How do I convert audio to text?

Pick a converter, give it your audio, and read back the text. Web tools want you to upload a file; a desktop app like Whisper can transcribe a recording locally or dictate live at the cursor with a hotkey. The text comes back editable.

Can AI transcribe audio to text accurately?

Yes, on clear audio. Vendors quote 96 to 99% on clean recordings, though those are marketing figures, not independent benchmarks. Accuracy drops on noisy audio, heavy accents, and overlapping speakers. A decent microphone helps more than a bigger model.

Does audio to text work offline?

With the right tool, yes. Whisper's local mode processes everything on your computer and needs no internet after a one-time model download of about 140 MB to 3 GB. The free web converters in this search all require an upload, so they need a connection.

Is there a free audio to text converter?

Several, with limits. HappyScribe offers 10 free minutes with no card; AudioConvert.ai gives 30 minutes a day. Whisper's entire local pipeline is free for authenticated users with no payment method at signup.

What audio formats can I convert to text?

Most tools take the common ones. The OpenAI transcription API accepts mp3, mp4, mpeg, mpga, m4a, wav, and webm. NoteGPT lists MP3, WAV, MP4, and AVI. Cloud uploads also hit a 25 MB ceiling per request on the OpenAI endpoint.

Does it support multiple languages?

Depends on the model. Whisper's multilingual models cover 99 languages with auto-detect; its English-only builds are locked to English. The faster Parakeet engine covers English plus 24 European languages, with no Asian languages and no translate-to-English.

Can I transcribe audio from a video file?

Yes. Transcription only cares about the audio track, so the OpenAI endpoint accepts mp4. For a video on your own drive, local transcription keeps the file off any server while it works.

Af Denys Medvediev13. marts 2026

Guide

Lyd til tekst-konverter, forklaret

Gratis webværktøjer, offline desktopprogrammer og medbring-din-egen-nøgle i skyen omdanner alle lyd til tekst. Det valg, der virkelig betyder noget, er hvor din lyd bliver behandlet.

Senest opdateret: juni 2026

Nærbillede af en digital lydgrænseflade, der viser en lysende lydbølgeform på en mørk skærm

En lyd til tekst-konverter omdanner en optagelse eller live tale til redigerbar tekst, du kan søge i, ved hjælp af en tale-til-tekst-model. Det valg, der betyder noget, er hvor lyden bliver behandlet: gratis webværktøjer uploader filer til en server, mens et desktopprogram som Whisper kan transskribere helt på din egen computer, offline, og indsætte resultatet lige der, hvor markøren står.

De fleste gratis lyd til tekst-værktøjer giver dig kun de første 10 til 30 minutters transskription, hvorefter de beder om et betalingskort. Den del er rimelig nok. Servere koster penge. Det, ingen siger højt, er, at din lyd først skulle rejse hen til de servere. En læges talememo, en optagelse af et bestyrelsesmøde, en forberedelsesfil til en forældremyndighedssag: alt sammen uploadet til en leverandør, du aldrig har mødt.

Jeg har en holdning til det, og den kommer jeg til.

En lyd til tekst-konverter gør én ting: den lytter til lyd og skriver ordene ned. De interessante forskelle ligger i, hvordan den lytter (en model), hvor den lytter (din maskine eller en server), og hvad den gør med teksten bagefter (lægger den i en fil eller indsætter den, hvor du allerede skriver). De tre topplacerede gratis konvertere for denne søgning er alle af typen upload-en-fil-og-vent. Whisper by Remskill er et helt andet dyr. Den er diktat-først, hvilket vil sige, at du trykker på en genvejstast, taler, og teksten dukker op ved markøren i et hvilket som helst program.

Denne guide forklarer, hvordan konvertere fungerer, gennemgår den trestrins-vej for en optaget fil og fortæller dig, hvornår en webkonverter er det rigtige valg, og hvornår den ikke er det. Efter et år med at læse vores supportmails kan jeg fortælle dig, at det meste kommer fra folk, der valgte et skyværktøj til lyd, der aldrig burde have forladt deres bærbare.

En lyd til tekst-konverter omdanner optagelser til ord, du kan redigere

Whisper

Det rigtige Whisper-program — klik rundt i indstillingerne for at se, hvordan lokal transskription og sky-transskription sættes op.

Under motorhjelmen kører hver konverter det samme: en talegenkendelsesmodel. Den tager lydbølgeformen af din lyd og forudsiger ordene, et stykke ad gangen. Modellen er der, hvor nøjagtigheden bor. Den store åbne model bag mange af disse værktøjer er OpenAI's Whisper, som understøtter 99 sprog i sine flersprogede varianter. Det samme OpenAI Speech-to-Text API giver adgang til whisper-1 plus de nyere gpt-4o-transcribe- og gpt-4o-mini-transcribe-modeller.

Resultatet er almindelig, redigerbar tekst. Du kan rette et navn, søge efter en sætning, lægge den ind i en e-mail. Det er hele pointen. Lyd er svær at skimme, tekst er let. Whisper producerer den samme redigerbare tekst, men i stedet for at give dig en download kan den indsætte den direkte i det program, du er i. Programmet, der er indlejret ovenfor, er den rigtige desktopfrontend, ikke en mockup.

Hvilken model du vælger, er nøjagtighedsbeslutningen, og den åbne Whisper-model og Google Cloud Speech-to-Text lander forskellige steder; vores sammenligning af Whisper vs Google Speech-to-Text stiller de to motorer side om side på nøjagtighed, sprogdækning, og hvor din lyd ender.

Sådan konverterer du en lydfil til tekst i tre trin

For en optaget fil er vejen kort. De gratis webkonvertere beskriver den som upload, klik, download.

converter · web upload

interview.wavuploading to server… 64%

files deleted within 24h Download transcript

En typisk webkonverter: smid en fil ind, vent på uploadet, download transskriptionen.

Vælg, hvor det kører. Sky-konvertere kræver, at du uploader filen til deres server. Whisper kører transskriptionen på din egen maskine i lokal tilstand, så filen aldrig forlader din computer.

Vælg en model til dit sprog. Filer på kun engelsk er hurtigst på en mindre model. Flersproget eller blandet lyd kræver en flersproget model, der dækker 99 sprog.

Hent teksten og rediger den. Transskriptionen kommer tilbage som almindelig tekst. Ret de tastefejl, en model altid laver på egennavne, og så er du færdig.

CancelTranscribing

Whisper transskriberer en optagelse lokalt — filen forlader aldrig din maskine.

Et forbehold er værd at kende: sky-API'er har størrelseslofter. OpenAI's transskriptionsendpoint sætter loftet på uploads til 25 MB pr. forespørgsel. En lang mødeoptagelse i WAV overskrider det hurtigt. Lokal behandling har ingen sådan grænse ud over din egen disk og tålmodighed.

Optagede filer vs live diktat: hvilken har du brug for?

Her er det spørgsmål, de fleste konvertersider springer over. Transskriberer du en fil, der allerede findes, eller forsøger du at skrive noget nyt med din stemme?

Hvis du har en optagelse (et interview, en forelæsning, en podcast), er en filkonverter det rigtige værktøj. Upload den, få transskriptionen, gå videre. De tre øverste gratis værktøjer klarer dette, med daglige minutlofter på det gratis niveau.

Cancel

Whispers live optagelses-overlay — hold genvejstasten nede, tal, slip.

Hvis du skriver en ny e-mail, note eller et dokument, vil du slet ikke have en fil. Du vil have ordene til at dukke op, mens du taler. Det er diktat, og det er en anden mekanisme. Med Whisper holder du en genvejstast nede, taler og slipper. På Windows er standarden Ctrl+Space, og på macOS er det en Command+Option push-to-talk-akkord (hold begge nede, slip en af tasterne for at stoppe). Den transskriberede tekst indsættes ved din markør i ethvert program. Ingen upload, ingen download, ingen faneskift. Overlayet ovenfor er det, du ser, mens den lytter.

De fleste, der søger efter en lyd til tekst-konverter, vil have det første og opdager, at de også ville have det andet. Du optager færre ting, end du skriver. Sidste år brugte jeg to uger på at lede efter en bedre filkonverter, da det, jeg faktisk havde brug for, var at holde op med at hakke svar ind med én finger ad gangen under min datters svømmetræning.

Lokal vs sky: hvor din lyd bliver behandlet (og hvorfor det betyder noget)

Rækker af serverracks i et datacenter med aktivt udstyr, der repræsenterer sky-lydbehandling

Det skel, der betyder noget, kommer her, og det er det, de gratis værktøjer er mest tavse om. En webkonverter behandler din lyd på sine servere. AudioConvert.ai siger, at filer slettes inden for 24 timer. HappyScribe og NoteGPT uploader også til skyen. Det er standard, og for en offentlig podcast er det helt fint.

Nu kommer den holdning, jeg lovede. Lydkonvertering, der kun foregår i skyen, er en privatlivskatastrofe, der bare venter på at blive transskriberet. Et team, jeg engang arbejdede med, fik en konsulent til at bygge en intern diktatprototype, der ringede til en sky-AI for hver eneste ytring. Lederen åbnede omkostningsdashboardet i slutningen af kvartalet og fandt en regning på fem cifre, det meste fra at transskribere standup-optagelser fire gange, fordi gentagelseslogikken var for aggressiv. Finansdirektørens svar var kort: eller også kunne vi lade være med at betale for at uploade møder, der allerede har referater. Pengene var det lille problem. Det større var, at kvartalsvis interne opkald nu lå på en andens servere.

Whispers lokale tilstand svarer på det. I lokal tilstand behandles al lyd på din computer, og intet forlader enheden; efter en engangsdownload af modellen (alt fra omkring 140 MB til 3 GB afhængigt af modellen) fungerer den fuldt offline. To motorer kører på enheden: Whisper-modellerne og NVIDIA's Parakeet, som er 5 til 10 gange hurtigere end Whisper på CPU, men kun dækker engelsk plus 24 europæiske sprog, uden oversættelse til engelsk. Foretrækker du skyen, har Whisper en medbring-din-egen-nøgle OpenAI-tilstand, der bruger gpt-4o-mini-transcribe eller gpt-4o-transcribe (de samme modeller, som API'et giver adgang til), faktureret direkte af OpenAI, uden tillæg fra os. Pointen er, at du vælger. De gratis webværktøjer vælger for dig, og svaret er altid deres server. For mere om at holde dig helt væk fra skyen, se vores guide til offline tale til tekst.

At vælge nøjagtighed: hvilken model håndterer din accent og dit sprog

Nøjagtighed er mest et spørgsmål om model, og modellen er et spørgsmål om sprog. De gratis konvertere reklamerer med store tal. AudioConvert.ai hævder op til 99 % nøjagtighed på klar lyd, HappyScribe siger op til 96 %. Det er leverandørers marketingpåstande uden offentliggjort metode, så betragt dem som brochuren, ikke som målestokken.

Det, der flytter nøjagtigheden, er at matche modellen til din lyd. Whisper leveres med 8 lokale modeller delt op i kun-engelsk og flersproget. Kun-engelsk-versionerne (Base på ~140 MB op til Medium på ~1,5 GB) låser sprogvælgeren til engelsk og gør den ene ting godt. De flersprogede versioner (Small, Medium, Large v3 på ~3 GB og en Large v3 Turbo) dækker 99 sprog med automatisk registrering. Blandet ukrainsk og engelsk i én sætning? Det kræver en flersproget model. En ren engelsk talememo? Den engelske Base-model er hurtigere og lettere.

Whisper

Model- og sprogvælgeren i det rigtige Whisper-program — kun-engelsk- og flersprogede versioner side om side.

Den kedelige sandhed, som ingen modelside indrømmer: en billig clip-on-mikrofon gør mere for nøjagtigheden end nogen modelopgradering. Skrald ind, skrald ud. Ingen mængde AI redder en optagelse lavet ved siden af en kørende opvaskemaskine. Jeg brugte en weekend på at finjustere modelindstillinger for at rydde op i min egen grumsede lyd, før jeg indså, at problemet var den bærbares mikrofon femten centimeter fra en blæser. Jeg har en kandidatgrad. Indstillingspanelet ovenfor er der, hvor du vælger model og sprog.

Hvornår du skal springe en webkonverter over (og bruge noget andet)

En ryddelig skrivebordsarbejdsplads med en notesbog, briller og kuglepenne, der antyder alternativer til håndskrevne noter

En webkonverter er det bedre valg nogle gange, og det vil jeg hellere sige til dig end at lade dig kæmpe med det forkerte værktøj. Hvis du har én kort optagelse (et fem minutters interviewklip, en enkelt talememo), og du er ligeglad med, at den rører en server, giver en gratis konverter som HappyScribe dig de første 10 minutter gratis uden kort. Åbn siden, upload, færdig. At installere et desktopprogram til det er overkill.

Spring webkonverteren over, når en af tre ting er sand: lyden er følsom (medicinsk, juridisk, finansiel), filen er stor nok til at ramme et sky-loft på 25 MB, eller du skriver noget nyt frem for at transskribere noget gammelt. De to første tilfælde kræver lokal behandling. Det tredje kræver diktat, ikke en konverter overhovedet. Til mødestil-transskription med flere talere og resuméer passer et dedikeret værktøj i den kategori bedre end nogen af delene — det er et andet job, dækket i vores oversigt over transskriptionssoftware.

Hvad det koster

Whisper er gratis for alle for hele den lokale pipeline (begge transskriptionsmotorer, AI-tekstoprydning, historik og den brugerdefinerede genvejstast) uden at der kræves en betalingsmetode for at oprette en konto. Den medbring-din-egen-nøgle sky-flade er det betalte Pro-niveau, og OpenAI fakturerer dig direkte for de faktiske minutter, du transskriberer. De gratis webkonvertere i denne søgning kører på et freemium-minutloft: HappyScribe giver 10 gratis minutter, AudioConvert.ai giver 30 minutter om dagen. Whisper leveres til Windows og macOS på Apple Silicon i dag. For de præcise plantal har prissiden dem på skrift.

De gratis konvertere er gode til det, de gør — smid en fil ind, vent, kopier teksten ud. Brug en til det podcastklip, du ikke har noget imod at dele. Men de optagelser, der betyder mest, er som regel dem, du mindst af alt har lyst til at uploade, og det er præcis det øjeblik, hvor en konverter, der kører på din egen bærbare, holder op med at være en bonus.

Prøv en optagelse, der aldrig forlader din maskine

Min yngste datter dikterede en e-mail på 90 ord til sin mormor sidste lørdag og spurgte mig, hvor ordene blev af. Ingen steder, sagde jeg. De blev lige her. Det svar er hele grunden til, at jeg byggede det her.

Download Whisper Se, hvordan det virker

Gratis for hele den lokale pipeline. Ingen betalingsmetode kræves for at oprette en konto.

Denys Medvediev

Jeg er den, der læser vores supportmails, sandsynligvis ved at diktere svarene.

Videre læsning

Ofte stillede spørgsmål

Vælg en konverter, giv den din lyd, og læs teksten tilbage. Webværktøjer vil have dig til at uploade en fil; et desktopprogram som Whisper kan transskribere en optagelse lokalt eller diktere live ved markøren med en genvejstast. Teksten kommer tilbage redigerbar.

Af Denys Medvediev13. marts 2026

Guide

Lyd til tekst-konverter, forklaret

Gratis webværktøjer, offline desktopprogrammer og medbring-din-egen-nøgle i skyen omdanner alle lyd til tekst. Det valg, der virkelig betyder noget, er hvor din lyd bliver behandlet.

Senest opdateret: juni 2026

Jeg har en holdning til det, og den kommer jeg til.

En lyd til tekst-konverter omdanner optagelser til ord, du kan redigere

Whisper

Det rigtige Whisper-program — klik rundt i indstillingerne for at se, hvordan lokal transskription og sky-transskription sættes op.

Sådan konverterer du en lydfil til tekst i tre trin

For en optaget fil er vejen kort. De gratis webkonvertere beskriver den som upload, klik, download.

converter · web upload

interview.wavuploading to server… 64%

files deleted within 24h Download transcript

En typisk webkonverter: smid en fil ind, vent på uploadet, download transskriptionen.

Vælg, hvor det kører. Sky-konvertere kræver, at du uploader filen til deres server. Whisper kører transskriptionen på din egen maskine i lokal tilstand, så filen aldrig forlader din computer.

Vælg en model til dit sprog. Filer på kun engelsk er hurtigst på en mindre model. Flersproget eller blandet lyd kræver en flersproget model, der dækker 99 sprog.

Hent teksten og rediger den. Transskriptionen kommer tilbage som almindelig tekst. Ret de tastefejl, en model altid laver på egennavne, og så er du færdig.

CancelTranscribing

Whisper transskriberer en optagelse lokalt — filen forlader aldrig din maskine.

Optagede filer vs live diktat: hvilken har du brug for?

Her er det spørgsmål, de fleste konvertersider springer over. Transskriberer du en fil, der allerede findes, eller forsøger du at skrive noget nyt med din stemme?

Cancel

Whispers live optagelses-overlay — hold genvejstasten nede, tal, slip.

Lokal vs sky: hvor din lyd bliver behandlet (og hvorfor det betyder noget)

At vælge nøjagtighed: hvilken model håndterer din accent og dit sprog

Whisper

Model- og sprogvælgeren i det rigtige Whisper-program — kun-engelsk- og flersprogede versioner side om side.

Hvornår du skal springe en webkonverter over (og bruge noget andet)

Hvad det koster

Prøv en optagelse, der aldrig forlader din maskine

Download Whisper Se, hvordan det virker

Gratis for hele den lokale pipeline. Ingen betalingsmetode kræves for at oprette en konto.

Denys Medvediev

Jeg er den, der læser vores supportmails, sandsynligvis ved at diktere svarene.

Lyd til tekst-konverter, forklaret

En lyd til tekst-konverter omdanner optagelser til ord, du kan redigere

Sådan konverterer du en lydfil til tekst i tre trin

Optagede filer vs live diktat: hvilken har du brug for?

Lokal vs sky: hvor din lyd bliver behandlet (og hvorfor det betyder noget)

At vælge nøjagtighed: hvilken model håndterer din accent og dit sprog

Hvornår du skal springe en webkonverter over (og bruge noget andet)

Hvad det koster

Prøv en optagelse, der aldrig forlader din maskine

Videre læsning

Ofte stillede spørgsmål

Stemmeskrivning i Word

Genvejen til taleskrivning på alle styresystemer

Alternativ til Google stemmeindtastning: dikter hvor som helst

Lyd til tekst-konverter, forklaret

En lyd til tekst-konverter omdanner optagelser til ord, du kan redigere

Sådan konverterer du en lydfil til tekst i tre trin

Optagede filer vs live diktat: hvilken har du brug for?

Lokal vs sky: hvor din lyd bliver behandlet (og hvorfor det betyder noget)

At vælge nøjagtighed: hvilken model håndterer din accent og dit sprog

Hvornår du skal springe en webkonverter over (og bruge noget andet)

Hvad det koster

Prøv en optagelse, der aldrig forlader din maskine

Videre læsning

Ofte stillede spørgsmål

Stemmeskrivning i Word

Genvejen til taleskrivning på alle styresystemer

Alternativ til Google stemmeindtastning: dikter hvor som helst

Lyd til tekst-konverter, forklaret

En lyd til tekst-konverter omdanner optagelser til ord, du kan redigere

Sådan konverterer du en lydfil til tekst i tre trin

Optagede filer vs live diktat: hvilken har du brug for?

Lokal vs sky: hvor din lyd bliver behandlet (og hvorfor det betyder noget)

At vælge nøjagtighed: hvilken model håndterer din accent og dit sprog

Hvornår du skal springe en webkonverter over (og bruge noget andet)

Hvad det koster

Prøv en optagelse, der aldrig forlader din maskine

Videre læsning

Ofte stillede spørgsmål

Læs videre

Stemmeskrivning i Word

Genvejen til taleskrivning på alle styresystemer

Alternativ til Google stemmeindtastning: dikter hvor som helst

Lyd til tekst-konverter, forklaret

En lyd til tekst-konverter omdanner optagelser til ord, du kan redigere

Sådan konverterer du en lydfil til tekst i tre trin

Optagede filer vs live diktat: hvilken har du brug for?

Lokal vs sky: hvor din lyd bliver behandlet (og hvorfor det betyder noget)

At vælge nøjagtighed: hvilken model håndterer din accent og dit sprog

Hvornår du skal springe en webkonverter over (og bruge noget andet)

Hvad det koster

Prøv en optagelse, der aldrig forlader din maskine

Videre læsning

Ofte stillede spørgsmål

Læs videre

Stemmeskrivning i Word

Genvejen til taleskrivning på alle styresystemer

Alternativ til Google stemmeindtastning: dikter hvor som helst