Av Denys Medvediev

Guide

Programvare for talediktering: gratis innebygde alternativer mot betalte verktøy

Noe av den beste programvaren for talediktering ligger allerede på maskinen din. Her er hvilken du bør bruke, og når det faktisk gir mening å betale for en egen app.

Sist oppdatert: juni 2026

Stilren laptop og et glass vann på et lyst kontorbord, klart for håndfri talediktering

Programvare for talediktering lytter gjennom en mikrofon og skriver ned det du sier, og gjør tale om til redigerbar tekst med rundt 145 ord i minuttet mot omtrent 40 for skriving. De gode verktøyene kjører systemomfattende, slik at ordene havner ved markøren. Noen er gratis og innebygd i Windows og Mac; betalte apper legger til frakoblet modus og opprydding med AI.

Snakk, og ordene havner ved markøren

Første gang det fungerer, føles det som et lite tryllekunststykke. Du holder inne en tast, sier en setning, slipper, og setningen står bare der i e-posten din. Ingen tastatur. En yngre slektning av meg dikterte en gang en melding på 90 ord til bestemoren sin før jeg var ferdig med å forklare hva diktering var. Det vanskelige var aldri å snakke. I to tiår var det vanskelige at programvaren skulle bli god nok til å stole på, og akkurat den biten ble endelig løst.

Denne artikkelen handler om hvilken programvare for talediktering som er verdt tiden din, inkludert de gratis alternativene du allerede eier.

Pasted
Whispers overlegg avslutter en diktering — teksten limes inn ved markøren.

De fleste som er låst til et tastatur, gjør det av vane, ikke av nødvendighet. Skriving er et innlært kompromiss, en måte å få tanker ut av hodet og inn i en maskin som ikke har ører. Programvare for talediktering fjerner kompromisset. Spørsmålet sluttet å være om det fungerer rundt 2022 og ble i stedet hvilken, og om jeg må betale for det.

Det ærlige svaret avhenger av tre ting: hvor lenge du dikterer, om du vil at det skal fungere i alle apper, og om du bryr deg om at ordene dine aldri forlater laptopen. Når du er ferdig her, vet du hvilken vei som passer, og jeg skal fortelle deg når det gratis innebygde alternativet er alt du trenger. Jeg leser det meste av support-e-posten for denne appen, og en jevn andel kommer fra folk som betalte for et verktøy da det som allerede lå på maskinen deres ville gjort jobben. Så jeg har en liten egeninteresse i å snakke deg ut av et kjøp.

Hva programvare for talediktering er

Nærbilde av et digitalt lydgrensesnitt som viser en livlig lydbølge, og illustrerer tale fanget som data

Programvare for talediktering er et program som fanger lyd fra mikrofonen din og gjør den om til skrevet tekst ved hjelp av en talegjenkjenningsmodell. Det eldre navnet er dikteringsprogramvare. Det nyere markedsføringsnavnet er AI-diktering, som stort sett betyr det samme med en språkmodell skrudd på for å fikse tegnsetting og tone.

Den kommer i tre former. Innebygd diktering følger med operativsystemet ditt: Windows Voice typing, Apple Dictation. Nettleserbasert talediktering bor inni én app, som Google Docs Voice typing. Og egne skrivebordsapper installeres separat og fungerer på tvers av alt du skriver i. Formen betyr mer enn merket. Et nettleserverktøy som bare skriver inni Google Docs er ubrukelig for Slack-meldingene dine, uansett hvor god nøyaktigheten er. Det første spørsmålet å stille om et hvilket som helst verktøy er ikke hvor nøyaktig det er, men hvor det lar deg skrive. Nøyaktighet er nå et løst problem for de fleste av dem; rekkevidde er det ikke.

Det som skiller et seriøst verktøy fra et leketøy er hvor det limer inn. Innebygde og egne skrivebordsverktøy er systemomfattende: trykk på hurtigtasten i et hvilket som helst tekstfelt, og teksten dukker opp der. Det er hele poenget. Alt annet, nøyaktighet, språk, opprydding med AI, er en forfining oppå spørsmålet om det skriver der du ser.

En ting til skiller kategoriene: hva modellen kan høre. Noen verktøy håndterer bare engelsk. Andre håndterer dusinvis av språk og kan bytte midt i en setning. Whispers engelskspråklige modeller støtter nøyaktig ett språk, mens de flerspråklige bygningene dekker 99. NVIDIAs Parakeet ligger i midten med 25 språk, engelsk pluss 24 europeiske. Hvis du bare noensinne skriver på engelsk, betyr ingenting av dette noe, og du bør velge ut fra hastighet i stedet. Hvis du skriver utkast på to språk før lunsj, betyr det mye. De fleste overvurderer hvor mange språk de trenger og undervurderer hvor mye de bryr seg om forsinkelse. Forsinkelsen mellom å slippe tasten og se tekst er det du føler hver eneste gang.

Hvis du heller vil se den systemomfattende versjonen i bruk enn å lese om kategorien, viser Whisper-siden for talediktering hold-en-hurtigtast-løkken på Windows og Mac, med gratis lokale motorer inkludert.

Hvordan det fungerer (og hvorfor nøyaktigheten endelig ble bra)

Under panseret har prosessen tre trinn. Mikrofonen din tar opp et kort lydklipp. En talegjenkjenningsmodell gjør den lyden om til tekst. Så limes teksten inn, noen ganger etter at en språkmodell har ryddet opp i den.

CancelTranscribing
Whisper midt i transkripsjon — talemodellen gjør lyd om til tekst.

Nøyaktighetshoppet alle la merke til kom fra modellen i midten. Den åpne kildekode-modellen Whisper fra OpenAI endret hva godt betydde. Den håndterer aksenter, bakgrunnsstøy og 99 språk på de flerspråklige variantene, uten et opplæringstrinn. Den siste delen er den stille revolusjonen. Du lærer ikke moderne programvare for talediktering stemmen din. Du installerer den og snakker.

Jeg er gammel nok til å huske da det var science fiction. På slutten av 1990-tallet kjørte en slektning Dragon NaturallySpeaking på en Windows 98-PC med 64 MB RAM. Oppsettet betydde å lese en liste med ord høyt i 45 minutter slik at programvaren kunne kalibrere seg til stemmen din. Så fungerte det, så vidt, med kanskje 70 % nøyaktighet og fire sekunders forsinkelse per setning. Det tok femten minutter å diktere ett avsnitt av et julebrev. Headsettet ble kastet tvers over rommet. Headsettet overlevde; eksperimentet gjorde det ikke. Tjuefem år senere tar den samme oppgaven nitti sekunder og null opplæring. Maskinvaren tok igjen idéen.

To smaker av mellomtrinnet finnes i dag. Lokal behandling kjører modellen på din egen datamaskin, frakoblet, slik at lyden din aldri forlater maskinen, slik frakoblet tale-til-tekst fungerer. Skybehandling sender lyden til en server, noe som kan være raskere på svak maskinvare, men betyr at ordene dine reiser. Hvilken du vil ha avhenger av hva du dikterer. En handleliste, hvem bryr seg. Kundens kontrakt, kanskje bry deg.

Det tredje trinnet, oppryddingen, er der AI-en i AI-diktering bor. Rå transkripsjon gir deg en vegg av ord uten avsnittsskift og en og annen eh. En språkmodell kan fikse tegnsettingen, droppe fyllordene og til og med matche en tone du ber om. I Whisper by Remskill er det trinnet valgfritt og kjører lokalt gjennom Ollama, eller i skyen gjennom din egen OpenAI-nøkkel hvis du skrur på Pro. Du kan også utløse det med stemmen: si aktiveringsfrasen, for øyeblikket Hey whisper, og teksten overleveres til modellen i stedet for å bli limt inn rå. Ingenting av det endrer kjernetrikset. Det avgjør bare hvor polert ordene er når de ankommer.

De gratis alternativene du allerede har: Windows Voice typing, Apple Dictation, Google Docs

Før du betaler for noe, sjekk hva som allerede ligger på maskinen din. Tre gratis innebygde alternativer dekker mye terreng.

Windows · Win + H

Listening…

macOS · Dictation

Docs · Voice typing

Click to speak
Dikteringen som allerede ligger på datamaskinen din, i to varianter — ingen installasjon nødvendig.

Windows Voice typing

På Windows 11 trykker du Windows-logotasten pluss H i et hvilket som helst tekstfelt, og en talediktingslinje dukker opp. Den er god for raske meldinger. Haken: den trenger en internettforbindelse og en fungerende mikrofon for å kjøre, fordi gjenkjenningen skjer i skyen. Den støtter 43 språk ifølge Microsofts liste. Hvis du er frakoblet på et tog, slutter den å fungere. Det finnes en full gjennomgang i guiden vår til tale til tekst på Windows.

Apple Dictation

På en Mac skrur du den på i Systeminnstillinger, Tastatur, Diktering, og starter den så med mikrofontasten eller snarveien du har valgt. Den nåværende versjonen transkriberer tekst av enhver lengde og stopper først etter 30 sekunders stillhet, ikke etter en hard tidsgrense. På Apple Silicon kan den behandle talen din på selve enheten. For korte notater er den gratis og grei; det lengre oppsettet finnes i tale til tekst på Mac.

Google Docs Voice typing

Åpne et Google-dokument i Chrome, Edge eller Safari, klikk Verktøy, så Talediktering, og en mikrofonboks dukker opp. Den støtter over 100 språk og regionale varianter. Den harde begrensningen ligger rett der i navnet: den skriver bare inni Google Docs og Slides. Den vil ikke skrive e-posten din, Slacken din eller koden din.

Den ærlige måten å lese disse tre på: de er ekte verktøy, ikke demoer, og for en stor andel av folk er de slutten på letingen. Der de stopper er forutsigbart. Windows Voice typing dør i det øyeblikket du mister signal. Google Docs Voice typing forlater aldri dokumentet. Apple Dictation er utmerket på en Mac og fraværende overalt ellers. Hvis arbeidet ditt passer innenfor de kantene, er du ferdig. Lukk denne fanen og trykk på tasten. Den betalte kategorien finnes for arbeidet som ikke passer: diktering hele dagen, frakoblet på et fly, alle apper i stedet for én, og lyd som må bli liggende på din egen disk.

Når du bør hoppe over en egen app og bruke den innebygde

Her er delen de fleste beste-programvare-artikler hopper over. Hvis du sender korte meldinger, en tekst på 30 ord, et raskt Slack-svar, er den gratis dikteringen som allerede ligger på maskinen din alt du trenger. Windows Voice typing (Windows-tast + H) og Apple Dictation er gratis, de er innebygd, og de fungerer. Ikke installer eller betal for noe for å skrive én setning. En egen app begynner å gjøre seg fortjent når du dikterer ofte, trenger at det fungerer frakoblet på et fly, vil ha det på tvers av alle apper og ikke bare én, eller bryr deg om at ordene dine blir værende på enheten din. Under den terskelen er den kjedelige sannheten at du allerede eier det rette verktøyet.

Hva Whisper by Remskill koster

Whisper by Remskill er gratis for alle innloggede brukere for hele den lokale prosessen: lokal Whisper, Parakeet, Ollama-basert opprydding med AI, historikk, egendefinert hurtigtast, modellnedlastinger, uten at en betalingsmetode trengs for å registrere seg. Whisper Pro legger til Sky-flaten: OpenAI sky-transkripsjon, AI-forbedring i skyen og talenettsøk gjennom din egen OpenAI-nøkkel. Sky-modus fakturerer deg direkte gjennom OpenAI; vi tar ikke noe kutt. De nåværende abonnementene og Pro-prøveperioden finner du på prissiden. Jeg skal ikke sitere tall til deg her; siden gjør det bedre enn et avsnitt kan.

Videre lesning

Slektningen min kastet et headset tvers over et rom i 1999 fordi diktering var en 45-minutters plikt som produserte søppel. Headsettet overlevde eksperimentet. Tjuefem år senere er plikten borte. Du trykker på en tast og snakker, og ordene dukker opp. Den eneste virkelige avgjørelsen som gjenstår er hvilket verktøy, og for mange er det riktige svaret allerede på maskinen deres, slått av, ventende. Mine egne barn kommer aldri til å vite at det noen gang var vanskelig, som er målet, selv om det gir en dårligere historie ved middagsbordet.

Prøv den du allerede eier først

Hvis den går tom for plass, last ned Whisper og velg motoren som passer hvordan du jobber.

Gratis for innloggede brukere på hele den lokale prosessen. Ingen kort ved registrering.

Bilde av Denys Medvediev

Denys Medvediev

Jeg er han som leser support-e-posten vår, mest sannsynlig ved å diktere svarene.