Guide
Programvare for talediktering: gratis innebygde alternativer mot betalte verktøy
Noe av den beste programvaren for talediktering ligger allerede på maskinen din. Her er hvilken du bør bruke, og når det faktisk gir mening å betale for en egen app.
Sist oppdatert: juni 2026

Programvare for talediktering lytter gjennom en mikrofon og skriver ned det du sier, og gjør tale om til redigerbar tekst med rundt 145 ord i minuttet mot omtrent 40 for skriving. De gode verktøyene kjører systemomfattende, slik at ordene havner ved markøren. Noen er gratis og innebygd i Windows og Mac; betalte apper legger til frakoblet modus og opprydding med AI.
Snakk, og ordene havner ved markøren
Første gang det fungerer, føles det som et lite tryllekunststykke. Du holder inne en tast, sier en setning, slipper, og setningen står bare der i e-posten din. Ingen tastatur. En yngre slektning av meg dikterte en gang en melding på 90 ord til bestemoren sin før jeg var ferdig med å forklare hva diktering var. Det vanskelige var aldri å snakke. I to tiår var det vanskelige at programvaren skulle bli god nok til å stole på, og akkurat den biten ble endelig løst.
Denne artikkelen handler om hvilken programvare for talediktering som er verdt tiden din, inkludert de gratis alternativene du allerede eier.
De fleste som er låst til et tastatur, gjør det av vane, ikke av nødvendighet. Skriving er et innlært kompromiss, en måte å få tanker ut av hodet og inn i en maskin som ikke har ører. Programvare for talediktering fjerner kompromisset. Spørsmålet sluttet å være om det fungerer rundt 2022 og ble i stedet hvilken, og om jeg må betale for det.
Det ærlige svaret avhenger av tre ting: hvor lenge du dikterer, om du vil at det skal fungere i alle apper, og om du bryr deg om at ordene dine aldri forlater laptopen. Når du er ferdig her, vet du hvilken vei som passer, og jeg skal fortelle deg når det gratis innebygde alternativet er alt du trenger. Jeg leser det meste av support-e-posten for denne appen, og en jevn andel kommer fra folk som betalte for et verktøy da det som allerede lå på maskinen deres ville gjort jobben. Så jeg har en liten egeninteresse i å snakke deg ut av et kjøp.
Hva programvare for talediktering er

Programvare for talediktering er et program som fanger lyd fra mikrofonen din og gjør den om til skrevet tekst ved hjelp av en talegjenkjenningsmodell. Det eldre navnet er dikteringsprogramvare. Det nyere markedsføringsnavnet er AI-diktering, som stort sett betyr det samme med en språkmodell skrudd på for å fikse tegnsetting og tone.
Den kommer i tre former. Innebygd diktering følger med operativsystemet ditt: Windows Voice typing, Apple Dictation. Nettleserbasert talediktering bor inni én app, som Google Docs Voice typing. Og egne skrivebordsapper installeres separat og fungerer på tvers av alt du skriver i. Formen betyr mer enn merket. Et nettleserverktøy som bare skriver inni Google Docs er ubrukelig for Slack-meldingene dine, uansett hvor god nøyaktigheten er. Det første spørsmålet å stille om et hvilket som helst verktøy er ikke hvor nøyaktig det er, men hvor det lar deg skrive. Nøyaktighet er nå et løst problem for de fleste av dem; rekkevidde er det ikke.
Det som skiller et seriøst verktøy fra et leketøy er hvor det limer inn. Innebygde og egne skrivebordsverktøy er systemomfattende: trykk på hurtigtasten i et hvilket som helst tekstfelt, og teksten dukker opp der. Det er hele poenget. Alt annet, nøyaktighet, språk, opprydding med AI, er en forfining oppå spørsmålet om det skriver der du ser.
En ting til skiller kategoriene: hva modellen kan høre. Noen verktøy håndterer bare engelsk. Andre håndterer dusinvis av språk og kan bytte midt i en setning. Whispers engelskspråklige modeller støtter nøyaktig ett språk, mens de flerspråklige bygningene dekker 99. NVIDIAs Parakeet ligger i midten med 25 språk, engelsk pluss 24 europeiske. Hvis du bare noensinne skriver på engelsk, betyr ingenting av dette noe, og du bør velge ut fra hastighet i stedet. Hvis du skriver utkast på to språk før lunsj, betyr det mye. De fleste overvurderer hvor mange språk de trenger og undervurderer hvor mye de bryr seg om forsinkelse. Forsinkelsen mellom å slippe tasten og se tekst er det du føler hver eneste gang.
Hvis du heller vil se den systemomfattende versjonen i bruk enn å lese om kategorien, viser Whisper-siden for talediktering hold-en-hurtigtast-løkken på Windows og Mac, med gratis lokale motorer inkludert.
Hvordan det fungerer (og hvorfor nøyaktigheten endelig ble bra)
Under panseret har prosessen tre trinn. Mikrofonen din tar opp et kort lydklipp. En talegjenkjenningsmodell gjør den lyden om til tekst. Så limes teksten inn, noen ganger etter at en språkmodell har ryddet opp i den.
Nøyaktighetshoppet alle la merke til kom fra modellen i midten. Den åpne kildekode-modellen Whisper fra OpenAI endret hva godt betydde. Den håndterer aksenter, bakgrunnsstøy og 99 språk på de flerspråklige variantene, uten et opplæringstrinn. Den siste delen er den stille revolusjonen. Du lærer ikke moderne programvare for talediktering stemmen din. Du installerer den og snakker.
Jeg er gammel nok til å huske da det var science fiction. På slutten av 1990-tallet kjørte en slektning Dragon NaturallySpeaking på en Windows 98-PC med 64 MB RAM. Oppsettet betydde å lese en liste med ord høyt i 45 minutter slik at programvaren kunne kalibrere seg til stemmen din. Så fungerte det, så vidt, med kanskje 70 % nøyaktighet og fire sekunders forsinkelse per setning. Det tok femten minutter å diktere ett avsnitt av et julebrev. Headsettet ble kastet tvers over rommet. Headsettet overlevde; eksperimentet gjorde det ikke. Tjuefem år senere tar den samme oppgaven nitti sekunder og null opplæring. Maskinvaren tok igjen idéen.
To smaker av mellomtrinnet finnes i dag. Lokal behandling kjører modellen på din egen datamaskin, frakoblet, slik at lyden din aldri forlater maskinen, slik frakoblet tale-til-tekst fungerer. Skybehandling sender lyden til en server, noe som kan være raskere på svak maskinvare, men betyr at ordene dine reiser. Hvilken du vil ha avhenger av hva du dikterer. En handleliste, hvem bryr seg. Kundens kontrakt, kanskje bry deg.
Det tredje trinnet, oppryddingen, er der AI-en i AI-diktering bor. Rå transkripsjon gir deg en vegg av ord uten avsnittsskift og en og annen eh. En språkmodell kan fikse tegnsettingen, droppe fyllordene og til og med matche en tone du ber om. I Whisper by Remskill er det trinnet valgfritt og kjører lokalt gjennom Ollama, eller i skyen gjennom din egen OpenAI-nøkkel hvis du skrur på Pro. Du kan også utløse det med stemmen: si aktiveringsfrasen, for øyeblikket Hey whisper, og teksten overleveres til modellen i stedet for å bli limt inn rå. Ingenting av det endrer kjernetrikset. Det avgjør bare hvor polert ordene er når de ankommer.
De gratis alternativene du allerede har: Windows Voice typing, Apple Dictation, Google Docs
Før du betaler for noe, sjekk hva som allerede ligger på maskinen din. Tre gratis innebygde alternativer dekker mye terreng.
Windows · Win + H
macOS · Dictation
Docs · Voice typing
Windows Voice typing
På Windows 11 trykker du Windows-logotasten pluss H i et hvilket som helst tekstfelt, og en talediktingslinje dukker opp. Den er god for raske meldinger. Haken: den trenger en internettforbindelse og en fungerende mikrofon for å kjøre, fordi gjenkjenningen skjer i skyen. Den støtter 43 språk ifølge Microsofts liste. Hvis du er frakoblet på et tog, slutter den å fungere. Det finnes en full gjennomgang i guiden vår til tale til tekst på Windows.
Apple Dictation
På en Mac skrur du den på i Systeminnstillinger, Tastatur, Diktering, og starter den så med mikrofontasten eller snarveien du har valgt. Den nåværende versjonen transkriberer tekst av enhver lengde og stopper først etter 30 sekunders stillhet, ikke etter en hard tidsgrense. På Apple Silicon kan den behandle talen din på selve enheten. For korte notater er den gratis og grei; det lengre oppsettet finnes i tale til tekst på Mac.
Google Docs Voice typing
Åpne et Google-dokument i Chrome, Edge eller Safari, klikk Verktøy, så Talediktering, og en mikrofonboks dukker opp. Den støtter over 100 språk og regionale varianter. Den harde begrensningen ligger rett der i navnet: den skriver bare inni Google Docs og Slides. Den vil ikke skrive e-posten din, Slacken din eller koden din.
Den ærlige måten å lese disse tre på: de er ekte verktøy, ikke demoer, og for en stor andel av folk er de slutten på letingen. Der de stopper er forutsigbart. Windows Voice typing dør i det øyeblikket du mister signal. Google Docs Voice typing forlater aldri dokumentet. Apple Dictation er utmerket på en Mac og fraværende overalt ellers. Hvis arbeidet ditt passer innenfor de kantene, er du ferdig. Lukk denne fanen og trykk på tasten. Den betalte kategorien finnes for arbeidet som ikke passer: diktering hele dagen, frakoblet på et fly, alle apper i stedet for én, og lyd som må bli liggende på din egen disk.
De betalte verktøyene verdt å kjenne til (Dragon, Wispr Flow, Superwhisper, Voicy, Whisper by Remskill)
Når de gratis verktøyene går tom for plass, når du dikterer hele dagen eller trenger frakoblet modus eller vil ha opprydding med AI, åpner den betalte kategorien seg. Her er navnene verdt å kjenne til, med én ærlig linje hver.
Hvis du heller vil se hele feltet stilt opp i rekkefølge, her er den beste programvaren for talediktering, rangert.
Jeg kjørte ikke disse mot hverandre med stoppeklokke, så jeg skal ikke late som. Jeg valgte navnene under ut fra tre ting: dokumentert plattformrekkevidde (fungerer det der du faktisk skriver), dokumentert frakoblet støtte (forlater lyden din maskinen), og dokumentert språkdekning. Tabellen holder bare på fakta hver leverandør publiserer; jeg lot hastighet og nøyaktighet være ute av den, fordi ingen nøytral benchmark finnes på tvers av dem alle, og å finne på en ville vært akkurat det jeg kom hit for å snakke deg ut av.
| Verktøy | Plattform | Lokal / Sky | Fungerer frakoblet | Prismodell | Språk | Best for |
|---|---|---|---|---|---|---|
| Windows Voice typing | Windows 11 | Sky | Nei | Gratis, innebygd | 43 | Raske meldinger på en tilkoblet PC |
| Apple Dictation | macOS | Lokal på Apple Silicon | Ja (Apple Silicon) | Gratis, innebygd | Dusinvis | Korte notater på en Mac |
| Google Docs Voice typing | Nettleser | Sky | Nei | Gratis, nettleserfunksjon | 100+ | Skriving kun inni Google Docs |
| Dragon by Nuance | Windows | Lokal | Ja | Betalt, engangslisens | Engelsk-fokusert | Diktering hele dagen på Windows |
| Whisper by Remskill | Windows, macOS (Apple Silicon) | Lokal eller Sky (din nøkkel) | Ja (lokale motorer) | Gratis lokalt, betalt Pro for sky | 99 på Whisper flerspråklig | Systemomfattende diktering, frakoblet, alle apper |
Dragon by Nuance er den gamle garde. Dragon Professional v16 reklamerer for diktering tre ganger raskere enn skriving med opptil 99 % gjenkjenningsnøyaktighet fra første bruk, og den er optimalisert for Windows 11. De 99 % er Nuances eget tall, ikke en nøytral benchmark. Haken: Dragon Professional er kun for Windows, uten en nåværende skrivebordsversjon for Mac.
Wispr Flow, Superwhisper og Voicy er den nyere bølgen av AI-dikteringsapper. De pakker en talemodell inn i et rent grensesnitt og legger til opprydding av tone eller formatering. De er kompetente. Mønsteret på tvers av det meste av denne kategorien er den samme arkitekturen, en talemodell, et brukergrensesnitt og en månedlig faktura, og det er på fakturaen de skiller seg mest. Hvis fakturaen er den delen som svir, skrev vi om et ærlig superwhisper-alternativ som holder hele den lokale prosessen gratis for alltid.
Whisper by Remskill, appen vår, er et skrivebordsverktøy for Windows og macOS på Apple Silicon. Du trykker på en hurtigtast, snakker, og teksten limes inn ved markøren i en hvilken som helst app. Standardhurtigtasten er Ctrl+Space på Windows og en Command+Option push-to-talk-akkord på Mac — hold begge, slipp én for å stoppe. Det du velger er motoren. Du velger mellom tre veier: lokal NVIDIA Parakeet (~600 MB, 5–10× raskere enn Whisper på CPU, engelsk pluss 24 europeiske språk); lokal Whisper (åtte modeller, 99 språk på de flerspråklige, oversett-til-engelsk); eller Sky-modus, som bruker din egen OpenAI-nøkkel for gpt-4o-mini-transcribe eller gpt-4o-transcribe uten at vi tar noe kutt. All lokal transkripsjon er ren Rust, ingen Python. Den fulle sammenligningen av det bredere feltet finnes i vår oversikt over transkripsjonsprogramvare.
Dette er også der min ene mening kommer inn: prøv lokal modus først. Hvis Macen din er Apple Silicon eller PC-en din er fra de siste fire årene, trenger du ikke skyen for daglig diktering. Lokal Parakeet begynner å transkribere på godt under to sekunder på moderne maskinvare, lyden din forlater aldri laptopen, og skyen er nødutgangen for når du vil ha OpenAI-nøyaktighet eller nettsøk, ikke standarden. Strekk deg etter nettverket når du treffer en vegg, ikke før. Jeg er typen arkitekt som strekker meg etter den større, fancier løsningen av refleks og så snakker meg selv ned igjen. Lokal-først er meg som snakker meg selv ned igjen, offentlig, så du kan hoppe over delen der jeg kaster bort en uke.
Den praktiske grunnen er maskinvare. En moderne laptop har allerede en mikrofon og en prosessor rask nok til å kjøre en talemodell på egen hånd. Å sende ett avsnitt med lyd til en server og tilbake, for en jobb maskinen din kan gjøre frakoblet på under to sekunder, er en vane fra den gang laptoper var for trege. Det er de ikke lenger. Skyen gjør seg fortjent for de vanskelige tilfellene: et støyende rom, en uvanlig aksent, en forespørsel som trenger et live nettsvar limt inn i svaret ditt. For den daglige flyten av e-post, notater og chat er lokalt raskere å starte, privat som standard og gratis for innloggede brukere. Nødutgangen er der når du trenger den; de fleste dager gjør du ikke det.
Når du bør hoppe over en egen app og bruke den innebygde
Her er delen de fleste beste-programvare-artikler hopper over. Hvis du sender korte meldinger, en tekst på 30 ord, et raskt Slack-svar, er den gratis dikteringen som allerede ligger på maskinen din alt du trenger. Windows Voice typing (Windows-tast + H) og Apple Dictation er gratis, de er innebygd, og de fungerer. Ikke installer eller betal for noe for å skrive én setning. En egen app begynner å gjøre seg fortjent når du dikterer ofte, trenger at det fungerer frakoblet på et fly, vil ha det på tvers av alle apper og ikke bare én, eller bryr deg om at ordene dine blir værende på enheten din. Under den terskelen er den kjedelige sannheten at du allerede eier det rette verktøyet.
Hva Whisper by Remskill koster
Whisper by Remskill er gratis for alle innloggede brukere for hele den lokale prosessen: lokal Whisper, Parakeet, Ollama-basert opprydding med AI, historikk, egendefinert hurtigtast, modellnedlastinger, uten at en betalingsmetode trengs for å registrere seg. Whisper Pro legger til Sky-flaten: OpenAI sky-transkripsjon, AI-forbedring i skyen og talenettsøk gjennom din egen OpenAI-nøkkel. Sky-modus fakturerer deg direkte gjennom OpenAI; vi tar ikke noe kutt. De nåværende abonnementene og Pro-prøveperioden finner du på prissiden. Jeg skal ikke sitere tall til deg her; siden gjør det bedre enn et avsnitt kan.
Videre lesning
Slektningen min kastet et headset tvers over et rom i 1999 fordi diktering var en 45-minutters plikt som produserte søppel. Headsettet overlevde eksperimentet. Tjuefem år senere er plikten borte. Du trykker på en tast og snakker, og ordene dukker opp. Den eneste virkelige avgjørelsen som gjenstår er hvilket verktøy, og for mange er det riktige svaret allerede på maskinen deres, slått av, ventende. Mine egne barn kommer aldri til å vite at det noen gang var vanskelig, som er målet, selv om det gir en dårligere historie ved middagsbordet.
Prøv den du allerede eier først
Hvis den går tom for plass, last ned Whisper og velg motoren som passer hvordan du jobber.
Gratis for innloggede brukere på hele den lokale prosessen. Ingen kort ved registrering.



