Av Denys Medvediev

Jämförelse

Bästa programvaran för rösttext: 7 verktyg rankade

Sju verktyg för rösttext rankade efter var de skriver, vad gratisnivån faktiskt är värd och vad som överlever en död Wi-Fi-anslutning. Skrivet av en leverantör, med partiskheten tryckt på etiketten.

Senast uppdaterad: juni 2026

Vitt tangentbord på ett mörkt skrivbord, den sortens uppställning som programvara för rösttext stillsamt ersätter när det gäller första utkast

Den bästa programvaran för rösttext 2026 handlar om sju namn. Whisper by Remskill leder för obegränsad gratis lokal diktering på Windows och Mac, Wispr Flow för plattformsövergripande finputsning, och de inbyggda alternativen (Apple Dictation, Windows rösttext, Google Docs rösttext) täcker kort och tillfällig användning, medan Superwhisper och Dragon fyller specifika nischer.

I slutet av nittiotalet körde en släkting till mig Dragon NaturallySpeaking på en stationär Windows 98-dator med 64 MB RAM. Att träna upp den tog 45 minuter av att läsa kalibreringsord i ett headset. Att diktera ett enda stycke av ett julbrev tog 15 minuter till. Headsetet flög till slut tvärs över rummet; headsetet överlevde, experimentet gjorde det inte. Tjugofem år senare dikterade min yngre dotter ett komplett e-postmeddelande till sin mormor på 90 sekunder, vid första försöket, utan någon träning alls. Rösttext fungerar äntligen. Det nya problemet är att välja bland ett dussin verktyg som alla gör anspråk på förstaplatsen.

De flesta listor över "bästa programvaran för rösttext" är skrivna av en av leverantörerna, med deras egen produkt på förstaplats och poängprotokollet skrivet baklänges därifrån. Samtidigt levereras ditt operativsystem redan med en helt okej gratis dikteringsfunktion, och en våg av betalda verktyg lovar samma sak med mer finputsning. Den här listan rankar sju verktyg efter två saker du själv kan kontrollera: var verktyget skriver, och vad du får utan att betala. När du är klar vet du vilket namn som passar din plattform, ditt ordantal och din integritetsgräns. Fullständig öppenhet, med mina egna ord: "Jag bygger ett av verktygen på den här listan. Whisper ligger på förstaplats med sina svagheter utskrivna under, och två gånger i den här artikeln säger jag åt dig att använda något annat."

Om du vill ha mekaniken först — motorer, latens, hur talade ord landar vid din markör — så täcker guiden om hur programvara för rösttext fungerar under huven det. Den här sidan är den rankade listan.

Hur jag valde ut dessa sju

Urval först, ranking sedan. För att komma med på listan måste ett verktyg vara en verklig, levererad produkt som förvandlar tal till text där du skriver. Inte en kategori, inte en nedlagd app, inte ett tunt skal som försvinner nästa kvartal. Webbleksakerna och den övergivna gratisprogramvaran som fyller ut de flesta leverantörslistor klarade inte gallringen.

Rankningslogiken är medvetet tråkig:

  1. Var den skriver. Systemövergripande verktyg som fungerar i varje app rankas högre än verktyg låsta till en enda dokumentredigerare.
  2. Vad gratisnivån är värd. En gratisnivå du kan leva med rankas högre än ett gratis smakprov med en ordmätare.
  3. Offlinebeteende. Diktering som överlever en död Wi-Fi-anslutning rankas högre än diktering som inte gör det.
  4. Plattformstäckning. Både Windows och Mac, där det är möjligt.

Ingen poäng av tio, ingen viktad matris som låtsas att det här är vetenskap. Fyra kriterier, tillämpade i ordning, oavgjorda fall avgjorda av min egen dagliga användning (ett urval på en, vilket fortfarande är ett mer än de flesta leverantörslistor). Din upplevelse kan variera, och det avslutande avsnittet är skrivet för just det fallet.

De sju verktygen, rankade

1. Whisper by Remskill: obegränsad gratis lokal diktering, systemövergripande

Whisper
Den riktiga Whisper-appen, inbäddad live — inte en skärmbild. Klicka runt i inställningarna.

Whisper är en skrivbordsapp för Windows och macOS. Tryck på en snabbtangent, tala, släpp, och texten landar där din markör är: e-post, Slack, ditt CRM, en kodredigerare, var som helst. Standardsnabbtangenten är Ctrl+Space på Windows; på en Mac håller du Command och Option samtidigt som en walkie-talkie och släpper för att stoppa.

Anledningen till att den hamnar på förstaplats är gratisnivån. Det är inte ett mätarbegränsat smakprov. Hela den lokala pipelinen är gratis för inloggade användare: alla åtta lokala Whisper-modeller, Parakeet-motorn, AI-textstädning via Ollama, historik, anpassad ordlista, snabbtangenten. Allt körs på din maskin, ingenting lämnar din enhet, och det fungerar med internet avstängt.

Flerspråkiga Whisper-modeller täcker 99 språk — en siffra som gäller de flerspråkiga varianterna; de engelskoptimerade versionerna klarar endast engelska. Om du talar engelska större delen av dagen och vill ha fart, så körs NVIDIA Parakeet-motorn (~600 MB) 5–10× snabbare än Whisper på CPU och täcker engelska plus 24 europeiska språk. De två motorerna gör olika avvägningar; jämförelsen Whisper vs Parakeet går djupare. En betald Pro-nivå lägger till OpenAI-molntranskription och webbsökning med din egen API-nyckel; detaljerna finns på prissidan.

Nu till den ärliga delen. Whisper finns bara för skrivbordet, utan app för iPhone eller Android. På Mac krävs Apple Silicon; Intel-Mac är uteslutna, och det finns ingen Linux-version. Om du dikterar mer från telefonen än från din bärbara dator, eller om din bärbara är en MacBook från 2017, hoppa över Whisper och läs vidare. Jag dikterade den meningen med Whisper, vilket gjorde att den stack till dubbelt.

Snabbtangentsslingan, motoruppställningen och vad som stannar på din maskin är allt beskrivet på Whispers sida om rösttext.

2. Wispr Flow: det finputsade plattformsövergripande alternativet

Wispr Flow är verktyget jag skulle peka dig mot om du lever tvärs över olika enheter. Det körs på Mac, Windows, iPhone och Android, identifierar automatiskt bland 100+ språk mitt i flödet, och marknadsför sig på att förvandla rörigt tal till finputsad text i 4× skrivhastighet. Telefonapparna är den verkliga skillnaden. Inget annat på den här listan följer dig från ett skrivbord till en låsskärm.

Haken är mätaren. Gratisnivån har ett tak på 2 000 ord per vecka på skrivbordet, vilket en genomsnittlig dikteringsanvändare bränner igenom på en dag eller två. Bortom det är det en Pro-prenumeration på $15 per användare och månad, eller $12 på årsplanen. Det är också molnbaserat: Wisprs egen integritetssida säger att transkriptionen alltid sker i molnet, så ditt ljud lämnar din maskin. Om telefondiktering betyder mer för dig än offline eller obegränsat gratis, så är det här ditt val. Hoppa över Whisper utan dåligt samvete.

3. Apple Dictation: det inbyggda Mac-svaret

Finns redan på varje Mac. Du startar det från Mikrofontangenten, en anpassningsbar tangentbordsgenväg, eller Redigera > Starta diktering, och på aktuell macOS kan du diktera text av valfri längd utan tidsgräns; den stoppar sig själv efter 30 sekunders tystnad.

Apples guide för diktering visar var du kontrollerar om din diktering behandlas på enheten istället för att skickas till Apples servrar.

För ett svar på 40 ord i Meddelanden är det här rätt verktyg, och att betala någon för det användningsfallet är dumt. Begränsningarna dyker upp i kanterna: tillgängligheten varierar med språk och region, Apples guide dokumenterar ingen anpassad ordlista för dina egna produktnamn, och hela saken lever innanför Apples staket. Om din diktering är kort, tillfällig och på en Mac — stanna här och behåll dina pengar.

4. Windows rösttext: tryck Win+H och prata

Microsofts inbyggda rösttext startar med Win+H i vilken textruta som helst, levereras inuti Windows 10 och 11 utan något att ladda ner, och infogar skiljetecken automatiskt medan du talar. Den täcker mer än 40 språk. För en gratisfunktion de flesta Windows-användare aldrig har tryckt på är den bättre än sitt rykte.

Två förbehåll. Den kräver en internetanslutning, vilket Microsofts egen supportsida säger, vilket betyder att den dör i samma stund som ditt tåg-Wi-Fi gör det. Och Microsoft dokumenterar ingen anpassad ordlista för den, så räkna med att den fortsätter höra ditt företags produktnamn fel. Bra för tillfällig användning; frustrerande som dagligt arbetsredskap.

5. Google Docs rösttext: gratis, men inhägnat i Docs

Öppna ett Google-dokument, klicka på Verktyg, sedan Röstinmatning, och en mikrofonruta dyker upp. Den fungerar i aktuella Chrome, Edge och Safari, hanterar en lång publicerad lista över språk och dialekter, och täcker talaranteckningar och bildtexter i Google Slides. För studenter och alla som ändå skriver allt i Docs kostar det ingenting och fungerar i dag.

Staketet är hela historien. Den skriver in i Google Docs och Slides, inte i din e-postklient, inte i Slack, inte någon annanstans. Din webbläsare styr tal-till-text-tjänsten, så kvaliteten följer webbläsaren, inte dig. Den tråkiga sanningen är att ett verktyg du inte kan använda i 90 % av ditt skrivande är en funktion, inte en uppställning för rösttext.

6. Superwhisper: det lokala indie-alternativet för Apple-först-användare

Superwhisper förtjänar mer uppmärksamhet än det får. Det körs på macOS, Windows och iOS, fungerar offline, och aktiveras med Option+Space eller push-to-talk i vilken app som helst. Gratisnivån inkluderar röst-till-text i vilken app som helst, mötesinspelning, 100+ språk och dialekter med översättning till engelska, samt obegränsad användning av sina små AI-modeller. Större modeller och anpassade API-nycklar ligger bakom betalda Pro- och livstidsplaner.

Det överlappar med Whisper på förstaplatsen mer än något annat här: båda är lokala först, snabbtangentsdrivna, med gratisnivåer du kan leva med. Skillnaderna ligger i kanterna. Superwhisper växte upp med Mac först och iOS i familjen, medan Whispers gratisnivå inkluderar hela sin lokala modelluppställning på båda skrivbordsplattformarna. Om du är djupt inne i Apples ekosystem och vill ha en iPhone-följeslagare, är Superwhisper ett bra val framför oss.

7. Dragon: den professionella licensen som startade alltihop

Dragon Professional v16 är ättlingen till programvaran min släkting skrek åt 1998, och till Nuances heder slutade den för länge sedan be om 45-minuters träningspass. Nuance hävdar att du kan diktera dokument 3 gånger snabbare än att skriva med upp till 99 % igenkänningsnoggrannhet, och produkten är optimerad för Windows 11, bakåtkompatibel till Windows 10. Ingen Mac-version visas på produktsidan, och prissättningen är en professionell licens som ordnas via deras försäljningskanal snarare än en offentlig prislapp.

Här är min enda starka åsikt i den här artikeln: om ett dikteringsverktyg behöver att du tränar det, rättar det eller registrerar din röstprofil, så löser det ett problem från 1999. Moderna talmodeller fungerar direkt på de flesta dialekter — modeller i Whisper-familjen levereras med 99 språk och noll registrering. Dragon år 2026 förtjänar sin plats för proffs med etablerade Dragon-arbetsflöden, juridiska och medicinska team med åratal av anpassade kommandon, inte för någon som börjar från noll.

Snabb jämförelse

VerktygSkriver varGratisnivåOfflineSpråk
Whisper by RemskillVilken app som helst (Windows, Mac)Hela den lokala pipelinenJa, helt lokalt99 flerspråkiga / 25 Parakeet
Wispr FlowVilken app som helst (Mac, Win, iPhone, Android)2 000 ord/veckaNej, molntranskription100+ autoidentifiering
Apple DictationMac-apparInbyggtStöd på enhetenVarierar med region
Windows rösttextVilken textruta som helst (Windows)InbyggtNej, kräver internet40+
Google Docs rösttextEndast Docs + Slides-anteckningarInbyggtNej (webbläsartjänst)Lång publicerad lista
SuperwhisperVilken app som helst (macOS, Windows, iOS)Små modeller, obegränsatJa100+ & dialekter
Dragon ProfessionalWindows-apparIngen offentligAnges inte på produktsidanAnges inte på produktsidan

En rad förtjänar en fotnot: "gratisnivå" betyder vad du kan fortsätta använda hur länge som helst, inte vad en provperiod lånar ut åt dig i två veckor.

Varför systemövergripande slår diktering inuti appen

Den största klyftan på den här listan är inte noggrannhet. Det är revir. Google Docs rösttext är låst till två Google-appar. Apple Dictation stannar inuti Macen. De systemövergripande verktygen — Whisper, Wispr Flow, Superwhisper, Windows rösttext — skriver var än din markör blinkar.

Cancel
Whisper-overlayn mitt i inspelningen — det animerade tillståndet du ser medan du håller ner snabbtangenten, i vilken app som helst.

Den revirskillnaden avgör om rösttext blir en vana. Den genomsnittliga dikteringsanvändaren talar omkring 145 ord per minut mot ungefär 40 skrivna, men hastigheten förstärks när verktyget fungerar i varje ruta du skriver i: e-posten, ärendet, chattsvaret, commit-meddelandet. Ett verktyg du måste byta dokument för att använda lägger till den friktion det var tänkt att ta bort. De flesta produktivitetsverktyg är skrivproblem i förklädnad; en systemövergripande snabbtangent är den sällsynta lösning som tar bort skrivandet istället för att dekorera det.

Hur jag skulle välja, fall för fall

Skala bort rankningen och fyra frågor återstår. Dikterar du från telefonen större delen av tiden? Wispr Flow — inget annat här klarar låsskärm-till-laptop. Korta tillfälliga anteckningar på en plattform? Använd det som kom installerat: Apple Dictation på en Mac, Win+H på Windows, Verktyg > Röstinmatning i Docs, och betala ingen. Långform daglig diktering där integritet eller offline spelar roll? Det är paret som är lokalt först: Whisper om du vill ha hela den fria modelluppställningen på Windows och Mac, Superwhisper om du vill ha en iOS-följeslagare i Apple-världen. Ett etablerat Dragon-arbetsflöde med anpassade juridiska eller medicinska kommandon? Stanna på Dragon; att migrera åratal av muskelminne kostar mer än licensen.

Fortfarande osäker? Börja gratis. Varje väg ovan har en kostnadsfri ingång, och guiden om gratis programvara för diktering går igenom dem i detalj. Uppgradera när du slår i en riktig vägg, inte en marknadsföringsvägg.

Sju verktyg, men bara tre beslut: inbyggt eller dedikerat, moln eller lokalt, skrivbord eller överallt. Svara på dem och listan kollapsar till ett enda namn för sig självt. Min släkting behövde 45 minuters träning och ett flygande headset för att lära sig att diktering inte var redo 1998. Du behöver ungefär tio minuter och noll dollar för att lära dig att den är det nu — vilket, som produkttidslinjer går, åtminstone är åt rätt håll.

Se vad din röst kan få klart

Ladda ner Whisper för Windows eller Mac och låt den fria lokala nivån genomgå en riktig dag av e-post och anteckningar.

Eller börja med Win+H; den sitter fyra centimeter från ditt vänstra lillfinger, och att säga åt dig att prova den gratis konkurrenten först är, har jag fått höra, inte så marknadsföring fungerar.

Foto av Denys Medvediev

Denys Medvediev

Jag är den som läser vår support-e-post, troligen genom att diktera svaren.