Av Denys Medvediev

Guide

Röststyrning i Word: Win+H, Diktera eller något bättre

Två inbyggda sätt att diktera i Word, och en uppgradering som fungerar i hela systemet. Var de finns, hur du slår på dem och var de tar slut.

Senast uppdaterad: juni 2026

Händer som skriver ett dokument på en bärbar dator omgiven av papper – det arbetssätt som röststyrning i Word ersätter

Röststyrning i Word fungerar på två sätt direkt: tryck på Win+H för att öppna Windows röststyrning i vilket textfält som helst, eller klicka på knappen Diktera på fliken Start i Word. Båda kräver en internetanslutning för att transkribera. Ett lokalt verktyg som Whisper lägger till diktering offline som fungerar i Word och alla andra appar.

En statusrapport på 700 ord tog mig 19 minuter att skriva förra månaden, och lite under 5 minuter att diktera i 145 ord per minut. Samma dokument, samma Word-fönster, samma författare. Det enda som ändrades var vilken inmatning Microsofts mest kända app lyssnade på. Word har haft öron i flera år; de flesta hittade bara aldrig de två knapparna som slår på dem. (Jag hittade dem på det pinsamma sättet, genom att trycka Win+H för att tysta ett samtal.)

Här är problemet: Word-användare hittar ett av de två inbyggda dikteringsverktygen, antar att det är det enda som finns, och bedömer röststyrning utifrån det de råkar trycka på först. Just nu levereras Windows 11 med röststyrning på Win+H och Microsoft 365 med Diktera inne i Word, och det är två olika verktyg med olika krav. Den här guiden går igenom hur du slår på båda inifrån Word, var var och en tar slut, och hur ett systemövergripande verktyg täcker det de missar.

I slutet har du röststyrning igång i Word på under en minut, plus en offline-uppsättning om du behöver en. De flesta dikteringsfrågorna i vår support-inkorg handlar i grunden om "vilket av dessa använder jag". Jag läser de mejlen, så jag kan säga det med rak min.

Word har två vägar till röststyrning, inte en

Microsoft byggde båda, vilket är just därför ingen kan skilja dem åt. Windows röststyrning är en del av operativsystemet. Den öppnas med Win+H, svävar ovanför vilken app som än har fokus, och skriver där markören står. Den fungerar i Word på samma sätt som i Anteckningar eller ett formulär i en webbläsare. Diktera är en del av Microsoft 365. Den finns på fliken Start i Word, existerar bara inne i Office-apparna, och kräver en aktiv Microsoft 365-prenumeration.

Den tråkiga sanningen: för vanlig styckesdiktering i Word ger de nästan identiska resultat, eftersom båda skickar ditt ljud genom Microsofts taltjänster online. Skillnaderna som spelar roll är räckvidd och krav. Win+H följer med Windows och hänger med dig i alla appar. Diktera är knutet till din Microsoft 365-plan och kan Word-specifika trick som formateringskommandon. Har du en Microsoft 365-prenumeration och bor inne i Word hela dagen, börja med Diktera. Skriver du i Word, Outlook, Slack och en webbläsare, börja med Win+H. Inget av dem kostar extra utöver det du redan har.

Win+H: röststyrning som bor i Windows, inte i Word

Lyssnar …
Röststyrningspillret i Windows 11 – en förenklad återskapning av Microsofts gränssnitt, inte Whisper-appen.

Vad du behöver före steg 1: en dator med Windows 11 (Windows 10 har det äldre dikteringsverktygsfältet på samma kortkommando), en fungerande mikrofon och en internetanslutning, eftersom Windows röststyrning transkriberar via Microsofts taligenkänning online. Ingen anslutning betyder ingen skrivning. Hela uppsättningen tar under en minut.

1. Öppna ditt dokument och klicka där texten ska hamna

Röststyrning behöver markören i en textruta; med inget i fokus öppnas pillret men ingenting skrivs.

Kontroll: markören blinkar inne på din Word-sida.

2. Tryck på Win+H

Röststyrningspillret dyker upp nära skärmens över- eller underkant.

Kontroll: det visar "Lyssnar …" innan du börjar prata.

3. Prata i fraser, inte enstaka ord

Hela meningar blir renare än diktering ord för ord.

4. Slå på automatisk interpunktion

Klicka på kugghjulet på pillret och aktivera automatisk interpunktion, eller säg den: "punkt", "kommatecken", "frågetecken".

Kontroll: att avsluta en mening och pausa ger en punkt utan att du säger någon.

5. Sluta med rösten eller samma kortkommando

Säg "sluta lyssna", eller tryck Win+H igen.

Win+H tar också emot redigeringskommandon: "ta bort det", "markera det", "tryck på Retur". De fungerar, med tålamodet hos någon som förhandlar om läxor: tydliga vinster på enkla begäran, enstaka överraskningar på sammansatta. För längre rättningar förblir tangentbord och mus obesegrade. Om pillret öppnas men inget händer går våra lösningar för när Win+H inte fungerar igenom de vanliga misstänkta, och Microsofts dokumentation om röststyrning listar alla kommandon och de 40+ språk som stöds.

En sak till: på Copilot+-datorer finns en funktion som heter flytande diktering som städar upp grammatik och stavning medan du pratar, och stänger av sig själv i lösenordsfält.

Knappen Diktera, kort och gott

Start
Diktera
Knappen Diktera på fliken Start i Word – en förenklad återskapning av Microsofts gränssnitt.

Diktera är mikrofonknappen på fliken Start i Word. Klicka på den, vänta tills den visar att den lyssnar, och prata. Den kräver en Microsoft 365-prenumeration, en mikrofon och en pålitlig internetanslutning, och den fungerar i Word för Windows, Mac, webben och mobilen. På en Mac växlar Option+F1 den. Skriver du i Word på en Mac hela dagen kan Diktera plus det enda kortkommandot vara all röststyrning du behöver.

Dess fördel framför Win+H är att den känner Word. Automatisk interpunktion finns på de flesta språk som stöds (en växel i inställningarna), och den förstår formateringskommandon: "fetstil det", "skapa punktlista", "ta bort sista ordet". Dess svaghet är räckvidd. I samma stund du lämnar Office stannar Diktera kvar. Jag håller det här avsnittet kort med flit. Vi har en fullständig guide till Words inbyggda Diktera-funktion som täcker alla kommandon, språk och inställningar, och Microsofts dokumentation om Diktera är den auktoritativa referensen. Om Diktera är gråtonad eller saknas går felsökningsguiden för diktering i Word igenom lösningarna.

Där båda de inbyggda verktygen tar slut

Tre begränsningar dyker upp i praktiken, rangordnade efter hur ofta de biter.

För det första: ingen av dem fungerar offline. Win+H transkriberar via Microsofts onlinetjänster; Diktera anger en pålitlig internetanslutning som ett krav. På ett tåg, på ett flyg, på hotell-wifi som tappar var 40:e sekund blir båda tysta. Mellan oss: diktering som inte kan fungera offline är också ett integritetsbeslut som någon annan tog åt dig. Mejlet till barnets skola, lönesamtalet, det juridiska utkastet – allt skickas genom en leverantörs servrar bara för att du ville skriva med rösten. Lokal transkribering skickar ingenting någonstans, och för vissa dokument är det inte en preferens, det är kravet.

För det andra: språktaken skiljer sig åt. Win+H stöder 40+ språk. Diktera stöder fullt ut omkring 15 språk och regionala varianter, med ytterligare cirka 25 i förhandsversion med lägre träffsäkerhet. Att diktera på ukrainska eller blanda språk mitt i ett dokument blir ojämnt snabbt.

För det tredje: räckvidd. Diktera tar slut vid Office gränser. Win+H går överallt men förblir en Windows-funktion; det finns ingen Mac-motsvarighet. Och jag hittade aldrig någonstans att lära något av verktygen projektnamnen, kundnamnen eller produktjargongen jag använder varje dag – "Remskill" kommer ut som "rem skill" hur många gånger jag än rättar det.

Ett kortkommando som skriver i Word och överallt annars

I slutet av 1990-talet körde en släkting till mig Dragon NaturallySpeaking på en stationär Windows 98-dator med 64 MB RAM. Att träna programmet tog 45 minuter av att läsa kalibreringstext, dikteringen kröp fram med 4 sekunders fördröjning per mening, och ett stycke i ett julbrev tog 15 minuter. Headsetet kastades tvärs över rummet. Headsetet överlevde; experimentet gjorde det inte. Jag arkiverade röststyrning under "idéer vars tid inte är inne" och rörde inte filen på tjugo år. Det här avsnittet är den återöppnade filen.

Whisper är en skrivbordsapp som lägger ett enda kortkommando ovanpå hela systemet. Tryck Ctrl+Space i Word (eller var som helst du kan skriva), prata, släpp, och texten landar vid din markör. Samma tangent fungerar i Outlook, Slack, en webbläsare, en kodredigerare. Det finns inget verktygsfält att leta efter och ingen funktion att aktivera per app, vilket är den strukturella skillnaden mot båda de inbyggda.

Whisper
Den riktiga Whisper-appen, renderad live – klicka runt i Inställningar; det här är vad som installeras.

Uppsättningen tar ungefär tio minuter, det mesta en nedladdning:

1. Installera appen

Den körs på Windows 10 eller senare och macOS 11 eller senare, och väger ungefär 25 MB.

Kontroll: Whisper-fönstret öppnas till Inställningar.

2. Logga in

Den lokala pipelinen – modeller, historik, förinställningar, kortkommandot – behöver bara ett konto.

3. Välj en lokal modell och ladda ner den

Standard är den flerspråkiga Small på ~480 MB. Parakeet v3 på ~600 MB körs 5–10× snabbare på CPU och täcker engelska plus 24 europeiska språk; detaljerna finns på modellkortet för NVIDIA Parakeet. Whisper-modellfamiljen går upp till Large v3 på ~3 GB och täcker över 90 språk i de flerspråkiga varianterna (de enbart engelska byggena är precis det).

Kontroll: modellen visas som nedladdad i Inställningar.

4. Sätt markören i Word, håll in Ctrl+Space, prata, släpp

Transkriptionen klistras in där markören står.

Kontroll: dina ord finns i dokumentet, interpunktion inkluderad.

Cancel
Det svävande överlägget under inspelning – det följer med dig in i vilken app som helst.

Efter modellnedladdningen sker transkriberingen på din maskin utan någon nätverksaktivitet; samma diktering fungerar på 11 000 meters höjd med wifi avstängt. Träffsäkerheten i lokalt läge ligger vanligtvis mellan 95 % och 99 % beroende på modellstorlek, och en egen ordlista lär den namnen som de inbyggda verktygen ständigt slarvar med. Det finns ett molnläge också, där du tar med din egen OpenAI-nyckel för de senaste transkriberingsmodellerna, men för diktering i Word är det lokala den halva jag använder. Jag dikterade det här avsnittet in i utkastet medan en vattenkokare förhandlade med en tepåse; avsnittet behövde två rättningar, teet behövde ingen.

När de inbyggda verktygen räcker

Hemmakontor med en skrivbordsmikrofon, tangentbord och skärm – en enkel uppsättning där inbyggd diktering gör jobbet

Om du dikterar ett stycke i veckan, vid ett skrivbord med bra internet, bara i Word, och på ett av de ~15 språk som Diktera stöder fullt ut, hoppa över Whisper. Diktera finns redan i din Microsoft 365-plan och gör det jobbet bra. Detsamma gäller Win+H om din diktering aldrig lämnar Windows och de 40+ språk som stöds täcker ditt: det är ett kortkommando bort och kostar inget extra. Tredjeparts-röststyrning förtjänar sin plats när du dikterar dagligen, jobbar offline, behöver en egen ordlista, eller vill ha ett enda verktyg i alla appar – inte tidigare.

Tjugofem år skiljer det kastade Dragon-headsetet från ett Word-dokument som skriver sig självt medan du gör te. Verktygen kom ikapp. Det som återstår är att välja vilken lyssnare som passar din vecka. Tryck Win+H idag och diktera ett riktigt stycke – en statusuppdatering, ett svar du har skjutit upp. Om det håller har du en ny standard. Slår du i offline-väggen eller ordlistetaket vet du var uppgraderingen finns.

Testa samma stycke med ett enda kortkommando

Ladda ner Whisper, håll in Ctrl+Space i Word, och se transkriptionen landa vid din markör.

Fungerar på Windows 10 eller senare och macOS 11 eller senare. Lokalt läge körs offline.

Foto av Denys Medvediev

Denys Medvediev

Jag är den som läser vår supportmejl, troligen genom att diktera svaren.