Guide
Röst till text i Figma utan plugin
Figma har ingen inbyggd diktering, och dess enda ljudfunktion är direktsänd röstchatt mellan medarbetare, inte transkribering. För att få dina ord till ritytan installerar du en community-plugin eller använder ett systemövergripande snabbkommando som skriver in i vilket fält som helst som har fokus – Figma inräknat.
Senast uppdaterad: juni 2026

Röst till text i Figma är ingen inbyggd funktion. Figma har ingen inbyggd diktering, och dess enda ljudfunktion är direktsänd röstchatt mellan medarbetare, vilket inte är transkribering. För att diktera in i en Figma-kommentar, anteckning eller textlager installerar designers antingen en community-plugin eller använder ett systemövergripande dikteringssnabbkommando som skriver in i vilket fält som helst som har fokus.
Jag såg en designer lägga fyra minuter på att skriva in samma två meningar i en Figma-kommentar, två gånger, eftersom autokorrigeringen gjorde om "padding" till "pudding". Hon gör det här dussintals gånger om dagen. Kommentarer, markeringsnoteringar, överlämningsanteckningar – inget av det är designarbete, allt är skrivande. De snabbaste personerna jag känner i Figma har i tysthet slutat göra det med händerna.
Här är det som förvirrar alla först: Figma har faktiskt en "ljud"-funktion, och den har inget med det här att göra. Figmas ljud är direktsänd röstchatt – du och dina kollegor pratar i realtid medan ni båda petar på samma ram. Det är ett telefonsamtal inuti en designfil. Det förvandlar inte dina ord till text. Så när någon säger "har inte Figma redan röst?" – jo, men fel sort. Den tråkiga sanningen är att diktering, den sorten som sätter ord på ritytan, inte finns i produkten alls.
Figma kan inte göra röst till text. Här är vad det faktiskt kan.

Figma har ingen inbyggd röst till text. Folk fortsätter att efterfråga det – Figma Forum har öppna funktionsönskemål som "Voice input to comment" och "Add voice to text prompting to Figma Make", vilket är internets artiga sätt att bekräfta att en funktion inte finns.
Det Figma faktiskt har är ljudchatt, och den är genuint användbar – fast för ett annat jobb. Den låter medarbetare prata högt inuti en fil eller en FigJam-tavla, på datorn och i webbläsaren, i stället för att hoppa över till ett separat samtal. Det är röstchatt. Det är inte tal till text. Inget du säger in i Figmas ljud landar någonsin i en kommentarsruta eller ett textlager.
Så du har två ärliga vägar till verklig diktering i Figma. Väg ett: en community-plugin som bor inuti Figma. Väg två: ett dikteringsverktyg på systemnivå som skriver in i vilket fält som helst som har fokus på din dator, Figma inräknat. Resten av det här handlar om båda, inklusive när vardera är det rätta valet.
Plugin-vägen: "Voice to Text for Figma" och kompani
Det finns riktiga plugins för det här. "Voice to Text for Figma" är en community-plugin där du öppnar ett röstverktyg, talar, och transkriptionen landar i ditt valda textlager. "Hey Figma Speech Recognition" gör samma sak. De fungerar. Jag vill vara rättvis mot det innan jag berättar varför de känns klumpiga.
Här är haken, och den är strukturell, inte ett fel. Figma-plugins kan inte komma åt din mikrofon. Så för att höra dig öppnar de här pluginsen ett separat webbläsarfönster, känner igen ditt tal med webbläsarens inbyggda Web Speech API, och skickar sedan tillbaka texten in i Figma över en WebSocket-anslutning. För att diktera en kommentar studsar du mellan ett Figma-fönster, en webbläsarpopup som lyssnar, och tillbaka igen. Det kräver en modern webbläsare, och det kräver att du befinner dig i webbläsaren över huvud taget.
För en kommentar på fem ord, helt okej. För en hel dag med överlämningsanteckningar blir fönsterjonglerandet snabbt tröttsamt. Det finns dessutom ingen FigJam-specifik dikteringsplugin alls.
Den snabbare vägen: ett systemövergripande snabbkommando som skriver in i Figma
Whisper tar den andra vägen. Det är en skrivbordsapp för Windows och macOS, inte en plugin och inte ett webbläsartillägg. Den använder ett enda systemövergripande snabbkommando: håll ner Ctrl+Space på Windows, eller Command+Option på macOS, tala, och släpp. Texten dyker upp där din markör redan står.
Den där "där din markör står"-biten är hela tricket. Eftersom Whisper skriver på operativsystemnivå bryr den sig inte om att fältet tillhör Figma. Ställ markören i en Figma-kommentarsruta och diktera kommentaren. Klicka in i ett valt textlager och diktera texten. Hoppa in i en markeringsnotering eller en utvecklaröverlämning och diktera specifikationen. Ingen plugin att installera, inget webbläsarfönster som dyker upp, ingen WebSocket. Det fungerar i Figmas skrivbordsapp och i Figma som körs i en webbläsarflik, eftersom på OS-nivå är båda bara "en app med ett textfält som har fokus".
Och samma snabbkommando fungerar överallt annars. Du dikterar en Figma-kommentar, växlar sedan med Cmd-Tab till Slack och dikterar ett meddelande till utvecklaren, sedan till din e-post – samma tangent, samma muskelminne, varje app.
Det är den faktiska Whisper-appen ovan, inte en skärmdump – klicka runt i den. Du väljer var transkriberingen körs, ställer in ditt snabbkommando, och det är ungefär hela inställningen. Det finns ingen Figma-formad överraskning: det är en app, en tangent, och Figma är bara en av apparna den råkar skriva in i.
Vad du kan diktera i Figma (och vad du inte kan)
Du kan diktera överallt där Figma ger dig en textmarkör. Designkommentarer och feedback. Markeringsnoteringar. Utvecklaröverlämningar. Själva texten inuti ett textlager – brödtext, knapptexter, den där mikrotexten du skriver om elva gånger. FigJam-klisterlappar också: FigJam har ingen inbyggd diktering och ingen dedikerad röstplugin, men en klisterlapp är bara ett vanligt textfält med fokus, så ett systemövergripande snabbkommando skriver in i det precis som i alla andra. Att hålla en workshop och fånga idéer snabbare än folk hinner säga dem är det enda tillfälle jag sett designers verkligen kapplöpa med rummet. Om du lever mer i whiteboards än i designfiler bär samma idé över till att diktera in i Miro-tavlor.
Nu den ärliga delen, i fetstil eftersom verktyg i den här branschen gärna antyder något annat. Whisper dikterar in i fältet som har fokus. Den styr inte Figma. Den ritar ingen ram, flyttar inget lager, byter inte namn på en komponent, ändrar ingen storlek och skapar inga objekt med rösten. Den skriver ord där din markör står – ett fält i taget – och det är hela jobbet. Whisper ersätter skrivandet, inte designandet. (Om du vill ha ett verktyg som knuffar ett lager 2px åt vänster när du säger "knuffa det 2px åt vänster" så är det en annan och mycket modigare produkt än min.) Samma enfältsräckvidd, förresten, som pluginsen och ditt operativsystems egen diktering har – ingen i den här kategorin styr hela editorn.
Lokalt, offline och uppstädat
Rå diktering innehåller utfyllnad. "Öh", "det, eh, mellanrummet", ögonblicket då du rättar dig själv mitt i en mening. Whisper kan köra en valfri AI-städning efter transkriberingen som trimmar utfyllnaden och rättar de uppenbara felen, så att du får något du faktiskt skulle vilja klistra in i en överlämningsanteckning. Städningen körs lokalt på din maskin i gratisläge, eller via molnet om du slår på Pro-funktionerna och tar med din egen nyckel. Den är genuint behändig på designsystemets vokabulär – komponentnamn, token-namn, orden som vanlig autokorrigering mörbultar till något pinsamt. Whisper hanterar dessutom över 90 språk i både lokalt läge och molnläge, så ett team som skriver UI-text på tyska och granskar den på engelska behöver inte byta verktyg.

Lokalt läge körs helt offline. Ingen internetuppkoppling under transkriberingen, och ditt ljud lämnar aldrig maskinen – det enda tillfälle du behöver en uppkoppling är den engångsnedladdningen av modellen, någonstans mellan ungefär 140 MB och 3 GB beroende på vilken modell du väljer. Efter det kan nätverket vara avstängt och dikteringen fungerar ändå på tåget, på ett flygplan, på ett kontor som blockerar halva internet.
Oss emellan, det här är den del jag inte skulle kompromissa om. Diktering som bara körs i molnet är en integritetskatastrof som väntar på att bli transkriberad. Anteckningen du dikterar kan beskriva en osläppt produkt, en prisskärm, ett säkerhetsflöde – det är precis den sortens sak som inte borde passera genom en leverantörs loggar bara för att du ville slippa skriva. Plugin-vägen är beroende av webbläsarens talmotor och ett separat fönster; lokal diktering håller ljudet kvar på den enda enhet som redan har en mikrofon och en fullt duglig processor. Om du hanterar något känsligt slutar den skillnaden vara ett trevligt extra.
När en Figma-plugin eller OS-diktering är mer logiskt

Jag skulle inte installera Whisper åt alla. Om du bara någon gång dikterar en kommentar på fem ord, och du lever helt inuti Figma i en webbläsarflik, så gör en gratis community-plugin som "Voice to Text for Figma" jobbet – öppna röstverktyget, prata, klart. Ingen nedladdning.
Och du kanske inte behöver något av det här alls. Windows har gratis diktering inbyggd – tryck Win+H och tala in i de flesta fält som har fokus, Figma inräknat. macOS har Diktering i sina tangentbordsinställningar. Båda är gratis, ingen behöver installeras, och för korta stötar duger de alldeles utmärkt. Sträck dig efter en skrivbordsdikteringsapp som Whisper när du vill ha tre saker som gratisalternativen inte riktigt ger dig: att det fungerar offline med ljudet kvar på din maskin, ett snabbkommando i varje app i stället för bara Figma, och AI-städning av teknisk designsystemvokabulär. Om inget av det spelar roll för dig, spara ditt diskutrymme – din styrplatta överlever ett år till.
Willow är ett annat dikteringsverktyg på systemnivå inriktat på samma Figma-arbetsflöde – snabbkommando i vilket textfält som helst, ingen plugin – så kategorin är inte bara vi. Det ärliga landskapet är: plugins för snabb webbläsarbunden diktering, ditt OS för korta gratis stötar, och en skrivbordsdikteringsapp när du vill ha det överallt och offline.
Installation: tre steg, ingen Figma-plugin
Du rör inte Figmas plugin-meny för det här. Hela poängen är att dikteringsverktyget bor utanför Figma.
- Ladda ner och installera Whisper på Windows eller macOS, och logga sedan in. Den lokala pipelinen är gratis utan kort vid registrering; Cloud-funktionerna är den betalda Pro-ytan.
- Bekräfta ditt snabbkommando. Standard är Ctrl+Space på Windows, Command+Option på macOS – ändra det i inställningarna om det krockar med något du redan använder.
- Öppna Figma, klicka in i vilket textfält som helst – en kommentar, ett lager, en klisterlapp – håll ner snabbkommandot, tala, släpp. Orden dyker upp vid markören.
Det är allt. Inget plugin-godkännande, ingen webbläsarpopup, ingen konfiguration per app. Första gången jag visade det här sträckte jag mig instinktivt efter Figmas plugin-meny av gammal vana, och kom sedan ihåg att det inte finns något att installera. Om du någonsin velat skriva snabbare med rösten i alla dina appar är Figma-fallet bara ett stopp på den vägen. Samma inställning är vad folk använder för att diktera inuti ClickUp och de flesta andra verktyg.
Min sjuåring listade ut snabbkommandot innan hon listade ut vilken app som var Figma. Hon höll ner tangenten, berättade om en klisterlapp om en drake, och släppte, och orden var bara där – ingen meny, ingen plugin, ingen aning om att något av det skulle vara svårt. Det är ribban. Om ett barn kan diktera en drake in i en klisterlapp utan att läsa en manual, så kan en designer diktera en överlämningsanteckning mellan klunkarna kaffe. Händerna var ändå aldrig poängen med arbetet. Samma tillvägagångssätt fungerar för röst till text på Mac i dina andra appar också.
Redo att sluta skriva dina kommentarer?
Ladda ner Whisper, klicka in i vilket Figma-fält som helst, håll ner snabbkommandot, och se transkriptionen dyka upp – ingen plugin, ingen webbläsarpopup.
Gratis lokalt läge för alla inloggade konton. Inget kort krävs för att börja.



