Av Denys Medvediev

Guide

Så får du en Zoom-transkribering

Ett verktyg för Zoom-mötestranskribering är oftast Zoom självt: molninspelningar på ett betalabonnemang skapar automatiskt en text, som mejlas när den är klar och kan redigeras i webbportalen. För livesamtal kan en mötesbot ansluta och transkribera i realtid.

Senast uppdaterad: juni 2026

Ett städat hemmakontor med en bärbar dator, hörlurar och en anteckningsbok, redo för att gå igenom en Zoom-mötestranskribering

Ett verktyg för Zoom-mötestranskribering är oftast Zoom självt. På ett betalt Zoom-abonnemang skapar molninspelningar automatiskt en ljudtranskribering, sparad i VTT-format och redigerbar i webbportalen under Recordings and Transcripts. För livesamtal ansluter en mötesbot som Otter eller Fireflies och transkriberar i realtid. Whisper kommer steget efter: ett dikteringsverktyg med snabbtangent som förvandlar den råa transkriberingen till rena anteckningar du faktiskt vill skicka.

För några veckor sedan frågade någon mig vilket Zoom-transkriberingsverktyg de borde köpa. Det ärliga svaret överraskade dem: troligen inget alls, åtminstone inte först. Om ditt konto ligger på ett betalt Zoom-paket spelar Zoom redan in och transkriberar dina möten åt dig, utan extra programvara och utan ett andra abonnemang.

Internet säljer in det här som ett problem som bara en startup kan lösa. För det mesta är det en kryssruta du ännu inte har slagit på. Det är den tråkiga sanningen, och den är värd ett stycke innan någon tar fram plånboken.

Mötestranskriberingar har varit nästan tillräckligt bra i ett decennium, och folk fortsätter att betala för att täppa till ett gap som är smalare än marknadsföringen antyder. Just nu finns det tre verkliga vägar, och vilken som är rätt beror på om du styr mötet, om du kan spela in det, och vad du tänker göra med orden efteråt.

Den här artikeln går igenom alla tre (Zooms egen transkribering, en mötesbot i realtid, och att transkribera en inspelningsfil du redan har) och var ett dikteringsverktyg med snabbtangent som Whisper passar in, och var det inte gör det. Det mesta av supportmejlen jag får om det här ämnet kommer från folk som köpte ett verktyg för att göra något deras konto redan gjorde. Den snabbaste transkriberingen är den du inte behöver installera något för, så vi börjar där.

Den snabbaste Zoom-transkriberingen är den Zoom redan gör åt dig

Ingen börjar med den här delen. Om du spelar in ett Zoom-möte till molnet på ett Pro-, Business-, Education- eller Enterprise-konto skapar Zoom automatiskt en ljudtranskribering och mejlar dig när den är klar. Transkriberingen sparas i VTT-format och finns i Zooms webbportal under Recordings and Transcripts. Inget tillägg, ingen bot, inget krångel.

Haken är kontonivån. Transkribering av molninspelningar kräver att både molninspelning och ljudtranskribering är påslagna, och inget av det finns i det kostnadsfria Basic-paketet. Så frågan finns det en gratis AI för att transkribera Zoom-möten har ett irriterande svar: Zooms egen transkribering är gratis i den meningen att den inte kostar något extra när du redan betalar för Zoom, och inte gratis alls om du sitter på Basic.

Språkstödet är hyfsat. Zooms supportdokument listar runt 19 språk för transkribering av molninspelningar, däribland engelska, spanska, franska, tyska, kinesiska, japanska, ukrainska och rumänska. För de flesta interna möten räcker det gott. Om du behöver koreanska sida vid sida med polska i samma samtal, kolla den aktuella listan innan du förlitar dig på det, eftersom Zoom utökar den över tid.

Så får du en Zoom-transkribering, steg för steg

zoom.us · Recordings & Transcripts
Molninspelningar · 1 resultat
Veckoavstämning — 2026-06-02Transkribering klar · VTT
pennikon = redigera en fras bock = spara
Zooms egen webbportal: panelen Recordings and Transcripts, där en färdig VTT-transkribering dyker upp och kan redigeras direkt.

Det inbyggda flödet är kort. Här är hela grejen.

1

Spela in mötet till molnet. Starta en molninspelning under samtalet, inte en lokal. Transkriberingen skapas bara för molninspelningar.

Inspelningen dyker upp i portalen, inte bara på din hårddisk.

2

Vänta på två mejl. När mötet är slut mejlar Zoom dig att inspelningen är klar, sedan ett andra mejl om att ljudtranskriberingen är tillgänglig.

Det andra mejlet kommer, vanligtvis inom några minuter efter det första.

3

Öppna Zooms webbportal. Logga in och klicka sedan på Recordings and Transcripts i navigeringsmenyn och öppna fliken Cloud recordings.

Ditt möte finns i listan.

4

Öppna inspelningen och läs transkriberingen. Klicka på inspelningen för att se transkriberingen bredvid uppspelningen.

Du kan se rader med tidsstämplar.

5

Rätta det som är fel. Håll muspekaren över en fras, klicka på pennikonen, rätta den och klicka sedan på bocken för att spara.

Den rättade raden förblir rättad efter en uppdatering.

Det var allt. Inget verktyg att köpa, total tid ett par minuter när mejlet väl har kommit. Om du kom hit för att hitta ett Zoom-mötestranskriberingsverktyg är du kanske redan klar.

Livetextning vs transkribering av molninspelning: vilken du vill ha

Ovanifrånvy av en uppfälld bärbar dator bredvid en tom spiralanteckningsbok, som ställer livetextning mot en sparad transkribering

Det här är två olika saker som folk blandar ihop. Livetranskribering visar textning på skärmen under mötet, användbart för tillgänglighet eller när någons ljud är dåligt, och försvinner i samma stund som samtalet slutar om du inte sparar den. Transkriberingen från molninspelningen är dokumentet i efterhand: den sökbara, redigerbara VTT-filen du läser senare.

Välj utifrån när du behöver orden. Att följa med live betyder att du vill ha textning. Att behöva ett underlag att sammanfatta, söka i eller klistra in i ett uppföljningsmejl betyder att du vill ha transkriberingen från molninspelningen. De flesta som säger transkribering menar den andra och tar av misstag den första.

En ärlig brist: Zoom marknadsför också en AI Companion som skriver mötessammanfattningar, och exakt vilken nivå som krävs ändras över tid. Jag tänker inte citera en siffra jag inte kan koppla till Zooms aktuella dokumentation. Om en automatisk sammanfattningsfunktion är det du är ute efter, kolla vad ditt Zoom-paket innehåller idag innan du antar att den finns där.

Var Whisper passar in: att förvandla transkriberingen till rena anteckningar du kan använda

Nu kommer delen där jag måste vara försiktig, för det vore lätt att översälja. Whisper ansluter inte till ditt Zoom-samtal. Den har ingen Zoom-bot, den ansluter inte automatiskt till möten, och den fångar aldrig andra deltagares ljud. Om du vill ha något som sitter med i mötet och lyssnar är Whisper fel verktyg, och jag pekar dig mot de rätta om en stund.

Whisper
Den riktiga Whisper-skrivbordsappen — klicka runt i inställningarna för att se panelerna för lokal och molnbaserad transkribering.

Det Whisper gör är steget efter att du har en transkribering. Du trycker på en snabbtangent (Ctrl+Space på Windows, Command+Option hålls nere som tryck-och-prata på macOS), talar, och dina ord klistras in vid markören i vilken app du än är i. Så när Zoom väl ger dig den där råa väggen av VTT-text öppnar du dokumentet där uppföljningen ska bo och dikterar versionen en människa ska läsa: de tre besluten, de två ansvariga, den enda deadlinen.

I molnläge går AI-assistenten ett steg längre. Säg Hey whisper så kan du be den sammanfatta ett stycke, plocka ut åtgärdspunkter ur mötesanteckningar eller utkasta svaret, och det putsade resultatet landar vid din markör. Molnfunktionerna är en del av Whisper Pro; den lokala dikteringskedjan är gratis för alla med ett konto, ingen betalmetod för att registrera dig. Transkriberingen är råmaterialet. Whisper är till för att forma det till något du faktiskt vill skicka.

Transkribera en Zoom-inspelningsfil du redan har

Vad händer om du sparade mötet som en lokal fil och aldrig fick någon Zoom-transkribering, Basic-paketets problem? Du har en inspelning, bara inte texten.

CancelTranscribing
Whisper som förvandlar en befintlig inspelning till text — overlay-fönstret i transkriberingsläge.

Whispers molnväg kan transkribera en ljudfil du äger med din egen OpenAI-nyckel, och OpenAI:s tal-till-text-API stöder mp3, mp4, m4a, wav och webm. Den enda siffran att hålla i huvudet: uppladdningar till det API:et är begränsade till 25 MB. Ett långt möte spränger den gränsen, så du skulle dela upp ljudet först. De lokala motorerna delar inte den API-gränsen, eftersom de körs på din maskin: transkribering i ren Rust, inget lämnar datorn.

En reservation jag är skyldig dig: jag har inte själv bekräftat den exakta benämningen på skrivbordsappens filimportflöde, så behandla dra in en inspelning och kör som intentionen, inte en garanterad enklicksknapp. För en ren, självinspelad fil under storleksgränsen klarar molnvägen det. För vardagsdiktering och städning av anteckningar är snabbtangenten huvudnumret.

När du ska hoppa över Whisper och använda en mötesbot istället

Det här är avsnittet som AI-verktyg aldrig skriver, så här kommer det rakt på: om ditt faktiska behov är något som ansluter till samtalet och skriver ner allt, använd inte Whisper. Använd en mötesbot.

Otter kopplas till din Google- eller Microsoft-kalender, ansluter automatiskt till dina Zoom-möten, skriver anteckningar i realtid, fångar delade presentationer och postar en diskussionssammanfattning i Zoom Chat. Fireflies kör en Notetaker-bot som automatiskt ansluter till kalendermöten för att spela in, transkribera och sammanfatta, med åtgärdspunkter efter varje samtal, och utlovar 100-plus språk. Tactiq går åt andra hållet: ett Chrome-tillägg som transkriberar Zoom i realtid utan att någon bot ansluter, en gratisnivå på dina första 10 mötestranskriberingar utan kort, och sammanfattningar med ett klick. Tre olika mekanismer, alla gör den infångning i mötet som Whisper medvetet inte gör.

Det här är åsikten jag står för: Otter är för möten, Whisper är för skrivande. Olika kategorier, och jag vill hellre att du använder rätt verktyg än betalar för mycket för fel. Whisper gör själva akten att skriva med rösten snabb. Den sitter inte med på din standup.

Den skillnaden spelar större roll än den ser ut att göra, och historien om molnräkningen är varför. Ett team jag jobbade med lät en konsult bygga en intern AI-dikteringsprototyp som anropade en molnmodell för varje yttrande, på varje dator. Vid kvartalets slut öppnade chefen kostnadspanelen och hittade en femsiffrig räkning. Mestadels var det ett team som transkriberade standup-inspelningar fyra gånger om, för att återförsökslogiken var för ivrig. Konsultens lösning var optimera prompten. Ekonomichefens var eller sluta betala för att transkribera möten som redan har anteckningar. En mötesbot du behöver är värd pengarna. En mötesbot du köpte för att göra det ditt Zoom-konto redan gör är den där femsiffriga räkningen som väntar på att hända.

Vad en Zoom-transkribering kostar

Zooms transkribering av molninspelningar kostar inget utöver det betalda Zoom-paket du redan har; den är låst bakom Pro-nivån och uppåt, inte det kostnadsfria Basic-paketet. Whispers lokala dikteringskedja är gratis för alla med ett konto, utan att någon betalmetod krävs för att börja. Molnytan (OpenAI-transkribering, AI-förbättring och webbsökning) är en del av Whisper Pro. De exakta siffrorna finns på Whispers prissida så de är alltid aktuella. Botverktyg som Otter, Fireflies och Tactiq prissätter var och en på sitt eget sätt; kolla deras sidor direkt, eftersom priserna för mötesbotar rör på sig.

Whisper körs på Windows och macOS på Apple Silicon, med den lokala kedjan helt offline efter en engångsnedladdning av modellen. Om du först vill få en känsla för dikteringsflödet ger översikten av röst-till-text-appen och jämförelsen av Otter.ai-alternativ en djupare bild av sidan med att skriva med rösten.

De flesta sökningar efter Zoom-transkriberingsverktyg slutar på samma sätt: någon upptäcker att transkriberingen redan låg i deras Zoom-portal, slår på molninspelning och kommer vidare med sin dag. Verktyget du behövde var en kryssruta. Det som återstår efter det, att förvandla en vägg av tidsstämplar till de två meningar ditt team faktiskt läser, är delen som är värd att göra med rösten. Jag dikterade det mesta av den här artikeln mellan hämtningen på skolan och ett supportmejl om, av allt, var man hittar en Zoom-transkribering. Min dotter frågade vad jag skrev. Jag sa hur man får en Zoom-transkribering. Hon frågade om det var ett riktigt jobb. Rimligt.

Vidare läsning

Redo att städa upp dina mötesanteckningar med rösten?

Hämta din transkribering från Zoom, ladda sedan ner Whisper och diktera versionen ditt team faktiskt kommer att läsa.

Gratis lokalt läge för alla inloggade konton. Inget kort krävs för att börja.

Foto av Denys Medvediev

Denys Medvediev

Jag är den som läser vår supportmejl, troligen genom att diktera svaren.