Guide
Programvara för mötesutskrifter
Ett och samma sökord, men två helt olika jobb. Vissa verktyg skickar en bot som ansluter till ditt möte och skriver delade anteckningar. Andra bearbetar en inspelning du redan har – offline, på din egen dator. Så här vet du vilket du faktiskt behöver.
Senast uppdaterad: juni 2026

Programvara för mötesutskrifter omvandlar tal från ett samtal till sökbar, skriven text. Det sker på två sätt: i realtid, där utskriften visas direkt medan folk talar, och efter mötet, där en inspelning bearbetas i efterhand för att ge renare, tidsstämplade anteckningar med talaridentifiering. De flesta verktyg ansluter automatiskt via kalendersynk och en mötesbot; ett fåtal fungerar utan bot, från en inspelning du redan har.
Första gången jag såg ett team dra på sig en rejäl nota för mötesutskrifter hade siffran fem siffror – och mötena hade redan anteckningar. En konsult hade kopplat ihop ett internt AI-dikteringsprototyp som anropade moln-API:et för varje yttrande, med en återförsökslogik så aggressiv att samma standup-inspelning transkriberades fyra gånger. Chefen öppnade kostnadsdashboarden vid kvartalsslutet. Det blev tyst i rummet.
Den tråkiga sanningen om den här kategorin är att välja fel verktyg kostar – i pengar, i integritet eller i tid – oftast innan någon ens märker det.
Det är hela poängen med den här artikeln. Team har velat ha automatiska mötesanteckningar i ett decennium, och verktygen klarar jobbet bra nu. Fångsten är att de gör vitt skilda jobb under ett och samma sökord. Vissa ansluter till ditt videosamtal som en bot och skriver delade anteckningar åt alla. Andra bearbetar en inspelning i efterhand, offline, på din egen maskin.
Nedan går jag igenom båda vägarna, namnger de verktyg som är värda att känna till och är ärlig om det jobb vår egen app inte gör: den är ingen mötesbot. Som den som läser vår support-post kan jag säga att det mesta av förvirringen i den här kategorin beror på att folk väljer fel typ av verktyg från dag ett. Jag har besvarat samma mejl tillräckligt många gånger för att känna igen det redan på ämnesraden.
Vad programvara för mötesutskrifter gör (och de två sätten det fungerar)
Bakom marknadsföringen gör alla verktyg här en enda sak: tar ljud och producerar text. Ljudet är mänskligt tal från ett möte. Texten är en utskrift. Allt annat – sammanfattningar, åtgärdspunkter, talaridentifiering, sökning – är byggt ovanpå den omvandlingen.
Kategorin delas utifrån när omvandlingen sker.
- Utskrift i realtid sker medan folk talar. Orden visas på skärmen en sekund eller två efter talaren. Det är vad du får från en live-undertext i Zoom eller Microsoft Teams, och från anteckningsbottar som visar en löpande utskrift under samtalet. Det är användbart i stunden: för tillgänglighet, för att hänga med och för att fånga ett namn du missade.
- Utskrift efter mötet sker från en inspelning när samtalet är slut. Verktyget har hela filen och kan ta sin tid. Det rensar upp tveksamma formuleringar, identifierar vem som sade vad, lägger till tidsstämplar och syr ihop ett läsbart dokument. Efterhandsbearbetning ger renare, tidsstämplad text med talaridentifiering jämfört med live-versionen. Avvägningen är att du måste vänta.
De flesta välkända verktyg (Otter, Fireflies, Fathom, tl;dv) gör båda, och de hämtar ljudet på samma sätt: en bot ansluter till samtalet. Du kopplar ihop din Google- eller Outlook-kalender, verktyget ser ett möte med en videolänk och skickar in en deltagare i rummet för att lyssna och spela in. Den lilla inspelningsrutan du sett i ett Zoom-rutnät sammanfattar hela modellen i en bild.
En tystare tredje väg gömmer sig bakom sökordet: att transkribera en inspelning du redan har, på din egen maskin, utan bot och utan samtal. Det är diktering och transkriberingsmjukvara snarare än en mötesanteckningsbot, och det är där vår app hör hemma. Mer om det nedan, inklusive den ärliga delen om när det är fel val.
När en mötesbot är rätt val (och Whisper inte är det)
Maria 10:02 Låt oss börja med lanseringsdatumet.
Tom 10:02 Jag tror vi glider en vecka.
Om ditt problem är "något borde ansluta till mitt Zoom-, Teams- eller Google Meet-samtal, fånga alla och ge hela teamet delade anteckningar efteråt" vill du ha en mötesbot. Whisper gör inte det. Den ansluter inte automatiskt till samtal, spelar inte in andra deltagare och kör inte flertalarsidentifiering i ett videomöte. Att påstå annat skulle slösa bort din eftermiddag.
För det jobbet är bot-baserade anteckningsverktyg rätt val. Otter.ai ansluter till Zoom, Microsoft Teams och Google Meet för att skriva och dela anteckningar automatiskt, och har en gratis Basic-plan om du vill testa modellen innan du betalar. Fireflies.ai ansluter via inbjudan eller automatisk kalenderanslutning, och gratistjänsten inkluderar obegränsad transkribering med begränsade AI-sammanfattningar. tl;dv spelar in Google Meet, Zoom och Teams, marknadsför ett botfritt inspelningsläge och erbjuder en gratis plan utan tidsgräns. Fathom har en gratis plan med obegränsade inspelningar och möjlighet att välja botfritt (i beta) eller bot-inspelning.
Här är den del av artikeln där jag medvetet skickar dig någon annanstans. Otter är för möten. Whisper är för skrivande. Det är olika kategorier, och att betala för fel en är det vanligaste misstaget i hela det här utrymmet. Om du behöver flertalarsidentifiering i ett inspelat samtal, automatisk kalenderanslutning och en sammanfattning i teamkanalen när mötet är slut, gör en botanteckningsapp ett jobb som vår app aldrig byggdes för. Vi gör röstdikterat skrivande snabbt; de gör rumsinspelning automatisk. Välj kategori först, verktyg sedan.
Hur träffsäker är AI-mötesutskrift egentligen?
Det ärliga svaret: bättre än du förväntar dig på rent ljud, sämre än du hoppas på ett riktigt möte. Kategorin landar kring 85 till 95 procents träffsäkerhet på klart, enkeltspråkigt ljud, och faller med bakgrundsljud, accenter, jargong och folk som pratar i munnen på varandra. Manuellt granskade tjänster klättrar tillbaka mot 99 procent, eftersom en människa rättar det modellen missade.
Vårt eget lokala läge rapporterar träffsäkerhet som typiskt landar mellan 95 och 99 procent, med större modeller som ger högre resultat. Jag vill vara försiktig här. Det är vår mätning på vår programvara, inte en oberoende jämförelse mot Otter eller Fireflies, och jag tänker inte hitta på en sådan. Den som lämnar en enda träffsäkerhetsprocent för mötesutskrift utan att ange ljudförhållandena säljer, mäter inte.
Här är det ingen marknadsför, för det finns inget att merförsälja. Mikrofonen spelar större roll än modellen. En USB-mikrofon för ett par hundralappar gör mer för din utskrift än att hoppa från en liten modell till den största. De flesta dåliga utskrifter jag sett var inte ett modellfel. De berodde på en laptopmic som fångade upp ett luftkonditioneringsaggregat, fyra personer i samma rum med en enda högtalartelefon, eller ett Bluetooth-headset som klippte av det första ordet i varje mening. Fixa ljudet först. AI:n kan inte ta bort krossandet från kaffekoppen.
Ytterligare två saker driver träffsäkerheten under huven. Den ena är hur verktyget avgör var en person slutar och en annan börjar, vilket blir svårare när folk talar i munnen på varandra (anledningen till att en utskrift av min familj vid middagsbordet skulle läsas som ett enda 400-ords meningslöst flöde). Den andra är stöd för anpassat ordförråd: möjligheten att mata in produktnamn, efternamn och förkortningar som ingen generell modell sett förut. Whisper låter dig ställa in anpassat ordförråd och vikta specifika nyckelord i sin lokala Whisper-motor, och många mötesbotar gör det också. Är dina samtal fyllda av jargong är den inställningen mer värd än ett modelluppgrade.
Botfritt och offline: transkribera en inspelning du redan har
Här är den väg sökordet håller tyst om, och den vår app är byggd för. Du behöver inte alltid programvara som ansluter till ett möte. Ibland har du redan inspelningen – ett röstmeddelande från ett enskilt samtal, en intervju, ett webbinarexport, ett klipp en kollega skickat – och du behöver bara ren text från det, på din egen maskin, utan en bot i någons samtal.
Diktering och transkriberingsmjukvara som Whisper passar här och förtjänar sitt existensberättigande på integritet. Allt i lokalt läge körs på din laptop. Ljudet lämnar aldrig enheten: ingen server i flödet, inga leverantörsloggar, ingen molnkostnadsmätare. Din chefs lönesamtal, den juridiska inspelningen, HR-konversationen – inget av det borde hamna i en tredje parts lagring för att du behövde en utskrift. Lokal-först är inte en funktion här. Det är hela poängen.
Whisper kör två lokala motorer, båda i ren Rust via transcribe-rs, utan Python-sidoprocesser som bromsar starten. Den första är OpenAI:s öppen källkods-Whisper, som i sina flerspråkiga varianter täcker 99 språk och kan översätta till engelska, med modellstorlekar från Base på ungefär 140 MB upp till Large v3 på ungefär 3 GB. De engelskspråkiga varianterna är precis det – bara engelska – och tenderar att köra lite lättare. Den andra motorn är NVIDIA:s Parakeet TDT, ungefär 600 MB, beskriven i appen som 5 till 10 gånger snabbare än Whisper på CPU, och täcker engelska plus 24 europeiska språk (25 totalt) utan översättning till engelska. Välj Parakeet för hastighet om du mestadels jobbar på engelska. Välj Whisper om du behöver översättning eller ett språk som Parakeet inte täcker.
Interaktionen är densamma jag använder hela dagen. Du håller ned snabbtangenten – Ctrl+Space på Windows, eller Command+Option push-to-talk på Mac, håll båda tangenterna och släpp endera för att stoppa – talar, och texten hamnar vid markören i vilken app som är aktiv. Ett litet överlägg visar statusen medan det arbetar. För en inspelning snarare än live-tal pekar du appen mot filen och får utskriften tillbaka. Om du vill ha dikteringsdelen specifikt går vår guide för offline tal-till-text djupare in på att köra allt på enheten.
Ett molnalternativ finns också, för den som vill ha de senaste OpenAI-modellerna och en röststyrd webbsökning i samma verktyg. Ta med din egen OpenAI-nyckel, säg "Hey whisper" för att dirigera texten genom AI:n. Men för att transkribera en inspelning du redan har är lokalt läge svaret, och det är gratis för alla inloggade användare.
De andra verktygen värda att känna till
Den här kategorin är trång, och sökresultaten domineras av listor som rankar sex till tio verktyg var. Här är en tydlig karta så att du slipper läsa tio recensioner för att förstå vad varje verktyg är till för. Alla funktioner nedan kommer från respektive verktygs egna sidor.
- Otter.ai — den självklara mötesanteckningsappen. Boten ansluter till Zoom, Teams och Meet; gratis Basic-plan med 300 minuter per månad, betalda Pro- och Business-nivåer ovanpå det. Transkribering på sex språk: engelska, spanska, franska, tyska, japanska, kinesiska.
- Fireflies.ai — boten ansluter via inbjudan eller automatisk kalenderanslutning. Gratis plan med obegränsad transkribering och begränsade AI-sammanfattningar; marknadsför 100+ språk i betalda nivåer.
- tl;dv — spelar in Meet, Zoom och Teams, marknadsför ett botfritt läge, transkriberar på 30+ språk, gratis plan utan tidsgräns och utan kortuppgifter.
- Fathom — gratis plan med obegränsade inspelningar, plus val av botfritt (beta) eller bot-inspelning; betalda Premium-, Team- och Business-nivåer ovanpå.
- Notta — har en mötesbot för Zoom, Teams och Meet samt en gratistjänst; deras eget hjälpcenter listar ungefär 58 språk.
- Zoom och Teams, inbyggt — innan du köper något, kolla vad du redan betalar för. Zoom transkriberar molninspelningar och erbjuder AI Companion realtidstranskribering på 46 språk i berättigade betalplaner. Microsoft Teams har inbyggd live-transkribering på ungefär 50-plus talade språk; live-översatt transkribering kräver Teams Premium.
Här är samma karta som en tabell, med bara de delar du kan verifiera på respektive verktygs egna sidor. Inga träffsäkerhets- eller hastighetssiffror, för ingen har kört dem mot varandra på samma ljud, och jag tänker inte hitta på testet.
| Verktyg | Inspelning | Lokalt/Moln | Fungerar offline | Prismodell | Språk | Passar bäst för |
|---|---|---|---|---|---|---|
| Otter.ai | Bot ansluter till samtalet | Moln | Nej | Gratis nivå + per-användare betalt | 6 | Den självklara teamanteckningsappen |
| Fireflies.ai | Bot via inbjudan eller auto-anslutning | Moln | Nej | Gratis nivå + per-användare betalt | 100+ | Generös gratis transkribering |
| tl;dv | Spelar in samtal, botfritt läge | Moln | Nej | Gratis för alltid + betalt | 30+ | Ingen bot i mötesrutnätet |
| Fathom | Botfritt (beta) eller bot | Moln | Nej | Gratis för alltid + betalt | Anges ej på prissidan | Obegränsade gratisinspelningar |
| Notta | Bot ansluter till samtalet | Moln | Nej | Gratis nivå + betalt | ~58 (hjälpcentret) | Bot plus gratis nivå |
| Zoom / Teams (inbyggt) | Inbyggt i samtalet | Moln | Nej | Ingår i berättigade betalplaner | Zoom 46, Teams 50+ | Det du redan betalar för |
| Whisper by Remskill | Inget samtal; transkriberar fil eller diktering | Lokalt (Moln valfritt) | Ja | Gratis lokalt + Pro | 99 flerspråkigt, 25 Parakeet | Privat, botfritt, på enheten |
Om dina möten redan körs på en betald Zoom- eller Teams-plan kan den inbyggda transkriberingen vara allt du behöver – utan ytterligare en prenumeration eller en bot i samtalet.
Vad jag skulle välja för varje situation
Jag läser supporten, så jag ser ångesten av att ha valt fel verktyg tillräckligt ofta för att ha en åsikt. Så här skulle jag välja.
- Du vill ha anteckningar från ett team-videosamtal, automatiskt, delade med alla. Använd en botanteckningsapp. Otter om du vill ha den polerade standardlösningen, Fireflies eller Fathom om du vill ha en generös gratis nivå, tl;dv om du inte vill ha en bot i mötesrutnätet.
- Du är redan på en betald Zoom- eller Teams-plan. Prova den inbyggda transkriberingen innan du betalar för ytterligare ett verktyg.
- Du har en inspelning och vill ha ren text, privat, på din egen maskin. Det här är den botfria, offline-vägen: Whisper, eller ett annat lokalt transkriberingsverktyg. Ljudet stannar på enheten.
- Du vill skriva med rösten (mejl, dokument, anteckningar under eller efter samtalet) vid markören, i vilken app som helst. Det är diktering, och det är jobbet Whisper byggdes för. Vår jämförelse av transkriberingsmjukvara går igenom skillnaden mellan diktering och mötesanteckningar mer i detalj.
- Du behöver en garanterat nästan felfri utskrift för juridik eller regelefterlevnad. Använd en manuellt granskad tjänst. AI ensamt toppar under 99 procent på verkligt ljud.
Misstaget att undvika är att betala för en mötesbot för att diktera, eller förvänta sig att ett dikteringsverktyg ansluter till dina samtal. Olika kategorier. Välj den som matchar jobbet. Jag har byggt mjukvara i femton år och köpte ändå fel verktyg för ett jobb förra året, så det här är ingen föreläsning från någon som alltid gör rätt.
Priser, i raka siffror
De flesta verktyg här har en gratis nivå värd att testa innan du tar fram kortet. Otter, Fireflies, tl;dv och Fathom erbjuder alla en gratis plan, med betalda nivåer när du behöver fler minuter, fler platser eller obegränsad lagring. Botanteckningsappar tar generellt betalt per användare och månad, vilket snabbt adderar ihop sig i ett team.
Whisper är gratis för alla inloggade användare i hela det lokala flödet – båda motorerna, AI-förbättring via Ollama, historik, förinställningar, anpassat ordförråd, snabbtangenten, allt – utan att en betalningsmetod krävs vid registrering. Den betalda nivån lägger till molnfunktionerna för den som vill ha OpenAI:s modeller och röstwebbsökning. Exakta siffror för månadsvis, årsvis, livstids- och teamplatser finns på prissidan. Jag föredrar att du börjar gratis och bestämmer dig själv snarare än att ta ett pris ur sitt sammanhang här.
Välj typ av verktyg innan du väljer varumärke. Om en bot ska ansluta till ditt samtal, använd en anteckningsapp. Om en inspelning på din laptop ska bli privat text, använd något offline. Den femsiffriga notan jag såg ett team dra på sig berodde på att de aldrig frågade vilket jobb de betalade för – och det var ett möte ingen behövde en utskrift av.
Prova den botfria vägen på en inspelning du redan har
Ladda ned Whisper, peka den mot en inspelning och se ren text komma tillbaka – på din egen maskin, utan bot i någons samtal.
Gratis för alla inloggade användare i hela det lokala flödet. Ingen betalningsmetod vid registrering.



