Opas
Kokoustranskriptio- ohjelmisto
Yksi hakutermi, kaksi aivan erilaista tehtävää. Osa työkaluista lähettää botin liittymään puheluusi ja kirjoittamaan yhteisiä muistiinpanoja. Osa käsittelee jo olemassa olevan äänitteen – offline-tilassa, omalla kannettavallasi. Tässä on, miten selvität, kumpi sinulle sopii.
Päivitetty viimeksi: kesäkuu 2026

Kokoustranskriptio-ohjelmisto muuntaa puhelun puhutun sisällön hakukelpoiseksi tekstiksi. Se toimii kahdella tavalla: reaaliaikaisesti, jolloin litteraatti näkyy ruudulla ihmisten puhuessa, tai kokouksen jälkeen, jolloin äänitteestä käsitellään jälkikäteen siistimpi, puhuja-merkitty, aikaleimattu muistiinpano. Useimmat työkalut liittyvät puheluihin automaattisesti kalenterisync-toiminnon ja kokousbotin kautta; muutama toimii botittomasti jo olemassa olevasta äänitteestä.
Kun katsoin ensimmäistä kertaa, miten tiimi keräsi viiden numeron laskun kokousten litteroinnista – kokousten, joihin oli jo tehty muistiinpanot – minua mietitytti. Urakoitsija oli kytkenyt sisäisen tekoälydiktoinnin prototyypin, joka kutsui pilvi-API:a jokaisen ilmaisun kohdalla, ja niin aggressiivisella uusintayrityslogiikalla, että sama standup-äänitys litteroitiin neljä kertaa. Johtaja avasi kustannusnäkymän vuosineljänneksen lopussa. Huoneessa hiljeni.
Tämän kategorian tylsä totuus on, että väärän työkalun valitseminen maksaa – rahassa, yksityisyydessä tai ajassa – yleensä ennen kuin kukaan huomaa.
Siinä on koko tämän artikkelin ydin. Tiimit ovat halunneet automaattiset kokousmuistiinpanot jo vuosikymmenen, ja työkalut tekevät nyt työn hyvin. Ongelma on, että ne tekevät täysin erilaisia töitä yhdellä hakutermillä. Osa liittyy videopuheluun bottina ja kirjoittaa yhteisiä muistiinpanoja kaikille. Osa käsittelee äänitteen jälkikäteen, offline-tilassa, omalla kannettavallasi.
Alla käyn läpi molemmat polut, nimeän tärkeimmät työkalut ja pysyn rehellisessä sen tehtävän suhteen, jota oma sovelluksemme ei tee: se ei ole kokousbotti. Tukisähköpostiamme lukevana henkilönä voin kertoa, että suurin osa sekaannuksista tässä kategoriassa johtuu siitä, että ihmiset valitsevat väärän tyyppisen työkalun heti alusta. Olen vastannut samaan sähköpostiin niin monta kertaa, että tunnen sen jo aiheesta.
Mitä kokoustranskriptio-ohjelmisto tekee (ja kahdella eri tavalla)
Markkinoinnin takana jokainen tämän kategorian työkalu tekee yhden asian: se ottaa ääntä ja tuottaa tekstiä. Ääni on ihmisten puhetta kokouksesta. Teksti on litteraatti. Kaikki muu – yhteenvedot, toimintakohdat, puhuja-merkinnät, haku – rakentuu sen yhden muunnoksen päälle.
Kategoria jakautuu sen mukaan, milloin muunnos tapahtuu.
- Reaaliaikainen litterointi toimii ihmisten puhuessa. Sanat ilmestyvät ruudulle sekunnin tai parin viiveellä. Tätä saat Zoomin tai Microsoft Teamsin live-tekstityksestä sekä notetaker-boteista, jotka näyttävät käynnissä olevan litteraatin puhelun aikana. Se on hyödyllistä sillä hetkellä: saavutettavuuteen, seurantaan ja puuttuneen nimen nappaamiseen.
- Kokouksen jälkeinen litterointi käsittelee äänitteen puhelun päätyttyä. Työkalu saa koko tiedoston, joten se voi ottaa aikansa. Se siivoaa keskeytyksiä, merkitsee kuka sanoi mitä, lisää aikaleimat ja kokoaa luettavan dokumentin. Jälkikäsittely tuottaa siistimpää, puhuja-merkittyä, aikaleimatumpaa tekstiä kuin live-versio. Vastineena joudut odottamaan.
Useimmat tunnetut työkalut (Otter, Fireflies, Fathom, tl;dv) tekevät molempia, ja ne saavat äänen samalla tavalla: botti liittyy puheluun. Yhdistät Google- tai Outlook-kalenterisi, työkalu näkee kokouksen, jossa on videolinkki, ja lähettää osallistujan huoneeseen kuuntelemaan ja äänittämään. Se pieni äänittävä ruutu, jonka olet nähnyt Zoom-ruudukossa, kuvaa koko mallin yhdessä kehyksessä.
Hakutermin takana piilee hiljaisempi kolmas polku: litteroit jo olemassa olevan äänitteen omalla koneellasi, ilman bottia ja ilman puhelua. Tämä on diktointi- ja litterointiohjelmisto eikä kokousmuistiinpanosovellus, ja siellä oma sovelluksemme elää. Lisää siitä alla, mukaan lukien rehellinen osuus siitä, milloin se on väärä valinta.
Milloin kokousbotti on oikea valinta (ja Whisper ei ole)
Maria 10:02 Aloitetaan julkaisupäivämäärästä.
Tom 10:02 Luulen, että lipsumme viikon.
Jos ongelmasi on "jonkin pitäisi liittyä Zoom-, Teams- tai Google Meet -puheluuni, tallentaa kaikki osallistujat ja toimittaa koko tiimille yhteisiä muistiinpanoja jälkikäteen", tarvitset kokousbotin. Whisper ei tee tätä. Se ei liity puheluihin automaattisesti, se ei tallenna muita osallistujia, eikä se tee monipuhuja-diarisointia videopuhelun läpi. Muuksi väittäminen vain tuhlaisi iltapäiväsi.
Siihen tehtävään sopivat botti-pohjaiset notetaker-sovellukset. Otter.ai liittyy Zoomiin, Microsoft Teamsiin ja Google Meetiin kirjoittaakseen ja jakaakseen muistiinpanot automaattisesti, ja sillä on ilmainen Basic-taso, jos haluat kokeilla mallia ennen maksamista. Fireflies.ai liittyy kutsun tai automaattisen kalenterisynkronoinnin kautta, ja sen ilmaistaso sisältää rajoittamattoman litteroinnin rajallisilla tekoälyyhteenvedoilla. tl;dv äänittää Google Meetin, Zoomin ja Teamsin, markkinoi botitonta tallennustilaa, ja tarjoaa ilmaisen forever-suunnitelman ilman aikarajoituksia. Fathomilla on ilmainen forever-suunnitelma rajoittamattomilla äänitteillä sekä valinta botittoman (beta) tai botti-tallennuksen välillä.
Tässä on artikkelin kohta, jossa lähetän sinut tarkoituksella muualle. Otter on kokouksia varten. Whisper on kirjoittamista varten. Ne ovat eri kategorioita, ja väärästä maksaminen on tämän koko alan yleisin virhe. Jos tarvitset monipuhuja-diarisointia nauhoitetusta puhelusta, kalenterin automaattista liittymistä ja yhteenvedon tiimikanavalle ennen kokouksen päättymistä, botti-notetaker tekee työn, jota sovellustamme ei koskaan ole rakennettu tekemään. Me teemme äänellä kirjoittamisesta nopeaa; he tekevät huoneen tallentamisesta automaattista. Valitse ensin kategoria, sitten työkalu.
Kuinka tarkka tekoälyn kokouslitterointi oikeasti on?
Rehellinen vastaus: parempi kuin odotat puhtaalla äänellä, huonompi kuin toivot oikeassa kokouksessa. Kategoria yltää noin 85–95 prosentin tarkkuuteen selkeällä, yhden kielen äänellä, mutta heikkenee taustamelun, aksenttien, ammattislangin ja päällekkäin puhumisen myötä. Ihmisen tarkistamat palvelut kiipeävät lähelle 99 prosenttia, koska henkilö korjaa sen mitä malli jätti huomaamatta.
Oman paikallisen tilamamme tarkkuus on tyypillisesti 95–99 prosentin välillä suurempien mallien saavuttaessa korkeamman pisteen. Haluan olla tarkka tässä. Kyseessä on oma mittauksemme omassa ohjelmistossamme, ei riippumaton vertailu Otter- tai Fireflies-palvelun kanssa, enkä aio sellaista keksiä. Kuka tahansa, joka antaa sinulle yksittäisen tarkkuusprosentin kokouslitteroinnille kertomatta äänitiedoista, myy eikä mittaa.
Tässä on osuus, jota kukaan ei markkinoi, koska siinä ei ole lisämyyntiä. Mikrofoni merkitsee enemmän kuin malli. Kahdenkymmenen euron USB-mikrofoni tekee enemmän litteraatillesi kuin hyppy pienestä mallista suurimpaan. Useimmat huonot litteraatit, joita olen nähnyt, eivät olleet mallin vika. Ne johtuivat kannettavan mikrofonista, joka poimi ilmastointilaitteen äänen, neljästä henkilöstä yhden kaiuttimen ympärillä tai Bluetooth-kuulokkeesta, joka leikkasi jokaisen lauseen ensimmäisen sanan. Korjaa ääni ensin. Tekoäly ei pysty poistamaan kuultua kattilaa.
Kaksi muuta asiaa vaikuttaa tarkkuuteen konepellin alla. Yksi on se, miten työkalu päättää, missä kohtaa yksi henkilö loppuu ja toinen alkaa – mikä vaikeutuu ihmisten puhuessa päällekkäin. Toinen on mukautettu sanasto: kyky syöttää sille tuotenimiä, sukunimiä ja lyhenteitä, joita mikään yleinen malli ei ole koskaan nähnyt. Whisper antaa sinun asettaa mukautetun sanaston ja painottaa hotwordeja paikallisessa Whisper-moottorissaan, ja monet kokousbotit tekevät samoin. Jos puhelusi ovat täynnä ammattislangia, tuo yksi asetus on arvokkaampi kuin mallin päivittäminen.
Botton ja offline: litteroi jo olemassa oleva äänitteesi
Tässä on polku, josta hakutermi pysyy hiljaa – ja se, johon sovelluksemme on rakennettu. Et aina tarvitse ohjelmistoa liittymään kokoukseen. Joskus äänite on jo olemassa – äänimuistio kahdenkeskisestä palaverista, haastattelu, webinaarin tallennus, kollegan lähettämä klippi – ja tarvitset vain puhtaan tekstin siitä, omalla koneellasi, ilman bottia kenenkään puhelussa.
Diktointi- ja litterointiohjelmisto kuten Whisper sopii tähän ja ansaitsee paikkansa yksityisyydellä. Kaikki paikallisessa tilassa tapahtuu kannettavallasi. Ääni ei koskaan poistu laitteelta: ei palvelinta välissä, ei toimittajan lokeja, ei pilven kustannusmittaria. Pomosi palkkakeskustelu, lakiäänite, HR-keskustelu: mitään niistä ei pitäisi päätyä kolmannen osapuolen tallennukseen siksi, että tarvitsit litteraatin. Paikallinen ensin ei ole tässä ominaisuus. Se on koko tarkoitus.
Whisper käyttää kahta paikallista moottoria, molemmat puhtaassa Rust-kielessä transcribe-rs:n kautta ilman Python-sivukaria hidastamassa käynnistystä. Ensimmäinen on OpenAI:n avoimen lähdekoodin Whisper, joka monikielisillä rakennelmillaan kattaa 99 kieltä ja voi kääntää englanniksi. Mallien koot vaihtelevat Base-mallista noin 140 megatavua Large v3:een noin 3 gigatavua. Vain englanninkieliset versiot ovat juuri sitä – vain englanniksi – ja ne toimivat hieman kevyemmin. Toinen moottori on NVIDIA:n Parakeet TDT, noin 600 MB, ja sovelluksessa kuvataan sen olevan 5–10 kertaa nopeampi kuin Whisper prosessorilla. Se kattaa englannin lisäksi 24 eurooppalaista kieltä (25 yhteensä) ilman englanninkäännöstä. Valitse Parakeet nopeuden vuoksi, jos työskentelet pääasiassa englanniksi. Valitse Whisper, jos tarvitset käännöstä tai kielen, jota Parakeet ei tue.
Vuorovaikutus on sama, jota käytän koko päivän. Pidät pikanäppäintä – Ctrl+Space Windowsilla tai Command+Option push-to-talk -yhdistelmää Macilla, pidät molempia näppäimiä ja vapautat kumman tahansa lopettaaksesi – puhut, ja teksti ilmestyy kursorin kohtaan missä tahansa aktiivisessa sovelluksessa. Pieni peite näyttää tilan sen toimiessa. Äänitettä varten – ei live-puhetta – osoitat sovelluksen tiedostoon ja saat litteraatin takaisin. Jos haluat erityisesti diktoinnin puolen, offline-puheentunnistusoppaassamme käydään syvällisemmin läpi kaiken laitteella ajaminen.
Cloud-vaihtoehto on myös olemassa ihmisille, jotka haluavat uusimmat OpenAI-mallit ja ääniohjatun webhaun samassa työkalussa. Tuo oma OpenAI-avaimesi, sano "Hey whisper" ohjataksesi tekstin tekoälyn läpi. Mutta jo olemassa olevan äänitteen litterointiin paikallinen tila on vastaus, ja se on ilmainen kaikille kirjautuneille käyttäjille.
Muut huomionarvoiset työkalut
Tämä kategoria on täynnä työkaluja, ja hakutulokset ovat täynnä listoja, joissa jokainen rankkaa kuudesta kymmeneen vaihtoehtoa. Tässä on selkeä kartta, jotta sinun ei tarvitse lukea kymmentä arvostelua selvittääksesi, mihin kukin sopii. Kaikki alla oleva tieto on peräisin kunkin työkalun omilta sivuilta.
- Otter.ai — oletusarvoinen kokousmuistiinpanosovellus. Botti liittyy Zoomiin, Teamsiin ja Meetiin; ilmainen Basic-taso 300 kuukausittaisella minuutilla sekä maksulliset Pro- ja Business-tasot sen yläpuolella. Litterointi kuudessa kielessä: englanti, espanja, ranska, saksa, japani, kiina.
- Fireflies.ai — botti liittyy kutsulla tai kalenterin automaattisella synkronoinnilla. Ilmaistaso rajoittamattomalla litteroinnilla ja rajallisilla tekoälyyhteenvedoilla; mainostaa yli 100 kieltä eri tasoilla.
- tl;dv — äänittää Meetin, Zoomin ja Teamsin, markkinoi botitonta tilaa, litteroi yli 30 kielellä, ilmainen forever-suunnitelma ilman aikarajaa tai korttia.
- Fathom — ilmainen forever-suunnitelma rajoittamattomilla äänitteillä sekä valinta botittoman (beta) tai botti-tallennuksen välillä; maksulliset Premium-, Team- ja Business-tasot sen yläpuolella.
- Notta — kokousbotti Zoomille, Teamsille ja Meetille sekä ilmaistaso; oman ohjesivuston mukaan noin 58 kieltä.
- Zoom ja Teams sisäänrakennettuna — ennen kuin ostat mitään, tarkista mitä jo maksat. Zoom litteroi pilviäänitykset ja tarjoaa AI Companion -reaaliaikaisen litteroinnin 46 kielellä kelvollisilla maksullisilla suunnitelmilla. Microsoft Teamsissa on sisäänrakennettu live-litterointi noin 50 puhutulle kielelle; live-käännetty litterointi vaatii Teams Premiumin.
Tässä on sama kartta taulukkona, vain osat, jotka voit itse tarkistaa kunkin työkalun omilta sivuilta. Ei tarkkuus- tai nopeuslukuja, koska kukaan ei ole vertaillut niitä samalla äänellä, enkä aio keksiä testiä.
| Työkalu | Tallennus | Paikallinen/Pilvi | Toimii offline | Hinnoittelumalli | Kielet | Paras käyttöön |
|---|---|---|---|---|---|---|
| Otter.ai | Botti liittyy puheluun | Pilvi | Ei | Ilmaistaso + käyttäjäkohtainen maksu | 6 | Oletusarvoinen tiimin notetaker |
| Fireflies.ai | Botti kutsulla tai automaattisesti | Pilvi | Ei | Ilmaistaso + käyttäjäkohtainen maksu | 100+ | Runsas ilmainen litterointi |
| tl;dv | Äänittää puhelun, botton tila | Pilvi | Ei | Ilmainen forever + maksullinen | 30+ | Ei bottia kokouksen ruudukossa |
| Fathom | Botton (beta) tai botti | Pilvi | Ei | Ilmainen forever + maksullinen | Ei mainittu hinnoittelusivulla | Rajoittamattomat ilmaiset äänitteet |
| Notta | Botti liittyy puheluun | Pilvi | Ei | Ilmaistaso + maksullinen | ~58 (ohjesivuston mukaan) | Botti ja ilmaistaso yhdessä |
| Zoom / Teams (sisäänrakennettu) | Natiivi puhelussa | Pilvi | Ei | Sisältyy kelvollisiin maksullisiin suunnitelmiin | Zoom 46, Teams 50+ | Se mitä jo maksat |
| Whisper by Remskill | Ei puhelua; litteroi tiedoston tai diktoinnin | Paikallinen (pilvi valinnaisena) | Kyllä | Ilmainen paikallinen taso + Pro | 99 monikielinen, 25 Parakeet | Yksityinen, botton, laitteella |
Jos kokouksesi pyörivät jo maksullisella Zoom- tai Teams-suunnitelmalla, sisäänrakennettu litterointi voi riittää sinulle – ilman ylimääräistä tilausta tai bottia puhelussa.
Mitä valitsisin kuhunkin tilanteeseen
Luen tukisähköpostimme, joten näen väärän työkalun katumuksen tarpeeksi usein muodostaakseni mielipiteitä. Näin valitsisin.
- Haluat muistiinpanot tiimin videopuhelusta automaattisesti, jaettuna kaikille. Käytä botti-notetakeria. Otter on kiillotettu oletusvalinta, Fireflies tai Fathom jos haluat runsaan ilmaistason, tl;dv jos botton ruudukossa on tärkeää.
- Olet jo maksullisella Zoom- tai Teams-suunnitelmalla. Kokeile sisäänrakennettua litterointia ennen kuin maksat kolmannesta työkalusta.
- Sinulla on äänite ja haluat puhdasta tekstiä yksityisesti, omalla koneellasi. Tämä on botton, offline-polku: Whisper tai muu paikallinen litterointityökalu. Ääni pysyy laitteella.
- Haluat kirjoittaa äänellä (sähköpostit, dokumentit, muistiinpanot puhelun aikana tai sen jälkeen) kursorilla, missä tahansa sovelluksessa. Se on diktointi, ja se on se tehtävä, johon Whisper on rakennettu. Vertailumme transkriptio-ohjelmistoista käy tarkemmin läpi diktoinnin ja kokousmuistiinpanojen eron.
- Tarvitset taatun lähes täydellisen litteraatin oikeudelliseen tai compliance-rekisteriin. Käytä ihmisen tarkistamaa palvelua. Tekoäly yksin jää alle 99 prosentin oikealla äänellä.
Vältettävä virhe on maksaa kokousbotista diktoinnin tekemiseksi tai odottaa diktoinnityökalun liittyvän puheluihisi. Eri kategoriat. Valitse se, joka vastaa tehtävää. Olen rakentanut ohjelmistoja viisitoista vuotta ja silti ostin väärän työkalun tehtävään viime vuonna – tämä ei siis ole luento joltain, joka onnistui ensi yrittämällä.
Hinnat suorina lukuina
Useimmilla tämän kategorian työkaluilla on ilmaistaso, jota kannattaa kokeilla ennen kuin kortti tulee esiin. Otter, Fireflies, tl;dv ja Fathom kaikilla on ilmaissuunnitelma, ja maksulliset tasot kun tarvitset enemmän minuutteja, istumapaikkoja tai rajoittamatonta tallennustilaa. Botti-notetakerit laskuttavat yleensä käyttäjäkohtaisesti kuukaudessa, mikä kasvaa nopeasti tiimissä.
Whisper on ilmainen kaikille kirjautuneille käyttäjille koko paikallisessa putkistossa – molemmat moottorit, tekoälyparannus Ollamalla, historia, esiasennukset, mukautettu sanasto, pikanäppäin, kaikki – ilman maksuvälinettä kirjautumisessa. Maksullinen taso lisää pilven niille, jotka haluavat OpenAI:n mallit ja äänihaun verkosta. Tarkat kuukausittaiset, vuosittaiset, elinikäiset ja tiimipaikkahinnat löydät hinnoittelusivulta. Aloita mieluummin ilmaisena ja päätä itse kuin ota hinta irrallaan kontekstista.
Valitse ensin työkalun tyyppi, sitten brändi. Jos botin pitäisi liittyä puheluusi, käytä notetakeria. Jos kannettavalla olevasta äänitteestä pitäisi tulla yksityistä tekstiä, käytä jotain offline-sovellusta. Se viiden numeron lasku, jonka katsoin tiimin keräävän, syntyi siitä, ettei koskaan kysytty, mitä tehtävää varten maksetaan – ja se on kokous, jolle kukaan ei olisi tarvinnut litteraattia.
Kokeile botitonta polkua jo olemassa olevalla äänitteelläsi
Lataa Whisper, osoita se äänitteeseen ja katso, kun puhdas teksti palaa takaisin – omalla koneellasi, ilman bottia kenenkään puhelussa.
Ilmainen kaikille kirjautuneille käyttäjille koko paikallisessa putkistossa. Ei maksuvälinettä kirjautumisessa.



