Selitys
Yksityinen puhe tekstiksi, laitteella
Yksityinen puhe tekstiksi tarkoittaa, että äänesi litteroidaan omalla laitteellasi eikä mitään lähetetä palvelimelle. Paikallinen Whisper ja Parakeet toimivat täysin offline-tilassa. Pilvilitterointi taas lähettää äänesi verkon yli muualle käsiteltäväksi.
Päivitetty viimeksi: kesäkuu 2026

Yksityinen puhe tekstiksi on litterointia, joka tapahtuu käyttäjän omalla laitteella, jolloin tallennettu ääni ei koskaan poistu koneelta. Paikalliset moottorit kuten Whisper ja Parakeet toimivat täysin offline-tilassa ilman palvelinyhteyttä. Pilvisanaelämispalvelut lataavat äänen etälitterointia varten. Jos yksityisyys on tärkeintä, valitse paikallinen, offline-työkalu.
Jokainen sanaelämistyökalu väittää olevansa yksityinen. Useimmat eivät ole. Sanaa venytetään tarkoittamaan "salaamme lähetyksen" tai "poistamme sen 30 päivän kuluttua" – mikä silti tarkoittaa, että äänesi lähti koneeltasi, istui jonkun palvelimella ja litteroitiin tietokoneella, jota et omista. Se on tietosuojakäytäntö, ei yksityisyys. Sanalla on tarkka, kapea merkitys, ja se kannattaa ymmärtää ennen kuin uskot työkalulle viestin asianajajallesi.
Rehellinen määritelmä on yksinkertainen: yksityinen puhe tekstiksi tarkoittaa, että ääni muunnetaan sanoiksi laitteellasi eikä mitään lähetetä minnekään. Ei latausta, ei palvelinta, ei internetiä tarvita. Tämä versio on olemassa, se on maksuton paikalliselle putkilinjalle ja se toimii kannettavallasi. Varjopuoli – ja kerron sen suoraan – on, että heti kun valitset pilvimuodon parempaa tarkkuutta varten, lupaus muuttuu. Vedän tämän rajan selvästi.
Tässä on asia, joka hukkuu markkinointiviestein alle. "Yksityinen" ei ole tunne vaan kysymys, jolla on yksi vastaus: lähteekö ääni laitteelta vai ei. Jos lähtee, joku muu voi periaatteessa kuulla sen. Jos ei lähde, ei voi. Kaikki muu – salaus, säilytysajat, vaatimustenmukaisuusmerkit – on vahingonhallintaa sille tapaukselle, että se lähtee.
Oikea kysymys ei siis ole "onko tämä työkalu yksityinen". Se on "litteroiko se ääneni koneellani vai heidän koneellaan". Paikallinen Whisper ja Parakeet tekevät sen sinun koneellasi, offline-tilassa, malli ladattuna omaan RAM-muistiisi. Pilvilitterointi tekee sen heidän koneellaan. Tässä oppaassa selitän, mitä tämä ero käytännössä tarkoittaa, miten paikallinen versio otetaan käyttöön kahdessa minuutissa ja mikä on se yksi rehellinen poikkeus, jossa äänen lähettäminen pilveen on järkevä vaihtokauppa.
Mitä "yksityinen" tarkoittaa puheesta tekstiksi -muunnoksessa

Yksityinen puhe tekstiksi tarkoittaa yhtä tiettyä asiaa: tallennettu ääni muunnetaan tekstiksi omalla laitteellasi eikä ääni koskaan poistu sieltä. Ei latausta palvelimelle, ei edestakaista matkaa internetissä, ei kolmatta osapuolta mukana. Litterointi tapahtuu omassa muistissasi ja prosessorissasi – samoin kuin oikeinkirjoituksen tarkistus tapahtuu – jonka jälkeen ääni on poissa. Siinä on koko määritelmä, ja useimmat "yksityinen"-sanaa käyttävät työkalut eivät täytä sitä.
Se, mitä yleensä myydään "yksityisenä", on pilvipalvelun versio paremmalla lukolla ovessa. Ääni kulkee silti toimittajan palvelimille litteroitavaksi – toimittaja vain lupaa salata sen siirron aikana ja poistaa sen jonkin aikataulun mukaan. Se on aidosti parempi kuin ei mitään, ja monille se on riittävää. Mutta se ei ole sama asia kuin äänin koskaan poistuminen. Lupaus poistamisesta on lupaus. Laitteella käsittely on tosiasia – mitään ei tarvitse poistaa, koska mitään ei lähetetty. Kun yksityisyydellä on todella väliä – palkan luku, lääketieteellinen muistiinpano, luonnos jota et haluaisi indeksoitavan – ero lupauksen ja tosiasian välillä on kaikki kaikessa.
Syy siihen, miksi laitteen päällä tapahtuva litterointi on nyt ylipäätään mahdollista, on se, että mallit pienenivät ja kannettavat nopeutuivat. Muutama vuosi sitten tarvittiin konesali hyvään puheentunnistukseen, minkä vuoksi kaikki siirtyi pilveen. Nykyään avoin Whisper-malli toimii paikallisesti keskiluokan kannettavalla ja Parakeet toimii sitäkin nopeammin. Pilvi oli kiertotie laitteiston ympäri, joka ei enää pidä sinua takana. Yksityinen puhe tekstiksi ei ole lisämaksullinen premium-ominaisuus – se on oletusarvo, josta tuli käytännöllinen, ja tämän oppaan loppuosa käsittelee sen käyttöä.
Miksi useimmat pilvisanaelämispalvelut eivät ole yksityisiä
Kun painat näppäintä pilvisanaelämistyökalussa, tässä tapahtuu pinnan alla: mikrofonisi tallentaa muutaman sekunnin ääntä, kyseinen äänitiedosto lähetetään internetin kautta palvelimelle, palvelimen malli litteroi sen ja teksti palaa näyttöllesi. Koko prosessi voi viedä tuskin sekunnin, minkä vuoksi se tuntuu näkymättömältä. Mutta äänesi – varsinainen tallenne, ei pelkästään sanat – teki matkan koneelle, jota et hallitse, ja takaisin.
Windowsin äänentunnistus on selkein esimerkki, koska useimmilla on se jo valmiina. Paina Windows-näppäin + H ja pieni palkki avautuu, joka kirjoittaa puheesi mihin tahansa aktiiviseen kenttään. Se toimii hyvin. Se on myös pilvipalvelu – Microsoftin online-puheentunnistus – minkä vuoksi se tarvitsee internet-yhteyden ja lakkaa toimimasta lentokoneessa. Äänesi menee Microsoftin palvelimille tekstiksi muunnettavaksi. Sama koskee useimpia nykyään julkaistuja "tekoälysanaelämis"-sovelluksia: älykäs osa toimii jonkun muun laitteistolla, ja hiljainen kuukausierä on sen vuokra. Paikallinen työkalu näyttää pienen kapselipainikkeen kuunnellessaan, eikä tallentamansa ääni koskaan poistu kannettavalta:
En väitä, että pilvilitterointi on pahan – puolustan sitä myöhemmin tapauksissa, joissa se ansaitsee paikkansa. Väitän, että markkinoinnissa käytetty sana "yksityinen" kuvaa yleensä lukko lähetyksessä, ei lähetyksen puuttumista. Pelkästään pilveen perustuva sanaeläminen on yksityisyyskatastrofi odottamassa litteroitumistaan, ja ensimmäisenä sen tuntevat ne, jotka eivät näe laskua. Olin kerran todistamassa, kun tiimi keräsi viisinkertaisen pilvitekoälylaskun yhden neljänneksen aikana – pääosin "älykäs uudelleenyritys" -virheestä, joka lähetti samat stand-up-tallenteet neljä kertaa uudelleen. Talousjohtaja avasi kojelaudan neljännesvuosikatsauksessa ja huone hiljeni täysin. Kukaan ei ollut päättänyt lähettää kaikkea ääntä palvelimelle. Työkalu vain teki niin, joka kerta, koska se oli sen toimintatapa.
Miten paikallinen puhe tekstiksi pysyy yksityisenä
Yksityinen versio toimii kokonaan omalla koneellasi. Painat pikanäppäintä, puhut, vapautat ja omaan RAM-muistiisi jo ladattu malli muuntaa äänen tekstiksi ja liittää sen kursorisi kohdalle – ei internetiä, ei palvelinta, ei lähetyksiä. Tarvitset Mac-tietokoneen Apple Siliconilla tai Windows 10:n tai uudemman, toimivan mikrofonin ja parin minuutin ajan. Koko paikallinen putkilinja on maksuton kaikille kirjautuneille käyttäjille ilman maksutapaa rekisteröitymisessä. Tässä on järjestys.
Vaihe 1 – Asenna Whisper ja kirjaudu sisään.
Lataa lataussivulta, asenna ja luo ilmainen tili. Ei korttia. Koko paikallinen litterointiputkilinja avautuu heti, offline-tilassa.
Tiedät sen toimineen, kun sovelluksen kelkkakuvake ilmestyy ja asennusvelho tarjoaa mallin valintaa.
Vaihe 2 – Valitse paikallinen litterointipolku.
Sovellus ei valitse puolestasi. Yksityistä, offline-sanaelämistä varten valitse Local Parakeet tai Local Whisper – molemmat toimivat koneellasi. Kolmas vaihtoehto, Cloud, lataa äänen, joten jätä se pois jos yksityisyys on tavoite.
Tiedät sen toimineen, kun paikallinen malli latautuu ja näkyy valmiina.
Vaihe 3 – Vahvista pikanäppäimesi.
Windowsilla oletusasetus on Ctrl+Space, Macilla Command+Option pidettynä push-to-talk-tilana. Macilla myönnä esteettömyyslupa pyydettäessä; ilman sitä teksti ei voi siirtyä muihin sovelluksiin.
Tiedät sen toimineen, kun testiäänitys liitetään mihin tahansa tekstikenttään.
Vaihe 4 – Irrota verkkokaapeli ja puhu silti.
Tämä on yksityisyystesti. Sammuta Wi-Fi, aseta kursori mihin tahansa tekstikenttään, pidä pikanäppäintä painettuna, sano lause, vapauta. Tekstitys ilmestyy silti, koska malli toimi paikallisesti.
Tiedät sen toimineen, kun sanaeläminen toimii internetin ollessa kokonaan poissa käytöstä.
Hidas osa on kertamallin lataus, joka tietenkin tarvitsee internetiä. Sen jälkeen ääni ei mene enää verkkoon paikallisessa tilassa. Kaapelin irrotustesti vaiheessa neljä ei ole temppu – se on ainoa todiste, jolla on merkitystä. Jos sanaeläminen jatkuu verkon ollessa poissa, ääni litteroidaan laitteellasi, piste. Jos se lakkaa, se meni jonnekin. Tuo yksi testi leikkaa läpi jokaisen "yksityinen"-väittämän jokaisella markkinointisivulla.
Myös tekoälypuhdistus voi pysyä koneellasi
Tässä on osa, josta useimmat ihmiset eivät tajua kysyä. Raakalitterointi tulee ulos yhtenä pitkänä lausumana – ei välimerkkejä, satunnainen "öö", harhailevat lauseet. Ratkaisu on tekoälykierros, joka siistii tekstin sellaiseen muotoon, jota oikeasti käyttäisit. Ja juuri tässä monet "yksityiset" paikalliset työkalut hiljaa soittavat kotiin: ne litteroivat laitteella, mutta lähettävät sitten sotkuisen tekstin pilvimallille siistittäväksi. Ääni pysyi yksityisenä; sanat eivät.
Whisper hoitaa siistimisen myös paikallisesti Ollaman kautta – maksuton paikallinen mallinkäyttäjä, joka sijaitsee koneellasi localhostissa eikä koskaan koske internetiä. Sano aktivointilause "Hey whisper" ja teksti parannetaan ennen kuin se laskeutuu kursorisi kohdalle, koko edestakainen matka tapahtuu kannettavasi sisällä. Ketju pysyy siis katkeamattomana: äänestäsi tulee tekstiä laitteellasi ja teksti siistetään laitteellasi. Mikään lauseen osaan – ei ääni, ei luonnos, ei siistiytty versio – ei koskaan poistu.
Tämä on yksityiseksi kutsuvan työkalun kohdalla yksityiskohta, jonka tarkistaisin. On helppo pitää litterointi paikallisena ja salakuljettaa parannusvaihe pilveen, koska parannusvaihe on se bitti, joka tarvitsee suuren mallin, ja suuret mallit ovat houkuttelevia vuokrata. Tylsä totuus on, että jokapäiväisessä sanaelämisessä paikallinen malli Ollaman kautta on enemmän kuin riittävä korjaamaan välimerkit ja poistamaan täytesanat. Tarvitset pilvimallia vain pyytäessäsi jotain aidosti vaikeampaa, ja sen on vaihtoehto, jonka sinun pitää tehdä tarkoituksella – ei yksi, jonka työkalu tekee puolestasi taustalla.
Paikallinen vai pilvi: kumpi tila yksityiseen työnkulkuun
Kaikkeen, mitä kutsut yksityiseksi, aloita paikallisesta. Jos Macisi on Apple Silicon tai tietokoneesi on viime vuosilta, paikalliset moottorit käsittelevät jokapäiväisen sanaelämisen moitteettomasti ja pilvistä tulee hätäuloskäynti eikä oletusarvo. Sovellus saa sinut valitsemaan polun tarkoituksella – se ei työnnä oletusarvoa – joten tässä on miten kolme eroavat, yksityisyys selvästi näkyvissä:
Valinta riippuu siitä, missä ääni käsitellään ja mitä tarvitset litteroinnilta.
- Local Parakeet — NVIDIAn TDT-moottori, noin 600 Mt, ja nopein paikallinen vaihtoehto – 5–10 kertaa nopeampi kuin Whisper prosessorilla. Kattaa englannin lisäksi 24 muuta eurooppalaista kieltä, yhteensä 25. Ei käännöstä englanniksi. Täysin laitteella, ei lähetyksiä. Nopea yksityinen valinta, jos puhut englantia tai muuta eurooppalaista kieltä.
- Local Whisper — hitaampi kuin Parakeet samalla koneella, mutta monikielinen versio kattaa 99 kieltä ja voi kääntää englanniksi. Pelkkä englanti -versiot ovat vain englanniksi, ei 99 kieltä. Myös täysin laitteella. Valitse tämä kiinaksi, japaniksi, koreaksi tai käännöstöihin, joita Parakeet ei osaa. Englannin oletusmalli on noin 480 Mt.
- Cloud (OpenAI, BYOK) — paras tarkkuus ja verkkoyhteys, käyttäen omaa OpenAI-avaintasi suoraan OpenAI:lta laskutettuna. Litterointi käyttää oletuksena gpt-4o-mini-transcribe-mallia. Tämä on ainoa polku, joka lataa äänesi – se poistuu koneeltasi OpenAI:lle. Se on vapaaehtoinen, osa Whisper Prota, ja pois käytöstä kunnes kytket sen päälle.
Raja on selkeä: kaksi paikallista polkua ovat yksityisiä rakenteeltaan – ääni litteroidaan laitteellasi eikä mitään vuoda. Pilvitie ei ole, emmekä teeskentele muuta. Se lähettää äänesi OpenAI:lle omalla avaimellasi, koska se on ainoa tapa saada OpenAI:n tarkkuus ja live-verkkoyhteys. Jos Macisi on M-sarjaa tai tietokoneesi on tuore, aloita paikallisella tilalla ja turvaudu pilveen vain silloin kun paikallinen aidosti jättää sinut haluamaan lisää. Pilvi on poikkeus jonka valitset, ei oletusarvo jonka perit.
Mitä oikeasti poistuu koneeltasi kussakin tilassa
Ollaan konkreettisia datan suhteen, koska "yksityinen" on merkityksetön ilman sen nimeämistä, mitä liikkuu. Paikallisessa tilassa vastaus on: ei mitään – ei ääntä, ei tekstitystä, ei siistiyttyä versiota. Tallenne käsitellään RAM-muistissasi, siistiminen kulkee Ollaman kautta koneellasi ja ainoa asia, joka liikkui, olivat sanat mallista tekstikenttääsi. Voit varmistaa sen verkon ollessa irrotettuna.
Kun tekoälypuhdistus käynnistyy, overlay näyttää parannustilan kun paikallinen malli korjaa lausuman joksikin luettavaksi. Tässä on esimerki muunnoksesta – raaka litterointi ylhäällä, siistiytynyt teksti alla – kaikki tapahtuu laitteellasi paikallisessa tilassa:
okay so send the q3 numbers to marcus before the board call and flag the margin dip um but dont cc the whole finance list
Okay, so send the Q3 numbers to Marcus before the board call and flag the margin dip — but don't cc the whole finance list.
Pilvitilassa rehellinen kirjanpito on erilainen ja sinun pitää tietää se ennen kuin käännät kytkintä. Äänesi ladataan OpenAI:n litterointipalveluun omalla API-avaimellasi, jotta se muunnetaan siellä tekstiksi. Jos käytät myös Cloud AI -parannusta, tekstitys menee GPT-mallille; jos käytät verkkohakua, myös kysely lähtee ulos. Mikään siitä ei kulje Remskill-palveluiden kautta – se on suora linja koneeltasi OpenAI:lle avaimellasi – mutta se poistuu koneeltasi, mikä on ainoa asia, joka määrittää onko jokin yksityistä. Lause Q3-luvuista ja Marcusista on juuri sellainen, jonka pitäisin paikallisena. Reseptin, jota sanaelen huvin vuoksi, en todellakaan välitä.
Sama puhu-ja-puhdista-virta toimii jokaisessa sovelluksessa, joten kun se on asetettu voit kirjoittaa nopeammin äänelläsi editorissasi, sähköpostissasi ja terminaalissasi – yksityisesti, kun mikään ei poistu kannettavalta paikallisessa tilassa.
Milloin äänen lähettäminen pilveen on reilu vaihtokauppa

Valehtelen, jos sanon, että paikallinen on aina vastaus. Joskus pilvi on oikea valinta, ja sen kieltäminen yksityisyyskulman vuoksi olisi sama markkinointiselvenpeys, josta olen kuluttanut kuusi lukua valittamiseen. Vaihtokauppa on todellinen: luovut ei-koskaan-poistu-koneeltasi-takuusta ja saat parhaan saatavilla olevan litterointitarkkuuden sekä live-verkkoyhteyden samassa pikanäppäimessä.
Turvaudu pilvitilaan, kun sisältö ei ole arkaluonteista mutta tarkkuus on. Podcast-litterointi, julkinen blogiluonnos, ostoslista, vaikea tallenne paksulla aksentilla tai meluisassa huoneessa missä paikallinen malli käy – mitään niistä ei tarvitse pitää koneellasi, ja OpenAI:n mallit saavat sen puhtaammaksi. Käytät omaa API-avaintasi, joten ääni menee OpenAI:lle suoraan ja minuuttiperusteinen kustannus tulee sinulle, ei välimiehen lisäpalkkion kautta. Ei-arkaluonteisessa työssä, jossa laatu on se mistä maksat, se on järkevä vaihtokauppa. Virhe ei ole pilven käyttäminen – se on pilven käyttäminen oletuksena kaikessa, mukaan lukien ne asiat, joita et koskaan haluaisi palvelimelle.
Aidosti lyhyessä sisällössä ohita erillinen työkalu kokonaan. Jos sanaat 30-sanaisen tekstiviestin, Windows-näppäin + H tai macOS Dictation on ilmainen ja jo asennettuna – joskin huomaa, että Windows Voice Typing on itse pilvipalvelu, joten se ei ole yksityinen vaihtoehto, pelkästään kätevä. Apple Siliconilla macOS Dictation voi käsitellä yleistä tekstiä laitteella, mikä tekee siitä ainoan sisäänrakennetun, joka on aidosti yksityinen lyhyille pätkille. Alle 200 sanan rajan alle en sano, että sinun pitäisi asentaa mitään. Erillinen työkalu ansaitsee paikkansa, kun muistiinpanot pitenevät, kun haluat offline-yksityisyyttä Windowsilla tai kun haluat yhden pikanäppäimen, joka käyttäytyy samalla tavalla kaikkialla.
Jos valitset työkalua pääasiassa yksityisyystakuun vuoksi, tämän argumentin syvempi versio on oppaassa offline-puhe tekstiksi joka käy läpi kaiken verkon ollessa irrotettuna.
"Yksityinen" on eniten ylikäytetty sana tässä kategoriassa ja helpoin testata: irrota verkko ja katso toimiiko se silti. Paikallinen Whisper ja Parakeet läpäisevät testin koska ääni ei koskaan poistu koneeltasi, ja tekoälypuhdistus läpäisee sen myös koska Ollama toimii aivan niiden vierellä. Pilvitila kaatuu siihen tarkoituksella, koska se vuokraa OpenAI:n tarkkuutta, ja se on reilu vaihtokauppa oikeaan tehtävään. Sanelin suurimman osan tästä oppaasta Wi-Fi pois päältä, mikä on joko vahva tuotedemo tai merkki siitä, että minun pitäisi päästä ulos enemmän. Molemmat voivat olla totta.
Sanaele yksityisesti, alkaen nyt
Valitse paikallinen malli, irrota verkko ja puhu. Tekstitys laskeutuu kursorisi kohdalle – eikä äänesi koskaan poistunut kannettavalta.
Ilmainen paikallinen tila kaikille kirjautuneille käyttäjille. Ei korttia aloittamiseen.



