Kirjoittaja: Denys Medvediev

Opas

Saneluohjelmat: ilmaiset sisäänrakennetut vaihtoehdot vastaan maksulliset työkalut

Osa parhaista saneluohjelmista on jo koneessasi. Tässä kerrotaan, mitä kannattaa käyttää ja milloin maksullisen sovelluksen ostaminen oikeasti kannattaa.

Päivitetty viimeksi: kesäkuu 2026

Tyylikäs kannettava ja lasi vettä valoisalla toimistopöydällä, valmiina kädet vapaana tapahtuvaan saneluun

Saneluohjelma kuuntelee mikrofonin kautta ja kirjoittaa ylös sen, mitä sanot, muuttaen puheen muokattavaksi tekstiksi noin 145 sanan minuuttivauhtia vastaan kirjoittamisen noin 40. Hyvät työkalut toimivat koko järjestelmässä, joten sanat ilmestyvät kohdistimen kohdalle. Osa on ilmaisia ja sisäänrakennettuja Windowsiin ja Maciin; maksulliset sovellukset lisäävät offline-tilan ja tekoälyn siistimisen.

Puhu, ja sanat ilmestyvät kohdistimesi kohdalle

Ensimmäisellä kerralla se tuntuu pieneltä taikatempulta. Painat näppäintä, sanot lauseen, päästät irti, ja lause on siellä sähköpostissasi. Ei näppäimistöä. Nuorempi sukulaiseni saneli kerran 90 sanan viestin isoäidilleen ennen kuin olin ehtinyt selittää, mitä sanelu oikeastaan on. Vaikeaa ei koskaan ollut puhuminen. Kahden vuosikymmenen ajan vaikeaa oli se, että ohjelman piti olla tarpeeksi hyvä luottaa siihen, ja juuri se osa lopulta ratkesi.

Tämä artikkeli kertoo, mitkä saneluohjelmat ovat aikasi arvoisia, mukaan lukien ilmaiset vaihtoehdot, jotka jo omistat.

Pasted
Whisperin ikkuna viimeistelee sanelua — teksti liimautuu kohdistimesi kohdalle.

Useimmat näppäimistöön jumittuneet ihmiset tekevät niin tottumuksesta, eivät tarpeesta. Kirjoittaminen on opittu kompromissi, tapa saada ajatukset ulos päästä koneeseen, jolla ei ole korvia. Saneluohjelma poistaa kompromissin. Kysymys ei ole vuoden 2022 tienoilta lähtien enää ollut se, toimiiko se, vaan se, mikä niistä ja pitääkö siitä maksaa.

Rehellinen vastaus riippuu kolmesta asiasta: kuinka pitkään sanelet, haluatko sen toimivan jokaisessa sovelluksessa, ja välitätkö siitä, että sanasi eivät koskaan poistu kannettavastasi. Tämän loppuun mennessä tiedät, mikä polku sopii sinulle, ja kerron, milloin ilmainen sisäänrakennettu vaihtoehto on kaikki mitä tarvitset. Luen suurimman osan tämän sovelluksen asiakaspostista, ja tasaisesti osa siitä tulee ihmisiltä, jotka maksoivat työkalusta silloin, kun jo koneessa ollut olisi hoitanut hommat. Minulla on siis pieni intressi puhua sinut pois ostoksesta.

Mitä saneluohjelma on

Lähikuva digitaalisesta ääniliittymästä, jossa näkyy elävä ääniaalto, kuvaten puhetta dataksi tallennettuna

Saneluohjelma on ohjelma, joka tallentaa äänen mikrofonistasi ja muuntaa sen kirjoitetuksi tekstiksi puheentunnistusmallin avulla. Vanhempi nimi on sanelusovellus. Uudempi markkinointinimi on tekoälysanelu, joka tarkoittaa enimmäkseen samaa asiaa, mutta päälle on liitetty kielimalli korjaamaan välimerkkejä ja sävyä.

Sitä on kolmessa muodossa. Sisäänrakennettu sanelu tulee käyttöjärjestelmäsi mukana: Windowsin Voice typing, Apple Dictation. Selainpohjainen sanelu elää yhden sovelluksen sisällä, kuten Google Docsin Voice typing. Ja erilliset työpöytäsovellukset asentuvat erikseen ja toimivat kaikkialla, mihin kirjoitat. Muoto merkitsee enemmän kuin brändi. Selaintyökalu, joka kirjoittaa vain Google Docsin sisällä, on hyödytön Slack-viesteissäsi, oli sen tarkkuus kuinka hyvä tahansa. Ensimmäinen kysymys mistä tahansa työkalusta ei ole se, kuinka tarkka se on, vaan missä se sallii sinun kirjoittaa. Tarkkuus on nykyään ratkaistu ongelma useimmilla niistä; kattavuus ei ole.

Vakavasti otettavan työkalun lelusta erottaa se, mihin se liimaa. Sisäänrakennetut ja erilliset työpöytätyökalut toimivat koko järjestelmässä: paina pikanäppäintä missä tahansa tekstikentässä, ja teksti ilmestyy siihen. Siitä koko juju on kyse. Kaikki muu, tarkkuus, kielet, tekoälyn siistiminen, on hienosäätöä sen päällä, kirjoittaako se sinne, minne katsot.

Toinen asia erottaa kategoriat: mitä malli pystyy kuulemaan. Osa työkaluista käsittelee vain englantia. Toiset käsittelevät kymmeniä kieliä ja voivat vaihtaa kesken lauseen. Whisperin vain englantia tukevat mallit tukevat tasan yhtä kieltä, kun taas sen monikieliset versiot kattavat 99. NVIDIAn Parakeet asettuu keskelle 25 kielellä, englanti plus 24 eurooppalaista. Jos kirjoitat aina vain englanniksi, mikään tästä ei merkitse ja sinun kannattaa valita nopeuden perusteella. Jos luonnostelet kahdella kielellä ennen lounasta, sillä on suuri merkitys. Useimmat yliarvioivat, kuinka montaa kieltä he tarvitsevat, ja aliarvioivat, kuinka paljon he välittävät viiveestä. Viive sen välillä, että päästät irti näppäimestä ja näet tekstin, on se asia, jonka tunnet joka ikinen kerta.

Jos haluat mieluummin nähdä koko järjestelmässä toimivan version käytännössä kuin lukea kategoriasta, Whisperin saneluohjelmasivu näyttää pidä-pikanäppäintä-pohjassa -silmukan Windowsilla ja Macilla, ilmaiset paikalliset moottorit mukaan lukien.

Miten se toimii (ja miksi tarkkuus lopulta parani)

Konepellin alla putkessa on kolme vaihetta. Mikrofonisi tallentaa lyhyen äänileikkeen. Puheentunnistusmalli muuttaa äänen tekstiksi. Sitten teksti liimataan, joskus sen jälkeen kun kielimalli on siistinyt sen.

CancelTranscribing
Whisper kesken litteroinnin — puhemalli muuttaa äänen tekstiksi.

Tarkkuusloikka, jonka kaikki huomasivat, tuli keskellä olevasta mallista. OpenAI:n avoimen lähdekoodin Whisper-malli muutti sen, mitä hyvä tarkoitti. Se käsittelee aksentteja, taustamelua ja 99 kieltä monikielisissä versioissaan, ilman koulutusvaihetta. Se viimeinen osa on hiljainen vallankumous. Et opeta nykyaikaiselle saneluohjelmalle ääntäsi. Asennat sen ja puhut.

Olen tarpeeksi vanha muistamaan, kun se oli tieteiskirjallisuutta. 1990-luvun lopulla eräs sukulainen ajoi Dragon NaturallySpeakingia Windows 98 -pöytäkoneella, jossa oli 64 Mt muistia. Asennus tarkoitti sanalistan lukemista ääneen 45 minuuttia, jotta ohjelma saattoi kalibroitua äänesi mukaan. Sitten se toimi, hädin tuskin, ehkä 70 prosentin tarkkuudella ja neljän sekunnin viiveellä lausetta kohti. Yhden joulukirjeen kappaleen saneluun meni viisitoista minuuttia. Kuulokemikrofoni lensi huoneen poikki. Kuulokemikrofoni selvisi; koe ei. Kaksikymmentäviisi vuotta myöhemmin sama tehtävä vie yhdeksänkymmentä sekuntia eikä mitään koulutusta. Laitteisto saavutti idean.

Keskimmäisestä vaiheesta on nykyään kaksi makua. Paikallinen prosessointi ajaa mallin omalla tietokoneellasi, offline-tilassa, joten äänesi ei koskaan poistu koneelta, samaan tapaan kuin offline-puheentunnistus toimii. Pilviprosessointi lähettää äänen palvelimelle, mikä voi olla nopeampaa heikolla laitteistolla, mutta tarkoittaa, että sanasi matkustavat. Kumman haluat, riippuu siitä, mitä sanelet. Ostoslista, kenpä välittää. Asiakkaasi sopimus, ehkä välitä.

Kolmas vaihe, siistiminen, on se, missä tekoälysanelun tekoäly asuu. Raaka litterointi antaa sinulle seinällisen sanoja ilman kappalejakoja ja satunnaisia öö-täytesanoja. Kielimalli voi korjata välimerkit, pudottaa täytesanat ja jopa osua pyytämääsi sävyyn. Whisper by Remskillissä tuo vaihe on valinnainen ja toimii paikallisesti Ollaman kautta tai pilvessä omalla OpenAI-avaimellasi, jos otat Pron käyttöön. Voit myös laukaista sen äänellä: sano aktivointilause, tällä hetkellä Hey whisper, ja teksti annetaan mallille raa'an liimaamisen sijaan. Mikään tästä ei muuta ydintaikatemppua. Se vain päättää, kuinka viimeisteltyjä sanat ovat saapuessaan.

Ilmaiset vaihtoehdot, jotka sinulla jo on: Windows Voice typing, Apple Dictation, Google Docs

Ennen kuin maksat mistään, tarkista, mitä koneessasi jo on. Kolme ilmaista sisäänrakennettua vaihtoehtoa kattaa paljon.

Windows · Win + H

Listening…

macOS · Dictation

Docs · Voice typing

Click to speak
Sanelu, joka on jo koneessasi, kahdessa maussa — ei asennusta tarvita.

Windows Voice typing

Windows 11:ssä paina Windows-logonäppäintä ja H:ta missä tahansa tekstikentässä, ja näkyviin tulee sanelupalkki. Se on hyvä nopeisiin viesteihin. Mutta: se tarvitsee internet-yhteyden ja toimivan mikrofonin, koska tunnistus tapahtuu pilvessä. Se tukee 43 kieltä Microsoftin listan mukaan. Jos olet offline-tilassa junassa, se lakkaa toimimasta. Täydellinen läpikäynti löytyy oppaastamme puheesta tekstiksi Windowsissa.

Apple Dictation

Macissa ota se käyttöön kohdasta Järjestelmäasetukset, Näppäimistö, Sanelu, ja käynnistä se sitten mikrofoninäppäimellä tai valitsemallasi pikanäppäimellä. Nykyinen versio litteroi minkä tahansa pituista tekstiä ja pysähtyy vasta 30 sekunnin hiljaisuuden jälkeen, ei kovan aikarajan vuoksi. Apple Siliconilla se voi käsitellä puheesi laitteella. Lyhyisiin muistiinpanoihin se on ilmainen ja toimiva; pidempi asennus löytyy artikkelista puheesta tekstiksi Macilla.

Google Docs Voice typing

Avaa Google-asiakirja Chromessa, Edgessä tai Safarissa, napsauta Työkalut ja sitten Voice typing, ja näkyviin tulee mikrofonilaatikko. Se tukee yli 100 kieltä ja alueellista varianttia. Tiukka rajoitus on jo nimessä: se kirjoittaa vain Google Docsin ja Slidesin sisällä. Se ei kirjoita sähköpostiisi, Slackiisi tai koodiisi.

Rehellinen tapa lukea nämä kolme: ne ovat oikeita työkaluja, eivät demoja, ja suurelle osalle ihmisistä ne ovat etsinnän loppu. Se, mihin ne pysähtyvät, on ennustettavissa. Windows Voice typing kuolee sillä hetkellä, kun menetät signaalin. Google Docsin Voice typing ei koskaan poistu asiakirjasta. Apple Dictation on erinomainen Macilla ja poissa kaikkialta muualta. Jos työsi mahtuu noiden reunojen sisään, olet valmis. Sulje tämä välilehti ja paina näppäintä. Maksullinen kategoria on olemassa työlle, joka ei mahdu: koko päivän sanelu, offline-tilassa lentokoneessa, jokainen sovellus yhden sijaan, ja ääni, jonka on pysyttävä omalla levylläsi.

Milloin kannattaa ohittaa erillinen sovellus ja käyttää sisäänrakennettua

Tässä on se osa, jonka useimmat parhaat-ohjelmat-artikkelit ohittavat. Jos lähetät lyhyitä viestejä, 30 sanan tekstarin, nopean Slack-vastauksen, koneessasi jo oleva ilmainen sanelu on kaikki mitä tarvitset. Windows Voice typing (Windows-näppäin + H) ja Apple Dictation ovat ilmaisia, ne ovat sisäänrakennettuja, ja ne toimivat. Älä asenna tai maksa mistään yhden lauseen kirjoittamiseksi. Erillinen sovellus alkaa ansaita paikkansa, kun sanelet usein, tarvitset sen toimivan offline-tilassa lentokoneessa, haluat sen jokaiseen sovellukseen etkä vain yhteen, tai välität siitä, että sanasi pysyvät laitteellasi. Sen kynnyksen alapuolella ikävä totuus on, että omistat jo oikean työkalun.

Mitä Whisper by Remskill maksaa

Whisper by Remskill on ilmainen jokaiselle sisäänkirjautuneelle käyttäjälle koko paikallisen putken osalta: paikallinen Whisper, Parakeet, Ollama-pohjainen tekoälyn siistiminen, historia, mukautettu pikanäppäin, mallien lataukset, eikä rekisteröitymiseen tarvita maksutapaa. Whisper Pro lisää pilvipinnan: OpenAI-pilvilitteroinnin, pilvitekoälyparannukset ja äänellä tehtävän verkkohaun oman OpenAI-avaimesi kautta. Pilvitila laskuttaa sinua suoraan OpenAI:n kautta; me emme ota osuutta. Nykyiset paketit ja Pro-kokeilu löytyvät hinnoittelusivulta. En aio luetella numeroita sinulle tässä; sivu tekee sen paremmin kuin kappale voi.

Lisää luettavaa

Sukulaiseni heitti kuulokemikrofonin huoneen poikki vuonna 1999, koska sanelu oli 45 minuutin urakka, joka tuotti roskaa. Kuulokemikrofoni eli kauemmin kuin koe. Kaksikymmentäviisi vuotta myöhemmin urakka on poissa. Painat näppäintä ja puhut, ja sanat ilmestyvät. Ainoa todellinen päätös, joka on jäljellä, on se, mikä työkalu, ja monille ihmisille oikea vastaus istuu jo heidän koneessaan, sammutettuna, odottamassa. Omat lapseni eivät koskaan tule tietämään, että se oli koskaan vaikeaa, mikä onkin tavoite, vaikka siitä tuleekin huonompi tarina päivällispöydässä.

Kokeile ensin sitä, jonka jo omistat

Jos se loppuu kesken, lataa Whisper ja valitse moottori, joka sopii tapaasi työskennellä.

Ilmainen sisäänkirjautuneille käyttäjille koko paikallisessa putkessa. Ei korttia rekisteröityessä.

Kuva Denys Medvedievistä

Denys Medvediev

Olen se, joka lukee asiakaspostimme, mitä todennäköisimmin sanelemalla vastaukset.