Kirjoittaja: Denys Medvediev

Vertailu

Talon Voice -vaihtoehto

Talon Voice on rakennettu kädet vapaana -ohjaukseen ja äänellä koodaamiseen, ja siihen kuuluu opeteltava komentokieli. Jos haluat lähinnä tavallista sanelua — puhut, ja teksti ilmestyy mihin tahansa sovellukseen — Whisper on yksinkertaisempi offline-vaihtoehto: yksi pikanäppäin, ei kielioppia opeteltavana.

Päivitetty viimeksi: kesäkuu 2026

Mekaaninen näppäimistö ja koodia tummalla työpöydällä — kuva kehittäjästä, joka valitsee äänisohjauksen ja tavallisen sanelun välillä

Paras Talon Voice -vaihtoehto tavalliseen saneluun on Whisper by Remskill: järjestelmänlaajuinen paina-ja-puhu-työkalu, joka liittää puhutun tekstin mihin tahansa sovellukseen, ilman opeteltavaa komentokielioppia. Talon on edelleen vahvempi valinta aitoon kädet vapaana -ohjaukseen ja äänellä koodaamiseen. Whisper toimii täysin offline-tilassa ja on ilmainen kaikille kirjautuneille käyttäjille.

Kokeilin Talonia viikon ajan, koska internet kertoi sen olevan se vakavasti otettava äänityökalu, ja internet oli oikeassa. Se on poikkeuksellinen ohjelmisto. Kolmanteen päivään mennessä liikutin kohdistinta katseella, ja äänen poksahdus laukaisi vasemman napsautuksen. Viidenteen päivään mennessä tajusin, etten halunnut mitään näistä. Halusin vain puhua ja nähdä sanat ilmestyvän siihen ruutuun, jota jo katsoin.

Juuri tuo kuilu saa monet etsimään Talon Voice -vaihtoehtoa. He asensivat sen odottaen sanelua ja löysivätkin täyden kädet vapaana -tietokonejärjestelmän komentokielen kera. Talon osaa kyllä sanella — mutta jos tarvitset vain sanelua, olet ottanut harteillesi oppimiskäyrän saadaksesi ominaisuuden, jonka paljon pienempi työkalu antaa sinulle kahdessa minuutissa.

Tässä rehellinen jako, koska vastaus riippuu täysin siitä, mitä oikeasti yrität tehdä. Talon korvaa näppäimistön ja hiiren. Puhut komentoja, ja se suorittaa ne; se voi liikuttaa kohdistinta katseella, napsauttaa äänellä ja ajaa kirjoittamiasi mukautettuja Python-skriptejä. Se on aidosti vaikea ongelma, joka on ratkaistu hyvin, ja niille, jotka sitä tarvitsevat, mikään muu ei vedä vertoja.

Sanelu on paljon pienempi ongelma. Haluat sanoa lauseen ja saada sen päätymään sähköpostiin, asiakirjaan, keskusteluun tai commit-viestiin. Ei kielioppia, ei skriptejä, ei uutta sanastoa. Juuri sen Whisper tekee: yksi pikanäppäin, puhut, ja teksti liittyy kohdistimen kohdalle mihin tahansa sovellukseen. Käyn läpi, mikä Talon on, miksi ihmiset sivuuttavat sen sanelussa, miten yksinkertaisempi työkalu otetaan käyttöön, missä kumpikin loistaa, ja — sen osan, jonka useimmat vertailusivut ohittavat — tarkalleen milloin sinun kannattaa pysyä Talonissa.

Mikä Talon Voice on ja kenelle se on aidosti tarkoitettu

Kehittäjän kädet lepäävät kaukana näppäimistöstä koodin täyttäessä ruudun — viittaus kädet vapaana -koodaamiseen

Talon Voice, osoitteesta talonvoice.com, on kädet vapaana -syötteen korvaaja näppäimistölle ja hiirelle. Sanamuoto on heidän omansa, ja se on tarkka. Se ei ole saneluohjelma, johon on lisätty pari extraa; se on ohjausjärjestelmä, jossa sanelu on yksi tila monien joukossa. Se toimii Windowsilla, macOS:llä ja Linuxilla, mikä jo tekee siitä laajemman kuin monet äänityökalut.

Se, mitä se oikeasti tekee, on vaikuttavaa. Äänikomennot antavat sinun ohjata koko konetta puheella. Äänenhallinta muuttaa äänet — poksahduksen, suhinan — napsautuksiksi, mikä on pelastus, jos koko päivän puhuminen väsyttää sinua. Katseenseuranta liikuttaa hiirtä sen mukaan, mihin katsot. Ja koko juttu on skriptattavissa Pythonilla: komennot elävät `.talon`-tiedostoissa, ja yhtä yksinkertainen rivi kuin `hello talon: "hello world"` yhdistää lauseen toimintoon. Tarjolla on laaja yhteisön komentosarja (`talonhub/community`-projekti), joka antaa sinulle toimivan sanaston heti kättelyssä.

Yleisö, jolle tämä on rakennettu, on selvä ja todellinen: kehittäjät, jotka haluavat koodata äänellä, sekä ihmiset, joilla on rasitusvamma tai muu tila, jonka vuoksi he eivät pysty käyttämään näppäimistöä ja hiirtä mukavasti lainkaan. Täyteen kädet vapaana -tietokoneenkäyttöön Talon on yksi parhaista olemassa olevista työkaluista. Perusversio on ilmainen; maksullinen Patreon-betataso lisää aikaisempia ominaisuuksia, korkeamman prioriteetin tuen ja ylimääräisiä puhemoottorivaihtoehtoja. Mikään tästä ei ole moite. Se on vain eri, suurempi tehtävä kuin se, jota useimmat hakukenttään "puheesta tekstiksi" kirjoittavat yrittävät tehdä.

Miksi ihmiset sivuuttavat Talonin tavallisessa sanelussa

Syynä on oppimiskäyrä, eikä se ole vika — se on tehon hinta. Talonin koko idea on, että opetat tietokoneellesi komentosanaston ja usein kirjoitat tai lainaat skriptejä laajentaaksesi sitä. Korvataksesi näppäimistön sinun on opittava kieli, joka korvaa näppäimet. Se on reilu vaihtokauppa, jos äänisohjaus on tavoite. Se on jyrkkä vero, jos halusit vain sanella sähköpostin.

Tavallisessa sanelussa ei ole opeteltavaa sanastoa. Painat näppäintä, puhut, vapautat sen, ja sanat ilmestyvät sinne, missä kohdistimesi jo on. Whisper pitää lyhyen hännän sen jälkeen, kun päästät irti, jottei viimeinen sanasi katkea, ja koska se liittää tekstin käyttöjärjestelmän kohdistimen kohdalle, kohdesovellus on yksinkertaisesti "se ruutu, jolla on fokus" — Gmail, Google Docs -asiakirja, Slack tai koodieditorisi. Pieni kapseli ilmestyy puhuessasi, jotta tiedät sen kuuntelevan:

Cancel
Tallennuskerros — pieni kapseli, joka ilmestyy puhuessasi, jotta tiedät Whisperin kuuntelevan.

Pikanäppäin on ainoa asetus, joka kannattaa laittaa kuntoon heti alkuun. Windowsilla se on Ctrl+Space; Macilla se on Command+Option, pelkkiin muuntonäppäimiin perustuva paina-ja-puhu, jota pidät pohjassa puhuessasi. Molemmat ovat vaihdettavissa, jos ne menevät päällekkäin jonkin muun kanssa. (Nuorempi tyttäreni kertoi minulle kerran, ettei pikanäppäin "toiminut" hänen piirrosohjelmassaan. Se oli ristiriita, ei vika — ja näin opin, ettei tavallisella ihmisellä ole aavistustakaan, mikä pikanäppäinristiriita edes on. Joten jokainen pikanäppäin on nyt muokattavissa.) Tämän päälle ei ole kerrostettu mitään komentokielioppia. Pikanäppäin on koko käyttöliittymä. Jos olet aiemmin määrittänyt sanelun Windowsilla tai Macilla, tämä on samaa lihasmuistia.

Sanelu-vaihtoehdon käyttöönotto kahdessa minuutissa

Tarvitset Apple Silicon -Macin tai Windows 10:n tai uudemman tietokoneen, toimivan mikrofonin ja minkä tahansa sovelluksen, johon haluat kirjoittaa. Koko paikallinen putki on ilmainen kaikille kirjautuneille käyttäjille, eikä rekisteröityessä kysytä maksutapaa. Tässä on järjestys.

Vaihe 1 — Asenna Whisper ja kirjaudu sisään.

Lataa lataussivulta, asenna ja luo ilmainen tili. Ei korttia. Koko paikallinen transkriptioputki avautuu heti.

Tiedät sen onnistuneen, kun sovelluksen ilmaisinalueen kuvake ilmestyy ja ohjattu asennus tarjoaa mallin valintaa.

Vaihe 2 — Valitse transkriptiopolku.

Sovellus ei valitse puolestasi. Saat kolme vaihtoehtoa: Pilvi (OpenAI, oma avain mukaan), paikallinen Parakeet tai paikallinen Whisper. Yksityiseen saneluun aloita paikallisesta — lisää tästä kahden osion päästä.

Tiedät sen onnistuneen, kun malli on latautunut ja näkyy valmiina.

Vaihe 3 — Vahvista pikanäppäimesi.

Windowsin oletus on Ctrl+Space, Macin Command+Option pohjassa paina-ja-puhu-tyyliin. Macilla myönnä Käyttöapu-oikeus pyydettäessä; ilman sitä liitä-kohdistimeen ei ylety muihin sovelluksiin.

Tiedät sen onnistuneen, kun testitallennus liittyy mihin tahansa tekstikenttään.

Vaihe 4 — Vie kohdistin minne tahansa ja puhu.

Klikkaa sähköpostiin, asiakirjaan, keskusteluruutuun tai editoriisi, pidä pikanäppäintä pohjassa, sano lause ja vapauta. Transkriptio ilmestyy kohdistimen kohdalle.

Tiedät sen onnistuneen, kun puhumasi lause istuu kentässä tekstinä.

Whisper
Aito Whisperin työpöytäsovellus asetusnäkymässä, Transcription- ja AI-paneelit auki.

Siinä on ero pähkinänkuoressa. Whisperin käyttöönotto on yksi mallin lataus ja neljä vaihetta. Ei `.talon`-tiedostoja kirjoitettavana, ei komentosarjaa ulkoa opeteltavana, ei Pythonia. Jos tavoitteesi on sanelu, kaiken tuon koneiston puuttuminen on itse ominaisuus.

Miten Talon ja Whisper vertautuvat, rehellisesti

Aloitetaan siitä, mitä Talon tekee ja Whisper ei, koska muu olisi epärehellistä. Talon ohjaa tietokonettasi. Se liikuttaa hiirtä, napsauttaa, vaihtaa ikkunoita, ajaa komentoja ja — yhteisön komentosarjalla tai omilla skripteilläsi — muokkaa koodia äänellä aidolla tarkkuudella. Whisper ei tee mitään näistä. Whisper muuntaa puheen tekstiksi kohdistimen kohdalle ja pysähtyy siihen. Jos tarvitset kädet vapaana -ohjausta, tämä vertailu on jo ohi ja Talon voittaa sen.

Nyt ne asiat, joilla on merkitystä, jos tehtävä on sanelu. Alusta: Talon kattaa Windowsin, macOS:n ja Linuxin; Whisper on vain Windows ja macOS, ei Linuxia. Käyttöönotto: Talon pyytää sinua opettelemaan komentosanaston ja usein skriptaamaan; Whisper pyytää valitsemaan mallin ja pikanäppäimen. Offline ja yksityisyys: molemmat voivat toimia paikallisesti, ja Whisperin paikalliset tilat pitävät kaiken omalla koneellasi. Kielet: Whisperin monikieliset mallit kattavat 99 kieltä ja osaavat kääntää englanniksi; kevyempi Parakeet-moottori kattaa 25. Lisäksi Whisper tarjoaa valinnaisen tekoälypuhdistuksen, joka karsii täytesanat ja korjaa välimerkit ennen kuin teksti laskeutuu — hyödyllistä proosaa sanellessa, vähemmän olennaista komentoja antaessa.

Hinnan osalta molemmilla on ilmainen polku, ja kuvailen mieluummin malleja kuin arvailen numeroita. Talonin vakaa versio on ilmainen, ja maksullinen Patreon-betataso tarjoaa aikaisia ominaisuuksia ja lisää puhemoottoreita. Whisperin koko paikallinen putki on ilmainen kaikille kirjautuneille käyttäjille ilman korttia rekisteröityessä; maksullinen taso lisää vain pilvipuolen. Tylsä totuus on, etteivät ne oikeastaan kilpaile hinnalla — ne kilpailevat sillä, mitä yrität tehdä. Maksa siitä, joka vastaa tehtävää, äläkä maksa oppimiskäyrää aikana ominaisuudesta, jonka saat kahdessa minuutissa.

Paikallinen vai pilvi: mitä Whisper-tilaa ajaa

Jos tulit Talonista osittain siksi, että pidit sen toimimisesta omalla koneellasi, haluat paikallisen tilan myös tänne. Sanelu kantaa usein samaa yksityistä tekstiä kuin Talonkin olisi kantanut — työmuistiinpanoja, sähköpostin asiakkaalle, luonnoksen, jota et koskaan laittaisi kenenkään palvelimelle. Jos Macisi on Apple Silicon tai tietokoneesi on viime vuosilta, paikallinen hoitaa arkisen sanelun valittamatta, ja pilvestä tulee varauloskäynti oletuksen sijaan. Sovellus pakottaa sinut valitsemaan, joten tässä on, miten kolme polkua eroavat.

  • Paikallinen ParakeetNVIDIAn TDT-moottori, noin 600 MB, ja nopein paikallinen vaihtoehto — 5–10 kertaa nopeampi kuin Whisper prosessorilla. Kattaa englannin ja 24 muuta eurooppalaista kieltä, yhteensä 25. Ei käännöstä englanniksi. Jos sanelet englanniksi tai muulla eurooppalaisella kielellä, tämä on nopea, täysin offline-valinta.
  • Paikallinen Whisperhitaampi kuin Parakeet samalla koneella, mutta monikieliset versiot kattavat 99 kieltä ja osaavat kääntää englanniksi. Pelkän englannin versiot ovat vain englanniksi, eivät 99 kielelle. Valitse tämä kiinaa, japania, koreaa tai mitä tahansa käännöstyötä varten, jota Parakeet ei osaa. Oletuksena oleva englanninkielinen malli on noin 480 MB.
  • Pilvi (OpenAI, oma avain)paras tarkkuus ja verkkokäyttö omalla OpenAI-avaimellasi, jonka OpenAI laskuttaa suoraan. Transkriptio ajetaan oletuksena gpt-4o-mini-transcribe-mallilla. Vaatii internetin, joten se on ainoa polku, joka poistuu koneeltasi. Pilvipuoli kuuluu Whisper Prohon.

Useimpaan saneluun paikallinen riittää hyvin. Molemmat paikalliset moottorit toimivat täysin koneellasi ilman, että palvelimelle lähetetään mitään, mikä on koko pointti, jos yksityisyys oli osa syytä, miksi kokeilit Talonia alun perin. Pilvi ansaitsee paikkansa, kun haluat huippuluokan tarkkuuden vaikeaan tallenteeseen tai tarvitset mallia hakemaan faktan verkosta kesken lauseen. Aloita paikallisesta, tartu pilveen vain, kun paikallinen jättää sinut kaipaamaan lisää.

Tekoälypuhdistus, jota Talon ei pyri tekemään

Raaka sanelu tulee ulos yhtenä pötkönä. Sanot "okei eli pushaa auth-fiksi katso migraatioskripti läpi ja pingaa tiimi ennen standupia", ja juuri tuon välimerkittömän seinämän mikä tahansa puhemoottori ojentaa sinulle, Talonin sanelutila mukaan lukien. Tuon muuttaminen siistiksi tekstiksi on eri tehtävä kuin koneen ohjaaminen, ja siihen Whisper panostaa.

Windowsin sanelu lisää välimerkit puhuessasi, ja macOS:n Sanelu hoitaa perusvälimerkit, kun sanot "pilkku" tai "piste". Raskaampaan puhdistukseen — täytesanojen karsimiseen, pötköjen korjaamiseen, puhutun kappaleen muuttamiseen joksikin, jonka oikeasti lähettäisit — Whisper voi ajaa tekoälykierroksen. Sano aktivointilause "Hey whisper", ja teksti parannetaan ennen kuin se laskeutuu. Paikallisella mallilla se ajetaan Ollaman kautta; pilvitilassa se on oletuksena gpt-5-mini.

Thinking...
Raaka

okei eli pushaa auth-fiksi katso migraatioskripti läpi ja pingaa tiimi öö ennen standupia

Siistitty

Okei, eli pushaa auth-fiksi, katso migraatioskripti läpi ja pingaa tiimi ennen standupia.

Tämä on tarkoituksellinen ero pyrkimyksessä, ei pistetaulu. Talonin energia menee tarkkaan ohjaukseen — täsmälliseen kohdistimen liikkeeseen, täsmälliseen komentoon, täsmälliseen muokkaukseen. Whisperin energia menee puhutun proosan tekemiseen luettavaksi ilman, että kosket näppäimistöön jälkeenpäin. Jos vietät päiväsi kirjoittaen sähköposteja, asiakirjoja ja viestejä äänellä, tunnet tuon puhdistuskierroksen joka tunti. Jos vietät päiväsi ohjaten kohdistinta ja muokaten koodia äänellä, se on epäolennaista ja Talonin tarkkuus on se, mikä merkitsee.

Tuo puhu-sitten-puhdista-virtaus on tasan se, mitä ihmiset haluavat sanellessaan koodikommentteja ja proosaa ilman, että opettelevat ensin komentokielen — saat sanat ylös nopeasti ja annat puhdistuskierroksen siistiä ne.

Milloin Talon on oikea valinta, ei Whisper

Kaksi haarautuvaa polkua kuvaamassa valintaa Talonin (ohjaus) ja Whisperin (sanelu) välillä

Useinkin, ja tekisin sinulle karhunpalveluksen, jos esittäisin toisin. Jos jokin seuraavista pitää paikkansa, sulje tämä sivu ja mene asentamaan Talon — se on parempi työkalu siihen, mitä tarvitset.

Sinun kannattaa valita Talon, jos haluat aitoa kädet vapaana -tietokoneenkäyttöä: hiiren liikuttamista, napsauttamista, ikkunoiden vaihtoa ja koko koneen ohjaamista koskematta näppäimistöön. Sinun kannattaa valita Talon, jos koodaat äänellä, missä sen komentokielioppi ja Python-skriptaus antavat sinun kirjoittaa symboleita, navigoida koodissa ja tehdä täsmällisiä muokkauksia tavalla, johon mikään saneluohjelma ei pysty. Sinun kannattaa valita Talon, jos sinulla on rasitusvamma tai muu tila, joka tarkoittaa, ettet pysty käyttämään näppäimistöä ja hiirtä mukavasti lainkaan — se on rakennettu tasan sitä varten, ja äänenhallinta ja katseenseuranta ovat aitoja esteettömyysominaisuuksia, eivät kikkoja. Ja sinun kannattaa valita Talon, jos olet Linuxilla, koska Whisper ei toimi siellä mutta Talon toimii. Oppimiskäyrä on pääsymaksu kyvyistä, joita Whisperillä tarkoituksella ei ole.

Whisper on parempi valinta vain silloin, kun sanelu on varsinainen tehtävä: haluat puhua ja saada siistin tekstin ilmestymään mihin tahansa sovellukseen, jossa olet, Windowsilla tai Macilla, ilman että opettelet komentokielen päästäksesi sinne. Se on todellinen ja yleinen tarve, mutta pienempi kuin Talonin. Sovita työkalu tehtävään — ja jos tehtäväsi on se isompi, Talon on siinä aidosti erinomainen.

Jos päädyit tänne äänisohjelmien vanhemmasta päästä etkä itse Talonista, kompromissit aiheessa siirtyminen pois Dragon NaturallySpeakingista kattavat saman maaston niille, jotka tulevat komento-ja-ohjaus-tyyppisestä sanelusta.

Vietin viikon opettaen tietokoneelleni sanastoa, ja sitten tajusin yrittäneeni sovittaa näppäimistön korvaajaa ongelmaan, joka oli vain "kirjoita kirjoittamatta". Talon on oikea vastaus vaikeaan kysymykseen. Helppoon kysymykseen — puhu, saa teksti, mihin tahansa ruutuun — et tarvitse komentokieltä, vaan pikanäppäimen. Sanelin koko tämän vertailun pitämällä yhtä näppäintä pohjassa ja puhumalla, ja annoin sitten puhdistuskierroksen korjata pötköni. Siinä koko temppu, ja sen lauseen kirjoittaminen kesti kauemmin kuin sen oppiminen.

Kokeile sanelu edellä -vaihtoehtoa

Pidä pikanäppäintä pohjassa, puhu, vapauta. Siisti teksti laskeutuu siihen sovellukseen, jossa kohdistimesi on — komentokieltä ei vaadita.

Ilmainen paikallinen tila kaikille kirjautuneille käyttäjille. Aloitukseen ei tarvita korttia.

Valokuva Denys Medvedievistä

Denys Medvediev

Minä se olen, joka lukee tukisähköpostimme — mitä luultavimmin sanellen vastaukset.

Lisälukemista