Kirjoittaja: Denys Medvediev

Vianmääritys

Diktointi kirjoittaa vääriä sanoja? 5 korjausta

Diktointi kirjoittaa vääriä sanoja, kun malli kuulee yhden äänteen väärin ja arvaa. Viisi syytä — neljä niistä voit korjata kymmenessä minuutissa.

Päivitetty viimeksi: kesäkuu 2026

Musta näppäimistö tummalla alustalla epäterävässä kuvassa — kuvaa diktoinnin tulostetta sivulle

Diktointi kirjoittaa vääriä sanoja, kun puheentunnistusmalli kuulee yhden äänteen väärin ja muodostaa lauseen arvauksensa pohjalta. Tavallisimmat syyt ovat heikko mikrofoni, taustamelu, homofoni jota malli ei pysty erottamaan, väärä kielivalinta tai nimi jota se ei ole koskaan nähnyt. Korjaa ääni ensin — opeta sitten työkalu tuntemaan sanastosi.

Sanot "vie tuotantoon". Näytölle ilmestyy "vie tuotanto". Korjaat sen. Seuraava lause — sama juttu. Kolmannen korjauksen kohdalla kirjoitat jo nopeammin kuin puhut, mikä vie koko hommalta pohjan pois. Olen nähnyt tämän saman kierteen turhauttaa kirjoittajan, myyntiedustajan ja oman äitini, joka kokeili diktointia kerran ja palasi sitten kahden sormen konekirjoitukseen puhtaasta periaatteesta. Hyvä uutinen on se, että lähes jokainen väärä sana johtuu yhdestä viidestä syystä — ja neljä niistä voit korjata seuraavan kymmenen minuutin aikana.

Tässä se osa, jota kukaan ei kerro sinulle. Useimmat diktoinnityökalut eivät ole rikki kun ne tekevät tätä. Ne arvaavat, reaaliajassa, huonoissa olosuhteissa, tietämättä kollegasi nimeä tai sitä, että "Kubernetes" on edes sana. Whisperin paikallisessa tilassa on asetus, joka korjaa viimeisen ongelman suoraan — Custom words -kenttä, johon listataan nimet ja ammattisanasto joita odotat sen kuulevan, jotta se kirjoittaa ne oikein sen sijaan että keksisi jotain samankuuloista. Se on ilmainen ja toimii offline-tilassa. Palataan siihen. Mutta tylsä totuus on, että mikrofoni merkitsee enemmän kuin ohjelmisto — joten sieltä aloitetaan.

Diktointi ei ole rikki. Se arvaa.

Kannettavan tietokoneen näppäimistö tunnelmavalaistuksessa — havainnollistaa mihin väärin kirjoitettu diktointi päätyy

Puheentunnistus ei kuule kirjaimia. Se kuulee ääntä ja veikkaa todennäköisimmät sanat, joita kyseinen ääni voisi tarkoittaa — ja tarkistaa veikkaustaan sitä mukaa kun lisää ääntä saapuu. Siksi diktointi joskus kirjoittaa aiemmin sanomasi tekstin uudelleen. Se kuulee lauseen lopussa yhden sanan väärin, päättää että aikaisemman sanan täytyy olla jotain muuta jotta kielioppi toimisi — ja muuttaa sen hiljaa.

"Kuu" ja "kuun." "Tuli" ja "tuuli." Suomen kielessä samankuuloiset tai helposti sekoittuvat sanat voivat aiheuttaa täsmälleen saman ongelman kuin englannin homofonit. Selkein puhuminen ei auta, koska selkeys ei ole ongelma. Mallin täytyy arvata kontekstin perusteella — ja joskus se arvaaa väärin.

Sitten on sanoja, joita malli ei ole koskaan kohdannut. Esimiehesi sukunimi. Tuotekoodi. "Remskill." Malli ei osaa kirjoittaa oikein sanoja, joita se ei tunne — joten se korvaa ne lähimmällä tuntemallaan sanalla. Se ei ole bugi. Se on sanastopuute, ja siihen on tietty korjaus jonka käymme läpi tuonnempana.

Mikrofoni on useimmiten syyllinen

Pöytätyöasema kondensaattorimikrofonilla, kannettavalla ja kuulokkeilla — diktointiäänen lähde

Ennen kuin syytät ohjelmistoa, katso mitä sille syötetään. Kannettavan tietokoneen sisäänrakennettu mikrofoni istuu tuulettimen vieressä, osoittaa kattoon ja poimii yhtä paljon huoneen ääniä kuin ääntäsi. Roskaa sisään — vääriä sanoja ulos.

Tämä on se yksi mielipide, johon laitan koko artikkelin peliin: "tekoäly" ei korjaa huonoa ääntä. 20 dollarin USB-mikrofoni parantaa tarkkuutta enemmän kuin mikään mallin päivitys. Latasin itse viikon ajan isompia ja hitaampia malleja korjatakseni omia virheitäni — ennen kuin huomasin, että kannettavani mikki osoitti tuulettimeen. Mikki oli koko ajan se ongelma. Teen tätä ohjelmistoa työkseni. Käytä rahat ensin laitteistoon. Malli on se halpa osa.

Varmentamistesti: sanele samat kolme lausetta ensin sisäisellä mikrofonilla, sitten kuulokemikillä tai USB-mikrofonilla. Jos virheiden määrä putoaa, mikrofoni oli ongelma ja olet valmis. Suurin osa ihmisistä lopettaa lukemisen tähän — ja se on ihan fine.

Taustamelu ja huoneen akustiikka

Rauhallinen hiljainen kirjoituspöytä kannettavan, muistikirjan ja kukkien kanssa — matalamelutasoinen työtila

Astianpesukone kahdessa huoneessa. Kollegan puhelinsoitto. Avotoimisto, jossa kuulet jonkun syövän sipsiä kolmenkymmenen metrin päästä. Malli ei erota ääntäsi melusta — se litteroi kovimman äänen, ja joskus sipsit voittavat.

Googlen tekoälykatsaus juuri tähän ongelmaan listaa taustamelun ensisijaiseksi syyksi, samaan riviin aksenttien ja homofonien kanssa. Korjaus ei ole glamouria: sulje ovi, sammuta tuuletin, siirry auki olevasta ikkunasta kauemmas. Hiljainen huone tekee enemmän kuin fiksu algoritmi.

Varmennus: kokeile samaa diktointia hiljaisessa tilassa ja tavallisessa ympäristössäsi. Jos virheitä tulee hiljaisuudessa vähemmän, melu oli syyllinen. Jos hiljaista tilaa ei ole saatavilla, suuntaava tai melua vaimentava mikrofoni — joka kuuntelee vain suoraan edessä olevaa — on seuraavaksi paras vaihtoehto. Ja jälleen puhutaan laitteistosta, johon rahat kannattaa muutenkin laittaa.

Väärä kieli tai aksenttiero

Puisia kirjainlaattoja hajallaan vaalealla pöydällä — kuvaa sanoja ja kielivalintoja

Jos diktointisi on asetettu tunnistamaan kieli automaattisesti ja vaihdat kielten välillä, malli käyttää vaivaa kielen tunnistamiseen ennen sanojen tunnistamista — ja väärä arvaus kielestä pilaa kaiken sen jälkeen. Aseta kieli erikseen aina kun pystyt.

Whisperissä se löytyy kohdasta Asetukset, Litterointi, Kieli. Puhumasi kielen valitseminen suoraan ohittaa tunnistusvaiheen ja auttaa mallia poimimaan sanasi tarkemmin. Jätä automaattinen tunnistus päälle vain jos todella vaihdat kieliä kesken istunnon. Whisperin monikieliset mallit tukevat 99 kieltä automaattisessa tunnistuksessa. Pelkästään englanninkieliset mallit lukittuvat englantiin — mikä on täsmälleen oikein, jos puhut vain englantia.

Aksenttiero on tämän ongelman serkku. Yhdysvaltalaiselle englannille koulutettu malli, jonka harjoitusdata on pääosin yhdysvaltalaisista puhujista, kompastuu vahvaan alueelliseen aksenttiin. Lähimmän saatavilla olevan alueellisen variantin valitseminen ja puhtaan äänimerkin antaminen kaventavat eroa.

Korjaa se Windowsilla, Macilla ja iPhonella

Jokaisen alustan sisäänrakennettu diktointi on omanlaisensa — omine puutteineen ja rajoineen. Windowsissa Äänellä kirjoittaminen avautuu Windows-näppäimellä ja H:lla, mutta kursorin täytyy olla tekstikentässä ja tarvitset internetyhteyden — sisäänrakennettu työkalu lähettää äänen pilveen litterointia varten. Jos se kirjoittaa hölynpölyä, tarkista yhteys ensin. Applen tukiforumeilla saman väärät-sanat-ongelman kohdalla "tarkista internetyhteys" on listan aivan kärjessä. (Lisää ohjeita löydät oppaastamme aiheesta ääni tekstiksi ei toimi Windowsissa.)

Macilla Diktointi käynnistyy Mikrofoni-näppäimellä funktionäppäinrivillä, Diktointi-pikavalinnalla tai Muokkaa-valikosta kohdasta Käynnistä Diktointi. Yksi asia selväksi: nykyinen macOS Diktointi antaa sanella tekstiä minkä pituista tahansa ilman aikarajoitusta — se pysähtyy vasta noin 30 sekunnin hiljaisuuden jälkeen, minkä ihmiset virheellisesti luulevat kovaksi rajaksi. Jos virheet jatkuvat, Mac-ääni-tekstiksi-vianmääritysoppaassamme käydään asiat läpi vaihe vaiheelta. iPhonella Applen forumeilla suositellaan myös ennakoivan tekstin poistamista käytöstä, sillä se voi joskus "korjata" sen, minkä diktointi sai oikein.

Vaikeampi raja: Windows Voice Typing (Win+H) ei tarjoa mitään tapaa lisätä mukautettuja sanoja tai kouluttaa sanakirjaansa. Wordin erillinen diktointinäkymä antaa rakentaa pienen diktointisanakirjan, mutta työkalu johon useimmat turvautuvat — Win+H — ei voi oppia sanastoasi ollenkaan. Mikä johtaa meidät siihen yhteen korjaukseen, joka todella tekee eron väärät-nimet, väärä-ammattisanasto -ongelmaan.

Opeta sille sanasi: mukautettu sanasto

Whisper
Oikea Whisper-sovellus — avaa Asetukset, Litterointi ja kirjoita nimesi ja ammattisanastosi Custom words -kenttään. Kokeile vapaasti — se on käytössä nyt.

Tämä on korjaus, jota sisäänrakennetut työkalut eivät voi tarjota. Kun ajat Whisper-mallia Whisperin paikallisessa tilassa, saat käyttöösi Custom words -kentän — pilkulla eroteltu lista nimistä, tuotetermeistä ja ammattisanastosta, joita odotat sen kuulevan. Kirjoitat "Kubernetes, PostgreSQL, Remskill, Matti Virtanen" — ja litterointi kallistuu kohti näiden oikeaa kirjoitusasua aina kun ne esiintyvät puheessasi. Se sijaitsee kohdassa Asetukset, Litterointi, ilmaisessa paikallisessa tasossa — ei korttia, ei pilveä.

Yksi asia kannattaa tietää: Custom words on Whisper-mallin ominaisuus. Parakeet, nopeampi paikallinen vaihtoehto, ei hyväksy mukautettuja sanoja tai kehotevihjeitä — sen oma kuvaus sanoo sen suoraan. Jos sanastosi opettaminen työkalulle on sinulle tärkeää, valitse Whisper-malli, ei Parakeet.

Opin tämän merkityksen nuoremmalta tyttäreltäni. Näytin hänelle diktointia kerran — paina, puhu, vapauta. Hän kirjoitti välittömästi 90-sanaisen sähköpostin isoäidilleen menetetystä hampaasta ja hammaskeijun vaihtokurssista — kysymättä mitään. Sitten hän palasi ärsyttyneenä, koska se piti pilata parhaan ystävänsä nimen. Hän ei tiennyt mikä sanastopuute on. Hän tiesi vain, että nimi meni väärin. Lisäsin nimen Custom words -kenttään, ja valitukset loppuivat. Tavallinen ihminen ei halua ymmärtää miksi diktointi kirjoittaa nimen väärin. He haluavat laatikon, johon kirjoittaa nimi. Tuo laatikko on koko tämän osion pointti.

Toinen säädin, jos haluat: Whisper tarjoaa Profiili-asetuksen — Nopea, Tasapainoinen tai Tarkka — joka hallitsee kuinka huolellisesti malli kuuntelee. Tarkka on hitaampi mutta poimii enemmän. Ja isomman mallin valitseminen Whisperin kahdeksasta mallista, Base-mallista (noin 140 MB) Large v3:een (noin 3 Gt), vaihtaa nopeutta tarkkuuteen. Mikään näistä ei ole "oikea valinta" kaikille — ne ovat säätimiä, ja väärät-sanat-ongelma päättää mitä säätää. Jos et ole varma mitä ladata, Whisper-mallin valintaoppaassamme käydään läpi kompromissit.

Siistimiskierros joka korjaa loput

Thinking...
Whisperin valinnainen tekoälyn siistimiskierros raakalitteraatille — se korjaa kieliopin, välimerkit ja isot kirjaimet ennen kuin teksti päätyy kursorin kohdalle.

Vaikka ääni olisi puhdas ja sanasto ladattu, muutama jäljelle jäävä virhe livahtaa läpi. Whisper voi ajaa valinnaisen tekoälyn siistimiskierroksen raakalitteraatille ennen kuin se päätyy kursorisi kohdalle — se korjaa kieliopin, välimerkit ja isot kirjaimet, ja poistaa täytesanat kuten "öh" ja "tuota noin". Se toimii laitteellasi ilmaiseksi, tai Cloud-tilassa OpenAI:n kanssa jos olet syöttänyt oman avaimesi.

Tämä on turvaverkko, ei ensimmäinen liike. Korjaa mikrofoni, hiljennä huone, aseta kieli, opeta sille sanasi — anna sitten siistimiskierroksen siivota jäljelle jäävä. Tekoälytekstikorjauksen yrittäminen kompensoimaan tuulettimeen osoittavaa sisäistä mikrofonia on väärän ongelman ratkaiseminen kalliilla työkalulla. Tiedän sen, koska julkaisin siistimiskierroksen ensin ja kielivalitsimen toisena, täysin väärässä järjestyksessä — ja käytin sitten omaa sovellustani kuukauden ihmetellen miksi. Hienosäätöä haluaville Whisper-kehoteoppaamme menee syvemmälle tulosteen muotoiluun.

Tallennuksen pikanäppäin on Ctrl+Space Windowsilla ja Command+Option Macilla — molemmat mukautettavissa Asetuksissa, jos ne ovat ristiriidassa jonkin käyttämäsi näppäinyhdistelmän kanssa.

Kun sisäänrakennettua työkalua ei voi korjata

Joskus vastaus ei ole korjaus — se on eri työkalu tai ei työkalua ollenkaan. Jos lähetät vain satunnaisen 30-sanaisen tekstin, Apple Dictation ja Windows Voice Typing ovat ilmaisia ja sisäänrakennettuja, eikä täydellisen tarkkuuden tavoittelu ole vaivan arvoista. Käytä sitä mikä on jo siinä.

Mutta todellinen raja on olemassa. Windows Voice Typing tarvitsee internetin eikä voi oppia sanastoasi. Jos väärät-sanat-ongelmasi on nimenomaan se, että työkalu jatkuvasti pilaa nimiä, tuotetermejä tai teknistä ammattisanastoa — eikä näitä sanoja voi lisätä mihinkään — sisäänrakennettua työkalua ei yksinkertaisesti voi korjata käyttötapaustasi varten. Se on se raja, jossa opetettava, offline-työkalu ansaitsee paikkansa. Ja jos pääasiassa litteroit useamman puhujan kokouksia oman kirjoittamisesi sijaan, se on kokonaan eri kategoria — kokouslitterointi, ei diktointi. Älä pakota diktointisovellusta tekemään työtä, johon se ei ole rakennettu.

Kuinka tarkkaa diktointia voi odottaa?

Aseta odotukset rehellisesti. Puhdas ääni, tunnettu kieli ja ladattu sanasto vievät sinut pisteeseen, jossa korjaukset ovat poikkeus eivät sääntö. Julkiset Whisper-vertailutulokset asettuvat noin 3 prosentin sanavirheprosenttiin puhtaalla luetulla puheella medium-englannin mallilla. Todellinen elämä — aksenttisi, huoneesi, ammattisanastosi — on korkeampi. Se on normaalia.

Tavoite ei ole nolla virhettä. Tavoite on vähemmän virheitä kuin kirjoittaminen olisi tuottanut samassa ajassa — ja se rima on matalampi kuin ihmiset luulevat. Diktointi 145 sanalla minuutissa voittaa 40 sanan minuuttivauhdin kirjoittamisen, vaikka pysähtyisit korjaamaan sanan tai kaksi. Jos korjaat joka toisen sanan, jokin yllä olevalta listalta on vielä rikki. Jos korjaat joka kymmenennen sanan, olet jo voittanut.

Jos diktointi jatkaa vääriin sanoihin pääsemistä, korjaa ääni, aseta kieli ja opeta sille nimesi — anna sitten sen hoitaa kirjoittaminen kun teet jotain muuta. Nuorempi tyttäreni kutsuu sitä yhä "puhuvaksi tietokoneeksi". Hänellä ei ole aavistustakaan, että taustalla on sanastokenttä, kielivalitsin tai kahdeksan mallia paina-puhu-vapauta-toiminnon takana. Se on se versio tästä, joka todella toimii — kun väärät sanat loppuvat, etkä enää kiinnitä huomiota itse työkaluun.

Haluatko nimesi kirjoittuvan oikein?

Lataa Whisper, lisää ensimmäinen mukautettu sanasi ja katso väärät sanat loppuvan ensimmäisessä lauseessa.

Kuva Denys Medvedievistä

Denys Medvediev

Minä olen se, joka lukee tukisähköpostimme — todennäköisesti diktoimalla vastaukset.

Lisälukemista