Opas
OpenAI Whisper Windowsille
OpenAI Whisper on ilmainen, avoimen lähdekoodin puheentunnistusmalli MIT-lisenssin alla. Windowsissa sitä ajetaan tavallisesti Pythonin ja komentorivin kautta äänitiedostojen litterointiin. Whisper by Remskill paketoi nämä mallit työpöytäsovellukseksi, jotta voit sen sijaan sanella suoraan mihin tahansa sovellukseen.
Viimeksi päivitetty: kesäkuu 2026

OpenAI Whisper on ilmainen, avoimen lähdekoodin puheentunnistusmalli, joka julkaistiin MIT-lisenssin alla. Windowsissa sitä ajetaan tavallisesti Pythonin ja komentorivin kautta litteroimaan äänitiedostoja, joihin sen osoitat. Whisper by Remskill paketoi nämä mallit työpöytäsovellukseksi, jotta voit sen sijaan sanella suoraan mihin tahansa sovellukseen.
OpenAI Whisper on ilmainen, avoimen lähdekoodin malli. Uudella Windows-koneella virallinen versio vaatii Pythonin, ffmpegin ja komentorivin tiedostojen litterointiin. Jos sinulla on tiedosto, ilmaiset graafiset työkalut kuten Buzz tai Whisper Desktop hoitavat sen. Jos haluat puhua ja nähdä sanasi ilmestyvän kohdistimen kohdalle missä tahansa sovelluksessa, Whisper by Remskill paketoi samat mallit valmiiksi — mitään ei tarvitse rakentaa, ja paikallinen taso on ilmainen.
Mitä "OpenAI Whisper for Windows" oikeastaan tarkoittaa
Tylsä totuus on, että "OpenAI Whisper" on kaksi eri asiaa saman nimen alla, ja hakutulokset sekoittavat ne keskenään päivittäin.
Ensimmäinen asia on malli. Whisper on puheentunnistusmalli, jonka OpenAI avasi MIT-lisenssin alla, joten sekä koodi että opetetut painot ovat ilmaisia ladata ja käyttää. Se tulee kuudessa koossa (tiny, base, small, medium, large ja turbo), joista neljällä on vain englantia tukeva versio, vaihtaen nopeutta tarkkuuteen. Se on monikielinen, ja se osaa kääntää puheen englanniksi yhdellä valitsimella. Tämä on aidosti vaikuttavaa, ja se on aidosti ilmaista.
Toinen asia on tapa, jolla sitä todella ajetaan. Virallinen Whisper on Python-paketti. Asennat sen pipillä, asennat sen rinnalle ffmpeg-komentorivityökalun, ja sitten syötät sille äänitiedoston päätteestä. Jos "pääte", "pip" ja "ffmpeg" kuulostavat jo nyt lauantailta, jota et suunnitellut viettäväsi, olet löytänyt sen aukon, josta tämä koko artikkeli kertoo. Komentorivi on työkalu, jolla kirjoitat tietokoneelle komentoja klikkaamisen sijaan. Useimmat Windows-käyttäjät eivät ole koskaan avanneet sitä tarkoituksella.
Joten kun joku kirjoittaa Googleen "OpenAI Whisper for Windows", hän haluaa yleensä yhden kahdesta vastauksesta. Joko: miten saan tämän ilmaisen mallin litteroimaan tiedostojani ilman tietojenkäsittelytieteen tutkintoa? Tai: haluan vain puhua ja saada sanani näkyviin, osaako tämä sen? Nämä ovat eri tarpeita, ja ne kaipaavat eri työkaluja. Vastaan molempiin, ja kerron rehellisesti, kumpi työkalu voittaa kummassakin.
Ilmainen malli on loistava. Asennus on se ongelma.
Tästä osasta tuotesivut vaikenevat. Whisper-malli ei maksa mitään. Whisper-kokemus uudella Windows-koneella maksaa sinulle iltapäivän.
Jotta voit ajaa virallista OpenAI Whisperiä, asennat Pythonin, sitten Whisper-paketin, sitten ffmpegin ja varmistat, että Windows löytää sen, sitten avaat päätteen ja ajat komennon jokaiselle tiedostolle. Mikään tästä ei ole kehittäjälle vaikeaa. Kaikki tämä on muuri kaikille muille: kirjoittajalle, juristille, opiskelijalle, myyjälle, omalle äidilleni, joka suostui kokeilemaan sanelua kolmannella esittelyllä ja olisi suostunut tasan nollaan esittelyyn, joihin liittyi lause "lisää ffmpeg PATH-muuttujaasi".
On olemassa ystävällisempiä reittejä, ja ne kannattaa tuntea. Whisper.cpp on saman mallin pelkistetty C/C++-portti: MIT-lisensoitu, nopea ja pelkällä prosessorilla toimiva, ilman Pythonia. Mutta silti rakennat sen lähdekoodista tai ajat sen komentoriviltä. Se on kaunis insinöörityö, joka on suunnattu suoraan ihmisille, jotka nauttivat kääntäjistä. Tämän artikkelin loppuosa on niille, jotka eivät nauti.
Kun haluatkin komentorivin Whisperin (tai tiedostojen litterointityökalun)
Aion nyt ohjata sinut muualle, koska tämä on se rehellinen osa.
Jos sinulla on todellisuudessa äänitiedosto (nauhoitettu haastattelu, podcast-jakso, tallentamasi Teams-puhelu, ääniviesti), sovelluksemme on väärä työkalu, ja kerron sen sinulle mieluummin kuin myyn väärän ratkaisun. Me teemme suoraa sanelua: sinä puhut, sanat ilmestyvät kohdistimen kohdalle. Emme ota olemassa olevaa tiedostoa ja litteroi sitä. Eri työ.
Siihen työhön kolme ilmaista työkalua ovat aidosti hyviä, ja ne on rakennettu juuri sitä varten:
- Buzz litteroi ja kääntää äänitiedostoja paikallisesti, OpenAI:n Whisperin voimalla, MIT-lisensoituna, ja se toimii Windowsissa. Jos haluat oikean ikkunan painikkeineen päätteen sijaan, aloita tästä.
- Whisper Desktop (Const-me) on Windowsin graafinen sovellus. Puret sen pakatusta, ajat WhisperDesktop.exe-tiedoston, osoitat sen tiedostoon, ja se litteroi näytönohjaimellasi DirectComputen kautta. Se on MPL-2.0-lisensoitu ja nopea kelvollisella näytönohjaimella.
- whisper.cpp on kevyt vaihtoehto, jos olet kotonasi komentorivillä ja haluat raakaa nopeutta ilman Pythonia.
En sano tätä vain diplomaattisuuttani. Se, että ohjaan sinut oikeaan työkaluun silloin, kun se ei ole meidän, on koko syy, miksi sinun pitäisi uskoa loput tästä. Jos sinulla on tiedosto, käytä Buzzia. Jos sinulla on mikrofoni ja lause mielessäsi, jatka lukemista.
Mitä Whisper by Remskill oikeasti tekee Windowsissa
Otimme samat avoimen lähdekoodin Whisper-mallit sekä toisen moottorin ja kääritimme ne Windows-sovellukseksi, joten mitään ei tarvitse rakentaa eikä mitään tarvitse kirjoittaa päätteeseen.
Asennat yhden sovelluksen, noin 25 Mt. Kirjaudut sisään. Painat pikanäppäintä, joka on oletuksena Ctrl + Space ja täysin uudelleen määriteltävissä. Puhut. Päästät irti. Teksti ilmestyy kohdistimen kohdalle siihen sovellukseen, jossa jo olit: Word, Outlook, selain, Slack, koodieditori, hakukenttä. Ei tiedostoa, ei päätettä, ei näytönohjainta — kaikki paikallinen litterointi toimii prosessorillasi.
Konepellin alla valitset kolmesta polusta, koska me emme valitse mallia puolestasi:
- Paikallinen Whisper (8 mallia) on se avoimen lähdekoodin Whisper, jonka takia tulit tänne, valmiiksi paketoituna. Englanniksi optimoidut mallit Basesta (~140 Mt) Mediumiin (~1,5 Gt), sekä monikieliset versiot aina Large v3:een asti (~3 Gt). Monikieliset versiot kattavat 99 kieltä ja osaavat kääntää englanniksi.
- Parakeet (NVIDIA TDT, ~600 Mt) on erillinen moottori, 5–10 kertaa Whisperiä nopeampi prosessorilla, kattaen englannin sekä 24 muuta eurooppalaista kieltä. Ei käännöstä englanniksi. Valitse tämä, jos haluat nopeutta ja työskentelet enimmäkseen englanniksi.
- Pilvi (OpenAI, oma avain) antaa sinun tuoda oman OpenAI-avaimesi huippuluokan tarkkuutta ja verkkohakua varten; emme ota siitä osuutta. Tämä on se yksi Pro-ominaisuus.
Paikallinen putki (jokainen Whisper-malli, Parakeet, tekoälyn siistiminen Ollaman kautta, historia, esiasetukset, oma pikanäppäin, mallien lataukset) on ilmainen kaikille kirjautuneille käyttäjille, ilman korttia rekisteröityessä. Pilvipolku on maksullinen Pro-taso; näet luvut hinnoittelusivulta.
Miksi oikea Windowsin sanelusovellus on vaikeampi kuin pip install
Tästä kukaan ei varoita sinua, kun sanotaan "kääritään vain Whisper käyttöliittymään".
Malli on se helppo osa. Pikanäppäimen saaminen käyttäytymään Windowsissa ei ole. Pikanäppäinkäsittelijämme ensimmäinen versio laukaisi nauhoituksen lopetus -takaisinkutsun kuusi kertaa yhdellä todellisella painalluksella. Se toimi täydellisesti Macilla. Se toimi täydellisesti puhtaalla Windows-asennuksella. Se hajosi todellisilla asiakaskoneilla — niillä, joissa oli kielen syöttömenetelmä käytössä, mikä Windowsissa tuottaa haamumaisia Ctrl + Space -vapautustapahtumia arvaamattomina hetkinä. Vaadittiin päiviä telemetriaa, sitten 50 ms:n debounce, joka ei riittänyt, sitten 300 ms:n debounce, joka lopulta riitti. Opin Windowsin syöttömenetelmäkehyksestä enemmän kuin kenenkään ihmisen pitäisi, ja minulla on maisterin tutkinto. Vanhemman tyttäreni tuomio, kun selitin tämän: "tästä syystä isän sähköpostit kestävät ikuisuuden".
Tämä on ero mallin ja tuotteen välillä. Ilmainen Whisper antaa sinulle litteroinnin tiedostosta. Sanelusovelluksen on selviydyttävä todellisesta Windows-työpöydästä, todellisissa sovelluksissa, samalla kun teet jotain muuta. Malli ei koskaan näe tuota taistelua. Me näemme, ja hävisimme sen ensin noin viikoksi.
Kun Windowsin sisäänrakennettu työkalu riittää
Kerro ihmisille, milloin tuotettasi ei kannata ostaa, niin he saattavat uskoa sinua muusta. Eli: jos sanelet vain satunnaisen lyhyen muistiinpanon, et ehkä tarvitse mitään tästä. Windows 11:ssä on sisäänrakennettu sanelutoiminto, jonka avaat näppäimillä Win + H. Se on ilmainen ja ihan hyvä parille riville, vaikka se ohjaa äänesi Microsoftin verkossa toimivaan puheentunnistukseen sen sijaan, että se toimisi koneellasi. Nopeaan Teams-vastaukseen se riittää hyvin.
Asennuksemme alkaa olla vaivansa väärti suunnilleen siinä vaiheessa, kun luonnostelet oikeaa tekstiä (pitkiä sähköposteja, muistioita, luentotiivistelmiä, koodikommentteja, markkinointiversioita) ja haluat sen pysyvän koneellasi, 99 kielellä, samalla pikanäppäimellä kaikkialla. Jos päiväsi on kaksirivisiä keskusteluja, olet valmis. Jos päiväsi on kirjoittamista, pidä sovellus.
Lisälukemista
OpenAI Whisper on ilmainen, avoimen lähdekoodin malli, ja Windowsissa se yleensä vaatii Pythonin, ffmpegin ja päätteen tiedostojen litterointiin. Jos sinulla on tiedosto, Buzz tai Whisper Desktop hoitaa sen ilmaiseksi oikealla ikkunalla. Jos haluat oikeasti puhua ja nähdä sanasi ilmestyvän kohdistimen kohdalle missä tahansa sovelluksessa, ilman rakentamista, ilman komentoriviä, paikallisesti prosessorillasi — sen me teimme.
Pidemmän katsauksen ilmaisen ja maksullisen kentästä saat artikkelista puhe tekstiksi Windowsissa. Valitaksesi kahden paikallisen moottorimme välillä, katso Whisper vs Parakeet.
Sanele ensimmäinen lauseesi noin minuutissa
Lataa Whisper by Remskill Windowsille, kirjaudu sisään ilman korttia, paina Ctrl + Space ja puhu. Paikallinen putki on ilmainen niin kauan kuin käytät sitä.
Ilmainen paikallinen litterointi ikuisesti. Ei maksutapaa rekisteröityessä. Pilvitaso on ainoa maksullinen ominaisuus.



