Opas
Whisper Macille
"Whisper for Mac" voi tarkoittaa kahta eri asiaa. Joko avoimen lähdekoodin OpenAI Whisper -mallia, joka pyörii Macilla Pythonin ja komentorivin kautta, tai Mac-sovellusta, joka käyttää Whisperiä konepellin alla. Useimmat haluavat jälkimmäisen. He vain eivät vielä tiedä sitä.
Päivitetty viimeksi: kesäkuu 2026

Whisper for Mac on kaksi eri asiaa saman nimen takana. Itse malli on avointa lähdekoodia ja ilmainen, mutta virallinen tapa käyttää sitä vaatii Pythonia ja komentoriviä, ja se litteroi tiedostoja eikä elävää puhettasi. Jos haluat painaa pikanäppäintä ja saada sanasi mihin tahansa Mac-sovellukseen, tarvitset sanelusovelluksen, kuten Whisper by Remskillin, jonka koko paikallinen ketju on ilmainen kaikille kirjautuneille käyttäjille.
Whisper on malli, ei Mac-sovellus
Selvitetään ensin nimet, koska hakutulokset sekoittavat ne keskenään.
Whisper on OpenAI:n avoimen lähdekoodin puheentunnistusmalli, julkaistu MIT-lisenssillä. Malli on ilmainen. Koodi on ilmainen. Voit ladata painot ja ajaa ne omalla koneellasi ilman tiliä. Tämä osa on aidosti "Whisper for Mac" kirjaimellisessa mielessä.
Mutkana on se, miten sitä ajetaan. Virallinen OpenAI Whisper on Python- ja komentorivityökalu. Asennat sen pip:llä, tarvitset lisäksi ffmpeg-komentorivityökalun, ja sitten osoitat sen äänitiedostoon. Se litteroi äänitteitä: audio.mp3, audio.wav, sen tyyppisiä. Se ei kirjoita elävää puhettasi Mailiin tai Slackiin. Se muuttaa jo olemassa olevan tiedoston tekstiksi.
Mallikokoja on kuusi (tiny, base, small, medium, large ja turbo), joista neljällä on pelkästään englanninkieliset variantit, jotka vaihtavat tarkkuuden nopeuteen. Whisper on monikielinen ja osaa kääntää puheen englanniksi yhdellä asetuksella. Hyvä malli. Tylsä totuus on, ettei malli koskaan ollut vaikein osa. Sen kytkeminen siihen, miten oikeasti työskentelet Macilla, on.
Mac-työkalut, jotka käärivät Whisperin, ja mihin kukin niistä on
Useimmat "Whisper for Mac" -hakijat eivät halua koskea pip:iin. He haluavat sovelluksen. Hyviä on useita, eivätkä ne ole keskenään vaihdettavissa. Ne jakautuvat kahteen leiriin.
Leiri yksi: litteroi tiedostoja
whisper.cpp on Whisperin yksinkertainen C/C++-portti, MIT-lisensoitu, ja se on ensiluokkainen kansalainen Apple Siliconilla, optimoitu ARM NEON:lla, Accelerate-kehyksellä, Metalilla ja Core ML:llä. Se pyörii pelkällä prosessorilla, käännät sen lähdekoodista ja ohjaat sitä komentoriviltä. Jos viihdyt terminaalissa ja haluat raakaa, nopeaa, paikallista tiedostojen litterointia, se on erinomainen. MacWhisper antaa tästä ideasta graafisen version. Se litteroi ääni- ja videotiedostot laitteella käyttäen OpenAI Whisperiä ja NVIDIA Parakeetia, eikä mikään data poistu koneeltasi, sekä koko järjestelmän laajuisen saneluominaisuuden. Jos työsi on muuttaa äänitteet litteroinneiksi, tämä leiri on oikea.
Leiri kaksi: kirjoita elävä puheesi
Tämä on sanelua. Painat pikanäppäintä, puhut, ja teksti ilmestyy kohdistimeesi siinä sovelluksessa, joka on aktiivisena. VoiceInk kuuluu tänne. Se on avointa lähdekoodia GPL-3.0-lisenssillä, ajaa paikallisia malleja Apple Neural Enginellä, mukaan lukien Parakeet v3, ja liittää tekstin kohdistimeen push-to-talk-pikanäppäimellä. Se vaatii Apple Siliconin ja macOS 14.4:n tai uudemman. superwhisper on myös täällä, tarjoten elävän sanelun ja tiedostojen litteroinnin, paikallisesti tai pilvessä, Macilla, Windowsilla ja iOS:llä.
Whisper by Remskill, sovellus jota rakennan, kuuluu leiriin kaksi. Sanelu edellä. Kannattaa tietää, kummassa leirissä olet, ennen kuin lataat mitään.
Mitä Whisper by Remskill tekee Macilla
Kuvailen rakentamani jutun, niin voit verrata sitä muihin.
Se on sanelusovellus. Painat pikanäppäintä, puhut, ja teksti laskeutuu kohdistimeesi missä tahansa sovelluksessa: Mail, Notes, Slack, koodieditorisi, se kenttä johon kirjoitat tämän vuoden koulun lupalappua. Macilla oletuspikanäppäin on Command ja Option yhtä aikaa pohjassa, ja se on täysin muokattavissa. Kaikki litterointi tapahtuu Macilläsi. Ei ladattavaa tiedostoa, ei hallittavaa äänitettä.
Et myöskään aja Pythonia. Ei pip:iä, ei ffmpegiä, ei terminaalia, ei näytönohjainta. Koko homma on puhdasta Rustia. Whisper- ja Parakeet-moottorit pyörivät transcribe-rs-nimisen kirjaston kautta, ilman mukaan paketoitua Python-sivuprosessia. Paikallinen litterointi pyörii prosessorillasi, erillistä näytönohjainta ei tarvita, ja sovellus vie levyltä noin 25 MB.
Itse mallin valitset itse. Paikallinen Whisper antaa sinulle 8 mallia, 99 kieltä, englanniksi kääntämisen, oman sanaston, beam-koon hallinnan ja avainsanapainotuksen. Hitaampi, mutta eniten hallintaa. Parakeet on NVIDIA TDT -moottori, noin 600 MB, ja se pyörii 5–10 kertaa nopeammin kuin Whisper prosessorilla, kattaen englannin plus 24 muuta eurooppalaista kieltä, ilman englanniksi kääntämistä. Pilvitila on kolmas polku: tuot oman OpenAI-avaimesi, emmekä ota siitä siivua. En tarkoituksella valitse puolestasi. Erot on eritelty artikkelissa Whisper vs Parakeet, jos haluat pitkän version.
Paikallinen tarkkuus asettuu tyypillisesti 95 %:n ja 99 %:n välille. Koko paikallinen ketju on ilmainen kaikille kirjautuneille käyttäjille: Whisper, Parakeet, offline-AI-siivous Ollaman kautta, litterointihistoria, esiasetukset, avainsanat, laitteistokiihdytys, mallien lataukset ja oma pikanäppäin. Ei maksutapaa rekisteröityessä. Voit käyttää sitä enintään 3 laitteella. Maksullinen taso, Whisper Pro, lisää vain pilvipinnan: OpenAI-pilvilitteroinnin, pilvi-AI-siivouksen ja verkkohaun. Hinnat löytyvät hinnoittelusivulta. En lainaa tässä lukuja, koska hinnoittelusivut muuttuvat ja sinun kannattaa lukea ne suoraan lähteestä.
Yksi rehellinen rajoitus: Mac-versiomme toimii vain Apple Siliconilla, M1:stä M4:ään. Jos sinulla on Intel-Mac, tämä sovellus ei ole sinua varten, ja kerron kohta, mikä on.
Tältä ensimmäinen saneluksesi oikeasti näyttää. Painat pikanäppäintä, pieni nauhoitusilmaisin ilmestyy, puhut, vapautat, ja siistitty teksti tipahtaa siihen, missä kohdistimesi oli. Alla oleva overlay on aito asia, jonka sovellus näyttää, ei mallinnus.
Käyttöönotto on lyhyt. Lataa sovellus, kirjaudu sisään ja anna sen hakea yksi malli. Parakeet on pienin, noin 600 MB, tai Whisper-malli, jos haluat kieliä tai kääntämistä. Valitse pikanäppäimesi tai pidä Command ja Option. Avaa sitten Mail, pidä pikanäppäin pohjassa ja sano lause. Siinä koko käyttöönotto. Nuorempi tyttäreni teki sen kysymättä minulta yhtäkään lisäkysymystä, mikä on ainoa käytettävyystesti, johon täysin luotan. Jos haluat pidemmän, kuvakaappaus kuvakaappaukselta -läpikäynnin kaikilla kolmella mallipolulla, kirjoitin oman oppaan: puhe tekstiksi Macilla.
Miksi pidän sen paikallisena Macilla
Tässä yksi vahva mielipiteeni tähän artikkeliin: pelkkä pilvisanelu on yksityisyyskatastrofi.
Esimiehesi palkkataulukko, sähköposti lapsesi kouluun, oikeudellinen lausunto jota laadit junassa. Minkään niistä ei pitäisi kulkea palveluntarjoajan palvelinten kautta vain siksi, että halusit kirjoittaa äänelläsi. Macissäsi on jo mikrofoni ja prosessori. Yhtä sanelun kappaletta varten se ei tarvitse palvelinta väliin. Paikallisilla moottoreilla ääni ei koskaan poistu koneeltasi. Sen oletuksen valitsisin itse, ja se on ilmainen.
Pilvitila on olemassa niitä hetkiä varten, kun oikeasti haluat uusimmat OpenAI-mallit tai verkkovastaukset, omalla avaimellasi. Se on varauloskäynti, ei pääovi.
Milloin MacWhisper, VoiceInk tai komentorivi on parempi valinta
Olisin huono opas, jos teeskentelisin, että yksi sovellus voittaa joka tilanteessa. Ei se voita. Tässä on tilanteet, joihin ohjaisin sinut muualle.
Litteroit pääasiassa äänitteitä
Jos päiväsi kuluu syöttäen podcast-jaksoja, haastattelunauhoituksia tai kokoustallenteita litteroinniksi, tarvitset tiedostojen litterointityökalun, et sanelusovellusta. MacWhisper on rakennettu juuri siihen: raahaa tiedosto sisään, saat tekstin ulos, laitteella. Käytä sitä. Me emme tee tiedostojen latausta. Me kirjoitamme elävän puheesi.
Haluat raakaa, skriptattavaa, ilmaista, ja elät terminaalissa
Silloin whisper.cpp on vastaus. Se on MIT-lisensoitu, Apple Siliconille optimoitu, pelkällä prosessorilla toimiva, ja voit putkittaa sen mihin tahansa. Jos olet sellainen ihminen, joka nauttii lähdekoodista kääntämisestä, olet siellä onnellisempi kuin missään graafisessa käyttöliittymässä.
Haluat täysin avoimen lähdekoodin sanelun ja olet Apple Siliconilla
VoiceInk on GPL-3.0, voit lukea tai auditoida jokaisen rivin, ja se liittää tekstin kohdistimeen kuten mekin. Se on vankka ilmainen vaihtoehto. Me olemme hallinnoitu sovellus, jossa on tilit, historia, pilven BYOK ja Windows-tuki, emmekä ole avointa lähdekoodia. Joten jos avoin lähdekoodi on ehdoton vaatimus, se on sinun valintasi, ja VoiceInk on hyvä sellainen.
Olet Intel-Macilla
Sovelluksemme ei käynnisty. Avoimen lähdekoodin whisper.cpp osaa kääntyä ja toimia Intelillä, ja Applen oma sisäänrakennettu Dictation on ilmainen lyhyisiin muistiinpanoihin. Kumpi tahansa voittaa Apple Silicon -koneen odottelun, jota et ole vielä ostanut.
Jos muistat vain yhden asian
Malli on ilmainen ja avoin. Merkitsevä päätös on se, mitä kääräit sen ympärille: terminaalin, tiedostolitteroinnin graafisen käyttöliittymän vai pikanäppäimen, joka kirjoittaa elävän puheesi siihen, mitä katsotkin. Sovita kääre tehtävään, ja Macilla unohda Python, ellet aidosti nauti siitä. Whisperiä Macilta etsii kolmenlaisia ihmisiä: ne joilla on kansiollinen äänitteitä, ne jotka eivät halua koskaan enää kirjoittaa, ja ne jotka vain pitivät nimestä. Kaksi heistä on väärässä leirissä, kunnes ovat lukeneet tänne asti.
Sanelin suurimman osan tästä artikkelista sen sijaan, että olisin kirjoittanut sen, mikä tuntui sopivalta. Siinä yhdessä kappaleessa, jonka kirjoitin käsin, oli enemmän kirjoitusvirheitä.
Lisälukemista
Kokeile sitä Macilläsi
Lataa Whisper by Remskill, kirjaudu sisään ja sanele ensimmäinen lauseesi Macilläsi. Paikallinen taso on ilmainen, ja voit päättää myöhemmin, tarvitsetko koskaan pilveä.
Ilmainen paikallinen litterointi ikuisesti. Ei maksutapaa rekisteröityessä. Vain Apple Silicon.



