Opas
Puheesta tekstiksi GitHubissa: näin se oikeasti toimii
GitHubissa ei ole omaa sanelua — sen issue-, PR-, kommentti- ja markdown-kentät ovat tavallisia tekstikenttiä verkossa. Järjestelmänlaajuinen pikanäppäinsovellus pitää näppäintä pohjassa, litteroi puheesi ja liittää sen siihen kenttään, joka sinulla on aktiivisena.
Päivitetty viimeksi: kesäkuu 2026

Puheesta tekstiksi GitHubissa tarkoittaa proosan sanelemista GitHubin tekstikenttiin järjestelmänlaajuisella pikanäppäinsovelluksella, sillä GitHubissa ei ole omaa sisäänrakennettua sanelua. Sen issue-, pull request-, kommentti- ja markdown-kentät ovat tavallisia tekstikenttiä. Whisperin kaltainen työkalu pitää pikanäppäintä pohjassa, litteroi puheesi ja liittää sen kohdistimen kohdalle — siihen issueen, PR:ään tai arviointimerkintään, joka sinulla on aktiivisena.
Vietin viime vuonna viikon vakuuttuneena siitä, että GitHub oli hiljaa lisännyt jonnekin issue-editoriin puhepainikkeen. Ei ollut. Issuen runko on tekstikenttä. PR:n kuvaus on tekstikenttä. Arviointikommentti, Discussions-kenttä, README-editori — kaikki ovat tekstikenttiä, samanlaisia kuin yhteydenottolomakkeessa. Mitään mikrofonikuvaketta ei piileskele valikossa. Tylsä totuus on, että koodisi ympärille GitHubiin kirjoittamasi teksti on pelkkää tekstinsyöttöä, ja mikä tahansa kunnollinen saneluohjelma osaa täyttää sen.
Se on hyvä uutinen, koska se tarkoittaa, ettet odota GitHubin rakentavan ominaisuutta. Tuot oman äänikerroksesi mukanasi. Windowsilla tai Macilla Whisper toimii käyttöjärjestelmän tasolla, joten sama pikanäppäin toimii issue-editorissa, PR:n kuvauksessa, koodiarvioinnin keskustelussa, kehitysympäristössäsi ja Slackissa — kaikkialla, missä kohdistin vilkkuu. Klikkaat kenttää, pidät näppäintä pohjassa, puhut ja vapautat. Yksi tärkeä varaus heti alkuun, ja toistan sen vielä monta kertaa: tämä on proosaa varten, ei koodia.
GitHubissa ei ole puhekirjoitusta. Pikanäppäin tekee työn.

Vastataan kysymykseen, jonka ihmiset oikeasti kirjoittavat Googleen. Ei, GitHubissa ei ole sisäänrakennettua puheesta tekstiksi -toimintoa. Issue-editorissa, PR-lomakkeessa, arviointipaneelissa, Discussionsissa tai wikissä ei ole omaa sanelua. Ne ovat tavallisia tekstikenttiä verkossa. Niihin sanellaksesi äänen on tultava jostain muualta: käyttöjärjestelmästäsi, selaimestasi tai kolmannen osapuolen sovelluksesta.
GitHub ei koskaan estä sanelua. Se ei vain tarjoa sitä itse. Vaihtoehtoja on suurin piirtein kolme. Käyttöjärjestelmässäsi on sisäänrakennettu sanelu — Windowsin puhekirjoitus näppäimillä Win+H tai macOS:n Sanelu. Voice In -tyyppinen selainlaajennus voi kirjoittaa Chrome- tai Edge-välilehdelle. Tai Whisperin kaltainen järjestelmänlaajuinen työpöytäsovellus sanelee mihin tahansa kenttään missä tahansa sovelluksessa, selaimessa tai sen ulkopuolella.
Näiden kolmen ero on ulottuvuus. Käyttöjärjestelmän sanelu on ilmainen ja toimii yhdellä alustalla kerrallaan, ja laatu vaihtelee. Selainlaajennus elää vain välilehden sisällä — se ei voi seurata sinua kehitysympäristöösi tai GitHubin komentoriville, ja se toimii pilvessä. Whisperin kaltaista työpöytäsovellusta ei ole sidottu välilehteen; koska se toimii käyttöjärjestelmän tasolla, se sanelee GitHubiin Chromessa, Firefoxissa, Safarissa tai Edgessä — ja myös commit-viestiin GitHub Desktopissa.
Mitä voit oikeasti sanella (ja se yksi asia, jota et)
Tässä on raja, jonka yli en anna sinun vahingossa astua. Whisper sanelee koodisi ympärille kirjoitettavan tekstin. Se ei kirjoita itse koodia.
Se kattaa rehellisesti sanottuna suurimman osan kehittäjän kirjoituspäivästä. Issue-raportit. Pull request -kuvaukset. Koodiarviointimerkinnät. Discussions-vastaukset. README- ja markdown-dokumentit. Proosan, joka selittää muutoksen — ei itse muutosta. Kun puhut kappaleen siitä, miksi migraatio on riskialtis, Whisper hoitaa sen hienosti. Kun yrität sanella itse migraation, edessäsi on ikävä iltapäivä.
Syy on yksinkertainen. Puhuttu koodi ei selviä matkasta. Funktioiden nimet, JSON, snake_case versus camelCase, kubectl-lippu, API-polku — ne tulevat ulos parhaan kyvyn mukaan englanniksi ja vaativat käsin korjaamista. Puhemalli kuulee "user underscore I D" ja kirjoittaa "user ID", ja nyt sinä korjaat sitä. Sanele siis lause, joka sanoo "tämä PR korjaa null-tarkistuksen autentikoinnin middlewaressa", ja kirjoita sitten itse tunniste. Useimmat issue- ja PR-rungot ovat joka tapauksessa 80-prosenttisesti selitystä ja 20-prosenttisesti koodinpätkää. Sanele se 80, kirjoita se 20.
Paina pikanäppäintä, puhu, saat tekstiä aktiiviseen kenttään
Mekaniikka on sama, jota käyttäisit missä tahansa muussa sovelluksessa — siinä koko pointti. Klikkaa GitHub-kenttään, jonka haluat täyttää. Pidä pikanäppäintä pohjassa. Puhu. Vapauta. Litterointi ilmestyy kohdistimen kohdalle.
Oletuspikanäppäin on Ctrl+Space Windowsissa ja Command+Option macOS:llä. Molemmat ovat pidä-ja-puhu-tyyppisiä: pidä pohjassa puhuessasi, vapauta lopettaaksesi. Voit vaihtaa niitä asetuksissa, jos ne menevät päällekkäin jonkin kanssa — ja jos olet koskaan kamppaillut pikanäppäinten ristiriitojen kanssa, tiedät, miksi tuo asetus ansaitsi paikkansa (lisää tästä alempana).
Yksi rehellinen yksityiskohta laajuudesta. Whisper liittää tekstin siihen yhteen kenttään, joka sinulla on aktiivisena, yksi kerrallaan. Se ei täytä koko GitHub-issuelomaketta yhdellä henkäyksellä. Uuden issuen kulku on siis: klikkaa otsikko, sanele se, klikkaa runko, sanele se. Kaksi kenttää, kaksi painallusta. Se tuntuu vähemmän taikuudelta ja enemmän nopealta konekirjoittajalta, joka ei koskaan koske näppäimistöön. Se on oikea ajatusmalli.
Koko sovellus, livenä
Tämä on itse sovellus, käynnissä juuri tässä — ei kuvakaappaus. Tutki vapaasti. Asetukset, pikanäppäinvalitsin ja mallivaihtoehdot ovat aitoja.
Pari asiaa, jotka kannattaa tietää klikkaillessasi. GitHubille ei ole omaa välilehteä eikä "GitHub-tilaa", koska sellaista ei tarvita. Whisperille GitHubin PR-kuvaus on tekstikenttä siinä missä mikä tahansa muukin. Sama kokoonpano, joka sanelee issue-editoriin, sanelee sähköpostiisi ja kehitysympäristöösi. Määrität sen kerran. Ulottuvuus on se ominaisuus.
Missä siitä on hyötyä: issuet, PR-kuvaukset, arvioinnit, keskustelut
Hyöty on siinä tylsässä, toistuvassa kirjoittamisessa — siinä, jonka lykkäät, koska sen kirjoittaminen on raataa.
Issuet. Hyvä virheraportti on enimmäkseen kerrontaa: mitä teit, mitä odotit, mitä tapahtui sen sijaan. Se on sanelun kotikenttää. Puhu uudelleentoiston vaiheet läpi niin kuin selittäisit ne kollegalle pöytäsi ääressä, ja liitä sitten kutsupino käsin.
Pull request -kuvaukset. Se PR-runko, jonka kirjoittamisen kaikki ohittavat, koska diff "puhuu puolestaan" (ei se puhu). Sanele miksi — se konteksti, jonka arvioija tarvitsee — ja anna diffin puhua puolestaan siitä mitä.
Koodiarvioinnit. Arviointikommenteissa sävy ratkaisee ja ihmiset selittävät liian vähän. Arviointimerkinnän puhuminen tulee yleensä inhimillisemmin ja täydellisemmin kuin sen kirjoittaminen palaverien välissä. Kirjoitat "tämä toimii, mutta se hajoaa kun lista on tyhjä" sen sijaan, että vain "reunatapaus?".
Keskustelut ja dokumentit. Pitkä proosa, joka on juuri sitä missä ääni on hyvä ja juuri sitä mitä kukaan ei halua kirjoittaa. README-johdanto, Discussions-vastaus, migraatio-opas — sanele luonnos, siisti markdown jälkeenpäin. Sama logiikka pätee saneluun Jira-tiketteihin ja muihin seurantajärjestelmiin; GitHub on vain yksi kenttä lisää pinossa.
Siisti sanelu automaattisesti
Raa'assa sanelussa on täytettä. "Öö", "niinku", se lause, jonka aloitit kahdesti. Whisperissä on valinnainen tekoälysiivousajo, joka korjaa täytesanat, välimerkit ja kirjainkoon, jotta issue tai PR lukeutuu kuin olisit kirjoittanut sen huolella.
Vaihtoehtoja on kaksi makua. Ilmaisessa paikallisessa tasossa siivous ajetaan koneellasi Ollaman kautta. Pro-tasossa tuot oman OpenAI-avaimesi, ja siivous ajetaan pilvessä, ja myös verkkovastaukset ovat käytettävissä. Kummin tahansa se on valinnainen — sammuta se ja saat raa'an litteroinnin. Pidän sen päällä PR-kuvauksissa ja pois pikakommenteissa, koska pikakommentti ei tarvitse editointia ja PR-kuvaus tarvitsee.
Yksi asia, jota siivous ei tee, on puhutun koodin pelastaminen. Se kiillottaa englannin. Se ei tiedä, että tarkoitit getUserById kun sanoit "get user by I D". Jatka proosan sanelua; jatka tunnisteiden kirjoittamista.
Offline ja yksityinen: paikallisessa tilassa mikään ei lähde koneeltasi

Jos sanelet issueita ja PR:iä koodista, joka ei ole julkista, äänen päämäärällä on väliä. Whisperin paikallisessa tilassa litterointi tapahtuu kokonaan koneellasi. Mikään puhumastasi ei lähde pilvipalveluun. Internetiä ei tarvita litteroinnin aikana lainkaan — ainoa kerta, jolloin menet verkkoon, on kertaluonteinen mallin lataus, joka on noin 140 megatavusta 3 gigatavuun valitsemastasi mallista riippuen.
Tämä on se yksi paikka, jossa annan sinulle todellisen mielipiteen. Pelkästään pilvessä toimiva sanelu on tietosuojakatastrofi, joka odottaa litteroitumistaan. Näin kerran sisäisen tiimin keräävän viisinumeroisen pilvilaskun yhdessä neljänneksessä, koska kotitekoinen saneluprototyyppi lähetti jokaisen lausahduksen rajapintaan — ja pahempaa kuin lasku oli se, että kaikkien puhutut muistiinpanot julkaisemattomasta tuotteesta asuivat nyt toimittajan lokeissa. Pomosi palkkataulukko, tietoturvaongelma, jonka kirjaat yksityisesti, omistusoikeudellinen arkkitehtuuri, jota kuvailet PR:ssä — mikään niistä ei saisi lähteä kannettavaltasi vain siksi, että halusit kirjoittaa kappaleen äänelläsi. Koneessasi on jo mikrofoni ja prosessori. Yhtä kappaletta varten siihen ei tarvita palvelinta mukaan. Jos työkalusi toimii vain pilvessä, sen korjaisin ensimmäisenä.
Mihin se ei ole tarkoitettu (koodin kirjoittamiseen)

Saatoit tulla tänne etsimään tapaa kirjoittaa koodia äänellä, tai muistat "Hey, GitHub!" -toiminnon ja ihmettelet, minne se katosi. Kaksi rehellistä vastausta.
"Hey, GitHub!" ja GitHub Copilot Voice olivat GitHub Nextin tekninen esikatselu. GitHub lopetti esikatselun vuonna 2024. Siitä ei koskaan tullut tuotetta; opit valuivat VS Code Speech -laajennukseen. Joten jos blogikirjoitus käskee sinua ottamaan "Hey GitHub" -toiminnon käyttöön tänään, se on pari vuotta vanhentunut.
Äänellä-koodaamisen kaista on yhä olemassa — se vain elää editorissasi ja terminaalissasi, ei github.comissa. VS Code Speech -laajennuksen (kutsutaan joskus nimellä "Hey Code") avulla voit puhua editorille ja Copilot Chatille koodia ja komentoja varten. Ja GitHub Copilot CLI lisäsi äskettäin paikallisen äänisyötteen, joka ohjaa Copilot-agenttia terminaalissa. Molemmat ovat koodin ja tekoälyagentin ohjaamiseen. Kumpikaan ei sanele proosaa GitHub-issueen selaimessasi. Se on eri kaista, ja se on se, jonka Whisper omistaa: koodin ympärille kirjoittaminen.
Milloin kannattaa jättää Whisper väliin GitHub-työnkulussasi
Käytät mieluummin oikeaa työkalua kuin sitä, jonka minä teen. Joten tässä, milloin kannattaa jättää Whisper väliin.
Jos haluat oikeasti ohjata Copilotia tai editoriasi äänellä — "korjaa tämä funktio", "aja testit", "selitä tämä lohko" — se on koodin/agentin kaista, ei proosaa. Käytä sen sijaan VS Code Speech -laajennusta tai GitHub Copilot CLI:n äänisyötettä. Ne puhuvat koneelle; Whisper kirjoittaa sanat, jotka ihminen lukee.
Jos sanelet vain satunnaisen yksirivisen kommentin silloin tällöin, käyttöjärjestelmäsi tekee sen jo ilmaiseksi. Paina Win+H Windowsissa tai ota Sanelu käyttöön macOS:llä, niin voit pudottaa pikalauseen GitHub-kenttään ilman asennettavaa. Whisper alkaa ansaita paikkansa, kun kirjoitat oikeita kappaleita monissa sovelluksissa, haluat sen toimivan offline-tilassa tai haluat yhden pikanäppäimen kaikkialle sen sijaan, että käyttöjärjestelmän ominaisuus kattaa vain osan kentistä. Sen rajan alapuolella sisäänrakennettu vaihtoehto on ihan kelpo, enkä esitä muuta.
Ilmainen paikallinen, Pro pilveä varten
Paikallinen putki — litterointi, laitteella tapahtuva tekoälysiivous, pikanäppäin, kaikki mitä tarvitset GitHubiin saneluun — on ilmainen kirjautuneille käyttäjille, eikä korttia vaadita rekisteröityessä. Asennat sen, kirjaudut sisään ja alat sanella.
Whisper Pro lisää pilvipinnan: OpenAI-pilvilitteroinnin, pilvitekoälysiivouksen omalla avaimellasi ja verkkovastaukset, ja tälle tasolle kuuluu lyhyt kokeilujakso. Issueiden ja PR:ien saneluun ilmainen paikallinen taso kattaa koko homman. Pro:n numerot löytyvät hinnoittelusivulta; en aio lainata niitä sinulle kesken kappaleen.
Vielä yksi asia siitä pikanäppäimestä
Sananen siitä, miksi pikanäppäin on muokattavissa, koska se sitoo koko homman yhteen. Whisperin ensimmäinen versio laukaisi nauhoituksen pysäytyksen kuusi kertaa näppäinpainallusta kohti tietyillä Windows-koneilla — haamuvapautustapahtumia syöttökehyksestä, sellaista mikä toimii puhtaalla asennuksella ja hajoaa oikealla. Se vaati 300 ms:n viiveen ja enemmän aikaa kuin tahdon myöntää, jotta sen sai luotettavaksi. Opin Windowsin syötteen käsittelystä enemmän kuin koskaan halusin. Opetus jäi mieleen: pikanäppäimen on taivuttava koneesi mukaan, ei toisin päin. Klikkaa kenttään, pidä näppäintä pohjassa, puhu. Koodin kirjoitat yhä itse — ja minusta se on rehellinen versio sopimuksesta.
Sanele seuraava GitHub-issuesi
Klikkaa kenttään, pidä näppäintä pohjassa, puhu, vapauta. Litterointi laskeutuu sinne, missä kohdistimesi on — issue-editoriin, PR-kuvaukseen ja jokaiseen muuhunkin sovellukseen.
Ilmainen paikallinen tila mille tahansa kirjautuneelle tilille. Aloittamiseen ei tarvita korttia.



