Poradnik
Głos na tekst w Coda
Coda nie ma wbudowanego dyktowania. Rozwiązaniem jest narzędzie działające w całym systemie: naciskasz skrót, mówisz, a transkrypcja wkleja się przy kursorze w dowolnym dokumencie Coda, komórce tabeli czy na kanwie. Dyktowanie wbudowane w system operacyjny też się sprawdzi przy krótkich zapisach.
Ostatnia aktualizacja: czerwiec 2026

Głos na tekst w Coda działa dzięki narzędziu obejmującemu cały system, a nie samej Coda. Coda nie ma wbudowanego dyktowania. Rozwiązaniem jest narzędzie takie jak Whisper: naciskasz skrót, mówisz, a transkrypcja wkleja się przy kursorze w dowolnym dokumencie, komórce tabeli czy na kanwie. Dyktowanie wbudowane w system operacyjny też się sprawdzi przy krótkich zapisach.
Prowadzę w Coda kilka rejestrów — dziennik lektur, tablicę projektu pobocznego z tymi zagnieżdżonymi tabelami, w których Coda jest naprawdę dobra. Jedyne, czego ciągle mi brakowało, to możliwość podyktowania wiersza do tabeli zamiast wpisywania go ręcznie. Poszedłem więc szukać ustawienia dyktowania. Nie ma ustawienia dyktowania. Coda nie ma przycisku mikrofonu, a po porządnym przekopaniu się przez dokumentację i społeczność twórców jestem pewien, że nigdzie się ono nie ukrywa.
Ludzie szukają „głos na tekst w Coda”, nic nie znajdują w aplikacji i zakładają, że przeoczyli jakiś przełącznik. Nie przeoczyli. Tego przełącznika nigdy nie zbudowano. Dobra wiadomość jest taka, że rozwiązanie zajmuje około dwóch minut, działa w pełni offline, jeśli tego chcesz, i przy okazji działa w każdej innej aplikacji, którą otworzysz.
Oto rzecz, której większość stron krążących wokół tego hasła nie powie wprost. Dokument Coda, komórka tabeli, tekst na kanwie — to wszystko po prostu pola tekstowe, takie same jak Gmail czy pasek wyszukiwania. Dyktowanie, które wkleja przy kursorze, nie obchodzi, w której aplikacji ten kursor się znajduje.
Prawdziwe pytanie nie brzmi więc „jak włączyć pisanie głosowe w Coda”. Nie ma takiego przełącznika. Pytanie brzmi „które narzędzie do dyktowania uruchomić ponad Coda”, a odpowiedź zależy od tego, czy chcesz darmowe rozszerzenie przeglądarki, dyktowanie systemu operacyjnego, czy jeden skrót działający offline, który zachowuje się tak samo w przeglądarce i w aplikacji desktopowej. Omówię to wszystko, skonfiguruję jedno w dwie minuty i powiem ci, kiedy odpuścić sobie dedykowane narzędzie.
Czy Coda ma wbudowane dyktowanie?

Nie. Coda nie ma wbudowanej funkcji zamiany mowy na tekst, dyktowania ani pisania głosowego, która pozwalałaby pisać w dokumencie głosem. Nie ma przycisku mikrofonu przy wierszu, polecenia głosowego ani ukrytej opcji. Jeśli przeczesujesz w jej poszukiwaniu ustawienia, możesz przestać. Tego tam nie ma, a społeczność twórców prosi o tę funkcję od 2021 roku i wciąż się nie pojawiła.
Istnieje za to pakiet Coda o nazwie ElevenLabs Voice AI i to właśnie tutaj ludzie się gubią. Ten pakiet działa w odwrotnym kierunku — zamienia tekst w twoim dokumencie na mówiony dźwięk. To zamiana tekstu na mowę, a nie mowy na tekst. Przydatne, jeśli chcesz, by dokument został odczytany na głos; bezużyteczne, jeśli chcesz podyktować wiersz do tabeli. Brzmią jak ta sama funkcja, a są dokładnym przeciwieństwem — i to jest właśnie taki konflikt nazewnictwa, który potrafi kosztować całe popołudnie. Wolałbym, żebyś tego popołudnia nie stracił.
Obraz rozszerzeń przeglądarki wart jest jednego akapitu, żebyś nie pognał za nim ku niewłaściwej konfiguracji. Istnieje popularne rozszerzenie do Chrome i Edge, Voice In, które dyktuje na stronach internetowych, w tym w przeglądarkowej wersji Coda. Działa, z jednym strukturalnym haczykiem: to rozszerzenie przeglądarki, więc dociera do Coda tylko wtedy, gdy Coda jest kartą przeglądarki. Otwórz aplikację desktopową Coda, a rozszerzenie jej po prostu nie widzi. Więcej o tym dwie sekcje niżej. Na razie sedno jest takie: nic wewnątrz Coda tego nie robi. Potrzebujesz narzędzia, które działa ponad nią.
Naciskasz skrót, mówisz, tekst trafia do komórki
Na tym polega cały mechanizm i jest nudny w najlepszym możliwym sensie. Naciskasz skrót, mówisz, puszczasz, a transkrypcja wkleja się przy kursorze, w którymkolwiek polu tekstowym akurat ma fokus. Whisper przytrzymuje krótką końcówkę po tym, jak puścisz klawisz, więc ostatnie słowo nie zostaje ucięte. Ponieważ wkleja przy kursorze systemu, komórka tabeli Coda to po prostu „dowolne pole tekstowe”. Karta przeglądarki czy aplikacja desktopowa — zachowanie takie samo.
To właśnie tę część strony lądowania niepotrzebnie komplikują. Nie ma pakietu do zainstalowania w Coda, nie ma tokenu API do wklejenia, nie ma automatyzacji, którą trzeba pilnować. Kursor jest w komórce, mówisz, słowa pojawiają się w komórce. Mała kapsułka pojawia się, gdy mówisz, żebyś wiedział, że narzędzie słucha:
Skrót to jedyna rzecz, którą warto od razu dobrze ustawić. W Windows to Ctrl+Space; na Macu to Command+Option, push-to-talk złożone wyłącznie z modyfikatorów, które przytrzymujesz, mówiąc. Oba można zmienić w Ustawieniach, jeśli kolidują z czymś, czego już używasz. (Moja młodsza córka powiedziała mi kiedyś, że skrót „nie działa” w jej aplikacji do rysowania. To był konflikt, nie błąd — i tak nauczyłem się, że przeciętny człowiek nie ma pojęcia, czym w ogóle jest konflikt skrótów. Dlatego teraz każdy skrót jest konfigurowalny.) Jeśli kiedykolwiek konfigurowałeś dyktowanie w Windows lub na Macu, to ta sama pamięć mięśniowa skierowana na inną aplikację.
Skonfiguruj to w dwie minuty (Windows lub Mac)
Potrzebujesz Maca z Apple Silicon albo komputera z Windows 10 lub nowszym, działającego mikrofonu i otwartej Coda — w aplikacji desktopowej lub w karcie przeglądarki. Cały lokalny proces jest darmowy dla każdego zalogowanego konta, bez pytania o metodę płatności przy rejestracji. Oto kolejność.
Krok 1 — Zainstaluj Whisper i zaloguj się.
Pobierz ze strony pobierania, zainstaluj i załóż darmowe konto. Bez karty. Cały lokalny proces transkrypcji jest dostępny od razu.
Poznasz, że się udało, gdy w zasobniku systemowym pojawi się ikona aplikacji, a kreator konfiguracji zaproponuje wybór modelu.
Krok 2 — Wybierz ścieżkę transkrypcji.
Aplikacja nie wybiera za ciebie. Masz trzy opcje: Chmura (OpenAI, własny klucz), lokalny Parakeet albo lokalny Whisper. Do codziennych notatek w Coda zacznij od lokalnej — więcej o tym dwie sekcje niżej.
Poznasz, że się udało, gdy model skończy się pobierać i pokaże się jako gotowy.
Krok 3 — Potwierdź swój skrót.
Windows domyślnie ustawia Ctrl+Space, Mac — Command+Option przytrzymywane jako push-to-talk. Na Macu udziel uprawnienia Dostępność, gdy pojawi się prośba; bez niego wklejanie przy kursorze nie dosięgnie innych aplikacji.
Poznasz, że się udało, gdy testowe nagranie wklei się w dowolne pole tekstowe.
Krok 4 — Postaw kursor w komórce Coda i mów.
Otwórz dokument, kliknij w komórkę albo w linię tekstu na kanwie, przytrzymaj skrót, wypowiedz zdanie, puść. Transkrypcja pojawia się tam, gdzie jest kursor.
Poznasz, że się udało, gdy wypowiedziane zdanie znajdzie się w komórce Coda jako tekst.
Najwolniejszą częścią jest pobieranie modelu, a nie konfiguracja. Cała reszta to powyższe cztery kroki. Gdy już działa, wypełnianie wiersza w tabeli Coda przestaje być zadaniem na pisanie, a staje się zadaniem na mówienie.
Coda w przeglądarce a aplikacja desktopowa
Coda występuje w dwóch postaciach — wersji przeglądarkowej i aplikacji desktopowej na Mac i Windows — a to, która ścieżka dyktowania zadziała, zależy od tego, której używasz. Większość stron rankujących na to hasło kieruje cię prosto do Voice In, rozszerzenia do Chrome i Edge. To dobry wybór z jednym strukturalnym ograniczeniem: to rozszerzenie przeglądarki, więc dociera do Coda tylko wtedy, gdy Coda jest kartą w tej przeglądarce. Uruchom aplikację desktopową Coda, a rozszerzenie po prostu nie widzi tego okna.
Skrót działający w całym systemie to omija. Wkleja przy kursorze systemu niezależnie od tego, które okno jest jego właścicielem, więc ten sam klawisz, który wypełnia komórkę Coda w przeglądarce, wypełnia też komórkę w aplikacji desktopowej Coda, twoje okno tworzenia wiadomości w Gmailu, wiadomość na Slacku i opis commita. Jedno narzędzie, każde pole tekstowe, zarówno przeglądarka, jak i aplikacja natywna. Niczego nie uczysz się od nowa, przełączając się, i nie potrzebujesz innego rozwiązania w zależności od tego, jak akurat dziś masz otwartą Coda.
Jeśli korzystasz z Coda wyłącznie w karcie przeglądarki i nigdy w aplikacji desktopowej, rozszerzenie jest schludną, skupioną opcją i warto się mu przyjrzeć. W chwili, gdy sięgasz po aplikację desktopową Coda albo chcesz tego samego przepływu w każdym programie, który otwierasz, wygrywa ścieżka systemowa. Ja sięgnąłbym po jeden skrót, bo przełączam aplikacje jakieś czterdzieści razy na godzinę i nie chcę pamiętać czterdziestu różnych przycisków dyktowania.
Lokalnie czy w chmurze: który tryb do twoich dokumentów
Do większości pracy w Coda spróbuj najpierw trybu lokalnego. Sporo z tego, co trafia do dokumentu Coda, to rzeczy, których wolałbyś nie przepuszczać przez logi dostawcy — plan projektu, notatka od klienta, na wpół ukształtowany pomysł w tabeli. Jeśli twój Mac to Apple Silicon albo twój komputer pochodzi z ostatnich kilku lat, tryb lokalny ogarnia codzienne dyktowanie bez narzekań, a chmura staje się wyjściem awaryjnym, a nie domyślnym.
Oto jak różnią się te trzy ścieżki, bo aplikacja każe ci wybierać, a wolałbym, żebyś wybrał dobrze:
- Lokalny Parakeet — silnik TDT od NVIDIA, około 600 MB, najszybsza opcja lokalna — od 5 do 10 razy szybszy niż Whisper na CPU. Obsługuje angielski plus 24 inne języki europejskie, 25 łącznie. Bez tłumaczenia na angielski. Jeśli pracujesz po angielsku lub w innym języku europejskim, to szybki, w pełni offline wybór.
- Lokalny Whisper — wolniejszy niż Parakeet na tej samej maszynie, ale wersje wielojęzyczne obejmują 99 języków i potrafią tłumaczyć na angielski. Wersje tylko-angielskie są tylko angielskie, nie 99. Wybierz go do chińskiego, japońskiego, koreańskiego albo jakiejkolwiek pracy z tłumaczeniem, czego Parakeet nie potrafi. Domyślny model angielski to około 480 MB.
- Chmura (OpenAI, BYOK) — najlepsza dokładność i dostęp do sieci, przy użyciu twojego własnego klucza OpenAI rozliczanego bezpośrednio przez OpenAI. Transkrypcja domyślnie działa na gpt-4o-mini-transcribe. Wymaga internetu, więc to jedyna ścieżka, która opuszcza twoją maszynę. Powierzchnia Chmury jest częścią Whisper Pro.
Nudna prawda jest taka, że dla rodzaju tekstu, jaki większość ludzi wpisuje do Coda, lokalny tryb w zupełności wystarcza. Oba silniki lokalne działają w całości na twojej maszynie, nic nie jest wysyłane na serwer. Chmura zasługuje na swoje miejsce, gdy chcesz najwyższej klasy dokładności na trudnym nagraniu albo potrzebujesz, żeby model wyciągnął fakt z sieci w połowie zdania. Do codziennego nawyku pracy z dokumentem zacznij lokalnie i sięgaj po chmurę tylko wtedy, gdy lokalny tryb zostawia cię z niedosytem.
Interpunkcja, czyszczenie i formatowanie Coda głosem
Surowe dyktowanie wychodzi jako jeden ciąg bez przerw. Mówisz „okej więc dodaj wiersz sprawdź dokument launch właściciel to ja termin czwartek status zablokowane” i to jest ta ściana bez interpunkcji, jaką podaje ci każdy silnik mowy. Uporządkowanie tego to miejsce, gdzie ścieżki się rozchodzą.
Pisanie głosowe w Windows dodaje interpunkcję, gdy mówisz, a Dyktowanie w macOS radzi sobie z podstawową interpunkcją, gdy powiesz „przecinek” albo „kropka”. Przy poważniejszym czyszczeniu — usuwaniu „yyy”, naprawianiu ciągów bez przerw, zamianie wypowiedzianego zdania w coś, co faktycznie chciałbyś zostawić w dokumencie — Whisper może uruchomić przebieg AI. Powiedz frazę aktywującą „Hey whisper”, a tekst zostaje ulepszony, zanim trafi na miejsce. Na modelu lokalnym działa to przez Ollama; w trybie chmury domyślnie jest to gpt-5-mini.
okej więc dodaj wiersz sprawdź dokument launch właściciel to ja termin czwartek yyy przed standupem
Okej, więc dodaj wiersz: sprawdź dokument launch, właściciel to ja, termin czwartek przed standupem.
Co do samej struktury Coda — budowania tabeli, ustawiania typu kolumny, dodawania opcji wyboru, pisania formuły — szczera odpowiedź jest taka, że głos daje ci tekst, a interfejs samej Coda daje ci strukturę. Podyktuj zawartość komórki, a potem zbuduj tabelę i ustaw typy kolumn tak, jak zawsze. Żadne narzędzie do dyktowania nie wyczaruje schematu tabeli Coda na zawołanie; każdy, kto obiecuje „powiedz nowa tabela z trzema kolumnami i patrz, jak się buduje”, sprzedaje ci pokaz, a nie zwykły wtorek. Szybko zrzuć słowa głosem, a dokument ukształtuj kontrolkami, które już znasz.
Ten sam przepływ mów-potem-czyść opłaca się dużo szerzej niż w twoich dokumentach — możesz też dyktować czystą prozę do dowolnej aplikacji jednym skrótem, więc długi akapit zamienia się w kilka wypowiedzianych zdań zamiast czegoś, co wystukujesz na klawiaturze.
Kiedy odpuścić sobie narzędzie do dyktowania dla Coda

Czasem właściwym narzędziem jest to darmowe, które już masz na maszynie, i udawanie, że jest inaczej, byłoby nieuczciwe. Jeśli wrzucasz do Coda tylko krótkie zapisy — szybki wiersz, dwuwyrazowy status — system operacyjny ogarnia to za darmo.
W Windows naciśnij klawisz Windows + H i otwiera się wbudowany pasek pisania głosowego tam, gdzie jest twój kursor, włącznie z komórką Coda. Sam dodaje interpunkcję i w porządku nadaje się do krótkich porcji. Haczyk: przechodzi przez serwery Microsoftu i wymaga połączenia z internetem, więc nie jest opcją offline. Na Macu Dyktowanie pozwala mówić, by wprowadzać tekst wszędzie tam, gdzie można pisać, konfigurujesz je w Ustawieniach systemowych w sekcji Klawiatura, a na Apple Silicon ogólny tekst może być przetwarzany na urządzeniu. A jeśli korzystasz z Coda wyłącznie w karcie przeglądarki, rozszerzenie Voice In to skupiona, darmowa opcja stworzona dokładnie do tego.
Sięgnij po dedykowane narzędzie działające w całym systemie, gdy wbudowane zaczynają boleć: długie notatki, praca wielojęzyczna, prywatność offline w Windows, aplikacja desktopowa Coda zamiast karty albo chęć posiadania jednego skrótu, który zachowuje się tak samo w Coda, w twojej poczcie i w twoim edytorze. Poniżej tej granicy używaj tego, co darmowe. Nie zamierzam ci mówić, żebyś instalował aplikację dla jednowierszowej aktualizacji statusu.
Ten sam kompromis pojawia się, jeśli trzymasz pracę także w innych narzędziach — logika dyktowania w Google Docs jest identyczna, bo i tam to kursor, a nie wtyczka, jest prawdziwą integracją.
Dalsza lektura
Coda nigdy nie wypuściła przycisku mikrofonu i po napisaniu tego jestem dość pewien, że nigdy tego nie zrobi. Nie musi, bo to kursor jest integracją. Mów do komórki, dostań tekst, ukształtuj dokument kontrolkami, które już znasz. Większość tego poradnika podyktowałem do pola tekstowego, które nie było Coda, narzędziem, którego nie obchodzi, jakie to pole, a potem wkleiłem całość do dokumentu. Na tym polega cała sztuczka.
Wypróbuj to w swoim następnym dokumencie Coda
Przytrzymaj skrót, mów, puść. Transkrypcja trafia do tej komórki, w której jest twój kursor — i do każdej innej aplikacji też.
Darmowy tryb lokalny dla każdego zalogowanego konta. Bez karty, by zacząć.



