Poradnik
Zamiana mowy na tekst w Airtable
Airtable nie ma wbudowanego dyktowania ani w aplikacji desktopowej, ani w przeglądarce, ani w aplikacji mobilnej. Rozwiązaniem jest narzędzie działające w całym systemie: naciskasz skrót klawiszowy, mówisz, a transkrypcja wkleja się w miejscu kursora w dowolnej komórce Airtable, polu długiego tekstu czy komentarzu. Dyktowanie wbudowane w system operacyjny też się sprawdza, do krótkich zapisów.
Ostatnia aktualizacja: czerwiec 2026

Zamiana mowy na tekst w Airtable działa dzięki narzędziu obejmującemu cały system, a nie samemu Airtable. Airtable nie ma wbudowanego dyktowania ani w przeglądarce, ani w aplikacji desktopowej, ani na telefonie. Rozwiązaniem jest narzędzie takie jak Whisper: naciskasz skrót klawiszowy, mówisz, a transkrypcja wkleja się w miejscu kursora w dowolnej komórce, polu długiego tekstu czy komentarzu. Dyktowanie wbudowane w system operacyjny też się sprawdza, do krótkich wpisów.
Prowadzę bazę, która śledzi każde wydanie aplikacji — wiersz na wersję, pole długiego tekstu na listę zmian, wątek komentarzy, w którym kłócę się sam ze sobą o zakres prac. Przez bardzo długi czas wpisywałem to wszystko ręcznie. Aż w końcu zacząłem szukać przycisku mikrofonu przy polu długiego tekstu, bo przecież narzędzie tak dobre w porządkowaniu danych na pewno pozwala mówić do niego. Przycisku mikrofonu nie ma. Po dłuższych poszukiwaniach jestem pewien, że Airtable wcale go nie ukrywa.
Ludzie szukają "zamiany mowy na tekst w Airtable", nic w aplikacji nie znajdują i zakładają, że przeoczyli jakiś przełącznik. Nie przeoczyli. Tego przełącznika nigdy nie zbudowano. Dobra wiadomość jest taka, że rozwiązanie zajmuje około dwóch minut, w razie potrzeby działa całkowicie offline, a w bonusie sprawdza się w każdej innej otwieranej przez ciebie aplikacji.
Oto rzecz, której większość stron krążących wokół tego hasła nie powie wprost. Komórka w Airtable to po prostu pole tekstowe, takie samo jak w Gmailu czy pasku wyszukiwania. Pole długiego tekstu i komentarz do rekordu to większe pola tekstowe. Dyktowanie, które wkleja w miejscu kursora, nie obchodzi, w którym polu ten kursor się znajduje.
Więc prawdziwe pytanie nie brzmi "jak włączyć dyktowanie w Airtable". Nie ma takiego przełącznika. Pytanie brzmi "które narzędzie do dyktowania uruchomić na wierzchu Airtable", a odpowiedź zależy od tego, czy chcesz coś darmowego i wbudowanego, działającego tylko w przeglądarce, czy jeden skrót klawiszowy działający offline, który wszędzie zachowuje się tak samo. Przejdę przez to wszystko, skonfiguruję narzędzie w dwie minuty i powiem, kiedy z dedykowanej drogi można zrezygnować.
Czy Airtable ma wbudowane dyktowanie?

Nie. Airtable nie ma żadnej wbudowanej funkcji zamiany mowy na tekst, dyktowania ani wpisywania głosem do komórki, pola długiego tekstu czy komentarza. Ani w przeglądarce, ani w aplikacji desktopowej, ani na telefonie. Nie ma przycisku mikrofonu przy polu, nie ma polecenia głosowego, nie ma ukrytego ustawienia. Jeśli przeczesujesz Ustawienia w jego poszukiwaniu, możesz przestać. Nie ma go tam.
Co istnieje, to transkrypcja nagrań audio i właśnie tu ludzie się gubią. Możesz wgrać plik audio do pola załącznika i przepuścić go przez Airtable AI lub automatyzację, żeby otrzymać transkrypcję. To przydatne, ale to nie jest dyktowanie na żywo. Nie możesz postawić kursora w komórce, mówić i patrzeć, jak słowa się pojawiają. Te procesy obrabiają nagrany plik po fakcie; nie piszą za ciebie, gdy myślisz. Pomylenie tych dwóch rzeczy kosztuje popołudnie spędzone na budowaniu automatyzacji, która rozwiązuje zupełnie inny problem — i wolałbym, żebyś sobie to popołudnie darował.
Nawet narzędzia firm trzecich zbudowane wokół tego mówią to wprost. Rozszerzenia przeglądarki i aplikacje do dyktowania, które wyświetlają się na hasło "wpisywanie głosem w Airtable", zaczynają od stwierdzenia, że Airtable nie ma natywnego wprowadzania głosowego, po czym proponują doczepić je z zewnątrz. Mają rację co do diagnozy. W aplikacji desktopowej i w siatce w przeglądarce, w której większość ludzi faktycznie żyje, potrzebujesz narzędzia działającego na wierzchu Airtable. Są trzy uczciwe kategorie i reszta tego przewodnika je opisuje.
Naciskasz skrót, mówisz, tekst ląduje w komórce
To cały mechanizm i jest nudny w najlepszym możliwym sensie. Naciskasz skrót klawiszowy, mówisz, puszczasz, a transkrypcja wkleja się w miejscu kursora, w dowolnym polu tekstowym, które ma fokus. Whisper przytrzymuje krótką końcówkę po tym, jak puścisz klawisz, więc ostatnie słowo się nie ucina. Ponieważ wkleja w miejscu kursora systemowego, komórka Airtable to po prostu "dowolne pole tekstowe". Aplikacja desktopowa czy wersja w przeglądarce — działa tak samo.
To właśnie tę część strony reklamowe niepotrzebnie komplikują. Nie ma żadnej integracji z Airtable do autoryzacji, klucza API do wklejenia, automatyzacji do pilnowania. Kursor jest w komórce, mówisz, słowa pojawiają się w komórce. Mała kapsułka pojawia się, gdy mówisz, więc wiesz, że narzędzie nasłuchuje:
Skrót klawiszowy to jedna rzecz, którą warto od razu ustawić dobrze. W Windows to Ctrl+Space; na Macu to Command+Option, tryb push-to-talk oparty na samym modyfikatorze, który przytrzymujesz podczas mówienia. Oba można zmienić w Ustawieniach, jeśli kolidują z czymś, czego już używasz. (Moja młodsza córka powiedziała mi kiedyś, że skrót "nie działa" w jej aplikacji do rysowania. To był konflikt, a nie błąd — i tak nauczyłem się, że przeciętna osoba w ogóle nie wie, czym jest konflikt skrótów klawiszowych. Więc teraz każdy skrót da się dostosować.) Jeśli kiedykolwiek konfigurowałeś dyktowanie w Windows lub na Macu, to ta sama pamięć mięśniowa skierowana na inną aplikację.
Skonfiguruj to w dwie minuty (Windows lub Mac)
Potrzebujesz Maca na Apple Silicon albo komputera z Windows 10 lub nowszym, działającego mikrofonu i otwartego Airtable — w aplikacji desktopowej lub w przeglądarce. Cały lokalny proces jest darmowy dla każdego zalogowanego konta, bez podawania metody płatności przy rejestracji. Oto kolejność.
Krok 1 — Zainstaluj Whisper i zaloguj się.
Pobierz ze strony pobierania, zainstaluj i załóż darmowe konto. Bez karty. Cały lokalny proces transkrypcji otwiera się od razu.
Poznasz, że się udało, gdy w zasobniku systemowym pojawi się ikona aplikacji, a kreator konfiguracji zaproponuje wybór modelu.
Krok 2 — Wybierz ścieżkę transkrypcji.
Aplikacja nie wybiera za ciebie. Masz trzy opcje: Chmura (OpenAI, własny klucz), lokalny Parakeet lub lokalny Whisper. Do codziennych wpisów w bazie zacznij od lokalnej — więcej o tym dwie sekcje niżej.
Poznasz, że się udało, gdy model skończy się pobierać i pokaże się jako gotowy.
Krok 3 — Potwierdź swój skrót klawiszowy.
W Windows domyślnie jest to Ctrl+Space, na Macu Command+Option przytrzymane jako push-to-talk. Na Macu przyznaj uprawnienie Dostępności, gdy aplikacja o nie poprosi; bez niego wklejanie w miejscu kursora nie dosięgnie innych aplikacji.
Poznasz, że się udało, gdy testowe nagranie wklei się w dowolnym polu tekstowym.
Krok 4 — Postaw kursor w polu Airtable i mów.
Otwórz swoją bazę, kliknij w komórkę, pole długiego tekstu lub okno komentarza, przytrzymaj skrót, powiedz zdanie, puść. Transkrypcja pojawi się tam, gdzie jest kursor.
Poznasz, że się udało, gdy wypowiedziane zdanie wyląduje w polu Airtable jako tekst.
Najwolniejszą częścią jest pobranie modelu, a nie konfiguracja. Cała reszta to te cztery kroki powyżej. Gdy już działa, wypełnianie pola długiego tekstu przestaje być zadaniem na pisanie, a staje się zadaniem na mówienie.
Krótkie komórki, pola długiego tekstu i komentarze
Airtable nie jest jednym rodzajem pola tekstowego, jest trzema — a dyktowanie obsługuje je wszystkie tak samo, bo kursor to kursor. Jednowierszowa komórka przyjmuje szybką wypowiedzianą wartość — nazwę, status, tytuł. Pole długiego tekstu przyjmuje akapit, a to właśnie tam głos się opłaca, bo akapit to miejsce, gdzie pisanie cię spowalnia. Komentarz do rekordu przyjmuje zdanie, które inaczej wystukiwałbyś jedną ręką, czytając wiersz. Ten sam skrót, trzy różne pola.
Większość stron wyświetlających się na to hasło kieruje cię do rozszerzenia przeglądarki — Voice In, Voicy i im podobne — które dodaje dyktowanie do dowolnego pola tekstowego na stronie internetowej, w tym w Airtable. Rozszerzenia to dobra odpowiedź, jeśli żyjesz w karcie przeglądarki. Mają jedno strukturalne ograniczenie: działają tylko tam, gdzie sięga przeglądarka. Aplikacja desktopowa Airtable to nie karta przeglądarki, więc rozszerzenie Chrome jej nie widzi. Skrót działający w całym systemie ją widzi, bo wkleja w miejscu kursora systemowego, niezależnie od tego, które okno jest jego właścicielem.
To prawdziwy podział. Rozszerzenie ogranicza się do przeglądarki; skrót działa wszędzie. Ten sam klawisz, który wypełnia pole długiego tekstu w Airtable, wypełnia też okno tworzenia wiadomości w Gmailu, wiadomość na Slacku i treść commita. Jedno narzędzie, każde pole tekstowe, zarówno w Windows, jak i na Macu. Jeśli dotykasz Airtable wyłącznie w karcie Chrome, rozszerzenie wystarczy, a kilka z nich jest darmowych. W chwili, gdy otwierasz aplikację desktopową albo chcesz tego samego przepływu w każdym programie, wygrywa droga systemowa. Ja sięgam po jeden skrót, bo przełączam aplikacje jakieś czterdzieści razy na godzinę i nie chcę zapamiętywać czterdziestu różnych przycisków dyktowania.
Lokalnie czy w chmurze: który tryb do twojej bazy
Do Airtable spróbuj najpierw trybu lokalnego. Sporo z tego, co trafia do bazy, to rzeczy, których wolałbyś nie przepuszczać przez logi dostawcy — notatki o klientach, kolumna z cennikiem, wewnętrzna mapa rozwoju, komentarz o pomyśle kolegi z zespołu. Jeśli twój Mac ma Apple Silicon, a komputer pochodzi z ostatnich kilku lat, tryb lokalny bez problemu obsłuży codzienne dyktowanie, a chmura staje się wyjściem awaryjnym, a nie domyślnym.
Oto czym różnią się te trzy ścieżki, bo aplikacja każe ci wybrać, a wolę, żebyś wybrał dobrze:
- Lokalny Parakeet — silnik TDT od NVIDIA, około 600 MB, i najszybsza opcja lokalna — od 5 do 10 razy szybsza niż Whisper na CPU. Obsługuje angielski plus 24 inne języki europejskie, łącznie 25. Bez tłumaczenia na angielski. Jeśli wypełniasz bazę po angielsku lub w innym języku europejskim, to szybki i w pełni offline wybór.
- Lokalny Whisper — wolniejszy niż Parakeet na tej samej maszynie, ale wersje wielojęzyczne obsługują 99 języków i potrafią tłumaczyć na angielski. Wersje tylko angielskie są tylko angielskie, nie obejmują 99 języków. Wybierz tę opcję do chińskiego, japońskiego, koreańskiego lub jakiejkolwiek pracy tłumaczeniowej, której Parakeet nie potrafi. Domyślny model angielski ma około 480 MB.
- Chmura (OpenAI, własny klucz) — najlepsza dokładność i dostęp do sieci, z użyciem twojego własnego klucza OpenAI rozliczanego bezpośrednio przez OpenAI. Transkrypcja domyślnie działa na gpt-4o-mini-transcribe. Wymaga internetu, więc to jedyna ścieżka, która opuszcza twoją maszynę. Powierzchnia Chmury jest częścią Whisper Pro.
Nudna prawda jest taka, że dla rodzaju tekstu, jaki większość ludzi wpisuje do bazy, tryb lokalny w zupełności wystarcza. Oba lokalne silniki działają w pełni na twojej maszynie, nic nie wysyłając na serwer. Chmura zasługuje na swoje miejsce, gdy potrzebujesz najwyższej dokładności na trudnym nagraniu albo gdy model ma w połowie zdania wyciągnąć fakt z sieci. Do codziennego wprowadzania danych zacznij od lokalnej i sięgaj po chmurę tylko wtedy, gdy lokalna zostawia cię z niedosytem.
Interpunkcja, czyszczenie i struktura Airtable głosem
Surowe dyktowanie wychodzi jako jeden ciąg. Mówisz "okej więc ustaw status na w recenzji przypisz to do marii i zaznacz że budżet jest przekroczony o jakieś dwanaście procent" i to jest ta nieinterpunkcyjna ściana, którą podaje ci każdy silnik mowy. Uporządkowanie jej to miejsce, w którym ścieżki się rozchodzą.
Wpisywanie głosem w Windows dodaje interpunkcję, gdy mówisz, a Dyktowanie w macOS obsługuje podstawową interpunkcję, gdy powiesz "przecinek" lub "kropka". Do cięższego czyszczenia — usunięcia "yyy", poprawienia ciągów, zamienienia wypowiedzianego akapitu w coś, co faktycznie zachowałbyś w polu długiego tekstu — Whisper może uruchomić przebieg AI. Wypowiedz frazę aktywacyjną "Hey whisper", a tekst zostanie ulepszony, zanim wyląduje. Na modelu lokalnym dzieje się to przez Ollama; w trybie chmurowym domyślnie jest to gpt-5-mini.
okej więc ustaw status na w recenzji przypisz to do marii i zaznacz że budżet jest przekroczony o jakieś dwanaście procent yyy zanim sprint się skończy
Okej, więc ustaw status na W recenzji, przypisz to do Marii i zaznacz, że budżet jest przekroczony o jakieś dwanaście procent, zanim sprint się skończy.
Jeśli chodzi o samą strukturę Airtable — wybór wartości z pola jednokrotnego wyboru, połączenie rekordu, ustawienie pola daty — uczciwa odpowiedź jest taka, że głos daje ci tekst, a struktura zostaje po stronie interfejsu Airtable. Podyktuj pole długiego tekstu, a potem kliknij listę rozwijaną dla pojedynczego wyboru albo wpisz nazwę powiązanego rekordu tak, jak zawsze. Żadne narzędzie do dyktowania nie wyczaruje typów pól Airtable na żądanie; każdy, kto obiecuje "powiedz status w recenzji i patrz, jak wybiera opcję", sprzedaje ci pokaz, a nie zwykły wtorek. Szybko zapisz słowa głosem, a rekord ukształtuj przyciskami, które już znasz.
Ten sam przepływ mów-potem-czyść opłaca się daleko poza twoją bazą — możesz też dyktować czystą prozę do dowolnej aplikacji jednym skrótem klawiszowym, więc długi komentarz staje się kilkoma wypowiedzianymi zdaniami zamiast wystukiwanego akapitu.
Kiedy odpuścić narzędzie do dyktowania w Airtable

Czasem właściwym narzędziem jest to darmowe, które już masz na komputerze, a udawanie inaczej byłoby nieuczciwe. Jeśli wrzucasz do bazy tylko krótkie wartości — status, nazwę, dwuwyrazowy tag — twój system operacyjny obsłuży to za darmo.
W Windows naciśnij klawisz Windows + H, a otworzy się wbudowany pasek Wpisywania głosem, tam gdzie jest kursor, włącznie z komórką Airtable. Sam dodaje interpunkcję i nadaje się do krótkich zrywów. Haczyk: przechodzi przez serwery Microsoftu i potrzebuje połączenia z internetem, więc nie jest opcją offline, co ma znaczenie, gdy kolumna zawiera cokolwiek, co wolałbyś zachować dla siebie. Na Macu Dyktowanie pozwala mówić, by wprowadzać tekst wszędzie tam, gdzie możesz pisać, konfiguruje się je w Ustawieniach systemowych w sekcji Klawiatura, a na Apple Silicon ogólny tekst może być przetwarzany na urządzeniu. Do szybkiej jednowierszowej komórki każda z wbudowanych opcji to rozsądny wybór.
Sięgnij po dedykowane, systemowe narzędzie, gdy wbudowane zaczynają uwierać: pola długiego tekstu, wpisy wielojęzyczne, prywatność offline w Windows albo chęć posiadania jednego skrótu, który zachowuje się tak samo w Airtable, w twojej poczcie i w edytorze. Poniżej tej poprzeczki korzystaj z tego, co darmowe. Nie będę ci kazał instalować aplikacji, żeby podyktować jedno pole statusu.
Ten sam kompromis pojawia się, jeśli twoja praca żyje też w trackerze — logika dyktowania do Jiry jest identyczna, bo oba to narzędzia oparte na polach i komentarzach, gdzie prawdziwym połączeniem jest kursor, a nie integracja.
Airtable nigdy nie wypuścił przycisku mikrofonu i po napisaniu tego jestem dość pewien, że nigdy go nie wypuści. Nie musi, bo to kursor jest integracją. Mów do komórki, dostań tekst, ukształtuj rekord przyciskami, które już znasz. Większość tego przewodnika podyktowałem do pola tekstowego, które nie było Airtable, narzędziem, którego nie obchodzi, jakie to pole, a potem wkleiłem całość do pola długiego tekstu, w którym trzymam swoje szkice. Na tym polega cała sztuczka.
Wypróbuj to w swoim następnym polu Airtable
Przytrzymaj skrót, mów, puść. Transkrypcja ląduje w dowolnej komórce, polu długiego tekstu czy komentarzu, w którym jest twój kursor — i w każdej innej aplikacji też.
Darmowy tryb lokalny dla każdego zalogowanego konta. Bez karty na start.



