Autor: Denys Medvediev

Poradnik

Jak uzyskać transkrypcję ze Zooma

Narzędziem do transkrypcji spotkań w Zoomie najczęściej jest sam Zoom: nagrania w chmurze na płatnym planie automatycznie generują transkrypcję tekstową, która trafia mailem, gdy jest gotowa, i można ją edytować w portalu internetowym. W przypadku rozmów na żywo bot spotkań może dołączyć do połączenia i transkrybować w czasie rzeczywistym.

Ostatnia aktualizacja: czerwiec 2026

Schludne biurko w domowym biurze z laptopem, słuchawkami i notesem, przygotowane do przeglądania transkrypcji spotkania w Zoomie

Narzędziem do transkrypcji spotkań w Zoomie najczęściej jest sam Zoom. Na płatnym planie Zoom nagrania w chmurze automatycznie generują transkrypcję dźwięku, zapisaną w formacie VTT i edytowalną w portalu internetowym w sekcji Nagrania i transkrypcje. W przypadku rozmów na żywo bot spotkań, taki jak Otter czy Fireflies, dołącza i transkrybuje w czasie rzeczywistym. Whisper to kolejny krok: narzędzie do dyktowania uruchamiane skrótem klawiszowym, które zamienia tę surową transkrypcję w czyste notatki gotowe do wysłania.

Kilka tygodni temu ktoś zapytał mnie, które narzędzie do transkrypcji Zooma powinien kupić. Szczera odpowiedź go zaskoczyła: prawdopodobnie żadnego, a przynajmniej nie na początek. Jeśli Twoje konto jest na płatnym planie Zoom, Zoom już nagrywa i transkrybuje Twoje spotkania za Ciebie, bez dodatkowego oprogramowania i bez drugiej subskrypcji.

Internet sprzedaje to jako problem rozwiązany przez startupy. Najczęściej jest to po prostu pole wyboru, którego jeszcze nie zaznaczyłeś. To nudna prawda, ale warto poświęcić jej akapit, zanim ktokolwiek sięgnie po portfel.

Transkrypcje spotkań są niemal wystarczająco dobre od dekady, a ludzie wciąż płacą za załatanie luki węższej, niż sugeruje to marketing. Obecnie istnieją trzy prawdziwe ścieżki, a właściwa zależy od tego, czy kontrolujesz spotkanie, czy możesz je nagrać i co planujesz później zrobić z tekstem.

Ten artykuł omawia wszystkie trzy (własną transkrypcję Zooma, bota spotkań działającego w czasie rzeczywistym oraz transkrypcję pliku z nagraniem, który już masz) oraz to, gdzie narzędzie do dyktowania ze skrótem klawiszowym, takie jak Whisper, pasuje, a gdzie nie. Większość maili wsparcia, które dostaję na ten temat, pochodzi od osób, które kupiły narzędzie, by zrobić coś, co ich konto już potrafiło. Najszybsza transkrypcja to ta, do której nie musisz niczego instalować, więc od niej zaczynamy.

Najszybsza transkrypcja ze Zooma to ta, którą Zoom już dla Ciebie tworzy

Nikt nie zaczyna od tej części. Jeśli nagrasz spotkanie w Zoomie do chmury na koncie Pro, Business, Education lub Enterprise, Zoom automatycznie wygeneruje transkrypcję dźwięku i powiadomi Cię mailem, gdy będzie gotowa. Transkrypcja zapisuje się w formacie VTT i znajduje się w portalu internetowym Zoom w sekcji Nagrania i transkrypcje. Bez rozszerzenia, bez bota, bez kombinowania.

Haczyk tkwi w poziomie konta. Transkrypcja nagrań w chmurze wymaga włączenia zarówno nagrywania w chmurze, jak i transkrypcji dźwięku, a żadna z tych funkcji nie istnieje w darmowym planie Basic. Więc pytanie, czy istnieje darmowe AI do transkrypcji spotkań w Zoomie, ma irytującą odpowiedź: własna transkrypcja Zooma jest darmowa w tym sensie, że nic dodatkowo nie kosztuje, skoro już płacisz za Zoom, i wcale nie jest darmowa, jeśli jesteś na planie Basic.

Obsługa języków jest rozsądna. Dokumentacja wsparcia Zooma wymienia około 19 języków dla transkrypcji nagrań w chmurze, w tym angielski, hiszpański, francuski, niemiecki, chiński, japoński, ukraiński i rumuński. W przypadku większości spotkań wewnętrznych to w zupełności wystarczy. Jeśli potrzebujesz koreańskiego obok polskiego w tej samej rozmowie, sprawdź aktualną listę, zanim na niej polegniesz, bo Zoom z czasem ją rozszerza.

Jak uzyskać transkrypcję ze Zooma, krok po kroku

zoom.us · Nagrania i transkrypcje
Nagrania w chmurze · 1 wynik
Cotygodniowa synchronizacja — 2026-06-02Transkrypcja gotowa · VTT
ikona ołówka = edytuj frazę ptaszek = zapisz
Własny portal internetowy Zooma: panel Nagrania i transkrypcje, gdzie pojawia się gotowa transkrypcja VTT, którą można edytować bezpośrednio.

Wbudowany proces jest krótki. Oto całość.

1

Nagraj spotkanie do chmury. Podczas rozmowy uruchom nagrywanie w chmurze, a nie lokalne. Transkrypcja generuje się tylko dla nagrań w chmurze.

Nagranie pojawia się w portalu, a nie tylko na Twoim dysku.

2

Poczekaj na dwa maile. Po zakończeniu spotkania Zoom wysyła Ci maila, że nagranie jest gotowe, a następnie drugiego maila, że transkrypcja dźwięku jest dostępna.

Drugi mail dociera, zwykle w ciągu kilku minut od pierwszego.

3

Otwórz portal internetowy Zoom. Zaloguj się, a następnie w menu nawigacyjnym kliknij Nagrania i transkrypcje i otwórz zakładkę Nagrania w chmurze.

Twoje spotkanie jest na liście.

4

Otwórz nagranie i przeczytaj transkrypcję. Kliknij nagranie, aby zobaczyć transkrypcję obok odtwarzania.

Widzisz linijki z oznaczeniami czasu.

5

Popraw, co trzeba. Najedź na frazę, kliknij ikonę ołówka, popraw ją, a następnie kliknij ptaszek, aby zapisać.

Poprawiona linijka zostaje poprawiona po odświeżeniu.

I to tyle. Żadnego narzędzia do kupienia, łączny czas to kilka minut, gdy mail już dotrze. Jeśli przyszedłeś tu, by znaleźć narzędzie do transkrypcji spotkań w Zoomie, być może właśnie skończyłeś.

Napisy na żywo a transkrypcja nagrania w chmurze: której chcesz

Widok z góry na otwarty laptop obok pustego notesu w spirali, zestawiający napisy na żywo z zapisaną transkrypcją

To dwie różne rzeczy, które ludzie mylą. Transkrypcja na żywo wyświetla napisy na ekranie podczas spotkania, przydatne dla dostępności lub gdy czyjś dźwięk jest słaby, i znika w chwili zakończenia rozmowy, chyba że ją zapiszesz. Transkrypcja nagrania w chmurze to dokument po fakcie: przeszukiwalny, edytowalny plik VTT, który czytasz później.

Wybieraj na podstawie chwili, w której potrzebujesz tekstu. Śledzenie na bieżąco oznacza, że chcesz napisów. Potrzeba zapisu, który podsumujesz, przeszukasz lub wkleisz do maila z podsumowaniem, oznacza, że chcesz transkrypcji nagrania w chmurze. Większość osób mówiących transkrypcja ma na myśli tę drugą, a przez przypadek sięga po pierwszą.

Jedna uczciwa luka: Zoom reklamuje też AI Companion, które pisze podsumowania spotkań, a dokładny podział na poziomy planu zmienia się z czasem. Nie zamierzam podawać liczby, której nie mogę przypiąć do aktualnej dokumentacji Zooma. Jeśli zależy Ci na funkcji podsumowań na autopilocie, sprawdź, co dziś obejmuje Twój plan Zoom, zanim założysz, że tam jest.

Gdzie pasuje Whisper: zamiana transkrypcji w czyste notatki, których możesz użyć

Teraz część, w której muszę uważać, bo łatwo byłoby przesadzić. Whisper nie dołącza do Twojej rozmowy w Zoomie. Nie ma bota Zoom, nie dołącza automatycznie do spotkań i nigdy nie przechwytuje dźwięku innych uczestników. Jeśli chcesz czegoś, co siedzi na spotkaniu i słucha, Whisper to złe narzędzie, a za chwilę wskażę Ci te właściwe.

Whisper
Prawdziwa aplikacja desktopowa Whisper — klikaj po Ustawieniach, by zobaczyć panele transkrypcji lokalnej i w chmurze.

Whisper robi to, co następuje po tym, jak masz już transkrypcję. Naciskasz skrót klawiszowy (Ctrl+Space w Windows, przytrzymane Command+Option jako naciśnij-i-mów na macOS), mówisz, a Twoje słowa wklejają się w miejscu kursora w dowolnej aplikacji, w której jesteś. Więc gdy Zoom da Ci ten surowy mur tekstu VTT, otwierasz dokument, w którym żyje podsumowanie, i dyktujesz wersję, którą przeczyta człowiek: trzy decyzje, dwóch odpowiedzialnych, jeden termin.

W trybie chmury asystent AI idzie o krok dalej. Powiedz Hey whisper i możesz poprosić go o podsumowanie akapitu, wyciągnięcie zadań z notatek ze spotkania lub przygotowanie odpowiedzi, a oczyszczony wynik ląduje w miejscu kursora. Funkcje chmury są częścią Whisper Pro; lokalny tor dyktowania jest darmowy dla każdego, kto ma konto, bez podawania metody płatności przy rejestracji. Transkrypcja to surowiec. Whisper służy do nadania jej kształtu, w którym możesz ją wysłać.

Transkrybuj plik z nagraniem Zoom, który już masz

Co, jeśli zapisałeś spotkanie jako plik lokalny i nigdy nie dostałeś transkrypcji ze Zooma, ten problem planu Basic? Masz nagranie, tylko bez tekstu.

CancelTranscribing
Whisper zamieniający istniejące nagranie w tekst — stan transkrypcji nakładki.

Tor chmurowy Whispera może transkrybować plik audio, który posiadasz, używając Twojego własnego klucza OpenAI, a API zamiany mowy na tekst OpenAI obsługuje mp3, mp4, m4a, wav i webm. Jedna liczba do zapamiętania: przesyłane pliki do tego API są ograniczone do 25 MB. Długie spotkanie znacznie to przekroczy, więc najpierw podzieliłbyś dźwięk. Lokalne silniki nie mają tego limitu API, bo działają na Twoim komputerze: transkrypcja w czystym Rust, nic nie opuszcza laptopa.

Zastrzeżenie, które jestem Ci winien: nie potwierdziłem niezależnie dokładnej nazwy procesu importu pliku w aplikacji desktopowej, więc traktuj przeciągnij nagranie i gotowe jako intencję, a nie gwarantowany przycisk do jednego kliknięcia. W przypadku czystego, nagranego samodzielnie pliku poniżej limitu rozmiaru tor chmurowy sobie z nim poradzi. Do codziennego dyktowania i porządkowania notatek głównym wydarzeniem jest skrót klawiszowy.

Kiedy pominąć Whispera i zamiast tego użyć bota spotkań

To sekcja, której narzędzia AI nigdy nie piszą, więc napiszę ją wprost: jeśli faktycznie potrzebujesz czegoś, co dołączy do rozmowy i wszystko zapisze, nie używaj Whispera. Użyj bota spotkań.

Otter łączy się z Twoim kalendarzem Google lub Microsoft, automatycznie dołącza do spotkań w Zoomie, pisze notatki w czasie rzeczywistym, przechwytuje udostępniane slajdy i publikuje podsumowanie dyskusji na czacie Zoom. Fireflies uruchamia bota Notetaker, który automatycznie dołącza do spotkań z kalendarza, by nagrywać, transkrybować i podsumowywać, z listą zadań po każdej rozmowie, i reklamuje ponad 100 języków. Tactiq idzie w drugą stronę: rozszerzenie do Chrome, które transkrybuje Zooma w czasie rzeczywistym bez dołączania bota, darmowy poziom z pierwszymi 10 transkrypcjami spotkań bez karty oraz podsumowania na jedno kliknięcie. Trzy różne mechanizmy, a każdy z nich wykonuje to przechwytywanie podczas spotkania, którego Whisper celowo nie robi.

Oto opinia, za którą stanę murem: Otter jest do spotkań, Whisper jest do pisania. Inna kategoria, i wolałbym, żebyś użył właściwego, niż przepłacił za niewłaściwe. Whisper sprawia, że samo pisanie głosem jest szybkie. Nie siedzi na Twoim standupie.

To rozróżnienie ma większe znaczenie, niż się wydaje, a historia rachunku za chmurę pokazuje, dlaczego. Zespół, z którym pracowałem, zlecił wykonawcy zbudowanie wewnętrznego prototypu dyktowania AI, który wywoływał model w chmurze przy każdej wypowiedzi, na każdym laptopie. Na koniec kwartału menedżer otworzył panel kosztów i znalazł pięciocyfrowy rachunek. Większość z niego to jeden zespół transkrybujący nagrania ze standupów po cztery razy, bo logika ponawiania była zbyt agresywna. Poprawka wykonawcy brzmiała zoptymalizuj prompt. Poprawka dyrektora finansowego brzmiała albo przestań płacić za transkrypcję spotkań, które już mają notatki. Bot spotkań, którego potrzebujesz, jest wart swojej ceny. Bot spotkań, którego kupiłeś, by robił to, co Twoje konto Zoom już robi, to właśnie ten pięciocyfrowy rachunek czekający, by się wydarzyć.

Ile kosztuje transkrypcja ze Zooma

Transkrypcja nagrań w chmurze Zooma nie kosztuje nic ponad płatny plan Zoom, który już masz; jest dostępna od poziomu Pro wzwyż, a nie w darmowym planie Basic. Lokalny tor dyktowania Whispera jest darmowy dla każdego, kto ma konto, bez konieczności podawania metody płatności na start. Powierzchnia chmurowa (transkrypcja OpenAI, ulepszanie AI i wyszukiwanie w sieci) jest częścią Whisper Pro. Dokładne liczby znajdziesz na stronie z cennikiem Whispera, więc są zawsze aktualne. Narzędzia botowe, takie jak Otter, Fireflies i Tactiq, wyceniają się każde po swojemu; sprawdź ich strony bezpośrednio, bo cennik botów spotkań się zmienia.

Whisper działa na Windows i macOS na Apple Silicon, a lokalny tor po jednorazowym pobraniu modelu działa w pełni offline. Jeśli chcesz najpierw poczuć, jak wygląda przepływ dyktowania, przegląd aplikacji do zamiany głosu na tekst oraz porównanie alternatyw dla Otter.ai omawiają stronę pisania głosem bardziej szczegółowo.

Większość wyszukiwań narzędzia do transkrypcji Zooma kończy się tak samo: ktoś odkrywa, że transkrypcja już leżała w jego portalu Zoom, włącza nagrywanie w chmurze i wraca do swoich spraw. Narzędziem, którego potrzebowałeś, było pole wyboru. To, co zostaje po tym — zamiana muru oznaczeń czasu w dwa zdania, które przeczyta Twój zespół — to część warta zrobienia głosem. Większość tego artykułu podyktowałem między odbiorem dziecka ze szkoły a mailem wsparcia o tym, gdzie, ze wszystkich rzeczy, znaleźć transkrypcję ze Zooma. Córka zapytała, co piszę. Powiedziałem: jak uzyskać transkrypcję ze Zooma. Zapytała, czy to prawdziwa praca. Słuszne pytanie.

Dalsza lektura

Gotowy uporządkować notatki ze spotkania głosem?

Pobierz transkrypcję ze Zooma, potem pobierz Whispera i podyktuj wersję, którą Twój zespół naprawdę przeczyta.

Darmowy tryb lokalny dla każdego zalogowanego konta. Bez karty na start.

Zdjęcie Denysa Medvedieva

Denys Medvediev

To ja czytam nasze maile wsparcia, najpewniej dyktując odpowiedzi.