Poradnik
Narzędzia do notatek AI ze spotkań, szczerze
Ta kategoria obejmuje dwa różne produkty, a strony marketingowe zacierają tę granicę. Jeden wysyła bota na twoją rozmowę. Drugi w ogóle jej nie dotyka. Oto jak rozpoznać, którego naprawdę potrzebujesz.
Ostatnia aktualizacja: czerwiec 2026

Narzędzie do notatek AI ze spotkań nagrywa rozmowę i zamienia ją w transkrypcję, podsumowanie i listę zadań. Większość to boty, które same dołączają do spotkania w Zoom, Teams czy Meet i spisują notatki za całą salę. Drugi rodzaj działa bez bota: notatki dyktujesz samodzielnie, a nic nie dołącza do rozmowy. Wybierz boty (Otter, Fireflies, Granola, Read AI, tl;dv), gdy chcesz, by robot uczestniczył w spotkaniu i przygotował streszczenie; wybierz narzędzie do dyktowania, takie jak Whisper, gdy chcesz mieć własne, czyste notatki głosowe bez nagrywania całej sali.
Godzinne spotkanie to z grubsza około 9000 wypowiedzianych słów, jeśli liczyć na palcach. Nikt nie wpisuje tego ręcznie i właśnie dlatego cała branża narzędzi sama dołącza dziś do twoich rozmów bez zaproszenia i pisze notatki za ciebie. Nudna prawda: „narzędzie do notatek AI ze spotkań” obejmuje dwa różne produkty, a strony marketingowe robią wszystko, by tę granicę zatrzeć. Jeden wysyła bota do sali. Drugi w ogóle nie dotyka rozmowy. Wybierz źle, a albo zapłacisz za funkcję, której nie chcesz, albo wyślesz nagranie całego spotkania tam, gdzie wcale nie zamierzałeś.
Wyrok na samym początku, skoro to porównanie. Chcesz, żeby robot uczestniczył w twoim Zoomie i potem wręczył wszystkim streszczenie? Boty dołączające automatycznie (Otter, Fireflies, Granola, Read AI, tl;dv) są stworzone właśnie do tego, a kilka ma darmowe plany. Chcesz uchwycić własne, czyste notatki głosem, w trakcie rozmowy albo zaraz po niej, bez nagrywania całej sali przez osobę trzecią? To inne narzędzie i tu mieści się Whisper. Ten artykuł porządkuje kategorię na te dwa rodzaje, wymienia boty, które warto znać, i mówi, po który sam sięgnąłbym w każdym z przypadków. Większość maili od użytkowników, które czytam, pochodzi od osób, które pierwszego dnia kupiły zły rodzaj, więc mam interes w tym, żeby dobrze postawić tę różnicę.
To ja robię Whisper, więc powiem wprost o jego miejscu, zanim pójdziemy dalej. Whisper nie jest botem na spotkania. Nie dołącza do twojej rozmowy. To narzędzie do dyktowania: naciskasz skrót klawiszowy, mówisz, a tekst pojawia się tam, gdzie stoi kursor. To czyni go złym narzędziem do „przepisz cztery osoby na standupie, w którym uczestniczę połową uwagi” i właściwym do „napisz własne notatki i listę zadań głosem bez przesyłania całego spotkania”. Oba zadania są prawdziwe. Większość artykułów udaje, że istnieje tylko jedno.
Narzędzie do notatek AI ze spotkań zamienia mowę w notatki, na których można działać

Odrzuć marketing, a każde narzędzie w tej kategorii robi trzy rzeczy. Przechwytuje dźwięk. Przekształca ten dźwięk w tekst. Następnie model językowy zwija tekst w podsumowanie, listę decyzji i zestaw zadań do wykonania. Odpowiedź AI Overview, którą Google pokazuje przy tym wyszukiwaniu, mówi to samo, tylko obszerniej.
To, co odróżnia te narzędzia, to krok przechwytywania, a właśnie ten fragment strony domowe przemilczają. Bot dołączający automatycznie przechwytuje, wysyłając uczestnika na twoją rozmowę wideo. Widziałeś to: dodatkowy uczestnik o nazwie „Otter.ai” albo „Fireflies Notetaker” siedzący w siatce. Narzędzie desktopowe bez bota przechwytuje za to dźwięk grający przez twój komputer, więc w sali nie pojawia się żaden dodatkowy gość. Narzędzie do dyktowania, takie jak Whisper, przechwytuje tylko to, co mówisz do mikrofonu, gdy trzymasz skrót klawiszowy. Na papierze ta sama kategoria. W sali trzy różne rzeczy.
Powód, dla którego to ma znaczenie, to zgoda i prywatność, a nie funkcje. Gdy dołącza bot, osoba trzecia nagrywa wszystkich na rozmowie, często bez wyraźnego uprzedzenia. Gdy sam dyktujesz notatki, jedynym przechwyconym głosem jest twój, a w trybie lokalnym nic nie opuszcza twojego komputera. Jeszcze do tego wrócimy. Najpierw — jak działają boty.
Jak działają notatkujące boty dołączające automatycznie
Narzędzia dołączające automatycznie żyją w twoim kalendarzu. Podłączasz Kalendarz Google albo Outlook, a na kilka minut przed startem każdego spotkania narzędzie wysyła bota, który prosi o dołączenie do rozmowy jako uczestnik. Fireflies na przykład potrafi „automatycznie dołączać do spotkań z kalendarza” albo możesz zaprosić jego bota na żywą rozmowę w locie. Read AI obiecuje, że „dołącza do twoich spotkań, nagrywa i dostarcza streszczenie” w Zoom, Google Meet i Microsoft Teams.
Gdy już jest w środku, bot nagrywa rozmowę, transkrybuje każdego mówcę, a po spotkaniu pisze podsumowanie z listą zadań, które rozsyła mailem albo wrzuca do przestrzeni roboczej. Niektóre z tych narzędzi pozwalają potem przeszukiwać wszystkie minione spotkania i „pytać” o to, co zostało powiedziane.
W ciągu ostatniego roku wyrosła cichsza, druga metoda: przechwytywanie bez bota. Zamiast bota dołączającego do rozmowy, aplikacja desktopowa nagrywa dźwięk wychodzący z własnych głośników twojego komputera. Granola „transkrybuje dźwięk komputera bezpośrednio, bez botów dołączających do rozmowy”. Fathom oferuje teraz oba warianty, z botem albo bez, więc możesz „skupić się na spotkaniu” tak czy inaczej. tl;dv reklamuje przepływ „BOT NIEWYMAGANY” w swoim darmowym planie. Notatki nadal obejmują całe spotkanie; różnica polega na tym, czy w siatce pojawia się widoczny gość. Nagranie i tak powstaje. Po prostu powstaje na twoim laptopie, a nie w chmurze.
Dwa rodzaje narzędzi, których nikt ci nie rozróżnia
Oto różnica, której strony kategorii nie chcą postawić. Jest narzędzie, które słucha sali, i jest narzędzie, które słucha ciebie.
Narzędzia sali, z botem albo bez, samodzielnie przechwytują całą rozmowę, każdego mówcę. Ty siedzisz wygodnie, a notatki się pojawiają. To zarabia na siebie, gdy jesteś na spotkaniu, w którym nie możesz w pełni uczestniczyć, albo gdy cały zespół potrzebuje wspólnego zapisu. To także nagranie innych osób, które niesie pytania o zgodę i przechowywanie — teraz to twoja sprawa.
Narzędzie „ciebie” przechwytuje tylko to, co sam zdecydujesz się powiedzieć. Trzymasz skrót klawiszowy, dyktujesz trzy decyzje, które miały znaczenie, a oczyszczony tekst ląduje w twojej aplikacji do notatek albo w mailu. Nikt inny nie jest nagrywany. Ze spotkania nie istnieje nic poza podsumowaniem, które wypowiedziałeś celowo. Praca jest wolniejsza w tym sensie, że to ty musisz myśleć, ale myślenie jest tu sednem. Sześćsetwyrazowe podsumowanie, które podyktowałeś, jest warte więcej niż dziewięciotysięczna transkrypcja, której nikt nie czyta.
Większość osób szukających „narzędzia do notatek AI ze spotkań” zakłada, że chce narzędzia sali. Około połowa z nich, gdy się nad tym zastanowi, chce narzędzia „ciebie”. Nigdy nie wiedzieli, że to osobna kategoria. To cały powód, dla którego ten artykuł istnieje.
Jak wybrałem narzędzia do tego porównania
Krótka notka o metodzie, bo szczera wersja ma tu znaczenie. Nie przeprowadziłem testu laboratoryjnego. Nie posadziłem siedmiu z tych botów obok siebie w jednej rozmowie na Zoomie i nie mierzyłem ich czasów, a każdy artykuł, który twierdzi, że to zrobił, nie pokazując nagrania, zgaduje. Nie zamierzam więc zmyślać procentów dokładności ani liczb prędkości dla narzędzi, których nie buduję. To, co następuje, opiera się na dwóch rzeczach: na udokumentowanych możliwościach każdego narzędzia (deklaracjach z ich stron z cennikami i produktami, cytowanych w tekście) plus na praktycznym używaniu jedynej aplikacji, którą sam buduję i z której codziennie korzystam.
Cechy, które ważyłem, w kolejności, w jakiej zwykle mają znaczenie dla tej kategorii:
- Co przechwytuje. Całą salę (dołączanie automatyczne albo bez bota) kontra wyłącznie twój własny głos. To rozwidlenie, od którego wszystko inne zależy.
- Kto zostaje nagrany. Bot w rozmowie nagrywa każdego uczestnika; dyktowanie nagrywa tylko ciebie. To rozstrzyga kwestię zgody i prywatności.
- Dokąd trafia dźwięk. Usługa w chmurze kontra twój własny komputer. Większość botów działa wyłącznie w chmurze; jeden tryb lokalny jest wyjątkiem.
- Zasięg platform. Do których aplikacji do rozmów dołącza (Zoom, Meet, Teams) i które systemy operacyjne je uruchamiają.
- Obsługa języków. Ze źródeł pierwotnych — strony każdego dostawcy. Tam, gdzie dostawca nie podaje liczby, mówię o tym, zamiast zgadywać.
- Kształt kosztu. Darmowy plan, abonament za stanowisko albo model freemium. Prawdziwe kwoty w dolarach żyją na własnej stronie każdego narzędzia oraz na stronie z cennikiem; nie cytuję ich tutaj w środku zdania.
To kryteria wyboru, a nie wyrok przebrany za jeden. Skoro już je postawiłem, oto cała kategoria w jednej tabeli.
Narzędzia w skrócie
Każda komórka poniżej pochodzi z udokumentowanych deklaracji każdego narzędzia (cytowanych w tekście w następnej sekcji) albo, w przypadku Whisper, z tego, jak ta aplikacja jest dostarczana. Nie pojawiają się żadne liczby dokładności ani prędkości, bo żaden z dostawców tutaj nie publikuje zweryfikowanych testów, a ja ich nie zmyślę.
| Narzędzie | Platformy, do których dołącza | Lokalnie czy w chmurze | Działa offline | Kształt cennika | Języki (deklarowane) | Najlepsze do |
|---|---|---|---|---|---|---|
| Otter.ai | Zoom, Teams, Meet | Chmura | Nie | Plan darmowy + za stanowisko | 6 | Zespoły mocno osadzone w Zoomie, w jednym z jego języków |
| Fireflies.ai | Zoom, Meet, Teams, +więcej | Chmura | Nie | Darmowy na zawsze + za stanowisko | 100+ | Przeszukiwalne archiwum każdej rozmowy |
| Granola | Zoom, Meet, Webex, Slack, Teams | Chmura (przechwytywanie lokalne bez bota) | Nie | Freemium | Nie podano | Notatki z całego spotkania bez widocznego bota |
| Read AI | Zoom, Meet, Teams | Chmura | Nie | Plan darmowy + płatny | 20+ | Wypróbowanie pomysłu na darmowym planie bez karty |
| tl;dv | Meet, Zoom, Teams | Chmura (opcja bez bota) | Nie | Darmowy na zawsze + płatny | 30+ | Najhojniejszy darmowy plan |
| Notion AI Meeting Notes | Nie podano | Chmura | Nie | W pakiecie z płatnymi planami Notion | Nie podano | Zespoły już żyjące w Notion |
| Whisper by Remskill | Do niczego nie dołącza (ty dyktujesz) | Lokalnie lub w chmurze (twój wybór) | Tak (tryb lokalny) | Darmowy plan lokalny + Pro dla chmury | 99 (wielojęzyczny lokalnie) | Pisanie własnych notatek głosem, prywatnie |
Czytaj tabelę jak narzędzie do sortowania, a nie tablicę wyników. Pierwszych sześć wierszy to sala. Ostatni wiersz to ty. Wybierz swój wiersz, a reszta tego artykułu powie ci, po którą nazwę w nim sięgnąć.
Boty na spotkania, które warto znać
Jeśli to narzędzia sali potrzebujesz, oto pięć, które są warte twojego czasu. Wszystkie deklaracje poniżej pochodzą z własnych stron każdego narzędzia.
Otter.ai to domyślna nazwa w tej przestrzeni. Dołącza do Zoom, Microsoft Teams i Google Meet, by spisywać i udostępniać notatki, z transkrypcją na żywo i napisami. Jego darmowy plan Basic daje 300 minut transkrypcji miesięcznie. Haczyk, który warto znać: jego strona z cennikiem wymienia sześć języków, mianowicie angielski, hiszpański, francuski, niemiecki, japoński i chiński. Poza nimi — szukaj gdzie indziej. Jeśli ważysz Otter wobec dyktowania, opracowanie alternatywa dla Otter.ai wnika głębiej w podział spotkanie kontra pisanie.
Fireflies.ai automatycznie dołącza do spotkań z kalendarza w Zoom, Meet, Teams i nie tylko, a reklamuje transkrypcję w ponad 100 językach. Ma darmowy na zawsze plan z 800 minutami pamięci na stanowisko. Skłania się ku zespołom, które chcą przeszukiwalnego archiwum każdej rozmowy.
Granola to ten bez bota. Nagrywa dźwięk twojego komputera, bez bota w siatce, i działa obok Zoom, Meet, Webex, Slack i Teams, z aplikacją na iPhone'a. Jeśli twoim zastrzeżeniem jest niezręczność widocznego bota, Granola ją usuwa, wciąż przechwytując całe spotkanie.
Read AI zajął pierwsze miejsce w wynikach wyszukiwania, na które patrzyłem. Dołącza, nagrywa i dostarcza streszczenie w Zoom, Meet i Teams, z aplikacjami na Windows, macOS, Androida, iPhone'a i Chrome, plus ponad 20 językami. Jego darmowy plan oferuje 5 spotkań miesięcznie bez karty kredytowej.
tl;dv to agresywna darmowa opcja. Jego plan Free Forever reklamuje nieograniczone nagrania i transkrypcje w ponad 30 językach z podsumowaniami AI oraz integruje się z Meet, Zoom i Teams. Jeśli „darmowy” to twój jedyny twardy wymóg, zacznij tutaj.
Jeszcze jedno warte wzmianki: Notion AI Meeting Notes transkrybuje i podsumowuje wewnątrz Notion bez osobnego bota, w pakiecie z planami Business i Enterprise Notion. Warto znać, jeśli już żyjesz w Notion, choć jego strona nie podaje, do których platform do rozmów dołącza ani ile języków obejmuje.
Gdzie pasuje Whisper: ty dyktujesz, on pisze, nic nie dołącza do rozmowy
Whisper to narzędzie „ciebie”. Naciskasz skrót klawiszowy (Ctrl+Space w Windows albo przytrzymujesz Command+Option na macOS jako akord push-to-talk), potem mówisz, a twoje słowa wklejają się jako tekst tam, gdzie stoi kursor, w dowolnej aplikacji. Żaden bot nie dołącza do twojej rozmowy. Żaden dodatkowy gość nie pojawia się w siatce Zoom. Jedynym przechwyconym dźwiękiem jest to, co celowo mówisz do własnego mikrofonu.
To zmienia sposób pracy. Zamiast dziewięciotysięcznej transkrypcji całego spotkania dyktujesz tę część, która ma znaczenie (trzy decyzje, dwie osoby odpowiedzialne, jeden termin) prosto do swojego dokumentu z notatkami, gdy rozmowa jest jeszcze świeża. W trybie chmurowym asystent AI może ją oczyścić, streścić akapit, wyłuskać zadania z tego, co podyktowałeś, albo naszkicować mail z odpowiedzią, wklejony przy kursorze. Powiedz „Hey whisper” przed swoim poleceniem, by uruchomić krok AI.
Ty wybierasz silnik. Lokalny Whisper uruchamia osiem modeli na twoim komputerze i obejmuje 99 języków w swoich wariantach wielojęzycznych; kompilacje .en tylko po angielsku obsługują wyłącznie angielski. NVIDIA Parakeet to najszybsza opcja lokalna, 5–10× szybsza niż Whisper na procesorze, obejmująca 25 języków (angielski plus 24 europejskie), w całości na urządzeniu. Albo tryb chmurowy używa twojego własnego klucza OpenAI: gpt-4o-mini-transcribe lub gpt-4o-transcribe do transkrypcji, gpt-5-mini do ulepszania. W trybie lokalnym całość działa offline po jednorazowym pobraniu modelu; nic nie jest wysyłane nigdzie podczas transkrypcji. Jeśli to uruchamianie wszystkiego na własnym komputerze jest tym, co ma dla ciebie znaczenie, przewodnik po zamianie mowy na tekst offline omawia silniki lokalne dogłębniej. Whisper jest dostarczany na Windows i macOS (Apple Silicon); Linux nie jest obsługiwany.
Szczery kompromis: narzędzia sali oszczędzają ci uwagi, a Whisper oszczędza ci nagrania, którego nie potrzebowałeś. Jeśli głównie piszesz rzeczy (maile, dokumenty, notatki po rozmowie), sposób pracy z dyktowaniem zarabia na swoje miejsce w twoim dniu daleko poza spotkaniami. To ten sam argument, który stawiam w szerszym opracowaniu o aplikacji do zamiany głosu na tekst, i dlatego Whisper jest zbudowany wokół dyktowania w pierwszej kolejności, a spotkań w drugiej.
A teraz jedyna opinia, którą trzymam tu mocno, powiedziana wprost: dyktowanie wyłącznie w chmurze to katastrofa prywatności czekająca na przepisanie. Zespół, z którym kiedyś pracowałem, pozwolił wykonawcy zbudować wewnętrzny prototyp „dyktowania AI”, który wywoływał model w chmurze przy każdej wypowiedzi i działał na każdym laptopie. Menedżer otworzył kokpit kosztów na koniec kwartału i znalazł pięciocyfrowy rachunek, w większości od jednego zespołu transkrybującego nagrania standupów po cztery razy, bo logika „inteligentnej powtórki” była zbyt agresywna. Wykonawca powiedział „powinniśmy zoptymalizować prompt”. Dyrektor finansowy powiedział „albo nie powinniśmy płacić za przesyłanie spotkań, które już mają notatki”. W sali zrobiło się bardzo cicho. Liczby z pensji twojego szefa, mail do szkoły twojego dziecka, projekt prawny, który dyktujesz: nic z tego nie musi żyć w logach dostawcy tylko dlatego, że chciałeś pisać głosem. W trybie lokalnym Whisper twój dźwięk jest przetwarzany na twoim komputerze i nic nie jest wysyłane na żaden serwer, nigdy.
Kiedy bot na spotkania bije Whisper
A teraz szczera część. Jeśli twoim faktycznym zadaniem jest „uchwyć rozmowę czterech osób, w której ledwo mogę uczestniczyć, i wyślij wszystkim mailem streszczenie”, Whisper jest złym narzędziem i nie sprzedałbym ci go. Chcesz narzędzia sali. Sięgnij po Otter, jeśli żyjesz w Zoomie i mówisz jednym z jego sześciu języków, albo po tl;dv, jeśli chcesz nieograniczonych nagrań na darmowym planie w ponad 30 językach, albo po Granolę, jeśli chcesz uchwycić całe spotkanie bez widocznego bota w siatce. Darmowy plan Read AI z 5 spotkaniami miesięcznie to dobry sposób, by przetestować pomysł bez karty.
Jest jeszcze jeden przypadek warty nazwania: jeśli wartością, której chcesz, jest to, że bot sam dołącza i podsumowuje, podczas gdy ty skupiasz się gdzie indziej, dedykowany bot do notatek bije dyktowanie na całej linii, bo automatyczne dołączanie plus automatyczne podsumowywanie to dokładnie to, co on robi, a czego Whisper celowo nie robi. Whisper nie dołącza do rozmów, nie transkrybuje innych mówców i nie tworzy streszczenia wielu mówców. Przechwytuje to, co ty mówisz. Jeśli potrzebujesz sali, użyj narzędzia sali. Wolę stracić sprzedaż, niż czytać mail z prośbą o zwrot pieniędzy.
Cennik
Whisper jest darmowy dla każdego dla całego lokalnego potoku: transkrypcja lokalna, ulepszanie AI przez Ollama, historia, zestawy ustawień, własny skrót klawiszowy, bez metody płatności przy rejestracji. Whisper Pro dodaje warstwę chmurową: transkrypcję w chmurze OpenAI, ulepszanie AI w chmurze i wyszukiwanie w sieci głosem. Pełne liczby żyją na stronie z cennikiem. Boty wyceniają za stanowisko: darmowy Basic Otter daje 300 minut miesięcznie, Fireflies jest darmowy na zawsze z 800 minutami pamięci na stanowisko, plan Free Forever tl;dv jest nieograniczony, a darmowy plan Read AI to 5 spotkań miesięcznie. Jeśli poprzeczką jest „darmowy do użytku osobistego”, niemal wszystko tutaj ją przekracza.
Jeśli masz wynieść z tego wszystkiego jedną rzecz: zdecyduj, czy potrzebujesz sali, czy tylko własnego głosu, zanim zapiszesz się gdziekolwiek. Boty są dobre w byciu salą, więc pozwól im na to. Ale następnym razem, gdy skończysz rozmowę i sięgniesz po klawiaturę, by spisać trzy rzeczy, które miały znaczenie, spróbuj zamiast tego przytrzymać skrót klawiszowy i je wypowiedzieć. Notatki zostaną napisane w czasie, w jakim bot zdąży wysłać mailem swoje streszczenie, a jedyną osobą na nagraniu jesteś ty. Moja młodsza córka rozgryzła to szybciej niż ja. Nie ma jeszcze żadnych spotkań.
Potrzebujesz sali czy tylko własnego głosu?
Jeśli zależy ci na własnych notatkach, pobierz Whisper, przytrzymaj skrót klawiszowy i podyktuj trzy rzeczy, które miały znaczenie. Lokalny potok jest darmowy, bez karty przy rejestracji.
Darmowe dyktowanie lokalne dla każdego zalogowanego użytkownika. Pro dodaje funkcje chmurowe w osobnym okresie próbnym.



