Autor: Denys Medvediev

Porównanie

Uczciwa alternatywa dla Aqua Voice

Aqua Voice to chmurowa aplikacja do dyktowania na Maca, Windows i iPhone'a, która w czasie rzeczywistym zamienia twoją mowę na tekst w dowolnej aplikacji, poprawiając przy okazji gramatykę i formatowanie. Najsilniejszą prywatną alternatywą jest Whisper by Remskill, którego lokalny mechanizm działa offline, za darmo i nigdy nigdzie nie wysyła twojego dźwięku.

Ostatnia aktualizacja: czerwiec 2026

Studyjny mikrofon pojemnościowy na biurku w ciepłym, przytłumionym świetle, kojarzący się z dyktowaniem głosowym offline

Od razu wyłóżmy kwestię konfliktu interesów. To tekst porównawczy, a jeden z dwóch opisywanych produktów sam zbudowałem. Dlatego oddam Aqua Voice to, na co zasługuje, a będzie tego więcej, niż można by się spodziewać po blogu konkurenta, i jednocześnie będę bardzo konkretny w tym jednym miejscu, gdzie naprawdę wygrywamy.

Whisper by Remskill to prywatna alternatywa dla Aqua Voice, której cały lokalny mechanizm działa offline i jest darmowy na zawsze, bez limitu słów i bez podawania metody płatności przy rejestracji. Aqua Voice działa w czasie rzeczywistym, jest dopracowana i szlifuje twoją wypowiedź w chmurze, gdy mówisz. Różnica, która ma znaczenie, to jedno słowo: chmura.

Czym jest to porównanie i kto je napisał

Nudna prawda jest taka, że Aqua Voice robi dobrze to, co robi. Działa w czasie rzeczywistym, jest dopracowana i przetwarza każde słowo, gdy mówisz, poprawiając frazowanie i gramatykę na bieżąco. Jeśli już za nią płacisz i jesteś zadowolony, możesz spokojnie zamknąć tę kartę. Pod koniec jest cały rozdział, który dokładnie mówi, kiedy warto przy niej zostać.

Dla wszystkich, którzy czytają dalej, różnica sprowadza się do jednego słowa: chmura. Aqua wysyła twój dźwięk na swoje serwery, żeby zrobić tę magię w czasie rzeczywistym. My robimy to na twoim laptopie, za darmo, a dźwięk nigdy nie opuszcza pokoju.

To cały argument, a przez resztę artykułu będę go raczej pokazywał, niż tylko o nim zapewniał. Żadnych zmyślonych liczb recenzji, żadnych wymyślonych liczb użytkowników. Po prostu dwie listy funkcji i tabela, którą możesz sprawdzić na obu stronach głównych.

Co Aqua Voice właściwie robi

Aqua Voice działa na Macu i Windowsie, ma też aplikację na iPhone'a. Oferuje dyktowanie na żywo, w czasie rzeczywistym, które wpasowuje się w każdą aplikację, której już używasz, bez żadnego rytuału konfiguracji. Naciskasz, mówisz i pojawia się dopracowany tekst. To właśnie owo szlifowanie jest tu głównym atutem: poprawia gramatykę, porządkuje frazowanie i formatuje tekst, gdy mówisz.

Pod maską kryje się zamknięty, chmurowy silnik. W materiałach marketingowych nazywa się Avalon w płatnej wersji i Aqua Engine w darmowej, a wag modelu nie da się podejrzeć. Rozumie 49 języków. To realna liczba na realnej stronie głównej i nie zamierzam jej bagatelizować.

Jeśli chodzi o obchodzenie się z danymi, Aqua jest ostrożniejsza niż większość narzędzi chmurowych. Jej własna strona mówi, że w planach Starter i Pro nic nie jest przechowywane na ich serwerach, a Zero Data Retention zarezerwowane jest dla wersji Enterprise. To uczciwa polityka. Ale to wciąż tylko polityka. Twój dźwięk opuszcza twoją maszynę, wędruje do ich chmury, zostaje przetranskrybowany i wraca. Ufasz obietnicy, a nie prawom fizyki.

Jest darmowy plan Starter z limitem 1000 słów, dalej plan Pro rozliczany rocznie, plan Team i Enterprise. Nie podaję tu konkretnych kwot, bo cenniki się zmieniają i powinieneś przeczytać ich oraz nasz prosto u źródła. Liczy się sam kształt: darmowy plan się kończy, a wszystko ponad niego to subskrypcja.

Co dostajesz dodatkowo z Whisper by Remskill

Teraz część, w której opisuję to, co sam zbudowałem, a potem zostawiam ci ocenę tabeli. Whisper by Remskill to dwa produkty pod jednym skrótem klawiszowym. Darmowa wersja to cały lokalny mechanizm. Dostajesz 8 modeli transkrypcji Whisper, silnik Parakeet, w pełni offline'owe oczyszczanie tekstu przez AI dzięki Ollama, historię transkrypcji, presety, słowa-klucze, akcelerację sprzętową, pobieranie modeli i własny skrót klawiszowy. Bez podawania metody płatności przy rejestracji i bez limitu słów. Zakładasz konto, pobierasz aplikację, naciskasz skrót i mówisz.

Whisper
Aplikacja Whisper by Remskill na żywo — pasek boczny, panel transkrypcji i karty instrukcji AI. To prawdziwy interfejs, a nie zrzut ekranu.

Lokalny silnik wybierasz w zależności od tego, czego potrzebujesz, a nie od tego, co my forsujemy. Whisper daje ci 99 języków, tłumaczenie na angielski, własny słownik, kontrolę nad rozmiarem wiązki i nadawanie wagi słowom-kluczom — wszystko kosztem szybkości. Parakeet to silnik NVIDIA TDT, około 600 MB, działający 5 do 10 razy szybciej niż Whisper na procesorze, obejmujący angielski oraz 24 inne języki europejskie. Wybierz Parakeet, gdy zależy ci na szybkości i angielskim. Wybierz Whisper, gdy potrzebujesz języków, tłumaczenia lub precyzyjnej kontroli. Żaden z nich nie jest domyślny. To twoja decyzja.

Lokalna dokładność zwykle mieści się między 95% a 99%, a wszystko działa na twoim procesorze, bez konieczności posiadania karty graficznej. Sama aplikacja zajmuje na dysku około 25 MB. Wszystko to dzieje się na twojej maszynie. Żadnej podróży w obie strony, żadnych serwerów, żadnej obietnicy, której trzeba zaufać.

Jeśli chcesz chmury, też ją mamy — i działa na zasadzie własnego klucza. Wersja Pro dodaje chmurową transkrypcję OpenAI. Wklejasz własny klucz OpenAI i wybierasz model: gpt-4o-mini-transcribe za około $0.003 za minutę albo gpt-4o-transcribe dla wyższej jakości. Ulepszanie przez AI domyślnie działa na gpt-5-mini, jest też wyszukiwanie w sieci tuż przy kursorze przez Responses API od OpenAI. Nie pobieramy żadnej dodatkowej prowizji ponad stawkę OpenAI. Twój klucz, twój rachunek — przeczytaj stronę z cennikiem, by poznać kwoty dla wersji Pro.

Kwestia platform to ta uczciwa część. Windows i macOS na Apple Silicon są dostępne już dziś. Nie ma aplikacji na iPhone'a, iPada ani Androida. Jeśli dyktujesz z telefonu, to właśnie tutaj Aqua jest po prostu o krok przed nami.

Aqua Voice kontra Whisper by Remskill, obok siebie

Tabela, której nikt inny nie wydaje się wypełniać prawdziwymi wierszami. Nie ma w niej kwot — te sprawdź na obu stronach z cennikiem.

Porównanie funkcji Aqua Voice i Whisper by Remskill
FunkcjaAqua VoiceWhisper by Remskill
PlatformyMac, Windows, iOSMac (Apple Silicon) i Windows; brak aplikacji mobilnej
Gdzie przetwarzany jest dźwiękChmura; dźwięk opuszcza twoją maszynęNa twojej maszynie, offline
Darmowy planZa darmo do 1000 słówCały lokalny mechanizm darmowy na zawsze, bez limitu słów
Działa bez internetuNie, działa w chmurzeTak, w pełni offline na lokalnym mechanizmie
SilnikZamknięta chmura (Avalon / Aqua Engine), bez otwartych wag8 modeli Whisper + Parakeet, otwarte modele
Własny klucz OpenAINiedostępneTak — chmura działa na własnym kluczu, bez narzutu
Języki4999 w wielojęzycznym Whisper, 25 w Parakeet
Tłumaczenie na angielskiNie podanoTak, w modelach Whisper
Szlifowanie w czasie rzeczywistym, gdy mówiszTak; jego sztandarowa funkcjaOczyszczanie po wypowiedzi, przez Ollama lub AI w chmurze
Dyktowanie mobilneTak — iPhoneBrak aplikacji mobilnej
Model cenowySubskrypcja po wyczerpaniu darmowego limituLokalnie za darmo; opcjonalne Pro dla chmury

Kilka uczciwych odczytów tej tabeli. Szlifowanie w czasie rzeczywistym w Aqua jest naprawdę zgrabne, jej 49 języków pokrywa większość tego, co ludzie dyktują, a ona sama ma aplikację mobilną, której my nie mamy. To nie są drobne zwycięstwa. Wszędzie tam, gdzie wiersz dotyczy działania offline, prywatności, darmowego lokalnego mechanizmu albo liczby języków, przewaga jest po drugiej stronie.

To, że twój dźwięk nigdy nie opuszcza maszyny, to cały sedno

To właśnie po to większość osób tu trafiła, więc powiem konkretnie. Polityka danych Aqua jest dobra. Mówi, że w wersjach konsumenckich nic nie jest przechowywane na ich serwerach. Wierzę im. Ale „nie przechowujemy tego” to nie to samo co „to nigdy nie opuściło maszyny”. Twój dźwięk i tak wędruje do chmury, żeby zostać przetranskrybowanym, bo tak właśnie działa chmurowy silnik. Przy lokalnym mechanizmie Whisper by Remskill w całym obiegu nie ma żadnego serwera. Model ładuje się do twojego RAM-u, mikrofon go zasila, a tekst się pojawia: w samolocie w trybie offline, w pomieszczeniu o podwyższonym poziomie poufności, w pociągu jadącym przez tunel. Nie ufasz obietnicy. Nie ma tu nic, co trzeba by obiecać.

Pasted
Wdrożona nakładka po dyktowaniu — tak wygląda jedno darmowe, w pełni offline'owe dyktowanie lokalne w chwili, gdy się kończy.

Oto jedyna opinia, na którą sobie pozwolę w tym artykule. Dyktowanie wyłącznie w chmurze to katastrofa prywatności, która czeka tylko, aż ktoś ją przetranskrybuje. Arkusz z pensjami twojego szefa, mail do szkoły twojego dziecka, pismo procesowe, które piszesz w pociągu: nic z tego nie powinno opuszczać twojego laptopa tylko dlatego, że chciałeś pisać głosem. Zespół, z którym kiedyś pracowałem, zatrudnił podwykonawcę, by zbudował wewnętrzny prototyp chmurowego dyktowania, który dla każdej wypowiedzi wołał API AI. Te same nagrania ze standupów transkrybował czterokrotnie, bo logika „inteligentnej ponownej próby” była zbyt agresywna. Menedżer otworzył pod koniec kwartału panel kosztów chmury i znalazł pięciocyfrowy rachunek. Naprawa zaproponowana przez podwykonawcę brzmiała: „zoptymalizujmy prompt”. Naprawa od dyrektora finansowego brzmiała: „albo przestańmy wysyłać na serwer spotkania, z których już mamy notatki”. Rozwiązanie lokalne było tańsze i bardziej prywatne, w jednym zdaniu.

Twój laptop ma już mikrofon i procesor. Nie potrzebuje serwera w obiegu, żeby napisać jeden akapit. Chmura to świetne wyjście awaryjne i dziwne ustawienie domyślne.

Kiedy warto zostać przy Aqua Voice

Ten rozdział jest tym, na co zasłużyła reszta artykułu. Są realne powody, by zostać, i nie zamierzam udawać, że jest inaczej.

Chcesz w pełni zarządzanego doświadczenia w chmurze i nie zależy ci na offline

To ten najważniejszy powód. Aqua działa w czasie rzeczywistym, jest hostowana i nie wymaga konfiguracji. Jeśli to, że twój dźwięk na chwilę ląduje na serwerze dostawcy, ci nie przeszkadza, a wolisz nie pobierać modelu ani nie zastanawiać się nad silnikami, zarządzane doświadczenie w chmurze jest po prostu mniej kłopotliwe. Zostań przy tym, co działa.

Zależy ci konkretnie na jego formatowaniu w czasie rzeczywistym

Aqua szlifuje frazowanie i poprawia gramatykę, gdy mówisz, w danej chwili, zanim tekst się pojawi. Nasze oczyszczanie działa po wypowiedzi, a nie w połowie zdania. Jeśli to właśnie owo żywe, słowo po słowie szlifowanie cię ujęło, to ich rozwiązanie to robi, a nasze działa inaczej.

Dyktujesz z telefonu

Aqua ma aplikację na iPhone'a. My dostarczamy na Windows i Maca na Apple Silicon, a aplikacji mobilnej nie ma w naszych planach. Jeśli twoje codzienne dyktowanie odbywa się na telefonie, potrzebujesz ich narzędzia.

Dla wszystkich pozostałych — samodzielnych autorów, marketerów, handlowców, studentów, rodziców odpisujących na maila od nauczyciela podczas gotowania kolacji, każdego, czyje słowa nie powinny opuszczać pokoju — zacznij od naszej darmowej wersji lokalnej i sprawdź, czy kiedykolwiek natkniesz się na ścianę. Nie ma limitu słów i nie jest potrzebny internet.

Jeśli masz zapamiętać tylko jedno

Większość artykułów porównujących dyktowanie kończy się namową, byś przeobraził swój sposób pracy. Ten kończy się skromniej. To, co naprawia pisanie głosem, to luka między tym, że masz coś do powiedzenia, a tym, że trafia to do dokumentu. Aqua zamyka tę lukę w czasie rzeczywistym, w chmurze, i pobiera opłatę po wyczerpaniu darmowego limitu. My zamykamy ją na twojej maszynie, offline, a część lokalna jest darmowa. Jeśli twoje słowa mogą żyć na cudzym serwerze, Aqua to dobry wybór. Jeśli nie mogą albo po prostu wolałbyś, żeby tak nie było, to dokładnie ta granica, dla której zostaliśmy zbudowani.

Jeśli chcesz głębszej wersji tego argumentu, opisałem ją w naszym tekście o zamianie mowy na tekst offline, jest też nasze porównanie z alternatywą dla superwhisper, jeśli rozważasz opcje lokalne.

Najpierw wypróbuj darmowy lokalny mechanizm

Pobierz Whisper by Remskill, załóż konto bez podawania karty, naciśnij skrót klawiszowy i dyktuj. Twój dźwięk zostaje na twojej maszynie, a jeśli nigdy nie będziesz potrzebować warstwy chmurowej, nigdy nie zapłacisz.

Darmowa lokalna transkrypcja na zawsze, w pełni offline. Bez podawania metody płatności przy rejestracji. 7-dniowy okres próbny chmury prosi o kartę dopiero przy uaktualnieniu.

Zdjęcie Denysa Medvedieva

Denys Medvediev

To ja czytam nasze maile na wsparcie, najpewniej dyktując odpowiedzi.

Dalsza lektura