asystent głosowy AI
Funkcje
Dyktuj wszędzie
Trzymaj skrót, mów, słowa pojawiają się przy kursorze. Mac i Windows, w każdej aplikacji, w której da się pisać — Slack, Gmail, VSCode, Notes, Twoje zgłoszenie w Jira, formularz szkolny dziecka.
Tryb lokalny
Całkowicie offline. Transkrypcja na OpenAI Whisper lub NVIDIA Parakeet, czyszczenie AI na Ollama z dowolnym modelem open-source, któremu ufasz. Bez chmury, bez serwerów, nic nie opuszcza Twojej maszyny — na te chwile, gdy Twoje audio nie jest do dzielenia się.
Tryb chmurowy
Najlepsza w klasie dokładność i odpowiedzi z sieci na żywo w jednym skrócie. Transkrypcja przez gpt-4o-transcribe od OpenAI za $0.003/min — około 18¢ za godzinę audio. Ten sam klucz zasila fakty w czasie rzeczywistym przez Responses API. Ty przynosisz klucz, my bierzemy zerową marżę.
Wyszukiwanie w sieci
W połowie zdania poproś Whispera, żeby coś sprawdził — kurs akcji, pogodę, wczorajszy wynik meczu, pisownię rodzinnego miasta kolegi. Odpowiedź pojawia się sformatowana, w tekście. Bez zmiany karty, bez gubienia wątku.
Dopracuj w trakcie mówienia
Mów chaotycznie, dostajesz uporządkowany tekst. „Hey Whisper, format as email" zamienia Twój wymamrotany szkic w trzyakapitowy e-mail z powitaniem i podpisem. Napisz własny trigger dla dowolnego kontekstu.
Tłumacz w trakcie mówienia
Mów po polsku, wklejaj po angielsku. Mów po angielsku, wklejaj po mandaryńsku. Mów po japońsku, wklejaj po niemiecku. Ponad 90 języków, w obie strony, w trybie chmurowym i lokalnym — bez dodatkowej aplikacji, bez dodatkowej subskrypcji, bez karty Google Translate.
Zapytaj o to, co masz na ekranie
Najedź kursorem na błąd, wykres, usterkę interfejsu — naciśnij skrót do dyktowania i zapytaj. Zrzut ekranu spod kursora trafia do OpenAI wraz z Twoim poleceniem głosowym, a odpowiedź wkleja się w miejscu. Koszt obrazu to znacznie mniej niż grosz za pytanie. Tryb Cloud, funkcja Pro.
Wycisz muzykę, gdy mówisz
Spotify w środku albumu, tutorial na YouTube otwarty w karcie, podcast lecący z boku — Whisper wycisza wszystko, co odtwarza Twój system, w chwili gdy zaczynasz nagrywać, i przywraca głośność w sekundę po zakończeniu. Połącz to z subtelnym sygnałem startu i stopu w tej samej sekcji, jeśli chcesz mieć informację zwrotną bez patrzenia na ekran.
Przepisz to, co już napisałeś
Zaznacz tekst w dowolnej aplikacji — Slack, Gmail, Twój edytor — naciśnij skrót do dyktowania i wypowiedz przeróbkę: „nadaj ton formalny”, „wytnij korporacyjną watę”, „przetłumacz na niemiecki”. Zaznaczenie zostaje zastąpione w miejscu. Ten sam skrót, bez menu. Działa w trybie Cloud i w trybie Local.
Instrukcje na skrócie
Zapisuj pakiety instrukcji do każdego kontekstu — prompty deweloperskie, formalny e-mail, luźne aktualizacje na Slacku, punkty do szkolnego newslettera. Przypisz pierwsze dziewięć do Ctrl/Cmd + 1..9 i przełączaj aktywny styl w trakcie nagrywania, nie wychodząc z aplikacji.
Twoje słowa, zapisane poprawnie
Dodaj nazwy marek, akronimy, nazwisko swojego kolegi, nazwę niemieckiego miasta, którą ciągle przekręcasz — raz. Każda transkrypcja je respektuje, w chmurze czy lokalnie, bez wydawania tokenów AI.
Eee, yyy, no wiesz — znikają
Jeden przełącznik — każde „yyy" i „no wiesz" usunięte na wyjściu. Deterministycznie, za darmo, działa z każdym silnikiem. Twoje dyktowanie brzmi teraz jak trzecia wersja, nie pierwsza.