Poradnik
Głos na tekst w Canva: dyktuj skrótem klawiszowym
Canva nie ma dyktowania na żywo. Magic Write generuje tekst z polecenia; Speech to Text przepisuje plik. Aby wypowiedzieć własne słowa do pola tekstowego, komentarza albo dokumentu w Canva, używasz ogólnosystemowego skrótu klawiszowego, takiego jak Whisper.
Ostatnia aktualizacja: czerwiec 2026

Głos na tekst w Canva nie jest wbudowaną funkcją. Canva ma Magic Write (generowanie tekstu przez AI z wpisanego polecenia) oraz Speech to Text (przepisywanie nagrania, które już zrobiłeś), ale nie ma dyktowania na żywo do pola tekstowego. Tę lukę wypełnia ogólnosystemowe narzędzie na komputer, takie jak Whisper: przytrzymaj skrót, mów, a słowa pojawią się w miejscu kursora w dowolnym polu Canva.
To zdanie potrafi wprowadzić w błąd, więc powiem to wolniej. Canva ma cztery rzeczy z etykietą „głos” albo „AI” i żadna z nich nie jest dyktowaniem własnych słów do pola tekstowego. Pomyl je, a spędzisz dwadzieścia minut na szukaniu przycisku dyktowania, którego tam nigdy nie było.
To poradnik. Rozplączę cztery „głosowe” funkcje Canva, pokażę, jak dyktować do prawdziwego pola tekstowego, komentarza i dokumentu w Canva jednym skrótem, wskażę jedną rzecz, której ta metoda nie zrobi, i powiem, kiedy w ogóle pominąć moje narzędzie.
Czy Canva ma głos na tekst? Magic Write to nie dyktowanie

Canva ma funkcje z nutą głosu. Nie ma dyktowania na żywo. Oto cztery rzeczy, które ludzie mylą, rozłożone na czynniki pierwsze.
Magic Write to generowanie tekstu przez AI, a nie twój głos. Wpisujesz polecenie — „napisz trzy hasła reklamowe dla studia jogi” — i AI Canva tworzy tekst. Oficjalna strona Magic Write w Canva jasno mówi, że to ty wpisujesz polecenie; twój głos nigdy nie jest danymi wejściowymi. To AI pisze za ciebie. Dyktowanie zapisuje to, co powiedziałeś. Dwa różne zadania.
Speech to Text przepisuje plik, który już nagrałeś. Funkcja Speech to Text w Canva bierze istniejące nagranie lub film — jej strona wymienia MP4, MOV lub M4V do 500 MB i poniżej 90 minut, albo link z YouTube — i po fakcie zamienia je na tekst. Naprawdę przydatne i jeszcze do tego wrócę. Ale to przepisywanie pliku, a nie ty mówiący na żywo do pola tekstowego.
Text to Speech działa w drugą stronę. Generator głosu AI w Canva zamienia wpisany tekst w narrację lektorską do filmów. Tekst na wejściu, dźwięk na wyjściu. Przeciwieństwo dyktowania.
Mikrofon AI w Canva wypełnia tylko pole polecenia. Asystent ma ikonę mikrofonu, ale głosowo wypełnia polecenie dla AI — mówisz komendę do asystenta. Nie wpisuje tego w tekst twojego projektu, komentarze ani treść dokumentu.
Szczery werdykt: Canva nie ma dyktowania na żywo do pól tekstowych. Zadanie — mówisz, a twoje słowa pojawiają się przy kursorze — wykonuje osobne narzędzie na komputer. To właśnie dlatego ten artykuł istnieje.
Dyktuj do pól tekstowych i dokumentów Canva skrótem klawiszowym
Rozwiązanie siedzi pod Canva, na poziomie systemu operacyjnego. Instalujesz aplikację do dyktowania na komputer, ona przejmuje globalny skrót, a ten skrót wkleja przepisany tekst do pola, w którym jest kursor — pola tekstowego Canva, komentarza, dokumentu Canva. Ten sam klawisz działa w Slack, Gmail i twoim edytorze, bo narzędzie żyje na poziomie systemu, a nie wewnątrz karty przeglądarki.
W Whisper domyślny skrót to Ctrl+Space w Windows i Command+Option w macOS. Schemat jest identyczny na każdej powierzchni Canva:
- Kliknij w pole, które chcesz — pole tekstowe na obszarze roboczym, linię komentarza albo dokument Canva.
- Przytrzymaj skrót i mów. Powiedz zdanie tak, jak powiedziałbyś je na głos.
- Puść. Po sekundzie lub dwóch słowa pojawiają się przy kursorze.
- Zerknij, popraw słowo, jeśli musisz, i projektuj dalej.
To cały ruch. Żadnego okienka „rozpocznij dyktowanie”, żadnego drugiego okna, żadnego kopiowania skądś. Zostajesz w polu Canva, w którym już byłeś. Działa, czy używasz Canva w przeglądarce, czy aplikacji desktopowej Canva, bo narzędziu jest obojętne, co masz na ekranie.
Tu mam jedną opinię na potrzeby tego tekstu, podpartą liczbą. Najlepszy zysk dla produktywności to nie szybsze pisanie — to mniej kroków. Pisanie to około 40 słów na minutę; mówienie to mniej więcej 145, czyli około 3,6 razy szybciej. Prawdziwa oszczędność to pominięcie zmiany postawy: zatrzymaj się, usiądź, pisz. Układasz karuzelę, masz podpis w głowie, mówisz go, i już jest. Głos nie przyspiesza kroków. Kasuje kilka z nich.
Ten osadzony element powyżej to prawdziwa aplikacja, a nie zrzut ekranu. Wybierz ścieżkę transkrypcji, naciśnij skrót, patrz, jak tekst ląduje. Canva nigdy nie dowiaduje się, że narzędzie istnieje — dla Canva wygląda to dokładnie tak, jakbyś pisał, tylko bez pisania.
Są trzy ścieżki i aplikacja nie wybiera za ciebie. Tryb chmurowy używa twojego własnego klucza OpenAI dla najwyższej dokładności i odpowiedzi z sieci. Parakeet to najszybsza opcja lokalna dla angielskiego i 24 języków europejskich. Wielojęzyczne modele Whisper obejmują ponad 99 języków, w tym automatyczne wykrywanie, plus tłumaczenie na angielski. Do codziennej pracy w Canva — nagłówek, podpis, komentarz — nadążają nawet mniejsze modele lokalne, a liczba podawana klientom to ponad 90 języków w obu trybach, jeśli piszesz kampanie wielojęzyczne.
Posprzątaj dyktowanie automatycznie
Surowa mowa zawiera „yyy”, falstart, „nie, wykreśl to”. Whisper oferuje opcjonalne porządkowanie przez AI na bazie transkrypcji: przebieg lokalny działający na twojej maszynie w trybie darmowym albo przebieg chmurowy w Pro, jeśli przyniesiesz własny klucz. Włącz to, a „eee zrób nagłówek pogrubiony i przyjazny coś w stylu dziesięć procent rabatu tylko w tym tygodniu” wyląduje jako czyste zdanie. Wyłącz to, a dostaniesz dosłowną transkrypcję — z każdym „yyy”, co jest swego rodzaju uczciwością. Twój wybór, przy każdym nagraniu.
Tu też wraca zamieszanie z Magic Write, więc zamknę je na dobre. Magic Write generuje tekst z polecenia, które wpisujesz. Porządkowanie w Whisper poleruje słowa, które faktycznie wypowiedziałeś. Jedno wymyśla zdanie; drugie porządkuje twoje. Jeśli chciałeś, żeby AI napisało hasło, to Magic Write. Jeśli chciałeś wypowiedzieć hasło i mieć je schludnie wpisane, to właśnie to.
Gdzie to wkleja i jedna rzecz, której nie zrobi
Teraz szczera uwaga o zakresie, bo nikt inny na tej liście wyników nie mówi tego wprost. Whisper wkleja przepisany tekst do jednego pola, które ma fokus — pola tekstowego, komentarza albo dokumentu, tam gdzie siedzi kursor. To cała umowa.
Nie utworzy, nie przesunie, nie zmieni rozmiaru ani koloru i nie zaprojektuje elementów Canva głosem, ani nie uruchomi komend Canva. Nie możesz powiedzieć „dodaj ramkę”, „zmień czcionkę na pogrubioną” albo „powiększ logo” i oczekiwać, że tak się stanie. Zamienia mowę w tekst przy kursorze. Nie steruje narzędziem projektowym. (Na początku spędziłem żenujące popołudnie, próbując głosowymi komendami przesuwać kształty. Kształty zostały dokładnie tam, gdzie były. A mam tytuł magistra.)
Warto wiedzieć: Willow, konkurencyjna aplikacja do dyktowania na Maca i Windows, idzie dalej w jednej kwestii — obsługuje wbudowane komendy formatowania głosem, więc możesz powiedzieć „punkt wypunktowania” albo „nowy wiersz” w środku zdania, a formatowanie pojawia się w trakcie dyktowania. Whisper tego nie obiecuje; wkleja zwykły tekst i pozwala formatować rękami. Jeśli zależy ci na formatowaniu sterowanym głosem, to realny powód, by spojrzeć na Willow. Wolę to powiedzieć, niż żebyś przekonał się o tym po instalacji.
Offline i prywatnie

Projektanci pracują z tekstami, które nie powinny opuszczać firmy. Niezapowiedziana nazwa produktu. Data premiery klienta objęta NDA. Linia cenowa, która nie jest jeszcze publiczna. Gdy dyktujesz to do narzędzia działającego wyłącznie w chmurze, dźwięk jedzie na serwer i wraca, by stać się tekstem.
Tryb lokalny Whisper działa w całości na twojej maszynie. Bez internetu podczas transkrypcji, a dźwięk nigdy nie opuszcza laptopa. Jedyne potrzebne połączenie to jednorazowe pobranie modelu, gdzieś między około 140 MB a 3 GB, zależnie od wybranego modelu. Potem możesz nadyktować podpisy do całej prezentacji Canva w samolocie z wyłączonym Wi-Fi.
To najwyraźniejsza różnica między narzędziami, które wypełniają lukę dyktowania w Canva. Voice In, rozszerzenie do przeglądarki, działa w chmurze. Strona Willow dla Canva reklamuje zero przechowywania danych, ale nie wspomina o trybie offline. Whisper jawnie oferuje lokalną transkrypcję na urządzeniu. Przy tekście typu „nagłówek tygodnia” nie ma to znaczenia. Przy czymkolwiek, co wahałbyś się odczytać na głos w open space, transkrypcja na urządzeniu jest nudnym, słusznym domyślnym wyborem. Ta sama matematyka przewija się przez nasze poradniki o dodawaniu głosu na tekst w Figma oraz głosu na tekst w Miro — narzędzie projektowe się zmienia, rozumowanie nie.
Kiedy Magic Write albo dyktowanie systemowe ma więcej sensu

Nie będę udawał, że Whisper to za każdym razem właściwa odpowiedź. Trzy przypadki, gdy nią nie jest:
Naprawdę chcesz przepisać istniejące nagranie. Jeśli masz już notatkę głosową, fragment webinaru albo link z YouTube i chcesz wyciągnąć z tego słowa, to nie dyktowanie — to transkrypcja pliku, a wbudowane w Canva Speech to Text robi to w samym edytorze, bez dodatkowego narzędzia. Użyj funkcji wbudowanej w Canva; to ta właściwa do tego zadania.
Pracujesz wyłącznie w karcie przeglądarki Canva i chcesz darmowego dodatku do przeglądarki. Voice In to rozszerzenie do Chrome i Edge stworzone właśnie do tego. Nie sięgnie do aplikacji desktopowej Canva ani niczego poza przeglądarką, ale jeśli przeglądarka jest całym twoim światem, pasuje.
Chcesz głosu, który już masz na komputerze. Windows ma Wpisywanie głosowe pod Win+H; macOS ma Apple Dictation. Oba dyktują ogólnosystemowo do Canva, w przeglądarce lub aplikacji, za darmo i bez instalowania. Każde działa na jednej platformie i jakość bywa różna, ale do krótkich zrywów to uczciwa darmowa opcja.
Sięgnij po Whisper, gdy chcesz, by dźwięk został na twoim urządzeniu, gdy chcesz darmowego narzędzia bez karty przy rejestracji albo jednego skrótu, który działa tak samo w aplikacji desktopowej Canva i w każdej innej aplikacji, której dotykasz.
Ile to kosztuje
Magic Write i Speech to Text od samej Canva mieszczą się w darmowym i płatnym planie Pro Canva — cennik Canva, nie mój. Strona Willow dla Canva daje 2000 darmowych słów tygodniowo do przetestowania, bez karty, a potem płatny próg powyżej tego. Voice In to freemiumowe rozszerzenie do przeglądarki. Cały lokalny potok Whisper — ta część, która dyktuje do twoich pól Canva — jest darmowy przy rejestracji, bez karty. Whisper Pro dokłada powierzchnię Cloud i jest dostarczany z 7-dniowym okresem próbnym Cloud, w którym karta jest potrzebna tylko do tego rozszerzenia, nigdy przy pierwszej rejestracji. Nie myl tych dwóch: dyktowanie, które obsługuje twoją pracę w Canva, to część darmowa. Liczby znajdziesz na naszej stronie z cennikiem, jeśli ich potrzebujesz.
Większość wyszukiwań „głos na tekst w Canva” kończy się tym samym małym rozczarowaniem: idziesz szukać przycisku dyktowania, znajdujesz Magic Write i orientujesz się, że chce on napisać tekst za ciebie, a nie wpisać to, co powiedziałeś. Tego przycisku nie ma w Canva. Siedzi warstwę niżej, w skrócie klawiszowym. Pokazałem ten ruch młodszej córce — kliknij, przytrzymaj, mów, puść — i napisała podpis na kartce urodzinowej, zanim skończyłem tłumaczyć. Ma siedem lat. Nie zadała ani jednego pytania pomocniczego, czego nie mogę powiedzieć o większości dorosłych, których wdrażałem. Jeśli chcesz wersji bez klawiatury wszędzie, oto jak pisać szybciej głosem, w tym głos na tekst na Macu.
Nadyktuj swój kolejny podpis w Canva
Kliknij w pole, przytrzymaj klawisz, mów, puść. Transkrypcja ląduje tam, gdzie jest twój kursor — w Canva i w każdej innej aplikacji też.
Darmowy tryb lokalny dla każdego zalogowanego konta. Bez karty na start.



