작성자: Denys Medvediev

튜토리얼

Figma에서 음성을 텍스트로 플러그인 없이

Figma에는 기본 받아쓰기 기능이 없습니다. 유일한 오디오 기능은 협업자끼리 실시간으로 대화하는 음성 채팅일 뿐, 전사 기능이 아닙니다. 말을 캔버스에 옮기려면 커뮤니티 플러그인을 설치하거나, 포커스가 있는 모든 입력란에 글자를 입력해 주는 시스템 전역 단축키를 사용해야 합니다. Figma도 그 입력란 중 하나입니다.

최종 업데이트: 2026년 6월

노트북, 모니터, 주변기기가 놓인 깔끔한 데스크톱 작업 공간, 디자인 작업에 맞춰 세팅됨

Figma에서 음성을 텍스트로 바꾸는 것은 기본 제공 기능이 아닙니다. Figma에는 기본 받아쓰기가 없고, 유일한 오디오 기능은 협업자끼리의 실시간 음성 채팅인데 이것은 전사가 아닙니다. Figma 댓글, 주석, 텍스트 레이어에 받아쓰려면 디자이너는 커뮤니티 플러그인을 설치하거나, 포커스가 있는 모든 입력란에 글자를 입력해 주는 시스템 전역 받아쓰기 단축키를 사용합니다.

어느 디자이너가 같은 문장 두 줄을 Figma 댓글에 두 번이나 입력하느라 4분을 쓰는 걸 본 적이 있습니다. 자동 교정이 "padding"을 "pudding"으로 바꿔 버렸기 때문이죠. 그녀는 하루에 이런 일을 수십 번 합니다. 댓글, 레드라인 주석, 핸드오프 노트 — 어느 것도 디자인 작업이 아니지만, 전부 타이핑입니다. 제가 아는 Figma 고수들은 조용히, 손으로 입력하는 일을 그만뒀습니다.

사람들이 가장 먼저 헷갈리는 지점이 여기입니다. Figma에는 분명 "오디오" 기능이 있는데, 이것과는 전혀 상관이 없습니다. Figma의 오디오는 실시간 음성 채팅입니다. 같은 프레임을 함께 만지작거리면서 동료와 실시간으로 대화하는 기능이죠. 디자인 파일 안에서 거는 전화 통화 같은 겁니다. 말을 텍스트로 바꿔 주지 않습니다. 그래서 누군가 "Figma에 이미 음성 기능 있지 않아?"라고 물으면 — 맞습니다, 다만 엉뚱한 종류죠. 시시하지만 사실은, 말을 캔버스에 옮겨 주는 그런 받아쓰기는 이 제품에 아예 없다는 겁니다.

Figma는 음성을 텍스트로 바꿀 수 없습니다. 실제로 할 수 있는 일은 이렇습니다.

책상 위에 손으로 그린 상세 디자인 도면과 제도 도구들이 펼쳐져 있음

Figma에는 기본 음성-텍스트 변환 기능이 없습니다. 사람들은 계속 요청하고 있습니다 — Figma 포럼에는 "댓글에 음성 입력"이나 "Figma Make에 음성-텍스트 프롬프트 추가" 같은 기능 요청이 열려 있는데, 이것은 그 기능이 존재하지 않는다는 점을 점잖게 확인해 주는 인터넷식 표현입니다.

Figma가 가진 것은 오디오 채팅이고, 이건 정말 유용합니다 — 다만 용도가 다를 뿐이죠. 별도 통화로 넘어가는 대신, 협업자들이 파일이나 FigJam 보드 안에서 데스크톱과 브라우저 모두에서 소리 내어 이야기할 수 있게 해 줍니다. 그게 음성 채팅입니다. 음성-텍스트 변환이 아닙니다. Figma 오디오에 대고 말한 어떤 것도 댓글 칸이나 텍스트 레이어에 들어가지 않습니다.

그래서 Figma에서 실제로 받아쓰기를 하는 정직한 방법은 두 가지입니다. 첫 번째 경로: Figma 안에서 돌아가는 커뮤니티 플러그인. 두 번째 경로: 컴퓨터에서 포커스가 있는 모든 입력란에 글자를 입력하는 시스템 수준의 받아쓰기 도구이고, Figma도 그 대상에 포함됩니다. 이 글의 나머지는 두 방법 모두에 관한 것이고, 각각이 언제 옳은 선택인지도 다룹니다.

플러그인 경로: "Voice to Text for Figma"와 그 친구들

이를 위한 실제 플러그인이 있습니다. "Voice to Text for Figma"는 음성 도구를 열고 말하면 전사된 글이 선택한 텍스트 레이어에 들어가는 커뮤니티 플러그인입니다. "Hey Figma Speech Recognition"도 같은 종류의 일을 합니다. 작동은 됩니다. 왜 이것들이 어딘가 어설프게 느껴지는지 말씀드리기 전에, 그 점은 공정하게 인정하고 싶습니다.

여기에 함정이 있는데, 버그가 아니라 구조적인 문제입니다. Figma 플러그인은 마이크에 접근할 수 없습니다. 그래서 당신의 말을 듣기 위해 이 플러그인들은 별도의 브라우저 창을 엽니다. 브라우저에 내장된 Web Speech API로 음성을 인식한 다음, WebSocket 연결을 통해 그 텍스트를 다시 Figma로 보냅니다. 댓글 하나를 받아쓰려고 Figma 창과, 듣고 있는 브라우저 팝업, 그리고 다시 Figma 사이를 오가야 합니다. 최신 브라우저가 필요하고, 무엇보다 당신이 브라우저 안에 있어야 합니다.

다섯 단어짜리 댓글이라면 괜찮습니다. 하지만 하루 종일 핸드오프 노트를 작성하다 보면 창을 오가는 일이 금세 지겨워집니다. 게다가 FigJam 전용 받아쓰기 플러그인은 아예 없습니다.

더 빠른 경로: Figma에 바로 입력해 주는 시스템 전역 단축키

Cancel
녹음 오버레이: 말하는 동안 나타나는 작은 캡슐로, Whisper가 포커스된 Figma 입력란에 받아쓰기 위해 듣고 있다는 걸 알려 줍니다.

Whisper는 다른 경로를 택합니다. 플러그인도 아니고 브라우저 확장도 아닌, Windows와 macOS용 데스크톱 앱입니다. 하나의 시스템 전역 단축키를 사용합니다: Windows에서는 Ctrl+Space를, macOS에서는 Command+Option을 누른 채 말하고 손을 떼면 됩니다. 텍스트는 커서가 이미 있는 곳에 나타납니다.

그 "커서가 있는 곳 어디든"이라는 부분이 핵심 비결입니다. Whisper는 운영체제 수준에서 입력하기 때문에, 그 입력란이 Figma의 것이든 아니든 상관하지 않습니다. Figma 댓글 칸에 커서를 두고 댓글을 받아쓰세요. 선택한 텍스트 레이어에 클릭해 넣고 카피를 받아쓰세요. 레드라인 주석이나 개발자 핸드오프 노트에 들어가 스펙을 받아쓰세요. 설치할 플러그인도, 튀어나오는 브라우저 창도, WebSocket도 없습니다. Figma 데스크톱 앱에서도, 브라우저 탭에서 돌아가는 Figma에서도 작동합니다. OS 수준에서는 둘 다 그저 "포커스가 있는 텍스트 입력란을 가진 앱"일 뿐이기 때문이죠.

그리고 같은 단축키가 다른 모든 곳에서도 작동합니다. Figma 댓글을 받아쓰고, Cmd-Tab으로 Slack에 넘어가 개발자에게 메시지를 받아쓰고, 이어서 이메일까지 — 같은 키, 같은 손버릇으로 모든 앱에서요.

Whisper
진짜 Whisper 데스크톱 앱입니다 — 직접 클릭해 보세요. 전사를 어디서 돌릴지 고르고, 단축키를 설정하면 설정의 대부분이 끝납니다.

위에 보이는 것은 스크린샷이 아니라 실제 Whisper 앱입니다 — 직접 클릭해 보세요. 전사를 어디서 돌릴지 고르고, 단축키를 설정하면 설정의 대부분이 끝납니다. Figma 모양의 깜짝 놀랄 일은 없습니다. 하나의 앱, 하나의 키일 뿐이고, Figma는 그저 그 앱이 입력하게 되는 여러 앱 중 하나일 뿐입니다.

Figma에서 받아쓸 수 있는 것 (그리고 할 수 없는 것)

Figma가 텍스트 커서를 주는 곳이라면 어디든 받아쓸 수 있습니다. 디자인 댓글과 피드백. 레드라인 주석. 개발자 핸드오프 노트. 텍스트 레이어 안의 실제 카피 — 본문, 버튼 레이블, 열한 번씩 다시 쓰는 그 마이크로카피. FigJam 스티키 노트도 마찬가지입니다: FigJam에는 기본 받아쓰기도, 전용 음성 플러그인도 없지만, 스티키 노트는 그저 포커스가 있는 평범한 텍스트 입력란일 뿐이라 시스템 전역 단축키가 다른 것과 똑같이 입력해 줍니다. 워크숍을 진행하면서 사람들이 말하는 속도보다 빠르게 아이디어를 받아 적는 그 순간이야말로, 제가 디자이너들이 진짜로 방 안의 속도를 앞지르는 걸 본 유일한 때입니다. 디자인 파일보다 화이트보드에서 더 많이 산다면, 같은 발상이 Miro 보드에 받아쓰기에도 그대로 적용됩니다.

이제 정직한 부분입니다. 이 분야의 도구들이 곧잘 반대로 암시하기에 굵게 표시합니다. Whisper는 포커스가 있는 입력란에 받아씁니다. Figma를 조작하지는 않습니다. 음성으로 프레임을 그리거나, 레이어를 옮기거나, 컴포넌트 이름을 바꾸거나, 크기를 조정하거나, 객체를 만들지 못합니다. 커서가 있는 곳에 말을 입력할 뿐이고 — 한 번에 한 입력란씩 — 그게 일의 전부입니다. Whisper는 타이핑을 대신하는 것이지, 디자인을 대신하는 게 아닙니다. ("2px 왼쪽으로 밀어"라고 말하면 레이어를 2px 왼쪽으로 밀어 주는 도구를 원한다면, 그건 제 것과는 다른, 훨씬 더 용감한 제품입니다.) 참고로, 플러그인과 운영체제 자체의 받아쓰기도 똑같이 한 입력란 범위에 머뭅니다 — 이 분야에서 에디터 전체를 조종하는 건 아무도 없습니다.

로컬에서, 오프라인으로, 깔끔하게 정리되어

Thinking...
받아쓰기 후 실행되는 Whisper의 선택적 AI 정리 패스 — 군더더기를 다듬고 명백한 실수를 바로잡습니다.

다듬지 않은 받아쓰기에는 군더더기가 있습니다. "음," "그, 어, 그 간격," 문장 중간에 스스로 고치는 순간들. Whisper는 전사 후 선택적인 AI 정리 패스를 실행해 군더더기를 다듬고 명백한 실수를 바로잡아, 핸드오프 노트에 바로 붙여 넣을 만한 결과를 남길 수 있습니다. 정리 작업은 무료 모드에서는 당신의 기기에서 로컬로 실행되고, Pro 기능을 켜고 자신의 키를 연결하면 클라우드를 통해 실행됩니다. 디자인 시스템 어휘 — 컴포넌트 이름, 토큰 이름, 평범한 자동 교정이 민망한 무언가로 망가뜨리는 단어들 — 에서 정말 유용합니다. Whisper는 로컬과 클라우드 모드를 통틀어 90개 이상의 언어도 처리하므로, UI 카피를 독일어로 쓰고 영어로 검토하는 팀이 도구를 바꿔 가며 쓸 필요가 없습니다.

기둥 위 전선을 잠그고 있는 황동 자물쇠, 비공개 온디바이스 처리를 상징함

로컬 모드는 완전히 오프라인으로 돌아갑니다. 전사 중에 인터넷이 필요 없고, 당신의 오디오는 기기를 절대 벗어나지 않습니다 — 연결이 필요한 유일한 순간은 한 번 받는 모델 다운로드뿐인데, 어떤 모델을 고르느냐에 따라 대략 140MB에서 3GB 사이입니다. 그 후에는 네트워크를 꺼도 기차에서도, 비행기에서도, 인터넷 절반을 막아 둔 사무실에서도 받아쓰기가 여전히 작동합니다.

우리끼리 이야기지만, 이건 제가 타협하지 않을 부분입니다. 클라우드 전용 받아쓰기는 전사되기를 기다리는 개인정보 재앙입니다. 당신이 받아쓰고 있는 주석은 미출시 제품, 가격 화면, 보안 흐름을 묘사할 수도 있습니다 — 바로 그런 것이야말로, 타이핑을 건너뛰고 싶다는 이유만으로 어느 업체의 로그를 거쳐서는 안 되는 종류의 것입니다. 플러그인 경로는 브라우저의 음성 엔진과 별도 창에 의존합니다. 로컬 받아쓰기는 이미 마이크와 충분히 좋은 프로세서를 가진 그 한 대의 기기에 오디오를 묶어 둡니다. 민감한 것을 다룬다면, 이 차이는 더 이상 있으면 좋은 정도가 아닙니다.

Figma 플러그인이나 OS 받아쓰기가 더 나은 경우

기기들, 노트, 스케치 도구가 나란히 놓인 책상의 위에서 본 모습

저라면 모두에게 Whisper를 설치하라고 하지는 않겠습니다. 가끔 다섯 단어짜리 댓글만 받아쓰고, 온종일 브라우저 탭의 Figma 안에서만 산다면, "Voice to Text for Figma" 같은 무료 커뮤니티 플러그인으로 충분합니다 — 음성 도구를 열고, 말하면, 끝. 다운로드도 필요 없습니다.

그리고 이 모든 게 필요 없을 수도 있습니다. Windows에는 무료 받아쓰기가 내장되어 있습니다 — Win+H를 누르고 포커스가 있는 대부분의 입력란에 말하면 되고, Figma도 포함됩니다. macOS에는 키보드 설정에 받아쓰기가 있습니다. 둘 다 무료이고, 설치가 필요 없으며, 짧게 쓰기에는 완벽히 괜찮습니다. Whisper 같은 데스크톱 받아쓰기 앱은 무료 옵션들이 딱히 주지 못하는 세 가지를 원할 때 손을 뻗으세요: 오디오가 기기에 머문 채 오프라인으로 작동하는 것, Figma만이 아니라 모든 앱을 가로지르는 하나의 단축키, 그리고 기술적인 디자인 시스템 어휘에 대한 AI 정리. 이 중 어느 것도 중요하지 않다면, 디스크 공간을 아끼세요 — 당신의 트랙패드는 한 해 더 버틸 겁니다.

Willow는 같은 Figma 워크플로를 겨냥한 또 다른 시스템 수준 받아쓰기 도구입니다 — 어느 텍스트 입력란에서든 단축키, 플러그인 없이 — 그러니 이 분야가 우리만 있는 건 아닙니다. 정직한 지형도는 이렇습니다: 브라우저에 묶인 빠른 받아쓰기에는 플러그인, 짧고 무료인 단발에는 OS, 어디서나 오프라인으로 쓰고 싶을 때는 데스크톱 받아쓰기 앱.

설정: 세 단계, Figma 플러그인 없이

이걸 위해 Figma의 플러그인 메뉴를 건드릴 일은 없습니다. 핵심은 받아쓰기 도구가 Figma 바깥에 산다는 점입니다.

  1. Windows나 macOS에 Whisper를 다운로드해 설치한 다음 로그인하세요. 로컬 파이프라인은 가입 시 카드 없이 무료입니다. 클라우드 기능은 유료 Pro 영역입니다.
  2. 단축키를 확인하세요. 기본값은 Windows에서 Ctrl+Space, macOS에서 Command+Option입니다 — 이미 쓰고 있는 것과 충돌하면 설정에서 바꾸세요.
  3. Figma를 열고, 아무 텍스트 입력란에 — 댓글, 레이어, 스티키 노트 — 클릭한 뒤, 단축키를 누른 채 말하고 손을 떼세요. 단어가 커서 위치에 나타납니다.

그게 전부입니다. 플러그인 승인도, 브라우저 팝업도, 앱마다의 설정도 없습니다. 이걸 처음 시연했을 때 저는 여전히 습관적으로 Figma의 플러그인 메뉴에 손을 뻗었다가, 설치할 게 없다는 걸 떠올렸습니다. 모든 앱에서 음성으로 더 빠르게 입력하고 싶었던 적이 있다면, Figma는 그 여정의 한 정거장일 뿐입니다. 같은 설정으로 사람들이 ClickUp 안에서 받아쓰기도 하고, 다른 대부분의 도구에서도 합니다.

제 일곱 살짜리 아이는 어느 앱이 Figma인지 알아내기도 전에 단축키부터 알아냈습니다. 키를 누른 채, 용에 관한 스티키 노트를 읊고, 손을 떼니 단어가 그냥 거기 있었습니다 — 메뉴도, 플러그인도 없이, 그게 어렵게 되어 있어야 한다는 생각조차 없이요. 그게 기준입니다. 아이가 설명서를 읽지 않고도 스티키 노트에 용을 받아쓸 수 있다면, 디자이너는 커피를 한 모금씩 마시는 사이에 핸드오프 노트를 받아쓸 수 있습니다. 어차피 손은 이 일의 핵심이었던 적이 없습니다. 같은 방식이 다른 앱들에서 Mac에서 음성을 텍스트로 옮기는 데에도 똑같이 통합니다.

댓글을 손으로 입력하는 일, 이제 그만둘 준비가 되셨나요?

Whisper를 다운로드하고, 아무 Figma 입력란에 클릭해 넣고, 단축키를 누른 채 전사가 나타나는 걸 지켜보세요 — 플러그인도, 브라우저 팝업도 없이요.

로그인한 모든 계정에 로컬 모드 무료. 시작할 때 카드가 필요 없습니다.

Denys Medvediev의 사진

Denys Medvediev

저는 우리 고객지원 이메일을 읽는 사람입니다. 답장은 십중팔구 받아쓰기로 하고 있죠.