작성자: Denys Medvediev

가이드

회의 전사 소프트웨어

하나의 검색어, 두 가지 전혀 다른 용도. 어떤 도구는 봇을 회의에 참가시켜 공유 노트를 작성하고, 어떤 도구는 이미 갖고 있는 녹음 파일을 오프라인으로 내 노트북에서 처리합니다. 내게 실제로 필요한 게 어느 쪽인지 구별하는 방법을 알려드립니다.

최종 업데이트: 2026년 6월

마이크와 모니터가 줄지어 놓인 빈 회의 테이블 — 소프트웨어가 전사할 회의를 위해 세팅된 모습

회의 전사 소프트웨어는 통화 중 나눈 대화를 검색 가능한 텍스트로 변환합니다. 크게 두 가지 방식이 있습니다. 하나는 사람들이 말하는 동안 실시간으로 전사문이 나타나는 실시간 방식이고, 다른 하나는 회의가 끝난 후 녹음 파일을 처리해 화자 레이블과 타임스탬프가 붙은 깔끔한 노트를 만드는 사후 처리 방식입니다. 대부분의 도구는 캘린더 동기화와 회의 봇을 통해 자동으로 참가하지만, 이미 갖고 있는 녹음 파일만으로 봇 없이 동작하는 도구도 있습니다.

처음으로 팀이 회의 전사비로 다섯 자리 숫자 청구서를 받는 걸 목격했을 때, 그 회의들엔 이미 노트가 있었습니다. 한 계약업체가 내부 AI 딕테이션 프로토타입을 구축하면서 모든 발화마다 클라우드 API를 호출했고, 재시도 로직이 너무 공격적인 나머지 같은 스탠드업 녹음을 네 번 전사했습니다. 관리자가 분기 말 비용 대시보드를 열었을 때, 방이 조용해졌습니다.

이 분야에서 흔히 간과하는 진실이 있습니다. 잘못된 도구를 선택하면 돈, 프라이버시, 시간 중 하나를 치르게 되는데, 보통 누군가 알아채기 전에 이미 그렇게 됩니다.

이 글의 핵심이 바로 그겁니다. 팀들은 십 년째 자동 회의 노트를 원해왔고, 이제 도구들이 그 일을 제법 잘 해냅니다. 문제는 하나의 검색어 아래 전혀 다른 일을 하는 도구들이 뒤섞여 있다는 점입니다. 어떤 도구는 봇으로 화상 회의에 참가해 모든 사람을 위한 공유 노트를 작성하고, 어떤 도구는 사후에 녹음 파일을 처리하는데, 내 노트북에서 오프라인으로 처리합니다.

아래에서 두 가지 경로를 모두 살펴보고, 알아둘 만한 도구들을 소개하며, 저희 앱이 하지 못하는 일에 대해서도 솔직하게 이야기하겠습니다. 저희 앱은 회의 봇이 아닙니다. 지원 이메일을 직접 읽는 사람으로서 말씀드리면, 이 분야에서 생기는 혼란의 대부분은 첫날부터 잘못된 종류의 도구를 선택한 데서 비롯됩니다. 같은 내용의 이메일을 충분히 많이 받다 보면 제목줄만 봐도 알 수 있게 됩니다.

회의 전사 소프트웨어가 하는 일 (그리고 두 가지 작동 방식)

마케팅 문구를 걷어내면, 이 도구들은 모두 한 가지 일을 합니다. 오디오를 받아 텍스트를 생성하는 것입니다. 오디오는 회의에서 나온 사람의 음성이고, 텍스트는 전사문입니다. 요약, 실행 항목, 화자 레이블, 검색 — 이 모든 것은 그 단 하나의 변환 위에 구축됩니다.

이 분야는 변환이 언제 일어나느냐에 따라 나뉩니다.

  • 실시간 전사 는 사람들이 말하는 동안 실행됩니다. 화자보다 1~2초 늦게 단어가 화면에 나타납니다. Zoom이나 Microsoft Teams의 실시간 자막이나 통화 중 실시간 전사문을 보여주는 노트 봇에서 볼 수 있는 방식입니다. 접근성을 위해, 대화를 따라가기 위해, 놓친 이름을 잡기 위해 그 순간에 유용합니다.
  • 사후 전사 는 통화가 끝난 후 녹음 파일을 처리합니다. 도구가 파일 전체를 갖고 있으므로 시간을 들일 수 있습니다. 말이 끊기는 부분을 정리하고, 누가 무엇을 말했는지 레이블을 붙이고, 타임스탬프를 추가하고, 읽기 쉬운 문서로 이어 붙입니다. 사후 처리는 실시간보다 더 깔끔하고, 화자 레이블과 타임스탬프가 있는 텍스트를 만들어냅니다. 대신 기다려야 한다는 트레이드오프가 있습니다.

잘 알려진 도구들(Otter, Fireflies, Fathom, tl;dv)은 대부분 두 가지를 모두 제공하며, 오디오를 같은 방식으로 얻습니다. 봇이 통화에 참가하는 것입니다. Google 또는 Outlook 캘린더를 연결하면, 도구가 영상 링크가 있는 회의를 감지하고 참가자를 방에 보내 듣고 녹음하게 합니다. Zoom 그리드에서 봤던 그 작은 녹화 타일이 바로 이 모델 전체를 한 프레임에 담은 것입니다.

검색어 뒤에 조용히 숨어 있는 세 번째 경로가 있습니다. 이미 갖고 있는 녹음 파일을 봇 없이, 통화 없이, 내 기기에서 전사하는 것입니다. 이건 회의 노트 도구가 아니라 딕테이션·전사 소프트웨어이고, 저희 앱이 자리하는 곳이기도 합니다. 언제 잘못된 선택인지까지 포함해서 아래에서 더 자세히 다루겠습니다.

회의 봇이 정답인 경우 (그리고 Whisper가 아닌 경우)

노트 테이커 · 주간 싱크녹화 중
통화 중
Maria (호스트)
Tom
Priya
노트 테이커 봇
실시간 전사

Maria 10:02 출시일부터 시작하죠.

Tom 10:02 일주일 밀릴 것 같아요.

자동 참가: 캘린더 동기화 · 통화 후 요약 + 실행 항목
회의 봇 노트 테이커: 캘린더에서 자동으로 통화에 참가하고, 참가자 목록에 이름을 올리며, 모든 사람을 위한 실시간 공유 전사문을 작성합니다. Whisper는 이 일을 하지 않습니다.

"내 Zoom, Teams, Google Meet 통화에 자동으로 참가해서 모든 사람을 캡처하고, 통화 후에 팀 전체에 공유 노트를 제공"하는 게 필요하다면, 회의 봇이 정답입니다. Whisper는 이 일을 하지 않습니다. 통화에 자동 참가하지 않고, 다른 참가자를 녹음하지 않으며, 화상 회의에서 다중 화자 화자분리를 실행하지 않습니다. 그렇지 않다고 말하는 건 오후를 낭비시키는 일입니다.

그 일에는 봇 기반 노트 테이커가 적합합니다. Otter.ai는 Zoom, Microsoft Teams, Google Meet에 참가해 자동으로 노트를 작성하고 공유하며, 모델을 먼저 써보고 싶다면 무료 Basic 플랜이 있습니다. Fireflies.ai는 초대 또는 자동 참가 방식으로 합류하며, 무료 티어에서 무제한 전사와 제한된 AI 요약을 제공합니다. tl;dv는 Google Meet, Zoom, Teams를 녹화하고, 봇 없는 캡처 모드를 내세우며, 시간 제한 없는 무료 영구 플랜을 제공합니다. Fathom은 무제한 녹화가 포함된 무료 영구 플랜과 봇 없는 캡처(베타) 또는 봇 캡처 중 선택이 가능합니다.

이 글에서 의도적으로 다른 곳을 안내하는 대목입니다. Otter는 회의를 위한 것이고, Whisper는 글쓰기를 위한 것입니다. 서로 다른 카테고리이고, 잘못된 것을 선택하는 게 이 분야에서 가장 흔한 실수입니다. 녹음된 통화에서 다중 화자 분리, 캘린더 자동 참가, 회의가 끝날 때 팀 채널에 요약이 필요하다면, 봇 노트 테이커가 저희 앱이 처음부터 만들어지지 않은 일을 해냅니다. 저희는 음성으로 글쓰기를 빠르게 만들고, 그들은 방 캡처를 자동화합니다. 카테고리를 먼저 선택하고, 그다음에 도구를 선택하세요.

AI 회의 전사는 실제로 얼마나 정확한가

솔직한 답변은 이렇습니다. 깨끗한 오디오에서는 기대보다 낫고, 실제 회의에서는 바람보다 못합니다. 이 분야는 명확한 단일 언어 오디오에서 약 85~95% 정확도를 보이며, 배경 소음, 억양, 전문 용어, 동시 발화가 있으면 떨어집니다. 사람이 검증하는 서비스는 모델이 놓친 부분을 사람이 고치기 때문에 99%에 가까워집니다.

저희 자체 로컬 모드는 일반적으로 95~99% 정확도를 보이며, 더 큰 모델일수록 높습니다. 이 부분에서 주의가 필요합니다. 이는 저희 소프트웨어에 대한 저희의 측정값이지, Otter나 Fireflies와의 독립적인 비교가 아닙니다. 그리고 그런 비교를 만들어내지 않겠습니다. 오디오 조건도 알려주지 않고 단 하나의 정확도 수치를 내미는 사람은 측정하는 게 아니라 팔고 있는 겁니다.

마케팅에서 잘 다루지 않는 이야기를 하겠습니다. 거기서는 업셀이 없으니까요. 마이크가 모델보다 중요합니다. 2만 원짜리 USB 마이크 하나가 작은 모델에서 가장 큰 모델로 바꾸는 것보다 전사 품질에 더 큰 영향을 줍니다. 제가 봐온 나쁜 전사의 대부분은 모델 실패가 아니었습니다. 에어컨 소리를 잡아내는 노트북 내장 마이크, 한 방에서 하나의 스피커폰을 나눠 쓰는 네 명, 매 문장 첫 단어를 끊어먹는 블루투스 헤드셋이 원인이었습니다. 오디오를 먼저 고치세요. AI는 이미 들어간 소음을 되돌릴 수 없습니다.

정확도에 영향을 주는 두 가지가 더 있습니다. 하나는 화자가 바뀌는 지점을 어떻게 판단하느냐인데, 사람들이 겹쳐서 말할수록 어려워집니다(가족이 저녁 식사하는 걸 전사하면 400단어짜리 글자 덩어리 하나가 나올 이유가 여기 있습니다). 다른 하나는 커스텀 어휘 지원입니다. 어떤 범용 모델도 학습한 적 없는 제품 이름, 성씨, 약어를 입력할 수 있는 기능입니다. Whisper는 로컬 Whisper 엔진에서 커스텀 어휘 설정과 핫워드 우선순위 조정을 지원하며, 많은 회의 봇도 마찬가지입니다. 통화에 전문 용어가 많다면, 이 설정 하나가 모델 업그레이드보다 훨씬 값어치가 있습니다.

봇 없이 오프라인으로: 이미 갖고 있는 녹음 파일 전사하기

검색어가 잘 드러내지 않는 경로이자, 저희 앱이 만들어진 목적이기도 합니다. 소프트웨어가 회의에 참가할 필요가 없는 경우도 있습니다. 1:1 미팅 음성 메모, 인터뷰, 웨비나 내보내기, 동료가 보낸 클립 — 이미 녹음 파일이 있고, 봇이 없어도 내 기기에서 그냥 깔끔한 텍스트가 필요한 경우입니다.

Whisper 같은 딕테이션·전사 소프트웨어가 여기서 제 역할을 하며, 프라이버시 면에서 진가를 발휘합니다. 로컬 모드의 모든 처리는 노트북에서 이루어집니다. 오디오가 기기를 떠나지 않습니다. 서버를 거치지 않고, 공급업체 로그도 없고, 클라우드 비용 미터도 없습니다. 상사의 급여 논의, 법적 녹음, HR 대화 — 이 중 어느 것도 단지 전사가 필요하다는 이유로 제3자의 저장소에 올라가서는 안 됩니다. 여기서 로컬 우선은 기능이 아닙니다. 핵심 자체입니다.

Whisper
로컬에서 실행 중인 실제 Whisper 앱 — 직접 클릭해보세요. 이것이 봇 없는 경로입니다. 이미 갖고 있는 녹음 파일을 가리키면 내 기기에서 깔끔한 텍스트가 나옵니다.

Whisper는 두 가지 로컬 엔진을 실행하며, 둘 다 transcribe-rs를 통한 순수 Rust로 구동됩니다. Python 사이드카 없이 빠르게 시작됩니다. 첫 번째는 OpenAI의 오픈소스 Whisper로, 다국어 버전에서 99개 언어를 지원하고 영어로 번역할 수 있으며, 모델 크기는 약 140 MB의 Base부터 약 3 GB의 Large v3까지 다양합니다. 영어 전용 버전은 말 그대로 영어만 지원하며 약간 더 가볍게 실행되는 경향이 있습니다. 두 번째 엔진은 NVIDIA의 Parakeet TDT로, 약 600 MB이며 앱 내에서 CPU 기준으로 Whisper보다 5~10배 빠르다고 설명되어 있습니다. 영어와 24개 유럽 언어(총 25개)를 지원하며 영어 번역 기능은 없습니다. 주로 영어로 작업한다면 속도를 위해 Parakeet를 선택하고, 번역이 필요하거나 Parakeet가 지원하지 않는 언어가 필요하다면 Whisper를 선택하세요.

CancelTranscribing
녹음 파일을 처리하는 동안 나타나는 Whisper 오버레이 — 누군가의 통화에 봇이 없는 작은 플로팅 위젯.

저도 하루 종일 이 방식을 씁니다. 단축키를 누르고 — Windows에서는 Ctrl+Space, Mac에서는 Command+Option 푸시 투 토크 조합을 눌렀다가 어느 키든 떼면 멈춥니다 — 말하면, 포커스된 앱의 커서 위치에 텍스트가 나타납니다. 작동하는 동안 작은 오버레이가 상태를 보여줍니다. 실시간 음성이 아닌 녹음 파일의 경우, 앱에 파일을 가리키면 전사문이 돌아옵니다. 딕테이션 부분이 구체적으로 궁금하다면, 저희의 오프라인 음성-텍스트 변환 가이드에서 기기 내 전체 실행 방법을 더 자세히 다룹니다.

최신 OpenAI 모델을 원하는 분들과 같은 도구에서 음성 기반 웹 검색을 원하는 분들을 위한 Cloud 옵션도 있습니다. 본인의 OpenAI 키를 가져와서 "Hey whisper"라고 말하면 텍스트가 AI를 통해 처리됩니다. 하지만 이미 갖고 있는 녹음 파일을 전사하는 용도라면 로컬 모드가 정답이며, 로그인한 모든 사용자에게 무료입니다.

알아둘 만한 다른 도구들

이 분야는 혼잡하고, 검색 결과는 6~10개 도구씩 순위를 매기는 리스트가 장악하고 있습니다. 열 개의 리뷰를 읽지 않아도 각 도구가 무엇을 위한 건지 알 수 있도록 간단히 정리했습니다. 아래의 모든 기능 설명은 각 도구의 공식 페이지에서 가져왔습니다.

  • Otter.ai기본 회의 노트 테이커입니다. Zoom, Teams, Meet에 봇이 참가하며, 월 300분이 포함된 무료 Basic 플랜과 그 위의 유료 Pro 및 Business 티어가 있습니다. 영어, 스페인어, 프랑스어, 독일어, 일본어, 중국어 등 6개 언어로 전사합니다.
  • Fireflies.ai초대 또는 캘린더 자동 참가 방식으로 봇이 합류합니다. 무제한 전사와 제한된 AI 요약이 포함된 무료 플랜을 제공하며, 티어 전반에 걸쳐 100개 이상의 언어를 지원한다고 내세웁니다.
  • tl;dvMeet, Zoom, Teams를 녹화하고 봇 없는 모드를 내세우며, 30개 이상의 언어로 전사합니다. 시간 제한과 카드 등록 없이 무료 영구 플랜을 제공합니다.
  • Fathom무제한 녹화가 포함된 무료 영구 플랜과 봇 없는 캡처(베타) 또는 봇 캡처 중 선택이 가능하며, 그 위에 유료 Premium, Team, Business 티어가 있습니다.
  • NottaZoom, Teams, Meet용 회의 봇과 무료 티어가 있으며, 자체 도움말 센터에 약 58개 언어가 나열되어 있습니다.
  • Zoom 및 Teams 내장 기능무언가를 구매하기 전에, 이미 비용을 내고 있는 것을 먼저 확인하세요. Zoom은 클라우드 녹화를 전사하고 적격 유료 플랜에서 AI Companion 실시간 전사를 46개 언어로 제공합니다. Microsoft Teams는 약 50개 이상의 구어 언어에서 내장 실시간 전사를 제공하며, 실시간 번역 전사는 Teams Premium이 필요합니다.

각 도구의 공식 페이지에서 확인할 수 있는 정보만 담아 같은 내용을 표로 정리했습니다. 정확도나 속도 수치는 포함하지 않았습니다. 같은 오디오로 비교 테스트를 아무도 하지 않았고, 제가 그걸 만들어내지 않을 것이기 때문입니다.

회의 전사 도구 비교 — 캡처 방식, 실행 환경, 오프라인 지원, 가격 모델, 언어 수, 적합한 용도 기준.
도구캡처 방식로컬/클라우드오프라인 지원가격 모델언어적합한 용도
Otter.ai봇이 통화에 참가클라우드아니오무료 티어 + 유저당 유료6기본 팀 노트 테이커
Fireflies.ai초대 또는 자동 참가 봇클라우드아니오무료 티어 + 유저당 유료100+넉넉한 무료 전사
tl;dv통화 녹화, 봇 없는 모드 지원클라우드아니오무료 영구 + 유료30+회의 그리드에 봇 없이
Fathom봇 없는 캡처(베타) 또는 봇클라우드아니오무료 영구 + 유료가격 페이지에 명시 없음무제한 무료 녹화
Notta봇이 통화에 참가클라우드아니오무료 티어 + 유료~58 (its help center)봇 + 무료 티어
Zoom / Teams (built in)통화 자체 기능클라우드아니오적격 유료 플랜 포함Zoom 46, Teams 50+이미 비용을 내는 기능
Whisper by Remskill통화 없음; 파일 또는 딕테이션 전사로컬 (클라우드 선택 가능)무료 로컬 티어 + Pro99 multilingual, 25 Parakeet프라이빗, 봇 없는, 기기 내 처리

이미 유료 Zoom 또는 Teams 플랜으로 회의를 진행하고 있다면, 내장 전사 기능만으로 충분할 수 있습니다. 구독을 하나 더 추가하거나 통화에 봇을 하나 더 넣지 않아도 됩니다.

상황별로 내가 선택할 것

지원 이메일을 읽다 보니 잘못된 도구를 선택한 후회를 자주 접하게 됩니다. 제가 선택한다면 이렇게 하겠습니다.

  • 팀 화상 통화 노트를 자동으로, 모든 사람에게 공유되게 원한다. 봇 노트 테이커를 사용하세요. 잘 다듬어진 기본 옵션을 원한다면 Otter, 넉넉한 무료 티어를 원한다면 Fireflies 또는 Fathom, 회의 그리드에 봇을 넣고 싶지 않다면 tl;dv.
  • 이미 유료 Zoom 또는 Teams 플랜을 사용하고 있다. 세 번째 도구에 비용을 내기 전에 내장 전사 기능을 먼저 시도해보세요.
  • 녹음 파일이 있고, 깨끗한 텍스트를 비공개로 내 기기에서 원한다. 봇 없이 오프라인으로 처리하는 경로입니다. Whisper 또는 다른 로컬 전사 도구를 사용하세요. 오디오는 기기에 남습니다.
  • 통화 중이나 이후에 이메일, 문서, 노트를 음성으로 커서 위치에 어떤 앱에서든 쓰고 싶다. 그건 딕테이션이고, Whisper가 만들어진 목적입니다. 저희의 전사 소프트웨어 비교에서 딕테이션과 회의 노트의 차이를 더 자세히 설명합니다.
  • 법적·컴플라이언스 기록을 위해 거의 완벽한 전사가 보장되어야 한다. 사람이 검증하는 서비스를 이용하세요. 실제 오디오에서 AI만으로는 99% 미만에 머뭅니다.

피해야 할 실수는 딕테이션 용도로 회의 봇에 비용을 내거나, 딕테이션 도구가 통화에 참가하길 기대하는 것입니다. 서로 다른 카테고리입니다. 해당 작업에 맞는 것을 선택하세요. 저도 15년간 소프트웨어를 만들어왔고 작년에도 용도에 맞지 않는 도구를 샀습니다. 처음부터 잘한 사람이 하는 강의가 아닙니다.

가격, 숫자로 간단하게

여기서 소개하는 도구 대부분은 카드를 꺼내기 전에 시도해볼 만한 무료 티어가 있습니다. Otter, Fireflies, tl;dv, Fathom 모두 무료 플랜을 제공하며, 더 많은 분, 더 많은 시트, 무제한 저장이 필요할 때 유료 티어로 올라갑니다. 봇 노트 테이커는 일반적으로 유저당 월 요금을 받으며, 팀 전체로 보면 금방 쌓입니다.

Whisper는 전체 로컬 파이프라인에서 로그인한 모든 사용자에게 무료입니다 — 두 엔진 모두, Ollama를 통한 AI 향상, 히스토리, 프리셋, 커스텀 어휘, 단축키 — 가입 시 결제 수단을 요구하지 않습니다. 유료 티어는 OpenAI 모델과 음성 웹 검색을 원하는 분들을 위한 Cloud 기능을 추가합니다. 월별, 연별, 평생, 팀 시트의 정확한 금액은 가격 페이지에서 확인하세요. 여기서 맥락 없이 가격을 꺼내는 것보다 무료로 시작해서 직접 판단하시길 권합니다.

브랜드보다 도구의 종류를 먼저 선택하세요. 봇이 통화에 참가해야 한다면 노트 테이커를 사용하세요. 노트북에 있는 녹음이 비공개 텍스트가 되어야 한다면 오프라인 도구를 사용하세요. 제가 목격한 다섯 자리 청구서는 어떤 일을 위해 비용을 내는지 한 번도 묻지 않은 데서 나왔습니다. 그건 아무도 전사가 필요 없었던 회의였습니다.

이미 갖고 있는 녹음으로 봇 없는 경로를 경험해보세요

Whisper를 다운로드하고, 녹음 파일을 가리키면 내 기기에서 봇 없이 깔끔한 텍스트가 돌아오는 것을 확인하세요.

전체 로컬 파이프라인을 로그인한 모든 사용자에게 무료로 제공합니다. 가입 시 결제 수단 불필요.

Denys Medvediev 사진

Denys Medvediev

저는 지원 이메일을 읽는 사람이고, 아마 답장도 딕테이션으로 씁니다.

더 읽어보기