Af Denys Medvediev

Guide

Sådan transskriberer du interviews

Vil du transskribere et interview automatisk, skal du sende optagelsen gennem et tale-til-tekst-værktøj: et gratis open source-program som Buzz eller OpenAI Whisper på din egen computer, når privatlivets fred er vigtig — eller en cloudtjeneste, når du også har brug for højttalermærkning og en poleret editor. Vælg lokal for gratis og privat, cloud for diarisering.

Sidst opdateret: juni 2026

Et podcaststudiebord med mikrofoner og en lydmixer, klar til at optage en samtale

Vil du transskribere et interview automatisk, skal du sende optagelsen gennem et tale-til-tekst-værktøj: et gratis open source-program som Buzz eller OpenAI Whisper på din egen computer, når privatlivets fred er vigtig — eller en cloudtjeneste, når du også har brug for højttalermærkning og en poleret editor. Vælg lokal for gratis og privat, cloud for diarisering.

Lad mig starte med den akavede del, for det sparer dig ti minutter. Whisper by Remskill — den app, dette blogindlæg tilhører — transskriberer ikke interviewoptagelser. Det er live-diktering: du holder en genvejstast nede, taler, og ordene dukker op ved din cursor i en hvilken som helst app. Det er en helt anden opgave end at fodre programmet med en times optagelse af to mennesker og få en mærket transskription tilbage. Denne guide handler derfor om de værktøjer, der faktisk klarer interviewopgaven — skrevet af én, der hellere sender dig i den rigtige retning end foregiver, at vi selv er svaret.

En interviewtransskription er sværere, end det lyder, og det skyldes ét ting: højttalere. Et almindeligt transskriptionsværktøj giver dig en ubrudt tekstmur. Det, du som regel vil have, er »Interviewer:« og »Kilde:« foran hvert svar. Det kaldes diarisering, og det er langt fra alle værktøjer, der kan det. Den vigtige skillelinje er lokal kontra cloud. Lokale værktøjer kører på din laptop, koster ingenting og uploader aldrig din lyd. Cloudtjenester uploader filen, men håndterer til gengæld typisk højttalermærkning og giver dig en editor. Nedenfor finder du det ærlige kort — og bagefter den del, hvor jeg fortæller præcis, hvor vi passer ind, og hvor vi ikke gør.

Den gratis og private vej kører på din egen computer

Er interviewet følsomt — en kilde, der skal beskyttes, en patient eller en intern direktør — bør optagelsen aldrig forlade din maskine. De gratis open source-værktøjer transskriberer udelukkende lokalt.

OpenAI's Whisper er den model, de fleste af disse er bygget på. Den er udgivet under MIT-licensen, du installerer den med én enkelt pip-kommando, og den transskriberer lydfiler fra kommandolinjen. Den leveres i seks størrelser, fire med engelsksprogede varianter, så du afvejer hastighed mod nøjagtighed afhængigt af din hardware. Den er flersproget og kan endda oversætte tale til engelsk undervejs. Fangsten ved interviews: basis-Whisper skriver ordene ned, men mærker ikke, hvem der sagde hvad. Højttalerdiarisering kræver ekstra værktøjer oven på — eller en cloudtjeneste, der inkluderer det.

Hvis blot synet af en kommandolinje får dig til at trække på skuldrene, er Buzz den nemme vej. Det er en grafisk app, der transskriberer og oversætter lyd offline på din personlige computer — drevet af Whisper, MIT-licenseret og tilgængelig på macOS, Windows og Linux. Træk optagelsen ind, vælg en model, vent, læs transskriptionen. For de fleste, der vil transskribere et interview gratis, er det den korteste vej.

To mere, det er værd at kende. whisper.cpp er en ren C/C++-port af Whisper, der kører udelukkende på CPU og er stærkt optimeret til Apple Silicon: hurtigere, ingen Python, men du bygger det selv og bruger det fra kommandolinjen. Og MacWhisper er en Mac-app bygget omkring on-device Whisper og NVIDIAs Parakeet, der sætter filtransskription i centrum — præcis det, interviews kræver. Alle disse holder lyden på din maskine. Ingen af dem giver dig på egen hånd rene højttalermærker.

Cloudtjenester tilføjer højttalermærkning og en editor

Her er det, du skal tage stilling til: hvad er dit privatliv værd for dig? De dedikerede transskriptionstjenester uploader din optagelse til deres servere, behandler den og returnerer en transskription, der typisk navngiver højttalerne og lægger dem ind i en editor, hvor du kan rette navne og eksportere. Den bekvemmelighed er reel — og til en offentlig podcast eller et panel, du er fint med at dele, er det det bedre valg.

Har du brug for det (flersproget højttalermærkning, tidsstempler, en ren redigeringsflade), skal du kigge på den etablerede transskriptionskategori for møder og optagelser — ikke en dikteringsapp. Jeg har beskrevet det landskab i Otter.ai-alternativer-indlægget og i Rev-alternativer-indlægget; begge dækker de cloudværktøjer, der håndterer diarisering og redigering ordentligt.

Her er min vurdering — og den følger med en regning. Et team, jeg engang arbejdede med, lod en freelancer bygge en intern dikteringsprototype, der kaldte en cloud-AI for hvert eneste udsagn. Chefen åbnede omkostningsdashboardet ved kvartalets slutning og fandt et femsifret tal — det meste af det fra at gengenerere standup-optagelser fire gange, fordi genforsøgslogikken var alt for aggressiv. CFO'ens svar var kort: eller vi kunne stoppe med at betale for at uploade møder, der allerede har noter. Pengene var det lille problem. Det større var, at en fjerdedel af de interne opkald nu lå på en leverandørs servere. Cloud-transskription er vitterligt det rigtige valg til højttalermærkning og redigering. Det er det forkerte valg til en optagelse, du aldrig ville ønske forlod bygningen. Vælg ud fra den akse — ikke ud fra markedsføringen.

Sådan vælger du — kort fortalt

Der er tre slags mennesker, der lander på denne side: dem, der prioriterer privatlivets fred, dem, der er presset på deadline, og dem, der bare vil have højttalernavne uden at tænke over det. To af dem bør gå lokalt.

  • Har brug for gratis og privatBuzz (nemmest) eller Whisper på din egen maskine. Lyden uploades aldrig.
  • Har brug for højttalermærkning og en poleret editoren cloud-transskriptionstjeneste. Lyden uploades — det er handlen.
  • På Mac og vil have en fil-første-appMacWhisper, on-device.

Den ærlige afgørelse: er optagelsen følsom, er svaret lokal — punktum. Er det et offentligt foredrag, og vil du have diarisering serveret, er cloud pengene værd. Størstedelen af interviewtransskription er den første slags, og det er derfor, jeg starter med de gratis lokale værktøjer. Er rå behandlingstid din bekymring, gennemgår guiden til hurtig lydtransskription de relevante knapper.

Hvor Whisper by Remskill faktisk passer ind

Pasted
Det leverede post-diktering-overlay — sådan ser én live, fuldt lokal diktering ud i det øjeblik, den er færdig. Der er ingen »upload en optagelse«-knap her.

Nu til den del, hvor jeg trækker grænsen tydeligt — for det værste udfald af denne artikel ville være, at du downloader vores app i forventning om, at den kan tygge sig igennem en optagelse. Det kan den ikke. Whisper by Remskill er diktering-først: en genvejstast udløser din live tale, som transskriberes og indsættes ved cursoren i den app, du er i. Der er ingen »upload en interviewfil«-knap og ingen højttalerdiarisering — fordi det er bygget til én stemme: din, i øjeblikket.

Hvor bruger en interviewer det så? Rundt om interviewet, ikke i det. Til at diktere dine forberedende spørgsmål ind i et dokument, inden du går ind. Til at tale dine opfølgningsnoter ud i det sekund, samtalen slutter — mens indtrykkene er friske, og dine hænder stadig holder en kop kaffe. Til at udkaste artiklen med stemmen, når transskriptionen eksisterer. Standardgenvejen på Windows er Ctrl+Space — fuldt omprogrammerbar — og hele den lokale pipeline er gratis for alle tilmeldte brugere uden betalingskort ved oprettelse. Der er også et betalt cloud-niveau, der tilføjer OpenAI-drevet transskription og websøgning til live-diktering, men det handler stadig om at skrive med stemmen — ikke om at transskribere en optagelse med to mennesker.

Whisper
Det er den rigtige desktop-app — sidebjælke, transskriptionspanel og AI-instruktionskort — ikke et skærmbillede.

Brug den til at skrive rundt om interviewet. Brug Buzz eller en cloudtjeneste til selve interviewet. Forskellige værktøjer, forskellige opgaver. Jeg foretrækker, at du ved det, inden du installerer noget som helst.

Et sidste ord

De fleste interviewoptagelser, der er værd at transskribere, er præcis dem, du mindst vil uploade: den fortrolige bemærkning, kilden der stolede på dig, patienten. Det er hele årsagen til, at de gratis lokale værktøjer fortjener deres plads — filen bliver på din laptop. Jeg brugte en gang en weekend på at finjustere modelindstillinger for at rydde op i min mudrede lyd, inden jeg opdagede, at det egentlige problem var laptop-mikrofonen, der sad seks centimeter fra en blæser. Jeg har en kandidatgrad. Køb mikrofonen først.

Og når transskriptionen er færdig, og det er tid til at skrive selve artiklen — det er dér, vores app ophører med at være tilskuer.

Dikter artiklen, når transskriptionen eksisterer

Transskriber interviewet med Buzz eller en cloudtjeneste. Download derefter Whisper by Remskill og dikter artiklen — den ene del af interviewworkflowet, vi er bygget til. Den lokale pipeline er gratis uden betalingskort ved oprettelse.

Gratis lokal diktering for altid. Intet betalingskort ved oprettelse. Vi transskriberer ikke optagelser — brug et lokalt værktøj eller en cloudtjeneste til det.

Foto af Denys Medvediev

Denys Medvediev

Jeg er den, der læser vores support-e-mail — sandsynligvis ved at diktere svarene.

Videre læsning