Av Denys Medvediev

Guide

Slik transkriberer du intervjuer

For å transkribere et intervju automatisk sender du opptaket gjennom et tale-til-tekst-verktøy: et gratis, åpen kildekode-alternativ som Buzz eller OpenAI Whisper på din egen maskin for personvern, eller en skytjeneste når du i tillegg trenger taleretiketter og en ryddig editor. Velg lokalt for gratis og privat, sky for diarisering.

Sist oppdatert: juni 2026

Et podkaststudio med mikrofoner og en lydmikser, klargjort for å ta opp en samtale

For å transkribere et intervju automatisk sender du opptaket gjennom et tale-til-tekst-verktøy: et gratis, åpen kildekode-alternativ som Buzz eller OpenAI Whisper på din egen maskin for personvern, eller en skytjeneste når du i tillegg trenger taleretiketter og en ryddig editor. Velg lokalt for gratis og privat, sky for diarisering.

La meg si det litt klossete med en gang, for det sparer deg ti minutter. Whisper by Remskill — appen denne bloggen tilhører — transkriberer ikke intervjuopptak. Det er live-diktering: du holder nede en hurtigtast, snakker, og ordene havner ved markøren i den appen du bruker. Det er noe helt annet enn å mate inn et én-times opptak med to personer og få tilbake et merket transskript. Denne guiden handler derfor om verktøyene som faktisk løser intervjuoppgaven, skrevet av noen som heller vil sende deg til det rette verktøyet enn late som vi er det.

Et intervjutransskript er vanskeligere enn det høres ut av én grunn: talerne. Et vanlig transkripsjonsprogram gir deg en vegg av tekst. Det du egentlig vil ha er «Intervjuer:» og «Kilde:» foran hvert replikk. Det kalles diarisering, og ikke alle verktøy gjør det. Det avgjørende skillet er lokalt versus sky. Lokale verktøy kjører på laptopen din, koster ingenting og laster aldri opp lyden din. Skytjenester laster opp filen, men leverer som regel taleretiketter og gir deg en editor. Nedenfor er det ærlige kartet — og deretter delen der jeg forteller deg nøyaktig hvor vi passer inn og hvor vi ikke gjør det.

Den gratis, private løsningen kjører på din egen maskin

Er intervjuet sensitivt — en kilde som trenger beskyttelse, en pasient, en intern direktør — bør opptaket aldri forlate maskinen din. De gratis åpen kildekode-verktøyene transkriberer helt lokalt.

OpenAI Whisper er modellen de fleste av disse er bygget på. Den er utgitt under MIT-lisensen, du installerer den med én pip-kommando, og den transkriberer lydfiler fra kommandolinjen. Den finnes i seks størrelser, fire med engelskspråklige varianter, så du bytter hastighet mot nøyaktighet avhengig av maskinvaren din. Den er flerspråklig og kan til og med oversette tale til engelsk mens den transkriberer. Haken for intervjuer: standard Whisper skriver ned ordene, men merker ikke hvem som sa dem. Taleretiketter krever ekstra verktøy på toppen, eller en skytjeneste som har det innebygd.

Hvis kommandolinjen får øyet ditt til å rykke, er Buzz den enkle løsningen. Det er en grafisk app som transkriberer og oversetter lyd frakoblet på din personlige datamaskin, drevet av Whisper, og er MIT-lisensiert og tilgjengelig på macOS, Windows og Linux. Dra inn opptaket, velg en modell, vent, les transskriptet. For de fleste som vil transkribere et intervju gratis, er dette den korteste veien.

To til verdt å kjenne til. whisper.cpp er en ren C/C++-port av Whisper som kjører bare på CPU og er tungt optimalisert for Apple Silicon: raskere, ingen Python, men du kompilerer og kjører det fra kommandolinjen. Og MacWhisper er en Mac-app bygget rundt lokal Whisper og NVIDIAs Parakeet, med filtranskripsjon som hovedfunksjon — nøyaktig det intervjubruksscenarioet krever. Alle disse beholder lyden på maskinen din. Ingen av dem gir deg rene taleretiketter på egenhånd.

Skytjenester legger til taleretiketter og en editor

Her er veiskillet der du bestemmer hva personvernet ditt er verdt. De dedikerte transkripsjonsstjenestene laster opp opptaket ditt til sine servere, behandler det og gir deg tilbake et transskript som vanligvis navngir talerne og legger det inn i en editor der du kan rette navn og eksportere. Den bekvemmeligheten er reell — og for en offentlig podkast eller et panel du gjerne deler, er det det bedre valget.

Hvis det er det du trenger (retiketter for flere talere, tidsstempler, en ren redigeringsflate), se på den etablerte kategorien for møte- og opptakstranskripsjon fremfor en dikterings-app. Jeg har skrevet om dette landskapet i Otter.ai-alternativer-artikkelen og i Rev-alternativer-artikkelen; begge dekker skyverktøyene som håndterer diarisering og redigering skikkelig.

Her er meningen min — og den følger med en regning. Et team jeg jobbet med hadde en gang leid inn en konsulent for å bygge en intern dikteringsprototype som kalte en sky-AI for hvert utsagn. Lederen åpnet kostnadsdashbordet på slutten av kvartalet og fant et femsifret beløp, det meste fra å transkribere standup-opptak fire ganger på rad fordi retry-logikken var for ivrig. Økonomisjefens svar var kort: eller vi kan slutte å betale for å laste opp møter som allerede har referat. Pengene var det minste problemet. Det større var at en fjerdedel av interne samtaler nå lå på en leverandørs servere. Skytranskripsjon er genuint riktig valg for taleretiketter og redigering. Det er feil valg for et opptak du aldri ville sendt ut av bygningen. Velg på det grunnlaget, ikke på markedsføringen.

Slik velger du, kort og godt

Det er tre typer mennesker som havner på denne siden: de personvernbevisste, de med stram deadline, og de som bare vil ha talernavn uten å tenke på det. To av dem bør velge lokalt.

  • Trenger det gratis og privatBuzz (enklest) eller Whisper på din egen maskin. Lyden lastes aldri opp.
  • Trenger taleretiketter og en ryddig editoren skytranskripsjonsstjeneste. Lyden lastes opp — det er byttet.
  • På Mac, vil ha en filbasert appMacWhisper, lokalt.

Den ærlige tiebreakeren: er opptaket sensitivt, er svaret lokalt, punktum. Er det et offentlig foredrag og du vil ha diarisering servert, tjener sky seg inn. De fleste intervjutransskripsjoner er av den første typen, og det er grunnen til at jeg begynner med de gratis lokale verktøyene. Er rå behandlingstid bekymringen din, går guiden til rask lydtranskripsjon gjennom fartsknappene.

Hvor Whisper by Remskill faktisk passer inn

Pasted
Den ferdigleverte overleggsskjermen etter diktering — slik ser én live, fullt lokal diktering ut øyeblikket den er ferdig. Det finnes ingen «last opp opptak»-knapp her.

Nå til delen der jeg trekker grensen tydelig, for det verste utfallet av denne artikkelen ville være at du laster ned appen vår og forventer at den knauser et opptak. Det gjør den ikke. Whisper by Remskill er diktering først: en hurtigtast utløser den live talen din, som transkriberes og limes inn ved markøren i hvilken som helst app. Det finnes ingen «last opp en intervjufil»-knapp, og ingen taleseparering, fordi appen er bygget for én stemme: din, i øyeblikket.

Så hvor bruker en intervjuer den? Rundt intervjuet, ikke på selve opptaket. Du dikterer forberedende spørsmål i et dokument før du går inn. Du snakker ut oppfølgingsnotater sekundet samtalen er over, mens inntrykkene er ferske og hendene fortsatt holder en kaffekopp. Du utkaster artikkelen med stemmen når transskriptet er klart. Standard hurtigtast på Windows er Ctrl+Space, fullt mulig å endre, og hele den lokale pipelinen er gratis for alle innloggede brukere uten kort ved registrering. Det finnes også et betalt skynivå som legger til OpenAI-drevet transkripsjon og nettsøk for live-diktering, men det handler fortsatt om å skrive med stemmen — ikke om å transkribere et to-personers opptak.

Whisper
Det er den ekte skrivebordsappen — sidefelt, transkripsjonspanel og AI-instruksjonskort — ikke et skjermbilde.

Bruk den til skrivingen rundt intervjuet. Bruk Buzz eller en skytjeneste til selve intervjuet. Ulike verktøy, ulike jobber. Jeg vil heller at du visste det før du installerte noe som helst.

Et siste ord

De fleste intervjuopptakene det er verdt å transkribere, er de du minst vil laste opp: den uoffisielle bemerkningen, kilden som stolte på deg, pasienten. Det er hele grunnen til at de gratis lokale verktøyene fortjener plassen sin — filen forblir på laptopen din. Jeg brukte en helg på å justere modellinnstillinger for å rydde opp i mitt eget grøtete lydbilde, før jeg oppdaget at det egentlige problemet var laptopens mikrofon seks tommer fra en vifte. Jeg har en mastergrad. Kjøp mikrofonen først.

Og når transskriptet er klart og det er på tide å faktisk skrive artikkelen, er det da appen vår slutter å stå på sidelinjen.

Dikter artikkelen når transskriptet er klart

Transkriber intervjuet med Buzz eller en skytjeneste. Last deretter ned Whisper by Remskill og dikter artikkelen — den ene delen av intervjuarbeidsflyten vi er bygget for. Den lokale pipelinen er gratis, uten kort ved registrering.

Gratis lokal diktering for alltid. Ingen betalingsmetode ved registrering. Vi transkriberer ikke opptak — bruk et lokalt verktøy eller en skytjeneste til det.

Bilde av Denys Medvediev

Denys Medvediev

Jeg er den som leser støtte-e-posten vår, mest sannsynlig ved å diktere svarene.

Videre lesning