Vejledning
Transskribér YouTube-videoer: 3 måder
Tre metoder dækker stort set alt: åbn videoens egen transskriptionspanel, indsæt linket i en gratis generator, eller diktér dine egne noter med stemmen. De første to kræver kun en browser.
Senest opdateret: juni 2026

Hvis du vil transskribere YouTube-videoer, dækker tre metoder stort set alt: åbn videoens eget Vis transskription-panel for enhver video med undertekster, indsæt linket i en gratis online transskriptionsgenerator for renere tekst og download, eller optag og diktér dine egne noter med et skrivebordsværktøj. De første to kræver kun en browser.
Sidste uge brugte jeg tyve minutter på at forsøge at kopiere tre sætninger ud af et fyrre minutter langt konferenceoplæg. Ikke transskribere det hele. Tre sætninger, sagt et sted omkring atten-minutters-mærket, som jeg ville citere i en e-mail. Jeg spolede frem og tilbage, som om jeg desarmerede en bombe. Den kedelige sandhed er, at de fleste, der griber ud efter et værktøj til at transskribere YouTube-videoer, ikke har brug for hele transskriptionen. De vil læse i stedet for at se, fange et citat eller forvandle en video til noter, de kan søge i senere.
YouTube-videoer hober sig op i faneblade, ligesom ulæste bøger hober sig op på en hylde, og at se en i normal hastighed er den langsomste måde at få information ud af den på. Lige nu er søgeresultaterne for dette en mur af indsæt-et-link-widgets, alle næsten ens, alle med løfter om gratis transskriptioner på sekunder. De fleste af dem fungerer fint. Spørgsmålet er, hvilken metode der passer til det, du laver. Denne guide gennemgår tre: YouTubes egen indbyggede transskription, gratis URL-indsæt-generatorer og et skrivebordsdikteringsværktøj til den del, som de generatorer ikke kan røre. Til sidst ved du, hvilken du skal gribe efter på under ti sekunder, og du spoler ikke i en tidslinje med sammenbidte tænder. Jeg læser vores supportmail, så jeg har set mange mennesker vælge den forkerte først. Som regel lige efter at jeg selv valgte den forkerte først.
Den gratis vej findes allerede inde i YouTube
Hvis videoen har undertekster, har du allerede transskriptionen. Du behøver ikke et værktøj, en konto eller et betalingskort. Åbn videoen, kig under den efter beskrivelsesområdet, og klik på Vis transskription. Et panel åbner ved siden af afspilleren med hele teksten, og mens videoen kører, ruller panelet til den linje, der bliver sagt. Klik på en hvilken som helst linje, og videoen hopper til det øjeblik.
Det er den metode, de fleste artikler begraver nederst, sandsynligvis fordi der ikke er noget at sælge omkring den. Den virker på computer og på mobil. Hagen: videoen skal have undertekster til at begynde med. De fleste populære kanaler har dem, automatisk genererede eller tilføjet af den, der har uploadet, men en lille skabers ældre upload har det måske ikke.
Tjek, at det virkede: transskriptionspanelet viser tekst, der ruller i takt med lyden. Hvis det slet ikke åbner, har videoen ingen undertekster, og så går du videre til metode to.
Én ting mere, folk overser. Transskriptionspanelet har en lille menu til at slå tidsstemplerne fra, hvilket gør teksten langt nemmere at kopiere som ren prosa. Den knap bor i panelet, ikke i supportdokumenterne. Den er bredt dokumenteret, men ikke på YouTubes officielle hjælpeside. Værd at vide, før du indsætter en mur af tal i et dokument.
Indsæt et link, få renere tekst
Når du vil have transskriptionen uden for YouTube (for at downloade den, køre den gennem et opsummeringsværktøj eller læse en video, der kæmper imod dig på det indbyggede panel), er en gratis URL-indsæt-generator vejen frem. Formen er altid den samme. Kopiér YouTube-URL'en, indsæt den i et felt, få teksten tilbage.
Tactiqs gratis YouTube-transskriptionsgenerator tager en indsat URL, kræver ingen installation, ingen tilmelding og ingen e-mail, og lader dig downloade resultatet som en .txt-fil. Den er ærlig om, at den automatiske talegenkendelse ikke altid er 100 % nøjagtig, hvilket er det ærlige at sige. NoteGPT's generator laver det samme indsæt-et-link-trick, giver en transskription med tidsstempler, understøtter flere sprog, lader dig kopiere med eller uden tidsstemplerne og kaster en AI-opsummering oveni. Det førende resultat, youtubetotranscript.com, reklamerer med oversættelse, længdegrænser og en API i sin FAQ. Tag det som reklame, ikke som testet.
Tjek, at det virkede: du kan markere, kopiere eller downloade transskriptionsteksten. Hvis værktøjet går i stå eller ikke returnerer noget, har videoen som regel ingen undertekster at trække fra. Disse generatorer læser YouTubes eksisterende undertekstspor, de lytter ikke til lyden.
Den sidste sætning er hele begrænsningen. Og det er der, den tredje metode kommer ind.
Det, link-værktøjerne ikke kan
Alle metoder ovenfor afhænger af, at YouTube har et undertekstspor at give videre. Ingen undertekster, ingen transskription. Det dækker de fleste offentlige videoer, men det efterlader et hul: lyd, der slet ikke er en offentlig YouTube-video. Et privat link, nogen har delt med dig. En livestream uden undertekster endnu. Et klip i en kursusafspiller. Dine egne optagelser, før du uploader dem.
Det efterlader også et andet, mere stille hul. Nogle gange vil du ikke have videoens ord. Du vil have dine ord om videoen. Noten, du ville skrive, mens du så med. Resuméet i din egen formulering. De tre sætninger, du ville diktere til en kollega for at forklare, hvorfor dette oplæg betyder noget.
Det er her, et skrivebordsstemmeværktøj gør sig fortjent til sin plads, og det er værd at være præcis om, hvad det gør og ikke gør. Whisper by Remskill er en dikteringsapp, der styres med en genvejstast. Tryk på genvejstasten, tal ind i din mikrofon, og dine ord lander som tekst ved markøren i den app, du står i. Den tager ikke et YouTube-link og transskriberer videoen for dig. Det er indsæt-et-link-generatorernes job, ikke vores. Det, den gør, er at lade dig se en video og fange dine egne noter ved at tale i stedet for at skrive, hvilket for mange mennesker er den egentlige opgave, der gemmer sig bag transskribér denne video.
Tal dine noter, mens videoen kører
Her er det workflow, jeg bruger. Afspil videoen. Når noget er værd at gemme, hold genvejstasten nede, sig noten højt, slip. Teksten dukker op i dit dokument. Ingen faneskift, ingen pauser for at skrive, ingen tabt tråd.
På Windows er standardgenvejstasten Ctrl+Space. På macOS er det en push-to-talk-akkord med kun modifikatortaster: hold Command+Option nede sammen, slip en af tasterne for at stoppe. Du kan ændre den i Indstillinger, hvis den kolliderer med noget. Optagelses-overlayet viser dig, at det lytter, så du aldrig gætter på, om det fangede dig.
Transskription kører på to måder, og du vælger selv. Lokal tilstand kører på din egen maskine gennem to rene Rust-motorer: OpenAI Whisper, med modelstørrelser fra omkring 140 MB op til cirka 3 GB og 99 sprog på de flersprogede varianter, og NVIDIA Parakeet TDT, en enkelt model på ~600 MB, der dækker 25 sprog (engelsk plus 24 europæiske), den hurtigste af de to. Intet forlader din bærbare i lokal tilstand. Cloud-tilstand bruger din egen OpenAI-nøgle, med gpt-4o-mini-transcribe eller gpt-4o-transcribe til tale-til-tekst, til når du vil have de nyeste modeller og web-adgang.
Den lokale pipeline er gratis for enhver bruger, der er logget ind; cloud er Whisper Pro-laget.
Det er her, jeg indrømmer min egen forudindtagethed. De fleste produktivitetsværktøjer er skriveproblemer i forklædning. En noteapp, en udklipsholder, en andet-hjerne med elleve indlejrede databaser: under det hele ligger den samme handling — at flytte fingrene hen over tasterne for at fange noget, du allerede ved, hvordan du skal sige. Diktering springer tastaturet over. Tale kører omkring 145 ord i minuttet mod cirka 40 for tastning, så en videonote, der tog et minut at skrive, tager omkring femten sekunder at sige. Løsningen på et skriveproblem er som regel ikke en smartere app. Det er at lade være med at skrive.
Tjek, at det virkede: du kan se hele videoen og ende med en side fuld af noter uden nogensinde at røre tastaturet undtagen for at rulle.
Tidsstempler, SRT-filer og andre sprog
Tre ting, folk beder om, der ikke alle kommer fra samme sted, så lad mig sortere dem.
Tidsstempler. YouTubes indbyggede panel og NoteGPT giver dig begge linjer med tidsstempler, som du kan kopiere med eller uden tallene. Hvis du vil have tidsstempler knyttet til videoens eksisterende undertekster, så brug dem. Et dikteringsværktøj med mikrofon ved ikke, hvor du er i en andens video.
SRT- og VTT-undertekstfiler. Det er en undertekst-eksportopgave. OpenAIs egen tale-til-tekst-API kan udskrive srt- og vtt-formater med whisper-1-modellen, og redigeringsværktøjer som Descript laver undertekstfiler ud fra medier, du uploader. Whisper by Remskill indsætter ren tekst ved markøren. Den er bygget til at få ord ind i dine apps, ikke til at forfatte en .srt-fil. Rigtigt værktøj, rigtigt job.
Andre sprog. Indsæt-et-link-generatorerne håndterer flere sprog ud fra YouTubes undertekstspor. Hvis du dikterer dine egne flersprogede noter, dækker den lokale Whisper-motor 99 sprog på sine flersprogede modeller og kan oversætte tale til engelsk; Parakeet dækker 25 og oversætter ikke. For en trin-for-trin-opsætning af diktering går guiden til voice-to-text-appen det hele igennem.
Interviews og optagede samtaler. Det samme træk-fil-ind-flow håndterer optagede interviews, hvor du som regel vil have ren talertekst ud af en lang samtale. Vores guide til, hvordan man transskriberer interviews automatisk, dækker netop det tilfælde fra ende til anden.
Hvornår du helt bør springe Whisper over
Hvis din eneste opgave er at læse en offentlig YouTube-video som tekst, så spring Whisper over og tænk ikke to gange over det. YouTubes indbyggede transskription er gratis, øjeblikkelig og allerede installeret i din browser.
Hvis du har brug for en fil til download eller en renere kopi, klarer en gratis generator som Tactiq det uden konto og uden e-mail og eksporterer en .txt.
Hvis du klipper undertekster ind i en video, du redigerer, er en tung editor som Descript (som reklamerer med 30+ sprog og op til 95 % nøjagtighed på uploadede medier) den rigtige kategori, ikke os. Vi er til den del, de værktøjer ikke rører: at fange dine egne ord, med stemmen, mens du ser med.
Den eftermiddag, jeg mistede tyve minutter til tre sætninger, gik min ældste datter forbi, så mig spole de samme ti sekunder for fjerde gang og spurgte, hvorfor jeg ikke bare læste det. Jeg fortalte hende, at videoen ikke kom med en transskription. Hun sagde, alt har en transskription nu, far, og gik væk for at lave lektier, hun en time senere ville forhandle sig ud af. Hun havde for det meste ret. Transskriptionen er som regel allerede der: under videoen, bag et link eller én genvejstast væk i dine egne ord.
Prøv det på din næste video
Download Whisper og diktér din næste omgang videonoter i stedet for at skrive dem.
Gratis for hele den lokale pipeline. Intet kort ved tilmelding.



