Af Denys Medvediev

Sammenligning

Lokal vs. cloud transskription

Lokal transskription kører talemodellen på din egen maskine, så dine lydoptagelser aldrig forlader enheden, fungerer offline og koster ingenting pr. minut. Cloud-transskription sender din lyd til en server med de nyeste modeller, hvilket er hurtigere på svagere hardware og kan tilføje live-websøgning – men lyden forlader din maskine, og du betaler pr. forbrug.

Sidst opdateret: juni 2026

Et moderne serverrum badet i blåt lys – en illustration af cloud-siden af valget mellem lokal og cloud-transskription

Lokal transskription holder din lyd på enheden, fungerer offline og koster intet pr. minut efter en engangsdownload af modellen. Cloud-transskription kører udbyderens nyeste model og kan søge på nettet, men kræver en forbindelse og opkræves efter forbrug. Vores app leverer begge dele bag én knap, så du skifter efter behov frem for at låse dig fast én gang for alle.

Det er hele afvejningen i to korte afsnit. Alt nedenfor er detaljerne bag.

Jeg kan skrive dette uden at tage side, fordi vores app leverer begge dele. Den lokale pipeline kører otte Whisper-modeller plus NVIDIAs Parakeet – alt i ren Rust på din CPU – og er gratis for alle indloggede brugere uden betalingskort. Cloud-overfladen er OpenAI-transskription med din egen API-nøgle, solgt som Pro-tilvalget. Samme genvejstast, samme overlay, én knap. Så når jeg siger, at lokal er det rigtige for de fleste, er det ikke fordi vi kun sælger lokal. Det er, hvad regnestykket siger.

Lokal betyder, at modellen ligger på din disk

Lokal transskription downloader en talemodel én gang og kører den derefter på din processor. Ingen upload, ingen server, ingen kontakt til nettet under en optagelse. Tag netværkskablet ud – det virker stadig.

Vores app gør dette i ren Rust via et bibliotek kaldet transcribe-rs uden nogen Python-runtime boltet på. Du vælger mellem otte Whisper-modeller, fra Base på ca. 140 MB op til Large v3 på ca. 3 GB, eller NVIDIAs Parakeet på ca. 600 MB – fem til ti gange hurtigere end Whisper på en CPU. Intet GPU kræves. Modellen indlæses i RAM, din stemme går ind, tekst kommer ud – og intet i den rejse rører internettet.

Downloaden er den eneste forhindring. En 3 GB-model er en reel download på hotel-Wi-Fi, og en laptop fra 2018 klarer en lille model fint men kvæler den store. Men efter den første download er der ingen pr.-minut-pris og ingen server i løkken. Vil du have den dybere version, har jeg skrevet et helt indlæg om at køre det helt offline. Se offline tale-til-tekst på skrivebordet.

Cloud betyder, at din lyd tager en tur

Cloud-transskription optager din lyd, sender den til en udbyders server, og serveren sender tekst tilbage. Du lejer andres hardware og deres nyeste model.

I vores app er cloud-tilstand bring-your-own-key OpenAI. Transskription kører på gpt-4o-mini-transcribe eller den højere kvalitet gpt-4o-transcribe, og du kan lægge AI-oprydning og live-websøgning oven på med den samme nøgle. Du leverer din egen OpenAI-nøgle og betaler OpenAI direkte. Vi tager intet snit og lægger intet oveni. Der er ingen stor model at downloade. Det kører det samme på en fem år gammel netbook som på en ny arbejdsstation, fordi arbejdet foregår på serveren – og det kan besvare et spørgsmål ved at søge på nettet, hvilket en lokal model simpelthen ikke kan.

Prisen ligger i selve konceptet. Din lyd forlader din maskine. Du har brug for en aktiv forbindelse. Og du betaler pr. minut – brøkdele af en øre – men det løber op, og det er opkrævet efter forbrug.

Den ærlige sammenligning side om side

Ingen tal i denne tabel med vilje. Se vores prisside for de konkrete tal. Dette handler om formen på hvert valg.

Sådan sammenligner lokal og cloud-transskription sig på privatlivs-, offline-, pris-, hastigheds-, model- og webadgangsdimensionen
Hvad du går op iLokal transskriptionCloud-transskription
PrivatlivLyden forlader aldrig din maskineLyden sendes til en udbyders server
Fungerer offlineJa, efter den engangsdownload af modellenNej, kræver en aktiv forbindelse
PrismodelIngen pr.-minut-pris efter downloadenOpkrævet efter forbrug – du betaler pr. brugt minut
Hastighed afhænger afDin CPU og modellens størrelseUdbyderens hardware og din forbindelse
ModelaktualitetDen model du downloadede – opdateret, når du vælger detAltid udbyderens nyeste model
Live webadgangNejJa, cloud kan søge og svare

Læs det fra top til bund, og mønsteret er klart. Lokal bytter bekvemmelighed mod privatliv, offline-brug og en fast pris. Cloud bytter privatliv og opkrævning mod den nyeste model og en webforbindelse. Ingen er bedre. De er gode til forskellige opgaver.

Hvornår cloud er det bedste valg

Jeg vil ikke lade som om lokal vinder hver gang. Der er reelle situationer, hvor jeg ville vælge cloud.

Hvis dit hardware er gammelt eller RAM-sultet, er cloud den venligere mulighed. En laptop fra 2017 med 8 GB RAM vil slås med en stor lokal model, mens cloud klarer det tunge løft et andet sted, og din maskine kun håndterer mikrofonen. Har du brug for absolut top-transskriptionskvalitet på svær lyd – kraftige accenter, overlappende talere eller fagterminologi – har de nyeste hosted-modeller en tendens til at klare sig en anelse bedre end det, du kan køre hjemme. Og vil du diktere et spørgsmål og få et websøgt svar sat ind ved markøren, kræver det cloud – punktum. En lokal model har ikke adgang til internettet.

Tråden der forbinder dem: cloud er redningsplanken ved svagt hardware, topkvalitet og live webadgang.

Hvornår lokal er det bedste valg

For de fleste, det meste af tiden, er lokal det, jeg ville starte med.

Hvis det, du dikterer, er privat – et lønregneark, en e-mail til dit barns skole, et juridisk udkast – bør det ikke ende i en leverandørs logger, bare fordi du vil skrive med stemmen. Lokal holder lyden på din maskine, punktum. Arbejder du i fly, tog eller caféer med ustabilt Wi-Fi, er det ligegyldigt for lokal, om du har signal. Og dikterer du meget, betyder den faste pris noget.

Her er den mening, jeg faktisk vil stå ved: prøv lokal først og brug cloud som redningsplanken, ikke som standarden. Er din Mac Apple Silicon eller din PC fra de seneste fire år, håndterer lokal hverdagsdiktering med 95% til 99% nøjagtighed uden en server i løkken. Fald tilbage til cloud, når du rammer en mur – svagt hardware, særligt svær lyd eller behov for websøgning. De fleste rammer aldrig muren.

Jeg har en grund til at være forsigtig over for cloud som standard. Et team, jeg arbejdede med, lod en konsulent bygge en intern cloud-AI-dikteringsprototype, der kaldte API'et for hvert udsagn. En smart retry-løkke transskriberede de samme standup-optagelser fire gange. Lederen åbnede omkostningsdashboardet sidst på kvartalet og fandt en fem-cifret regning. Konsulentens løsning var at optimere prompten. Regnskabschefens løsning var at stoppe med at betale for at transskribere møder, der allerede har noter. Opkrævet cloud er fint, indtil noget løber amok. Lokal har ingen tæller, der kan løbe løbsk.

Begge tilstande i én app

Whisper
Den live Whisper by Remskill-app med knappen til at skifte mellem lokal og cloud-tilstand ved siden af modelvalget. Dette er den rigtige grænseflade, ikke et skærmbillede.

Adskillelsen ovenfor er reel, men det er ikke et vejkryds, du forpligter dig til én gang. I vores app sidder begge tilstande bag den samme genvejstast og det samme optagelses-overlay, og skiftet er én knap. Dikter en privat e-mail lokalt om morgenen, skift til cloud for at faktatjekke en påstand med websøgning om eftermiddagen, skift tilbage. Du geninstallerer ingenting. Du låser dig ikke fast for altid.

Pasted
Post-diktering-overlayet, der vises uanset om du transskriberede lokalt eller i cloud.

Det er den del, som lokal-vs.-cloud-framen typisk overser. Det er ikke en religionskrig. Det er to redskaber i den samme skuffe, og det rigtige afhænger af den sætning, du er ved at sige. Vil du sammenligne de lokale motorer indbyrdes – hastighed versus sprogdækning – er det sit eget indlæg: Whisper vs Parakeet. Og overvejer du os op mod en bestemt konkurrent, superwhisper-sammenligningen gennemgår én i detaljer.

Hvis du kun skal huske én ting

Lokal til privatliv, offline-brug og fast pris. Cloud til den nyeste model, svagt hardware og webadgang. Prøv lokal først og behold cloud som redningsplanken. Det bedste er, at du ikke behøver vælge for evigt: én knap, begge tilstande – hvad end der passer til den sætning, du er ved at sige.

Prøv begge dele

De lokale motorer er gratis for alle indloggede brugere, og du kan tilføje cloud-overfladen, når du rent faktisk har brug for det. Download appen, dikter én privat e-mail lokalt, skift derefter og se, hvad cloud ændrer for dig.

Gratis lokal transskription for evigt. Intet betalingskort ved tilmelding.

Foto af Denys Medvediev

Denys Medvediev

Jeg er den, der læser vores support-e-mail – sandsynligvis ved at diktere svarene.

Videre læsning