Sammenligning
Speechmatics-alternativ: API eller app?
Speechmatics er en tale-til-tekst-API til udviklere, som du bygger ind i dit eget produkt. Whisper er en færdig desktop-app, du trykker på en genvejstast og dikterer med. Forskellig kategori, forskellig køber — og søgningerne bliver ved med at smide de to i samme bunke.
Sidst opdateret: juni 2026

Hvad et Speechmatics-alternativ er, afhænger af, hvad du egentlig vil erstatte. Speechmatics er en tale-til-tekst-API til udviklere, som du kobler ind i dit eget produkt. Har du brug for det, er de reelle alternativer AssemblyAI, Deepgram, Google Cloud Speech-to-Text, AWS Transcribe og OpenAIs open source-model Whisper. Cirka fire ud af fem, der søger på dette, ønsker en API at sætte ind i koden — ikke et værktøj at installere og trykke en genvejstast på. Whisper by Remskill er den anden slags: en desktop-dikteringsapp du bruger, ikke en tjeneste du kalder fra et backend. Tryk på en systemdækkende genvejstast, tal, og teksten lander ved din markør i enhver app — lokalt, uden timemåler på lyden. Så det ærligste første skridt er at finde ud af, hvilken gruppe du tilhører, inden du læser videre.
De fleste, der søger efter "Speechmatics-alternativ", er udviklere. Cirka fire ud af fem vil have en API til at sætte ind i koden — ikke et værktøj at installere og trykke en genvejstast på. Det har betydning her, for Whisper by Remskill er den anden slags: en desktop-dikteringsapp du bruger, ikke en tjeneste du kalder fra dit backend.
Jeg driver Whisper by Remskill. Jeg vil ikke lade som om, den konkurrerer med en enterprise-ASR-motor — det gør den ikke. Forskellig kategori, forskellig køber. Det, jeg kan gøre, er at fortælle dig ligeud, hvilke værktøjer der passer til hvilke opgaver, og hvor skillelinjen går. Den kedelige sandhed er, at de fleste "alternativ"-lister springer dette trin over og efterlader en udvikler med en dikteringsapp, der slet ikke har en API at kalde.
Hvad Speechmatics er: en ASR-motor til udviklere

Speechmatics beskriver sig selv som tale-API'er, der driver voice-AI. Du kobler det ind i dit eget produkt via dets API. Det leverer realtidstranskription med under et sekunds latenstid og batchbehandling, og du kan deploye det som cloud-API, on-device eller on-premises. Det dækker 55+ sprog til transkription og 69 sprogpar til AI-oversættelse, ifølge egne tal.
Kunderne er teams, der bygger transkription ind i noget større: call center-analyser, live-undertekster, medicinske og juridiske transkriptionspipelines, voice agents. Intet af det er én person, der forsøger at besvare en e-mail ved at tale.
Prissætningen fortæller samme historie. Speechmatics er forbrugsbaseret og faktureres pr. lydtime. Gratisplanen giver dig 2.400 minutter — 40 timer — tale-til-tekst om måneden, to samtidige realtidssessioner og intet kort at starte med. Pro starter fra $0.24 pr. lydtime og lofter ved 6.000 timer om måneden. Enterprise er skræddersyet med on-prem-deployment og brugerdefinerede modeller. Det er en måler — og en måler er præcis, hvad du vil have, når du behandler tusindvis af timer igennem et produkt. Det er præcis, hvad du ikke vil have, når du dikterer en indkøbsliste.
Skellet: en motor til at bygge med kontra en app til at bruge

Her er linjen, trukket én gang, klart.
En motor som Speechmatics er noget, en udvikler integrerer. Du sender den lyd over en API, får tekst tilbage, og bygger selv knapperne, UI'et, lagringen og faktureringen. Det er råmateriale.
En færdig app er noget, du installerer og kører. Whisper by Remskill er den anden slags. Det er ikke en tale-til-tekst-API, SDK eller motor. Du kan ikke bygge den ind i dit eget produkt, kalde den fra kode eller sende lyd igennem den programmatisk. Der er intet endpoint at ramme. Det er en desktop-applikation styret af en systemdækkende genvejstast.
Ét navn forvirrer alle, så lad mig komme det i forkøbet. "OpenAI Whisper" — den open source-talemodel, du kan self-hoste og kalde som en API — dukker op på alle Speechmatics-alternativlister. Det er udviklervalget. Det er ikke det samme som Whisper by Remskill, den desktop-app jeg laver. Samme ord, forskellige kategorier. Vil du have en model at self-hoste, er det OpenAIs open source-model Whisper, du vil have. Vil du have et færdigt værktøj at diktere med, så læs videre.
Har du brug for en API at bygge på, er her hvem du skal se på
Hvis du er her for en motor, vil jeg hellere sende dig hen til den rigtige end at spilde din eftermiddag. De reelle tale-til-tekst-API'er i denne kategori — dem der faktisk erstatter Speechmatics for en udvikler — er:
- AssemblyAI — tale-til-tekst-API med batch og realtid, rettet mod produktteams.
- Deepgram — streaming-API med lav latenstid, populær til voice agents.
- Google Cloud Speech-to-Text — hyperscaler-valget med bred sprogdækning.
- AWS Transcribe — samme tanke inden for AWS-regningen.
- OpenAIs open source-model Whisper — self-host modellen og kør den selv.
- Gladia — en nyere transkriptions-API i samme spor.
Alle disse er API'er og motorer, du bygger ind i din egen kode. Jeg vil ikke opfinde nøjagtighedsprocenter eller priser for dem — det er sådan, alternativlister ender med at tage fejl ved selvsikkert at citere et tal fra en prisside, der ændrede sig for et kvartal siden. Pointen er kategorien: har du brug for en måler og et endpoint, er et af disse dit svar — og Whisper by Remskill er det ikke.
Hvad Whisper gør i stedet: genvejstast, tal, indsæt
Nu den anden gruppe — dem, der ikke skriver kode og bare vil tale i stedet for at taste.
Whisper by Remskill er diktering først. Du trykker på en systemdækkende genvejstast, taler, og transkriptionen lander ved din markør i den app, du allerede er i. Intet upload-trin, intet projektbibliotek, ingen API at lære. Standardgenvejstasten er Ctrl+Space på Windows og Command+Option — et hold-for-at-tale-akkord — på macOS. Du kan ændre den.
Fordi den skriver ved markøren, virker den overalt — din e-mailklient, et dokument, et chatfelt, en kodekommentar — uden at nogen behøver at bygge en integration til hver app. Det er hele tricket, og det er det modsatte af en motor. En motor venter på, at din kode kalder den. Denne venter på, at du trykker en tast. Første gang jeg viste det til min kone, dikterede jeg en indkøbsliste direkte ind i en besked til hende. Hun svarede "super, men du glemte mælken." Appen virkede. Min hukommelse gjorde ikke.
De flersprogede modeller dækker 90+ sprog til live tale, og de ikke-engelske Whisper-modeller kan oversætte talt input til engelsk undervejs. Det er tale-til-engelsk, ikke den 69-par tekst-oversættelsestjeneste, Speechmatics sælger — forskellig opgave, mindre omfang, ærlig om det.
Lokalt og offline: ingen lydtimer, ingen forbrugsbetaling

I lokal tilstand transkriberer Whisper udelukkende på din maskine. Lyden forlader aldrig enheden, der er intet netværkskald til transkription, og der er ingen timemåler på lyden. Hele den lokale pipeline — modeller, on-device AI-oprydning, historik, brugerdefinerede ord, genvejstasten — er gratis for enhver logget ind bruger, uden kort ved tilmelding.
Jeg vil være fair her, for ærlighed er pointen. Speechmatics har også en gratis plan — generøse 40 timer om måneden — og tilbyder også on-prem og on-device deployment til udviklere. Så "gratis" og "offline" er ikke magiske ord, som kun Whisper ejer. Den reelle forskel er formen. Speechmatics giver en udvikler en motor, de måler og integrerer. Whisper giver en enkeltperson en færdig app med nul integrationsarbejde og ingen timebetaling.
Dette er den ene klare holdning, jeg vil bruge i denne artikel: timemåling på lyd er den forkerte form for en person, der bare vil diktere. Til $0.24 pr. time efter de gratis 40 giver en måler god mening, når du kører et produkt igennem den og har brug for forbrugsdata. Det giver ingen mening, når "produktet" er dig selv, ved et skrivebord, der besvarer e-mail. Du bør ikke skulle tænke på et ur, der tikker, mens du taler. En fast app-pris uden nogen måling overhovedet passer bedre til det liv. Hvis det betyder noget for dig at holde din diktering ude af skyen, er det den samme instinkt bag privat, on-device tale-til-tekst.
Hvornår Speechmatics er det rigtige valg

Jeg ville ikke skifte væk fra Speechmatics, hvis jeg byggede et produkt på den. Har du brug for at indsætte transkription i din egen applikation i stor skala — et call center-analysedashboard, live-undertekster, en medicinsk eller juridisk transkriptionspipeline, en voice agent — er Speechmatics eller et af de reelle API-alternativer det rigtige valg, og Whisper er det ikke. Det samme gælder, hvis du har brug for streng on-prem datasovereignty for mange samtidige sessioner eller dens 69 oversættelsespar. Whisper har intet svar på noget af det. Det er en enkeltbruger desktop-dikteringsapp, punkt. At vælge den forkerte kategori her koster dig en ombygning, ikke en refusion.
Hvad det koster bare at diktere
Whispers lokale dikteringsniveau er gratis for alle med en konto, ingen betalingsmetode ved tilmelding. Der er ingen forbrugsur — du betales ikke pr. lydtime, som Speechmatics måler Pro fra $0.24 pr. time. Den valgfrie Cloud-overflade, der bruger din egen OpenAI-nøgle til cloud-transkription og websøgning, ligger bag en fast app-pris frem for en pr.-minut-måler. De aktuelle tal finder du på prissiden; det eneste værd at huske er formen — en fast pris for en app, ikke en måler for en motor.
Vil du tale i stedet for at taste?
Kom du her for en motor at bygge på, så tag en af de rigtige API'er og gå — din kode vil takke dig. Kom du her, fordi du er træt af at taste og bare vil tale, er det det smalle segment, Whisper faktisk er bygget til. Download den, hold genvejstasten nede, og se transskriptet dukke op, der hvor du allerede skriver. Vælg kategorien, ikke modeordet.
Gratis lokal diktering for evigt. Ingen betalingsmetode ved tilmelding. 7-dages Cloud-prøveperiode beder kun om et kort ved opgradering.



