Av Denys Medvediev

Jämförelse

Det ärliga Aqua Voice- alternativet

Aqua Voice är en molnbaserad dikteringsapp för Mac, Windows och iPhone som skriver in ditt tal i vilken app som helst i realtid och rättar grammatik och formatering medan du pratar. Det starkaste privata alternativet är Whisper by Remskill, vars lokala pipeline körs offline, är gratis och aldrig skickar ditt ljud någonstans.

Senast uppdaterad: juni 2026

En studiomikrofon av kondensatortyp på ett skrivbord i varmt, dämpat ljus, som anspelar på offlinediktering med rösten

Låt mig få intressekonflikten ur världen direkt. Det här är en jämförelse, och jag byggde en av de två sakerna i den. Så jag tänker ge Aqua Voice cred där det förtjänas, vilket är på fler ställen än man kanske väntar sig av en konkurrents blogg, och jag tänker vara konkret med det enda stället där vi faktiskt vinner.

Whisper by Remskill är ett privat Aqua Voice-alternativ vars hela lokala pipeline körs offline och gratis för alltid, utan ordgräns och utan betalningsmetod vid registrering. Aqua Voice är realtid, polerat och förfinar ditt tal i molnet medan du pratar. Skillnaden som spelar roll ryms i ett ord: moln.

Vad den här jämförelsen är, och vem som byggde den

Den tråkiga sanningen är att Aqua Voice är bra på det det gör. Det är realtid, det är polerat, och det bearbetar varje ord medan du pratar och rättar formuleringar och grammatik i farten. Om du redan betalar för det och är nöjd kan du nog stänga den här fliken. Det finns ett helt avsnitt nära slutet som talar om exakt när du bör stanna kvar.

För alla som läser vidare ryms skillnaden i ett ord: moln. Aqua skickar ditt ljud till sina servrar för att göra den där realtidsmagin. Vi gör det på din dator, gratis, och ljudet lämnar aldrig rummet.

Det är hela argumentet, och jag tänker ägna resten av artikeln åt att visa det snarare än att påstå det. Inga påhittade recensionssiffror, inga uppfunna användartal. Bara två funktionslistor och en tabell du kan stämma av mot bägge startsidorna.

Vad Aqua Voice faktiskt gör

Aqua Voice körs på Mac och Windows, och det finns även en iPhone-app. Det gör live, realtidsdiktering som passar in i varje app du redan använder, utan något uppstartsritual. Tryck, prata, och förfinad text dyker upp. Förfiningen är själva säljargumentet: den rättar grammatik, snyggar till formuleringar och formaterar medan du pratar.

Under huven är det en proprietär molnmotor. Marknadsföringen kallar den Avalon på den betalda nivån och Aqua Engine på den gratis, och det finns inga öppna vikter att granska. Den förstår 49 språk. Det är ett verkligt tal på en verklig startsida, och jag tänker inte förminska det.

När det gäller datahantering är Aqua mer noggrant än de flesta molnverktyg. Deras egen sida säger att ingenting lagras på deras servrar på nivåerna Starter och Pro, med Zero Data Retention reserverat för Enterprise. Det är en rimlig policy. Det är också fortfarande bara en policy. Ditt ljud lämnar din maskin, färdas till deras moln, blir transkriberat och kommer tillbaka. Du litar på ett löfte istället för att lita på fysiken.

Det finns en gratis Starter-nivå med tak på 1 000 ord, sedan en Pro-plan som faktureras årsvis, en Team-plan och Enterprise. Jag citerar inte siffrorna här, för prissidor ändras och du bör läsa deras och vår direkt vid källan. Det är formen som spelar roll: gratisnivån tar slut, och allt bortom den är ett abonnemang.

Vad du också får med Whisper by Remskill

Här är delen där jag beskriver det jag byggde, och sedan låter dig bedöma tabellen. Whisper by Remskill är två produkter på en och samma snabbtangent. Gratisnivån är hela den lokala pipelinen. Du får de 8 Whisper-transkriberingsmodellerna, Parakeet-motorn, helt offline AI-städning via Ollama, transkriberingshistorik, förinställningar, hotwords, hårdvaruacceleration, modellnedladdningar och en egen snabbtangent. Ingen betalningsmetod vid registrering, och ingen ordgräns. Du skapar ett konto, laddar ner appen, trycker på snabbtangenten och pratar.

Whisper
Den körande Whisper by Remskill-appen — sidofält, transkriberingspanel och AI-instruktionskort. Detta är det riktiga gränssnittet, inte en skärmdump.

Du väljer din lokala motor utifrån vad du behöver, inte vad vi puffar för. Whisper ger dig 99 språk, översätt-till-engelska, eget ordförråd, kontroll över beam-storlek och hotword-biasering, allt till priset av hastighet. Parakeet är NVIDIA TDT-motorn, runt 600 MB, och den körs 5 till 10 gånger snabbare än Whisper på en CPU, och täcker engelska plus 24 andra europeiska språk. Välj Parakeet för hastighet och engelska. Välj Whisper för språk, översättning eller finkontroll. Ingen av dem är standard. Det är ditt val.

Lokal träffsäkerhet hamnar oftast mellan 95 % och 99 %, och allt körs på din CPU utan att någon GPU krävs. Själva appen tar ungefär 25 MB på disken. Allt det sker på din maskin. Ingen rundtur, inga servrar, inget löfte att lita på.

Om du vill ha molnet har vi det också, och det är bring-your-own-key. Pro-nivån lägger till OpenAI-molntranskribering. Du klistrar in din egen OpenAI-nyckel och väljer modell: gpt-4o-mini-transcribe för runt $0.003 i minuten, eller gpt-4o-transcribe för högre kvalitet. AI-förbättringen körs på gpt-5-mini som standard, och det finns även webbsökning vid din markör via OpenAI:s Responses API. Vi tar inget påslag ovanpå OpenAI:s taxa. Din nyckel, din räkning — läs prissidan för Pro-siffrorna.

Plattformsberättelsen är den ärliga delen. Windows och macOS på Apple Silicon levereras båda i dag. Det finns ingen iPhone-app, ingen iPad-app, ingen Android. Om du dikterar från din telefon är det här Aqua helt klart ligger steget före.

Aqua Voice mot Whisper by Remskill, sida vid sida

Tabellen som ingen annan verkar fylla med riktiga rader. Inga siffror i den — kolla bägge prissidorna för dem.

Funktionsjämförelse mellan Aqua Voice och Whisper by Remskill
FunktionAqua VoiceWhisper by Remskill
PlattformarMac, Windows, iOSMac (Apple Silicon) och Windows; ingen mobilapp
Var ljudet bearbetasMoln; ljudet lämnar din maskinPå din maskin, offline
GratisnivåGratis upp till 1 000 ordHela den lokala pipelinen gratis för alltid, ingen ordgräns
Fungerar utan internetNej, det är molnbaseratJa, helt offline på den lokala pipelinen
MotorProprietärt moln (Avalon / Aqua Engine), inga öppna vikter8 Whisper-modeller + Parakeet, öppna modeller
Använd din egen OpenAI-nyckelErbjuds inteJa — Cloud är BYOK, inget påslag
Språk4999 flerspråkiga Whisper, 25 Parakeet
Översätt till engelskaEj angivetJa, på Whisper-modellerna
Realtidsförfining medan du pratarJa; dess signaturfunktionStädning körs efter yttrandet, via Ollama eller moln-AI
MobildikteringJa — iPhoneIngen mobilapp
PrismodellAbonnemang efter gratistaketGratis lokalt; valfritt Pro för Cloud

Några ärliga avläsningar av den här tabellen. Aquas realtidsförfining är genuint smidig, dess 49 språk täcker det mesta folk dikterar, och det levererar en mobilapp, vilket vi inte gör. Det är inga små segrar. Överallt där raden handlar om offline, integritet, den gratis lokala pipelinen eller antal språk lutar det åt andra hållet.

Att ditt ljud aldrig lämnar maskinen är hela poängen

Det är detta de flesta kom hit för att jämföra, så låt mig vara konkret. Aquas datapolicy är bra. Den säger att ingenting lagras på deras servrar på konsumentnivåerna. Jag tror dem. Men ”vi lagrar det inte” är inte samma sak som ”det lämnade aldrig”. Ditt ljud färdas fortfarande till ett moln för att transkriberas, eftersom det är så en molnmotor fungerar. Med Whisper by Remskills lokala pipeline finns det ingen server i kedjan alls. Modellen laddas in i ditt RAM-minne, din mikrofon matar den, och texten dyker upp: på ett flyg i flygplansläge, i ett säkerhetsrum, på ett tåg genom en tunnel. Du litar inte på ett löfte. Det finns ingenting att lova.

Pasted
Den levererade efter-dikterings-overlayen — hur en gratis, helt offline lokal diktering ser ut i samma stund den är klar.

Här är den enda åsikten jag tänker spendera i den här artikeln. Enbart molnbaserad diktering är en integritetskatastrof som väntar på att bli transkriberad. Din chefs löne-kalkylblad, mejlet till ditt barns skola, det juridiska utkast du sitter och skriver på tåget: inget av det borde lämna din dator bara för att du ville skriva med rösten. Ett team jag en gång jobbade med lät en konsult bygga en intern prototyp för molndiktering som anropade ett AI-API för varje yttrande. Den transkriberade samma standup-inspelningar fyra gånger om, eftersom logiken för ”smart återförsök” var alltför aggressiv. Chefen öppnade molnkostnads-instrumentpanelen i slutet av kvartalet och hittade en räkning med fem siffror. Konsultens lösning var ”vi optimerar prompten”. Ekonomichefens lösning var ”eller så slutar vi skicka möten vi redan har anteckningar för till en server”. Local-first var det billigare svaret och det mer privata, i samma mening.

Din dator har redan en mikrofon och en CPU. Den behöver ingen server i kedjan för att skriva ett enda stycke. Molnet är en utmärkt nödutgång och ett konstigt standardval.

När du bör stanna kvar på Aqua Voice

Det här avsnittet gör resten av artikeln förtjänt. Det finns verkliga skäl att stanna kvar, och jag tänker inte låtsas något annat.

Du vill ha en helt hanterad molnupplevelse och bryr dig inte om offline

Det här är det stora. Aqua är realtid, hostat och utan uppstart. Om det inte stör dig att ditt ljud kortvarigt ligger på en leverantörs server, och du hellre slipper ladda ner en modell eller fundera på motorer, är den hanterade molnupplevelsen genuint smidigare. Behåll det som funkar.

Du vill specifikt ha dess realtidsformatering

Aqua förfinar formuleringar och rättar grammatik medan du pratar, i ögonblicket, innan texten landar. Vår städning körs efter yttrandet snarare än mitt i meningen. Om den där live, ord-för-ord-förfiningen är funktionen du blev kär i så gör deras det, medan vår funkar annorlunda.

Du dikterar från din telefon

Aqua levererar en iPhone-app. Vi levererar på Windows och Mac på Apple Silicon, och det finns ingen mobilapp på vår roadmap. Om din dagliga diktering sker på en telefon behöver du deras verktyg.

För alla andra — soloskribenter, marknadsförare, säljare, studenter, föräldrar som svarar på ett mejl från en lärare medan de lagar middag, alla vars ord inte bör lämna rummet — börja med vår gratis lokala nivå och se om du någonsin slår i en vägg. Det finns ingen ordgräns och inget internet krävs.

Om du bara minns en sak

De flesta dikterings-jämförelseartiklar avslutas med att tala om för dig att du ska förvandla ditt arbetsflöde. Den här avslutas mindre. Det röstskrivning fixar är glappet mellan att ha något att säga och att få in det i dokumentet. Aqua sluter det glappet i realtid, i molnet, och tar betalt bortom gratistaket. Vi sluter det på din maskin, offline, med den lokala delen gratis. Om dina ord kan ligga på någon annans server är Aqua ett fint val. Om de inte kan det, eller om du helt enkelt hellre slipper, är det precis den gräns vi byggdes för.

Om du vill ha den djupare versionen av det argumentet skrev jag ner det i vår text om offline tal-till-text, och det finns även vår jämförelse med superwhisper-alternativ om du väger lokala alternativ mot varandra.

Prova den gratis lokala pipelinen först

Ladda ner Whisper by Remskill, skapa ett konto utan att något kort krävs, tryck på snabbtangenten och diktera. Ditt ljud stannar på din maskin, och om du aldrig behöver Cloud-nivån betalar du aldrig.

Gratis lokal transkribering för alltid, helt offline. Ingen betalningsmetod vid registrering. Den 7-dagars Cloud-provperioden ber om ett kort först vid uppgradering.

Foto av Denys Medvediev

Denys Medvediev

Jag är den som läser vår supportmejl, troligast genom att diktera svaren.

Vidare läsning