Tutorial
Da voce a testo in Zendesk: le chiamate contro le tue risposte
Zendesk Talk trascrive la chiamata del cliente. Non scrive la tua risposta. Per dettare la risposta, la nota o la macro che scrivi davvero tu, ci pensa uno strumento con scorciatoia a livello di sistema come Whisper — offline, nell'Agent Workspace e in ogni app secondaria in cui passi la giornata.
Ultimo aggiornamento: giugno 2026

Da voce a testo in Zendesk si divide in due cose diverse. Zendesk Talk trascrive la chiamata registrata del cliente o il messaggio in segreteria e allega la trascrizione al registro del ticket — non scrive la tua risposta. Per dettare la risposta, la nota o la macro che scrivi davvero tu, Zendesk non ha alcuna funzione nativa; ci pensa uno strumento a livello di sistema come Whisper, con una scorciatoia.
La maggior parte degli agenti che cerca questa cosa vuole una cosa sola: smettere di digitare la stessa risposta per la quarantesima volta nella giornata e dirla a voce. Il divario tra il parlare e il digitare è reale — la maggior parte delle persone parla a circa 150 parole al minuto e ne digita forse un terzo sotto la pressione della coda, ed è tutto qui il senso della dettatura. Quindi la ricerca ha perfettamente senso. La confusione è su cosa facciano davvero le funzioni vocali di Zendesk, perché sembrano dettatura ma non lo sono. Ho passato un buon quarto d'ora nella documentazione di Zendesk a convincermi di aver perso l'interruttore della dettatura per l'agente. Non l'avevo perso. Non esiste. Lascia che tracci il confine in modo netto, poi ti mostro la parte che funziona.
Ecco la versione breve. Gli strumenti vocali di Zendesk vivono sul canale telefonico. Ascoltano il cliente. La cosa che hai in mente — tu che parli e le tue parole che finiscono nella casella della risposta — è una categoria diversa, e vive a livello di sistema operativo, non dentro Zendesk. Una volta che vedi questa divisione, tutto smette di essere confuso.
Premi una scorciatoia, parla e la tua risposta si scrive da sola
Il meccanismo è un tasto solo. Tieni premuta una scorciatoia globale, parli, rilasci e il testo finisce dove si trova il cursore — la risposta pubblica, una nota interna, il corpo di una macro, un articolo della Guide. Su Windows il valore predefinito è Ctrl+Space; su macOS è Command+Option tenuti premuti in modalità push-to-talk. Niente menu, niente caricamento, niente "clic per registrare". Lo stesso tasto funziona nell'Agent Workspace di Zendesk e in ogni altra app a cui passi tra un ticket e l'altro — Slack, Teams, Gmail, Notion.
Quest'ultima parte conta più di quanto sembri. Whisper è un'app desktop nativa per Windows e macOS, non un'estensione del browser. Così, quando esci con alt-tab dalla scheda di Zendesk per scrivere su Slack al team di sviluppo a proposito di un bug, la stessa scorciatoia funziona ancora. Un'estensione del browser si ferma al bordo della scheda. Lo stesso raggio d'azione a livello di sistema operativo è il motivo per cui il trucco funziona anche nel tuo CRM — gli agenti lo usano allo stesso modo per la dettatura vocale in Salesforce e la dettatura in HubSpot.
Zendesk Talk trascrive la chiamata. Non scrive la tua risposta.

Questa è la riga su cui inciampano tutti, quindi eccola chiara. Secondo le FAQ ufficiali di Zendesk sulla trascrizione delle chiamate, Talk prende una telefonata registrata tra un cliente e un agente e, una volta finita la chiamata, aggiunge la trascrizione e un riepilogo al registro della conversazione del ticket come note interne. Vengono trascritte solo le chiamate registrate. Zendesk trascrive anche l'audio dei messaggi in segreteria, che fattura intorno a un centesimo al minuto.
Tutto questo è il canale vocale. Trascrive la chiamata in corso con il cliente. È davvero utile — se vuoi un resoconto scritto di una chiamata parlata allegato al ticket, è esattamente il compito di Zendesk, e dovresti usarlo.
Quello che non è è la dettatura per l'agente. Nessuna di queste funzioni ti permette di pronunciare a voce la risposta che digiti nel compositore. La verità noiosa è che Zendesk non ha alcuna funzione nativa per questo. Un dipendente di Zendesk lo ha confermato nel forum della community dell'azienda: la trascrizione vocale in tempo reale era solo in roadmap ed è slittata dall'inizio del 2024 a un trimestre successivo, e anche quella voce riguardava il canale delle chiamate, non la dettatura dell'agente. Un thread di richiesta a parte che chiedeva la digitazione vocale è rimasto senza risposta. La soluzione provvisoria suggerita da un membro dello staff nello stesso thread era attivare i sottotitoli in tempo reale di Chrome, il che ti dice quanto questa cosa sia lontana da una funzione vera. Quando la risposta ufficiale a "posso dettare le mie risposte" è "hai provato il menu di accessibilità del browser", la risposta onesta è no.
Cosa offre davvero Zendesk per la voce, e cosa no
Tre cose promettono tre risultati diversi, e solo due esistono. Ecco la mappa onesta:
- Chiamate registrate — Zendesk le trascrive e archivia la trascrizione nel registro del ticket.
- Audio della segreteria — Zendesk trascrive anche questo, alimentando lo smistamento e i riepiloghi.
- La risposta che digiti tu, dettata a voce — questo Zendesk non lo fa affatto.
Quindi, se sei arrivato qui sperando di parlare per farti strada nella coda, le funzioni vocali di Zendesk non ti porteranno a destinazione. Sono costruite attorno all'audio del cliente, non alla tua tastiera. Whisper si infila proprio in quel vuoto — è uno strumento di dettatura a livello di sistema operativo, quindi funziona dentro il compositore dell'Agent Workspace esattamente come la digitazione, perché per il browser è solo testo che arriva al cursore.
Come dettare in una risposta, una nota o una macro di un ticket Zendesk
La configurazione è breve. Ecco tutto, dall'inizio alla fine.
- Installa Whisper per Windows o macOS e accedi. L'intera pipeline locale è gratuita per gli utenti che hanno effettuato l'accesso, senza carta alla registrazione.
- Scegli un modello e lascia che si scarichi. Il download una tantum va da circa 140 MB a 3 GB a seconda del modello che scegli. Dopodiché, la trascrizione non ha bisogno di internet.
- Apri un ticket nell'Agent Workspace e fai clic nel campo che vuoi — la risposta pubblica, una nota interna o il corpo di una macro che stai modificando.
- Tieni premuta la scorciatoia e parla. Ctrl+Space su Windows, Command+Option su macOS. (Se stai configurando il tutto su un PC, la guida pratica alla dettatura vocale su Windows spiega la scorciatoia più nel dettaglio.) Pronuncia la risposta come la diresti al cliente in faccia.
- Rilascia il tasto. Il testo finisce al cursore, nel campo attivo. Rileggilo, correggi quel che serve, invia.
L'overlay di registrazione qui sopra mostra cosa vedrai mentre parli — un piccolo indicatore dal vivo, niente che ti invada lo schermo. La prima volta che la risposta compare semplicemente nel compositore, ti sembra quasi vietato. Quella sensazione svanisce verso il quinto ticket. Quello che non svanisce è il crampo alla mano che sparisce.
L'intera app, dal vivo
Quella qui sopra è la vera app desktop integrata — non uno screenshot, la cosa vera. Curiosaci dentro. Le impostazioni, l'elenco dei modelli, la configurazione della scorciatoia sono tutti lì. Quello che vedi è quello che si installa.
Pulisci automaticamente la dettatura
Il linguaggio parlato ha i suoi "ehm" sparsi e attacca le frasi una all'altra. Whisper può eseguire una fase facoltativa di pulizia con l'IA sulla trascrizione grezza — punteggiatura, maiuscole e un leggero ritocco di tono — prima di incollare. In modalità locale gratuita questa pulizia gira sulla tua macchina tramite Ollama; con Whisper Pro gira tramite la tua chiave OpenAI. Per una risposta pubblica che un responsabile della qualità leggerà, quella fase è la differenza tra "appunti parlati" e "una risposta che supera la revisione".
Gestisce oltre 90 lingue in entrambe le modalità, il che conta se la tua coda di ticket passa dall'inglese allo spagnolo al tedesco prima di pranzo — più o meno lo stesso numero di lingue che mio figlio di sette anni usa per contrattare l'ora di andare a letto. La linea di modelli multilingue raggiunge specificamente più di 99 lingue; le varianti solo inglese coprono solo l'inglese.
Perché locale e offline contano quando gestisci i dati dei clienti

Ecco l'unica opinione che mi concedo in questo articolo: una dettatura che gira solo nel cloud, senza opzione offline, è un disastro per la privacy quando sei un agente del supporto. Leggi a voce l'email di un cliente, il suo ordine, a volte il suo indirizzo di casa o la contestazione di un pagamento con carta. Con uno strumento solo cloud, tutto questo fa una deviazione attraverso i server di terze parti — senza altro motivo se non che volevi parlare invece di digitare. Uno strumento che può far girare tutto sulla tua macchina non ti chiede di accettare quel compromesso.
La modalità locale di Whisper gira interamente offline. L'audio non lascia mai la tua macchina; l'unico momento in cui tocca la rete è il download una tantum del modello. I dati personali del cliente che pronunci in una risposta restano sul dispositivo. Gli strumenti di dettatura via estensione del browser e cloud che dominano questa ricerca non possono dire altrettanto — spediscono fuori il tuo audio per farlo trascrivere. Se la tua organizzazione di supporto gestisce dati regolamentati, "l'audio non ha mai lasciato il portatile" è una frase che il tuo team di sicurezza vorrà sentire.
Cosa non farà (i limiti onesti)
Nessuno strumento merita una pagella immacolata, quindi ecco dove Whisper si ferma.
Incolla in un campo attivo per volta. Non compila un intero modulo di ticket a più campi e non decide a quale campo appartengano le tue parole — vanno dove si trova il cursore. Vuol dire che devi tenere a mente la differenza tra la risposta pubblica e la nota interna prima di parlare. Detta in quello sbagliato e puoi far trapelare una nota interna dritta al cliente. Il cursore fa esattamente quello che gli indichi, il che è una funzione o una confessione a seconda di dove l'hai puntato. Prima fai clic, poi parla.
Inserisce testo, non formattazione. Non azionerà il pulsante del grassetto del compositore né costruirà un elenco puntato a voce — digita parole in CKEditor, esattamente come farebbe la tua tastiera. E come ogni strumento di dettatura, è più debole sulle stringhe che non sono parole: ID account, numeri d'ordine, codici SKU, codici di errore. L'ho visto trasformare "ticket ZD trattino quattro quattro zero due" in qualcosa con un quattro di troppo, che è esattamente il tipo di dettaglio che un cliente nota. Trascrive quello che dici, ma controlla con l'occhio ogni codice prima di premere invio.
Quando lasciar perdere Whisper e usare qualcos'altro

Preferisco che tu usi lo strumento giusto piuttosto che il nostro. Se ti serve un resoconto scritto di una chiamata parlata allegato al ticket, quella è la trascrizione delle chiamate di Zendesk Talk — è il compito di Zendesk, non di Whisper, ed è già integrata nel tuo canale telefonico. Non ricorrere a un'app di dettatura per risolvere un problema di registrazione delle chiamate.
Se vuoi solo dettare qualche risposta ogni tanto e non vuoi installare niente, il tuo sistema operativo offre già un'opzione gratuita. Windows ha la Digitazione vocale con Win+H; macOS ha la Dettatura integrata. Entrambe funzionano a livello di sistema, compreso nel compositore di Zendesk. Sono monopiattaforma, di default si appoggiano al cloud e ti danno meno controllo — ma per un agente su una sola macchina che detta due volte al giorno, gratis e già installato è uno scambio equo.
Scegli Whisper quando vuoi smaltire la coda a voce ogni giorno, lo vuoi offline così i dati dei clienti restano dove sono, vuoi un'unica scorciatoia tra Zendesk e le app secondarie in cui vivi e lo vuoi gratis senza carta. Whisper è gratuito per la pipeline locale alla registrazione; la parte Pro Cloud aggiunge una prova di 7 giorni. I numeri aggiornati li trovi sulla pagina dei prezzi.
Zendesk ascolta la chiamata del cliente. Non è mai stato costruito per scrivere la tua metà della conversazione. Quel secondo compito — tu che parli, le tue parole che finiscono nella casella della risposta — è quello che trasforma una giornata da 200 ticket in qualcosa che i tuoi polsi ti perdonano. Fai clic sul campo, tieni premuto il tasto, parla. Scarica Whisper e smaltisci un ticket a voce. Se le tue mani non ti ringraziano entro pranzo, torna pure a digitare.
Smaltisci il tuo prossimo ticket a voce
Fai clic sul campo, tieni premuto il tasto, parla, rilascia. La risposta finisce al cursore — nell'Agent Workspace di Zendesk e in ogni app secondaria in cui passi la giornata.
Modalità locale gratuita per qualsiasi account con accesso effettuato. Nessuna carta richiesta per iniziare.



