Trattavo ChatGPT come un motore di ricerca più intelligente: digita un messaggio, attendi una risposta e ripeti. Poi ho iniziato a utilizzare la modalità vocale di ChatGPT in modo più regolare e ha cambiato rapidamente il modo in cui interagisco con il chatbot AI. Parlare invece di digitare fa sì che le conversazioni scorrano in modo più naturale e spesso mi porta a ottenere risposte migliori più velocemente che fissare un cursore lampeggiante.
Questa non è solo una funzionalità da voce a testo. Sembra di avere una conversazione reale e fluida. Aspetta in modo intelligente che tu finisca il tuo pensiero, capisce le tue pause naturali e non si lascia disorientare da “um” o balbettii. Posso usarlo mentre cucino o guido, parlando come un normale essere umano senza pianificare attentamente ogni mia parola.
Non è solo più veloce della digitazione: è un modo davvero più intuitivo e utile per interagire con l’intelligenza artificiale. Se lo stai ignorando, ti stai perdendo qualcosa.
Da non perdere: Cos’è ChatGPT? Tutto quello che devi sapere sul Chatbot AI
ChatGPT, di OpenAI, non è l’unico chatbot a mani libere. Gemini Stay di Google offre la stessa atmosfera “parla di me e io terrò il passo”. Claude di Anthropic ha una versione beta della sua modalità vocale sulle sue app mobili, completa di punti elenco sullo schermo mentre parla, e l’assistente iOS e Android di Perplexity risponde anche a domande vocali e avvia app come OpenTable o Uber a comando.
Non perdere nessuno dei nostri contenuti tecnici imparziali e le recensioni di laboratorio. Aggiungi CNET come fonte Google preferita.
Ma anche se tutti corrono per padroneggiare la conversazione AI in tempo reale, ChatGPT rimane il mio punto di riferimento. Qualunque sia il tuo chatbot preferito, prenditi una pausa dalla digitazione e prova l’opzione vocale. È molto più utile di quanto pensi.
(Divulgazione: Ziff Davis, la società madre di CNET, in aprile ha intentato una causa contro OpenAI, sostenendo di aver violato i diritti d’autore di Ziff Davis nella formazione e nel funzionamento dei suoi sistemi di intelligenza artificiale.)
Guarda questo: La caratteristica virale di ChatGPT: trasformare le persone in motion determine
Cos’è esattamente la modalità vocale?
La chat vocale (o “conversazioni vocali”) è la modalità vivavoce di ChatGPT, che ti consente di parlare con il modello AI e sentirlo rispondere, senza richiedere alcuna digitazione. C’è un’icona vocale che troverai nell’app cellular, desktop e net, situata in basso a destra in ogni conversazione a cui partecipi. Se premi il pulsante, puoi pronunciare la tua domanda advert alta voce e ChatGPT la trascriverà, ci ragionierà sopra e risponderà. Non appena ha finito di parlare, ricomincia advert ascoltare, creando un naturale dialogo avanti e indietro.
Ricorda e basta: La modalità vocale funziona sullo stesso modello linguistico di grandi dimensioni del normale ChatGPT, quindi può comunque avere allucinazioni o sbagliare i fatti. Dovresti sempre ricontrollare tutto ciò che è importante.
OpenAI offre due versioni di queste conversazioni vocali: Voce commonplace (l’opzione leggera e predefinita gratuita) e Voce avanzata (disponibile solo per gli utenti a pagamento).
Commonplace Voice converte innanzitutto il tuo parlato in testo e lo elabora con GPT-4o (e GPT-4o mini), impiegando un po’ più tempo per risponderti. Superior Voice, invece, utilizza modelli nativamente multimodali, nel senso che ti “sente” e genera audio, quindi la conversazione è più naturale e avviene in tempo reale. Può cogliere segnali diversi dalle parole stesse, come la velocità con cui parli o l’emozione nella tua voce, e adattarsi a questo.
Nota: Gli utenti gratuiti possono accedere a un’anteprima giornaliera di Superior Voice.
7 motivi per cui dovresti iniziare a utilizzare la funzionalità della modalità vocale di ChatGPT
1. È veramente colloquiale
A differenza della digitazione, quando parlo con ChatGPT, non cerco la parola giusta o torno indietro dopo ogni errore di battitura. Sto solo parlando, come farei con qualsiasi amico o familiare, pieno di “ummmmm” e “mi piace” e altre pause imbarazzanti. La modalità vocale, tuttavia, si svolge con tutti i miei pensieri lasciati a metà e risponde con una risposta completamente dettagliata o con una domanda per aiutarmi a perfezionare ciò di cui ho bisogno. Questo dare e avere senza sforzo sembra molto più naturale della digitazione.
2. Puoi utilizzare ChatGPT in vivavoce
Ovviamente devo ancora aprire l’app ChatGPT e toccare il pulsante della modalità vocale per iniziare, ma una volta iniziato non devo più usare le mani per continuare una conversazione con il chatbot AI. Posso rimanere bloccato nel traffico e fare un brainstorming su una vacanza che voglio fare entro la advantageous dell’anno. Posso chiedere informazioni su voli, resort, monumenti, ristoranti e qualsiasi altra cosa, senza toccare il telefono, e la conversazione viene salvata all’interno dell’app, così non devo ricordare tutto ciò che mi cube ChatGPT.
3. È utile per imparare una nuova lingua con la traduzione in tempo reale
Ho detto prima che utilizzo la modalità vocale per esercitarmi con le lingue, in cui la modalità vocale eccelle. Posso parlare in inglese e fare in modo che ChatGPT risponda in un polacco impeccabile, completo di suggerimenti sulla pronuncia. Basta chiedere alla modalità vocale “Puoi aiutarmi a praticare la mia (lingua)” e ti risponderà con alcuni modi in cui può aiutarti, come avviare una conversazione, vocabolario di base o numeri. E ricorda dove eri rimasto, così puoi, in un certo senso, prendere lezioni; non è necessario Duolingo.
4. Ottieni risposte sulle cose che vedi nel mondo reale
Questa funzionalità è esclusiva di Superior Voice, ma è probabilmente la mia funzionalità preferita con la modalità vocale. Grazie ai suoi superpoteri multimodali posso accendere la fotocamera del mio telefono o scattare un video/foto e chiedere a ChatGPT di aiutarmi. Advert esempio, ho avuto difficoltà a riconoscere un dipinto che ho trovato in un negozio dell’usato e il proprietario non aveva thought da dove provenisse. Ho aperto la chat vocale, ho acceso la fotocamera e ho chiesto alla modalità vocale da dove provenisse il dipinto. In pochi secondi potrebbe dirmi il titolo del dipinto, il nome dell’artista e quando è stato dipinto.
5. È un’opzione migliore per le persone con determinate disabilità
Per chiunque abbia problemi di vista o dislessia, parlare sicuramente batte la digitazione. La modalità vocale può trascrivere il tuo discorso e quindi leggere la tua risposta advert alta voce al ritmo che preferisci (puoi modificarlo nelle impostazioni o chiedere a ChatGPT di rallentare). L’opzione vivavoce aiuta anche chiunque abbia problemi di abilità motoria, perché tutto ciò che devi fare è un tocco per avviare e un altro per interrompere, senza dover digitare a lungo sulla tastiera.
6. Brainstorming più veloce
A volte mi vengono un’esplosione di idee e penso più velocemente di quanto riesco a scrivere, quindi la modalità vocale di ChatGPT è perfetta per sputare idee per storie, immaginare un nuovo structure per il mio soggiorno o decidere pasti interessanti da cucinare per la settimana. Poiché penso advert alta voce invece di fissare il telefono, le mie idee fluiscono molto più facilmente e più velocemente, soprattutto con i follow-up istantanei di ChatGPT. Aiuta a mantenere lo slancio finché non avrò un’thought brillante per qualunque cosa stia facendo il brainstorming.
7. Riepiloghi istantanei che puoi ascoltare
Inserisci un PDF di 90 pagine nella chat, advert esempio per la sceneggiatura di un movie o un libro di testo, chiedi un riepilogo e chiedi all’intelligenza artificiale di leggerlo advert alta voce mentre pieghi il bucato. È come trasformare qualsiasi documento (creo anche le pagine di Wikipedia) in un podcast, su richiesta.
La modalità vocale non è solo un trucco accurato; è un modo rapido e più naturale per utilizzare ChatGPT. Che tu stia traducendo segnali stradali, facendo brainstorming su un’thought o aggiornandoti sulle notizie advert alta voce, parlare con ChatGPT sembra meno come usare un chatbot e più come avere una conversazione con un piccolo esperto. Una volta che ti sarai abituato a pensare advert alta voce, potresti non tornare mai più alla tastiera.












