Segui ZDNET: Aggiungici come fonte preferita su Google.
I principali punti salienti di ZDNET
- Anthropic debutta con Claude Opus 4.6 per il lavoro basato sulla conoscenza aziendale.
- È costruito per un’autonomia end-to-end con meno riscritture.
- Le anteprime includono PowerPoint, group di agenti e contesto 1M.
Anthropic ha annunciato oggi Claude Opus 4.6, che secondo l’azienda è il modello più capace per il lavoro imprenditoriale e della conoscenza. Questo nuovo modello linguistico di grandi dimensioni è un aggiornamento a Opus 4.5, con una più ampia autonomia e risultati più accurati al primo tentativo.
Inoltre: Claude Code ha guadagnato l’incredibile cifra di 1 miliardo di dollari in 6 mesi e la mia app per iPhone codificata con intelligenza artificiale mostra il perché
Anthropic descrive Opus 4.6 come un “modello di frontiera” progettato per gestire complessi flussi di lavoro aziendali end-to-end. Il termine “modello di frontiera” viene utilizzato dal settore dell’intelligenza artificiale per descrivere i sistemi di intelligenza artificiale che sono all’avanguardia delle attuali capacità di intelligenza artificiale.
Utilizzando Opus 4.6, “Documenti, fogli di calcolo e presentazioni avranno bisogno di meno avanti e indietro nelle iterazioni”, secondo un’e-mail ricevuta da ZDNET da un rappresentante dell’azienda.
Salto prestazionale per il lavoro della conoscenza
Anthropic afferma: “Affinché l’intelligenza artificiale possa realmente affrontare il lavoro aziendale, deve riuscire a raggiungere tre risultati chiave: trovare informazioni, analizzarle e produrre qualcosa da esse”. Secondo l’azienda, 4.6 si comporta bene in tutti e tre i risultati chiave.
Tutto ciò indica un salto nelle capacità agentiche dell’IA, con la capacità di gestire compiti complessi e a lungo termine oltre a sottoattività isolate.
Usando il viaggio come analogia, una semplice sottoattività potrebbe essere dire a un autista di “svoltare a destra al semaforo successivo”, mentre un compito più complesso sarebbe dire all’autista che si trova a New York Metropolis di guidare fino a Faneuil Corridor a Boston. Spetterà all’autista determinare i passaggi e arrivarci. Allo stesso modo, l’concept alla base della più ampia autonomia di Opus 4.6 è che può pianificare ed eseguire la complessa serie di passaggi per incarichi su larga scala.
Anche: Come installare e configurare Claude Code, passo dopo passo
Secondo l’azienda, Opus 4.6 riduce anche il numero di correzioni e riformulazioni necessarie per i “risultati aziendali comuni”.
Secondo Yashodha Bhavnani, responsabile dell’intelligenza artificiale presso il fornitore di cloud storage Field, “Claude Opus 4.6 eccelle in attività advert alto ragionamento, come l’analisi multi-fonte, su contenuti legali, finanziari e tecnici. La valutazione di Field ha mostrato un aumento del 10% delle prestazioni, raggiungendo il 68% rispetto a un valore di base del 58% e punteggi quasi perfetti nei domini tecnici.”
Anthropic sta inoltre posizionando Claude Opus 4.6 come una risorsa preziosa per la modellazione finanziaria. L’intelligenza artificiale può aiutare con documenti normativi, rapporti di mercato e dati interni, producendo risultati rapidi per progetti che in precedenza richiederebbero giorni per il completamento degli analisti. Anthropic afferma che Opus 4.6 “gestisce le sfumature richieste per l’output sensibile alla conformità”.
L’Opus 4.6 si sta rivelando potente anche per il ragionamento legale. Secondo Niko Grupen, responsabile della ricerca sull’intelligenza artificiale presso la società legale di intelligenza artificiale Harvey“Claude Opus 4.6 ha ottenuto il punteggio BigLaw Bench più alto di qualsiasi modello Claude pari al 90,2%. Con il 40% di punteggi perfetti e l’84% superiore a 0,8, è straordinariamente capace di ragionamento legale.”
Un’altra nuova funzionalità interessante è l’integrazione di Claude con PowerPoint. Una volta rilasciato, Claude sarà in grado di lavorare direttamente all’interno di PowerPoint (presumibilmente come plug-in) e di leggere format, caratteri e schemi di diapositiva. In questo modo, le modifiche apportate dall’intelligenza artificiale possono rimanere “sul marchio e sul modello”.
Anche: Ho provato un’alternativa a Claude Code locale, open supply e completamente gratuita: come funziona
Secondo l’azienda, Claude Opus 4.6 può “creare diapositive da un modello aziendale, ristrutturare una trama, convertire punti elenco in diagrammi o generare un mazzo completo da una descrizione, il tutto senza uscire dall’app”.
La funzionalità PowerPoint è in anteprima della ricerca, disponibile tramite una lista d’attesa. ZDNET ha richiesto l’accesso. Non appena lo avremo, creeremo alcune diapositive eleganti e ti riferiremo.
Avanzamenti di sviluppatori e agenti
Claude è particolarmente noto per le sue capacità di codifica degli agenti. Claude Opus 4.6 si basa sui punti di forza di Opus 4.5 con un comportamento più agente. L’azienda afferma che i miglioramenti della codifica autonoma andranno a beneficio soprattutto degli sviluppatori con basi di codice di grandi dimensioni, attività a lungo orizzonte e implementazioni complesse.
Inoltre: smetti di usare ChatGPT per tutto: i miei modelli di intelligenza artificiale preferiti per la ricerca, la codifica e altro (e che evito)
Come utente di Claude Code, questo mi fa venire in mente una domanda chiave. Claude Code che utilizza Opus 4.5 spesso necessita di eseguire sequenze di compattazione che liberano risorse disponibili. Questo processo non solo richiede molto tempo, ma spesso interrompe il flusso del progetto.
Se si suppone che 4.6 sia in grado di affrontare basi di codice ancora più grandi, allora la finestra di contesto deve crescere. Anthropic afferma che “Claude Opus 4.6 supporterà il contesto 1M (in beta) al momento del lancio. Questo è il primo modello Opus con contesto lungo”. Sarà molto interessante vederlo in azione.
Squadre di agenti
L’azienda offre un’anteprima della ricerca dei group di agenti in Claude Opus 4.6 agli utenti API e in abbonamento Claude. L’azienda afferma che i group “lasciano che Claude Code lavori come fa un vero group di ingegneri. Invece di un agente che lavora attraverso le attività in sequenza, puoi dividere il lavoro tra più agenti, ognuno dei quali possiede la sua parte e si coordina direttamente con gli altri.”
Anche: Ho lasciato che Claude Cowork di Anthropic si liberasse dei miei file ed è stato brillante e allo stesso tempo spaventoso
Ho avuto problemi con Claude che eseguiva più agenti paralleli in Claude Code utilizzando Opus 4.5, in particolare nell’anteprima di Xcode 26.3. Ho scoperto che una volta che l’agente principale avvia una serie di agenti secondari, questi non sono visibili per la mia gestione pratica. Quando uno o più di essi si blocca (come sembra accadere con inquietante regolarità), l’intero processo di codifica dell’agente si blocca.
Spero che i group di agenti in Claude Opus 4.6 forniscano una migliore trasparenza, una migliore gestione complessiva e un migliore controllo dei danni, quindi se rimangono bloccati, riferiranno e chiederanno aiuto. Rimani sintonizzato. Farò qualche check e riferirò sulle prestazioni generali.
Detto questo, Michele Catasta, presidente della società AI no-code Replica afferma: “Claude Opus 4.6 rappresenta un enorme passo avanti per la pianificazione degli agenti. Suddivide attività complesse in sottoattività indipendenti, esegue strumenti e sottoagenti in parallelo e identifica i bloccanti con reale precisione.”
Disponibilità
Anthropic afferma: “Claude Opus 4.6 è disponibile oggi su claude.ai, sulla nostra API e su tutte le principali piattaforme cloud”. Il prezzo dei token non è cambiato rispetto alla versione precedente per gli utenti API.
Alcune funzionalità come PowerPoint, il contesto 1M e i group di agenti sono descritte come anteprime di ricerca o beta e non sono disponibili per un ampio rilascio al momento del lancio. Ma Anthropic sta lavorando sul tempo dell’intelligenza artificiale. Pertanto è più probabile che gli elementi nell’anteprima della ricerca e nella beta siano a distanza di settimane piuttosto che di mesi. Dopotutto, ha un’intelligenza artificiale che lo aiuta a codificare i suoi prodotti.
Anche: Vuoi codificare l’atmosfera locale? Questo stack AI sostituisce Claude Code e Codex ed è gratuito
Cosa ne pensi di Claude Opus 4.6 e della spinta di Anthropic verso un’intelligenza artificiale più autonoma e focalizzata sull’impresa? Vedete un valore reale in funzionalità come i group di agenti, il contesto 1M o integrazioni profonde come PowerPoint? Ti fideresti di un’intelligenza artificiale per gestire lavori complessi end-to-end con meno supervisione umana o preferiresti comunque un controllo più rigoroso? Come pensi che questo si confronti con gli altri modelli di frontiera che hai utilizzato? Quali domande hai ancora sulla disponibilità o sulle prestazioni nel mondo reale? Fatecelo sapere nei commenti qui sotto.
Puoi seguire gli aggiornamenti quotidiani sui miei progetti sui social media. Assicurati di iscriverti a la mia newsletter di aggiornamento settimanalee seguimi su Twitter/X all’indirizzo @DavidGewirtzsu Fb all’indirizzo Facebook.com/DavidGewirtzsu Instagram all’indirizzo Instagram.com/DavidGewirtzsu Bluesky a @DavidGewirtz.come su YouTube all’indirizzo YouTube.com/DavidGewirtzTV.












