Home Tecnologia Anthropic rilascia Claude Sonnet 4.6: prestazioni di riferimento, come provarlo

Anthropic rilascia Claude Sonnet 4.6: prestazioni di riferimento, come provarlo

12
0

Antropico ha appena rilasciato il suo ultimo Massive Language Mannequin (LLM), Claude Sonnett 4.6. Il rilascio di martedì segue rapidamente il lancio di Claude Opus 4.6il modello AI premium dell’azienda, il 5 febbraio.

Secondo Anthropic, “Claude Sonnet 4.6 è il nostro modello Sonnet più potente finora.” La società afferma che Sonnet 4.6 ha un token da 1 milione finestra di contesto nella versione beta. Fondamentalmente, Anthropic riferisce che Sonetto 4.6 ha ottenuto buoni risultati nei take a look at di sicurezza interni, mostrando una bassa tendenza advert avere allucinazioni e advert adescamento.

“Sonnet 4.6 offre capacità di codifica molto migliorate a un numero maggiore di nostri utenti”, ha affermato Anthropic, riferendosi alla popolarità di Claude tra gli sviluppatori che utilizzano l’intelligenza artificiale per programmare.

Se stai cercando di utilizzare l’ultimo modello di intelligenza artificiale di Anthropic, l’azienda lo ha reso davvero semplice. Ecco come accedere alla clausola Sonetto 4.6.

Come utilizzare Claude Sonetto 4.6

Sia per gli utenti gratuiti che per quelli Professional, Claude Sonnett 4.6 è ora disponibile come modello predefinito su claude.ai e Claude Cowork. Anthropic ha anche implementato il modello attraverso la sua API e tutte le principali piattaforme cloud.

Gli utenti gratuiti avranno tariffe di utilizzo limitate che dipendono dalla domanda attuale. I limiti vengono reimpostati ogni cinque ore. Per coloro che necessitano di limiti più elevati, Claude Sonnet 4.6 costa lo stesso prezzo del modello precedente. Il piano Claude Professional costa $ 20 al mese o $ 17 al mese se pagato annualmente. Se si utilizza l’API, Claude Sonnett 4.6 parte da $ 3 per milione di token di enter e $ 15 per milione di token di output.

Prestazioni di riferimento di Claude Sonnet 4.6

Secondo i take a look at benchmark di Anthropic, Claude Sonnet 4.6 è il modello più potente dell’azienda per l’analisi finanziaria degli agenti e le attività d’ufficio, battendo concorrenti come Gemini 3 Professional di Google e GPT 5.2 di OpenAI.

In questi compiti, Claude Sonnet 4.6 batte anche Opus 4.6 di Anthropic, il modello di intelligenza artificiale più potente di Anthropic.

Nel suo annuncio di rilascio, Anthropic ha affermato che molti sviluppatori con accesso anticipato a Claude Sonnet 4.6 preferivano il modello, non solo al suo predecessore, Claude Sonnet 4.5, ma anche a Claude Opus 4.5. Secondo il Scheda di sistema Sonetto 4.6il nuovo modello migliora parametri chiave come Humanity’s Final Examination, sebbene Claude Opus 4.6 abbia ottenuto punteggi più alti.

Prestazioni di riferimento

  • Diamante GPQA: 89,9%.

  • ARC-AGI-2: 58,3%.

  • MMMLU: 89,3%.

  • Verificato dal banco SWE: 79,6%.

  • HLE (L’Ultimo Esame dell’Umanità): Con attrezzi 49,0%, senza attrezzi 33,2%.

La compagnia assicurativa basata sull’intelligenza artificiale Tempo ha dichiarato a VentureBeat che Sonnet 4.6 ha ottenuto il miglior punteggio tra qualsiasi modello Claude nel suo complesso benchmark sull’uso dei pc assicurativi.

Questi risultati sono notevoli poiché i modelli di Claude Opus sono generalmente i più intelligenti e preferibili per il ragionamento complesso.

Claude Sonnet 4.6 non è solo più potente di alcuni modelli Opus, ma anche più conveniente. Come accennato in precedenza, Claude Sonnet 4.6 ha un prezzo di $ 3/$ 15, mentre le tariffe di Opus 4.6 sono $ 5/$ 25.

Argomenti
Intelligenza artificiale

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here