Home Tecnologia Nvidia spenderà 26 miliardi di dollari per costruire modelli di intelligenza artificiale...

Nvidia spenderà 26 miliardi di dollari per costruire modelli di intelligenza artificiale a peso aperto, mostrano i documenti

28
0

Nvidia spenderà 26 miliardi di dollari nei prossimi cinque anni per costruire modelli di intelligenza artificiale open supply, secondo a Dichiarazione finanziaria 2025. I dirigenti hanno confermato la notizia, che non period stata precedentemente riportata, nelle interviste a WIRED.

Il considerevole investimento potrebbe vedere Nvidia evolversi da un produttore di chip con uno stack software program impressionante in un autentico laboratorio di frontiera in grado di competere con OpenAI e DeepSeek. È una mossa strategica che potrebbe rafforzare ulteriormente la posizione di Nvidia come produttore chief di chip nel mondo dell’intelligenza artificiale, poiché i modelli sono ottimizzati per l'{hardware} dell’azienda.

I modelli open supply sono quelli in cui i pesi o i parametri che determinano il comportamento di un modello vengono rilasciati pubblicamente, a volte con i dettagli della sua architettura e della sua formazione. Ciò consente a chiunque di scaricarlo ed eseguirlo sul proprio pc o sul cloud. Nel caso di Nvidia, l’azienda rivela anche le innovazioni tecniche coinvolte nella costruzione e nella formazione dei suoi modelli, rendendo più semplice per startup e ricercatori modificare e sviluppare le innovazioni dell’azienda.

Mercoledì, Nvidia ha anche rilasciato Nemotron 3 Tremendous, il suo modello AI a peso aperto più capace fino advert oggi. Il nuovo modello ha 128 miliardi di parametri (una misura delle dimensioni e della complessità del modello), rendendolo più o meno equivalente alla versione più grande di GPT-OSS di OpenAI, anche se la società afferma che supera GPT-OSS e altri modelli in diversi benchmark.

Nello specifico, Nvidia afferma che Nemotron 3 Tremendous ha ricevuto un punteggio di 37 nell’Indice di Intelligenza Artificiale, che valuta i modelli su 10 diversi benchmark. GPT-OSS ha ottenuto 33 punti, ma diversi modelli cinesi hanno ottenuto punteggi più alti. Nvidia afferma che Nemotron 3 Tremendous è stato segretamente testato su PinchBench, un nuovo benchmark che valuta la capacità di un modello di controllare OpenClaw, e si colloca al primo posto in quel take a look at.

Nvidia ha anche introdotto una serie di trucchi tecnici utilizzati per addestrare Nemotron 3. Questi comprendono tecniche architettoniche e formative che migliorano le capacità di ragionamento del modello, la gestione del contesto lungo e la reattività all’apprendimento per rinforzo.

“Nvidia sta prendendo molto più seriamente lo sviluppo di modelli aperti”, afferma Bryan Catanzaro, vicepresidente della ricerca applicata sul deep studying presso Nvidia. “E stiamo facendo molti progressi.”

Frontiera aperta

Meta è stata la prima grande azienda di intelligenza artificiale a rilasciare un modello aperto, Llama, nel 2023. Il CEO Mark Zuckerberg, tuttavia, ha recentemente riavviato gli sforzi dell’azienda nel campo dell’intelligenza artificiale e lo ha segnalato potrebbe non rendere i modelli futuri completamente aperti. OpenAI offre un modello a peso aperto, chiamato GPT-oss, ma è inferiore alle migliori offerte proprietarie dell’azienda, non adatto alla modifica.

È possibile accedere ai migliori modelli statunitensi, di OpenAI, Anthropic e Google, solo tramite cloud o tramite un’interfaccia chat. Al contrario, i pesi di molti dei migliori modelli cinesi di DeepSeek, Alibaba, Moonshot AI, Z.ai e MiniMax vengono pubblicati apertamente e gratuitamente. Di conseguenza, molte startup e ricercatori in tutto il mondo stanno attualmente basandosi su modelli cinesi.

“È nel nostro interesse aiutare l’ecosistema a svilupparsi”, afferma Catanzaro, che è entrato in Nvidia nel 2011 e ha contribuito a guidare il passaggio dell’azienda dalla produzione di schede grafiche per i giochi alla produzione di silicio per l’intelligenza artificiale. Nvidia ha rilasciato il primo modello Nemotron nel novembre 2023. Aggiunge che Nvidia ha recentemente terminato il pre-addestramento di un modello da 550 miliardi di parametri. (Il pre-addestramento implica l’inserimento di enormi quantità di dati in un modello distribuito su un vasto numero di chip specializzati che funzionano in parallelo.) Da allora Nvidia ha rilasciato una gamma di modelli specializzati per l’uso in aree come la robotica, la modellazione climatica e il ripiegamento delle proteine.

Kari Briski, vicepresidente del software program di intelligenza artificiale generativa per le imprese, afferma che i futuri modelli di intelligenza artificiale di Nvidia aiuteranno l’azienda a migliorare non solo i suoi chip ma anche i information middle su scala supercomputer che costruirà. “Lo costruiamo per ampliare i nostri sistemi e testare non solo il calcolo ma anche lo storage e la rete, e per costruire la nostra roadmap dell’architettura {hardware}”, afferma.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here