Diversi laboratori di intelligenza artificiale hanno priorità various. OpenAI si concentra tradizionalmente sugli utenti shopper, advert esempio, mentre il suo rivale Anthropic tende a rivolgersi alle imprese. L’xAI di Elon Musk, come abbiamo scoperto di recente, ha posto particolare enfasi sulle process dettagliate dei videogiochi.
Venerdì Grace Kay di Enterprise Insider ha pubblicato un rapporto dettagliato e di ampia portata su xAIla startup AI recentemente acquisita da SpaceX, con particolare enfasi su come Musk stia rendendo la vita difficile ai dipendenti. Ma questo particolare aneddoto risalta:
In un caso dell’anno scorso, il rilascio di un modello è stato ritardato di diversi giorni perché Musk period insoddisfatto di come il chatbot aveva risposto a domande dettagliate sul videogioco “Baldur’s Gate”, secondo persone a conoscenza della questione. Ingegneri di alto livello sono stati prelevati da altri progetti per migliorare le risposte prima del lancio, hanno affermato.
Naturalmente, potete immaginare la frustrazione di qualsiasi ingegnere rispettato ed esperto che si presenta al lavoro pensando di affrontare problemi fondamentali di conoscenza e intelligenza artificiale, solo per essere distratto nell’aiutare un uomo di 54 anni a completare il suo videogioco. Ma l’aneddoto solleva una domanda ancora più urgente: Musk ha finito per acquisire le abilità di gioco che desiderava?
Per rispondere a questa domanda, il nostro appassionato di giochi di ruolo Ram Iyer ha messo insieme una serie di cinque domande generali su Baldur’s Gate, che abbiamo confrontato con xAI e i tre modelli principali in una sorta di quasi-benchmark che ho deciso di chiamare BaldurBench.
Nell’interesse della trasparenza giornalistica, ho reso pubbliche tutte le trascrizioni delle chat, quindi puoi vederle qui: Grok, ChatGPT, ClaudioE Gemelli.
Innanzitutto la buona notizia: Grok fornisce effettivamente informazioni piuttosto buone. Le sue risposte erano un po’ dense di gergo da giocatore – “save-scumming” invece di salvare e “DPS” invece di danno – ma le risposte erano sia utili che ben informate, a condizione che tu sapessi di cosa si stava parlando. Anche Grok ama molto i tavoli e teoriache è più o meno quello che ti aspetteresti.
Ci sono molte information di Baldur’s Gate là fuori e i modelli generalmente si ispiravano agli stessi, quindi le differenze più grandi erano stilistiche. ChatGPT preferisce elenchi puntati e frammenti di frasi, mentre Gemini lo adora grassetto parole importanti.
Evento Techcrunch
Boston, MA
|
9 giugno 2026
La sorpresa più grande è stata Claude, che si è preoccupato particolarmente di darmi informazioni che potessero rovinare la mia esperienza di gioco. Quando ho chiesto informazioni sulle buone composizioni per le feste, ho chiuso la guida dicendo “non stressarti troppo e suona solo ciò che ti sembra divertente”. Grazie, Claudio!
È importante tenere presente che questa è un’space tematica che conosciamo (grazie a I resoconti di Business Insider) che xAI si è concentrato specificamente sul raggiungimento della parità. Non bisogna quindi dare troppa importanza al fatto che, dopo lo dash riportato, i consigli di Grok si sono rivelati più o meno gli stessi degli altri modelli. Tuttavia, è bello sapere che xAI può farlo funzionare se ci prova.













