Lo stand di Alibaba alla World Synthetic Intelligence Convention presso lo Shanghai World Expo Exhibition Middle di Shanghai, Cina, il 5 luglio 2024.
Nurphoto | Nurphoto | Immagini Getty
Mentre i mercati statunitensi si concentrano sull’impatto degli strumenti di Anthropic e Altruist su software program e servizi finanziari, questa settimana i giganti tecnologici cinesi hanno rilasciato modelli di intelligenza artificiale che hanno mostrato progressi nella robotica e nella generazione di video.
AlibabaByteDance, creatore di TikTok e piattaforma per brevi video Kuaishouhanno tutti rilasciato nuovi modelli di intelligenza artificiale che sottolineano come le aziende cinesi stiano tenendo il passo con quelle statunitensi
Ciò arriva dopo che il capo di Google DeepMind, Demis Hassabis, ha dichiarato alla CNBC che i modelli di intelligenza artificiale cinesi sono solo “mesi” indietro rispetto ai rivali occidentali.
Questi modelli provenienti dalla Cina sono in diretta competizione con modelli di generazione video come Sora di OpenAI, nonché con modelli di robotica provenienti da Nvidia E Google.
Ecco una carrellata di modelli.
RynnBrain di Alibaba
DAMO Academy di Alibaba ha presentato questa settimana RynnBrain, un modello di intelligenza artificiale progettato per aiutare i robot a comprendere il mondo fisico che li circonda e a identificare gli oggetti.
In un video dimostrativo, Alibaba ha mostrato un robot con delle tenaglie al posto delle mani che sembrava essere in grado di contare le arance, raccoglierle e metterle in un cestino. È stato anche mostrato mentre prendeva il latte dal frigorifero.
I modelli richiedono una formazione approfondita per consentire loro di identificare gli oggetti di uso quotidiano con cui interagire, il che significa che compiti semplici come raccogliere la frutta possono essere impegnativi nella robotica.
RynnBrain ora mette Alibaba in concorrenza con aziende del calibro di Nvidia E Google che stanno sviluppando i propri modelli di intelligenza artificiale per i robot.
“Una delle sue innovazioni chiave è la consapevolezza integrata del tempo e dello spazio”, ha detto alla CNBC Adina Yakefu, ricercatrice di Hugging Face.
“Invece di reagire semplicemente a input immediati, il robot può ricordare quando e dove si sono verificati gli eventi, monitorare l’avanzamento delle attività e continuare attraverso più passaggi. Ciò lo rende più affidabile e coerente in ambienti complessi del mondo reale.”
Yakefu ha aggiunto che “l’ambizione più ampia” di Alibaba è quella di “stabilire uno strato di intelligenza fondamentale per i sistemi incorporati”.
Seedance 2.0 di ByteDance
Seedance 2.0 è un modello AI di generazione video in grado di generare un video realistico semplicemente da un messaggio di testo da parte di un utente. Ma i prompt possono contenere anche altri video e immagini.
I video creati con Seedance 2.0 e revisionati dalla CNBC sembrano mostrare immagini e video abbastanza realistici che sono stati completamente creati con l’intelligenza artificiale.
Billy Boman, che vive a Stoccolma, in Svezia, e gestisce un’agenzia pubblicitaria creativa che produce contenuti generati dall’intelligenza artificiale, ha utilizzato Seedance 2.0.
Ha affermato che la generazione di video AI ha fatto passi da gigante negli ultimi due anni, con rapidi miglioramenti in tutto il settore.

“Nel 2023… era difficile convincere qualcuno a correre o a camminare. Qualsiasi tipo di realismo lo era [limited to] clip molto brevi, tutto era molto lento, texture scadenti, nessuna texture della pelle, mancanza di dettagli. Ora il copione è capovolto. Ora posso fare qualsiasi cosa. I progressi tecnologici sono stati a dir poco eccezionali”, ha detto Boman alla CNBC in un’intervista.
Yakefu di Hugging Face, ha aggiunto che il modello Seedance 2.0 ha mostrato progressi rispetto alle generazioni precedenti in “controllabilità, velocità ed efficienza produttiva”.
“Seedance 2.0 è uno dei modelli di generazione video più completi che ho testato finora. Mi ha davvero sorpreso fornendo risultati soddisfacenti al primo tentativo, anche con un semplice suggerimento. Le immagini, la musica e la cinematografia si uniscono in un modo che sembra raffinato piuttosto che sperimentale”, ha affermato Yakefu.
Tuttavia, mentre gli utenti hanno elogiato la tecnologia, Seedance ha avuto problemi. Media locali cinesi segnalato che Seedance ha sospeso una funzionalità che consentiva all’intelligenza artificiale di generare la voce di una persona in base a un’immagine caricata. Ciò è avvenuto dopo che un blogger in Cina ha espresso preoccupazione per la generazione della voce che avviene senza consenso.
ByteDance non è stato immediatamente disponibile per un commento quando è stato contattato dalla CNBC.
Kling di Kuaishou 3.0
Rilasciato la scorsa settimana, Kling 3.0 di Kuaishou è un altro modello di generazione video che rivaleggia con quello di ByteDance.
Kling 3.0 “presenta importanti aggiornamenti in termini di coerenza, output fotorealistico, durata video estesa fino a 15 secondi e generazione di audio nativo in più lingue, dialetti e accenti.
Il modello è disponibile solo per gli abbonati paganti, ma sarà presto disponibile al pubblico, ha affermato Kuaishou.
Il successo di Kuaishou con i suoi modelli Kling è stato un fattore chiave dietro l’aumento del prezzo delle sue azioni di oltre il 50% nell’ultimo anno.
Azioni Kuaishou da inizio anno
Altri importanti rilasci di modelli di intelligenza artificiale
Zhipu AI – che viene commercializzato come Knowledge Atlas Technology a Hong Kong – ha visto le sue azioni aumentare giovedì dopo aver rilasciato GLM-5, un modello open source per grandi linguaggi con capacità di codifica avanzate e attività dell’agente di lunga durata.
L’azienda ha detto il modello si avvicina a Claude Opus 4.5 di Anthropic nei benchmark di codifica superando il Gemini 3 Professional di Google in alcuni take a look at. La CNBC non ha potuto verificare tali affermazioni.
Anche le azioni di MiniMax hanno registrato un balzo giovedì ha lanciato il suo M2.5 aggiornato modello open supply con strumenti di agente AI avanzati. “Agenti” o “AI agentica” si riferiscono a strumenti di intelligenza artificiale progettati per automatizzare le attività.
— Anniek Bao e Dylan Butts della CNBC hanno contribuito a questo rapporto.









