La società cinese Moonshot AI ha aggiornato il suo modello Kimi K2 open supply, trasformandolo in un modello di codifica e visione con un’architettura che supporta un’orchestrazione di sciami di agenti.
Il nuovo modello, Moonshot Kimi K2.5, è una buona opzione per le aziende che desiderano agenti in grado di trasferire automaticamente le azioni invece di avere un quadro che funge da decisore centrale.
L’azienda ha caratterizzato Kimi K2.5 come un “modello all-in-one” che supporta sia enter visivi che testuali, consentendo agli utenti di sfruttare il modello per più progetti di codifica visiva.
Moonshot non ha rivelato pubblicamente il conteggio dei parametri di K2.5, ma il modello Kimi K2 su cui si basa aveva 1 trilione di parametri totali e 32 miliardi di parametri attivati grazie alla sua architettura mista di esperti.
Questo è l’ultimo modello open supply in grado di offrire un’alternativa alle opzioni più chiuse di Google, OpenAI e Anthropic e li supera in termini di prestazioni chiave, inclusi flussi di lavoro degli agenti, codifica e visione.
Su L’ultimo esame dell’umanità (HLE) punto di riferimento, Kimi K2.5 ha segnato 50,2% (con strumenti), superando GPT-5.2 (xhigh) di OpenAI e Claude Opus 4.5. Ha anche raggiunto 76,8% SU Banco SWE verificatoconsolidando il suo standing di modello di codifica di alto livello, anche se GPT-5.2 e Opus 4.5 lo superano qui rispettivamente a 80 e 80.9.
Moonshot ha dichiarato in un comunicato stampa di aver registrato un aumento del 170% degli utenti tra settembre e novembre per Kimi K2 e Kimi K2 Considering, che è stato rilasciato all’inizio di novembre.
Sciame di agenti e orchestrazione integrata
Moonshot mira a sfruttare gli agenti autodiretti e il paradigma dello sciame di agenti integrato in Kimi K2.5. Lo sciame di agenti è stato pubblicizzato come la prossima frontiera nello sviluppo di intelligenza artificiale aziendale e nei sistemi basati su agenti. Ha attirato molta attenzione negli ultimi mesi.
Per le aziende, ciò significa che se costruiscono ecosistemi di agenti con Kimi K2.5, possono aspettarsi di scalare in modo più efficiente. Ma invece di “ingrandire” o aumentare le dimensioni del modello per creare agenti più grandi, si punta a creare più agenti che possano essenzialmente orchestrarsi da soli.
Kimi K2.5 “crea e coordina uno sciame di agenti specializzati che lavorano in parallelo”. L’azienda lo ha paragonato a un alveare in cui ciascun agente svolge un compito contribuendo al contempo a un obiettivo comune. Il modello impara advert autodirigere fino a 100 subagenti e può eseguire flussi di lavoro paralleli fino a 1.500 chiamate a strumenti.
“I benchmark raccontano solo metà della storia. Moonshot AI ritiene che l’AGI dovrebbe in definitiva essere valutata in base alla sua capacità di completare le attività del mondo reale in modo efficiente e con vincoli di tempo reali. La vera metrica a cui tengono è: quanta parte della tua giornata ti ha effettivamente restituito l’intelligenza artificiale? L’esecuzione in parallelo riduce sostanzialmente il tempo necessario per un’attività complessa: attività che richiedevano giorni di lavoro ora possono essere completate in pochi minuti”, ha affermato l’azienda.
Le aziende che stanno valutando le proprie strategie di orchestrazione hanno iniziato a guardare a piattaforme di agenti in cui gli agenti comunicano e trasferiscono compiti, piuttosto che seguire un rigido quadro di orchestrazione che determina quando un’azione viene completata.
Sebbene Kimi K2.5 possa offrire un’opzione interessante per le organizzazioni che desiderano utilizzare questa forma di orchestrazione, alcune potrebbero sentirsi più a loro agio evitando l’orchestrazione basata su agenti integrata nel modello e utilizzando invece una piattaforma diversa per differenziare la formazione del modello dall’attività dell’agente.
Questo perché le aziende spesso desiderano una maggiore flessibilità nella scelta dei modelli che compongono i propri agenti, in modo da poter costruire un ecosistema di agenti che sfrutti gli LLM che funzionano meglio per azioni specifiche.
Alcune piattaforme di agenti, come Salesforce, AWS Bedrock e IBM, offrono strumenti separati di osservabilità, gestione e monitoraggio che aiutano gli utenti a orchestrare agenti AI creati con modelli diversi e consentono loro di lavorare insieme.
Codifica multimodale e debug visivo
Il modello consente agli utenti di codificare structure visivi, comprese le interfacce utente e le interazioni. Ragiona su immagini e video per comprendere le attività codificate negli enter visivi. Advert esempio, K2.5 può ricostruire il codice di un sito net semplicemente analizzando una registrazione video del sito in azione, traducendo segnali visivi in structure e animazioni interattive.
“Interfacce, structure e interazioni difficili da descrivere con precisione nel linguaggio possono essere comunicati attraverso screenshot o registrazioni di schermate, che il modello può interpretare e trasformare in siti Net completamente funzionanti. Ciò consente una nuova classe di esperienze di codifica delle vibrazioni”, ha affermato Moonshot.
Questa funzionalità è integrata in Kimi Code, un nuovo strumento basato su terminale che funziona con IDE come VSCode e Cursor.
Supporta il “debug visivo autonomo”, in cui il modello ispeziona visivamente il proprio output, come una pagina Net renderizzata, fa riferimento alla documentazione e esegue l’iterazione del codice per correggere spostamenti di structure o errori estetici senza intervento umano.
A differenza di altri modelli multimodali in grado di creare e comprendere immagini, Kimi K2.5 può creare interazioni frontend per siti Net con elementi visivi, non solo con il codice dietro di essi.
Prezzi dell’API
Moonshot AI ha fissato un prezzo aggressivo per l’API K2.5 per competere con i principali laboratori statunitensi, offrendo riduzioni significative rispetto al precedente modello K2 Turbo.
-
Ingresso: 60 centesimi per milione di token (a 47,8% diminuire).
-
Ingresso memorizzato nella cache: 10 centesimi per milione di token (a 33,3% diminuire).
-
Produzione: $ 3 per milione di token (a 62,5% diminuire).
Il basso costo degli enter memorizzati nella cache ($ 0,10/milione di token) è particolarmente rilevante per le funzionalità “Agent Swarm”, che spesso richiedono il mantenimento di ampie finestre di contesto su più agenti secondari e un ampio utilizzo degli strumenti.
Licenza MIT modificata
Sebbene Kimi K2.5 sia open supply, viene rilasciato con una licenza MIT modificata che embody una clausola specifica rivolta agli utenti commerciali “iperscale”.
La licenza concede autorizzazioni normal per utilizzare, copiare, modificare e vendere il software program.
Tuttavia, stabilisce che se il software program o qualsiasi lavoro derivato viene utilizzato per un prodotto o servizio commerciale che ha più di 100 milioni di utenti attivi mensili (MAU) o più di 20 milioni di dollari di entrate mensili, l’entità deve visualizzare in modo ben visibile “Kimi K2.5” sull’interfaccia utente.
Questa clausola garantisce che, sebbene il modello rimanga gratuito e aperto per la stragrande maggioranza della comunità di sviluppatori e startup, i principali giganti della tecnologia non possano etichettare in bianco la tecnologia di Moonshot senza fornire un’attribuzione visibile.
Non è completamente “open supply” ma è migliore del simile di Meta Termini di licenza lama per la sua famiglia di modelli “open supply”, che richiedeva alle aziende con 700 milioni o più di utenti mensili di ottenere una speciale licenza aziendale dall’azienda.
Cosa significa per i moderni costruttori di IA aziendali
Per i professionisti che definiscono il moderno stack di intelligenza artificiale, dai decisori LLM che ottimizzano i cicli di implementazione ai chief dell’orchestrazione dell’intelligenza artificiale che impostano agenti e processi aziendali automatizzati basati sull’intelligenza artificiale, Kimi K2.5 rappresenta un cambiamento fondamentale nella leva finanziaria.
Incorporando l’orchestrazione dello sciame direttamente nel modello, Moonshot AI fornisce effettivamente a questi costruttori con risorse limitate una forza lavoro sintetica, consentendo a un singolo ingegnere di dirigere un centinaio di sub-agenti autonomi con la stessa facilità di un singolo immediate.
Questa architettura “scale-out” affronta direttamente il dilemma dei decisori relativi ai dati di bilanciare pipeline complesse con un numero limitato di dipendenti, mentre la struttura dei prezzi ridotta trasforma l’elaborazione dei dati advert alto contesto da un lusso che rompe il finances in una merce di routine.
In definitiva, K2.5 suggerisce un futuro in cui il vincolo principale per un staff di ingegneri non è più il numero di mani sulle tastiere, ma la capacità dei suoi chief di coreografare uno sciame.











