Segui ZDNET: Aggiungici come fonte preferita su Google.
I principali punti salienti di ZDNET
- Martedì Moonshot ha presentato il suo modello Kimi K2.5 open supply.
- Può generare interfacce internet basate esclusivamente su immagini o video.
- Viene inoltre fornito con una funzione beta “sciame di agenti”.
La startup cinese di intelligenza artificiale Moonshot, sostenuta da Alibaba, ha rilasciato martedì Kimi K2.5, descrivendolo in un file articolo del blog come il “modello open supply più potente fino advert oggi” al mondo.
Costruito sulla base del Kimi K2 LLM, che ha debuttato la scorsa property, l’ultimo modello di Moonshot è dotato di funzionalità di codifica che potrebbero renderlo un serio concorrente con le sue controparti proprietarie. Secondo i dati pubblicati da Moonshot, Kimi K2.5 ha ottenuto punteggi comparabili ai modelli di frontiera di OpenAI, Google e Anthropic sui benchmark di codifica SWE-Bench Verified e SWE-Bench Multilingual.
La sua capacità di creare interfacce internet front-end da enter visivi, tuttavia, è ciò che potrebbe davvero distinguerlo dalla massa.
Codificare con visione
Kimi K2.5 è stato pre-addestrato con 15 trilioni di testo e token visivi, rendendolo “un modello multimodale nativo”, secondo Moonshot, in grado di generare interfacce internet da immagini o video caricati, full di elementi interattivi ed effetti di scorrimento.
In un video dimostrativo di questa funzionalità di “codifica con visione” incluso nel put up del weblog di Moonshot, Kimi K2.5 ha generato una bozza di un nuovo sito Internet basato su un video registrato di un sito Internet preesistente, mostrato dalla prospettiva dello schermo di un utente mentre scorre. Il modello è stato in grado di ricreare l’estetica generale, anche se, nel classico stile dell’IA, ha commesso alcuni lievi errori visivi lungo il percorso, come raffigurare i continenti su un globo come macchie amorfe.
Non è chiaro quanto sarà pratico questo tipo di capacità. (Perché un’azienda dovrebbe creare una copia generata dall’intelligenza artificiale leggermente meno accattivante di un sito Internet già perfettamente ragionevole?) Tuttavia, generare modelli di siti Internet e app esclusivamente da immagini o video segnerebbe un significativo passo avanti per i cosiddetti strumenti di “vibe coding”, che si basano su metodi intuitivi facilmente implementabili da non esperti piuttosto che sulla codifica tradizionale.
ChatGPT, Claude e Gemini possono generare codice grezzo per nuove risorse internet basate su screenshot o altre immagini, ma ciò lascia comunque all’utente la necessità di tradurlo in un prodotto finito e utilizzabile. La novità (e il potenziale valore di mercato) del nuovo modello di Moonshot è che elimina quel passaggio intermedio. “Ragionando su immagini e video, K2.5 migliora la generazione di immagini/video in codice e il debug visivo, abbassando la barriera che impedisce agli utenti di esprimere visivamente le proprie intenzioni”, ha scritto l’azienda nel suo put up sul weblog.
Inoltre: ho usato Claude Code per codificare un’app Mac in 8 ore, ma è stato più lavoro che magia
Se si rivelasse utile nel mondo reale, soprattutto tra le aziende, altri sviluppatori probabilmente seguiranno l’esempio con funzionalità simili per i propri modelli.
Le capacità di codifica di Kimi K2.5 sono state rese disponibili attraverso una piattaforma open supply chiamata Kimi Code, a cui è possibile accedere tramite ambienti di sviluppo integrati (IDE) come Cursor, VSCode e Zed. Il nuovo modello è disponibile anche tramite Kimi.coml’app Kimi e Kimi API.
Sciame di agenti
Moonshot ha anche presentato un’anteprima della ricerca chiamata “sciame di agenti”, che orchestra fino a cento “sottoagenti” per migliorare le prestazioni su determinati compiti a più fasi.
Eseguendo più attività in parallelo tra loro, lo sciame di agenti può anche accelerare il processo di calcolo. “L’esecuzione simultanea di queste sottoattività riduce significativamente la latenza end-to-end rispetto all’esecuzione sequenziale dell’agente”, ha scritto Moonshot nel suo put up sul weblog, aggiungendo che le valutazioni interne hanno mostrato che il runtime end-to-end – il processo totale dall’enter al completamento dell’output finale – potrebbe essere ridotto fino all’80%.
Inoltre: ho usato Claude Code per codificare un’app per Apple Watch in sole 12 ore, invece di 2 mesi
Gli utenti con un account Moonshot “Allegretto” o “Vivace” attivo (che costano rispettivamente $ 31/mese e $ 159/mese) possono provare Agent Swarm sul sito internet di Kimi facendo clic sul menu a discesa del modello in basso a destra nella finestra di dialogo e selezionando “K2.5 Agent Swarm (Beta)”.













