Home Tecnologia Cohere lancia una famiglia di modelli multilingue aperti

Cohere lancia una famiglia di modelli multilingue aperti

22
0

La società di intelligenza artificiale aziendale Cohere ha lanciato una nuova famiglia di modelli multilingue a margine dell’India AI Summit in corso. I modelli, soprannominati Tiny Aya, sono open-weight, il che significa che il loro codice sottostante è pubblicamente disponibile per essere utilizzato e modificato da chiunque, supportano oltre 70 lingue e possono essere eseguiti su dispositivi di uso quotidiano come i laptop computer senza richiedere una connessione Web.

Il modello, lanciato dal braccio di ricerca dell’azienda Cohere Labs, supporta le lingue dell’Asia meridionale come bengalese, hindi, punjabi, urdu, gujarati, tamil, telugu e marathi.

Il modello base contiene 3,35 miliardi di parametri, una misura della sua dimensione e complessità. Cohere ha anche lanciato TinyAya-International, una versione ottimizzata per seguire meglio i comandi dell’utente, per app che richiedono un ampio supporto linguistico. Varianti regionali completano la famiglia: TinyAya-Earth per le lingue africane; TinyAya-Fireplace per le lingue dell’Asia meridionale; e TinyAya-Water per l’Asia Pacifico, l’Asia occidentale e l’Europa.

Crediti immagine: Cohere

“Questo approccio consente a ciascun modello di sviluppare basi linguistiche e sfumature culturali più forti, creando sistemi che risultano più naturali e affidabili per le comunità che intendono servire. Allo stesso tempo, tutti i modelli Tiny Aya mantengono un’ampia copertura multilingue, rendendoli punti di partenza flessibili per ulteriori adattamenti e ricerche”, ha affermato la società in una nota.

Cohere ha osservato che questi modelli, addestrati su un singolo cluster di 64 GPU H100 (un tipo di chip advert alta potenza di Nvidia) utilizzando fonti di calcolo relativamente modeste, sono ideali per ricercatori e sviluppatori che creano app per un pubblico che parla lingue native. I modelli possono essere eseguiti direttamente sui dispositivi, quindi gli sviluppatori possono utilizzarli per potenziare la traduzione offline. L’azienda ha notato di aver creato il software program sottostante per adattarlo all’utilizzo del dispositivo, richiedendo meno potenza di calcolo rispetto alla maggior parte dei modelli comparabili.

Crediti immagine: Cohere

In paesi linguisticamente diversi come l’India, questo tipo di funzionalità offline può aprire una serie diversificata di applicazioni e casi d’uso senza la necessità di un accesso costante a Web.

I modelli sono disponibili su HuggingFace, la popolare piattaforma per condividere e testare modelli di intelligenza artificiale, e sulla piattaforma Cohere. Gli sviluppatori possono scaricarli su HuggingFace, Kaggle e Ollama per la distribuzione locale. L’azienda sta inoltre rilasciando set di dati di formazione e valutazione su HuggingFace e prevede di pubblicare un rapporto tecnico che dettaglia la sua metodologia di formazione.

Evento Techcrunch

Boston, MA
|
23 giugno 2026

L’amministratore delegato della startup, Aidan Gomez, ha dichiarato l’anno scorso che la società prevede di quotarsi in borsa “presto”. Secondo CNBCla società ha chiuso il 2025 in maniera positiva, registrando 240 milioni di dollari di ricavi annuali ricorrenti, con una crescita del 50% trimestre su trimestre durante tutto l’anno.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here