Home Tecnologia Perché MongoDB ritiene che un recupero migliore, e non modelli più grandi,...

Perché MongoDB ritiene che un recupero migliore, e non modelli più grandi, sia la chiave per un’intelligenza artificiale aziendale affidabile

41
0

I sistemi agentici e la ricerca aziendale dipendono da un efficace recupero dei dati che funzioni in modo efficiente e accurato. Il fornitore di database MongoDB ritiene che sia il più recente modelli di inglobamento contribuire a risolvere il calo della qualità di recupero man mano che sempre più sistemi di intelligenza artificiale entrano in produzione.

Man mano che i sistemi advert agenti e RAG entrano in produzione, la qualità del recupero sta emergendo come un punto di fallimento silenzioso, che può minare l’accuratezza, i costi e la fiducia degli utenti anche quando i modelli stessi funzionano bene.

L’azienda ha lanciato quattro nuove versioni dei suoi modelli di incorporamento e riclassificazione. Voyage 4 sarà disponibile in quattro modalità: Voyage-4 Embedding, Voyage-4-large, Voyage-4-lite e Voyage-4-nano.

MongoDB ha affermato che l’incorporamento di Voyage-4 funge da modello generale; MongoDB considera Voyage-4-large il suo modello di punta. Voyage-4-lite si concentra su attività che richiedono poca latenza e costi inferiori, mentre Voyage-4-nano è destinato advert ambienti di sviluppo e check più locali o al recupero di dati sul dispositivo.

Voyage-4-nano è anche il primo modello a peso aperto di MongoDB. Tutti i modelli sono disponibili tramite API e sulla piattaforma Atlas di MongoDB.

La società ha affermato che i modelli superano modelli simili di Google e Cohere sul benchmark RTEB. Abbracciare il viso Punto di riferimento RTEB pone Voyage 4 come il modello di incorporamento principale.

“I modelli di incorporamento sono una di quelle scelte invisibili che possono davvero creare o distruggere le esperienze di intelligenza artificiale”, ha affermato Frank Liu, product supervisor di MongoDB, in un briefing. “Se sbagli, i risultati della tua ricerca sembreranno piuttosto casuali e superficiali, ma se li sbagli, la tua applicazione improvvisamente sembrerà di comprendere i tuoi utenti e i tuoi dati.”

Ha aggiunto che l’obiettivo dei modelli Voyage 4 è quello di migliorare il recupero dei dati del mondo reale, che spesso crolla una volta che i gasdotti Agentic e RAG entrano in produzione.

MongoDB ha anche rilasciato un nuovo modello di incorporamento multimodale, Voyage-multimodal-3.5, in grado di gestire documenti che includono testo, immagini e video. Questo modello vettorizza i dati ed estrae il significato semantico da tabelle, grafici, determine e diapositive tipicamente presenti nei documenti aziendali.

Problemi di incorporamento delle imprese

Per le imprese, un sistema advert agenti è efficace tanto quanto la sua capacità di recuperare in modo affidabile le informazioni giuste al momento giusto. Questo requisito diventa più difficile man mano che i carichi di lavoro si ridimensionano e le finestre di contesto si frammentano.

Diversi fornitori di modelli prendono di mira questo livello di intelligenza artificiale degli agenti. Quello di Google Modello da incasso Gemini sormontato le classifiche di incorporamento e Cohere ha lanciato il suo Incorpora 4 modelli multimodaliche elabora documenti lunghi più di 200 pagine. Mistral ha affermato che il suo modello di incorporamento del codice, Incorporamento codestralesupera Cohere, Google e persino Voyage Code 3 di MongoDB. MongoDB sostiene che le prestazioni benchmark da sole non risolvono la complessità operativa che le aziende devono affrontare nella produzione.

MongoDB ha affermato che molti clienti hanno scoperto che i loro stack di dati non sono in grado di gestire carichi di lavoro sensibili al contesto e advert alta intensità di recupero in produzione. La società ha affermato che sta assistendo a una maggiore frammentazione con le aziende costrette a mettere insieme various soluzioni per connettere i database con un modello di recupero o riclassificazione. Per aiutare i clienti che non desiderano soluzioni frammentate, l’azienda offre i suoi modelli attraverso un’unica piattaforma dati, Atlas.

La scommessa di MongoDB è che il recupero non può più essere trattato come una raccolta sciolta di componenti di prima qualità. Affinché gli agenti aziendali possano funzionare in modo affidabile su larga scala, gli incorporamenti, il riclassificazione e il livello dati devono funzionare come un sistema strettamente integrato anziché come uno stack messo insieme.

fonte