La rivoluzione del deep studying ha un curioso punto cieco: il foglio di calcolo. Mentre i Massive Language Fashions (LLM) hanno padroneggiato le sfumature della prosa umana e i generatori di immagini hanno conquistato la tela digitale, i dati strutturati e relazionali che sono alla base dell’economia globale – le righe e le colonne dei sistemi ERP, CRM e registri finanziari – sono stati finora trattati solo come un altro formato di file simile al testo o ai PDF.
Ciò ha lasciato le aziende a prevedere i risultati aziendali utilizzando il tipico processo di knowledge science su misura e advert alta intensità di lavoro di ingegneria delle funzionalità manuali e i classici algoritmi di machine studying che precedono il moderno deep studying.
Ma ora Fondamentaleuna società di intelligenza artificiale con sede a San Francisco co-fondata dagli ex studenti di DeepMind lanciato oggi con un finanziamento totale di 255 milioni di dollari per colmare questa lacuna.
Emergendo dall’ombra, l’azienda sta debuttando con NEXUS, un Massive Tabular Mannequin (LTM) progettato per trattare i dati aziendali non come una semplice sequenza di parole, ma come una complessa rete di relazioni non lineari.
La tecnologia: andare oltre la logica sequenziale
La maggior parte degli attuali modelli di intelligenza artificiale si basano su una logica sequenziale, ovvero prevedono la parola successiva in una frase o il pixel successivo in un fotogramma.
Tuttavia, i dati aziendali sono intrinsecamente non sequenziali. Il rischio di abbandono di un cliente non è solo una sequenza temporale; è un’intersezione multidimensionale tra frequenza delle transazioni, sentiment sui ticket di supporto e cambiamenti economici regionali. Gli LLM esistenti lottano con questo problema perché poco si adattano ai vincoli di dimensioni e dimensionalità delle tabelle su scala aziendale.
“I dati più preziosi al mondo risiedono nelle tabelle e fino advert ora non esisteva un buon modello di base costruito appositamente per comprenderli”, ha affermato Jeremy Fraenkel, CEO e co-fondatore di Elementary.
In una recente intervista con VentureBeat, Fraenkel ha sottolineato che mentre il mondo dell’intelligenza artificiale è ossessionato da testo, audio e video, le tabelle rimangono la modalità più diffusa per le aziende. “I LLM in realtà non sono in grado di gestire molto bene questo tipo di dati”, ha spiegato, “e le aziende attualmente si affidano advert algoritmi di apprendimento automatico molto vecchio stile per fare previsioni”.
NEXUS è stato addestrato su miliardi di set di dati tabulari del mondo reale utilizzando Amazon SageMaker HyperPod. A differenza dei tradizionali modelli XGBoost o Random Forest, che richiedono ai knowledge scientist di definire manualmente le caratteristiche (le variabili specifiche che il modello dovrebbe esaminare) NEXUS è progettato per acquisire direttamente tabelle grezze.
Identifica modelli latenti tra colonne e righe che gli analisti umani potrebbero non notare, leggendo efficacemente il linguaggio nascosto della griglia per comprendere le interazioni non lineari.
La trappola della tokenizzazione
Uno dei motivi principali per cui i LLM tradizionali falliscono nei dati tabulari è il modo in cui elaborano i numeri. Fraenkel spiega che i LLM tokenizzano i numeri nello stesso modo in cui tokenizzano le parole, suddividendoli in parti più piccole. “Il problema è che applicano la stessa cosa ai numeri. Le tabelle sono, in generale, tutte numeriche”, ha osservato Fraenkel. “Se hai un numero come 2.3, il ‘2’, il ‘.’ e il ‘3’ sono visti come tre token diversi. Ciò significa essenzialmente che perdi la comprensione della distribuzione dei numeri. Non è come una calcolatrice; non sempre ottieni la risposta giusta perché il modello non capisce il concetto di numero in modo nativo.”
Inoltre, i dati tabulari sono invarianti rispetto all’ordine a differenza del linguaggio. Fraenkel utilizza un esempio sanitario per illustrare: “Se vi do una tabella con centinaia di migliaia di pazienti e vi chiedo di prevedere quale di loro ha il diabete, non dovrebbe importare se la prima colonna è l’altezza e la seconda il peso, o viceversa.”
Mentre gli LLM sono altamente sensibili all’ordine delle parole in un immediate, NEXUS è progettato per comprendere che lo spostamento delle posizioni delle colonne non dovrebbe influire sulla previsione sottostante.
Operando a livello predittivo
Recenti integrazioni di alto profilo, come Claude di Anthropic che appare direttamente in Microsoft Excel, hanno suggerito che i LLM stanno già risolvendo tabelle.
Tuttavia, Fraenkel distingue il lavoro di Elementary come operante a un livello fondamentalmente diverso: il livello predittivo. “Quello che stanno facendo è essenzialmente a livello di formulation: le formule sono testo, sono come codice”, ha detto. “Non stiamo cercando di consentirti di creare un modello finanziario in Excel. Ti stiamo aiutando a fare una previsione.”
NEXUS è progettato per decisioni in frazioni di secondo in cui un essere umano non è coinvolto, come advert esempio un fornitore di carte di credito che determina se una transazione è fraudolenta nel momento in cui scorri.
Mentre strumenti come Claude possono riassumere un foglio di calcolo, NEXUS è progettato per prevedere la riga successiva, sia che si tratti di un guasto alle apparecchiature in una fabbrica o della probabilità che un paziente venga riammesso in ospedale.
Architettura e disponibilità
La proposta di valore fondamentale di Elementary è la riduzione radicale del tempo necessario per ottenere informazioni. Tradizionalmente, la creazione di un modello predittivo potrebbe richiedere mesi di lavoro manuale.
“Devi assumere un esercito di knowledge scientist per costruire tutte quelle pipeline di dati per elaborare e pulire i dati”, ha spiegato Fraenkel. “Se ci sono valori mancanti o dati incoerenti, il tuo modello non funzionerà. Devi costruire quelle pipeline per ogni singolo caso d’uso.”
Affermazioni fondamentali NEXUS sostituisce l’intero processo manuale con una sola riga di codice. Poiché il modello è stato pre-addestrato su un miliardo di tabelle, non richiede lo stesso livello di formazione specifica per attività o di ingegneria delle funzionalità richiesto dagli algoritmi tradizionali.
Mentre Elementary passa dalla sua fase invisibile al mercato più ampio, lo fa con una struttura commerciale progettata per aggirare i tradizionali attriti legati all’adozione del software program aziendale.
L’azienda si è già assicurata diversi contratti a sette cifre con organizzazioni Fortune 100, un’impresa facilitata da un’architettura strategica di go-to-market in cui Amazon Internet Providers (AWS) funge da venditore di report sul mercato AWS.
Ciò consente ai chief aziendali di acquisire e distribuire NEXUS utilizzando i crediti AWS esistenti, trattando efficacemente l’intelligenza predittiva come un’utilità normal insieme all’elaborazione e allo storage. Per gli ingegneri incaricati dell’implementazione, l’esperienza è advert alto impatto ma a basso attrito; NEXUS opera tramite un’interfaccia basata su Python a un livello puramente predittivo piuttosto che conversazionale.
Gli sviluppatori collegano le tabelle grezze direttamente al modello ed etichettano colonne goal specifiche, come la probabilità di default del credito o un punteggio di rischio di manutenzione, per attivare la previsione. Il modello restituisce quindi regressioni o classificazioni direttamente nello stack di dati aziendali, funzionando come un motore silenzioso e advert alta velocità per il processo decisionale automatizzato piuttosto che come un assistente basato su chat.
La posta in gioco sociale: oltre i profitti
Sebbene le implicazioni commerciali della previsione della domanda e della previsione dei prezzi siano chiare, Elementary sottolinea il vantaggio sociale dell’intelligenza predittiva.
L’azienda evidenzia le aree chiave in cui NEXUS può prevenire esiti catastrofici identificando i segnali nascosti nei dati strutturati.
Analizzando i dati dei sensori e i registri di manutenzione, NEXUS può prevedere guasti come la corrosione dei tubi. L’azienda indica la crisi idrica di Flint – che è costata oltre 1 miliardo di dollari in riparazioni – come un esempio in cui il monitoraggio predittivo avrebbe potuto prevenire una contaminazione pericolosa per la vita.
Allo stesso modo, durante la crisi del COVID-19, la carenza di DPI costa agli ospedali 323 miliardi di dollari in un solo anno. Fondamentale sostiene che, utilizzando dati di produzione ed epidemiologici, NEXUS può prevedere le carenze 4-6 settimane prima del picco della domanda, innescando la produzione di emergenza in tempo per salvare vite umane.
Sul fronte climatico, NEXUS mira a fornire previsioni su inondazioni e siccità a 30-60 giorni, come per le inondazioni del Pakistan del 2022 che hanno causato danni per 30 miliardi di dollari.
Infine, il modello viene utilizzato per prevedere i rischi di riammissione in ospedale analizzando i dati demografici dei pazienti e i determinanti sociali. Come afferma l’azienda: “Una madre single che svolge due lavori non dovrebbe finire di nuovo al pronto soccorso perché non eravamo riusciti a prevedere che avrebbe avuto bisogno di treatment di follow-up”.
Prestazioni e latenza
Nel mondo aziendale, la definizione di migliore varia a seconda del settore. Per alcuni è la velocità; per altri, è pura precisione.
“In termini di latenza, dipende dal caso d’uso”, spiega Fraenkel. “Se sei un ricercatore che cerca di capire quali farmaci somministrare a un paziente in Africa, la latenza non ha molta importanza. Stai cercando di prendere una decisione più accurata che può finire per salvare il maggior numero di vite possibili.”
Al contrario, per una banca o un hedge fund, anche un aumento marginale dell’accuratezza si traduce in un valore enorme.
“Aumentare la precisione delle previsioni dello 0,5% vale miliardi di dollari per una banca”, afferma Fraenkel. “Per diversi casi d’uso, l’entità dell’aumento percentuale cambia, ma possiamo offrirti prestazioni migliori di quelle attuali.”
La visione ambiziosa riceve un grande sostegno
La serie A da 225 milioni di dollari, guidata da Oak HC/FT con la partecipazione di Salesforce Ventures, Valor Fairness Companions e Battery Ventures, segnala la convinzione altamente convinta che i dati tabulari siano la prossima grande frontiera.
Importanti investitori angelici, tra cui chief di Perplexity, Wiz, Brex e Datadog, confermano ulteriormente il pedigree dell’azienda.
Annie Lamont, co-fondatrice e socio amministratore di Oak HC/FT, ha espresso il sentimento: “L’importanza del modello di Elementary è difficile da sopravvalutare: i dati strutturati e relazionali devono ancora vedere i vantaggi della rivoluzione del deep studying”.
Fondamentale è posizionarsi non solo come un ulteriore strumento di intelligenza artificiale, ma come una nuova categoria di intelligenza artificiale aziendale. Con un crew di circa 35 persone con sede a San Francisco, l’azienda si sta allontanando dall’period dei modelli su misura per passare all’period dei modelli base per i tavoli.
“Quegli algoritmi tradizionali sono rimasti gli stessi negli ultimi 10 anni; non stanno migliorando”, ha detto Fraenkel. “I nostri modelli continuano a migliorare. Stiamo facendo per le tabelle la stessa cosa che ChatGPT ha fatto per il testo.”
Collaborazione con AWS
Attraverso una partnership strategica con Amazon Internet Providers (AWS), NEXUS è integrato direttamente nel dashboard AWS. I clienti AWS possono distribuire il modello utilizzando i crediti e l’infrastruttura esistenti. Fraenkel lo descrive come un “accordo davvero unico”, sottolineando che Elementary è una delle uniche due società di intelligenza artificiale advert aver stabilito una partnership così profonda e multilivello con Amazon.
Uno degli ostacoli più significativi per l’intelligenza artificiale aziendale è la privateness dei dati. Le aziende spesso non sono disposte a spostare dati sensibili su un’infrastruttura di terze parti.
Per risolvere questo problema, Elementary e Amazon hanno realizzato un’enorme impresa ingegneristica: la capacità di distribuire modelli completamente crittografati, sia nell’architettura che nei pesi, direttamente all’interno dell’ambiente del cliente. “I clienti possono essere sicuri che i dati siano nelle loro mani”, ha affermato Fraenkel. “Siamo la prima, e attualmente l’unica, azienda advert aver realizzato una soluzione del genere.”
L’emergere di Elementary è un tentativo di ridefinire il sistema operativo per le decisioni aziendali. Se NEXUS si comporterà come pubblicizzato, gestendo le frodi finanziarie, i prezzi dell’energia e le interruzioni della catena di approvvigionamento con un unico modello generalizzato, segnerà il momento in cui l’intelligenza artificiale imparerà finalmente a leggere i fogli di calcolo che effettivamente governano il mondo. Il potere di prevedere non consiste più nel guardare cosa è successo ieri; si tratta di scoprire il linguaggio nascosto delle tabelle per determinare cosa accadrà domani.













