Gli agenti AI vengono eseguiti su file system utilizzando strumenti normal per navigare nelle listing e leggere i percorsi dei file.
La sfida, tuttavia, è che ci sono molti dati aziendali nei sistemi di storage di oggetti, in particolare Amazon S3. Gli archivi di oggetti forniscono dati tramite chiamate API, non percorsi di file. Colmare questo divario ha richiesto un livello di file system separato insieme a S3, dati duplicati e pipeline di sincronizzazione per mantenerli entrambi allineati.
TL’ascesa dell’IA agente rende questa sfida ancora più difficile e sta influenzando la capacità di Amazon di portare a termine le cose. I crew di ingegneri di AWS che utilizzavano strumenti come Kiro e Claude Code continuavano a riscontrare lo stesso problema: gli agenti utilizzavano per impostazione predefinita strumenti di file locali, ma i dati erano in S3. Il obtain locale ha funzionato fino a quando la finestra di contesto dell’agente non si è compattata e lo stato della sessione è andato perso.
La risposta di Amazon è S3 Information, che monta qualsiasi bucket S3 direttamente nell’ambiente locale di un agente con un singolo comando. I dati rimangono in S3, senza necessità di migrazione. Dietro le quinte, AWS collega la sua tecnologia Elastic File System (EFS) a S3 per fornire la semantica completa del file system, non una soluzione alternativa. S3 Information è ora disponibile nella maggior parte delle regioni AWS.
“Rendendo i dati in S3 immediatamente disponibili, come se fossero parte del file system locale, abbiamo scoperto di avere un’accelerazione davvero grande con la capacità di cose come Kiro e Claude Code di essere in grado di lavorare con quei dati”, ha detto a VentureBeat Andy Warfield, vicepresidente e illustre ingegnere di AWS.
La differenza tra archiviazione di file e oggetti e perché è importante
S3 è stato realizzato per garantire durabilità, scalabilità e accesso basato su API a livello di oggetto. Queste proprietà lo hanno reso il livello di archiviazione predefinito per i dati aziendali. Ma hanno anche creato un’incompatibilità fondamentale con gli strumenti basati su file da cui dipendono sviluppatori e agenti. “S3 non è un file system e non ha una semantica di file su tutta una serie di fronti”, ha affermato Warfield. “Non puoi eseguire uno spostamento, uno spostamento atomico di un oggetto, e in realtà non ci sono listing in S3.”
I precedenti tentativi di colmare questa lacuna si basavano su FUSE (Filesystems in USErspace), un livello software program che consente agli sviluppatori di montare un file system personalizzato nello spazio utente senza modificare lo spazio di archiviazione sottostante. Strumenti come Mount Level di AWS, gcsfuse di Google e blobfuse2 di Microsoft utilizzavano tutti driver basati su FUSE per far sembrare i rispettivi archivi di oggetti un file system.
Warfield notò che il problema è che quegli archivi di oggetti non erano ancora file system. Questi driver falsificavano il comportamento dei file inserendo metadati aggiuntivi nei bucket, interrompendo la visualizzazione dell’API dell’oggetto, oppure rifiutavano operazioni sui file che l’archivio oggetti non poteva supportare.
S3 Information adotta un’architettura completamente diversa. AWS sta collegando la sua tecnologia EFS (Elastic File System) direttamente a S3, presentando un livello di file system nativo completo pur mantenendo S3 come sistema di registrazione. Sia l’API del file system che l’API degli oggetti S3 rimangono accessibili contemporaneamente rispetto agli stessi dati.
In che modo S3 Information accelera l’intelligenza artificiale degli agenti
Prima di S3 Information, un agente che lavorava con i dati degli oggetti doveva essere esplicitamente istruito a scaricare i file prima di utilizzare gli strumenti. Ciò ha creato un problema sullo stato della sessione. Man mano che gli agenti compattavano le finestre di contesto, la registrazione di ciò che period stato scaricato localmente veniva spesso persa.
“Mi troverei a dover ricordare all’agente che i dati erano disponibili localmente”, ha detto Warfield.
Warfield ha esaminato il prima e il dopo di un’attività dell’agente comune che prevedeva l’analisi dei registri. Ha spiegato che uno sviluppatore stava utilizzando Kiro o Claude Code per lavorare con i dati di registro, nel caso del solo oggetto avrebbe dovuto dire all’agente dove si trovano i file di registro e andare a scaricarli. Se invece i log sono immediatamente montabili sul file system locale, lo sviluppatore può semplicemente identificare che i log si trovano in un percorso specifico e l’agente ha immediatamente accesso per esaminarli.
Per le pipeline multi-agente, più agenti possono accedere contemporaneamente allo stesso bucket montato. AWS afferma che migliaia di risorse di elaborazione possono connettersi a un singolo file system S3 contemporaneamente, con un throughput di lettura aggregato che raggiunge più terabyte al secondo – cifre che VentureBeat non è stata in grado di verificare in modo indipendente.
Lo stato condiviso tra agenti funziona tramite convenzioni di file system normal: sottodirectory, file di observe e listing di progetto condivise che qualsiasi agente nella pipeline può leggere e scrivere. Warfield ha descritto i crew di ingegneri di AWS che utilizzano questo modello internamente, con gli agenti che registrano observe di indagine e riepiloghi delle attività in listing di progetto condivise.
Per i crew che creano pipeline RAG sul contenuto dell’agente condiviso, S3 Vectors, lanciato advert AWS re:Invent nel dicembre 2024, si sovrappone per la ricerca di similarità e la generazione aumentata di recupero rispetto agli stessi dati.
Cosa dicono gli analisti: questo non è solo un FUSIBILE migliore
AWS sta posizionando S3 Information contro l’accesso ai file basato su FUSE da Azure Blob NFS e Google Cloud Storage FUSE. Per i carichi di lavoro AI, la distinzione significativa non riguarda principalmente le prestazioni.
“S3 Information elimina lo scambio di dati tra oggetti e file di archiviazione, trasformando S3 in uno spazio di lavoro condiviso a bassa latenza senza copiare i dati”, ha dichiarato a VentureBeat Jeff Vogel, analista di Gartner. “Il file system diventa una vista, non un altro set di dati.”
Con gli approcci basati su FUSE, ciascun agente mantiene la propria visualizzazione locale dei dati. Quando più agenti lavorano contemporaneamente, tali visualizzazioni possono potenzialmente non essere sincronizzate.
“Elimina un’intera classe di modalità di errore, inclusi errori di coaching/inferenza inspiegabili causati da metadati obsoleti, notoriamente difficili da eseguire il debug”, ha affermato Vogel. “Le soluzioni basate su FUSE esternalizzano la complessità e i problemi all’utente.”
Le implicazioni a livello di agente vanno ancora oltre. L’argomento architettonico conta meno di ciò che sblocca nella pratica.
“Per l’IA agente, che pensa in termini di file, percorsi e script locali, questo è l’anello mancante”, ha detto a VentureBeat Dave McCarthy, analista di IDC. “Consente a un agente AI di trattare un bucket su scala exabyte come il proprio disco rigido locale, consentendo un livello di velocità operativa autonoma che in precedenza period imbottigliato dal sovraccarico API associato advert approcci come FUSE.”
Al di là del flusso di lavoro dell’agente, McCarthy vede S3 Information come un punto di svolta più ampio per il modo in cui le aziende utilizzano i propri dati.
“Il lancio di S3 Information non significa solo S3 con una nuova interfaccia; è la rimozione del punto di attrito finale tra enormi information lake e intelligenza artificiale autonoma”, ha affermato. “Convergendo l’accesso a file e oggetti con S3, stanno aprendo la porta a più casi d’uso con meno rielaborazioni.”
Cosa significa questo per le imprese
Per i crew aziendali che mantengono un file system separato insieme a S3 per supportare applicazioni basate su file o carichi di lavoro degli agenti, story architettura ora non è più necessaria.
Per i crew aziendali che consolidano l’infrastruttura AI su S3, il cambiamento pratico è concreto: S3 smette di essere la destinazione degli output degli agenti e diventa l’ambiente in cui avviene il lavoro degli agenti.
“Tutti questi cambiamenti API che stai vedendo dai crew di archiviazione derivano dal lavoro diretto e dall’esperienza dei clienti che utilizzano agenti per lavorare con i dati”, ha affermato Warfield. “Siamo davvero concentrati singolarmente sulla rimozione di qualsiasi attrito e sul far sì che tali interazioni vadano nel miglior modo possibile.”












