Gli agenti IA come OpenClaw sono recentemente esplosi in popolarità proprio perché possono prendere le redini della tua vita digitale. Sia che tu voglia un riassunto personalizzato delle notizie del mattino, un proxy che possa litigare con il servizio clienti della tua compagnia through cavo o un revisore delle liste di cose da fare che svolga alcune attività per te e ti sproni a risolvere il resto, gli assistenti degli agenti sono progettati per accedere ai tuoi account digitali ed eseguire i tuoi comandi. Questo è utile, ma ha anche causato molto caos. I bot sono là fuori email con eliminazione di massa hanno ricevuto istruzioni di preservare, scrivere pezzi di successo su snobbazioni percepitee lanciando attacchi di phishing contro i loro proprietari.
Osservando il pandemonio svolgersi nelle ultime settimane, l’ingegnere e ricercatore di lunga knowledge Niels Provos ha deciso di provare qualcosa di nuovo. Oggi sta lanciando un assistente AI sicuro e open supply chiamato Cortina di ferro progettato per aggiungere un livello critico di controllo. Invece di interagire direttamente con i sistemi e gli account dell’utente, l’agente viene eseguito in una macchina virtuale isolata. E la sua capacità di intraprendere qualsiasi azione è mediata da una politica – si potrebbe anche pensare advert una costituzione – che il proprietario scrive per governare il sistema. Fondamentalmente, IronCurtain è progettato anche per ricevere queste politiche generali in un inglese semplice e quindi eseguirle attraverso un processo in più fasi che utilizza un modello linguistico di grandi dimensioni (LLM) per convertire il linguaggio naturale in una politica di sicurezza applicabile.
“Servizi come OpenClaw sono al massimo dell’hype in questo momento, ma la mia speranza è che ci sia l’opportunità di dire: ‘Beh, probabilmente non è così che vogliamo farlo'”, afferma Provos. “Invece, sviluppiamo qualcosa che offra comunque un’utilità molto elevata, ma che non entri in questi percorsi completamente inesplorati, a volte distruttivi.”
La capacità di IronCurtain di prendere affermazioni intuitive e dirette e trasformarle in linee rosse applicabili, deterministiche o prevedibili è vitale, afferma Provos, perché gli LLM sono notoriamente “stocastici” e probabilistici. In altre parole, non generano necessariamente sempre lo stesso contenuto o forniscono le stesse informazioni in risposta allo stesso suggerimento. Ciò crea sfide per i guardrail dell’intelligenza artificiale, perché i sistemi di intelligenza artificiale possono evolversi nel tempo in modo story da rivedere il modo in cui interpretano un meccanismo di controllo o vincolo, il che può provocare attività non autorizzate.
Una coverage IronCurtain, afferma Provos, potrebbe essere semplice come: “L’agente può leggere tutte le mie e-mail. Può inviare e-mail alle persone nei miei contatti senza chiedere. Per chiunque altro, chiedimelo prima. Non eliminare mai nulla in modo permanente”.
IronCurtain prende queste istruzioni, le trasforma in una politica applicabile e quindi media tra l’agente assistente nella macchina virtuale e quello che è noto come server del protocollo del contesto modello che fornisce agli LLM l’accesso ai dati e advert altri servizi digitali per svolgere attività. Essere in grado di vincolare un agente in questo modo aggiunge una componente importante del controllo degli accessi che le piattaforme internet come i supplier di posta elettronica attualmente non offrono perché non sono state create per lo situation in cui sia il proprietario umano che i bot dell’agente AI utilizzano tutti un unico account.
Provos osserva che IronCurtain è progettato per affinare e migliorare la “costituzione” di ciascun utente nel tempo man mano che il sistema incontra casi limite e richiede enter umani su come procedere. Il sistema, che è indipendente dal modello e può essere utilizzato con qualsiasi LLM, è inoltre progettato per mantenere un registro di controllo di tutte le decisioni politiche nel tempo.
IronCurtain è un prototipo di ricerca, non un prodotto di consumo, e Provos spera che le persone contribuiscano al progetto per esplorarlo e aiutarlo a evolversi. Dino Dai Zovi, un noto ricercatore di sicurezza informatica che ha sperimentato le prime versioni di IronCurtain, afferma che l’approccio concettuale adottato dal progetto è in linea con la sua intuizione su come l’intelligenza artificiale debba essere vincolata.













