Home Tecnologia Rapidata emerge per abbreviare i cicli di sviluppo del modello AI da...

Rapidata emerge per abbreviare i cicli di sviluppo del modello AI da mesi a giorni con RLHF quasi in tempo reale

19
0

Nonostante le crescenti chiacchiere su un futuro in cui gran parte del lavoro umano sarà automatizzato dall’intelligenza artificiale, una delle ironie dell’attuale increase tecnologico è quanto ostinatamente continui a dipendere dagli esseri umani, in particolare dal processo di addestramento dei modelli di intelligenza artificiale utilizzando l’apprendimento per rinforzo dal suggestions umano (RLHF).

Nella sua forma più semplice, RLHF è un sistema di tutoraggio: dopo che un’intelligenza artificiale è stata addestrata su dati selezionati, continua a commettere errori o sembra robotica. Gli appaltatori umani vengono quindi assunti in massa dai laboratori di intelligenza artificiale per valutare e classificare i risultati di un nuovo modello durante l’addestramento, e il modello impara dalle loro valutazioni, adattando il suo comportamento per offrire risultati con valutazioni più elevate. Questo processo è tanto più importante in quanto l’intelligenza artificiale si espande per produrre output multimediali come video, audio e immagini che possono avere misure di qualità più sfumate e soggettive.

Storicamente, questo processo di tutoraggio è stato un enorme grattacapo logistico e un incubo di pubbliche relazioni per le aziende di intelligenza artificiale, che fanno affidamento su reti frammentate di appaltatori stranieri e pool di etichettatura statici in specifici hub geografici a basso reddito. considerato dai media un salario basso – anche di sfruttamento. È anche inefficiente: richiedere ai laboratori di intelligenza artificiale di attendere settimane o mesi per un singolo lotto di suggestions, ritardando il progresso del modello.

Ora è emersa una nuova startup per rendere il processo molto più efficiente: RapidataLa piattaforma di “gamifica” effettivamente RLHF spingendo tali attività di revisione in tutto il mondo a quasi 20 milioni di utenti di app popolari, tra cui Duolingo o Sweet Crush, sotto forma di brevi attività di revisione opt-in che possono scegliere di completare invece di guardare annunci mobili, con i dati inviati immediatamente a un laboratorio di intelligenza artificiale incaricato.

Come condiviso con VentureBeat in un comunicato stampa, questa piattaforma consente ai laboratori di intelligenza artificiale di “iterare sui modelli quasi in tempo reale”, riducendo significativamente i tempi di sviluppo rispetto ai metodi tradizionali.

Il CEO e fondatore Jason Corkill ha dichiarato nello stesso comunicato che Rapidata rende “il giudizio umano disponibile su scala globale e quasi in tempo reale, sbloccando un futuro in cui i workforce di intelligenza artificiale possono eseguire cicli di suggestions costanti e costruire sistemi che si evolvono ogni giorno anziché ogni ciclo di rilascio.”

Il fondatore e CEO di Rapidata Jason Corkill. Credito: Rapidata

Rapidata tratta RLHF come un’infrastruttura advert alta velocità piuttosto che un problema di lavoro manuale. Oggi, la società ci ha annunciato in esclusiva a VentureBeat la sua nascita con un spherical di avviamento da 8,5 milioni di dollari co-guidato da Canaan Companions e IA Ventures, con la partecipazione di Acequia Capital e BlueYard, per ampliare il suo approccio unico ai dati umani on-demand.

La conversazione al pub che ha costruito una nuvola umana

La genesi di Rapidata non è nata in una sala riunioni, ma a un tavolo davanti a qualche birra. Quando Corkill period studente all’ETH di Zurigo, lavorava nel campo della robotica e della visione artificiale, quando si è scontrato con il muro che ogni ingegnere di intelligenza artificiale prima o poi deve affrontare: il collo di bottiglia dell’annotazione dei dati.

“Nello specifico, lavoro nel campo della robotica, dell’intelligenza artificiale e della visione artificiale ormai da diversi anni, ho studiato all’ETH qui a Zurigo e sono sempre stato frustrato dall’annotazione dei dati”, ha ricordato Corkill in una recente intervista. “Sempre quando avevi bisogno di persone o di annotazioni di dati umani, period come se il tuo progetto si fermasse, perché fino advert allora potevi portarlo avanti semplicemente spingendo notti più lunghe. Ma quando avevi bisogno dell’annotazione umana su larga scala, dovevi andare da qualcuno e poi aspettare qualche settimana”.

Frustrati da questo ritardo, Corkill e i suoi cofondatori si resero conto che il modello di lavoro esistente per l’intelligenza artificiale period fondamentalmente rotto per un mondo che si muove alla velocità del calcolo moderno. Mentre l’elaborazione si ridimensiona in modo esponenziale, la tradizionale forza lavoro umana, vincolata dall’onboarding manuale, dalle assunzioni regionali e dai cicli di pagamento lenti, non lo fa. Rapidata è nata dall’concept che il giudizio umano potesse essere fornito come un servizio distribuito a livello globale e quasi istantaneo.

Tecnologia: trasformare le impronte digitali in dati di addestramento

L’innovazione principale di Rapidata risiede nel suo metodo di distribuzione. Invece di assumere annotatori a tempo pieno in regioni specifiche, Rapidata sfrutta l’economia dell’attenzione esistente nel mondo delle app mobili. Collaborando con app di terze parti come Sweet Crush o Duolingo, Rapidata offre agli utenti una scelta: guardare un annuncio tradizionale o dedicare qualche secondo a fornire suggestions per un modello di intelligenza artificiale.

“Agli utenti viene chiesto: ‘Ehi, preferiresti invece di guardare la pubblicità e avere, sai, le aziende che ti comprano gli occhi in quel modo, preferiresti annotare alcuni dati, dare suggestions?'” Ha spiegato Corkill. Secondo Corkill, tra il 50% e il 60% degli utenti opta per l’attività di suggestions rispetto a un tradizionale annuncio video.

Questo approccio di “crowd intelligence” consente ai workforce di intelligenza artificiale di attingere a una fascia demografica globale diversificata su una scala senza precedenti.

  • La rete globale: Rapidata raggiunge attualmente tra i 15 e i 20 milioni di persone.

  • Parallelismo massiccio: La piattaforma può elaborare 1,5 milioni di annotazioni umane in una sola ora.

  • Velocità: I cicli di suggestions che in precedenza richiedevano settimane o mesi sono ridotti a ore o addirittura minuti.

  • Controllo qualità: La piattaforma crea nel tempo profili di fiducia e competenza per gli intervistati, garantendo che le domande complesse vengano abbinate ai giudici umani più rilevanti.

  • Anonimato: Mentre gli utenti vengono tracciati tramite ID anonimizzati per garantire coerenza e affidabilità, Rapidata non raccoglie identità personali, mantenendo la privateness e ottimizzando la qualità dei dati.

RLHF on-line: passaggio alla GPU

Il salto tecnologico più significativo che Rapidata sta consentendo è quello che Corkill descrive come “RLHF on-line”. Tradizionalmente, l’intelligenza artificiale viene addestrata in lotti disconnessi: si addestra il modello, si interrompe, si inviano dati agli esseri umani, si attendono settimane per le etichette e poi si riprende. Ciò crea un “circolo” di informazioni che spesso manca di nuovi enter umani.

Rapidata sta spostando questo giudizio direttamente nel ciclo di formazione. Poiché la loro rete è così veloce, possono integrarsi tramite API direttamente con le GPU che eseguono il modello.

“Abbiamo sempre avuto l’concept dell’apprendimento per rinforzo per il suggestions umano… finora dovevi sempre farlo in batch”, ha detto Corkill. “Ora, se andiamo fino in fondo, ora abbiamo alcuni consumer dove, poiché siamo così veloci, possiamo essere direttamente, fondamentalmente nel processo, come nel processore sulla GPU destra, e la GPU calcola un po’ di output, e può immediatamente richiederci in modo distribuito. ‘Oh, ho bisogno, ho bisogno, ho bisogno di un essere umano che guardi questo.’ Ottengo la risposta e poi applico quella perdita, cosa che finora non è stata possibile”.

Attualmente, la piattaforma supporta circa 5.500 persone al minuto fornendo suggestions in tempo reale ai modelli in esecuzione su migliaia di GPU. Ciò impedisce l'”hacking del modello di ricompensa”, in cui due modelli di intelligenza artificiale si ingannano a vicenda in un ciclo di suggestions, basando la formazione sulle reali sfumature umane.

Prodotto: soluzioni in base al gusto e al contesto globale

Man mano che l’intelligenza artificiale va oltre il semplice riconoscimento degli oggetti verso i media generativi, i requisiti per l’etichettatura dei dati si sono evoluti dal tagging oggettivo alla cura soggettiva “basata sul gusto”. Non si tratta più solo di “questo è un gatto?” ma piuttosto “questa sintesi vocale è convincente?” oppure “quale di questi due riassunti sembra più professionale?”.

Lily Clifford, CEO della startup di intelligenza artificiale vocale Rime, osserva che Rapidata è stata trasformativa per testare modelli in contesti del mondo reale. “In precedenza, raccogliere suggestions significativi significava mettere insieme fornitori e sondaggi, segmento per segmento, o paese per paese, cosa che non period scalabile”, ha affermato Clifford. Utilizzando Rapidata, Rime può raggiungere il pubblico giusto, sia in Svezia, Serbia o Stati Uniti, e vedere come si comportano i modelli nei flussi di lavoro dei clienti reali in pochi giorni, non in mesi.

“La maggior parte dei modelli sono effettivamente corretti, ma sono sicuro che hai ricevuto e-mail che sembrano, sai, non autentiche, giusto?” osservò Corkill. “Puoi sentire l’odore di un’e-mail di intelligenza artificiale, puoi sentire l’odore di un’immagine o di un video di intelligenza artificiale, ti è subito chiaro… questi modelli ancora non sembrano umani, e hai bisogno del suggestions umano per farlo”.

Il cambiamento economico e operativo

Dal punto di vista operativo, Rapidata si posiziona come un livello infrastrutturale che elimina la necessità per le aziende di gestire le proprie operazioni di annotazione personalizzate. Fornendo una rete scalabile, l’azienda sta abbassando la barriera all’ingresso per i workforce di intelligenza artificiale che in precedenza avevano difficoltà con i costi e la complessità dei tradizionali cicli di suggestions.

Jared Newman di Canaan Companions, che ha guidato l’investimento, suggerisce che questa infrastruttura è essenziale per la prossima generazione di intelligenza artificiale. “Ogni implementazione seria dell’IA dipende dal giudizio umano in qualche punto del ciclo di vita”, ha affermato Newman. “Man mano che i modelli passano da compiti basati sull’esperienza a una cura basata sul gusto, la richiesta di suggestions umano scalabile crescerà notevolmente”.

Un futuro a uso umano

Mentre l’attenzione attuale è rivolta ai laboratori modello della Bay Space, Corkill vede un futuro in cui gli stessi modelli di intelligenza artificiale diventeranno i principali clienti del giudizio umano. Lo chiama “uso umano”.

In questa visione, l’intelligenza artificiale di un progettista di automobili non si limiterebbe a generare un veicolo generico; potrebbe chiamare Rapidata in modo programmatico per chiedere a 25.000 persone nel mercato francese cosa pensano di un’estetica specifica, ripetere quel suggestions e perfezionare il suo design in poche ore.

“La società è in costante cambiamento”, ha osservato Corkill, affrontando la tendenza a utilizzare l’intelligenza artificiale per simulare il comportamento umano. “Se si simulano una società adesso, la simulazione sarà stabile e magari rispecchierà la nostra per qualche mese, ma poi cambia completamente, perché la società è cambiata e si è sviluppata in modo completamente diverso”.

Creando un modo distribuito e programmatico per accedere alla capacità del cervello umano in tutto il mondo, Rapidata si sta posizionando come l’interconnessione vitale tra il silicio e la società. Con 8,5 milioni di dollari di nuovi finanziamenti, la società prevede di agire in modo aggressivo per garantire che, man mano che l’intelligenza artificiale cresce, l’elemento umano non sia più un collo di bottiglia, ma una funzionalità in tempo reale.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here