Home Tecnologia La nuova intelligenza artificiale di DeepMind può leggere un milione di lettere...

La nuova intelligenza artificiale di DeepMind può leggere un milione di lettere del DNA contemporaneamente e comprenderle effettivamente

13
0

Ultimamente l’intelligenza artificiale ha guadagnato una cattiva reputazione, e spesso per una buona ragione. Ma un workforce di scienziati del DeepMind di Google ora afferma di aver trovato un caso d’uso rivoluzionario per l’intelligenza artificiale: aiutare l’umanità a svelare la “materia oscura” del nostro genoma in modo più efficace che mai.

In uno studio pubblicato oggi su Nature, i ricercatori di DeepMind hanno presentato il loro modello di deep studying, soprannominato AlphaGenome. Rispetto ai modelli esistenti, AlphaGenome può prevedere la funzione di sequenze di DNA molto più lunghe pur mantenendo un livello di precisione simile, affermano i ricercatori. Il workforce spera che il suo modello possa diventare uno strumento prezioso per analizzare come sottili variazioni nel DNA umano possano influenzare la nostra salute e biologia, in particolare nella stragrande maggioranza del genoma che funziona silenziosamente in background.

“Siamo entusiasti di presentare AlphaGenome: la nostra soluzione per decifrare il complesso codice normativo”, ha affermato Pushmeet Kohli, vicepresidente della ricerca presso Google DeepMind, in una conferenza stampa tenutasi martedì.

Una guida alla nostra materia oscura genetica

Il nostro DNA contiene le istruzioni per costruire e regolare ogni aspetto biologico di noi stessi. Ma solo una piccola parte dei nostri geni, circa il 2%, porta effettivamente il codice per decine o centinaia di migliaia di proteine ​​che svolgono le funzioni di cui un corpo ha bisogno per sopravvivere, come l’insulina o il collagene. Il restante 98% del nostro DNA è costituito da regioni non codificanti, conosciute più eloquentemente come regioni non codificanti materia oscura del nostro genoma. Una volta gli scienziati presumevano che la nostra materia oscura genetica fosse composta da DNA spazzatura senza valore, ma ora sappiamo che contiene sequenze vitali per la regolazione dei nostri geni che producono proteine.

Sebbene gli scienziati abbiano mappato la maggior parte del genoma umano, sappiamo ancora molto poco su quanti di questi geni funzionano, specialmente quelli che si trovano nelle regioni non codificanti; inoltre, siamo in gran parte all’oscuro di come le variazioni di questi geni possano influenzarne il funzionamento. Molto prima che l’intelligenza artificiale diventasse una parola d’ordine culturale (e un sacco da boxe), gli scienziati la utilizzavano modelli di apprendimento profondo– addestrati su dati di laboratorio – per vagliare in modo più efficiente le montagne del genoma umano e per prevedere la funzione di un gene o di una sequenza di DNA. Ma i ricercatori di DeepMind affermano che AlphaGenome è il modello di sequenza del DNA più completo e accurato fino advert oggi.

I ricercatori di DeepMind hanno addestrato il modello sia sul genoma umano che su quello del topo. Secondo quanto riferito, può analizzare fino a 1 megabase (Mb) – circa 1 milione di lettere di DNA – alla volta, rispetto ai modelli più vecchi in grado di analizzare fino a 500 kilobasi (kb), anche se a un certo costo. Da quella sequenza, si cube che il modello “preveda migliaia di tracce genomiche funzionali”. Queste tracce non si limitano solo al modo in cui viene espresso un gene o una sequenza di DNA, ma anche advert altre funzioni meno visibili. Questi includono le interazioni tra regioni codificanti e non codificanti del DNA, o la struttura delle cromatine (i pacchetti sciolti di materiale genetico tipicamente presenti in una cellula; i cromosomi sono la versione più ordinata).

Nel documento, i ricercatori hanno anche spiegato in dettaglio come AlphaGenome abbia abbinato o sovraperformato altri modelli di intelligenza artificiale esistenti in 25 check su 26 che misuravano quanto bene potesse prevedere gli effetti di una variante genetica. Tuttavia, oltre alla semplice precisione, il modello può fare molto di più contemporaneamente; secondo i ricercatori, può prevedere simultaneamente quasi 6.000 segnali genetici umani legati a funzioni specifiche.

Il futuro della genomica dell’intelligenza artificiale

Almeno alcuni scienziati esterni hanno elogiato le capacità di AlphaGenome, pur sottolineando che non è ancora in grado di risolvere tutti i misteri persistenti sul nostro codice genetico.

“Al Wellcome Sanger Institute abbiamo testato AlphaGenome utilizzando oltre mezzo milione di nuovi esperimenti e in effetti funziona molto bene”, ha detto al Science Media Heart Ben Lehner, capo della genomica generativa e sintetica presso il Wellcome Sanger Institute dell’Università di Cambridge. “Tuttavia, AlphaGenome è lungi dall’essere perfetto e c’è ancora molto lavoro da fare. I modelli di intelligenza artificiale sono validi quanto i dati utilizzati per addestrarli. La maggior parte dei dati esistenti in biologia non sono molto adatti per l’intelligenza artificiale: i set di dati sono troppo piccoli e non ben standardizzati.”

Detto questo, i ricercatori di DeepMind – e altri esperti del settore – ritengono che AlphaGenome segni una vera pietra miliare nella genomica dell’intelligenza artificiale, che potrebbe aiutare a rendere la tecnologia pratica per un uso più ampio. Sostengono che AlphaGenome, o modelli simili, potrebbero ora essere utilizzati per diagnosticare meglio malattie genetiche uncommon, identificare mutazioni che provocano il cancro o scoprire nuovi bersagli farmacologici.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here