AlphaFold, l’Intelligenza Artificiale che “costruisce” le proteine

Image by Ai4Business

Nello scenario delle tante macromolecole essenziali dell’organismo le proteine figurano sicuramente tra le più “famose”, in quanto note anche dai non addetti ai lavori. Sono presenti in tutti gli organismi viventi e le loro funzioni sono necessarie per portare a termine centinaia di funzioni necessarie per la vita, come la vista, il metabolismo o il movimento.

Ciò che forse è meno noto a riguardo, è il profondo legame che la loro struttura ha con la funzione che esercitano. Come un muscolo scheletrico si contrae solo se tutte le proteine del sarcomero sono perfettamente in posizione, un enzima coadiuva una reazione solo se la sua forma e i suoi domini gli consentono di legare i reagenti. Per questi e moltissimi altri esempi possibili, si può affermare che conoscere la struttura di una proteina permette di comprenderne la funzione.

La ricerca lavora da ormai quasi 50 anni su un sistema affidabile per individuare in maniera precisa ed efficace la struttura proteica, in quanto semplificherebbe moltissimo per esempio, la creazione di farmaci in grado di modularne la funzione e raggiungere un qualche effetto terapeutico. Rimangono però molti gli aspetti da chiarire, soprattutto riguardo al processo di ripiegamento delle proteine. Il cosiddetto folding è infatti necessario a trasformare la catena bidimensionale di amminoacidi, generata seguendo le “istruzioni del codice genetico”, nella precisa ed unica struttura tridimensionale funzionale. Secondo il “Paradosso di Levinthal” però, se il folding seguisse un iter aleatorio, per raggiungere la struttura finale della proteina sarebbe necessario un tempo maggiore dell’età stimata dell’universo.

Tra le tante iniziative volte a spiegare questo paradosso, dal 1994 è stato instituito il Critical Assessment of protein Structure Prediction (CASP), ormai gold standard per la valutazione dei sistemi predittivi. Si tratta di un esperimento a carattere globale (considerato spesso come una “gara”) a cadenza biennale, che vede coinvolti più di 100 gruppi di ricerca. I vari team mettono a punto i loro sistemi per ricostruire il modello predittivo di una proteina, a partire dalla sua sequenza amminoacidica, che viene assegnata “in cieco” dall’ente organizzativo. Il modello prodotto dalle varie squadre viene quindi paragonato alla proteina originale e valutato attraverso il Global Distance Test (GDT), uno score che definisce la similitudine tra le due strutture tramite un punteggio che va da 0 (assenza di similitudine) a 100 (completa similitudine).

Il risultato dell’edizione del 2018 il CASP13 è ancora al centro dell’interesse della comunità scientifica. In quell’anno il team di DeepMind ha presentato AlphaFold, il suo sistema basato sul concetto di intelligenza artificiale. Si tratta di un esempio di Apprendimento profondo, ovvero una tecnologia che assimila, elabora e genera informazioni attraverso una complessa rete di “percorsi neurali”, mimando la rete dei neuroni tipica del sistema nervoso umano. Attraverso un complesso algoritmo, il cui codice è liberamente fruibile su Github, è quindi possibile letteralmente “istruire” un network neurale in modo che “impari” la distanza tra i vari residui amminoacidici, i vari tipi di legame che si possono presentare all’interno di una catena e le caratteristiche che questi legami assumono a seconda dei residui che li compongono. A questo punto, il sistema è in grado di elaborare queste informazioni, testando le possibili conformazioni che la catena può assumere, ed estrapolare quella che più si avvicinerebbe alla realtà.

Image by DeepMind

Nel 2018 AlphaFold ha totalizzato un GDT pari a circa 60, mentre la sua versione più recente AlphaFold2, sta mostrando GDT medio pari a 92.4. Un risultato del genere è di largo impatto su tutto il mondo scientifico. Oltre a velocizzare lo sviluppo di farmaci, potrebbe gettare le basi per caratterizzare rapidamente ed economicamente le cause molecolari di molte patologie rare che spesso vengono trascurate. Per esempio, sembra che alcune forme della Malattia di Alzheimer siano proprio causate dall’accumulo di detriti proteici che hanno perso la loro struttura tridimensionale.

Questo progetto dimostra quanto qualcosa di prettamente ingegneristico e concettualmente lontano dalle scienze della vita, possa diventare cruciale per migliorare la salute di molte persone in poco tempo. Oltre all’ambito umano, il ruolo delle proteine e la conseguente applicazione di Alphafold, potrebbe allargarsi anche a contesti industriali, dove determinati enzimi litici di sintesi possono essere usati per degradare sostanze di scarto tossiche per l’uomo o l’ambiente.

Fino a non molti anni fa, l’intelligenza artificiale era un elemento da film di fantascienza, adesso potrebbe diventare una tecnologia essenziale per la vita e il benessere di tutti, catapultando il mondo direttamente nel futuro.

FONTI: https://onlinelibrary.wiley.com/doi/full/10.1002/prot.25834; https://www.nature.com/articles/s41586-019-1923-7#data-availability

Pubblicato da Matteo Buonamici

In una giungla di passioni che coltivo sin dall'infanzia all'insegna dell'ecletticismo più sfrenato, mi interesso di scienza, tecnologia e progresso in generale. A seguito della laurea in Biotecnologie, ho intrapreso un percorso di crescita personale e professionale, in modo da essere pronto per le sfide future.

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo di WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google photo

Stai commentando usando il tuo account Google. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: