• Hanns J. Neubert

La genomica era ieri - la proteomica è domani.

Proteomics aufmacherScience. Decodificare i 3,2 miliardi di lettere del genoma umano 20 anni fa fu una sensazione. Ora i ricercatori stanno facendo il passo successivo: decifrare le proteine, i veri portatori della vita.

Quando il bisogno era grande, le cose si muovevano improvvisamente molto velocemente. Alla fine di marzo 2020, dopo solo sei settimane di sviluppo, Bosch ha presentato il primo test rapido Corona. Usando gli anticorpi, le proteine del sistema immunitario, i frammenti del virus SARS-CoV-2 potrebbero essere rilevati dopo una malattia di Corona.

Questo è un esempio dell'importanza di chiarire la funzione delle proteine. "Se si guarda l'esatta composizione proteica di diverse cellule di pazienti, il loro proteoma, si ottengono informazioni dettagliate su quali proteine giocano un ruolo in certe malattie", spiega Jürgen Cox, leader del gruppo di ricerca presso l'Istituto Max Planck di Biochimica a Martinsried vicino a Monaco.

Le proteine sono i veri portatori di vita. Sono entrambi materiali da costruzione e strumenti. Muscoli, nervi, organi e capelli sono tutti fatti di proteine. Proprio come i corpi rossi dell'emoglobina per il trasporto dell'ossigeno, gli enzimi per accelerare le reazioni chimiche nel corpo, gli ormoni come messaggeri di messaggi o gli anticorpi della difesa immunitaria.

Quello che quasi nessuno sa è che la maggior parte delle malattie non infettive sono causate da proteine programmate in modo errato. E molte terapie moderne sono basate sulle proteine, come il farmaco per il diabete insulina o i più efficaci farmaci contro il cancro.

Se fosse possibile decodificare il proteoma individuale di ogni paziente, la scienza sarebbe molto più vicina al sogno della medicina personalizzata. Tuttavia, questo è molto più difficile che scoprire segmenti di geni difettosi nel DNA. Questo perché il DNA esiste come un doppio filamento sul quale i geni sono infilati come una sequenza di lettere. Ogni cellula del corpo ha lo stesso corredo genetico nel suo nucleo, che rimane invariato per tutta la vita.

Con le proteine è molto diverso. Ogni cellula degli organi del corpo contiene sempre lo stesso genoma, ma la composizione proteica di una cellula del fegato non è paragonabile a quella delle cellule nervose o del cervello.

Inoltre, la sequenza degli amminoacidi nelle catene cambia durante la vita. Così, il proteoma dei giovani appare diverso da quello degli anziani. Un esempio dal regno degli insetti lo illustra. Anche se la sua vita inizia come bruco e finisce come farfalla, i geni dell'insetto rimangono gli stessi in ogni cellula. I tipi di proteine nelle cellule, tuttavia, cambiano fondamentalmente. "Ci sono quindi quasi innumerevoli combinazioni possibili. È quindi cruciale che in futuro sviluppiamo metodi con cui migliaia di proteine possono essere analizzate molto rapidamente in poco tempo", spiega Cox.

Di particolare interesse per i ricercatori è la struttura delle macromolecole proteiche. A differenza del DNA, sono piegati spazialmente. Questa tridimensionalità può essere utilizzata per trovare farmaci che si inseriscono come una chiave nella serratura di una molecola proteica e quindi la sbloccano o la bloccano. Questo accade quando, durante la difesa immunitaria, un anticorpo si attacca alla controparte antigenica nel guscio di un batterio o virus che causa la malattia, rendendolo così innocuo.

Districare una tale struttura non è un compito facile. Questo richiede strumenti di ricerca su larga scala come l'anello di stoccaggio di 2,3 chilometri di PETRA III al centro di ricerca sugli elettroni DESY di Amburgo. Genera la radiazione a raggi X più brillante del mondo con fasci di luce di lunghezza d'onda estremamente corta. Questo permette di osservare le strutture più piccole, come il ripiegamento delle singole proteine.

Recentemente, un gruppo di ricercatori è riuscito in un cosiddetto screening a raggi X in poco tempo ad esaminare 7000 sostanze per vedere se una di esse ha una struttura tridimensionale che potrebbe essere incorporata in un importante enzima del virus SARS-CoV-2 e quindi bloccarlo. Hanno trovato 37 composti come candidati farmaci anti-corona che ora potrebbero essere sviluppati ulteriormente.

"Un altro modo per ottenere migliori informazioni sulla funzione delle proteine è il sequenziamento, la scomposizione delle proteine nei loro singoli blocchi di aminoacidi. Si tratta di identificare quante proteine di certe specie sono presenti", spiega Cox. Un approccio di ricerca consiste nell'introdurre una molecola estranea in una cellula, come un inquinante o un potenziale farmaco. "Poi possiamo guardare per vedere quali proteine sono ora presenti nella cellula in numero maggiore o minore, e confrontarle con le cellule sane". Questo aiuta a determinare quali proteine giocano un ruolo in certe malattie, come il cancro.

Lo strumento scelto dai ricercatori è la cosiddetta spettrometria di massa. Nel corso di questa procedura, l'analizzatore rimuove gli elettroni dalle molecole, rendendole cariche positivamente e quindi misurabili elettricamente. Il risultato è uno spettrogramma che sembra una curva frastagliata quando viene stampato. La lunghezza e la posizione dei singoli rebbi forniscono informazioni su quante molecole proteiche di una certa dimensione sono presenti in un campione.

Il compito erculeo è poi quello di confrontare i dati con altri campioni. La quantità di dati generati è così grande che solo un computer estremamente veloce è in grado di ordinarli. Il gruppo di ricerca di Cox al Max Planck Institute of Biochemistry ha sviluppato un potente software chiamato MaxQuant appositamente per questo scopo. Con l'aiuto di questo software, è possibile confrontare i dati delle cellule analizzate tra loro, ma anche con i dati nei database.

Protenostics

Il più grande di questi database di proteine si chiama UniProt, che è stato gestito e mantenuto dal 2002 dall'Istituto Europeo di Bioinformatica, dall'Istituto Svizzero di Bioinformatica e dal Protein Information Resource alla Georgetown University di Washington, D.C. Le informazioni su ben oltre 100000 proteine sono ora memorizzate qui e vi si può accedere liberamente e gratuitamente. "È un tesoro enorme. Nuove scoperte si aggiungono quasi ogni giorno, specialmente da organismi che non sono stati studiati così bene scientificamente", spiega Cox. Le informazioni memorizzate qui permettono di trarre conclusioni sulle funzioni che le proteine hanno in biologia.

Poiché le proteine stanno diventando sempre più importanti come strumenti e sostanze attive in processi e prodotti industriali, il loro sequenziamento sta diventando ancora più importante per lo sviluppo del prodotto. L'economia si sta muovendo sempre più verso una bioeconomia più rispettosa dell'ambiente. Gli enzimi e i tensioattivi nei detergenti sono quindi da tempo prodotti a partire dalle proteine. Nel frattempo, le catene di aminoacidi sono persino utilizzate in adesivi, lubrificanti ad alte prestazioni o come acceleratori di reazione nell'industria chimica.

Tuttavia, per far progredire lo sviluppo industriale sulla base delle proteine, centinaia di migliaia di proteine devono essere studiate e determinate per quanto riguarda le loro proprietà. Questo può essere ottenuto solo con i cosiddetti metodi "high throughput".

La società statunitense Quantum-Si, fondata da Jonathan M. Rothberg, sembra aver trovato un modo particolarmente veloce per sequenziare le proteine in modo più semplice ed economico. La sua invenzione si basa su un chip semiconduttore che apparentemente può essere utilizzato per analizzare e digitalizzare centinaia di campioni di proteine in un tempo molto breve. Rothberg chiama il processo "sequenziamento delle proteine di nuova generazione". In ogni caso, non dovrebbe mancargli il capitale per sviluppare ulteriormente la tecnologia. A metà febbraio 2021, la società è riuscita a diventare pubblica sotto l'ombrello della società di acquisizione SPAC HighCape Capital. Dopo la transazione, l'azienda ha più di 500 milioni di dollari di liquidità. "Vogliamo democratizzare la medicina utilizzando il campo della proteomica per capire non solo ciò che potrebbe accadere nel corpo, ma ciò che sta effettivamente accadendo in questo momento", Jonathan M. Rothberg ha annunciato l'ambizioso obiettivo in occasione dell'IPO.

Juergen Cox, tuttavia, è scettico. "Quantum-Si è piuttosto cauto al riguardo. Non si impara molto su come funziona esattamente la tecnologia", commenta il ricercatore del Max Planck, anche se il principio di base gli è chiaro. "Sembra che ci sia qualcosa in questo chip di silicio che può misurare i protoni, le molecole caricate positivamente nelle catene di aminoacidi".

Pensa che il termine "sequenziamento delle proteine di prossima generazione" sia più marketing. "Il sistema americano, dopo tutto, si basa sull'organizzazione di una grande quantità di capitale di rischio per poter spingere tecnologie che nessuno sa ancora se avranno successo". Ma il nuovo processo di sequenziamento di Quantum-Si non deve solo funzionare, sottolinea Cox. "Dopo tutto, deve funzionare almeno bene come la spettrometria di massa, pur essendo più economico, per sostituire i metodi standard stabiliti". La pura analisi delle proteine non è sufficiente. L'industria in particolare richiede sempre più nuove combinazioni di aminoacidi su misura con proprietà molto specifiche. Questi non sono sempre di origine naturale. Nella maggior parte dei casi, le sequenze di proteine naturali sono state modificate per renderle più efficienti, più stabili e adatte ad applicazioni specifiche, per esempio per temperature particolarmente alte o particolarmente basse.

In passato, questo richiedeva lunghe analisi basate sul principio di prova ed errore. Si trattava di esperimenti di laboratorio estremamente costosi e dispendiosi in termini di tempo per testare milioni di varianti di proteine per le proprietà utili. Presto, questo potrebbe essere fatto da un'intelligenza artificiale, come quella recentemente sviluppata alla Chalmers University of Technology di Göteborg.

"Accelerare la velocità con cui sviluppiamo proteine sul computer è

è molto importante per ridurre il costo dei catalizzatori enzimatici, per esempio", ha detto Martin Engqvist, uno dei ricercatori coinvolti dal Dipartimento di Biologia e Bioingegneria di Chalmers. "Questa è la chiave per realizzare processi industriali e prodotti di consumo rispettosi dell'ambiente".

Andare avanti. Per essere sicuri, la comprensione del proteoma umano in tutte le sue interazioni richiederà un altro decennio o due. Ma applicazioni come MaxQuant, l'intelligenza artificiale dei ricercatori di proteine di Chalmers, o forse metodi basati su chip come quelli di Quantum-Si, combinati con computer sempre più veloci e potenti, potrebbero mettere la ricerca e l'uso delle proteine su un percorso esponenziale. "Alla fine, potremmo essere in grado di utilizzare metodi ad alta produttività, come la spettrometria di massa, direttamente nella diagnostica. E quindi misurare l'intero proteoma di un paziente contemporaneamente", dice Jürgen Cox. Sarebbe davvero una rivoluzione. ®

–––––––––––––––––––––––––––

La proteina - il segreto della vita.

Le proteine - una volta si chiamavano proteine - sono macromolecole costituite da lunghe catene. Ci sono 23 diversi aminoacidi allineati in diverse sequenze come lettere.

La sequenza degli amminoacidi e la lunghezza di tale catena è determinata nel codice genetico. Molti geni stanno per più di una proteina, così che nel corpo umano ci sono molte più proteine che geni. In teoria, però, i 23 aminoacidi che possono formare catene proteiche possono essere combinati per formare 26 quadrilioni di combinazioni - un 26 con 21 zeri. Se il Sahara di nove milioni di chilometri quadrati contenesse così tanti granelli di sabbia, sarebbe coperto interamente da uno strato di sabbia di tre metri di spessore.

"Oltre a questo, ci sono molti altri aminoacidi che non sono incorporati nelle proteine", spiega Jürgen Cox. "Queste, come altre piccole molecole, galleggiano anche nelle cellule e vi svolgono compiti molto specifici".

Come se questo non fosse abbastanza complesso, lo schema delle proteine dato dai geni può anche essere alterato molte volte all'interno delle cellule da una reazione chimica chiamata fosforilazione. "Questo è, per così dire, un codice aggiuntivo proprio che specifica in quali siti di una proteina inizia questa reazione. Succede molto dinamicamente e rapidamente", spiega Cox. "Nella proteomica, questa informazione è estremamente importante perché il cambiamento avviene dopo, dopo che queste proteine sono già assemblate". In questo modo, i segnali vengono inviati molto rapidamente in una cellula in modo che possa, per esempio, portare una molecola importante e necessaria nella cellula dall'esterno o smaltire la "spazzatura" all'esterno.

–––––––––––––––––––––––––––

Autore: Hanns-J. Neubert

Indirizzo editoriale

  • Private Wealth GmbH & Co. KG
    Montenstrasse 9 - 80639 München
  • +49 (0) 89 2554 3917
  • +49 (0) 89 2554 2971
  • Questo indirizzo email è protetto dagli spambots. È necessario abilitare JavaScript per vederlo.

Lingue

Social media