• Hanns J. Neubert

La genómica fue ayer, la proteómica será mañana.

Proteomics aufmacherScience. Descifrar los 3.200 millones de letras del genoma humano hace 20 años fue toda una sensación. Ahora los investigadores están dando el siguiente paso: descifrar las proteínas, los verdaderos portadores de la vida.

Cuando la necesidad era grande, las cosas se movían muy rápidamente. A finales de marzo de 2020, tras sólo seis semanas de desarrollo, Bosch presentó la primera prueba rápida Corona. Mediante el uso de anticuerpos, las proteínas del sistema inmunitario, se han podido detectar fragmentos del virus SARS-CoV-2 después de una enfermedad Corona.

Este es un ejemplo de la importancia de dilucidar la función de las proteínas. "Si se observa la composición exacta de las proteínas de las distintas células de los pacientes, su proteoma, se obtiene información detallada sobre qué proteínas desempeñan un papel en determinadas enfermedades", explica Jürgen Cox, jefe del grupo de investigación del Instituto Max Planck de Bioquímica de Martinsried, cerca de Múnich.

Las proteínas son los verdaderos portadores de la vida. Ambos son materiales y herramientas de construcción. Los músculos, los nervios, los órganos y el cabello están hechos de proteínas. Al igual que los cuerpos sanguíneos de hemoglobina roja para el transporte de oxígeno, las enzimas para acelerar las reacciones químicas en el organismo, las hormonas como mensajeras de mensajes o los anticuerpos de la defensa inmunitaria.

Lo que casi nadie sabe es que la mayoría de las enfermedades no infecciosas están causadas por proteínas mal programadas. Y muchas terapias modernas se basan en las proteínas, como la insulina para la diabetes o los medicamentos más eficaces contra el cáncer.

Si fuera posible descifrar el proteoma individual de cada paciente, la ciencia estaría mucho más cerca del sueño de la medicina personalizada. Sin embargo, esto es mucho más difícil que descubrir segmentos de genes defectuosos en el ADN. Esto se debe a que el ADN existe como una doble cadena en la que los genes están encadenados como una secuencia de letras. Cada célula del cuerpo tiene la misma composición genética en su núcleo, que permanece inalterada durante toda la vida.

Con las proteínas es muy diferente. Cada célula de los órganos del cuerpo contiene siempre el mismo genoma, pero la composición proteica de una célula del hígado no es comparable a la de las células nerviosas o cerebrales.

Además, la secuencia de aminoácidos en las cadenas cambia durante la vida. Así, el proteoma de los jóvenes es diferente al de las personas mayores. Un ejemplo del reino de los insectos lo ilustra. Aunque su vida comience como oruga y termine como mariposa, los genes del insecto siguen siendo los mismos en cada célula. Sin embargo, los tipos de proteínas de las células cambian fundamentalmente. "Por lo tanto, existen casi innumerables combinaciones posibles. Por tanto, es crucial que en el futuro desarrollemos métodos con los que se puedan analizar miles de proteínas muy rápidamente en poco tiempo", explica Cox.

La estructura de las macromoléculas de las proteínas es de especial interés para los investigadores. A diferencia del ADN, están plegados espacialmente. Esta tridimensionalidad puede utilizarse para encontrar fármacos que encajen como una llave en la cerradura de una molécula de proteína y así abrirla o cerrarla. Esto ocurre cuando, durante la defensa inmunitaria, un anticuerpo se adhiere a la contraparte antigénica en la cubierta de una bacteria o virus que causa la enfermedad, haciéndola inofensiva.

Desenredar una estructura así no es tarea fácil. Para ello se necesitan herramientas de investigación a gran escala, como el anillo de almacenamiento de 2,3 kilómetros de longitud de PETRA III en el centro de investigación de electrones DESY de Hamburgo. Genera la radiación de rayos X más brillante del mundo con haces de luz de longitud de onda extremadamente corta. Esto permite observar las estructuras más pequeñas, como el plegado de las proteínas individuales.

Recientemente, un grupo de investigadores ha conseguido examinar en poco tiempo 7.000 sustancias con una estructura tridimensional que podría incorporarse a una importante enzima del virus del SARS-CoV-2 y así bloquearla. Descubrieron que 37 compuestos eran candidatos a fármacos anticorona que ahora podrían seguir desarrollándose.

"Otra forma de obtener mejor información sobre la función de las proteínas es la secuenciación, el desglose de las proteínas en sus bloques individuales de aminoácidos. Esto implica identificar cuántas proteínas de determinadas especies están presentes", explica Cox. Un enfoque de investigación consiste en introducir una molécula extraña en una célula, como un contaminante o un posible fármaco. "Entonces podemos ver qué proteínas están ahora presentes en la célula en mayor o menor número, y compararlas con las células sanas". Esto ayuda a determinar qué proteínas desempeñan un papel en ciertas enfermedades, como el cáncer.

La herramienta elegida por los investigadores es la llamada espectrometría de masas. En el transcurso de este procedimiento, el analizador elimina los electrones de las moléculas, lo que las convierte en cargadas positivamente y, por tanto, medibles eléctricamente. El resultado es un espectrograma que parece una curva irregular cuando se imprime. La longitud y la posición de cada una de las puntas proporcionan información sobre cuántas moléculas de proteína de un determinado tamaño están presentes en una muestra.

La tarea hercúlea consiste entonces en comparar los datos con otras muestras. La cantidad de datos generados es tan grande que sólo un ordenador extremadamente rápido es capaz de clasificarlos. El grupo de investigación de Cox en el Instituto Max Planck de Bioquímica ha desarrollado un potente software llamado MaxQuant específicamente para este fin. Con la ayuda de este software, es posible comparar los datos de las células analizadas entre sí, pero también con los datos de las bases de datos.

Protenostics

La mayor de estas bases de datos de proteínas se llama UniProt, que ha sido operada y mantenida desde 2002 por el Instituto Europeo de Bioinformática, el Instituto Suizo de Bioinformática y el Recurso de Información de Proteínas de la Universidad de Georgetown en Washington, D.C. La información sobre más de 100.000 proteínas se almacena ahora aquí y se puede acceder a ella de forma libre y gratuita. "Es un gran tesoro. Casi a diario se añaden nuevos hallazgos, sobre todo de organismos que no han sido tan bien estudiados científicamente", explica Cox. La información almacenada aquí permite sacar conclusiones sobre las funciones que tienen las proteínas en la biología.

Dado que las proteínas también son cada vez más importantes como herramientas y sustancias activas en los procesos y productos industriales, su secuenciación es aún más importante para el desarrollo de productos. La economía se orienta cada vez más hacia una bioeconomía más respetuosa con el medio ambiente. Por ello, las enzimas y los tensioactivos de los detergentes se producen desde hace tiempo a partir de proteínas. Mientras tanto, las cadenas de aminoácidos se utilizan incluso en adhesivos, lubricantes de alto rendimiento o como aceleradores de reacciones en la industria química.

Sin embargo, para avanzar en el desarrollo industrial a partir de las proteínas, hay que investigar y determinar cientos de miles de proteínas en cuanto a sus propiedades. Esto sólo puede lograrse con los llamados métodos de "alto rendimiento".

La empresa estadounidense Quantum-Si, fundada por Jonathan M. Rothberg, parece haber encontrado una forma especialmente rápida de secuenciar proteínas de forma más fácil y barata. Su invento se basa en un chip semiconductor que aparentemente puede utilizarse para analizar y digitalizar cientos de muestras de proteínas en muy poco tiempo. Rothberg llama al proceso "secuenciación de proteínas de nueva generación". En cualquier caso, no debería faltarle capital para seguir desarrollando la tecnología. A mediados de febrero de 2021, la empresa consiguió salir a bolsa bajo el paraguas de la sociedad de adquisiciones SPAC HighCape Capital. Tras la transacción, la empresa cuenta con más de 500 millones de dólares de liquidez. "Queremos democratizar la medicina utilizando el campo de la proteómica para entender no sólo lo que podría estar ocurriendo en el cuerpo, sino lo que está ocurriendo realmente en este momento", anunció Jonathan M. Rothberg el ambicioso objetivo con motivo de la salida a bolsa.

Sin embargo, Juergen Cox se muestra escéptico. "Quantum-Si" está siendo bastante cauteloso al respecto. No se aprende mucho sobre cómo funciona exactamente la tecnología", comenta el investigador del Max Planck, aunque el principio básico esté claro para él. "Parece que hay algo en este chip de silicio que puede medir los protones, las moléculas con carga positiva de las cadenas de aminoácidos".

Cree que el término "secuenciación de proteínas de próxima generación" es más marketing. "El sistema estadounidense, al fin y al cabo, se basa en organizar una gran cantidad de capital de riesgo para poder impulsar tecnologías que nadie sabe aún si tendrán éxito". Pero el nuevo proceso de secuenciación de Quantum-Si no sólo tiene que funcionar, señala Cox. "Al fin y al cabo, tiene que funcionar al menos tan bien como la espectrometría de masas, a la vez que ser más barata, para sustituir los métodos estándar establecidos". El puro análisis de las proteínas tampoco es suficiente. La industria, en particular, requiere cada vez más combinaciones de aminoácidos nuevas, hechas a medida y con propiedades muy específicas. No siempre son de origen natural. En la mayoría de los casos, las secuencias de proteínas naturales se han modificado para hacerlas más eficaces, más estables y adecuadas para aplicaciones específicas, por ejemplo para temperaturas especialmente altas o especialmente bajas.

En el pasado, esto requería largos análisis basados en el principio de prueba y error. Se trataba de experimentos de laboratorio extremadamente caros y que requerían mucho tiempo para probar millones de variantes de proteínas en busca de propiedades útiles. Pronto podría hacerlo una inteligencia artificial, como la desarrollada recientemente en la Universidad Tecnológica de Chalmers, en Gotemburgo.

"Acelerar la velocidad de desarrollo de las proteínas en el ordenador es

es muy importante para reducir el coste de los catalizadores enzimáticos, por ejemplo", dijo Martin Engqvist, uno de los investigadores participantes del Departamento de Biología y Bioingeniería de Chalmers. "Esto es clave para realizar procesos industriales y productos de consumo respetuosos con el medio ambiente".

Avanzando. Sin duda, comprender el proteoma humano en todas sus interacciones llevará una o dos décadas más. Pero aplicaciones como MaxQuant, la inteligencia artificial de los investigadores de proteínas de Chalmers, o quizás métodos basados en chips como los de Quantum-Si, combinados con ordenadores cada vez más rápidos y potentes, podrían situar la investigación y el uso de las proteínas en una vía exponencial. "Con el tiempo, podríamos utilizar métodos de alto rendimiento, como la espectrometría de masas, directamente en el diagnóstico. Y así medir simultáneamente todo el proteoma de un paciente", dice Jürgen Cox. Eso sí que sería una revolución. ®

–––––––––––––––––––––––––––

// La proteína - el secreto de la vida.

Las proteínas -antes se llamaban proteínas- son macromoléculas formadas por largas cadenas. Hay 23 aminoácidos diferentes alineados en diferentes secuencias como si fueran letras.

La secuencia de aminoácidos y la longitud de dicha cadena están determinadas en el código genético. Muchos genes representan más de una proteína, por lo que hay muchas más proteínas en el cuerpo humano que genes. Sin embargo, en teoría, los 23 aminoácidos que pueden formar cadenas de proteínas pueden combinarse para formar 26 cuatrillones de combinaciones, un 26 con 21 ceros. Si el Sáhara, de nueve millones de kilómetros cuadrados, contuviera tantos granos de arena, estaría cubierto por una capa de arena de tres metros de espesor.

"Además, hay muchos más aminoácidos que no se incorporan a las proteínas", explica Jürgen Cox. "Éstas, al igual que otras pequeñas moléculas, también flotan en las células y realizan allí tareas muy específicas".

Por si esto no fuera lo suficientemente complejo, el esquema de las proteínas dado por los genes también puede alterarse muchas veces dentro de las células mediante una reacción química llamada fosforilación. "Se trata, por así decirlo, de un código adicional propio que especifica en qué sitios de una proteína comienza esta reacción. Ocurre de forma muy dinámica y rápida", explica Cox. "En la proteómica, esta información es extremadamente importante porque el cambio se produce a posteriori, cuando estas proteínas ya están ensambladas". De este modo, se envían señales muy rápidamente en una célula para que ésta pueda, por ejemplo, introducir una molécula importante y necesaria en la célula desde el exterior o desechar la "basura" al exterior.

–––––––––––––––––––––––––––

Autor: Hanns-J. Neubert

Dirección de la editorial

  • Private Wealth GmbH & Co. KG
    Montenstrasse 9 - 80639 München
  • +49 (0) 89 2554 3917
  • +49 (0) 89 2554 2971
  • Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

Idiomas

Redes sociales