Ciencias

Nuevas técnicas de aprendizaje automático ayudan a resolver los desafíos de la biología estructural

Determinar las formas tridimensionales de las moléculas biológicas es uno de los problemas más difíciles de la biología moderna y los descubrimientos médicos. Las empresas y las instituciones de investigación a menudo gastan millones de dólares para determinar una estructura molecular, e incluso estos esfuerzos masivos a menudo no tienen éxito.

Utilizando nuevas técnicas inteligentes de aprendizaje automático, los estudiantes de doctorado de la Universidad de Stanford Stephan Eismann y Raphael Townshend, bajo la dirección de Ron Dror, profesor asociado de informática, desarrollaron un enfoque que supera este problema al predecir estructuras computacionalmente precisas.

En particular, su enfoque tiene éxito incluso cuando se aprende de solo unas pocas estructuras conocidas, lo que lo hace aplicable a los tipos de moléculas cuyas estructuras son más difíciles de determinar experimentalmente.

Su trabajo se demuestra en dos artículos que detallan las aplicaciones de moléculas de ARN y complejos multiproteicos, publicados en Ciencias el 27 de agosto de 2021 en adelante Proteínas en diciembre de 2020, respectivamente. el papel en Ciencias es una colaboración con el laboratorio de Stanford de Rhiju Das, profesor asociado de bioquímica.

La biología estructural, que es el estudio de las formas de las moléculas, tiene este mantra de que la estructura determina la función.. «

Raphael Townshend, estudiante de doctorado, Universidad de Stanford

El algoritmo diseñado por los investigadores predice estructuras moleculares precisas y, al hacerlo, puede permitir a los científicos explicar cómo funcionan las diferentes moléculas, con aplicaciones que van desde la investigación biológica fundamental hasta prácticas informadas de diseño de fármacos.

«Las proteínas son máquinas moleculares que realizan todo tipo de funciones. Para realizar sus funciones, las proteínas a menudo se unen a otras proteínas», dijo Eismann. «Si sabe que un par de proteínas está implicado en una enfermedad y sabe cómo interactúan en 3D, puede intentar apuntar a esa interacción de manera muy específica con un fármaco».

Eismann y Townshend son coautores principales de Ciencias artículo del becario postdoctoral de Stanford Andrew Watkins del laboratorio Das, así como los coautores principales del Proteínas Trabajo con el ex estudiante de doctorado de Stanford Nathaniel Thomas.

Diseñando el algoritmo

En lugar de especificar qué hace que una predicción estructural sea más o menos precisa, los investigadores permiten que el algoritmo descubra estas características moleculares por sí mismo. Hicieron esto porque encontraron que la técnica convencional de proporcionar tal conocimiento puede sesgar un algoritmo a favor de ciertas características, evitando que encuentre otras características informativas.

«El problema con estas características hechas a mano en un algoritmo es que el algoritmo se inclina hacia lo que la persona que elige esas características cree que es importante, y es posible que se pierda alguna información que necesitaría para mejorar», dijo Eismann.

«La red ha aprendido a encontrar conceptos fundamentales que son esenciales para la formación de la estructura molecular, pero sin recibir instrucciones explícitas para hacerlo», dijo Townshend. «Lo interesante es que el algoritmo claramente recuperó cosas que sabíamos que eran importantes, pero también recuperó características que no conocíamos antes».

Habiendo demostrado éxito con las proteínas, los investigadores aplicaron su algoritmo a otra clase de moléculas biológicas importantes, los ARN. Probaron su algoritmo en una serie de «acertijos de ARN» de una competencia de larga data en su campo, y en todos los casos, la herramienta superó a todos los demás participantes de acertijos y lo hizo sin estar diseñada específicamente para estructuras de ARN.

Aplicaciones más amplias

Los investigadores están emocionados de ver dónde más se puede aplicar su enfoque, ya que han tenido éxito con complejos de proteínas y moléculas de ARN.

«La mayoría de los avances dramáticos recientes en el aprendizaje automático han requerido una enorme cantidad de datos para el entrenamiento. El hecho de que este método tenga éxito con muy pocos datos de entrenamiento sugiere que los métodos relacionados pueden resolver problemas no resueltos en muchos campos donde los datos son escasos». dijo Dror, quien es el autor principal de Proteínas artículo y, con Das, coautor principal del Ciencias papel.

Específicamente para la biología estructural, el equipo dice que solo está rascando la superficie en términos de progreso científico por hacer.

«Una vez que tiene esta tecnología fundamental, está elevando su nivel de comprensión un paso más y puede comenzar a hacer la siguiente serie de preguntas», dijo Townshend. «Por ejemplo, puede comenzar a diseñar nuevas moléculas y medicamentos con ese tipo de información, que es un área que entusiasma mucho a la gente».

Fuente:

Referencia de la revista:

Townshend, RJL, et al. (2021) Aprendizaje geométrico profundo de la estructura del ARN. Ciencias. doi.org/10.1126/science.abe5650.

Prudencia Febo

"Explorador. Entusiasta de la cerveza. Geek del alcohol. Gurú de Internet sutilmente encantador. Erudito de la web en general".

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba