El aprendizaje automático ayuda a los científicos a identificar ‘genes importantes’ en la agricultura y la medicina
24 de septiembre (UPI) – Los seres humanos y las plantas tienen miles de genes. Tradicionalmente, el estudio de la función de un solo gen o grupo de genes requería una experimentación extensa.
Sin embargo, las computadoras y el acceso a grandes bases de datos de datos genómicos permiten a los investigadores estudiar la funcionalidad del gen de manera más eficiente. Aún así, extraer grandes cantidades de datos genómicos es difícil incluso para la computadora más poderosa.
En un nuevo descubrimiento, investigadores de Estados Unidos y Taiwán han desarrollado un algoritmo de aprendizaje automático para identificar de manera más eficiente «genes importantes» en la agricultura y la medicina.
El algoritmo de aprendizaje automático, descrito el viernes en la revista Nature Communications, podría ayudar a los científicos a anticipar mejor cómo responderán las plantas y los animales a los cambios en la nutrición, las toxinas o los patógenos, lo que permitirá a los investigadores desarrollar cultivos más resistentes, diagnosticar enfermedades raras o anticipar la próxima pandemia.
«Hemos demostrado que centrarnos en genes cuyos patrones de expresión se conservan evolutivamente en todas las especies mejora nuestra capacidad para aprender y predecir ‘genes importantes’ para el rendimiento del crecimiento de cultivos básicos, así como los resultados de enfermedades en animales», dijo la autora principal del estudio, Gloria Coruzzi, biología profesor del Centro de Genómica y Biología de Sistemas de la Universidad de Nueva York, dijo en un comunicado de prensa.
Esencialmente, los investigadores han encontrado una forma de reducir el ruido genético al que está sometido un algoritmo.
«Hemos demostrado que reducir nuestra información genómica a genes cuyos patrones de expresión se conservan dentro y entre especies es una forma basada en la biología de reducir la dimensionalidad de los datos genómicos, lo que mejora significativamente la capacidad de nuestros modelos de aprendizaje automático para identificar cuáles genes son importantes. por un rasgo «, dijo la autora principal Chia-Yi Cheng, investigadora del Centro de Genómica y Biología de Sistemas y de la Universidad Nacional de Taiwán.
En un experimento de prueba de concepto, los investigadores demostraron que los genes reactivos al nitrógeno se conservan evolutivamente entre dos especies de plantas diversas: Arabidopsis, una pequeña planta con flores y un modelo de planta popular entre los científicos de plantas y varias variedades de maíz. Con el ruido de los datos de entrada reducido, el nuevo algoritmo identificó genes importantes para procesar el nitrógeno de manera eficiente y exitosa.
La absorción de nitrógeno es esencial para el crecimiento de las plantas. Las plantas diseñadas para absorber y usar nitrógeno de manera más eficiente pueden reducir el uso de fertilizantes. El uso excesivo de nitrógeno se ha relacionado con una variedad de problemas ambientales, que incluyen carga de nutrientes, floraciones de algas nocivas y blanqueamiento de coral.
En experimentos de seguimiento, los investigadores confirmaron la importancia de los genes identificados por su algoritmo. Los científicos de plantas pudieron aumentar los genes de las variedades de maíz para aumentar la absorción de nitrógeno y mejorar el crecimiento de las plantas en suelos pobres en nitrógeno.
«Ahora que podemos predecir con mayor precisión qué híbridos de maíz son mejores para usar fertilizantes nitrogenados en el campo, podemos mejorar rápidamente ese rasgo», dijo el coautor Stephen Moose, profesor de ciencias agrícolas en la Universidad de Illinois en Urbana-Champaign. «Aumentar la eficiencia del uso de nitrógeno en el maíz y otros cultivos ofrece tres beneficios principales: reducir los costos de los agricultores, reducir la contaminación ambiental y mitigar las emisiones de gases de efecto invernadero de la agricultura».
Además de identificar genes relevantes para varios rasgos de cultivos, los investigadores sugieren que su algoritmo puede usarse para anticipar genes relevantes para los resultados de la enfermedad en modelos de ratón, lo que podría inspirar el desarrollo de nuevas terapias y técnicas de diagnóstico.
«Debido a que hemos demostrado que nuestra línea evolutiva informada también se puede aplicar a los animales, esto destaca su potencial para descubrir genes de importancia para cualquier rasgo fisiológico o clínico de interés en biología, agricultura o medicina», dijo Coruzzi.