Investigadores chinos esperan crear «verdaderos científicos de IA» a través del «aprendizaje automático informado»
Sora está entrenado utilizando grandes cantidades de datos visuales, lo que le permite capturar patrones para generar imágenes y videos que imitan la realidad. Pero no está capacitado para comprender leyes físicas como la gravedad.
«Sin una comprensión fundamental del mundo, un modelo es esencialmente una animación más que una simulación», afirmó Chen Yuntian, autor del estudio y profesor del Instituto Oriental de Tecnología.
La brecha en IA entre China y EE.UU. se amplía: 'estamos todos muy ansiosos'
La brecha en IA entre China y EE.UU. se amplía: 'estamos todos muy ansiosos'
Según el artículo, los modelos de aprendizaje profundo generalmente se entrenan utilizando datos en lugar de conocimientos previos, que pueden incluir cosas como las leyes de la física o la lógica matemática.
Pero los científicos de la Universidad de Pekín y el EIT escribieron que al entrenar los modelos, se podría utilizar el conocimiento previo junto con los datos para hacerlos más precisos, creando modelos de “aprendizaje automático informado” capaces de incorporar ese conocimiento en sus resultados.
Decidir qué conocimiento previo (que puede incluir cosas como relaciones funcionales, ecuaciones y lógica) incorporar en un modelo para “preaprender” fue un desafío, e incorporar múltiples reglas también puede llevar al colapso de los modelos, escribió el equipo.
«Cuando nos enfrentamos a un gran volumen de conocimientos y reglas, lo que suele ser el caso, los modelos actuales de aprendizaje automático informado tienden a tener dificultades o incluso fallar», afirmó Chen.
Para abordar este problema, los investigadores crearon un marco para evaluar el valor de las reglas y determinar qué combinaciones dieron como resultado los modelos más predictivos.
«La incorporación del conocimiento humano en los modelos de IA tiene el potencial de mejorar su eficiencia y capacidad para hacer inferencias, pero la cuestión es cómo equilibrar la influencia de los datos y el conocimiento», dijo Xu Hao, primer autor e investigador de la Universidad de Pekín, en un Cell. . Comunicado de prensa.
«Nuestro marco se puede emplear para evaluar diferentes conocimientos y reglas para mejorar la capacidad predictiva de los modelos de aprendizaje profundo».
Según el documento, el marco calcula la «importancia de la regla» observando cómo una regla específica o una combinación de reglas afecta la precisión predictiva de un modelo.
Enseñar a los modelos de IA tales reglas (por ejemplo, las leyes de la física) podría hacerlos «reflejos más del mundo real, lo que los haría más útiles en ciencia e ingeniería», dijo Chen del EIT en el comunicado.
Los investigadores probaron su marco usándolo para optimizar un modelo para resolver ecuaciones multivariadas y otro usado para predecir los resultados de un experimento de química.
Chen dijo que en el corto plazo este marco sería más útil en modelos científicos «donde la coherencia entre el modelo y las reglas de la física es crucial para evitar consecuencias potencialmente desastrosas».
Desde la IA hasta los vehículos eléctricos, ¿cómo se está desarrollando la rivalidad entre China y Estados Unidos en áreas clave de alta tecnología?
Desde la IA hasta los vehículos eléctricos, ¿cómo se está desarrollando la rivalidad entre China y Estados Unidos en áreas clave de alta tecnología?
El equipo espera llevar su marco más allá para permitir que la IA identifique su propio conocimiento y reglas directamente a partir de los datos, sin interferencia humana.
«Queremos hacer de esto un circuito cerrado, transformando el modelo en un verdadero científico de IA», dijo Chen en el comunicado. El equipo está desarrollando una herramienta de complemento de código abierto para desarrolladores de IA que podría permitirles lograrlo.
Sin embargo, el equipo ya ha identificado al menos un problema.
Durante el estudio, el equipo descubrió que cuando se agregan más datos a un modelo, las reglas generales se vuelven más significativas que las reglas locales específicas, pero esto no ayuda en áreas como la biología y la química porque «a menudo carecen de reglas generales fácilmente disponibles, similares». a las ecuaciones gubernamentales».