Ciencias

Discurso de ballena: acercándose a un sistema de comunicación desconocido a través de la exploración espacial latente y la inferencia causal

Descripción general de la arquitectura fiwGAN (Beguš, 2021b) y datos utilizados en el entrenamiento. La figura ilustra tres redes: el Generador con 5 capas convolucionales ascendentes, la red Q con 5 capas convolucionales y el Discriminador con 5 capas convolucionales. -stat.ML

Este artículo propone una metodología para descubrir propiedades significativas en los datos mediante la exploración del espacio latente de modelos generativos profundos no supervisados. Combinamos la manipulación de variables latentes individuales para valores extremos fuera del rango de entrenamiento con métodos inspirados en la inferencia causal en un enfoque que llamamos desenredo causal con valores extremos (CDEV) y mostramos que este enfoque proporciona información sobre la interpretabilidad del modelo. Usando esta técnica, podemos inferir qué propiedades de datos desconocidos codifica el modelo como significativas.

Aplicamos la metodología para probar qué es significativo sobre el sistema de comunicación del cachalote, uno de los sistemas de comunicación animal más intrigantes y poco estudiados. Entrenamos una red que ha demostrado aprender representaciones significativas del habla y probamos si podemos aprovechar este aprendizaje no supervisado para descifrar las propiedades de otro sistema de comunicación vocal para el cual no tenemos información previa.

La técnica propuesta sugiere que los cachalotes codifican información utilizando el número de clics en una secuencia, la regularidad de su sincronización y propiedades de audio como la media espectral y la regularidad acústica de las secuencias. Algunos de estos hallazgos son consistentes con hipótesis existentes, mientras que otros se proponen por primera vez.

También argumentamos que nuestros modelos revelan reglas que gobiernan la estructura de las unidades de comunicación en el sistema de comunicación del cachalote y las aplican mientras generan datos novedosos que no se muestran durante el entrenamiento.

READ  Los bosques multiespecíficos son un 70% más eficientes en carbono

Este artículo sugiere que una interpretación de los resultados de las redes neuronales profundas con metodología causal puede ser una estrategia viable para abordar datos sobre los que se sabe poco, y presenta otro caso de cómo el aprendizaje profundo puede limitar el espacio de hipótesis.

Finalmente, el enfoque propuesto que combina manipulación del espacio latente e inferencia causal puede extenderse a otras arquitecturas y conjuntos de datos arbitrarios.

Gašper Beguš, Andrej Leban, Shane Gero

Comentarios: 25 páginas, 23 figuras.
Materias: Aprendizaje automático (stat.ML); Aprendizaje automático (cs.LG); Sonido (cs.SD); Procesamiento de audio y voz (eess.AS)
Citar como: arXiv:2303.10931 [stat.ML] (o arXiv:2303.10931v1 [stat.ML] para esta versión)
https://doi.org/10.48550/arXiv.2303.10931
Enfócate para aprender más
Historial de envíos
Por: Andrej Leban
[v1] Lunes 20 de marzo de 2023 08:09:13 UTC (8148 KB)
https://arxiv.org/abs/2303.10931
Astrobiología, SETI, CETI,

Miembro del Club de Exploradores, ex gerente de carga útil de la Estación Espacial de la NASA/biólogo espacial, equipos desaparecidos, periodista, montañero, sinestésico, mezcla de Na’Vi-Jedi-Freman-Buddhist, ASL, veterano de la isla de Devon y del campamento base del Everest, (él/él) 🖖🏻

Prudencia Febo

"Explorador. Entusiasta de la cerveza. Geek del alcohol. Gurú de Internet sutilmente encantador. Erudito de la web en general".

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba