Tecnología

Google anuncia Gemini 1.5 multimodal con una longitud de contexto de un millón de tokens

Una semana después de anunciar Géminis 1.0 UltraGoogle anunció detalles adicionales sobre su modelo de próxima generación. Géminis 1.5. La nueva iteración viene con una expansión de su ventana contextual y la adopción de una arquitectura de «Mezcla de Expertos» (MoE), que promete hacer que la IA sea más rápida y eficiente. El nuevo modelo también incluye capacidades multimodales ampliadas.

Con la capacidad de procesar hasta 1 millón de tokens, supera las capacidades de sus competidores e incluso de su propio predecesor. Sundar Pichai, director ejecutivo de Google resaltado el potencial transformador de esta característica, afirmando: «Esto permite casos de uso en los que se puede agregar una gran cantidad de contexto e información personal en el momento de la consulta… Veo esto como uno de los mayores avances que hemos logrado».

Usando Géminis 1.5 Mezcla de expertos Esta técnica representa otro avance hacia la optimización de la eficiencia de la IA. Al activar selectivamente partes relevantes del modelo en función de la consulta, se garantiza la velocidad y la conservación de recursos, un avance fundamental a medida que los modelos de IA se vuelven cada vez más complejos y consumen más energía. Este enfoque no sólo mejora la experiencia del usuario al reducir los tiempos de espera, sino que también se alinea con esfuerzos más amplios para hacer que la IA sea más sostenible.

“Os recursos multimodais do modelo significam que você pode interagir de maneira sofisticada com livros inteiros, coleções de documentos muito longas, bases de código de centenas de milhares de linhas em centenas de arquivos, filmes completos, séries inteiras de podcast e muito mais”, de acuerdo con Jeff Dean, Científico Jefe, Google DeepMind y Google Research. Quienes deseen ver demostraciones organizadas de Gemini 1.5 pueden consultar sus vídeos. Solucion de problemas en 100.000 líneas de código o recuperación en una película de 44 minutos.

Con OpenAI revelando recientemente capacidades de memoria para ChatGPT y señalando un gran avance en la búsqueda web, ha comenzado la carrera para construir no solo la IA más poderosa. El enfoque de Google con Gemini 1.5 tanto en desarrolladores como en usuarios empresariales, antes de un lanzamiento más amplio para el consumidor, subraya la importancia de la IA como herramienta para la innovación empresarial y la productividad personal.

Lo que realmente importa es qué tan bien el modelo utiliza realmente el contexto para resolver problemas del mundo real, y Gemini-1.5 superó a SOTA con gran éxito. – Jim Fan

A pesar del entusiasmo que rodea a Gemini 1.5, está claro que Google todavía se encuentra en las primeras etapas de exploración de todo su potencial. Gemini 1.5 solo estará disponible para usuarios empresariales y desarrolladores a través de Vertex AI y AI Studio. Las impresionantes capacidades del modelo plantean desafíos, especialmente en la velocidad de procesamiento de tareas que involucran su ventana de contexto máxima. Como dice Oriol Vinyals, vicepresidente de investigación de Google DeepMind, Reconocido«El aspecto de latencia [is something] estamos… trabajando para optimizar; esto todavía está en la fase experimental, en la fase de investigación». Sin embargo, la promesa de futuras optimizaciones y la exploración de ventanas de contexto aún más grandes sugieren que Google sólo está arañando la superficie de lo que es posible.

Los desarrolladores interesados ​​en aprender más sobre Gemini 1.5 pueden consultar el documento técnico para obtener información adicional sobre el modelo, incluida la tarjeta del modelo, información de capacitación y detalles adicionales sobre la evaluación del modelo.

Federico Pareja

"Escritora típica. Practicante de comida malvada. Genio zombi. Introvertido. Lector. Erudito de Internet. Entusiasta del café incondicional".

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba