Tecnología

Anthropic lanza una versión mejorada de su LLM básico

Créditos de la imagen: antrópico

Anthropic, la startup de IA cofundada por exejecutivos de OpenAI, liberado una versión actualizada de su modelo de generación de texto más rápido y económico, disponible a través de una API, Claude Instant.

El Claude Instant actualizado, Claude Instant 1.2, incorpora las fortalezas del modelo insignia recientemente anunciado de Anthropic, Claude 2, que muestra ganancias «significativas» en áreas como matemáticas, codificación, razonamiento y seguridad, según Anthropic. En las pruebas internas, Claude Instant 1.2 obtuvo un 58,7 % en un punto de referencia de codificación en comparación con Claude Instant 1.1, que obtuvo un 52,8 % y un 86,7 % en un conjunto de preguntas de matemáticas, frente al 80,9 % de Claude Instant 1.1.

“Claude Instant genera respuestas más largas y estructuradas y sigue mejor las instrucciones de formato”, escribe Anthropic en una publicación de blog. “Instant 1.2 también muestra mejoras en la extracción de citas, capacidades multilingües y respuesta a preguntas”.

Claude Instant 1.2 también es menos propenso a las alucinaciones y más resistente a los intentos de fuga, afirma Anthropic. En el contexto de los modelos de lenguaje grande como Claude, la «alucinación» es cuando un modelo genera texto incorrecto o sin sentido, mientras que el jailbreak es una técnica que utiliza indicaciones escritas inteligentemente para eludir las características de seguridad colocadas en los modelos de lenguaje grande por sus creadores.

Y Claude Instant 1.2 presenta una ventana emergente del mismo tamaño que Claude 2: 100,000 tokens. La ventana de contexto hace referencia al texto que el modelo considera antes de generar texto adicional, mientras que los tokens representan el texto sin procesar (por ejemplo, la palabra «fantástico» se dividiría en los tokens «fan», «tas» y «tic»). . Claude Instant 1.2 y Claude 2 pueden analizar unas 75.000 palabras, aproximadamente la longitud de «El gran Gatsby».

En términos generales, es menos probable que los modelos con grandes ventanas emergentes «olviden» el contenido de una conversación reciente.

Como informamos anteriormente, la ambición de Anthropic es crear un «algoritmo de próxima generación para el autoaprendizaje de IA», como lo describe en una plataforma de presentación para inversores. Este algoritmo se puede usar para crear asistentes virtuales que pueden responder correos electrónicos, realizar búsquedas y generar arte, libros y más, algunos de los cuales ya hemos experimentado con modelos como GPT-4 y otros grandes modelos de lenguaje.

Pero Claude Instant no es ese algoritmo. En cambio, su objetivo es competir con ofertas de nivel de entrada similares de OpenAI, así como con nuevas empresas como Cohere y AI21 Labs, que están desarrollando y produciendo sus propios sistemas de IA de generación de texto y, en algunos casos, de generación de imágenes.

Hasta la fecha, Anthropic, lanzado en 2021, dirigido por el ex vicepresidente de investigación de OpenAI, Dario Amodei, ha recaudado $ 1.45 mil millones a una valoración de mil millones de un solo dígito. Si bien eso puede parecer mucho, está muy por debajo de lo que la compañía estima que necesitará (5 mil millones de dólares en los próximos dos años) para crear el chatbot ideal.

Anthropic afirma tener «miles» de clientes y socios en la actualidad, incluido Quora, que brinda acceso a Claude y Claude Instant a través de su aplicación de IA generativa basada en suscripción Poe. Claude impulsa la herramienta DuckAssist lanzada recientemente por DuckDuckGo, que responde directamente a consultas de búsqueda simples para los usuarios, en combinación con ChatGPT de OpenAI. Y en Notion, Claude es parte del backend técnico de Notion AI, un asistente de escritura de IA integrado en el espacio de trabajo de Notion.

Federico Pareja

"Escritora típica. Practicante de comida malvada. Genio zombi. Introvertido. Lector. Erudito de Internet. Entusiasta del café incondicional".

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba