Anthropic lanza una versión mejorada de su LLM básico
Créditos de la imagen: antrópico
Anthropic, la startup de IA cofundada por exejecutivos de OpenAI, liberado una versión actualizada de su modelo de generación de texto más rápido y económico, disponible a través de una API, Claude Instant.
El Claude Instant actualizado, Claude Instant 1.2, incorpora las fortalezas del modelo insignia recientemente anunciado de Anthropic, Claude 2, que muestra ganancias «significativas» en áreas como matemáticas, codificación, razonamiento y seguridad, según Anthropic. En las pruebas internas, Claude Instant 1.2 obtuvo un 58,7 % en un punto de referencia de codificación en comparación con Claude Instant 1.1, que obtuvo un 52,8 % y un 86,7 % en un conjunto de preguntas de matemáticas, frente al 80,9 % de Claude Instant 1.1.
“Claude Instant genera respuestas más largas y estructuradas y sigue mejor las instrucciones de formato”, escribe Anthropic en una publicación de blog. “Instant 1.2 también muestra mejoras en la extracción de citas, capacidades multilingües y respuesta a preguntas”.
Claude Instant 1.2 también es menos propenso a las alucinaciones y más resistente a los intentos de fuga, afirma Anthropic. En el contexto de los modelos de lenguaje grande como Claude, la «alucinación» es cuando un modelo genera texto incorrecto o sin sentido, mientras que el jailbreak es una técnica que utiliza indicaciones escritas inteligentemente para eludir las características de seguridad colocadas en los modelos de lenguaje grande por sus creadores.
Y Claude Instant 1.2 presenta una ventana emergente del mismo tamaño que Claude 2: 100,000 tokens. La ventana de contexto hace referencia al texto que el modelo considera antes de generar texto adicional, mientras que los tokens representan el texto sin procesar (por ejemplo, la palabra «fantástico» se dividiría en los tokens «fan», «tas» y «tic»). . Claude Instant 1.2 y Claude 2 pueden analizar unas 75.000 palabras, aproximadamente la longitud de «El gran Gatsby».
En términos generales, es menos probable que los modelos con grandes ventanas emergentes «olviden» el contenido de una conversación reciente.
Como informamos anteriormente, la ambición de Anthropic es crear un «algoritmo de próxima generación para el autoaprendizaje de IA», como lo describe en una plataforma de presentación para inversores. Este algoritmo se puede usar para crear asistentes virtuales que pueden responder correos electrónicos, realizar búsquedas y generar arte, libros y más, algunos de los cuales ya hemos experimentado con modelos como GPT-4 y otros grandes modelos de lenguaje.
Pero Claude Instant no es ese algoritmo. En cambio, su objetivo es competir con ofertas de nivel de entrada similares de OpenAI, así como con nuevas empresas como Cohere y AI21 Labs, que están desarrollando y produciendo sus propios sistemas de IA de generación de texto y, en algunos casos, de generación de imágenes.
Hasta la fecha, Anthropic, lanzado en 2021, dirigido por el ex vicepresidente de investigación de OpenAI, Dario Amodei, ha recaudado $ 1.45 mil millones a una valoración de mil millones de un solo dígito. Si bien eso puede parecer mucho, está muy por debajo de lo que la compañía estima que necesitará (5 mil millones de dólares en los próximos dos años) para crear el chatbot ideal.