DALL·E 3 llega a ChatGPT, Bing y Microsoft Designer
OpenAI compartió recientemente detalles sobre DALL·E 3, la última versión de su sistema de inteligencia artificial de texto a imagen, que llegará este otoño a ChatGPT Plus, ChatGPT Enterprise, AI Image Creator de Bing y Microsoft Designer.
Esta actualización promete mayor precisión de imagen, mayores matices y atención al texto ingresado por el usuario.
Novedades de DALL E3
Las iteraciones anteriores de DALL·E requerían que los usuarios ajustaran sus indicaciones mediante un proceso conocido como ingeniería de indicaciones.
DALL·E 3 tiene como objetivo eliminar esta molestia generando imágenes que se ajusten mejor a las instrucciones de texto iniciales del usuario.
Por ejemplo, mientras que DALL·E 2 podría representar a un jugador de baloncesto vagamente nebuloso, DALL·E 3 creará una representación más expresiva y precisa basada en el texto proporcionado.
Grandes noticias: @OpenAI DALL-E 3 estará disponible pronto en ChatGPT Plus y ChatGPT Enterprise 🤯
Este último modelo de DALL-E es absolutamente increíble, me sorprendió lo que es capaz de generar. pic.twitter.com/eTWzxiOHgB
– Logan.GPT (@OfficialLoganK) 20 de septiembre de 2023
El nuevo sistema se basa en ChatGPT, lo que permite una interacción perfecta entre plataformas de texto e imágenes.
Los usuarios pueden contratar a ChatGPT como “socio de lluvia de ideas” para refinar sus ideas de imágenes. Si a un usuario le gusta una imagen generada pero quiere pequeños cambios, una conversación con ChatGPT puede producir esos cambios en una o dos oraciones.
DALL·E 3 Mecanismos de Seguridad
Un enfoque adicional en los mecanismos de seguridad también distingue a DALL·E 3. Estos incluyen mitigaciones para prevenir la generación de contenido violento, para adultos u odioso.
Además, DALL·E 3 se negará a generar imágenes que incluyan personajes públicos vivos o que imiten el estilo de artistas vivos.
Estas precauciones se desarrollaron en colaboración con expertos en el campo conocidos como “equipos rojos”, quienes prueban rigurosamente el sistema en busca de vulnerabilidades de seguridad.
Los desarrolladores también están explorando formas de ayudar a los usuarios a identificar imágenes generadas por IA. Están investigando un “clasificador de procedencia”, una herramienta interna que puede reconocer si una idea se originó en DALL·E 3.
Esta herramienta se encuentra en una fase experimental, pero su desarrollo indica un enfoque proactivo para resolver problemas de desinformación y manipulación de imágenes.
¿Cuándo estará disponible DALL·E 3?
Está previsto que DALL·E 3 esté disponible para los clientes de ChatGPT Plus y Enterprise en octubre.
OpenAI planea ofrecer licencias liberales, lo que permitirá a los usuarios de ChatGPT usar, vender o intercambiar libremente las imágenes que crean sin necesidad de permiso de la plataforma.
Microsoft también planea agregar soporte DALL·E 3 al AI Image Creator and Designer de Bing en las próximas semanas.
Agregando calidad de imagen mejorada con soporte para el último modelo DALL.E 3 ✅ #EventoMicrosoft pic.twitter.com/hLtVQS1VJO
-Bing Bing) 21 de septiembre de 2023
Cómo los artistas y creadores de contenidos pueden cancelar la formación de DALL·E 3
Como ocurre con todos los modelos de IA, DALL·E 3 aprende sus capacidades a partir de una amplia gama de datos públicos, incluidos texto e imágenes. Este proceso de aprendizaje refleja la forma en que los humanos adquieren conocimientos.
Por ejemplo, después de examinar varias fotografías de gatos, la IA puede generar una imagen completamente nueva y única de un gato, muy parecida a cómo una persona podría dibujar un gato después de ver suficientes ejemplos.
Es esencial tener en cuenta que una vez que estos modelos han absorbido sus datos de entrenamiento, ya no tienen acceso directo a ellos. Cuando un usuario interactúa con el modelo, utiliza sus conceptos internalizados en lugar de extraerlos de una base de datos externa.
OpenAI, en un intento de abordar consideraciones éticas en torno a la propiedad del contenido, ofreció a los artistas dos formas de optar por no recibir capacitación en IA.
Los propietarios de sitios web pueden impedir que GPTBot, un rastreador web diseñado para recopilar datos de entrenamiento, acceda a su sitio web. Agregar GPTBot a los protocolos robots.txt de su sitio puede ser una ruta más eficiente para quienes tienen grandes volúmenes de imágenes.
Alternativamente, OpenAI ha proporcionado una molde para que las personas soliciten la eliminación de su contenido de futuros conjuntos de datos de entrenamiento.
Es importante tener en cuenta que OpenAI también compra licencias para conjuntos de datos, por lo que si ha habilitado licencias de terceros en otras plataformas, completar el formulario puede no garantizar la eliminación completa.
El futuro de la creación de contenidos con IA generativa
Eso actualizar Las imágenes de IA de OpenAI representan otro avance significativo para los especialistas en marketing y creadores de contenido.
Aunque hace que el diseño gráfico sea accesible a más personas, los avances en esta área abren la puerta a cuestiones legales y éticas más complejas.
Imagen de portada: Producción de Vladimka/Shutterstock