OpenAI acaba de publicar un nuevo documento de investigación sobre DALL-E 3. El documento se centra en las mejores prácticas para enmarcar descripciones de imágenes. Sin embargo, no dice nada sobre los detalles de la formación y la implementación del modelo.
Para los no iniciados, DALL-E 3 es un sistema de generación de texto a imagen que se ha implantado recientemente en ChatGPT para usuarios Plus y Enterprise. Con DALL-E 3, los usuarios pueden acelerar su creatividad para una gran variedad de casos de uso. Si tiene una idea para una imagen, sólo tiene que describirla de la forma más sencilla posible y dejar que el modelo la cree por usted.
Puede leer también | Microsoft integra DALL-E 3 de OpenAI en Bing
El documento de investigación publicado recientemente resume el desarrollo de DALL-E 3. Según el documento, el modelo genera imágenes a partir de indicaciones detalladas y destaca en tareas como la creación de imágenes de objetos a partir de descripciones o imágenes con texto. Según el documento, el rendimiento del modelo se evalúa mediante numerosas tareas con evaluadores humanos que utilizan una interfaz específica y siguen instrucciones detalladas.
Recomendaciones para utilizar DALL-E-3
He aquí 10 sugerencias para el trabajo de investigación de quienes planean utilizar DALL-E 3 de forma eficaz.
Comprender el modelo: El documento sugiere que los usuarios se familiaricen con las capacidades y limitaciones de DALL-E 3. El resultado de este modelo es un resultado de subtítulos muy descriptivos.
Las instrucciones descriptivas son fundamentales: Según los investigadores, cuanto más detalladas y descriptivas sean las instrucciones, mejor será el resultado. Recuerda, DALL-E 3 se nutre de descripciones detalladas.
Puede leer tambiién | Google vs OpenAI: 10 cosas que Bard puede hacer y ChatGPT no
Experimentar, experimentar y experimentar: El artículo insiste en la importancia de experimentar con variaciones para obtener un resultado óptimo. Si no estás satisfecho con el resultado, los expertos recomiendan reformular la pregunta y añadir más detalles.
Utiliza sus puntos fuertes: DALL-E 3 destaca en la generación de imágenes de objetos a partir de descripciones y en la creación de imágenes con texto. Usa tu imaginación para dar vida a las ideas de la forma más sencilla.
Aprende de los ejemplos: Los investigadores sugieren que mires ejemplos de indicaciones y resultados para elaborar tus propias indicaciones en función de lo que necesites.
Combinar otros modelos: El documento también hace referencia al uso de DALL-E 3 junto con otros modelos como CLIP, especialmente para el subtitulado y la búsqueda de imágenes.
Perfeccionamiento iterativo: Se aconseja a los usuarios que reutilicen los resultados de DALL-E 3 como nuevas instrucciones para un mayor refinamiento. Por ejemplo, si el modelo genera una imagen basándose en una instrucción descriptiva y el resultado no es exactamente el que se esperaba, se puede utilizar la misma instrucción para obtener el resultado deseado. Esto podría incluir la descripción de modificaciones y adiciones a la imagen generada.
Puede leer también | La actualización de ChatGPT permite a su IA ver, oír y hablar, según OpenAI
Cíñete a las directrices: Los autores recomiendan seguir las directrices de uso proporcionadas por los desarrolladores para garantizar un uso ético y responsable de DALL-E 3.
Mantente al día: Para sacar el máximo partido a DALL-E 3, asegúrate de estar al día de las últimas actualizaciones y mejoras del modelo.
Consejo más importante: Ten paciencia, la generación de imágenes de alta calidad es una tarea compleja y puede llevar tiempo.
Cabe señalar que DALL-E 3 está diseñado para rechazar las solicitudes que busquen imágenes del estilo de un artista vivo. La empresa también ofrece a los creadores la posibilidad de excluir sus imágenes del entrenamiento de sus futuros modelos de generación de imágenes.