¡Hola a todos! Soy Mamá Online y hoy voy a compartir mi experiencia con el nuevo modelo de generación de imágenes de Stable Diffusion «SDXL» que promete mejorar la inclusión de texto en las imágenes generadas por inteligencia artificial. ¡Acompáñame en este análisis!
El desafío del texto en imágenes generadas por AI
La generación de imágenes con inteligencia artificial ha tenido dificultades para incluir texto de manera coherente en las imágenes. Algunos modelos, como MidJourney en su versión 5, han mejorado aspectos como manos, rostros y dedos, pero el texto sigue siendo un desafío.
Probando el nuevo modelo SDXL beta de Stable Diffusion
Me dirigí a la página de Dreams Studio para probar el nuevo modelo SDXL beta. Puedes acceder a través de la página beta y registrarte con un correo de Gmail. Te darán créditos gratuitos para probar la herramienta.
https://beta.dreamstudio.ai/generate
Primeras pruebas: ¿Puede generar texto coherente en las imágenes?
Le pedí al modelo que generara imágenes de una hada sosteniendo un letrero gigante con el texto «Mami Online» para ponerlo a prueba. Después de varios intentos, aquí están mis observaciones:
- En general, el modelo no logra generar texto coherente o completo en las imágenes.
- A veces agarra solo una parte del texto solicitado.
- Las imágenes generadas son creativas, pero no cumplen con la expectativa del texto.
Estas son las imágenes más acertadas, generadas con prompts donde le pedí texto. Cabe mencionar que para que salieran estas tuve que hacer más de 25 intentos, por lo que esto parece más una lotería que un modelo que ya puede integrar los textos que le indiques a partir de un prompt.





Ajustando la fuerza del prompt y simplificando las instrucciones
Probé aumentando la fuerza del prompt y simplificando las instrucciones, pero los resultados fueron similares: no se generaron imágenes con el texto deseado.
Conclusión: ¿Es el nuevo modelo de Stable Diffusion SDXL una mejora real?
Aunque el modelo SDXL beta de Stable Diffusion es interesante, no puedo afirmar que cumpla con la promesa de generar texto coherente en las imágenes. Después de 25 intentos, solo 5 o 6 imágenes tenían texto, y solo 1 o 2 lo tenían de forma coherente.
¿Qué podemos esperar en el futuro?
Aunque el modelo SDXL beta no es perfecto, esperamos que futuras actualizaciones logren incluir texto en las imágenes de manera efectiva. Mientras tanto, seguiré investigando y compartiendo mis descubrimientos sobre estas maravillosas herramientas.
¡No olvides suscribirte, darle like y revisar la descripción para obtener más información sobre herramientas recomendadas! Hasta el próximo vídeo, ¡chao chao!
Herramientas Recomendadas
Designrr: Creación de ebooks con IA para crear diseños asombrosos en minutos! (un sólo pago de por vida):
Texto a Voz (un sólo pago de por vida): https://unamamaonline.com/speechelo
VPN segura y económica cupón un sólo pago de 19 usd de por vida: https://unamamaonline.com/gooseVPN
Genera tus tracks de música con IA Mubert: https://unamamaonline.com/MubertIA
Obtenga resúmenes rápidos de los libros de no ficción más vendidos en múltiples formatos de medios e idiomas. https://unamamaonline.com/storyshots
Alternativa a Midjourney generación de imágenes con inteligencia artificial (un sólo pago de por vida): https://unamamaonline.com/artsmartai
Asistente de escritura con IA más profesional que chat GPT, es capaz de checar Info real y escribe en varios idiomas e incluye generación de arte digital con prompts: (cupón un sólo pago de por vida para 15,000 palabras cada mes) https://unamamaonline.com/kattebAIWriter