El Dall-E 3 de OpenAI ya está disponible en el mercado desde hace aproximadamente un mes y los entusiastas creativos de todo el mundo están probando diversos casos de uso. El potencial parece ilimitado, desde la creación de imágenes con IA hasta la producción de cortometrajes.
Experimento de 10 minutos para ver qué tan rápido podía generar una película con IA.
Le pedí a #ChatGPT una historia y luego generar imágenes con #DALLE3.
Pasé las imágenes por #runwayml y agregué algo de música.Esta fue la historia que se le ocurrió a GPT4:
Ecos del pasado:
Intro: En un bar de jazz,… pic.twitter.com/6hlPknBYY7— Oliver McCann (@OliverZMcCann) 14 de octubre de 2023
Ahora puede que te estés preguntando: ¿Realmente vale la pena el bombo publicitario de Dall-E 3? ¿Es mejor que Midjourney?
Si ha estado utilizando Midjourney para sus necesidades de imágenes de IA, es posible que se pregunte si es necesario hacer un cambio.
En esta publicación de blog, realizaremos una comparación en profundidad, en la que compararemos Dall-E 3 con Midjourney utilizando 16 indicaciones distintas para comprender las fortalezas y las deficiencias de cada plataforma.
¿Qué son DALL-E 3 y Midjourney?
DALL-E 3 es el nuevo generador de arte de IA de OpenAI.
Está integrado en ChatGPT, lo que lo hace fácil de usar, y está disponible a través de ChatGPT Plus por $20 al mes. Si bien aún está en versión beta, es un éxito en varios campos para obtener imágenes precisas.
Consulte la guía detallada sobre cómo utilizar Dall-E 3.
Por otro lado, tenemos a Midjourney, un bot dentro de Discord.
Es conocida por sus estilos ricos y emociones en imágenes. Por $10 al mes, puedes comenzar con su plan básico, pero prepárate para modificar tus indicaciones de vez en cuando.
Aquí hay una guía detallada sobre cómo utilizar Midjourney.
Así, DALL-E 3 ofrece arte detallado a través de una plataforma dedicada, mientras que Midjourney, dentro de Discord, se inclina por la creatividad y la emoción. Ambos tienen sus propias ventajas. Todo se reduce a lo que estás buscando.
Dall-E 3 vs Midjourney: una matriz de comparación
Desde-E 3 | A mitad de camino | |
---|---|---|
Facilidad de uso | Muy fácil | Medio |
Costo | $20 por mes | Comienza en $10 por mes |
Calidad de imagen | Más matices y detalles | BIEN |
Estilo de imagen | Admite todos los estilos artísticos. | Admite todos los estilos artísticos. |
Tamaño de la imagen | Cuadrado, alto y ancho. | Admite tamaños personalizados |
Creatividad | Entiende la intención del usuario | Ajustar los niveles de creatividad |
Velocidad de generación de imágenes | Un poco más lento | Unos segundos |
Derechos de autor de las imágenes de IA | Los usuarios son dueños de las imágenes que crearon. | Los usuarios son dueños de las imágenes que crearon. |
Realismo | Menos realista pero con más detalles | Más realista |
Personalización | Opciones de personalización limitadas | Más opciones de personalización |
Dall-E 3 vs Midjourney: el duelo definitivo
Mirar una tabla de comparación puede darte una breve idea, pero solo comprenderás las fortalezas y debilidades de cada generador de arte de IA al hacer una comparación lado a lado.
En esta sección, seleccionamos algunas de las mejores imágenes y tipos de arte. Usaremos el mismo mensaje en Dall-E 3 y Midjourney para cada tipo a fin de comparar los resultados.
Usar:Todas las imágenes de la izquierda fueron creadas en DALL-E 3, y las de la derecha fueron creadas por Midjourney.
Paisajes
Inmediato:Campos de trigo dorado bajo un cielo tormentoso, con un espantapájaros solitario que lleva una bufanda roja brillante.
La imagen de Dall-E 3 tiene un estilo detallado e ilustrativo con un tono cálido y dorado, que muestra una figura parecida a un espantapájaros. En contraste, la imagen de Midjourney tiene un aire más fotográfico, centrándose en una figura encapuchada en medio de una tormenta inminente, pintada en tonos sepia. No se ve al espantapájaros en absoluto.
Conceptos abstractos
Inmediato:Representación visual del sonido de la risa mediante ráfagas vibrantes de color y patrones en espiral.
La imagen de Dall-E 3 tiene muchos colores mezclados, como si estuvieran girando, con mucho azul, lo que le da una sensación de ensueño. La imagen de Midjourney tiene una mujer riendo con patrones coloridos a su alrededor, lo que hace que la risa parezca viva y real. Ambas son geniales para mostrar la alegría de la risa.
Si bien Midjourney hizo un gran trabajo, la imagen no parece arte abstracto. Dall-E 3 entendió la intención del mensaje y generó una imagen abstracta.
Escenarios históricos
Inmediato:Un gladiador preparándose para la batalla en un Coliseo romano, ajustándose el casco y agarrando su escudo.
A la izquierda, el Dall-E 3 muestra a un gladiador con un casco detallado y ornamentado de pie ante el Coliseo. El ambiente es más sereno y la luz del sol ilumina su equipo.
A la derecha, la imagen de Midjourney presenta a un gladiador más rudo en un momento íntimo. Este guerrero parece perdido en sus pensamientos, tal vez reflexionando sobre la batalla que se avecina. Su armadura está más desgastada por la batalla y la escena parece más oscura e intensa. Agarra con fuerza su escudo ornamentado, mostrando su determinación.
Ambas imágenes parecen reales. La de Dall-E 3 incluye casi todo lo que pedimos en el mensaje, pero a Midjourney le faltan el casco y el coliseo. A Dall-E 3 también le falta la parte de “ajustar el casco”.
Escenas futuristas
Inmediato:Músicos callejeros cibernéticos que tocan instrumentos luminosos en un callejón iluminado con neón de una metrópolis
La imagen de la izquierda, de Dall-E 3, muestra un callejón largo y tranquilo con músicos de aspecto alienígena y letreros de neón brillantes. También se aseguró de tener detalles perfectos del fondo. La imagen de la derecha, de Midjourney, parece más ajetreada, con una mezcla de humanos y robots y un callejón más amplio y vibrante lleno de reflejos de luces de neón. Si bien ambas imágenes muestran músicos futuristas en callejones iluminados con neón, la de Dall-E parece más de otro planeta, y la de Midjourney tiene una mezcla de vibraciones actuales y futuras.
Retratos
Inmediato:Una mujer mayor con cabello plateado atado en un moño, con gafas vintage y bordando un patrón colorido.
Estas dos imágenes captan de forma hermosa a una mujer mayor trabajando en su bordado. La imagen Dall-E 3 de la izquierda muestra a una mujer con unas llamativas gafas vintage y el pelo plateado recogido en un moño. Está trabajando en un patrón vibrante. El ambiente es refinado, con una iluminación suave que resalta sus rasgos. La imagen de la derecha, de Midjourney, parece más espontánea, ya que la mujer lleva unas gafas más informales de montura negra y está vestida con una blusa colorida.
Ambas imágenes enfatizan el arte del bordado, pero el Dall-E 3 se inclina hacia la elegancia mientras que el Midjourney se siente acogedor y auténtico.
Arte de píxeles
Inmediato:Un mago lanzando un hechizo, con partículas mágicas y un libro de hechizos flotante, sobre un fondo de bosque encantado pixelado.
A la izquierda, Dall-E 3 ofrece una imagen pixelada de un fondo de bosque con el mago envuelto en un manto azul profundo y un sombrero alto, que replica el estilo de los videojuegos de la vieja escuela. Se pueden ver las partículas mágicas arremolinándose a su alrededor y el libro de hechizos flotante, que está completamente abierto y muestra sus páginas brillantes.
Ahora, a la derecha, Midjourney pinta un cuadro más realista. El mago es retratado como un hombre joven, de aspecto intenso, profundamente absorto en el acto de lanzar hechizos. Las partículas mágicas son vívidamente visibles, rodeando el libro de hechizos con forma de orbe brillante que sostiene. Si bien el fondo del bosque es evidente, no está pixelado como lo había pedido el mensaje.
Si bien ambas imágenes representan brillantemente a un mago lanzando un hechizo, solo Dall-E 3 logró el detalle “pixelado”.
Arte surrealista
Inmediato:Una mariposa de gran tamaño que lee un libro a un círculo de pequeños elefantes atentos en una isla flotante.
Ambas imágenes se crearon a partir del mismo tema, pero representan escenas muy diferentes. La imagen de Dall-E 3 es vibrante y divertida, y muestra una mariposa con cabeza de elefante que lee un libro a pequeños elefantes en una tierra flotante.
Por otro lado, la imagen de Midjourney tiene un aire de jungla encantada con una isla gigante de elefantes y muchos elefantes pequeños realizando diferentes actividades. Pero la versión de Midjourney carece del elemento central de la “mariposa de gran tamaño”.
Diseño plano
Inmediato:Una postal minimalista que muestra la esencia de Tokio a través de siluetas icónicas como la Torre de Tokio, un rollo de sushi y una rama de flor de cerezo.
Ambas imágenes capturan la esencia de Tokio a través de la Torre de Tokio, el sushi y los cerezos en flor. La versión de Dall-E 3 es vibrante, mostrando un paisaje urbano detallado y un rollo de sushi contra un fondo brillante, y los cerezos en flor son exuberantes.
Por el contrario, Midjourney tiene un enfoque tranquilo y minimalista con una paleta de colores pastel, estructuras simplificadas y menos flores de cerezo.
Si bien ambas creaciones incluyen los elementos solicitados, Dall-E 3 agrega elementos adicionales como un río y un puente. En cuanto a la calidad, la imagen de Dall-E es más rica en detalles, mientras que la de Midjourney prioriza la simplicidad y el espacio abierto.
3DRepresentaciones
Inmediato:Un colgante de dragón de jade con ojos de rubí, renderizado en 3D y detallado, suspendido en una delicada cadena de plata sobre un fondo de terciopelo.
El colgante de Dall-E (a la izquierda) combina muy bien con el aspecto de “jade” con su color verde y tiene ojos de color rojo rubí, pero la cadena de plata parece más gruesa de lo esperado. El fondo parece terciopelo.
El colgante de Midjourney (a la derecha) no se parece tanto al jade y tiene un tacto más metálico, pero sus ojos de rubí son prominentes. La cadena aquí es más detallada y el fondo es completamente oscuro. En comparación con el mensaje, la imagen de Dall-E se alinea mejor con los detalles de “jade” y “fondo de terciopelo”, mientras que Midjourney logra el aspecto de “cadena plateada”.
Ilustración digital
Inmediato:Una ilustración digital de un gato travieso que intenta sacar un pez de una pecera mientras un loro cercano grita una advertencia.
En ambas imágenes se ve a un gato intentando sacar un pez de una pecera con un loro cerca. En la imagen de Dall-E 3 de la izquierda se ve a un gato de rayas grises tocando tranquilamente el agua y el loro simplemente observando.
En la imagen de Midjourney de la derecha, el gato parece sorprendido y no hay ningún loro. La imagen de Dall-E tiene más detalles y textura, lo que le da un aspecto más pulido. La imagen de Midjourney parece apresurada y tiene un entorno más oscuro con elementos faltantes.
Pintura al óleo
Inmediato:Un marinero solemne perdido en sus pensamientos, sosteniendo una vieja brújula, con el mar tumultuoso y las nubes de tormenta al fondo.
La imagen de la izquierda, realizada por Dall-E 3, muestra a un marinero mayor que parece pensativo con un mar tormentoso detrás de él. La de la derecha, realizada por Midjourney, muestra a un marinero más joven que mira hacia un mar más tranquilo. Ambas imágenes coinciden con el tema, pero la de Dall-E parece más cercana debido al fondo más tormentoso. La calidad de la imagen es buena en ambas, pero transmiten diferentes sensaciones: una da la sensación de recordar aventuras pasadas y la otra da la sensación de prepararse para una nueva.
Diorama
Inmediato:Una escena de carnaval en miniatura, con una noria en funcionamiento, pequeños visitantes disfrutando de algodón de azúcar y un payaso haciendo malabarismos con orbes brillantes en estilo diorama.
Ambas imágenes muestran escenas de carnaval en miniatura con norias. La imagen de la izquierda, de Dall-E 3, muestra a los visitantes con algodón de azúcar y a un payaso haciendo malabarismos con orbes brillantes, lo que encaja bien con el mensaje. La imagen de la derecha, de Midjourney, tiene un aire nocturno y diseños más complejos, pero no muestra a los visitantes con algodón de azúcar ni al payaso haciendo malabarismos. Si bien ambas imágenes tienen buena calidad, la imagen de Dall-E se alinea más con los detalles del mensaje, mientras que la de Midjourney ofrece una visión única, pero los visitantes diminutos no son tan claros.
Arquitectura
Inmediato:Una extravagante biblioteca en una casa en el árbol con escaleras de caracol, linternas colgantes y balcones llenos de libros.
La imagen de la izquierda, de Dall-E 3, es más de fantasía, con muchos detalles, faroles y una casa en el árbol más grande. La imagen de la derecha, de Midjourney, parece más real, con menos habitaciones y faroles. Ambas imágenes captan la idea de una “biblioteca en la casa del árbol” con escaleras de caracol y balcones con libros. Ambas siguen bien el mensaje.
Sin embargo, la imagen de Dall-E tiene una sensación más onírica con su brillo verdoso, mientras que la de Midjourney parece ambientada en la noche y se siente más acogedora.
Ambas imágenes son de alta calidad, pero la elección entre ellas es si prefieres un aspecto más mágico o realista.
Diseño de interiores
Inmediato:Un dormitorio bohemio con una hamaca, tapices en las paredes, un espejo de mosaico y plantas colgando del techo.
Ambas imágenes reflejan la atmósfera de un dormitorio bohemio. La imagen de Dall-E (a la izquierda) es colorida y tiene estampados, un asiento tipo hamaca, tapices transparentes y muchas plantas colgantes, pero le falta un espejo de mosaico.
La imagen de Midjourney (a la derecha) es más clara y espaciosa, con plantas y un tapiz de encaje, pero su cama no tiene estilo hamaca y no hay ningún espejo de mosaico visible.
Si bien ambas imágenes tienen elementos boho y plantas colgantes, ninguna coincide completamente con el mensaje, especialmente con respecto al espejo de mosaico y la descripción exacta de la hamaca.
Indicaciones de alto contexto
Inmediato:Un taller de herrería durante el Renacimiento, con herramientas detalladas, una forja resplandeciente, intrincadas piezas de armadura y un artesano trabajando.
La imagen de la izquierda, de Dall-E, muestra a un herrero, herramientas ordenadas y una armadura resaltada. La de la derecha, de Midjourney, muestra a varias personas, herramientas dispersas y una atmósfera animada. Si bien ambas representan el taller, la imagen de Dall-E se centra en un solo artesano y sus herramientas, y la de Midjourney da la impresión de un día ajetreado con varios trabajadores.
Indicaciones de contexto bajas
Inmediato:Un baile a la luz de la luna
Ambas imágenes muestran una “danza a la luz de la luna”. La imagen de la izquierda, de Dall-E, tiene un tono azul vibrante con siluetas de bailarines contra una gran luna, mientras que la de Midjourney, a la derecha, ofrece una mirada más cercana y detallada a los bailarines con un brillo lunar más sutil. Dall-E se centra en el entorno y los contrastes, y Midjourney resalta las emociones de los bailarines. Ambas capturan el tema de la danza a la luz de la luna, pero en diferentes estilos.
El espectáculo más espectacular: Midjourney vs Dall-E 3
Después de evaluar 16 imágenes generadas por IA de Dall-E 3 y Midjourney, es evidente que Dall-E 3 se destaca en la captura de detalles intrincados. Esta plataforma también supera a Midjourney en la interpretación de la intención de las indicaciones para generar imágenes relevantes. Por otro lado, Midjourney tiene una ventaja en la creación de imágenes que parecen reales. Si bien Dall-E 3 apunta a la perfección, a veces puede producir imágenes menos naturales.
Para las empresas que buscan detalles en sus imágenes de IA, Dall-E 3 podría ser la opción más adecuada. Puede acceder a él a través de ChatGPT Plus y también en Photosonic, el mejor generador de imágenes de IA, muy pronto. OpenAI planea lanzar la API de Dall-E 3 pronto, convirtiéndola en una función integrada en Photosonic.
Preguntas frecuentes
1. ¿Es Midjourney mejor que DALL-E 3?
En realidad, no se trata de que uno sea “mejor” que el otro. Tienen diferentes estilos y capacidades. DALL-E 3 está integrado con ChatGPT Plus y es parte del paquete que se incluye con GPT-4. Midjourney, por otro lado, puede ofrecer variaciones en sus representaciones. Se trata más de sus preferencias personales y del estilo que está buscando.
2. ¿DALL-E 3 es gratuito?
No, DALL-E 3 no es gratuito. Viene incluido en ChatGPT Plus, que cuesta 20 USD al mes. Esta suscripción también te otorga acceso a GPT-4.
3. ¿Qué es más barato, DALL-E 3 o Midjourney?
Si nos fijamos estrictamente en las cifras, Midjourney tiene un precio inicial más económico de 10 dólares al mes. DALL-E 3 incluye ChatGPT Plus, cuyo precio es de 20 dólares al mes. Por lo tanto, si el presupuesto es un factor clave, Midjourney podría ser la opción más rentable.
¿Te gusta lo que lees? Comparte con un amigo Aishwarya Gindham Redactora de contenido en WriteSonic a quien le encanta escribir contenido extenso con detalles y ejemplos. Su objetivo es ayudar al lector a encontrar una solución a su problema.
No responses yet