In diesem Beitrag möchte ich einmal die Unterschiede in der Bilderstellung durch KI von ChatGPT (DALL-E) vs. Midjourney aufzeigen.
Unterschiede der Bilderstellung durch KI: ChatGPT (DALL-E) vs. Midjourney
Im vorherigen Beitrag „Bilder durch KI erstellen lassen“ zur habe ich ja schon die gravierenden Unterschiede der Versionen 1 bis 5 vorgestellt. Heute soll es um den Vergleich der Bilderstellung durch ChatGPT / DALL-E und Midjourney gehen. Um es gleich vorweg zu nehmen: DALL-E hat kräftig zugelegt und erstellt nunmehr erstaunlich schöne Bilder.
Midjourney erstellt zwar noch schönere Bilder, aber der Unterschied ist seit neuestem bei weitem nicht mehr so extrem, wie noch vor einigen Monaten. Zudem kommt, dass man mit der Bezahlversion von ChatGPT nun auch DALL-E in der ChatGPT-Oberfläche nutzen kann. Wem die Qualität von ChatGPT/DALL-E ausreicht, der kann sich das Abo von Midjourney unter Umständen sparen.
Nehmen wir einmal das in meinem bestehenden Beitrag gewählte Thema für ein Bild zum Vergleich: Bild eines Mannes vor einem Baum. Die Anweisung an die beiden KI’s sind diese: „Erstelle ein Bild eines Mannes vor einem Baum im Format 16:9“.
Zum jetzigen Zeitpunkt (05.01.2024) erstellt DALL-E über ChatGPT dieses Bild:
(Anmerkung in der Oberfläche von ChatGPT wird EIN Bild erstellt, wenn man direkt auf DALL-E die Eingabe macht, dann werden 4 unterschiedliche Versionen generiert.)
Midjourney dagegen erstellt immer 4 Versionen, die wie folgt ausschauen:
Mir persönlich gefällt kein einziges Bild, das durch die KI Midjourney erstellt wurde so richtig, weil der Mann kaum zu erkennen ist, oder wie ein Kind aussieht. Hier ist mein persönlicher Favorit eindeutig DALL-E!
Ein weiterer Vergleich der Bilderstellung durch KI und der Unterschiede ChatGPT/DALL-E vs. Midjourney ist der folgende. Hier war bei beiden KI’s die Vorgabe: „Ein Bild eines herrlichen weißen Sandstrandes mit wunderschönen Palmen und herrlichem blauen Meer“ zu erstellen. Ebenfalls im Format 16:9.
Den Anfang macht wieder DALL-E im ChatGPT Dashboard:
Also hier würde ich sofort gerne Urlaub machen 🙂 Allerdings sieht das Bild etwas künstlich aus in meinen Augen, was mich aber nicht wirklich stört.
Der Fairnesshalber vergleiche ich ab hier nur jeweils das erste Bild von Midjourney, da ich ja auch die erste Version von DALL-E nehme. Hier die Version von Midjourney in der aktuellen Version 5.2:
Dieses Bild sieht für mich wesentlich natürlicher aus, wenngleich auch hier wieder mein persönlicher Favorit die Version von DALL-E ist. Aber Geschmäcker sind ja zum Glück verschieden.
Probleme hat die KI oftmals, wenn sie Finger von Menschen zeichnen soll. Also machen wir jetzt einmal den Vergleich und lassen beide KI’s eine Frau zeichnen, die am Laptop sitzt und mit den Händen auf der Tastatur tippt. Mal schauen, was dabei herauskommt…
Anweisung an die KI: Ein Bild einer Frau, die vor einem Laptop sitzt und mit den Fingern auf der Tastatur tippt. Format wieder 16:9
DALL-E:
Hier sieht man schön, dass die KI mit Gliedmaßen immer noch Probleme hat, aber auch die Tastatur des Laptops ist eine Katastrophe. Die Umgebung allerdings finde ich sehr gelungen, dafür, dass ich dazu ja keinerlei Informationen an die KI gegeben habe.
Jetzt schauen wir einmal, wie Midjourney die Aufgabe gelöst hat:
Auch hier sehen die Finger, insbesondere die Fingerhaltung schon merkwürdig aus. Die Umgebung ist eher etwas mystisch. Hiermüsste man der KI genauer beschreiben, was man von ihr gerne als Ausgabe hat. Dieses war die erste Version, ich möchte hier auch noch die zweite Version aufzeigen:
Hier sind die Gliedmaßen besser zu erkennen und haben eine bessere Fingerposition. Auch dieses Bild ist wieder sehr mystisch. Die anderen beiden Versionen übrigens auch. Die Frauen und Bilder sehen aber sehr fotorealistisch aus.
Ich habe jetzt einmal DALL-E angewiesen, eine andere Version des Bildes zu erstellen, weil mir die Tastatur und die Finger nicht gefielen. Hier meine Anweisung und das Ergebnis. Anweisung: Bitte eine weitere Version, wo man nicht so extrem die Tastatur sieht und die Frau auf dem Sofa komplett mit Gesicht zu sehen ist. Ergebnis:
Hier sind die Finger und das Laptop jetzt sehr viel besser gezeichnet. Entscheiden Sie selbst, welches Bild Ihnen besser gefällt. Ich würde mich für das letzte entscheiden, auch wenn die Dame etwas künstlich in meinen Augen ausschaut.
Jetzt schauen wir einmal, wie gut die KI Tiere zeichnen kann. Ein Vergleich einer Katze und eines Hundes der Bilderstellung durch KI und der Unterschiede ChatGPT/DALL-E vs. Midjourney zeige ich nachfolgend auf.
Hier werde ich schon etwas ausführlicher das gewünschte Bild beschreiben, da ich beide KI’s direkt vergleichen möchte und ihnen nicht so viel Ermessensspielraum geben will.
Als Anweisung erhalten beide KI diese: „Erstelle ein fotorealistisches Bild eines süßen Hundewelpen, der zusammen mit einem süßen Katzenbaby auf einer Wiese mit vielen Blumen und Gräsern spielt. Format 16:9“
Zuerst wieder das Ergebnis von DALL-E:
Aufgabe zu 100% erfüllt: Hundebaby und Katzenbaby auf einer Wiese mit Blumen und Gräsern. Hier ist sogar noch von der KI ein kleiner Vogel dazu gezeichnet worden, den man – wenn man ihn nicht haben wollte – als Anweisung in einer weiteren Version entfernen lassen könnte.
Midjourney hat genau die gleiche Anweisung erhalten. Da aber die erste Version von Midjourney nicht der Vorgabe entsprach, habe ich hier wieder alle 4 erstellen Bilder aufgezeigt. KEINES hat die Vorgaben eingehalten:
Die Bilder sind zwar alle extrem süß und realistisch, aber es ist entweder ein Katzenbaby oder ein Hundebaby, wobei der Hund nicht unbedingt ein Welpe sein muss.
Machen Sie doch einfach selbst einmal für sich den Test.
Mein Fazit und meine Empfehlung ist nach diesen Beispielen eindeutig ChatGPT bzw. DALL-E. Wie sehen Sie das? Schreiben Sie doch einmal in die Kommentare, welche KI die für Sie besseren Bilder erstellt hat. Ich bin sehr gespannt!
Ich hoffe, dass Ihnen dieser kleine Vergleich der Bilderstellung durch KI und die Unterschiede ChatGPT / DALL-E vs. Midjourney gefallen hat und Ihnen eine Entscheidungshilfe ist, welche KI Sie für die künftige Bilderstellung verwenden werden.
***
Bilder Vergleich der Bilderstellung durch KI und die Unterschiede: ChatGPT / DALL-E und Midjourney
Text Vergleich der Bilderstellung durch KI und die Unterschiede ChatGPT / DALL-E vs. Midjourney: Holger Korsten KI-Experte