Was ist Dall-E? – Funktion, Prompts und Beispielbilder

Stellt euch vor, ihr könntet jedes Bild, das euch in den Sinn kommt, in Sekundenschnelle erstellen, und zwar nur mit ein paar Worten. Genau das ermöglicht Dall-E (Webseite von Dall-E besuchen), eine generative Bild-KI von OpenAI. Diese von machine-learning-gestützte Technologie hat die Welt der digitalen Kunst und des Designs in den letzten Monaten ziemlich auf den Kopf gestellt und ich nehme an, das wird auch in den kommenden Jahren so weitergehen.

Mac-Tipp: Große Dateien finden und löschen mit Daisy Disk (Werbung)

In einer Zeit, in der künstliche Intelligenz immer mehr Bereiche unseres Lebens berührt, stehen Dall-E und andere Bild-KIs an der Spitze dieser Entwicklung und zeigen uns, wie weit schon jetzt die Grenzen der Kreativität verschoben werden können.

Kapitel in diesem Beitrag:

1 Entwicklung und Funktion von Dall-E
2 Versionen von Dall-E
3 Vergleich mit anderen Bild-KI-Tools
4 Dall-E vs. Midjourney
5 Anwendungsbereiche von Dall-E
6 Dall-E 3 – Die neueste Version
7 Nutzung von Dall-E über ChatGPT
8 Beispiele für Bilder und Prompts mit Dall-E
9 Bild 1 – Portrait
10 Bild 2 – Abstrakte Kunst
11 Bild 3 – Comic
12 Bild 4 – Surreale Landschaft
13 Bild 5 – Gemälde
14 Grenzen und Herausforderungen von Dall-E
15 Meine Schlussfolgerung
16 Ähnliche Beiträge
17 Qi2-Ladegerät mit Lüfter: Perfekt für den Sommer oder kompletter Quatsch?
18 Soundcore AeroClip: Open-Ear-Kopfhörer mit offenem Ring-Design
19 Mit MagSafe und Qi2: Pitaka Powerbank fürs iPhone ausprobiert
20 Was ist eine „virtuelle Softwarekarte“ auf der Nintendo Switch?
21 iVANKY Fusion Dock Pro 3 – 11-in-1 Thunderbolt 5 Dock günstiger kaufen
22 Mac-Hilfe: Bluetooth deaktiviert und Maus / Trackpad lässt sich nicht mehr nutzen
23 Manus – KI-Agent für komplexe Aufgaben (+ Open-Source-Alternative)
24 Europäischer Suchindex: Ecosia und Qwant arbeiten an Google-Alternative

Entwicklung und Funktion von Dall-E

Dall-E wurde von OpenAI, dem gleichen Team, das auch hinter dem bekannten Sprachmodell GPT-4 und dem Chatbot ChatGPT steht, entwickelt. Diese KI nutzt fortschrittliche Algorithmen, um aus Textbeschreibungen visuelle Kunstwerke zu generieren. Dabei ist das Besondere an Dall-E, dass es nicht einfach vorhandene Bilder zusammenfügt, sondern basierend auf der Texteingabe komplett neue Bilder erschafft. Dies reicht von einfachen Objekten bis hin zu komplexen Szenen und Charakteren.

Die Bandbreite und Vielseitigkeit von Dall-E machen es zu einem mächtigen Werkzeug für Designer, Künstler und jeden, der kreative Ideen visuell umsetzen möchte. Diese Fähigkeit, aus Worten Bilder zu schaffen, eröffnet nicht nur neue kreative Möglichkeiten, sondern stellt auch eine beeindruckende technologische Errungenschaft dar.

Hier sieht man einen Auszug von den Werken, die man auf der Webseite von Dall-E selbst findet.

Versionen von Dall-E

Hier ist eine Liste der verschiedenen Versionen von Dall-E mit ihren Veröffentlichungsdaten:

Dall-E (Erste Version): Veröffentlicht am 5. Januar 2021. Diese initiale Version von Dall-E stellte einen bedeutenden Fortschritt in der KI-gestützten Bildgenerierung dar.
Dall-E 2: Angekündigt am 6. April 2022. Dall-E 2 betrat am 20. Juli 2022 die Beta-Phase und wurde am 28. September 2022 für alle Benutzer geöffnet. Diese Version war darauf ausgelegt, realistischere Bilder in höheren Auflösungen zu generieren.
Dall-E 3: Veröffentlicht am 10. August 2023. Dall-E 3 wurde als eine Weiterentwicklung vorgestellt, die „deutlich mehr Nuancen und Details“ als die vorherigen Versionen verstehen konnte.

Diese Daten geben einen Überblick über die Entwicklung und Verbesserungen von Dall-E im Laufe der Zeit.

Anhand von diesem Beispiel sieht man, wie sich die Bildgenerierung von Dall-E 2 zu Dall-E 3 verbessert hat.

Vergleich mit anderen Bild-KI-Tools

Während Dall-E beeindruckende Fähigkeiten in der Generierung kreativer und oft surrealer Bilder besitzt, gibt es auch andere bemerkenswerte KI-basierte Bildgenerierungstools, die jeweils ihre eigenen Stärken haben.

Midjourney: Bekannt für fotorealistische Bilder und überlegene Bildkomposition und Ästhetik.
Artsmart.ai: Ermöglicht die Erstellung hochwertiger Bilder mit verschiedenen fortgeschrittenen Einstellungen.
Leonardo.ai: Spezialisiert auf Spielinhalte und bietet eine breite Palette an Funktionen.
Stability.ai DreamStudio: Nutzt die neuesten Stable-Diffusion-Modelle und ist ideal für experimentelle Kreationen.
Adobe Firefly: Bietet eine intuitive Benutzeroberfläche und ist für Adobe-Anwender optimiert.
Stockimg.ai und Supermachine: Ideal für die schnelle Generierung von Stockbildern.
BlueWillow by LimeWire: Bietet einzigartige Stile und eine benutzerfreundliche Plattform.
DALL·E 2 (OpenAI Labs): Eine frühere Version von Dall-E mit eigenen Merkmalen.
Neuroflash KI Bild Generator, Jasper Art, Canva Create, Craiyon, Photosonic, Nightcafé, Runway, ArtSpace.ai, Mindverse: Weitere Optionen, die jeweils ihre eigenen spezifischen Funktionen und Stärken haben.

Diese Tools unterscheiden sich von Dall-E in Bezug auf Bildqualität, Anwendungsbereiche, Benutzerfreundlichkeit und spezifische Funktionen. Während Dall-E sich ideal für kreative und imaginative Bilder eignet, bieten andere Tools Vorteile in der Erstellung fotorealistischer Bilder, der Verarbeitungsgeschwindigkeit oder in speziellen Anwendungsbereichen wie Spielinhalte oder Stockfotos.

Dall-E vs. Midjourney

Ich konnte in der Vergangenheit sowohl Dall-E als auch Midjourney nutzen und habe dabei folgende Erfahrung gemacht: Midjourney liegt in jedem Fall vorne, wenn es darum geht, fotorealistische Ergebnisse zu erzielen. Sobald ich etwas erzeugen möchte, das realistisch aussehen soll, nutze ich Midjourney.

Dall-E hat seine Stärken aus meiner Sicht bei zwei Punkten:

Es „versteht“ den Prompt sehr gut und man kann gut Thumbnails für YouTube oder Bilder für Blogbeiträge erstellen. Vor allem, wenn auch Text im Bild vorhanden sein soll, dann ist Dall-E sehr gut. Midjourney hat mit Version 6 zwar nachgelegt, aber ich setze oft auf Dall-E, wenn es um Text im Bild geht.
Wenn man ein Bild nach und nach in Kooperation mit ChatGPT entwickeln will, dann geht das mit ChatGPT Plus und Dall-E extrem gut. Ich sage ChatGPT, was ich für ein Bild benötige und er erstellt mir ein Bild. Dann erkläre ich ihm, was anders sein soll und er passt den Prompt im Hintergrund an. So komme ich nach und nach immer näher an mein Wunschergebnis und muss dabei nicht selbst am Bild-Prompt werkeln. Die Arbeit übernimmt ChatGPT.

Es kommt aber immer auf den Einzelfall an, welches Tool das geeignetere ist. In Leonardo.ai habe ich nur wenig Erfahrungen bisher sammeln können, aber es hat mich auch noch nicht so von den Socken gehauen, wie Midjourney, was die Ergebnisse betrifft.

Hier aber nun ein Beispiel von einem fotorealistischen Bild in Dall-E und Midjourney. Der Prompt lautet:

A photorealistic portrait of a cyborg, blending human features with subtle mechanical elements, highlighted by a luminous, intelligent gaze.

Und hier ist das Ergebnis von Dall-E 3:

Und das Ergebnis von Midjourney (V 6.0 alpha):

Der Cyborg – generiert von Midjourney V 6.0 alpha.

Anwendungsbereiche von Dall-E

Dall-E bietet vielfältige Anwendungsmöglichkeiten in verschiedenen Bereichen:

Architektur und Innenraumgestaltung: Schnelle Visualisierung von Gebäuden und Innenräumen.
Werbung und Marketing: Erstellung einzigartiger und kreativer Kampagnenbilder.
Bildung und Lehre: Generierung anschaulicher Lernmaterialien und Illustrationen.
Kunst und Design: Erschaffung einzigartiger Kunstwerke und Designelemente.
Unterhaltung: Entwicklung von Charakterdesigns und Szenarien für Videospiele und Filme.
Logo- und Markendesign: Kreation von Logos und Markenbildern.
Modellierung und Simulation: Unterstützung bei der Erstellung von 3D-Modellen und Umgebungen.

Diese Beispiele zeigen, wie Dall-E die Kreativität und Effizienz in verschiedenen Bereichen revolutionieren kann, von der Kunst bis zur Technik.

Dall-E 3 – Die neueste Version

Dall-E 3 ist die aktuellste und fortschrittlichste Version dieser KI-gestützten Bildgenerierungstechnologie. Diese Version bietet verbesserte Funktionen und eine höhere Präzision bei der Bildgenerierung. Zu den Neuerungen gehören eine gesteigerte Fähigkeit zur Erstellung detaillierterer und komplexerer Bilder sowie verbesserte Algorithmen, die eine noch genauere Umsetzung von Textbeschreibungen in visuelle Inhalte ermöglichen.

Dall-E 3 setzt neue Standards in der KI-gestützten Bildgenerierung und erweitert die Grenzen dessen, was in Sachen digitaler Kreativität möglich ist. Informationen zu Verfügbarkeit und Kosten sind dabei für Interessierte besonders relevant.

Eine der Stärken von Dall-E 3 ist das Verständnis des Prompt, so dass man auch einzelne Bildelemente näher beschreiben kann. — Eine der Stärken von Dall-E 3 ist das Verständnis des Prompt, sodass man auch einzelne Bildelemente näher beschreiben kann.

Leider scheint Dall-E aber nicht auf Anhieb zu verstehen, was man meint, wenn man diesen Prompt gibt:

A photorealistic portrait of a cyborg, blending human features with subtle mechanical elements, highlighted by a luminous, intelligent gaze.

Das Ergebnis sieht in Dall-E 3 so aus:

Leider nicht bestanden: Eine kleine rote Kugel neben einer großen blauen Pyramide auf einem größeren grünen Würfel.

Bei Midjourney kam das hier raus:

Bei Midjourney ist von den 4 Bildern nur das links unten richtig. Ausser, dass er noch eine blaue Kugel dazu erfunden hat. — Bei Midjourney ist von den 4 Bildern nur das links unten richtig. Außer, dass er noch eine blaue Kugel dazu erfunden hat.

Nutzung von Dall-E über ChatGPT

Die einfachste und effektivste Art, mit Dall-E zu arbeiten, ist derzeit über ChatGPT. Diese Methode bietet den Vorteil, dass ChatGPT nicht nur dabei hilft, die Textbeschreibungen (Prompts) für Dall-E zu formulieren, sondern diese auch direkt an Dall-E weiterleitet. Dieser integrierte Ansatz macht den Prozess der Bildgenerierung besonders benutzerfreundlich und effizient.

Benutzer müssen sich bei OpenAI anmelden und können dann über die ChatGPT-Schnittstelle auf Dall-E zugreifen, wobei die Qualität der Ergebnisse stark von der Genauigkeit und Kreativität der eingegebenen Prompts abhängt.

Tipp: Wenn man sehen möchte, welcher Prompt aktuell an Dall-E geht, dann frage in ChatGPT einfach „Wie sieht der Prompt genau aus, der aktuell an Dall-E geschickt wurde?“

Hier sieht man die Kommunikation mit Dall-E über ChatGPT, um ein Bild zu erzeugen.

Beispiele für Bilder und Prompts mit Dall-E

Folgende Bilder habe ich erstellt, indem ich ChatGPT nach ein paar Ideen gefragt habe, die zeigen, wie vielseitig die Bild-KI ist. Aus den Ideen hat ChatGPT dann die Prompts erstellt, mit denen die Bilder erzeugt wurden. Und ihr findet hier nun, was dabei rausgekommen ist.