Die KI-Schmiede OpenAI, die vor allem für ChatGPT bekannt ist, hat diese Woche ein paar neue Entwicklungen ihrer Bild- und Video-KIs demonstriert. Das DALL-E genannte Werkzeug zur Bilderstellung wurde um die Möglichkeit zur individuellen, textbasierten Nachbearbeitung von erzeugten Bildern erweitert. Das Sora genannte Tool für die Videoerstellung, welches noch nicht für die breite Öffentlichkeit verfügbar ist, wurde von ausgesuchten Personen getestet. Einerseits haben sie damit Szenen und Videos erstellt, die äußerst kreative Ideen vermitteln. Andererseits lassen sich die Videos auch mit den wirren Sachen vergleichen, die man im Halbschlaf zusammenträumt.
Kapitel in diesem Beitrag:
OpenAI DALL-E – Erstellte Bilder können multimodal bearbeitet werden
In einem Beispielvideo für die neuen Funktionen der Nachbearbeitung von Grafiken zeigt OpenAI vorerst die Bilderstellung mit DALL-E. Dabei wird von der KI ein Pudel verlangt, der mit einem Schild „Happy Birthday“ sagt. Die KI erstellt daraufhin das verlangte Bild und schmückt es mit weiteren Objekten, die man mit einer Geburtstagsparty in Verbindung bringen kann, aus.
Anschließend wird eines der beiden erstellten Bilder ausgewählt, ein Werkzeug zur Bearbeitung angeklickt und direkt auf dem Bild werden zwei Stellen an den Ohren des Hundes markiert. Per Texteingabe wird die KI dazu aufgefordert, dort Schleifen hinzuzufügen, was nach einiger Bearbeitungszeit umgesetzt wird. So kann auf eine komplett neue Bilderstellung verzichtet werden, wenn in einem Ergebnis nur ein-zwei verbessernde Details fehlen.
OpenAI Sora – Mehrere Beispielvideos für verschiedenste Anwendungszwecke
Auf dem YouTube-Kanal von OpenAI wurden und werden aktuell verschiedene Videos hochgeladen, welche die Möglichkeiten der Nutzung von Sora aufzeigen sollen. Neben einem Musikvideo von August Kamp, das Traumwelten mit Mustern und Effekten verbindet, gibt es eine Fantasie-Dokumentation namens „Beyond Our Reality“ von Don Allen Stevenson, die verschiedene Tier-Chimären zeigt.
Ein Video von Josephine Miller zeigt Menschen, die unter Wasser eine Glaskleidung tragen bzw. aus Glaskörpern bestehen. Und zuletzt gibt es ein Video von Paul Trillo, in dem Gold von einem Erd-Element zu einer Schallplatte wird und ins Welt fliegt. Alle Videos zeigen zwar eindrucksvoll auf, wie weit die KI bereits gekommen ist. Allerdings gibt es in jedem Video auch Elemente, Bewegungen, Kameraführungen, Glitches und andere Einzelfaktoren, welche das Material unwirklich und teils auch unangenehm wirken lassen.
Hier die Videos:
Meine Tipps & Tricks rund um Technik & Apple
Ähnliche Beiträge
Johannes hat nach dem Abitur eine Ausbildung zum Wirtschaftsassistenten in der Fachrichtung Fremdsprachen absolviert. Danach hat er sich aber für das Recherchieren und Schreiben entschieden, woraus seine Selbstständigkeit hervorging. Seit mehreren Jahren arbeitet er nun u. a. für Sir Apfelot. Seine Artikel beinhalten Produktvorstellungen, News, Anleitungen, Videospiele, Konsolen und einiges mehr. Apple Keynotes verfolgt er live per Stream.