Wie generiert ChatGPT Bilder?
ChatGPT 4 kann nun auch Bilder im Chat generieren. Hier ein kurzer technischer Einblick, wie das im Chat funktioniert.
ChatGPT begann sofort akribisch zu schreiben, aber was ist das?

Wer sich ein wenig mit Webentwicklung auseinandersetzt, kennt den Tag <img>. Dieser wird verwendet, um Bilder in eine Webseite einzufügen. Neben der Angabe der URL bzw. Position auf dem Server über den SRC-Tag (also z.B. <img src="bild.png"> gibt es die Möglichkeit, Bilder per (data:image/svg+xml;base64, xxx) einzufügen. Die Informationen werden statt der Position des Bildes in das <img src=""> geschrieben.
(data:image/svg+xml;base64, xxx)
data | der Hinweis, dass hier Daten folgen |
image/svg+xml | ein Bild im SVG-Format, das mit der Beschreibungssprache XML erstellt wird |
base64 | die Daten folgen in einem Format, das auch als reiner Text übertragen werden kann - das sind die Buchstaben im Screenshot oben |
So entsteht Buchstabe für Buchstabe ein Bild, das anschließend im Browser angezeigt wird. Hier ist ein einfaches Beispiel:
Als Text

Wird als data64 zu

Und als Bild schließlich zu diesem - beim Konvertieren ins PNG-Format wurden durch Interpolation und Antialiasing Fehlpunkte hinzugefügt.

Das bedeutet, dass ChatGPT durch Kenntnis des SVG/XML-Standards, der Bilderkennung und durch Wissen über einen Kreis und ein Quadrat ein Bild als kodierte Zeichenfolge generieren kann.