KI und Kunst

Ko-Kreation mit StableDiffusion: Das Buchcover

Mein ursprünglicher Plan war es, ein paar Zeichnungen zu meiner Kurzgeschichte von einer KI generieren zu lassen. Da sich aber die Kurzgeschichte als eine normale Geschichte etabliert hat – von der ich für diesen Essay nur das erste Kapitel veröffentliche –, finde ich die Idee, ein Buchcover zu gestalten, doch ansprechender. Hierfür arbeite ich mit der KI StableDiffusion.

Durch die Forschungsliteratur habe ich eine ungefähre Ahnung, wie genau die Prompts in solch ein Programm eingegeben werden müssen, um das gewünschte Ergebnis zu erhalten. Und an dieser Stelle tritt das erste Problem auf: Was das Schreiben betrifft, besitze ich gewisse Fähigkeiten und Vorstellungen, wie das Werk am Ende aussehen soll. Zwar habe ich durchaus auch visuellen ‚Geschmack‘, allerdings keine exakte Idee darüber, wie dick beispielsweise die Pinselstriche dargestellt werden sollen, wie das Bild ausgeleuchtet oder welche Brennweite verwendet werden soll. Hier ist es also zunächst nötig, genügend Inspiration zu sammeln, um gewisse Wünsche überhaupt erst entstehen zu lassen.

Was ich jedoch im Voraus in Bezug auf die Geschichte schon sagen kann, ist, dass es ein eher düsteres Cover mit neutralen bis dunklen Farben werden soll, die die Stimmung adäquat widerspiegeln. Nach einigen Überlegungen entscheide ich mich dazu, meine Protagonistin auf dem Buchcover abbilden zu lassen. Das Setting soll dabei die Großstadt sein, aus der sie stammt. Sie soll dabei im Mittelpunkt stehen, um sie herum viele Menschen, die allerdings nur verwischt zu sehen sind. Das soll symbolisch ihre Andersartigkeit, aber auch Einsamkeit, widerspiegeln, die sie aufgrund ihres KI-Seins erfährt. Aber auch der Fakt, dass sie im Buch die erste KI ist, die ‚erwacht‘, soll damit zum Ausdruck kommen.

Also starte ich zunächst gleich mit den wichtigsten Informationen zu meiner Idee und gebe, um bessere Ergebnisse zu erzielen, die Prompts auf Englisch (Sprachenauswahl spielt bei KIs eine wichtige Rolle) in das Programm ein: „young woman standing in a big city by night with blurry people walking by, in gloomy dark colours“. Das Bild, das generiert wird, sieht zu meiner Überraschung sehr gut aus und hat auch genau die Komponenten aufgegriffen, die ich angegeben habe. Allerdings finde ich den Stil, den ich dazu gewählt habe, nämlich 'sai-cinematic', nicht passend für das Thema und probiere mehrere Stile durch, unter anderem 'futuristic sci-fi' und 'sai-comic book', wobei der letztere Stil am meisten meinen Vorstellungen entspricht. Eine besondere Auffälligkeit ist dabei, dass, auch wenn ich mehrmals dieselben Prompts eingebe und mit dem gleichen Stil arbeite, immer ein ähnliches Bild mit nur leichten Änderungen generiert wird. Anders als erwartet, wird hier also nicht – wie bei ChatGPT – ein völlig anderer Vorschlag geliefert, sondern es wird mit ähnlichen oder gleichen Formen gearbeitet.

Während meiner Tests fällt mir aber noch eine andere Idee für ein Cover ein, der ich natürlich nachgehe. Statt der Protagonistin in Menschenform setze ich gezielt einen Roboter in Szene: Mit den Prompts “young woman who looks like a roboter in a big city at night surrounded by blurry people walking by, gloomy dark colours, big night sky” möchte ich die Uressenz der Protagonistin nicht leugnen. Gleichzeitig hoffe ich, mit einem Roboter auf dem Cover etwas mehr Aufmerksamkeit generieren zu können, als mit einem Menschen.

Was mit dem Programm nicht gut funktioniert, ist die Darstellung von Schrift, die ich mehrmals versuche. Mein gewünschter Titel, für den ich mir „I Am“ ausgesucht habe, lässt sich durch die Eingaben „with the words saying ‚I Am‘“, „the words ‚I Am‘ written on top of it“ oder „the title ‚I Am‘“ nicht abbilden, weshalb ich mich dazu entscheide, ihn selbst mit Paint hinzuzufügen. An dieser Stelle ist es wichtig zu erwähnen, dass andere Programme möglicherweise schon in der Lage sind, auch Text in Bildern zu generieren. Für die Schriftart möchte ich etwas, was den ‚menschlichen‘ und emotionalen Aspekt meiner Protagonistin unterstreicht, weshalb ich eine Schriftart wähle, die einer menschlichen Handschrift sehr nahekommt. Mit dem Cover hoffe ich also, sowohl die KI-Aspekte als auch die menschlichen Aspekte nach dem Erwachen der KI zu illustrieren, ohne dabei zu viel von der eigentlichen Geschichte vorwegzunehmen. 

 

Meinen Namen als Autor habe ich dabei bewusst weggelassen. Zum einen, da StableDiffusion offensichtlich eine Verwendung seiner Bilder ohne Angabe des Programmes nicht zulassen möchte. Zum anderen, da ich dieses Bild nicht gezeichnet habe. Natürlich würde es ohne meine Ideen, Vorstellungen und Prompt-Eingaben nicht existieren, aber ich wurde, meiner Einschätzung nach, in keiner Weise künstlerisch tätig, um es zu erstellen. Eher würde ich, wie auch schon die Autoren aus meinem Literaturkapitel, von einer Ko-Kreation sprechen. Meine Idee + meine Befehle = von der KI generiertes Werk.

Ehrlicherweise erleichtert mir die von StableDiffusion angegebene Wassermarke meine Einschätzung diesbezüglich. Für eine tatsächliche Veröffentlichung des Buches würde ich wahrscheinlich dennoch die Wassermarke ausschneiden und im Impressum erwähnen, dass das Cover teilweise KI-generiert ist. Diese Entscheidung entspring zum Teil meiner Eitelkeit, teilweise ist sie meiner ästhetischen Vorliebe geschuldet.

Die Arbeit mit StableDiffusion hat – zusammenfassend – deutlich schneller funktioniert als mit ChatGPT, was vor allem daran lag, dass ich schneller mit dem Ergebnis der KI zufrieden war. Beim Generieren von Bildern ist mein Anspruch dabei nicht so hoch, wie beim Generieren von Text, da ich nach meiner eigenen Einschätzung nicht malen oder zeichnen kann. Einzelheiten im Bild schätze ich als nicht so wichtig ein, wie bei einer Geschichte; und auch Emotionen müssen nicht so deutlich dargestellt werden. Letztlich konnte ich einen viel kleineren Aufwand bei der Prompteingabe bzw. generell bei dem gesamten Prozess bis hin zum gewünschten Ergebnis feststellen. Natürlich können die Ergebnisse von KI zu KI variieren – dies sind lediglich die Ergebnisse zu StableDiffusion.

Ein weiterer Gedanke während der Arbeit mit der KI war: Ist die Frage nach dem Autor eines Kunstwerks zum Ausstellen wichtiger als für ein Buchcover? Natürlich wird ein Buch auch distribuiert, aber nicht um des Covers willen, sondern wegen seines Inhalts. Und ist die Frage nach dem Autor bei ChatGPT folglich wichtiger? Ein Buch wird wegen der Geschichte gekauft, das Cover ist dabei oft lediglich ein Anreiz zum Kauf.

 

>> Weiter zu "KI und Sprechen"