Blog: Stable Diffusion auf dem Macbook

1. Dezember 2022

KI ist sicherlich eines der interessantesten Themenfelder der Informatik in den letzen fünf Jahren. Die Fortschritte in der Entwicklung und vor Allem die Sprünge in den letzten zwei Jahren sind enorm. Vor wenigen Jahren war einfache Spracherkennung noch ein großes Problem, das es zu meistern galt. Inzwischen schreiben KIs ganze Bücher, komponieren Songs, erstellen Bilder, 3D-Modelle oder inzwischen sogar Videoanimationen auf Knopfdruck mit ein paar wenigen Zeilen Text als Eingabe.

Sicher KI konnte Teile hiervon bereits viel früher, jedoch benötigte man dafür noch einen „Supercomputer“ und eine Menge Zeit. Inzwischen ist KI aber beim Heimanwender angekommen, es genügt der heimische PC oder eben das Notebook.

Stable Diffusion ist zur Zeit eine der besten Varianten um KI-Bilder zu erstellen. Hier fängt der Computer mit einem starken Bildrauschen an und verbessert das Bild bei jedem Durchlauf. Diese Verbesserung wird durch hinzufügen von weiterem Rauschen ermöglicht. Es wird also auf ein Bildrauschen immer wieder gezielt weiteres Rauschen (welches auf trainierten Modellen basiert) hinzugefügt. Am Ende erhält man ein fertiges Bild, so zumindest die extrem stark vereinfachte Erklärung.

DiffusionBee

Doch kommen wir zur Anwendung auf dem heimischen Gerät. Für alle Apple M1 betriebenen Geräte gibt es tatsächlich eine sehr einfache Lösung: DiffusionBee. Diese Software lässt sich einfach via One-Click-Installer installieren.

Nach der Installation müssen natürlich noch die Modelle heruntergeladen werden, hierfür werden einige GB an Speicher benötigt. Außerdem solltet ihr zum Erstellen neuer Bilder mindestens 12GB freien Arbeitsspeicher haben. Das Modell alleine benötigt 8GB Speicher während der Nutzung.

Startet man die Software, sieht man ein einfach aufgebautes Interface.

  • Text To Image:

    „Text zu Bild“

    Hier gebt Ihr Text ein, der euer Bild beschreibt. Also zum einen was auf dem Bild zu sehen sein soll, als auch eine genauere Beschreibung des Stils.

    Beispiel:
    „Very detailed. intricate, elegant, highly detailed. trending on artstation, digital art, by Stanley Artgerm Lau, WLOP, Rossdraws, James Jean, Andrei Riabovitchev, Marc Simonetti, Yoshitaka Amano/the crow“

  • Image To Image:

    „Bild zu Bild“

    Hier könnt ihr ein Bild als Vorlage verwenden. Außerdem könnt ihr weiterhin über Text genaue Aussagen zu dem gewünschten Bild definieren.

  • Inpainting:

    „Hineinzeichnen“

    Hier könnt Ihr neue Dinge in existierende Bilder hineinzeichnen oder die Bilder somit nur an bestimmten stellen verändern. Wenn also ein Bild bis auf einige Einzelheiten gut gefällt, lassen sich die Einzelheiten hier verbessern.

  • Outpainting:

    „Herumreichen“

    Hier könnt ihr die KI außerhalb eures Bildes malen lassen. Also kann hier z.B. das Bild erweitert werden.

  • History:

    „Verlauf“

    Hier werden alle Bilder hin einer Liste angezeigt und können von hier aus auch vergrößert oder gespeichert werden.

Einstellungen:

  • Num Images:

    Anzahl der zu erstellenden Bilder

  • Image Height:

    Höher der Bilder in Pixel

  • Image Width:

    Breite der Bilder in Pixel

  • Steps:

    Anzahl der „Schritte“, Je größer desto besser die Qualität aber so länger auch die Rechenzeit.

  • Batch size:

    Anzahl der „Schritte“, Je größer desto besser die Qualität aber so länger auch die Rechenzeit.

  • Guidance Scale:

    Der Einfluss / Das Gewicht der Texteingabe. Jed höher um so gewichtiger ist der Text.

  • Seed:

    Hier kann die Zufallszahl (Seed) von bereits erstellten Bildern eingefügt werden um Bilder zu reproduzieren.

Nach der Eingabe des Textes um das Bild so präzise wie möglich zu beschreiben klickt man einfach auf „Generate“. Und jetzt wird es wirklich beeindruckend. In wenigen Sekunden und selbst in höchsten Einstellungen, mehr dazu später, in maximal wenige Minuten ist das Bild erstellt. Die Finesse ist hier die richtigen Texteingaben zu finden. Um das zu erleichtern empfiehlt sich ein Besuch auf ArtHub.ai. Hier werden eine riesige Auswahl an Bildern mit den dazu verwendeten Einstellungen sowie Texteingaben publiziert. Man kann seine erstellten Bilder bei Bedarf ebenfalls auf ArtHub hochladen. Hier muss man sich dann lediglich noch anmelden. Ich bin begeistert und verängstigt zugleich.

Ich finde es interessant wie weit die Technik inzwischen gekommen ist. Auch das diese Technologie so gut wie jedem bei bedarf zugänglich ist, jedoch stellen sich hier auch viele Fragen.

  • Wie wirken sich solche Technologien auf die Kunst und ihre Künstler aus?
  • Welche Gefahren bergen solche Technologien.
  • Ist es sinnvoll diese Technik jedem unzensiert und vollumfänglich zur Verfügung zu stellen?

Prompt Vorlagen/Ideen

Negative Prompts

Hiermit lassen sich bestimmte Vorkommnisse in den Bildern Vermeiden. Z.B. zusätzliche Arme, Füße oder besonders verstörende Gesichter.

Beim erstellen von Figuren (meist Menschen)
out of focus, scary, creepy, evil, disfigured, missing limbs, ugly, gross, missing fingers, ugly, duplicate, morbid, mutilated, out of frame, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, bad anatomy, bad proportions, extra limbs, cloned face, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck
Allg. Verbesserungen
out of focus, disfigured, duplicate, mutilated, out of frame

Abschließende Worte

Abschließend lässt sich nur hoffen, dass die Menschheit mit den vielen neuen Technologien und daraus resultierenden Möglichkeiten verantwortungsvoll umgeht. Wie gefährlich es werden kann, wenn Menschen lange Weile haben und anfangen KI-Systeme zu trollen oder zu missbrauchen, hat die Vergangenheit bereits eindrucksvoll bewiesen.

Also viel Spaß beim Bilder erstellen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.

Kooperationen

Social Media

© NEXART Blog. All rights reserved.