KI richtig nutzen: Stephan Wiesners Prompt-Formel verstehen und einordnen

KI-Bildgenerierung funktioniert genauso schlecht wie KI-Textgenerierung, wenn man dem KI-Werkzeug zu ungenaue Vorgaben mache. Das ist scheinbar eine triviale Erkenntnis, aber wie macht man nun die genauen Vorgaben so, dass man ein einigermaßen berechenbares Ergebnis bekommt? Stephan Wiesner erklärt in einem kurzen Video, worauf man zu achten hat. Selten habe ich in so kurzer Zeit, so prägnant beschrieben bekommen, worauf es bei einem guten Prompt ankommt. Deshalb lohnt sich das Video und diese einordnende Zusammenfassung, wenn man in Zukunft mehr gute Ergebnisse bekommen möchte.

Stephan Wiesner verspricht in seinem Video nicht weniger als einen Kompetenzsprung: Wer seine Methode versteht, soll „besser als 90 % der User“ mit KI arbeiten können. Das sind eine steile These – Weiterlesen

Generative Bild-KI mit Nano Banana: Revolution der Bildbearbeitung?

Mit nano banana erzeugt und modifiziert

Mit nano banana erzeugt und modifiziert

Die sogenannte digitale Welt diskutiert aktuell ein Thema, das sprichwörtlich neue Bilder im Kopf entstehen lässt: Mit „Nano Banana“ geht eine neue Generation generativer Bild-KIs an den Start, die die Art der Bildbearbeitung und der visuellen Kommunikation grundlegend verändern könnte. Google DeepMind präsentiert mit Nano Banana (offiziell „Gemini 2.5 Flash Image“) einen Bildeditor, der nicht nur Bilder generieren, sondern ziemlich gut bestehende Fotos modifizieren, das heißt, verändern kann – und dies auf einem Niveau, das bislang scheinbar nur mit aufwendigen Experten-Workflows und teurer Spezialsoftware möglich war. So sieht man es wenigstens bei Heise ...


Was ist generative Bild-KI eigentlich – und warum ist das so wichtig?

Generative Bild-KI ist die Kombination aus „Bilder schaffen“ (generieren) und „Bilder verändern“ (modifizieren): Nutzer geben einen sogenannten Prompt, also eine Aufforderung vor – zum Beispiel ein Stimmungsbild oder eine konkrete Anweisung – und die KI erstellt daraus entweder ein komplett neues Bild oder manipuliert ein existierendes Motiv gezielt nach Wunsch.
Frühere Bildgeneratoren erzeugten zwar schon spektakuläre Ergebnisse, doch die Bearbeitung bestehender Fotos geriet oft ins Surreale. Mit Nano Banana ist die Verschmelzung beider Ansätze gelungen: Figuren, Outfits, Hintergründe, ja sogar Licht und Schatten werden so angepasst, dass die Motive ihren Charakter behalten – selbst nach mehreren Bearbeitungsdurchgängen.


Nano Banana: Warum hat dieses Tool im Moment die Nase vorn?

Das neue Modell von Google wird direkt aus der Gemini-App angesteuert und setzt in Sachen Fotorealismus, Konsistenz und Geschwindigkeit neue Maßstäbe. Nano Banana bietet unter anderem:

  • Prompt-basierte Generierung und Bearbeitung: Du kannst neue Bilder schaffen oder vorhandene realistisch verändern, fast ganz ohne Expertenwissen, die solltest aber wissen, was im Bild geändert werden soll. Es ist also hilfreich Fachbegriffe wie z.B. „golden hour“ zu kennen, aber es geht auch ohne, wenn man sich präzise ausdrücken kann.

  • Iteratives Multi-Turn-Editing: Mehrstufige Bearbeitungen sind möglich, ohne dass Gesichter oder Objekte allzu unnatürlich mutieren. Man arbeitet also Schritt für Schritt und ändert Outfit oder Umgebung von Personen auf den Bildern ab, ohne das die Personen allzu stark anders aussehen. Man darf es aber nicht übertreiben, mit jedem Bearbeitungsschritt, wird das Hauptmotiv etwas unschärfer.

  • Vielfältige Anwendungsfälle: Bewerbungsfotos, Produktvisualisierungen, virtuelle Outfit-Tests, Marketingentwürfe – alles innerhalb weniger Minuten umsetzbar, wenn auch nicht direkt verwendbar. Ich würde deshalb nicht von perfekt sprechen, denn es klappt besser als erwartbar und da man jederzeit mit einem neuen Prompt und guten Ausgangsbildern loslegen kann, ist das Unschärfe-Problem bei allzu vielen Iterationen händelbar.

Nano Banana ist kostenlos für Nutzer von Gemini verfügbar und arbeitet, wie vom Verbraucherschutz gefordert, mit sichtbaren wie unsichtbaren Wasserzeichen, um KI-erzeugte Bilder als solche auszuweisen.


Neue Chancen und damit Demokratisierung der Bildbearbeitung?

Was ehemals Designagenturen und Photoshop-Experten vorbehalten war, liegt jetzt als Power-Tool in der Hand von „jedermann und jeder Frau“:

  • Einfachheit ersetzt komplexe Software – es braucht weder Vorwissen noch Einarbeitung in Profi-Programme, um sofort loslegen zu können. Gut ist derjenige oder diejenige, die mit gutem Deutsch oder Englisch genau sagen können, was sie wollen, was nicht unbedingt dieselben sind, die gut mit Fachbegriffen der Bildbearbeitung hantieren können. Wenn du den folgenden Prompt auf ein passendes Bild anwenden lässt, dann wird Nano Banana versuchen, dass auch umzusetzen.

Ersetze das Bild der Frau auf der Hauswand, setze in die Mitte der Hauswand den Text „Ferrari Schrottplatz“ in einer 20er-Jahre Schrift, mit Neoneffekt , sodass es realistisch in die Szene passt. Außerdem soll es Nacht sein.

Weiterlesen

Anti-Anti-Lumumba Glosse

Lumumba auf deutschen Weihnachstmarkt

Lumumba auf deutschen Weihnachstmarkt

„Schatten über dem Weihnachtsmarkt: Das ist kein Kakao“

In der von Charles Dickens sind es Geister, die dem Hauptcharakter ins Gewissen reden. Der Geist steht hierbei für das Verdrängte, der Geist ist ein Schatten, der zum Erinnern ermahnt, der uns auch Abgründe eröffnet: Abgründe wie starke Schokoladengetränke auf einem Weihnachtsmarkt, Kakao mit Schuss, „Lumumba“ auch genannt.

Vergesst die Weihnachtsstimmung, wenn ihr an der heißen Schokolade nippt! Denn laut taz sind diese Becher nicht einfach nur dampfende Becher süßer Genüsse, nein, sie sind Manifestationen des kolonialen Schattens, der über unseren Weihnachtsmärkten schwebt. Weiterlesen

ChatGPT und der Zugriff auf das aktuelle Internet

Die Sendung Scobel vom 2.3.23 war sehr interessant, aber an einer Stelle wurden die Zuschauer unvollständig informiert. Angeblich kann ChatGPT nicht auf das aktuelle Internet zurückgreifen, um Infos zu liefern. Diese Behauptung findet sich recht häufig in Berichten über ChatGPT; angeblich kann ChatGPT nur auf Daten zugreifen, die vor 2021 (einschließlich) irgendwo im Netz dokumentiert wurden. Der Bot nutzt das aktuelle Netz durchaus, man muss ihn nur dafür einen Weg aufzeigen.

Das ChatGPT mit veralteten Daten arbeitet, stimmt nicht, obwohl selbst ChatGPT oft etwas anderes behauptet. Prompt: „Angela Merkel Gomera“. ChatGPT schreibt dann Weiterlesen