Das klingt einfach, aber …
Mein Wunsch: Ich lade ein Bild zu Gemini hoch, eigentlich zu “Nano Banana”, der Bilder KI von Google und lasse dann den Text “Info” einfügen.
Ich ziehe also das Bild in das Eingabefeld von Gemini.

Meine Anweisung: Kannst Du mittig unten den Text Info einfügen?

Das Ergebnis. Okay, meine Angaben waren nicht ausreichend. Das Info sollte sehr groß sein und vielleicht gelb oder orange sein. Das hatte Banana ja schon mal bei einem ähnlichen Bild, ohne Anweisung so gemacht. Die Aufgabe war jedoch erfüllt, also gehe ich an das Feintuning.
Meine Anweisung: Bitte groß und in gelb.

Na ja, von groß keine Spur, aber immerhin gelb. Ich mache also weiter.
Meine Anweisung: Bitte in 15-facher Größe.

Keine Änderung, Verwunderung.
Also noch einmal: Schrift in 3 rem. (Einfach mal, um zu sehen, ob etwas passiert.)

Nichts, es ändert sich nichts! Ha, da frage ich doch mal eine KI, wie ich das richtig als Anweisung formuliere.
Meine Frage: Wie kann ich eine Anweisung zur Schriftgröße machen.
Die Antwort, samt Erklärung.
Das Anpassen der Schriftgröße in einem KI-Bildgenerator ist oft ein bisschen wie „Raten mit Ansage“, da die Modelle keine festen Maßeinheiten wie Pixel oder Zentimeter kennen. Begriffe wie „3 cm“ oder „15-fache Größe“ versteht die KI eher als vage Tendenz, nicht als exakten Befehl.
Hier sind die effektivsten Wege, um die Schriftgröße zu steuern:
1. Relative Beschreibungen nutzen
Anstatt technischer Maße funktionieren beschreibende Adjektive oft besser:
- „Riesig“ / „Einnehmend“: „Schreibe ‘INFO’ in gigantischen Buchstaben, die fast die gesamte untere Bildhälfte ausfüllen.“
- „Dezent“: „Platziere das Wort ‘INFO’ winzig klein in der unteren Ecke.“
2. Vergleiche ziehen
Setze die Schrift in Relation zu Objekten im Bild:
- „Die Schrift soll so breit sein wie das Vorderrad des Motorrads.“
- „Das Wort ‘INFO’ soll von einem Bildrand bis zum anderen reichen.“
3. Layout-Begriffe verwenden
Manchmal hilft es, der KI zu sagen, welche Rolle der Text spielt:
- „Headline“ (Überschrift): Erzeugt meist großen, fetten Text.
- „Subtle Watermark“ (Dezentes Wasserzeichen): Erzeugt sehr kleine Schrift.
- „Banner-Größe“: Füllt die Breite des Bildes aus.
4. Den Stil definieren
Oft wirkt Schrift größer, wenn sie massiver ist:
- „Schreibe ‘INFO’ in extrafetter (ultra-bold) Sans-Serif-Schrift, die massiv und groß wirkt.“
Ein kleiner technischer Hinweis: Wenn du für ein Projekt wirklich exakte Maße brauchst (z.B. genau 3 cm für einen Druck), ist es meist stressfreier, das Bild ohne Text zu generieren und das Wort „INFO“ danach mit einem Grafikprogramm (wie Canva, Photoshop oder Paint) einzufügen. Dort hast du die volle Kontrolle über Schriftart und Millimeter.
Soll ich versuchen, das Wort noch einmal deutlich massiver und breiter über die Straße zu legen?
Ich tippe ein einfaches: Ja

Okay, groß und gelb, aber schön ist wirklich anders.
Mein Fazit, Bilder erstellen kann die KI mittlerweile, aber der Umgang mit Texten im Bild ist noch mangelhaft. Einzig das Entfernen von Texten scheint in 80–90 % aller Fälle zu funktionieren. Aber dann auch nur, wenn man den gesamten Text im Bild löschen will.
Ich habe dann also das Bild genommen und wie früher, den Text mit paint.net in das Bild eingefügt. Die KI hatte recht, es war stressfreier und führte zum Wunschergebnis.

