KI-Influencer Prompt Engineering: Der vollständige Leitfaden für konsistente Charaktere
Inhaltsverzeichnis
Sie können in Sekunden ein wunderschönes KI-Bild generieren. Denselben Charakter über 200 verschiedene Bilder hinweg gleich gut aussehen zu lassen? Das ist die eigentliche Herausforderung. Der Unterschied zwischen einem gescheiterten KI-Influencer-Projekt und einem monetarisierbaren liegt fast immer in der Prompt-Engineering-Disziplin.
Nach dem Aufbau von Prompt-Workflows für Agenturen, die Dutzende von KI-Charakteren verwalten, haben wir den Prozess in ein wiederholbares System destilliert. Dieser Leitfaden vermittelt Ihnen dieses System von Grund auf.
Warum Freitext-Prompts bei Charakteren scheitern
Die meisten Menschen schreiben Prompts wie diesen:
Das funktioniert für Einzelbilder. Für einen Charakter, der in über 500 Bildern über Monate hinweg erscheinen soll, ist es eine Katastrophe. Hier ist der Grund:
- Mehrdeutigkeit erzeugt Variation. "Schöne junge Frau mit braunen Haaren" könnte eine Million verschiedener Gesichter erzeugen. Jede Generierung würfelt bei Augenform, Nasenbreite, Hautton, Kieferlinie und hundert weiteren Merkmalen.
- Keine Trennung der Bereiche. Wenn Ihre Charakterbeschreibung, Szenenbeschreibung und Stilanweisungen alle vermischt sind, verändert das Ändern einer Sache unvorhersehbar andere. Wollen Sie von einem Café zu einem Fitnessstudio wechseln? Sie könnten versehentlich die gesamte Beleuchtung und Farbpalette verschieben.
- Keine Wiederverwendbarkeit. Am Ende schreiben Sie den gesamten Prompt für jedes Bild neu. Der Charakter driftet mit jeder Iteration leicht ab, und nach 20 Posts betrachten Ihre Follower etwas, das wie fünf verschiedene Personen aussieht.
Die Lösung ist strukturiertes Prompting - behandeln Sie Ihren Prompt wie ein Formular mit definierten Feldern statt als Fließtext.
Die 9-Feld-Prompt-Struktur
Jeder KI-Influencer-Bild-Prompt sollte in genau 9 Felder aufgeteilt werden. Die ersten drei definieren den Charakter (und ändern sich nie). Die restlichen sechs definieren die Szene (und ändern sich mit jedem Bild).
1. Face
Gesichtsform, Hautton, Augenfarbe/-form, Nase, Lippen, Sommersprossen, Muttermale. Seien Sie äußerst spezifisch.
2. Hair
Farbe, Länge, Textur, Stil, Scheitelrichtung. Beschreiben Sie, wie das Haar im Verhältnis zu den Schultern fällt.
3. Body
Statur, Höheneindruck, markante körperliche Merkmale. Konsistent halten, aber nicht überbeschreiben.
4. Clothing
Oberteil, Unterteil, Schuhe, Accessoires. Ändert sich pro Bild, sollte aber im Stil des Charakters bleiben.
5. Style
Fotografiestil: editorial, street, candid, studio, lifestyle. Bestimmt den gesamten Rendering-Ansatz.
6. Lighting
Typ, Richtung, Farbtemperatur. Golden Hour, Studio-Softbox, Neon-Ambiente, bewölktes Naturlicht.
7. Camera
Objektiv, Brennweite, Blende, Winkel. "85mm f/1.8, Augenhöhe" vs. "35mm f/2.8, niedrige Perspektive" verändert das Gefühl drastisch.
8. Setting
Ort und Hintergrunddetails. Seien Sie spezifisch: "Industrie-Loft mit sichtbarem Backstein und großen Fenstern" statt nur "drinnen".
9. Mood
Emotionaler Ton und Ausdruck. "Selbstbewusst, direkter Blickkontakt, leichtes Schmunzeln" vs. "nachdenklich, wegschauend, sanftes Lächeln".
Ein vollständiges 9-Feld-Beispiel
Hair: long wavy dark brown hair with subtle caramel highlights, center parted, reaching mid-back, loose face-framing layers
Body: athletic lean build, toned arms, 5'8" proportions
Clothing: oversized vintage band tee (tucked front), black high-waisted mom jeans, white Air Force 1 sneakers, thin gold chain necklace
Style: street photography, editorial, magazine quality
Lighting: late afternoon golden hour, warm directional light from camera left, soft shadows
Camera: Canon R5, 85mm f/1.4, shallow depth of field, eye-level angle
Setting: Brooklyn sidewalk, brownstone buildings in background, a few parked cars, autumn leaves on ground
Mood: casual confidence, walking toward camera, natural mid-stride pose, relaxed half-smile
Wenn Sie dies an Midjourney, Flux oder Stable Diffusion übergeben (als korrekt formatierter einzelner Prompt), ist das Ergebnis dramatisch kontrollierter als ein Freitext-Absatz. Und wenn Sie das nächste Bild generieren, kopieren Sie die Felder 1-3 exakt und ändern nur die Felder 4-9.
Charaktermerkmale fixieren und Szenen variieren
Die 9-Feld-Struktur gibt Ihnen das Fundament. Aber es gibt zusätzliche Techniken zur Aufrechterhaltung der Konsistenz über Generierungen hinweg:
Die Anker-Prompt-Technik
Erstellen Sie ein "Ankerbild" - Ihre absolut beste Generierung des Charakters. Dieses wird zu Ihrem Referenzpunkt. In Midjourney verwenden Sie --cref [anchor_image_url] bei jeder nachfolgenden Generierung. In Stable Diffusion verwenden Sie den Anker als img2img-Referenz mit 0,3-0,5 Denoising-Stärke.
Der Anker-Prompt sollte ein einfaches, gut beleuchtetes, frontal aufgenommenes Porträt mit minimalen Hintergrundablenkungen sein. Denken Sie an "Passfoto, aber gut". Das gibt dem KI-Modell die klarstmögliche Referenz für die Gesichtsmerkmale des Charakters.
Prompt-Gewichtung
Nicht alle Prompt-Elemente sind gleich wichtig. Geben Sie charakterdefinierenden Merkmalen höhere Gewichtung:
In Midjourney verwenden Sie ::2-Gewichtung. In Stable Diffusion nutzen Sie die (Merkmal:Gewicht)-Syntax. Eine Gewichtung der Gesichtsmerkmale bei 1,2-1,4 sagt dem Modell "diese Merkmale sind nicht verhandelbar", während Szenenelemente bei Standardgewichtung für natürlichere Variation bleiben.
Konsistente technische Parameter
Halten Sie diese über alle Generierungen eines Charakters gleich:
- Seitenverhältnis: Verwenden Sie immer dasselbe Verhältnis für denselben Content-Typ (4:5 für Instagram-Feed, 9:16 für Stories).
- Stil-Referenz: In Midjourney fixiert
--srefden ästhetischen Stil über Generierungen hinweg. - Qualitätseinstellungen: Dieselben
--quality- oder Sampler-Einstellungen jedes Mal.
Negative Prompts, die wirklich helfen
Negative Prompts sagen dem Modell, was es vermeiden soll. Für KI-Influencer-Content sollten diese Negativ-Prompts bei jeder Generierung Standard sein:
Nischen-spezifische Negativ-Prompts
- Fitness-Nische: Ergänzen Sie "unrealistic proportions, overly muscular, bodybuilder", um den Körperbau im glaubwürdigen Bereich zu halten.
- Mode-Nische: Ergänzen Sie "wrinkled fabric, ill-fitting clothing, mismatched colors", um ein gepflegtes Erscheinungsbild zu wahren.
- Lifestyle-Nische: Ergänzen Sie "stock photo look, staged, fake smile, empty background", um natürliche Ästhetik zu fördern.
Ein häufiger Fehler ist das Schreiben enormer Negativ-Prompts mit 50+ Begriffen. Das schadet tatsächlich der Ausgabequalität, weil das Modell zu viel Rechenleistung darauf verwendet, Dinge zu vermeiden, anstatt das zu generieren, was Sie wollen. Beschränken Sie Negativ-Prompts auf maximal 15-25 Begriffe, fokussiert auf Probleme, die tatsächlich auftreten.
Seed-Nutzung in Midjourney und Stable Diffusion
Seeds steuern die Zufälligkeit bei der Bildgenerierung. Gleicher Prompt + gleicher Seed = gleiches (oder sehr ähnliches) Ergebnis. So setzen Sie sie strategisch ein:
Midjourney-Seed-Workflow
- Generieren Sie Ihr Ankerbild ohne Angabe eines Seeds.
- Reagieren Sie mit dem Briefumschlag-Emoji, um die Seed-Nummer vom Bot zu erhalten.
- Verwenden Sie
--seed [Nummer]bei nachfolgenden Generierungen mit modifizierten Prompts, um ähnliche Komposition und Merkmale beizubehalten.
Wichtiger Hinweis: Seeds in Midjourney sind nicht deterministisch über verschiedene Prompts hinweg. Sie beeinflussen das zufällige Startrauschen, nicht das Endergebnis. Ein Seed garantiert dasselbe Bild nur, wenn der Prompt identisch ist. Bei unterschiedlichen Prompts erzeugt derselbe Seed Bilder mit "ähnlichem Gefühl", nicht identische.
Stable-Diffusion-Seed-Workflow
In SD sind Seeds deterministischer. Gleicher Seed + gleicher Prompt + gleiches Modell + gleiche Einstellungen = jedes Mal identisches Ergebnis. Nutzen Sie dies für:
- Outfit-Tests: Seed beibehalten, nur das Kleidungsfeld ändern. Gesicht und Pose bleiben nahezu identisch.
- Beleuchtungsexperimente: Gleicher Seed, gleicher Prompt, anderes Beleuchtungsfeld. Isoliert die Auswirkung von Beleuchtungsänderungen.
- A/B-Tests: Generieren Sie dieselbe Szene mit zwei Seeds, um die beste Komposition auszuwählen.
LoRA-Training-Grundlagen für Charakterkonsistenz
LoRA (Low-Rank Adaptation) ist eine Technik zur Feinabstimmung eines KI-Modells auf einen kleinen Satz von Bildern. Für KI-Influencer-Arbeit trainieren Sie ein LoRA auf 15-30 Bildern Ihres Charakters, und dann generiert jeder Prompt mit diesem LoRA Ihren spezifischen Charakter.
Wann ein LoRA trainiert werden sollte
- Wenn Sie 100+ Bilder desselben Charakters produzieren müssen.
- Wenn prompt-basierte Konsistenz nicht ausreicht (das Gesicht driftet immer wieder ab).
- Wenn Sie Stable Diffusion verwenden möchten, aber Midjourney-Level Gesichtskonsistenz benötigen.
LoRA-Training-Schnellstart
- Trainingsbilder sammeln: Generieren Sie 20-30 hochwertige Bilder Ihres Charakters aus Ihrem besten Prompt. Variieren Sie Posen, Ausdrücke und Winkel, aber halten Sie das Gesicht konsistent. Kuratieren Sie manuell; entfernen Sie alle, die "daneben" aussehen.
- Bilder beschriften: Verwenden Sie BLIP oder WD Tagger für Auto-Beschriftungen, dann bearbeiten Sie die Beschriftungen, um sicherzustellen, dass die einzigartigen Merkmale Ihres Charakters konsistent beschrieben werden.
- Trainieren: Verwenden Sie Kohya_ss oder die Trainings-Oberfläche von civitai.com. Einstellungen: 1000-1500 Schritte, Lernrate 1e-4, Rang 32-64. Das Training dauert 15-30 Minuten auf einer RTX 3090.
- Testen: Generieren Sie 10 Bilder mit unterschiedlichen Prompts. Wenn das Gesicht über alle 10 konsistent ist, ist Ihr LoRA einsatzbereit.
Ein gut trainiertes LoRA ist der Goldstandard für Charakterkonsistenz. Es ermöglicht Ihnen, einfache Prompts wie "Luna am Strand, Sonnenuntergang, lässiges Outfit" zu schreiben und jedes Mal einen wiedererkennbaren Charakter zu erhalten. Der Kompromiss ist die anfängliche Zeitinvestition und die Notwendigkeit einer guten GPU (oder eines Cloud-GPU-Dienstes wie RunPod für ca. 0,50 $/Stunde).
7 häufige Prompt-Fehler
1. Den Charakter jedes Mal anders beschreiben
"Brown hair" in einem Prompt, "brunette" im nächsten, "dark chestnut hair" in einem dritten. Das sind für die KI keine Synonyme. Wählen Sie eine exakte Formulierung und kopieren Sie sie jedes Mal identisch.
2. Haut überbeschreiben
"Flawless porcelain skin, smooth, perfect complexion, no blemishes" erzeugt den Plastikpuppen-Look, der für Betrachter nach "KI" schreit. Verwenden Sie stattdessen "natural skin texture, subtle skin pores".
3. Handplatzierung ignorieren
KI hat immer noch Schwierigkeiten mit Händen. Überlassen Sie die Handposition nicht dem Zufall. Spezifizieren Sie: "hands in pockets", "holding a coffee cup with both hands" oder "arms crossed". Definierte Handpositionen erzeugen dramatisch weniger Artefakte.
4. "Photorealistic" als Krücke verwenden
Das Wort "photorealistic" ist in den Trainingsdaten so überstrapaziert, dass es fast bedeutungslos geworden ist. Geben Sie stattdessen die tatsächliche Kamera und das Objektiv an: "shot on Canon R5, 85mm f/1.4" signalisiert Fotorealismus durch technische Spezifität.
5. Stil mitten im Feed wechseln
Von "cinematic photography" zu "street photography" zu "fashion editorial" über drei aufeinanderfolgende Posts zu wechseln, lässt den Feed inkohärent wirken. Wählen Sie einen primären Stil und verwenden Sie ihn für 80 %+ Ihres Contents.
6. Hintergrunddetails vernachlässigen
"Blurred background" ist faul und erzeugt generische Bokeh-Kleckse. "Coffee shop with exposed brick, warm ambient lighting, a few blurred patrons" gibt dem Modell genug Kontext, um eine glaubwürdige Umgebung zu schaffen.
7. Prompts nicht speichern
Wenn Sie Prompts nicht in einem strukturierten Format speichern, verlieren Sie den Überblick darüber, was funktioniert hat. Speichern Sie jeden erfolgreichen Prompt zusammen mit dem generierten Bild. Genau das automatisieren Tools wie AIInfluencer.tools - strukturierte Prompt-Speicherung, Versionierung und Charakter-Feld-Fixierung über Ihr gesamtes Projekt.
Für mehr zum Thema Gesichtskonsistenz im Speziellen lesen Sie unseren speziellen Leitfaden: So bleibt das Gesicht Ihres KI-Influencers konsistent über alle Posts hinweg.
Automatisieren Sie Ihre Prompt-Struktur
AIInfluencer.tools verwendet das in diesem Artikel beschriebene 9-Feld-Prompt-System. Laden Sie ein Referenzbild hoch, und unsere KI extrahiert strukturierte Felder, die Sie fixieren, variieren und in jede Generierungsplattform exportieren können.
Kostenlos testen