Prompt engineering pour influenceur IA : le guide complet des personnages cohérents
Table des matières
- Pourquoi les prompts libres échouent pour les personnages
- La structure de prompt à 9 champs
- Comment verrouiller les caractéristiques du personnage tout en variant les scènes
- Les prompts négatifs qui aident vraiment
- Utilisation des seeds dans Midjourney et Stable Diffusion
- Bases de l'entraînement LoRA pour la cohérence du personnage
- 7 erreurs courantes de prompts
Vous pouvez générer une belle image IA en quelques secondes. Générer le même personnage aussi beau sur 200 images différentes ? C'est le vrai défi. La différence entre un projet d'influenceur IA raté et un projet monétisable se résume presque toujours à la discipline du prompt engineering.
Après avoir construit des flux de travail de prompts pour des agences gérant des dizaines de personnages IA, nous avons distillé le processus en un système reproductible. Ce guide vous enseigne ce système de zéro.
Pourquoi les prompts libres échouent pour les personnages
La plupart des gens écrivent des prompts comme ceci :
Cela fonctionne pour des images ponctuelles. Pour un personnage qui doit apparaître dans 500+ images sur des mois de contenu, c'est un désastre. Voici pourquoi :
- L'ambiguïté engendre la variation. « Belle jeune femme aux cheveux bruns » pourrait produire un million de visages différents. Chaque génération tire les dés sur la forme des yeux, la largeur du nez, le teint, la mâchoire et une centaine d'autres caractéristiques.
- Pas de séparation des préoccupations. Quand la description de votre personnage, la description de la scène et les instructions de style sont mélangées, changer une chose affecte les autres de manière imprévisible. Vous voulez passer d'un café à une salle de sport ? Vous pourriez accidentellement modifier toute la palette d'éclairage et de couleurs.
- Pas de réutilisabilité. Vous finissez par réécrire le prompt entier pour chaque image. Le personnage dérive légèrement à chaque itération, et après 20 posts vos abonnés regardent ce qui semble être cinq personnes différentes.
La solution est le prompting structuré - traiter votre prompt comme un formulaire avec des champs définis plutôt qu'un paragraphe.
La structure de prompt à 9 champs
Chaque prompt d'image d'influenceur IA devrait être décomposé en exactement 9 champs. Les trois premiers définissent le personnage (et ne changent jamais). Les six restants définissent la scène (et changent à chaque image).
1. Face
Forme du visage, teint, couleur/forme des yeux, nez, lèvres, taches de rousseur, grains de beauté. Soyez extrêmement spécifique.
2. Hair
Couleur, longueur, texture, style, direction de la raie. Incluez comment les cheveux tombent par rapport aux épaules.
3. Body
Corpulence, impression de taille, caractéristiques physiques distinctives. Gardez la cohérence sans trop décrire.
4. Clothing
Haut, bas, chaussures, accessoires. Change à chaque image mais doit rester dans le style du personnage.
5. Style
Style photographique : éditorial, street, pris sur le vif, studio, lifestyle. Détermine l'approche de rendu globale.
6. Lighting
Type, direction, température de couleur. Heure dorée, softbox studio, ambiance néon, lumière naturelle couvert.
7. Camera
Objectif, focale, ouverture, angle. « 85mm f/1.8, niveau des yeux » vs « 35mm f/2.8, contre-plongée » change radicalement le rendu.
8. Setting
Lieu et détails d'arrière-plan. Soyez spécifique : « loft industriel avec briques apparentes et grandes fenêtrès » et non simplement « intérieur ».
9. Mood
Tonalité émotionnelle et expression. « Confiant, regard direct, léger sourire en coin » vs « contemplatif, regard ailleurs, sourire doux ».
Un exemple complet à 9 champs
Hair: long wavy dark brown hair with subtle caramel highlights, center parted, reaching mid-back, loose face-framing layers
Body: athletic lean build, toned arms, 5'8" proportions
Clothing: oversized vintage band tee (tucked front), black high-waisted mom jeans, white Air Force 1 sneakers, thin gold chain necklace
Style: street photography, editorial, magazine quality
Lighting: late afternoon golden hour, warm directional light from camera left, soft shadows
Camera: Canon R5, 85mm f/1.4, shallow depth of field, eye-level angle
Setting: Brooklyn sidewalk, brownstone buildings in background, a few parked cars, autumn leaves on ground
Mood: casual confidence, walking toward camera, natural mid-stride pose, relaxed half-smile
Quand vous soumettez cela à Midjourney, Flux ou Stable Diffusion (en tant que prompt unique correctement formaté), le résultat est considérablement plus contrôlé qu'un paragraphe libre. Et quand vous générez l'image suivante, vous copiez les champs 1-3 exactement et ne changez que les champs 4-9.
Comment verrouiller les caractéristiques du personnage tout en variant les scènes
La structure à 9 champs vous donne la base. Mais il existe des techniques supplémentaires pour maintenir la cohérence entre les générations :
La technique du prompt ancre
Créez une « image ancre » - votre meilleure génération absolue du personnage. Cela devient votre point de référence. Dans Midjourney, utilisez --cref [anchor_image_url] avec chaque génération suivante. Dans Stable Diffusion, utilisez l'ancre comme référence img2img avec une force de débruitage de 0,3-0,5.
Le prompt ancre devrait être un portrait simple, bien éclairé, de face avec un minimum de distractions d'arrière-plan. Pensez « photo de passeport, mais en bien ». Cela donne à l'IA la référence la plus claire possible pour les caractéristiques du personnage.
Pondération des prompts
Tous les éléments du prompt ne se valent pas. Donnez un poids plus élevé aux caractéristiques définissant le personnage :
Dans Midjourney, utilisez la pondération ::2. Dans Stable Diffusion, utilisez la syntaxe (feature:weight). Pondérer les caractéristiques faciales à 1,2-1,4 dit au modèle « ces caractéristiques sont non négociables » tout en laissant les éléments de scène au poids par défaut pour une variation plus naturelle.
Paramètrès techniques constants
Gardez ceux-ci identiques pour toutes les générations d'un personnage :
- Ratio d'aspect : Utilisez toujours le même ratio pour le même type de contenu (4:5 pour le fil Instagram, 9:16 pour les stories).
- Référence de style : Dans Midjourney,
--srefverrouille le style esthétique entre les générations. - Paramètrès de qualité : Mêmes paramètrès
--qualityou d'échantillonneur à chaque fois.
Les prompts négatifs qui aident vraiment
Les prompts négatifs indiquent au modèle ce qu'il faut éviter. Pour le contenu d'influenceur IA, ces négatifs devraient être standards sur chaque génération :
Négatifs spécifiques à la niche
- Niche fitness : Ajoutez « proportions irréalistes, trop musclé, bodybuilder » pour garder le physique dans une fourchette crédible.
- Niche mode : Ajoutez « tissu froissé, vêtements mal ajustés, couleurs dépareillées » pour maintenir des looks soignés.
- Niche lifestyle : Ajoutez « look photo de stock, mise en scène, faux sourire, arrière-plan vide » pour pousser vers une esthétique naturelle.
Une erreur courante est d'écrire d'énormes prompts négatifs avec 50+ termes. Cela nuit en fait à la qualité du résultat car le modèle consacre trop de puissance de traitement à éviter des choses au lieu de générer ce que vous voulez. Limitez les négatifs à 15-25 termes max, centrés sur les problèmes que vous rencontrez réellement.
Utilisation des seeds dans Midjourney et Stable Diffusion
Les seeds contrôlent le hasard dans la génération d'images. Même prompt + même seed = même résultat (ou très similaire). Voici comment les utiliser stratégiquement :
Flux de travail des seeds Midjourney
- Générez votre image ancre sans spécifier de seed.
- Réagissez avec l'emoji enveloppe pour obtenir le numéro de seed du bot.
- Utilisez
--seed [number]sur les générations suivantes avec des prompts modifiés pour maintenir une composition et des caractéristiques similaires.
Mise en garde importante : les seeds dans Midjourney ne sont pas déterministes entre différents prompts. Elles influencent le bruit aléatoire de départ, pas le résultat final. Un seed garantit la même image uniquement si le prompt est identique. Avec des prompts différents, le même seed produit des images au « ressenti similaire », pas identiques.
Flux de travail des seeds Stable Diffusion
Dans SD, les seeds sont plus déterministes. Même seed + même prompt + même modèle + mêmes paramètrès = résultat identique à chaque fois. Utilisez cela pour :
- Test de tenues : Gardez le seed, changez uniquement le champ vêtements. Le visage et la pose restent quasi identiques.
- Expériences d'éclairage : Même seed, même prompt, champ éclairage différent. Isole l'effet des changements d'éclairage.
- Test A/B : Générez la même scène avec deux seeds pour choisir la meilleure composition.
Bases de l'entraînement LoRA pour la cohérence du personnage
LoRA (Low-Rank Adaptation) est une technique d'ajustement fin d'un modèle IA sur un petit ensemble d'images. Pour le travail d'influenceur IA, vous entraînez un LoRA sur 15-30 images de votre personnage, et ensuite tout prompt utilisant ce LoRA générera votre personnage spécifique.
Quand entraîner un LoRA
- Quand vous devez produire 100+ images du même personnage.
- Quand la cohérence basée sur les prompts n'est pas suffisante (le visage continue de dériver).
- Quand vous voulez utiliser Stable Diffusion mais avez besoin d'une cohérence faciale de niveau Midjourney.
Démarrage rapide de l'entraînement LoRA
- Rassemblez les images d'entraînement : Générez 20-30 images de haute qualité de votre personnage à partir de votre meilleur prompt. Variez les poses, expressions et angles, mais gardez le visage cohérent. Sélectionnez manuellement ; supprimez celles qui semblent « incorrectes ».
- Légendez les images : Utilisez BLIP ou WD Tagger pour auto-légender, puis modifiez les légendes pour vous assurer que les caractéristiques uniques de votre personnage sont décrites de manière cohérente.
- Entraînez : Utilisez Kohya_ss ou l'interface d'entraînement de civitai.com. Paramètrès : 1000-1500 étapes, taux d'apprentissage 1e-4, rang 32-64. L'entraînement prend 15-30 minutes sur un RTX 3090.
- Testez : Générez 10 images avec des prompts variés. Si le visage est cohérent sur les 10, votre LoRA est prêt.
Un LoRA bien entraîné est la référence absolue pour la cohérence du personnage. Il vous permet d'écrire des prompts simples comme « Luna à la plage, coucher de soleil, tenue décontractée » et d'obtenir un personnage reconnaissable à chaque fois. Le compromis est l'investissement en temps initial et le besoin d'un GPU correct (ou d'un service GPU cloud comme RunPod à environ 0,50 $/heure).
7 erreurs courantes de prompts
1. Décrire le personnage différemment à chaque fois
« Brown hair » dans un prompt, « brunette » dans le suivant, « dark chestnut hair » dans un troisième. Ce ne sont pas des synonymes pour l'IA. Choisissez un wording exact et copiez-collez-le de manière identique à chaque fois.
2. Sur-décrire la peau
« Flawless porcelain skin, smooth, perfect complexion, no blemishes » produit le look poupée en plastique qui crie « IA » aux spectateurs. Utilisez « natural skin texture, subtle skin pores » à la place.
3. Ignorer le placement des mains
L'IA a encore du mal avec les mains. Ne laissez pas la position des mains au hasard. Spécifiez : « hands in pockets », « holding a coffee cup with both hands », ou « arms crossed ». Les positions de mains définies produisent considérablement moins d'artefacts.
4. Utiliser « photorealistic » comme béquille
Le mot « photorealistic » est tellement surutilisé dans les données d'entraînement qu'il est devenu presque insignifiant. À la place, spécifiez l'appareil photo et l'objectif réels : « shot on Canon R5, 85mm f/1.4 » signale le photoréalisme par la spécificité technique.
5. Changer de style en cours de fil
Passer de « cinematic photography » à « street photography » puis à « fashion editorial » sur trois posts consécutifs rend le fil incohérent. Choisissez un style principal et utilisez-le pour 80%+ de votre contenu.
6. Négliger les détails d'arrière-plan
« Blurred background » est paresseux et produit des taches de bokeh génériques. « Coffee shop with exposed brick, warm ambient lighting, a few blurred patrons » donne au modèle suffisamment de contexte pour créer un environnement crédible.
7. Ne pas sauvegarder vos prompts
Si vous ne stockez pas vos prompts dans un format structuré, vous perdrez la trace de ce qui a fonctionné. Sauvegardez chaque prompt réussi à côté de l'image générée. C'est exactement ce que des outils comme AIInfluencer.tools automatisent - stockage structuré des prompts, versioning et verrouillage des champs du personnage à travers tout votre projet.
For more on maintaining face consistency specifically, read our dedicated guide: Comment garder le visage de votre influenceur IA cohérent Across Posts.
Automatisez votre structure de prompts
AIInfluencer.tools utilise le système de prompts à 9 champs décrit dans cet article. Téléchargez une image de référence et notre IA extrait des champs structurés que vous pouvez verrouiller et exporter.
Essayer gratuitement