Prompt engineering pour influenceur IA : le guide complet des personnages cohérents

Par l'équipe AIInfluencer.tools | | 15 min de lecture

Table des matières

  1. Pourquoi les prompts libres échouent pour les personnages
  2. La structure de prompt à 9 champs
  3. Comment verrouiller les caractéristiques du personnage tout en variant les scènes
  4. Les prompts négatifs qui aident vraiment
  5. Utilisation des seeds dans Midjourney et Stable Diffusion
  6. Bases de l'entraînement LoRA pour la cohérence du personnage
  7. 7 erreurs courantes de prompts

Vous pouvez générer une belle image IA en quelques secondes. Générer le même personnage aussi beau sur 200 images différentes ? C'est le vrai défi. La différence entre un projet d'influenceur IA raté et un projet monétisable se résume presque toujours à la discipline du prompt engineering.

Après avoir construit des flux de travail de prompts pour des agences gérant des dizaines de personnages IA, nous avons distillé le processus en un système reproductible. Ce guide vous enseigne ce système de zéro.

Pourquoi les prompts libres échouent pour les personnages

La plupart des gens écrivent des prompts comme ceci :

A beautiful young woman with brown hair at a coffee shop, photorealistic, 4k, detailed

Cela fonctionne pour des images ponctuelles. Pour un personnage qui doit apparaître dans 500+ images sur des mois de contenu, c'est un désastre. Voici pourquoi :

La solution est le prompting structuré - traiter votre prompt comme un formulaire avec des champs définis plutôt qu'un paragraphe.

La structure de prompt à 9 champs

Chaque prompt d'image d'influenceur IA devrait être décomposé en exactement 9 champs. Les trois premiers définissent le personnage (et ne changent jamais). Les six restants définissent la scène (et changent à chaque image).

1. Face

Forme du visage, teint, couleur/forme des yeux, nez, lèvres, taches de rousseur, grains de beauté. Soyez extrêmement spécifique.

2. Hair

Couleur, longueur, texture, style, direction de la raie. Incluez comment les cheveux tombent par rapport aux épaules.

3. Body

Corpulence, impression de taille, caractéristiques physiques distinctives. Gardez la cohérence sans trop décrire.

4. Clothing

Haut, bas, chaussures, accessoires. Change à chaque image mais doit rester dans le style du personnage.

5. Style

Style photographique : éditorial, street, pris sur le vif, studio, lifestyle. Détermine l'approche de rendu globale.

6. Lighting

Type, direction, température de couleur. Heure dorée, softbox studio, ambiance néon, lumière naturelle couvert.

7. Camera

Objectif, focale, ouverture, angle. « 85mm f/1.8, niveau des yeux » vs « 35mm f/2.8, contre-plongée » change radicalement le rendu.

8. Setting

Lieu et détails d'arrière-plan. Soyez spécifique : « loft industriel avec briques apparentes et grandes fenêtrès » et non simplement « intérieur ».

9. Mood

Tonalité émotionnelle et expression. « Confiant, regard direct, léger sourire en coin » vs « contemplatif, regard ailleurs, sourire doux ».

Un exemple complet à 9 champs

Face: heart-shaped face, light olive skin, hazel green eyes with gold flecks, straight nose with slight upturn, full natural lips, subtle beauty mark above left lip

Hair: long wavy dark brown hair with subtle caramel highlights, center parted, reaching mid-back, loose face-framing layers

Body: athletic lean build, toned arms, 5'8" proportions

Clothing: oversized vintage band tee (tucked front), black high-waisted mom jeans, white Air Force 1 sneakers, thin gold chain necklace

Style: street photography, editorial, magazine quality

Lighting: late afternoon golden hour, warm directional light from camera left, soft shadows

Camera: Canon R5, 85mm f/1.4, shallow depth of field, eye-level angle

Setting: Brooklyn sidewalk, brownstone buildings in background, a few parked cars, autumn leaves on ground

Mood: casual confidence, walking toward camera, natural mid-stride pose, relaxed half-smile

Quand vous soumettez cela à Midjourney, Flux ou Stable Diffusion (en tant que prompt unique correctement formaté), le résultat est considérablement plus contrôlé qu'un paragraphe libre. Et quand vous générez l'image suivante, vous copiez les champs 1-3 exactement et ne changez que les champs 4-9.

Comment verrouiller les caractéristiques du personnage tout en variant les scènes

La structure à 9 champs vous donne la base. Mais il existe des techniques supplémentaires pour maintenir la cohérence entre les générations :

La technique du prompt ancre

Créez une « image ancre » - votre meilleure génération absolue du personnage. Cela devient votre point de référence. Dans Midjourney, utilisez --cref [anchor_image_url] avec chaque génération suivante. Dans Stable Diffusion, utilisez l'ancre comme référence img2img avec une force de débruitage de 0,3-0,5.

Le prompt ancre devrait être un portrait simple, bien éclairé, de face avec un minimum de distractions d'arrière-plan. Pensez « photo de passeport, mais en bien ». Cela donne à l'IA la référence la plus claire possible pour les caractéristiques du personnage.

Pondération des prompts

Tous les éléments du prompt ne se valent pas. Donnez un poids plus élevé aux caractéristiques définissant le personnage :

(heart-shaped face, hazel green eyes, beauty mark above left lip:1.3), (long wavy dark brown hair:1.2), athletic build, wearing a red sundress, standing in a flower garden, golden hour lighting

Dans Midjourney, utilisez la pondération ::2. Dans Stable Diffusion, utilisez la syntaxe (feature:weight). Pondérer les caractéristiques faciales à 1,2-1,4 dit au modèle « ces caractéristiques sont non négociables » tout en laissant les éléments de scène au poids par défaut pour une variation plus naturelle.

Paramètrès techniques constants

Gardez ceux-ci identiques pour toutes les générations d'un personnage :

Les prompts négatifs qui aident vraiment

Les prompts négatifs indiquent au modèle ce qu'il faut éviter. Pour le contenu d'influenceur IA, ces négatifs devraient être standards sur chaque génération :

Negative: deformed hands, extra fingers, merged fingers, bad anatomy, disfigured face, asymmetric eyes, blurry, low quality, watermark, text overlay, cartoon, anime, illustration, 3d render, plastic skin, overly smooth skin, uncanny valley

Négatifs spécifiques à la niche

Une erreur courante est d'écrire d'énormes prompts négatifs avec 50+ termes. Cela nuit en fait à la qualité du résultat car le modèle consacre trop de puissance de traitement à éviter des choses au lieu de générer ce que vous voulez. Limitez les négatifs à 15-25 termes max, centrés sur les problèmes que vous rencontrez réellement.

Utilisation des seeds dans Midjourney et Stable Diffusion

Les seeds contrôlent le hasard dans la génération d'images. Même prompt + même seed = même résultat (ou très similaire). Voici comment les utiliser stratégiquement :

Flux de travail des seeds Midjourney

  1. Générez votre image ancre sans spécifier de seed.
  2. Réagissez avec l'emoji enveloppe pour obtenir le numéro de seed du bot.
  3. Utilisez --seed [number] sur les générations suivantes avec des prompts modifiés pour maintenir une composition et des caractéristiques similaires.

Mise en garde importante : les seeds dans Midjourney ne sont pas déterministes entre différents prompts. Elles influencent le bruit aléatoire de départ, pas le résultat final. Un seed garantit la même image uniquement si le prompt est identique. Avec des prompts différents, le même seed produit des images au « ressenti similaire », pas identiques.

Flux de travail des seeds Stable Diffusion

Dans SD, les seeds sont plus déterministes. Même seed + même prompt + même modèle + mêmes paramètrès = résultat identique à chaque fois. Utilisez cela pour :

Bases de l'entraînement LoRA pour la cohérence du personnage

LoRA (Low-Rank Adaptation) est une technique d'ajustement fin d'un modèle IA sur un petit ensemble d'images. Pour le travail d'influenceur IA, vous entraînez un LoRA sur 15-30 images de votre personnage, et ensuite tout prompt utilisant ce LoRA générera votre personnage spécifique.

Quand entraîner un LoRA

Démarrage rapide de l'entraînement LoRA

  1. Rassemblez les images d'entraînement : Générez 20-30 images de haute qualité de votre personnage à partir de votre meilleur prompt. Variez les poses, expressions et angles, mais gardez le visage cohérent. Sélectionnez manuellement ; supprimez celles qui semblent « incorrectes ».
  2. Légendez les images : Utilisez BLIP ou WD Tagger pour auto-légender, puis modifiez les légendes pour vous assurer que les caractéristiques uniques de votre personnage sont décrites de manière cohérente.
  3. Entraînez : Utilisez Kohya_ss ou l'interface d'entraînement de civitai.com. Paramètrès : 1000-1500 étapes, taux d'apprentissage 1e-4, rang 32-64. L'entraînement prend 15-30 minutes sur un RTX 3090.
  4. Testez : Générez 10 images avec des prompts variés. Si le visage est cohérent sur les 10, votre LoRA est prêt.

Un LoRA bien entraîné est la référence absolue pour la cohérence du personnage. Il vous permet d'écrire des prompts simples comme « Luna à la plage, coucher de soleil, tenue décontractée » et d'obtenir un personnage reconnaissable à chaque fois. Le compromis est l'investissement en temps initial et le besoin d'un GPU correct (ou d'un service GPU cloud comme RunPod à environ 0,50 $/heure).

7 erreurs courantes de prompts

1. Décrire le personnage différemment à chaque fois

« Brown hair » dans un prompt, « brunette » dans le suivant, « dark chestnut hair » dans un troisième. Ce ne sont pas des synonymes pour l'IA. Choisissez un wording exact et copiez-collez-le de manière identique à chaque fois.

2. Sur-décrire la peau

« Flawless porcelain skin, smooth, perfect complexion, no blemishes » produit le look poupée en plastique qui crie « IA » aux spectateurs. Utilisez « natural skin texture, subtle skin pores » à la place.

3. Ignorer le placement des mains

L'IA a encore du mal avec les mains. Ne laissez pas la position des mains au hasard. Spécifiez : « hands in pockets », « holding a coffee cup with both hands », ou « arms crossed ». Les positions de mains définies produisent considérablement moins d'artefacts.

4. Utiliser « photorealistic » comme béquille

Le mot « photorealistic » est tellement surutilisé dans les données d'entraînement qu'il est devenu presque insignifiant. À la place, spécifiez l'appareil photo et l'objectif réels : « shot on Canon R5, 85mm f/1.4 » signale le photoréalisme par la spécificité technique.

5. Changer de style en cours de fil

Passer de « cinematic photography » à « street photography » puis à « fashion editorial » sur trois posts consécutifs rend le fil incohérent. Choisissez un style principal et utilisez-le pour 80%+ de votre contenu.

6. Négliger les détails d'arrière-plan

« Blurred background » est paresseux et produit des taches de bokeh génériques. « Coffee shop with exposed brick, warm ambient lighting, a few blurred patrons » donne au modèle suffisamment de contexte pour créer un environnement crédible.

7. Ne pas sauvegarder vos prompts

Si vous ne stockez pas vos prompts dans un format structuré, vous perdrez la trace de ce qui a fonctionné. Sauvegardez chaque prompt réussi à côté de l'image générée. C'est exactement ce que des outils comme AIInfluencer.tools automatisent - stockage structuré des prompts, versioning et verrouillage des champs du personnage à travers tout votre projet.

For more on maintaining face consistency specifically, read our dedicated guide: Comment garder le visage de votre influenceur IA cohérent Across Posts.

Automatisez votre structure de prompts

AIInfluencer.tools utilise le système de prompts à 9 champs décrit dans cet article. Téléchargez une image de référence et notre IA extrait des champs structurés que vous pouvez verrouiller et exporter.

Essayer gratuitement