הנדסת פרומפטים למשפיעני AI: המדריך המלא לדמויות עקביות
אתם יכולים ליצור תמונת AI יפה תוך שניות. ליצור את אותה דמות נראית יפה על פני 200 תמונות שונות? זה האתגר האמיתי. ההבדל בין פרויקט משפיען AI שנכשל לכזה שניתן למנטז כמעט תמיד מסתכם במשמעת הנדסת הפרומפטים.
לאחר בניית זרימות עבודה של פרומפטים עבור סוכנויות שמנהלות עשרות דמויות AI, זיקקנו את התהליך למערכת חוזרת. המדריך הזה מלמד אתכם את המערכת הזו מהיסוד.
למה פרומפטים חופשיים נכשלים עבור דמויות
רוב האנשים כותבים פרומפטים כך:
זה עובד לתמונות חד-פעמיות. עבור דמות שצריכה להופיע ב-500+ תמונות לאורך חודשים של תוכן, זו אסון. הנה למה:
- עמימות מולידה וריאציה. "אישה צעירה ויפה עם שיער חום" יכול לייצר מיליון פנים שונים. כל יצירה מטילה קוביות על צורת עין, רוחב אף, גוון עור, קו לסת, ומאות תכונות אחרות.
- אין הפרדת תחומים. כשתיאור הדמות, תיאור הסצנה והוראות הסגנון כולם מעורבבים, שינוי דבר אחד משפיע באופן בלתי צפוי על אחרים. רוצים לעבור מבית קפה לחדר כושר? אתם עלולים בטעות לשנות את כל תכנית התאורה והצבע.
- אין שימוש חוזר. אתם מגיעים לכתוב מחדש את כל הפרומפט לכל תמונה. הדמות סוטה מעט בכל איטרציה, ואחרי 20 פוסטים העוקבים שלכם מסתכלים על מה שנראה כמו חמישה אנשים שונים.
הפתרון הוא כתיבת פרומפטים מובנית - להתייחס לפרומפט כאל טופס עם שדות מוגדרים במקום פסקה.
מבנה הפרומפט בן 9 השדות
כל פרומפט תמונה של משפיען AI צריך להיות מחולק ל-9 שדות בדיוק. שלושת הראשונים מגדירים את הדמות (ולעולם לא משתנים). ששת הנותרים מגדירים את הסצנה (ומשתנים עם כל תמונה).
1. פנים
צורת פנים, גוון עור, צבע/צורת עיניים, אף, שפתיים, נמשים, שומות. היו ספציפיים ביותר.
2. שיער
צבע, אורך, טקסטורה, סגנון, כיוון שביל. כללו איך השיער נופל ביחס לכתפיים.
3. גוף
מבנה, רושם גובה, תכונות פיזיות מבדלות. שמרו עקבי אבל לא מתואר יתר על המידה.
4. לבוש
חולצה, מכנסיים, נעליים, אביזרים. משתנה לכל תמונה אבל צריך להישאר בסגנון הדמות.
5. סגנון
סגנון צילום: עורכי, רחוב, ספונטני, סטודיו, אורח חיים. קובע את גישת הרינדור הכוללת.
6. תאורה
סוג, כיוון, טמפרטורת צבע. שעת זהב, softbox סטודיו, ניאון סביבתי, טבעי מעונן.
7. מצלמה
עדשה, אורך מוקד, צמצם, זווית. "85mm f/1.8, גובה עיניים" לעומת "35mm f/2.8, זווית נמוכה" משנה דרמטית את התחושה.
8. הגדרה
מיקום ופרטי רקע. היו ספציפיים: "לופט תעשייתי עם לבנים חשופים וחלונות גדולים" ולא סתם "בפנים".
9. מצב רוח
טון רגשי והבעה. "ביטחון, קשר עין ישיר, חיוך קל" לעומת "מהורהר, מסתכל הצידה, חיוך עדין".
דוגמה מלאה ל-9 שדות
Hair: long wavy dark brown hair with subtle caramel highlights, center parted, reaching mid-back, loose face-framing layers
Body: athletic lean build, toned arms, 5'8" proportions
Clothing: oversized vintage band tee (tucked front), black high-waisted mom jeans, white Air Force 1 sneakers, thin gold chain necklace
Style: street photography, editorial, magazine quality
Lighting: late afternoon golden hour, warm directional light from camera left, soft shadows
Camera: Canon R5, 85mm f/1.4, shallow depth of field, eye-level angle
Setting: Brooklyn sidewalk, brownstone buildings in background, a few parked cars, autumn leaves on ground
Mood: casual confidence, walking toward camera, natural mid-stride pose, relaxed half-smile
כשאתם מזינים את זה ל-Midjourney, Flux או Stable Diffusion (כפרומפט בודד מפורמט כראוי), התוצאה מבוקרת הרבה יותר מפסקה חופשית. וכשאתם מייצרים את התמונה הבאה, אתם מעתיקים שדות 1-3 בדיוק ומשנים רק שדות 4-9.
איך לנעול תכונות דמות תוך שינוי סצנות
מבנה 9 השדות נותן לכם את הבסיס. אבל יש טכניקות נוספות לשמירה על עקביות בין יצירות:
טכניקת פרומפט העוגן
צרו "תמונת עוגן" אחת - היצירה הכי טובה שלכם של הדמות. זו הופכת לנקודת הייחוס שלכם. ב-Midjourney, השתמשו ב---cref [anchor_image_url] עם כל יצירה עוקבת. ב-Stable Diffusion, השתמשו בעוגן כייחוס img2img בחוזק דנויזינג של 0.3-0.5.
פרומפט העוגן צריך להיות פורטרט פשוט, מואר היטב, פונה קדימה, עם מינימום הסחות רקע. חשבו על "תמונת דרכון, אבל טובה". זה נותן ל-AI את הייחוס הברור ביותר לתכונות הדמות.
משקולות פרומפט
לא כל אלמנטי הפרומפט שווים. תנו משקל גבוה יותר לתכונות מגדירות דמות:
ב-Midjourney, השתמשו במשקולות ::2. ב-Stable Diffusion, השתמשו בתחביר (feature:weight). משקל תכונות פנים ב-1.2-1.4 אומר למודל "התכונות האלה לא ניתנות למשא ומתן" תוך שאלמנטי סצנה נשארים במשקל ברירת מחדל לוריאציה טבעית יותר.
פרמטרים טכניים עקביים
שמרו אלה זהים בכל היצירות של דמות:
- יחס תצוגה: תמיד השתמשו באותו יחס לאותו סוג תוכן (4:5 לפיד אינסטגרם, 9:16 לסטוריז).
- ייחוס סגנון: ב-Midjourney,
--srefנועל את הסגנון האסתטי בין יצירות. - הגדרות איכות: אותו
--qualityאו הגדרות sampler בכל פעם.
פרומפטים שליליים שבאמת עוזרים
פרומפטים שליליים אומרים למודל ממה להימנע. לתוכן משפיעני AI, השליליים האלה צריכים להיות סטנדרטיים בכל יצירה:
שליליים ספציפיים לנישה
- נישת כושר: הוסיפו "unrealistic proportions, overly muscular, bodybuilder" כדי לשמור על מבנה גוף אמין.
- נישת אופנה: הוסיפו "wrinkled fabric, ill-fitting clothing, mismatched colors" כדי לשמור על מראה מלוטש.
- נישת אורח חיים: הוסיפו "stock photo look, staged, fake smile, empty background" כדי לדחוף לכיוון אסתטיקה טבעית.
טעות נפוצה היא כתיבת פרומפטים שליליים ענקיים עם 50+ מונחים. זה בעצם פוגע באיכות הפלט כי המודל מבזבז יותר מדי כוח עיבוד על הימנעות מדברים במקום ליצור מה שאתם רוצים. שמרו שליליים ל-15-25 מונחים מקסימום, ממוקדים בבעיות שאתם בפועל נתקלים בהן.
שימוש ב-Seed ב-Midjourney ו-Stable Diffusion
Seeds שולטים ברנדומליות ביצירת תמונות. אותו פרומפט + אותו seed = אותה תוצאה (או דומה מאוד). הנה איך להשתמש בהם באופן אסטרטגי:
זרימת עבודה של seed ב-Midjourney
- צרו את תמונת העוגן שלכם בלי לציין seed.
- הגיבו עם אמוג'י המעטפה כדי לקבל את מספר ה-seed מהבוט.
- השתמשו ב-
--seed [number]ביצירות עוקבות עם פרומפטים שונים כדי לשמור על קומפוזיציה ותכונות דומות.
הערה חשובה: seeds ב-Midjourney אינם דטרמיניסטיים בין פרומפטים שונים. הם משפיעים על רעש ההתחלה האקראי, לא על הפלט הסופי. seed מבטיח אותה תמונה רק אם הפרומפט זהה. עם פרומפטים שונים, אותו seed מייצר תמונות עם "תחושה דומה", לא זהות.
זרימת עבודה של seed ב-Stable Diffusion
ב-SD, seeds הם יותר דטרמיניסטיים. אותו seed + אותו פרומפט + אותו מודל + אותן הגדרות = פלט זהה בכל פעם. השתמשו בזה עבור:
- בדיקת תלבושות: שמרו על ה-seed, שנו רק את שדה הלבוש. הפנים והתנוחה נשארים כמעט זהים.
- ניסויי תאורה: אותו seed, אותו פרומפט, שדה תאורה שונה. מבודד את ההשפעה של שינויי תאורה.
- בדיקות A/B: צרו אותה סצנה עם שני seeds כדי לבחור את הקומפוזיציה הטובה ביותר.
יסודות אימון LoRA לעקביות דמות
LoRA (Low-Rank Adaptation) היא טכניקה לכוונון עדין של מודל AI על סט קטן של תמונות. לעבודת משפיעני AI, אתם מאמנים LoRA על 15-30 תמונות של הדמות שלכם, ואז כל פרומפט שמשתמש ב-LoRA ייצר את הדמות הספציפית שלכם.
מתי לאמן LoRA
- כשצריך לייצר 100+ תמונות של אותה דמות.
- כשעקביות מבוססת פרומפט לא מספיק טובה (הפנים ממשיכים לסטות).
- כשרוצים להשתמש ב-Stable Diffusion אבל צריכים עקביות פנים ברמת Midjourney.
התחלה מהירה לאימון LoRA
- אספו תמונות אימון: צרו 20-30 תמונות איכותיות של הדמות מהפרומפט הטוב ביותר שלכם. שנו תנוחות, הבעות וזוויות, אבל שמרו על פנים עקביים. סננו ידנית; הסירו כל תמונה שנראית "לא בסדר".
- כתבו כיתובים לתמונות: השתמשו ב-BLIP או WD Tagger לכיתוב אוטומטי, ואז ערכו כיתובים כדי להבטיח שתכונות הפנים הייחודיות של הדמות מתוארות באופן עקבי.
- אמנו: השתמשו ב-Kohya_ss או בממשק האימון של civitai.com. הגדרות: 1000-1500 צעדים, קצב למידה 1e-4, rank 32-64. האימון לוקח 15-30 דקות על RTX 3090.
- בדקו: צרו 10 תמונות עם פרומפטים מגוונים. אם הפנים עקביים בכל 10, ה-LoRA שלכם מוכן.
LoRA מאומן היטב הוא תקן הזהב לעקביות דמות. הוא מאפשר לכם לכתוב פרומפטים פשוטים כמו "לונה בחוף הים, שקיעה, תלבושת קז'ואלית" ולקבל דמות מזוהה בכל פעם. הפשרה היא השקעת הזמן הראשונית והצורך ב-GPU סביר (או שירות GPU בענן כמו RunPod בכ-$0.50 לשעה).
7 טעויות פרומפט נפוצות
1. תיאור הדמות שונה בכל פעם
"שיער חום" בפרומפט אחד, "brunette" בבא, "dark chestnut hair" בשלישי. אלה לא מילים נרדפות ל-AI. בחרו ניסוח מדויק והעתיקו-הדביקו אותו זהה בכל פעם.
2. תיאור יתר של עור
"עור פורצלן מושלם, חלק, עור נקי מבלי פגמים" מייצר את מראה בובת הפלסטיק שצועק "AI" לצופים. השתמשו ב-"natural skin texture, subtle skin pores" במקום.
3. התעלמות ממיקום ידיים
AI עדיין מתקשה עם ידיים. אל תשאירו את מיקום הידיים לגורל. ציינו: "hands in pockets", "holding a coffee cup with both hands", או "arms crossed". מיקומי ידיים מוגדרים מייצרים פחות פגמים באופן דרמטי.
4. שימוש ב-"photorealistic" כקביים
המילה "photorealistic" כל כך שחוקה בנתוני אימון שהפכה כמעט חסרת משמעות. במקום, ציינו את המצלמה והעדשה בפועל: "shot on Canon R5, 85mm f/1.4" מסמן פוטוריאליזם דרך ספציפיות טכנית.
5. שינוי סגנון באמצע הפיד
מעבר מ-"cinematic photography" ל-"street photography" ל-"fashion editorial" בשלושה פוסטים רצופים גורם לפיד להרגיש לא קוהרנטי. בחרו סגנון ראשי אחד והשתמשו בו ב-80%+ מהתוכן שלכם.
6. הזנחת פרטי רקע
"רקע מטושטש" זה עצלני ומייצר כתמי בוקה גנריים. "בית קפה עם לבנים חשופות, תאורת סביבה חמה, כמה לקוחות מטושטשים" נותן למודל מספיק הקשר ליצור סביבה אמינה.
7. אי-שמירה של פרומפטים
אם אתם לא שומרים פרומפטים בפורמט מובנה, תאבדו מעקב של מה עבד. שמרו כל פרומפט מוצלח לצד התמונה שנוצרה. זה בדיוק מה שכלים כמו AIInfluencer.tools מאמנים - אחסון פרומפטים מובנה, גרסאות ונעילת שדות דמות על פני כל הפרויקט.
למידע נוסף על שמירה על עקביות פנים באופן ספציפי, קראו את המדריך הייעודי שלנו: איך לשמור על עקביות פנים של משפיען AI בין פוסטים.
אוטמטו את מבנה הפרומפטים שלכם
AIInfluencer.tools משתמש במערכת הפרומפטים בת 9 השדות המתוארת במאמר הזה. העלו תמונת ייחוס, וה-AI שלנו מחלץ שדות מובנים שתוכלו לנעול, לשנות ולייצא לכל פלטפורמת יצירה.
נסו בחינם