مقدمه

ساختن عکس با هوش مصنوعی در نگاه اول جادویی به نظر می‌رسد، اما وقتی خودت پشت سیستم می‌نشینی، نتیجه اغلب چیزی نیست که در ذهنت داشتی. شاید عکس‌هایی که تحویل می‌گیری عجیب‌وغریب یا بی‌کیفیت باشند. خبر خوب این است که مشکل از هوش مصنوعی نیست؛ مشکل فقط در «زبانِ مشترک» است. پرامپت‌نویسی سخت نیست، فقط باید بدانی چطور به زبان ساده به ابزار بگویی چه می‌خواهی. در این مقاله یاد می‌گیریم چطور با یک فرمول ساده، دقیقاً همان چیزی را بسازیم که در ذهن داریم.


۱. پرامپت نویسی دقیقاً یعنی چه؟

به زبان خیلی ساده، «پرامپت» همان دستوری است که تو به هوش مصنوعی می‌دهی. فکر کن هوش مصنوعی یک هنرمند بااستعداد اما کمی خجالتی است. اگر به او بگویی «یک عکس بکش»، او نمی‌داند دقیقاً چه چیزی در ذهنت است. اما اگر به او بگویی «یک گربه نارنجی روی مبل چرمی قهوه‌ای در یک اتاق آفتابی بکش»، او دقیقاً می‌داند باید چه کار کند.

وقتی می‌گوییم پرامپت‌نویسی خوب، یعنی یاد بگیریم جزئیات را طوری کنار هم بچینیم که هوش مصنوعی بتواند تصویر ذهنی ما را بازسازی کند.

چرا بعضی عکس‌ها عالی و بعضی بد می‌شوند؟

تفاوت در میزان «اطلاعات» است. هوش مصنوعی ذهن‌خوان نیست. هرچقدر درخواست تو مبهم باشد، خروجیِ ابزار هم بی‌هدف‌تر خواهد بود. اینجاست که فرمول طلایی به کار می‌آید.

فرمول طلایی: چطور با یک ساختار ساده، عکس حرفه‌ای‌تر بسازیم؟

قبل از هر چیز، این فرمول را جلوی چشم‌ات نگه دار.

هر وقت خواستی برای تولید عکس با هوش مصنوعی پرامپت بنویسی، از این الگو استفاده کن:

[Subject] + [Important Details] + [Environment] + [Art Style] + [Lighting] + [Camera Angle] + [Mood] + [Negative Prompts]

این فرمول قرار نیست کار را سخت‌تر کند؛ برعکس، کمک می‌کند بدانی دقیقاً چه چیزهایی را باید به هوش مصنوعی بگویی.
اگر این ۸ بخش را درست و واضح بنویسی، شانس اینکه خروجی خوب بگیری خیلی بیشتر می‌شود. ولی ببین یه چیزی رو بهت بگم تو قرار نیست برای ساختت هرعکسی از این فرمول استفاده کنی جلوتر البته بهت میگم اینو  فقط یه جاهای خاصی قراره از این فرمول استفاده کنی

حالا هر بخش را جدا و روشن بررسی کنیم.

سوژه (Subject)

Subject یعنی مهم‌ترین چیزی که قرار است در تصویر دیده شود.

در واقع پاسخ به این سؤال است:

«این تصویر درباره‌ی چه چیزی است؟»

مدل‌های تولید تصویر معمولاً اول سوژه را تشخیص می‌دهند و بعد بقیه چیزها مثل محیط، نور، سبک و حس‌وحال را دور آن می‌سازند.

به همین دلیل، اگر سوژه مبهم باشد، کل تصویر هم مبهم، شلخته یا اشتباه از آب درمی‌آید.

مثلاً اگر فقط بنویسی:

“a person”

هوش مصنوعی باید خودش حدس بزند که این شخص چند ساله است، زن است یا مرد، چه لباسی پوشیده، کجاست و چه حالتی دارد. نتیجه؟ معمولاً چیزی می‌سازد که خیلی به ذهن تو نزدیک نیست.

پس اولین و مهم‌ترین کار این است که سوژه را واضح، مشخص و قابل تصور بنویسی.

در توصیف سوژه، این موارد خیلی کمک می‌کنند:

  • سن
  • جنسیت
  • ویژگی ظاهری
  • لباس
  • حالت چهره
  • موقعیت بدن
  • اشیاء همراه سوژه

مثال ساده:

  • ضعیف:a man
  • بهتر:a middle-aged man with short gray hair and a black coat  

 عکس اول بدون جزیئات عکس دوم

مثال دیگر:

  • ضعیف:a cat 
  • بهتر:
  • a fluffy white cat with blue eyes

 

 

 

مثال ساده مثال خو ب با جزیئات

 

 

  • مثال اول یه گربه ساده بود ولی مثال دوم تمام جزیئات رعایت شده

    جزئیات مهم (Important Details)

    Important Details یعنی اطلاعاتی که سوژه را از یک چیز کلی و معمولی، به یک تصویر مشخص و دقیق تبدیل می‌کنند.

    اگر Subject فقط بگوید «چه چیزی» در تصویر است،

    Important Details توضیح می‌دهد آن چیز دقیقاً چه شکلی است.

    این بخش همان جایی است که پرامپت تو از حالت ساده و خام درمی‌آید و شروع می‌کند به شبیه شدن به چیزی که در ذهن داری.

    جزئیات مهم می‌توانند شامل این موارد باشند:

    • رنگ
    • جنس و بافت
    • مدل لباس
    • حالت صورت
    • مدل مو
    • ویژگی‌های بدنی
    • اکسسوری‌ها
    • اشیای همراه
    • حرکت یا حالت خاص

    مثلاً بین این دو جمله تفاوت زیادی وجود دارد:

    • a girl
    • a young girl with curly black hair, wearing a yellow hoodie and white sneakers

    در جمله دوم، تصویر خیلی واضح‌تر است.

    هوش مصنوعی دیگر لازم نیست برای مدل مو، لباس یا ظاهر سوژه حدس بزند.

    نکته مهم اینجاست:

    جزئیات باید کمک‌کننده باشند، نه شلوغ‌کننده.

    اگر بیش از حد ریز و بی‌ربط بنویسی، ممکن است خروجی به‌هم‌ریخته شود.

    مثال ساده:

    • ضعیف:a dog
    • بهتر:a small brown dog with long ears and a red collar
  • مثال دیگر:  A young woman with long brown hair, round glasses, and a green jacket

 

 

 

یک زن جوان

  • در این مثال، سوژه فقط «یک زن» نیست.

    حالا ما می‌دانیم:

    • جوان است
    • موهای قهوه‌ای بلند دارد
    • عینک گرد زده
    • کت سبز پوشیده

    این‌ها همان جزئیاتی هستند که تصویر را از حالت عمومی درمی‌آورند.

محیط (Environment)

Environment یعنی جایی که سوژه در آن قرار دارد.

به زبان خیلی ساده، این بخش جواب می‌دهد به سؤال:

«سوژه کجاست؟»

محیط فقط یک پس‌زمینه ساده نیست.

خیلی وقت‌ها محیط تعیین می‌کند که تصویر چه حس‌وحالی داشته باشد و چقدر طبیعی یا جذاب به نظر برسد.

مثلاً یک مرد:

  • در خیابان بارانی
  • در کویر
  • داخل کافه
  • روی قله کوه
  • داخل سفینه فضایی

در هر کدام از این محیط‌ها، تصویر کاملاً فرق می‌کند.

اگر Environment را ننویسی، مدل خودش یک فضا برای سوژه می‌سازد.

گاهی این حدس خوب از آب درمی‌آید، ولی بیشتر وقت‌ها نتیجه دقیقاً آن چیزی نیست که تو می‌خواستی.

در توصیف محیط، این موارد مفیدند:

  • مکان اصلی
  • زمان تقریبی
  • آب‌وهوا
  • عناصر اطراف
  • فضای کلی صحنه

مثال ساده:

  • ضعیف:a woman standing
  • بهتر:a woman standing in a quiet modern cafe

مثال دیگر: A child playing in a snowy forest

در اینجا محیط خیلی واضح است:

  • جنگل
  • برفی
  • فضای باز

مثال کامل‌تر:

A male astronaut floating in deep space, surrounded by stars and blue light

در این مثال، فقط سوژه مهم نیست؛

محیط هم تصویر را جذاب‌تر و دقیق‌تر کرده:

  • فضای عمیق
  • ستاره‌ها
  • نور آبی

سبک هنری (Art Style)

Art Style یعنی ظاهر نهایی تصویر قرار است چه جور باشد.

این بخش مشخص می‌کند که عکس یا تصویر تو شبیه چه نوع کار بصری باشد.

مثلاً:

  • واقعی
  • سینمایی
  • کارتونی
  • انیمه
  • نقاشی دیجیتال
  • سه‌بعدی
  • مینیمال
  • فانتزی

اگر سبک را مشخص نکنی، مدل خودش تصمیم می‌گیرد تصویر را با چه حال‌وهوایی بسازد.

این تصمیم همیشه هم به نفع تو نیست.

سبک هنری یکی از مهم‌ترین بخش‌های پرامپت است، چون ظاهر کلی خروجی را شدیداً تغییر می‌دهد.

یک سوژه ثابت، اگر با سه سبک مختلف ساخته شود، می‌تواند سه تصویر کاملاً متفاوت بسازد.

مثلاً این سه پرامپت را ببین:

A cat sitting on a chair, realistic photo
A cat sitting on a chair, anime style
A cat sitting on a chair, oil painting

هر سه درباره یک گربه روی صندلی هستند،

اما نتیجه نهایی کاملاً فرق می‌کند.

در این بخش می‌توانی از عباراتی مثل این استفاده کنی:

  • realistic photo
  • cinematic
  • anime style
  • digital painting
  • watercolor painting
  • 3D render
  • fantasy art
  • minimalist illustration

مثال: A futuristic city at night, cyberpunk style

در این مثال، cyberpunk style فقط یک کلمه ساده نیست؛

دارد به مدل می‌گوید:

  • نورهای نئونی
  • فضای آینده‌نگر
  • حس تاریک و شهری
  • ظاهر مدرن و تکنولوژیک

یعنی سبک، ظاهر کلی تصویر را هدایت می‌کند.

نور (Lighting)

Lighting یعنی نور صحنه چگونه است و از کجا می‌تابد.

نور یکی از مهم‌ترین چیزهایی است که باعث می‌شود تصویر:

  • طبیعی‌تر به نظر برسد
  • حرفه‌ای‌تر دیده شود
  • حس خاصی پیدا کند

خیلی از کاربران تازه‌کار به نور توجه نمی‌کنند، بعد تعجب می‌کنند چرا تصویرشان بی‌روح یا مصنوعی شده است.

دلیلش روشن است: نور، بخش بزرگی از حس تصویر را می‌سازد.

برای مثال، یک صورت با:

  • نور نرم
  • نور شدید
  • نور غروب
  • نور نئون
  • نور شمع

پنج حس کاملاً متفاوت ایجاد می‌کند.

در توصیف نور، این چیزها مهم‌اند:

  • نوع نور
  • شدت نور
  • جهت نور
  • رنگ نور
  • زمان نور

عبارت‌های رایج برای این بخش:

  • soft lighting
  • golden hour light
  • studio lighting
  • dramatic lighting
  • neon lighting
  • natural daylight
  • backlighting

مثال ساده: A portrait of a young man, soft studio lighting

مثال دیگر: A woman standing by the window, warm sunset light

در مثال دوم، فقط نگفتیم نور هست؛

گفتیم:

  • نور گرم است
  • زمانش غروب است
  • از پنجره می‌آید

این یعنی تصویر برای مدل خیلی روشن‌تر می‌شود.

زاویه دوربین (Camera Angle)

Camera Angle یعنی دوربین از چه زاویه‌ای به سوژه نگاه می‌کند.

این بخش شاید در نگاه اول کوچک به نظر برسد، اما اثرش روی خروجی خیلی زیاد است.

گاهی مشکل یک تصویر این نیست که سوژه بد بوده یا نور اشتباه بوده؛

مشکل این است که زاویه دوربین مناسب نبوده.

زاویه دوربین می‌تواند تصویر را:

  • حرفه‌ای‌تر کند
  • دراماتیک‌تر کند
  • نزدیک‌تر و صمیمی‌تر کند
  • قوی‌تر یا ضعیف‌تر نشان دهد

مثلاً:

  • نمای نزدیک، حس جزئیات و تمرکز می‌دهد
  • نمای باز، محیط را بیشتر نشان می‌دهد
  • زاویه از پایین، سوژه را قدرتمندتر نشان می‌دهد
  • زاویه از بالا، سوژه را کوچک‌تر یا آسیب‌پذیرتر نشان می‌دهد

عبارت‌های رایج:

  • close-up shot
  • wide shot
  • low angle
  • high angle
  • front view
  • side view
  • over the shoulder
  • top-down view

مثال: A red sports car, low angle shot

در این مثال، زاویه پایین باعث می‌شود ماشین قدرتمندتر و جذاب‌تر به نظر برسد.

مثال دیگر:A close-up portrait of an old man

اینجا مدل می‌فهمد که باید روی چهره و جزئیات آن تمرکز کند، نه روی کل بدن یا پس‌زمینه.

حس‌وحال (Mood)

Mood یعنی تصویر چه احساسی باید منتقل کند.

این بخش کمک می‌کند خروجی فقط «درست» نباشد، بلکه حس‌دار هم باشد.

بعضی تصویرها از نظر فنی خوب هستند، اما هیچ حسی ندارند.

انگار فقط ساخته شده‌اند، نه اینکه چیزی منتقل کنند.

Mood این مشکل را حل می‌کند.

مثلاً یک خیابان در شب می‌تواند:

  • آرام باشد
  • مرموز باشد
  • ترسناک باشد
  • غمگین باشد
  • لوکس باشد

همه این‌ها به حس‌وحال تصویر بستگی دارند.

عبارت‌های رایج در این بخش:

  • calm
  • dreamy
  • mysterious
  • dramatic
  • joyful
  • melancholic
  • luxurious
  • cozy

مثال: A small cabin in the forest, cozy and peaceful mood

در اینجا Mood به مدل می‌گوید که فقط یک کلبه نسازد؛

بلکه کلبه‌ای بسازد که حس گرم، امن و آرام داشته باشد.

مثال دیگر: A rainy street at night, mysterious mood


این جمله ساده است، اما حس تصویر را خیلی خوب مشخص می‌کند.

موارد منفی (Negative Prompts)

Negative Prompts یعنی چیزهایی که نمی‌خواهی در تصویر وجود داشته باشند.

این بخش برای کنترل خطاها و خراب‌کاری‌های رایج هوش مصنوعی خیلی مهم است.

بعضی وقت‌ها مدل چیزهایی به تصویر اضافه می‌کند که اصلاً نمی‌خواستی:

  • متن‌های عجیب
  • واترمارک
  • دست اضافه
  • انگشت‌های خراب
  • چهره‌های کج‌وکوله
  • پس‌زمینه شلوغ
  • اشیای اضافی

Negative Prompts به مدل کمک می‌کند این اشتباه‌ها را کمتر تکرار کند.

این بخش مخصوصاً در سوژه‌هایی مثل:

  • چهره انسان
  • دست‌ها
  • بدن
  • صحنه‌های شلوغ
  • تصاویر تبلیغاتی

خیلی مهم می‌شود.

عبارت‌های رایج:

  • no text
  • no watermark
  • no extra fingers
  • no extra limbs
  • no blurry face
  • no distorted hands
  • no low quality
  • no background clutter

جمع‌بندی کوتاه این بخش

اگر بخواهم کل ماجرا را در یک جمله جمع کنم، ماجرا این است:

یک پرامپت خوب فقط اسم سوژه نیست؛ یک توصیف روشن و هدفمند از چیزی است که می‌خواهی ببینی.

پس هر بار که خواستی پرامپت بنویسی، این ۸ بخش را بررسی کن:

[Subject] + [Important Details] + [Environment] + [Art Style] + [Lighting] + [Camera Angle] + [Mood] + [Negative Prompts]

لازم نیست همیشه همه بخش‌ها را خیلی طولانی بنویسی.

اما هرچه این بخش‌ها واضح‌تر و هوشمندانه‌تر نوشته شوند، خروجی هوش مصنوعی هم بیشتر به چیزی که در ذهن داری نزدیک می‌شود.

۳. آموزش تصویری: ببین و یاد بگیر

مثال ۱: تفاوت «سوژه ساده» با «سوژه با جزئیات»

  • پرامپت بد: «یک زن»
  • پرامپت خوب: «یک زن جوان با موهای فر قهوه‌ای و لباس بافتنی کرم، در حال مطالعه کتاب، نور نرم پنجره»
  • چرا دومی بهتر است؟ چون به هوش مصنوعی «جزئیات» دادیم. وقتی فقط می‌گویی زن، هوش مصنوعی تصادفی انتخاب می‌کند.

[جایگاه تصویر ۱: یک عکس پرتره از خانمی در حال مطالعه با نور ملایم]

پرامپت پیشنهادی برای تولید این عکس: A young woman with curly brown hair, wearing a beige knitted sweater, reading a book, soft window lighting, realistic photography.


مثال ۲: جادوی «سبک هنری»

  • پرامپت بد: «یک شهر»
  • پرامپت خوب: «یک شهر مدرن در شب، سبک سایبرپانک، نورهای نئون آبی و بنفش، باران روی خیابان»
  • چرا دومی بهتر است؟ کلمه «سایبرپانک» (Cyberpunk) یک سبک هنری است که به هوش مصنوعی می‌گوید دقیقاً چه فضایی را بسازد.

[جایگاه تصویر ۲: شهری مدرن و بارانی با رنگ‌های نئونی]

پرامپت پیشنهادی: A modern city at night, cyberpunk style, neon blue and purple lights, rain on the street, cinematic shot.


مثال ۳: قدرت «نورپردازی»

  • پرامپت بد: «یک گربه»
  • پرامپت خوب: «یک گربه سیاه نشسته روی چوب، نور طلایی غروب خورشید از کنار، هایلایت‌های درخشان روی موهای گربه»
  • چرا دومی بهتر است؟ نور طلایی (Golden Hour) یکی از محبوب‌ترین ترفندهای عکاسان است که به عکس‌ها عمق و جذابیت می‌دهد.

[جایگاه تصویر ۳: گربه‌ای که نور غروب خورشید به کناره‌های بدنش تابیده]

پرامپت پیشنهادی: A black cat sitting on a wooden log, golden hour sunlight hitting from the side, detailed fur, highlighting edges of the cat, professional photography.


مثال ۴: تغییر «زاویه دوربین»

  • پرامپت بد: «یک ماشین اسپرت»
  • پرامپت خوب: «یک ماشین اسپرت قرمز در جاده ساحلی، نمای نزدیک از چراغ‌ها و جلوی ماشین، زاویه پایین (Low Angle)»
  • چرا دومی بهتر است؟ زاویه پایین به سوژه‌هایی مثل ماشین حس قدرت و عظمت می‌دهد.

[جایگاه تصویر ۴: نمای نزدیک و قدرتمند از چراغ‌های یک ماشین قرمز]

پرامپت پیشنهادی: A red sports car on a coastal road, close-up on headlights and car front, low angle shot, sleek design, commercial photography.


مثال ۵: استفاده از «موارد منفی» (برای رفع ایرادات)

  • پرامپت بد: «یک فوتبالیست در حال دویدن» (احتمالاً دست یا پاهای عجیبی می‌سازد)
  • پرامپت خوب: «یک فوتبالیست در حال دویدن در استادیوم، سبک رئالیستیک، بدون دست اضافه، بدون چهره‌ تغییرشکل‌یافته، بدون واترمارک»
  • چرا دومی بهتر است؟ گاهی هوش مصنوعی گیج می‌شود (مخصوصاً در مورد اعضای بدن). گفتنِ «چه چیزی را نمی‌خواهیم» به اندازه چیزی که می‌خواهیم مهم است.

[جایگاه تصویر ۵: فوتبالیستی در حال دویدن با جزئیات درست دست و پا]

پرامپت پیشنهادی: A soccer player running in a stadium, realistic style, high quality, --no extra limbs, deformed face, blurry watermark.

نکات استراتژیک: چطور حرفه‌ای‌تر شویم؟

فارسی بنویسیم یا انگلیسی؟

بیشتر ابزارهای هوش مصنوعی (مثل میدجورنی) با انگلیسی بهتر کار می‌کنند. اما لازم نیست حتما زبانت خوب باشه چون بهت یه سری تکنیک میدم

از گوگل ترنسلیت استفاده کن

یا میتونی :

  • ایده را فارسی بنویس، بعد بده به خودِ ChatGPT تا آن را به یک پرامپت انگلیسی حرفه‌ای تبدیل کند.
  • مثلاً به چت‌جی‌پی‌تی بگو: «این ایده من است: [ایده فارسی]. آن را به یک پرامپت حرفه‌ای انگلیسی برای تولید عکس تبدیل کن.»

چطور پرامپت را مرحله‌به‌مرحله بهتر کنیم؟

اگر عکس اولی که ساختی بد بود، نزن زیر همه چیز!

  • فقط یک المان را تغییر بده. مثلاً فقط سبک را عوض کن (از واقعی به کارتونی).
  • نور را تغییر بده (از نور روز به نور شب).
  • این روشِ «تکرار و اصلاح» (Iterative Process) راز اصلیِ کسانی است که عکس‌های بی‌نظیر می‌سازند.

۷ اشتباه رایج که عکس شما را زشت می‌کند

  1. بیش از حد شلوغ نوشتن: جملات طولانی هوش مصنوعی را گیج می‌کند.
  2. فراموش کردن «سبک»: اگر سبک را نگویی، هوش مصنوعی خودش تصمیم می‌گیرد (معمولاً هم بد تصمیم می‌گیرد!).
  3. انتظار کمال از تلاش اول: حتی حرفه‌ای‌ها هم ۱۰ بار یک پرامپت را تغییر می‌دهند تا به نتیجه دلخواه برسند.
  4. ننوشتن زاویه دوربین: عکس «تخت» می‌شود.
  5. ننوشتن نورپردازی: عکس «مصنوعی» به نظر می‌رسد.
  6. نادیده گرفتن بافت (Texture): مثلاً نوشتنِ «بافت چرم» یا «بافت فلز» عکس را واقعی‌تر می‌کند.
  7. تکیه بر شانس: همیشه فرمول را رعایت کن.

نکته مهم در پرامپت نویسی

مهم ترین اصل پرامپت این هست که بتونی خیلی شفاف بهش خواسته ای که داری رو بگی  و نکته مهمتر اینکه  برای اینکه بتونی به صورت شفاف به هوش مصنوعی بگی که چی میخوای  باید خودت به صورت شفاف بدونی که واقعا جی میخوای ؟
نکته دوم : 

تو قرار نیست که برایی  هر عکسی که میخوای بسازی یه پرامپت حرفه ای بسازی  چون اصلا ارزشی برات نداره این کار و وقت تلف کردن هست مثلا من برای تولید عکسای این مقاله از هوش مصنوعی کمک گرفتم ولی وقتی بخوام برای  یه عکس حرفه ای بسازم مطمن باش حداق نیم ساعت وقت میزارم  اما قبلش به این فک میکنم  که از هوش مصنوعی  چی میخوام تا شفاف  پرامپت را بنویسیم و پرامپت نویسی یعنی شفاف نویسی

جمع‌بندی

پرامپت‌نویسی مثل آشپزی است. مواد اولیه (سوژه، محیط) مهم هستند، اما ادویه‌ها (نور، سبک، زاویه) هستند که مزه غذا (خروجی عکس) را تعیین می‌کنند. الان که فرمول طلایی را داری، پیشنهاد می‌کنم همین الان یکی از پرامپت‌های بالا را کپی کنی و در یکی از ابزارها تست کنی.

قدم بعدی تو چیست؟

یادگیری پرامپت‌نویسی مثل یک عضله است؛ هرچه بیشتر تمرین کنی، قوی‌تر می‌شوی.