راهنمای اجرای SDXL

معرفی SDXL

Stable Diffusion XL (SDXL) نسل جدید مدل‌های تولید تصویر است که کیفیت بسیار بالاتری نسبت به نسخه‌های قبلی ارائه می‌دهد.
این مدل حدود ۳.۵ میلیارد پارامتر دارد و رزولوشن پیش‌فرض آن ۱۰۲۴×۱۰۲۴ پیکسل است؛ به همین دلیل خروجی‌های آن طبیعی‌تر، دقیق‌تر و چشم‌نوازتر هستند.


سخت‌افزار مورد نیاز

برای اجرای SDXL نیاز است که سیستم شما حداقل مشخصات زیر را داشته باشد:

  • حداقل 8GB VRAM (ترجیحاً 12GB یا بیشتر)
  • حداقل 16GB RAM
  • حدود 20GB فضای خالی در دیسک
  • کارت‌های NVIDIA با پشتیبانی از CUDA مناسب‌ترین گزینه هستند

اگر GPU ضعیف‌تری دارید، بخش «بهینه‌سازی عملکرد» در ادامه می‌تواند به شما کمک کند.


مرحله ۱: نصب AUTOMATIC1111 WebUI

اگر WebUI را هنوز نصب نکرده‌اید، ابتدا آن را دانلود کنید:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui

WebUI محبوب‌ترین رابط کاربری Stable Diffusion است و از SDXL کاملاً پشتیبانی می‌کند.


مرحله ۲: دانلود مدل SDXL

دو فایل اصلی SDXL را دانلود کنید:

  • sd_xl_base_1.0.safetensors (حدود 6.9GB)
  • sd_xl_refiner_1.0.safetensors (اختیاری، اما برای جزئیات بیشتر توصیه می‌شود)

سپس این فایل‌ها را در مسیر زیر قرار دهید:

models/Stable-diffusion/

مرحله ۳: دانلود VAE

برای بهبود کیفیت رنگ‌ها، سایه‌ها و کنتراست، VAE اختصاصی SDXL را دانلود کنید:

  • فایل: sdxl_vae.safetensors

و آن را در مسیر زیر قرار دهید:

models/VAE/

مرحله ۴: تنظیمات WebUI

پس از اجرای WebUI، وارد بخش Settings شوید و تغییرات زیر را اعمال کنید:

  • در منوی Stable Diffusion
    مدل SDXL Base 1.0 را انتخاب کنید
  • در منوی User Interface
    رزولوشن پیش‌فرض را روی 1024x1024 قرار دهید
  • در منوی Optimizations
    گزینه xformers را فعال کنید تا سرعت و مصرف VRAM بهینه شود

پس از تغییرات، WebUI را Reload UI کنید.


مرحله ۵: تولید اولین تصویر

در تب txt2img، یک پرامپت دلخواه وارد کنید و تنظیمات پیشنهادی زیر را اعمال کنید:

  • Sampling steps: 30 تا 40
  • Sampler:
    DPM++ 2M Karras یا Euler a
  • CFG Scale: بین 7 تا 9
  • Size: 1024×1024

سپس روی Generate کلیک کنید تا اولین تصویر SDXL شما تولید شود.


استفاده از Refiner (اختیاری)

مدل Refiner برای بهبود جزئیات نهایی تصویر استفاده می‌شود.

برای فعال‌سازی:

  1. وارد بخش Script شوید
  2. گزینه Refiner را انتخاب کنید
  3. مدل sd_xl_refiner_1.0 را بارگذاری کنید
  4. مقدار Switch at را روی 0.8 قرار دهید

این یعنی 80 درصد کار توسط Base و 20 درصد آخر توسط Refiner انجام شود.


بهینه‌سازی عملکرد

اگر با خطای کمبود VRAM مواجه شدید، پارامترهای زیر را به فایل COMMANDLINE_ARGS (یا اسکریپت اجرای WebUI) اضافه کنید:

--medvram --xformers --opt-sdp-attention

در صورت نیاز بیشتر:

--lowvram

نکته: حالت lowvram مصرف حافظه را کم می‌کند اما سرعت تولید تصویر کاهش می‌یابد.


نکات پرامپت‌نویسی برای SDXL

SDXL به زبان طبیعی بسیار بهتر پاسخ می‌دهد.

به جای کلمات کوتاه:

mountain, sunset, golden hour

بهتر است از یک جمله کامل و توصیفی استفاده کنید:

A serene mountain landscape at sunset with warm golden light and soft clouds

این مدل جملات توصیفی را بهتر می‌فهمد و جزئیات بهتری تولید می‌کند.


اگر نمی‌خواهی وقتت را صرف نصب و تنظیمات سرور کنی، می‌توانی یک سرور کاملاً آماده و از قبل پیاده‌سازی‌شده تهیه کنی و بلافاصله کار با GPU را شروع کنی.