راهنمای اجرای SDXL
معرفی SDXL
Stable Diffusion XL (SDXL) نسل جدید مدلهای تولید تصویر است که کیفیت بسیار بالاتری نسبت به نسخههای قبلی ارائه میدهد.
این مدل حدود ۳.۵ میلیارد پارامتر دارد و رزولوشن پیشفرض آن ۱۰۲۴×۱۰۲۴ پیکسل است؛ به همین دلیل خروجیهای آن طبیعیتر، دقیقتر و چشمنوازتر هستند.
سختافزار مورد نیاز
برای اجرای SDXL نیاز است که سیستم شما حداقل مشخصات زیر را داشته باشد:
- حداقل 8GB VRAM (ترجیحاً 12GB یا بیشتر)
- حداقل 16GB RAM
- حدود 20GB فضای خالی در دیسک
- کارتهای NVIDIA با پشتیبانی از CUDA مناسبترین گزینه هستند
اگر GPU ضعیفتری دارید، بخش «بهینهسازی عملکرد» در ادامه میتواند به شما کمک کند.
مرحله ۱: نصب AUTOMATIC1111 WebUI
اگر WebUI را هنوز نصب نکردهاید، ابتدا آن را دانلود کنید:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui
WebUI محبوبترین رابط کاربری Stable Diffusion است و از SDXL کاملاً پشتیبانی میکند.
مرحله ۲: دانلود مدل SDXL
دو فایل اصلی SDXL را دانلود کنید:
sd_xl_base_1.0.safetensors(حدود 6.9GB)sd_xl_refiner_1.0.safetensors(اختیاری، اما برای جزئیات بیشتر توصیه میشود)
سپس این فایلها را در مسیر زیر قرار دهید:
models/Stable-diffusion/
مرحله ۳: دانلود VAE
برای بهبود کیفیت رنگها، سایهها و کنتراست، VAE اختصاصی SDXL را دانلود کنید:
- فایل:
sdxl_vae.safetensors
و آن را در مسیر زیر قرار دهید:
models/VAE/
مرحله ۴: تنظیمات WebUI
پس از اجرای WebUI، وارد بخش Settings شوید و تغییرات زیر را اعمال کنید:
- در منوی Stable Diffusion
مدلSDXL Base 1.0را انتخاب کنید - در منوی User Interface
رزولوشن پیشفرض را روی1024x1024قرار دهید - در منوی Optimizations
گزینهxformersرا فعال کنید تا سرعت و مصرف VRAM بهینه شود
پس از تغییرات، WebUI را Reload UI کنید.
مرحله ۵: تولید اولین تصویر
در تب txt2img، یک پرامپت دلخواه وارد کنید و تنظیمات پیشنهادی زیر را اعمال کنید:
- Sampling steps: 30 تا 40
- Sampler:
DPM++ 2M KarrasیاEuler a - CFG Scale: بین 7 تا 9
- Size: 1024×1024
سپس روی Generate کلیک کنید تا اولین تصویر SDXL شما تولید شود.
استفاده از Refiner (اختیاری)
مدل Refiner برای بهبود جزئیات نهایی تصویر استفاده میشود.
برای فعالسازی:
- وارد بخش Script شوید
- گزینه Refiner را انتخاب کنید
- مدل
sd_xl_refiner_1.0را بارگذاری کنید - مقدار Switch at را روی
0.8قرار دهید
این یعنی 80 درصد کار توسط Base و 20 درصد آخر توسط Refiner انجام شود.
بهینهسازی عملکرد
اگر با خطای کمبود VRAM مواجه شدید، پارامترهای زیر را به فایل COMMANDLINE_ARGS (یا اسکریپت اجرای WebUI) اضافه کنید:
--medvram --xformers --opt-sdp-attention
در صورت نیاز بیشتر:
--lowvram
نکته: حالت lowvram مصرف حافظه را کم میکند اما سرعت تولید تصویر کاهش مییابد.
نکات پرامپتنویسی برای SDXL
SDXL به زبان طبیعی بسیار بهتر پاسخ میدهد.
به جای کلمات کوتاه:
mountain, sunset, golden hour
بهتر است از یک جمله کامل و توصیفی استفاده کنید:
A serene mountain landscape at sunset with warm golden light and soft clouds
این مدل جملات توصیفی را بهتر میفهمد و جزئیات بهتری تولید میکند.