استفاده از هوش مصنوعی برای رندر سه بعدی - قسمت دوم
چطور سردرگم نباشیم: با استفاده از مدل های آموزش دیده سفارشی
تاکنون در این مقاله، استفاده از هوش مصنوعی در طراحی، در درجه اول حول محور سرعت و ظرفیت آن برای خلق مشارکتی(هم به روش سنتی و هم با هوش مصنوعی ) بوده است. با این حال، به دلیل این واقعیت که بیشتر مدلها به صورت کلی طراحی شدهاند، یک چالش رایج وجود دارد که نیاز به مهندسی سریع و پیچیده برای طراحی یک سبک خاص است.
اگر هدف ما این باشد که از این تصاویر برای محصولی استفاده کنیم که چشم انداز خاصی برای آن داریم، می توانیم با بازی کردن با تصویر ساز هوش مصنوعی، به سرعت تصاویر مختلفی ایجاد کنیم و بارها و بارها درخواستها را تغییر دهیم تا زمانی که چیزی مناسب برای پروژه خود پیدا کنیم.
خوشبختانه، مدلهای دیفیوژن را میتوان آموزش داد تا در یک سبک یا جهت هنری خاص، متخصص شوند. با گردآوری منابع الهامبخش، میتوانیم مدلهای خود را با استفاده از ابزارهایی مانند* Dreambooth آموزش دهیم تا همچنان کنترل خلاقانهای را که برای حفظ آن تلاش کردهایم، حفظ کنیم.
(*مدل دیفیوژن (Diffusion) یا انتشار به این معنی است که هوش مصنوعی ابتدا ابری از نقاط یا پیکسلها را ایجاد میکند و به تدریج با حذف این پیکسلها یک تصویر را مطابق دستور شما و بانک اطلاعاتی خود شکل میدهد.)
(*Dream Booth: یک مدل کاملاً جدید انتشار متن به تصویراست که توسط گوگل ارائه شده و هدف اصلی این مدل اتصال کاربران به مدل انتشار متن به تصویر با دادن منابعی است که کاربران برای تولید بازنمایی های واقعی از نمونه های موضوع انتخابی خود به آنها نیاز دارند.)
هوش مصنوعی در مراحل اولیه طراحی مانند توسعه یک مفهوم داخلی و در زمان طوفان های فکری بسیار سودمند است. اگر ابزارهای هوش مصنوعی به درستی آموزش داده شوند، مدل و تصاویر تولید شده توسط آنها به عنوان پایه ای برای بحث های خلاقانه در تیم عمل می کنند و طیف وسیعی از امکانات را برای الهام گرفتن و ایده پردازی های اولیه ارائه می دهند.
شاید من کمی بیش از حد خوشبین باشم، اما در ذهن من، هدف از به کارگیری هوش مصنوعی در جریانِ کارِ طراحی، جایگزینی نیاز به هنرمندان نیست، بلکه تقویت و تسریع مرحله مفهومی قبل از تخصیص بودجه برای مشارکت هنرمندان است. این رویکرد مشابه همان کاری است که در حال حاضر هر طراح انجام میدهد. یعنی جمعآوری تصاویر آنلاینی که با سبک کلی برای مراحل اولیه طراحی یک مفهوم مطابقت دارند، که بعداً به داراییهای معتبر یا آثار هنری سفارشی تبدیل میشوند.
این طرز فکر در مورد استفاده از هوش مصنوعی به عنوان ابزاری است که خلاقیت انسان را تکمیل میکند و به کشف سریع ایدهها و جهت گیری های اولیه کمک میکند، در حالی که ارزش هنرمند حرفهای را در به ثمر رساندن چشم انداز نهایی طراحی به رسمیت می شناسد.
استفاده از هوش مصنوعی برای ایجاد سریع تصاویر و نگاره ها، در فرآیند های کاری طراحی سه بعدی ، در واقع فقط گوشه کوچکی از یک کار بزرگ است. نوآوری ها با سرعت سرسام آوری در حال پیشرفت هستند . من شکی ندارم که هوش مصنوعی آینده رندرینگ است و نرم افزارهای رندرینگ هوش مصنوعی به صورت بومی با نرم افزارهای سه بعدی و همچنین موتورهای بازی سازی عرضه خواهند شد. در واقع، هوش مصنوعی در حال حاضر برای حذف نویز و ارتقاء رندر در نرم افزار Blender، و همچنین بهینه سازی زمان رندر در جدیدترین المان های نرم افزار Pixar، بهینه سازی نرخ فریم در نرم افزارUnreal Engine استفاده می شود.
کنترل روی سبک و ترکیب بندی، همچنان مانع اصلی برای پذیرش گستردهتر این روش کاری در طراحی است. علاوه بر این، یادگیری نحوه استفاده از ابزارهایی مانند نرم افزار Stable Diffusion هنوز یک موضوع بسیار گیج کننده و تخصصی است. فناوری پشت مدلهای انتشار، که برای افرادی که مدرکی در زمینه شبکههای عصبی و علوم رایانه ندارد، در هالهای از ابهام قرار دارد. علاوه بر این، رابطهایی که کاربران باید با آنها تعامل داشته باشند، به دلیل سرعت زیاد توسعهدهندگان در ساخت آنها و پیشرفتهای زیادی که در آن ها دیده می شود، عمدتاً کمکی نمی کنند.
ابزارهایی مانند *Spline در خط مقدم دستیابی به رندرهای سه بعدی و هوش مصنوعی برای طیف وسیع تری از طراحان قرار دارند. اخیراً، این نرم افزار برداشت خود را از رندرهای هوش مصنوعی "تغییر سبک" ارائه کرده است که از تکنیک هایی مشابه آنچه امروز در مورد آن صحبت کردیم استفاده می کند. این نوع نرم افزارها با ساده کردن این فرآیندهای پیچیده، توانایی ایجاد تصاویری با کیفیت بالا را برای عموم مردم فراهم می کنند و بدون در نظر گرفتن تخصص فنی، فرصت های جدیدی را برای طراحان ایجاد می کنند.
(*Spline: یک ابزار جدید طراحی سه بعدی مبتنی بر هوش مصنوعی است که انقلابی در نحوه ایجاد و تجسم مدل های سه بعدی ایجاد کرده است . با استفاده از این نرم افزار، کاربران می توانند اشیاء و صحنه های سه بعدی را با استفاده از دستورهایی به زبان طبیعی تولید و ویرایش کنند، و ایجاد محتوای سه بعدی با کیفیت را آسان تر و سریع تر از همیشه می کند.)
با نگاهی به آینده، مرز بزرگ در حال تکامل بعدی در این چشم انداز ، تولید ویدئو های سه بعدی است. استارتآپهایی مانند Runway و همچنین ابزارهای منبع بازی مانند مدل انتشار *SVD یا AnimateDiff در حال پیشرفت سریع هستند و به کاربران اجازه میدهند تصاویری را که تولید میکنند، متحرک کنند.
(*SVD : یک مدل انتشار است که یک تصویر ثابت را به عنوان یک فریم می گیرد و از آن یک فیلم تولید می کند. )
تاکنون، حرکت از یک فریم ثابت محدود بود، اما خروجیهای نرم افزارvideo2video بهتر و بهتر میشوند و به ما امکان میدهند تا پتانسیل کامل استفاده از رندر هوش مصنوعی را در انیمیشنهای یک محصول ببینیم.
من (آنتوان ویدال) دوست دارم یک مقاله تکمیلیِ فنی تر در مورد چگونگی ترکیب برخی از این نوآوری ها و ایجاد پویایی بیشتر در آثار خلاقانه خود بنویسم. اگر شما هم به این موضوع علاقه مند هستید، کافی است که فقط پیشنهادات خودتان را، در بخش نظرات این مقاله با من در میان بگذارید.
نوشتۀ آنتوان ویدال
مطالب مرتبط
افراد دارای مهارت در این زمینه
در صورتی که در این زمینه تخصص یا مهارتی دارید، پس از ثبت نام در سایت و تکمیل فرم مشخصات شخصی ، پروفایل خود را به لیست زیر اضافه نمایید .