ترفند جالب هوش‌مصنوعی برای تبدیل متن به تصویر

alireza.khodaei۲۶ شهریور ۱۴۰۱

۰ 193 خواندن این مطلب 3 دقیقه زمان میبرد

ترفند جالب هوش‌مصنوعی برای تبدیل متن به تصویر

این ترفند بسیار هیجان‌انگیز است و به کاربران امکان می‌دهد تصاویر و آثار هنری را به کمک محتوای تولید شده توسط هوش مصنوعی گسترش دهند.

شرکت (Open AI)، یک شرکت توسعه دهنده مولد متن به تصویر (DALL- E ۲) به تازگی ویژگی جدیدی را برای این برنامه به نام “خارج سازی” ایجاد کرده است. این قابلیت جدید، به کاربران امکان می‌دهد تصاویر و آثار هنری را به کمک محتوای تولید شده توسط هوش مصنوعی گسترش دهند. این ترفند بسیار هیجان انگیز است و قابلیت‌های ابزاری را به شدت گسترش می‌دهد. این ابزار یکی از محبوب‌ترین مولد‌های تبدیل متن به تصویر است که در حال حاضر موجود است. با بیش از یک میلیون کاربر جای تعجب نیست که محتوای ایجاد شده توسط این ابزار در همه جا وجود داشته باشد. بسیاری از تبدیل کننده‌های متن به تصویر دیگر یا در نسخه بتا بسته هستند، یا در دسترس عموم نیستند، مانند (Imagen Google) یا از نظر دامنه محدودتر هستند، مانند (Craiyon).

این ابزار یک پیام متنی مانند “فضانوردی سوار بر اسب به سبک اندی وارهول” می‌گیرد و ۹ تصویر در ۱۰۲۴ پیکسل ایجاد می‌کند و آن را نشان می‌دهد. برای این کار از فرآیندی به نام انتشار استفاده می‌کند که با نویز تولید شده و به‌طور تصادفی شروع می‌شود سپس آن را ویرایش می‌کند تا با ویژگی‌های برجسته اعلان مطابقت داشته باشد. تا پیش از این، کاربران در اندازه و نسبت ابعادی که می‌توانستند با (DALL-E ۲) ایجاد کنند، محدود بودند. برنامه هوش مصنوعی تنها می‌توانست مربع‌های ۱۰۲۴ پیکسل در ۱۰۲۴ پیکسل ایجاد کند که چیزی بزرگتر از اندازه یا شکل متفاوتی خارج از چارچوب بود. امکان استفاده از قابلیتی به نام “inpainting” برای اصلاح جزئیات در آثار هنری موجود وجود داشت، اما در واقع ایجاد یک بوم بزرگتر با استفاده از برنامه‌ای مانند فتوشاپ بود. برای نسبت‌های مختلف می‌توانستید تصویر خود را برش دهید، اما وضوح کلی را کاهش می‌داد.

اکنون تنها محدودیتی که کاربران با آن روبرو هستند به غیر از فیلتر‌های محتوا تعداد اعتبار‌هایی است که دارند. هر کس ۵۰ اعتبار تولید رایگان در طول ماه اول خود دریافت می‌کند و ۱۵ اعتبار برای استفاده هر ماه بعد از آن و ۱۱۵ اعتبار اضافی را می‌توان تنها با ۱۵ دلار خریداری کرد. ایجاد یک تصویر اولیه مانند هر بخش اضافی به یک اعتبار نیاز دارد. کاربران یک منطقه مربع شکل ۱۰۲۴ در ۱۰۲۴ پیکسل را انتخاب می‌کنند که می‌خواهند تصویر را در آن گسترش دهند و می‌توانند هر گونه درخواست اضافی را برای هدایت هوش مصنوعی مشخص کنند. به عنوان مثال، برای افزودن پس‌زمینه بیشتر به فضانورد سوار بر اسب، می‌توانید دستور را به «فضانوردی سوار بر اسب روی ماه با ستاره‌هایی در پس‌زمینه به سبک اندی وارهول» تغییر دهید.

برای هر بخش بدون رنگ، (DALL-E ۲) چهار امکان را در اختیار کاربران قرار می‌دهد تا انتخاب کنند. اگر هیچ یک از آن‌ها برای تصویر مناسب نبود می‌توانید دوباره رنگ‌های دیگری امتحان کنید. جالب‌تر از همه، رنگ‌آمیزی عناصر بصری موجود در تصویر‌ها از جمله سایه‌ها، بازتاب‌ها و بافت‌ها است که آن‌ها را نیز در نظر می‌گیرد. این بدان معنی است که جزئیات اضافه شده زمینه تصویر را حفظ می‌کند و می‌تواند واقعاً مانند بخشی از یک کل منسجم به نظر برسد. در (DALL-E ۲) برای نقاشی یک تایم لپس وجود دارد به طور مثال در نقاشی دختری با گوشواره مروارید اثر یوهانس ورمیر اثر تا حدود ۲۰ برابر اندازه اصلی خود افزایش داشته است. این نقاشی پرتره ساده زن جوانی را نشان می‌دهد که در خانه‌ای به هم ریخته ایستاده است. دیدن آن بسیار جذاب است، زیرا تا زمانی که خیلی از نزدیک نگاه نکنیدواقعاً متوجه سبک و حال و هوای کلی آن نمی‌شوید. تقریباً شبیه یک فیلم خیالی در پشت صحنه است. اگر می‌خواهید نقاشی کردن را امتحان کنید، باید در (DALL-E ۲) ثبت‌نام کنید. این هوش مصنوعی در حال حاضر یک لیست انتظار در حال اجرا دارد. اگر می‌خواهید ثبت نام کنید، می‌توانید این کار را در آنجا انجام دهید.

منبع: پول‌نیوز

برچسب ها