شرکت OpenAI، سازنده چتبات ChatGPT، یک مدل قدرتمند تبدیل متن به تصویر به نام DALL-E هم دارد که بهزودی احتمالاً نسل بعدی آن معرفی میشود. اخیراً کاربری که در آزمایش آلفای این مدل حضور داشته، تصاویری از عملکرد DALL-E 3 را به نمایش گذاشته است و بهنظر میرسد که با پیشرفتهای چشمگیری روبهرو هستیم.
به گزارش Decoder، یک منبع ناشناس در دیسکورد جزئیاتی را از تجربه آزمایش DALL-E 3 به اشتراک گذاشته است. او اولینبار در ماه مه ظاهر شد و اعلام کرد که بخشی از گروه آزمایش آلفای این مدل هوش مصنوعی بوده است و تصاویری را از عملکرد این نرمافزار منتشر کرد. همین کاربر، چندی قبل دوباره به دیسکورد بازگشت تا تجربه آزمایش نسخه جدیدتر این برنامه را به اشتراک بگذارد.
او میگوید قبلاً هم برای آزمایش DALL-E و DALL-E 2 با OpenAI همکاری داشته و حالا از طریق ایمیل به این آزمایش آلفای این نسخه دعوت شده است. بنابراین حدس زده میشود که این نسخه DALL-E 3 باشد؛ هرچند OpenAI هنوز چیزی را دراینباره تأیید نکرده است.
نمونههایی از تصاویر تولیدشده با DALL-E 3
نسل جدید DALL-E درمجموع عملکرد بهتری در تولید متن دارد، درحالیکه اکثر رقبا حتی Stable Diffusion و میدجرنی در این زمینه با مشکل مواجه هستند. برای مثال، در میان تصاویر این هوش مصنوعی میتوانید تصویری از تلفیق جذاب عبارت Hello World در یک دیوار رنگی را ببینید.
DALL-E 3 همچنین درزمینه تصویرسازی از انسانها عملکرد خیلی خوبی دارد. در یکی از تصاویر سه مرد را در بالای گودالی میبینیم که شخصیت کارتونی «شرک» در آن قرار دارد. با بررسی تصاویری که او در ماه مه و ژوئیه منتشر کرده است نیز میتوانیم پیشرفتهای چشمگیری را در عملکرد این مدل ببینیم.
یکی از این تصاویر با این فرمان ساخته شده است: «یک پاندای عصبانی و یک دلقک با لباس صورتی سوار بر دوچرخههای پنیری در جنگلی مهآلود، روی زمینی گلآلود در رقابت و درحال زدن کف دست خود به یکدیگر.» در بالا میتوانید نمونه ساختهشده با نسخه ماه مه DALL-E 3 را ببینید. اما نسخه جدید این تصویر در ماه ژوئیه پیشرفتهای زیادی داشته و در ادامه قابل مشاهده است.
منبع گزارش امروز میگوید نسخه آلفای DALL-E 3 محدودیت خاصی ندارد و حتی میتوانید با آن تصاویر حاوی کپیرایت و خشن تولید کنید. درحالحاضر مشخص نیست که این مدل هوش مصنوعی جدید چه زمانی برای عموم کاربران عرضه خواهد شد.