اخبار

Stability AI از سری مدل‌های هوش مصنوعی StableLM رونمایی کرد؛ جایگزین متن‌باز ChatGPT

شرکت Stability AI به‌تازگی یک خانواده متن‌باز از مدل‌های زبانی هوش مصنوعی را منتشر کرده است که StableLM نام دارد. این شرکت امیدوار است که با این محصول بتواند اثری شبیه به Stable Diffusion در دنیای مدل‌های متن‌باز تصویری را تکرار کند. StableLM به‌خاطر ماهیت خود می‌تواند برای تولید جانشین‌های ChatGPT استفاده شود.

StableLM درست مثل GPT-4، محصول شرکت OpenAI، با پیش‌بینی واژه بعدی در یک جمله دست به تولید متن می‌زند. این خانواده البته درواقع بیشتر سعی کرده است که با وجود در اختیار داشتن پارامترهای کمتر، عملکردی شبیه به GPT-3 داشته باشد. GPT-3 حدود 175 میلیارد پارامتر دارد.

ساخت StableLM با ملاحظات فراوان صورت گرفته است

این پارامترها متغیرهایی هستند که مدل‌های زبانی از آن‌ها برای آموزش داده‌ها استفاده می‌کنند. استفاده از پارامترهای کمتر می‌تواند به کوچک‌تر و بهینه‌ترشدن مدل‌ها کمک کند، اما اگر بخواهیم عملکردی مشابه با مدل‌های بزرگ‌تر داشته باشیم، باید آن‌ها را با مهارت و دقت بسیار بالا مهندسی کنیم.

Stability AI می‌گوید StableLM را روی مجموعه تازه‌ای از داده‌های آزمایشی بر پایه مجموعه متن‌بازی از داده‌ها موسوم به The Pile آموزش داده است. این شرکت ادعا می‌کند که غنای این داده‌ها عامل اصلی عملکرد شگفت‌انگیز این مدل کوچک بوده است.

وب‌سایت آرس‌تکنیکا می‌گوید در آزمایشی که با مدل 7 میلیارد پارامتری StableLM انجام داده، دریافته است که این مدل عملکردی بهتر از مدل 7 میلیارد پارامتری LLaMA شرکت متا دارد، بااین‌حال مدل GPT-3 احتمالاً توانمندتر و انعطاف‌پذیرتر است.

جزئیات فنی کامل خانواده StableLM قرار است در آینده نزدیک به اشتراک گذاشته شود.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *