محققان متا یک مدل زبان هوش مصنوعی جدید با نام Toolformer را معرفی کردهاند که قدرت یادگیری کار کردن با برخی برنامهها از جمله موتورهای جستجو، ماشین حساب و تقویم را دارد.
مدلهای زبانی مانند ChatGPT که در چند وقت گذشته مورد توجه زیادی قرار گرفته، در زمینه پردازش زبان طبیعی انقلابی ایجاد کردهاند، اما هنوز در انجام برخی وظایف مانند محاسبه و راستی آزمایی مشکلاتی دارند.
نکته کلیدی Toolformer این است که میتواند از APIها استفاده کند. محققان متا در طول آزمایشهای خود، مجموعه کوچکی از نمونههای نوشته شده توسط انسان را برای Toolformer ارائه کردند که نحوه استفاده از هر API را نشان میداد و سپس به آن اجازه دادند تا مجموعه داده مدلسازی زبان بزرگی را براساس دستورات بالقوه API تفسیر کند.
قابلیت تصمیمگیری و عملکرد مستقل ابزار هوش مصنوعی متا
محققان توضیح میدهند که Toolformer موفق شده این کار را به روشی «خود ناظر» انجام دهد، به این معنی که بدون نیاز به راهنمایی انسان میتواند یاد بگیرد. علاوه بر این، Toolformer میتواند خودش تصمیم بگیرد که از کدام ابزار برای دریافت زمینه مناسب و نحوه استفاده از آن استفاده کند.
قابلیت فراخوانی API باعث میشود تا ابزار Toolformer بتواند از نرمافزارهای خارجی مانند موتورهای جستجو، ماشین حساب و موارد دیگر استفاده کند. به عنوان مثال، مدلهای زبان بزرگ (LLM) به دلیل نداشتن مهارت در محاسبه معروف هستند و Toolformer با استفاده از برنامه ماشین حساب میتواند این محدودیت را برطرف کند.
Toolformer براساس یک مدل GPT-J از پیش آموزش دیده با 6.7 میلیارد پارامتر ساخته شده است. براساس آزمایشهای انجام شده توسط محققان روی این ابزار، بهنظر میرسد که Toolformer نسبت به مدل بسیار بزرگتر GPT-3 که شامل 175 میلیارد پارامتر است، عملکرد بسیار قویتری دارد.
در نهایت باید اشاره کرد که این اولین باری نیست که محققان تلاش کردهاند محدودیتهای موجود در مدلهای زبانی هوش مصنوعی را از بین ببرند. در واقع، مرورگر جدید بینگ که از نسخه پیشرفته ChatGPT پشتیبانی میکند، میتواند در صورت نیاز جستجوهای وب را بهتنهایی انجام دهد.