به گزارش هلدینگ ICT – دیپمایند (DeepMind) درحال آموزش هوش مصنوعی جدید و بسیار جذابی است که میتواند فوتبال بازی کند و فعلاً در مرحلهی آموزش اولیه قرار دارد.
در بخشی از پست وبلاگی دیپمایند آمده است:
یک NPMP درواقع ماژول کنترل موتور همهمنظورهای است که اهداف خود را به سیگنالهای کنترل سطحپایه ترجمه میکند و بهصورت آفلاین یا ازطریق RL، با تقلید از دادههای ضبط حرکات (MoCap) که با قراردادن ردیاب روی بدن انسان یا حیوانات بهدست میآیند، آموزش داده میشود.
تیم دیپمایند اساساً یک هوش مصنوعی جدید ایجاد کرده که میتواند با تماشای ویدئو از حرکات فیزیکی بدن، انجام دادن این حرکات را یاد بگیرد و آنها را در شبیهساز فیزیکی انجام دهد.
البته، درصورتیکه موتور فیزیکی غولپیکر و تعداد بیپایانی از رباتهای کنجکاو دارید، تنها کار منطقی این است که به آنها یاد دهید چگونه دریبل بزنند یا تیراندازی کنند.
در بخشی از مقاله تحقیقاتی تیم دیپمایند نوشته شده است:
ما تیمهایی از عوامل را برای بازی فوتبال شبیهسازیشده ازطریق یادگیری تقویتی، بهینه کردیم و فضای راهکار را به حرکتهای قابلقبولی که با استفاده از دادههای ضبط حرکت انسانی آموخته میشوند، محدود کردیم.
شایان ذکر است که محققان برای آموزش هوش مصنوعی برای انجام کار و کنترل رباتها در جهان، باید ماشینها را برای دنیای واقعی آماده کنند؛ این درحالی است که در دنیای واقعی امکان رخ دادن هر اتفاقی وجود دارد و عوامل باید با گرانش، سطح لغزندهی غیرمنتظره و تداخلهای برنامهریزینشدهی سایر عوامل، مقابله کنند.هدف این تمرین، ساختن یک فوتبالیست بهتر نیست؛ کریستیانو رونالدو درحالحاضر هیچ ترسی از رباتها ندارد و درعوض ویدئوهای بازیهای وی به هوش مصنوعی کمک میکند تا توسعهدهندگان از آنها در چگونگی بهینهسازی توانایی عوامل برای پیشبینی بهترین اقدام در دنیای واقعی، بهره ببرند.
با شروع فرایند آموزش هوش مصنوعی، این ابزار بهسختی میتواند آواتار انساننمای مبتنیبر فیزیک خود را دراطراف میدان حرکت دهد. هوش مصنوعی جدید دیپمایند پس از چندروز آموزش، مواردی مثل اینکه توپ کجا خواهد رفت و عوامل دیگر نسبت به حرکت خود را پیشبینی کرده است.
در بخش دیگری از مقالهی دیپمایند آمده است:
نتیجهی توسعهی این هوش مصنوعی، ایجاد تیمی از بازیکنان فوتبال است که رفتار پیچیدهای را درمقیاسهای مختلف از خود نشان میدهند که براساس طیف وسیعی از تحلیلها و آمار، ازجمله تجزیه و تحلیلهای ورزشی در دنیای واقعی، اندازهگیری خواهند شد. کار ما یک نمایش کامل از تصمیمگیری یکپارچهی آموختهشده در مقیاسهای مختلف در محیطی چندعاملی است.
ما نمیدانیم که هوش مصنوعی جدید دیپمایند پس از تکمیلشدن چه عملکردی ارائه خواهد داد. بدیهی است که این مدل میتواند با یک عامل تجسمیافته کار کند، اما براساس تصاویر متحرک منتشرشده از آن، ظاهراً همچنان در مرحلهی شبیهسازی است.
نکتهی اصلی این است که هوش مصنوعی درحال یادگیری نحوهی بازی فوتبال نیست. این یک حرکت بیرحمانه در مرزهای شبیهسازی آن محسوب میشود و شاید شبیه یک بحران جزئی بهنظر برسد اما نتایج کاملاً مشهودی بهدنبال خواهد داشت.
عامل هوش مصنوعی فوق، کاملاً وحشتزده بهنظر میرسد و مشخص نیست از چه چیزی فرار میکند. هوش مصنوعی جدید دیپمایند درحالحاضر مثل یک بیگانه که برای اولینبار کتوشلوار انسانها را پوشیده است حرکت میکند. سیستمهایی که دیپمایند آنها را آموزش داده است، هزاران ساعت ویدئو را تجزیه و تحلیل و اساساً دادههای حرکتی را درمورد موضعی که قصد دارند از آن یاد بگیرند، استخراج میکنند.
بههرحال میتوان گفت چنین مدلهایی با گذشت زمان، قدرتمندتر خواهند شد. پیش از این دیدهایم که بوستون داینامیکس با الگوریتمهای یادگیری ماشینی و رقص ازپیش برنامهریزیشده چه کارهایی میتواند انجام دهد.
توسعهی مدلهای هوش مصنوعی تطبیقی دیپمایند بسیار جالب بهنظر میرسد و باید دید پس از تکمیل دورهی آموزش و خارج از محیطهای آزمایشگاهی در دنیای رباتیک چه عملکردی خواهند داشت