پژوهشگران کمپانی دیپ مایند (DeepMind)، آزمایشگاه هوش مصنوعی بریتانیایی، بازیهای اصیل شطرنج را کنار گذاشتهاند و به دنبال لذتی بیشتر برای مردم هستند: هوش مصنوعی فوتبالیست! برای آشنایی با این تحقیق جالب با اروتک همراه باشید.
دیپ مایند، شرکت خواهر گوگل، روز گذشته یک مقاله تحقیقاتی و پست وبلاگی همراه با جزئیات، درباره موتورهای بدوی احتمالاتی عصبی جدید (NPMP) منتشر کرد، روشی که توسط آن عوامل هوش مصنوعی میتوانند کارکردهای بدنهای فیزیکی مثل فوتبال را یاد بگیرند.
طبق پست وبلاگ:
NPMP یک ماژول کنترل موتور همه منظوره است که اهداف موتور short-horizon را به سیگنالهای کنترل سطح پایین ترجمه کرده و بهصورت آفلاین یا از طریق RL (یادگیری تقویتی) با تقلید از دادههای ضبطشده حرکتی (MoCap) که با ردیابها بر روی انسان یا حیوانات که حرکات موردانتظار خود را انجام میدهند، آموزش داده میشود.
پیش درآمد: تیم دیپ مایند، در اصل یک سیستم هوش مصنوعی ایجاد کرده است که میتواند با تماشای فیلمهایی از دیگر عواملی که این کارها را انجام میدهند، یاد بگیرد که چگونه این کارها را در داخل یک شبیهساز فیزیکی انجام دهد.
البته، اگر یک موتور فیزیکی غولپیکر و تعداد بیپایانی از رباتهای کنجکاو دارید، تنها کار منطقی این است که به آن یاد دهید چگونه دریبل بزنند و تیراندازی کنند!
طبق مقاله تحقیقاتی تیم:
ما چند کاراکتر مختلف را برای بازی فوتبال شبیهسازیشده از طریق یادگیری تقویتی بهینهسازی کرده و فضای حل را به حرکات قابل قبولی که با استفاده از دادههای ضبط حرکت انسانی آموخته شدهاند، محدود کردیم.
پیشزمینه: برای آموزش هوش مصنوعی به منظور کنترل رباتها در جهان، محققان باید ماشینها را برای واقعیت آماده کنند چراکه خارج از شبیهسازی، هر چیزی ممکن است اتفاق بیفتد. این شاخصهها باید با گرانش، سطوح لغزنده غیرمنتظره و تداخلهای برنامهریزینشده سایر عوامل مقابله کنند.
هدف این تمرین، ساختن یک فوتبالیست بهتر نیست بلکه کمک به هوش مصنوعی و توسعهدهندگان آن است که بفهمند چگونه توانایی عوامل را برای پیشبینی نتایج بهینه کنند.
بر اساس این پژوهش، زمانی که یکی از کاراکترهای هوش مصنوعی آموزش خود را آغاز کرد، بهسختی میتوانست آواتار انساننمای مبتنی بر فیزیک خود را در اطراف میدان، حرکت دهد. اما پس از چند روز تمرین، هوش مصنوعی شروع به پیشبینی مسیر حرکت توپ کرده و کاراکترهای دیگر نسبت به حرکت آن واکنش نشان دادند.
طبق این مقاله:
نتیجه این کار، تیمی از بازیکنان فوتبال انساننما است که رفتار پیچیدهای را در مقیاسهای مختلف نشان میدهند که با طیف وسیعی از تحلیلها و آمار، از جمله موارد مورد استفاده در تجزیه و تحلیل ورزش در دنیای واقعی، کمیتسازی میشود. کار ما یک نمایش کامل از تصمیمگیری یکپارچه آموختهشده در مقیاسهای مختلف در یک محیط چند عاملی است.
برداشت سریع: این کار بسیار رادیکالی و جدید است. اما ما چندان مطمئن نیستیم که نشاندهنده “نمایش کامل” یک مفهوم جدید باشد. بدیهی است که این مدل قادر به کار با یک عامل تجسم یافته است. اما، بر اساس GIFهای انتخابشده در پست وبلاگ، این کار هنوز عمیقاً در مرحله شبیهسازی است.
نکته اصلی و عجیب در اینجا این است که هوش مصنوعی در حال “یادگیری” نحوه بازی فوتبال نیست. این یک حرکت “بیرحمانه” در داخل مرزهای شبیهسازی است. ممکن است این سخن یک بحث جزیی بهنظر برسد، اما نتایج کاملا مشهود است:
هوش مصنوعی فوق کاملاً وحشتزده بهنظر میرسد و مشخص نیست از چه چیزی فرار میکند، اما مطمئناً “فرار کردن هوش مصنوعی از عاملی نامعلوم” حقیقتی ترسناک است.
هوش مصنوعی موردنظر مانند یک بیگانه که برای اولین بار کت و شلوار انسانی پوشیده است حرکت میکند! زیرا برخلاف انسانها، هوش مصنوعی نمیتواند با تماشا کردن یاد بگیرد. سیستمهایی مانند سیستمی که DeepMind آموزش داده، هزاران ساعت ویدئو را تجزیه و تحلیل میکنند و اساساً دادههای حرکتی را در مورد موضوعی که تلاش میکنند از آن “یاد بگیرند”، استخراج میکنند.
با این حال، تقریباً مطمئن هستیم که این مدلها با گذشت زمان قویتر میشوند. ما دیدهایم که کمپانی بوستون داینامیکز (Boston Dynamics) با الگوریتمهای یادگیری ماشینی و رقص از پیش برنامهریزیشده، چه کاری میتواند انجام دهد.
جالب است که ببینیم مدلهای تطبیقیتر، مانند مدلهایی که توسط دیپ مایند توسعه مییابند، پس از فراتر رفتن از محیط آزمایشگاهی و وارد شدن به برنامههای رباتیک واقعی، چگونه عمل خواهند کرد؟!
منبع: Thenextweb