سیستم آموزش رفتار انسان به ربات طراحی شد

پژوهشگران دانشگاه استنفورد به سرپرستی «درسا صدیق» دانشمند ایرانی، سیستم آموزش رفتار و عملکرد مورد نظر انسان به ربات را طراحی کردند.

به گزارش گروه فناوری خبرگزاری دانشجو، برای افزایش سرعت خودرو در یک بازی رایانه‌ای، فشار آوردن به پدال گاز کافی است. هیچ دستورالعمل خاصی در این مورد به خودرو گفته نشده و حرکت مستقیم، امری بداهه است. این مثال ساده که شاید در دنیای بازی رایانه‌ای، سرگرم‌ کننده به نظر برسد، پژوهشگران دانشگاه استنفورد را ترغیب کرد تا راه بهتری برای تنظیم سیستم خودرو‌های خودران ارائه دهند.

پژوهشگران دانشگاه استنفورد به سرپرستی درسا صدیق، دانشمند ایرانی، سیستم جدیدی طراحی کرده‌اند که می‌تواند رفتار و عملکرد مورد نظر انسان را به ربات‌ها آموزش دهد. پژوهشگران سعی دارند روش‌های بهتر و سریع‌ تری برای راهنمایی ربات‌های خودکار توسط انسان‌ها ارائه دهند.

درسا صدیق «Dorsa Sadigh»، استادیار علوم رایانه و مهندسی برق دانشگاه استنفورد و همکارانش، دو روش متفاوت مشخص برنامه‌ ریزی برای هدف را ترکیب کردند تا ربات‌ها را در یک فرآیند آموزش دهند. در آزمایش این روش، ربات‌ها هم در شبیه‌ سازی‌ها و هم در دنیای واقعی توانستند عملکرد بهتری داشته باشند.

صدیق درباره این طرح گفت: هدف ما این است که بهترین بازخورد را هم در آزمایش‌ها و هم در دنیای واقعی دریافت کنیم و با ترکیب داده‌های دو آزمایش، عملکرد مورد نظر انسان را بهتر به آن‌ها آموزش دهیم.

صدیق با بیان اینکه، این پژوهش، گامی به سوی درک بهتر اهداف انسان و انتظارات آن‌ها از یک ربات است؛ تصریح کرد: پژوهش ما می‌تواند امکان تعامل ساده با ربات‌ها و آموزش آن‌ها را برای انسان فراهم کند و من مشتاقانه می‌گویم که در آینده، پژوهش‌های بیشتری در مورد یادگیری انسان‌ها و ربات‌ها از یکدیگر انجام خواهیم داد.

اندی پالان «Andy Palan»، استادیار علوم رایانه و از نویسندگان این پژوهش نیز در این باره افزود : در آینده، سیستم‌های خودران بیشتری وجود خواهند داشت که لازم است مفهوم خوب و بد را درک کنند. اگر بخواهیم سیستم‌های خودران را در آینده به کار بگیریم، قابلیت درک مفهوم خوب و بد، امری ضروری خواهد بود.

اردم بی یک « Erdem Biyik »، دانشجوی مهندسی برق دانشگاه استنفورد و نویسنده این پژوهش، نیز خصوص این طرح بیان کرد: ما همیشه نمی‌توانیم اطلاعات را به ربات بدهیم و حتی اگر بتوانیم، اغلب نمی‌توانیم به همه اطلاعاتی که انسان‌ها ارائه می‌دهند اعتماد کنیم. پژوهش‌های پیشین نشان داده‌اند که انسان‌ها انتظار دارند خودرو‌های خودران با سرعتی کمتر از خود آن‌ها رانندگی کنند.

پژوهشگران برای افزایش سرعت خودرو، روشی ابداع کردند تا امکان ارائه چندین درخواست را به صورت یکجا فراهم کنند. این درخواست‌ها به گونه‌ای بودند که ربات بتواند به سرعت به آن‌ها پاسخ بدهد. این روش در مقایسه با ارائه یک به یک سوالات، بین ۱۵ تا ۵۰ برابر سریع‌ تر بود.

این سیستم جدید برای آموزش ربات، رفتار انسان را به آن نشان می‌دهد؛ در نتیجه ربات‌های خودکار می‌توانند اطلاعات زیادی دریافت کنند، اما مشکل اصلی آن‌ها این است که نمی‌توانند قسمت‌های مهم را تشخیص دهند. البته انسان‌ها نیز همیشه انتظار ندارند که ربات‌ها دقیقاً همان گونه که آموزش دیده‌اند، رفتار کنند.

همین موضوع، دلیل مهمی برای آغاز این پژوهش بود تا روشی برای تقلید رفتار انسان ارائه شود. پژوهشگران در این بررسی، کار خود را با یک درخواست از ربات آغاز کردند، اما برنامه اصلی آنها، بررسی با کمک چندین درخواست در آزمایش‌های بعدی بود. در پایان آزمایش، ۸۰ درصد شرکت‌کنندگان، نحوه عملکرد ربات را پس از آموزش آن با سیستم جدید، ترجیح دادند.

این سیستم جدید، با دشواری‌هایی نیز همراه بود. کسانی که از این روش ترکیبی استفاده کردند، در درک عملکرد سیستم برای پاسخ به درخواست‌ها، دچار مشکل شدند. نظر پژوهشگران این بود که بروز چنین مشکلاتی در سیستم‌های مبتنی بر یادگیری، طبیعی است و امیدوارند که این نقص‌ها جبران شوند و امکان عملکرد ساده و سریع را برای ربات‌ها فراهم کنند.

تغییرات ایجاد شده در سیستم، برای این گروه پژوهشی جالب است، زیرا این تغییرات به انسان‌ها امکان می‌دهند به صورت همزمان، عملکرد‌های گوناگون را برای شرایط متفاوت ایجاد کنند. برای مثال، شاید شخصی بخواهد در ترافیک، آرام و محافظه‌ کارانه حرکت کند و یا هنگامی که ترافیک سبک‌ تر است، با سرعت زیادی براند.

لازم به ذکر است، این پژوهش، در«نشست رباتیک علوم و سیستم‌ها RSS» ارائه خواهد شد.

لینک کپی شد

گزارش خطا

پسندها:

اشتراک گذاری

برچسب ها:

آموزش ربات آموزش رفتار انسان به ربات دانشگاه استنفورد علوم رایانه ای ربات های خودکار