پژوهشگران دانشگاه استنفورد به سرپرستی «درسا صدیق» دانشمند ایرانی، سیستم آموزش رفتار و عملکرد مورد نظر انسان به ربات را طراحی کردند.
به گزارش گروه فناوری خبرگزاری دانشجو، برای افزایش سرعت خودرو در یک بازی رایانهای، فشار آوردن به پدال گاز کافی است. هیچ دستورالعمل خاصی در این مورد به خودرو گفته نشده و حرکت مستقیم، امری بداهه است. این مثال ساده که شاید در دنیای بازی رایانهای، سرگرم کننده به نظر برسد، پژوهشگران دانشگاه استنفورد را ترغیب کرد تا راه بهتری برای تنظیم سیستم خودروهای خودران ارائه دهند.
پژوهشگران دانشگاه استنفورد به سرپرستی درسا صدیق، دانشمند ایرانی، سیستم جدیدی طراحی کردهاند که میتواند رفتار و عملکرد مورد نظر انسان را به رباتها آموزش دهد. پژوهشگران سعی دارند روشهای بهتر و سریع تری برای راهنمایی رباتهای خودکار توسط انسانها ارائه دهند.
درسا صدیق «Dorsa Sadigh»، استادیار علوم رایانه و مهندسی برق دانشگاه استنفورد و همکارانش، دو روش متفاوت مشخص برنامه ریزی برای هدف را ترکیب کردند تا رباتها را در یک فرآیند آموزش دهند. در آزمایش این روش، رباتها هم در شبیه سازیها و هم در دنیای واقعی توانستند عملکرد بهتری داشته باشند.
صدیق درباره این طرح گفت: هدف ما این است که بهترین بازخورد را هم در آزمایشها و هم در دنیای واقعی دریافت کنیم و با ترکیب دادههای دو آزمایش، عملکرد مورد نظر انسان را بهتر به آنها آموزش دهیم.
صدیق با بیان اینکه، این پژوهش، گامی به سوی درک بهتر اهداف انسان و انتظارات آنها از یک ربات است؛ تصریح کرد: پژوهش ما میتواند امکان تعامل ساده با رباتها و آموزش آنها را برای انسان فراهم کند و من مشتاقانه میگویم که در آینده، پژوهشهای بیشتری در مورد یادگیری انسانها و رباتها از یکدیگر انجام خواهیم داد.
اندی پالان «Andy Palan»، استادیار علوم رایانه و از نویسندگان این پژوهش نیز در این باره افزود : در آینده، سیستمهای خودران بیشتری وجود خواهند داشت که لازم است مفهوم خوب و بد را درک کنند. اگر بخواهیم سیستمهای خودران را در آینده به کار بگیریم، قابلیت درک مفهوم خوب و بد، امری ضروری خواهد بود.
اردم بی یک « Erdem Biyik »، دانشجوی مهندسی برق دانشگاه استنفورد و نویسنده این پژوهش، نیز خصوص این طرح بیان کرد: ما همیشه نمیتوانیم اطلاعات را به ربات بدهیم و حتی اگر بتوانیم، اغلب نمیتوانیم به همه اطلاعاتی که انسانها ارائه میدهند اعتماد کنیم. پژوهشهای پیشین نشان دادهاند که انسانها انتظار دارند خودروهای خودران با سرعتی کمتر از خود آنها رانندگی کنند.
پژوهشگران برای افزایش سرعت خودرو، روشی ابداع کردند تا امکان ارائه چندین درخواست را به صورت یکجا فراهم کنند. این درخواستها به گونهای بودند که ربات بتواند به سرعت به آنها پاسخ بدهد. این روش در مقایسه با ارائه یک به یک سوالات، بین ۱۵ تا ۵۰ برابر سریع تر بود.
این سیستم جدید برای آموزش ربات، رفتار انسان را به آن نشان میدهد؛ در نتیجه رباتهای خودکار میتوانند اطلاعات زیادی دریافت کنند، اما مشکل اصلی آنها این است که نمیتوانند قسمتهای مهم را تشخیص دهند. البته انسانها نیز همیشه انتظار ندارند که رباتها دقیقاً همان گونه که آموزش دیدهاند، رفتار کنند.
همین موضوع، دلیل مهمی برای آغاز این پژوهش بود تا روشی برای تقلید رفتار انسان ارائه شود. پژوهشگران در این بررسی، کار خود را با یک درخواست از ربات آغاز کردند، اما برنامه اصلی آنها، بررسی با کمک چندین درخواست در آزمایشهای بعدی بود. در پایان آزمایش، ۸۰ درصد شرکتکنندگان، نحوه عملکرد ربات را پس از آموزش آن با سیستم جدید، ترجیح دادند.
این سیستم جدید، با دشواریهایی نیز همراه بود. کسانی که از این روش ترکیبی استفاده کردند، در درک عملکرد سیستم برای پاسخ به درخواستها، دچار مشکل شدند. نظر پژوهشگران این بود که بروز چنین مشکلاتی در سیستمهای مبتنی بر یادگیری، طبیعی است و امیدوارند که این نقصها جبران شوند و امکان عملکرد ساده و سریع را برای رباتها فراهم کنند.
تغییرات ایجاد شده در سیستم، برای این گروه پژوهشی جالب است، زیرا این تغییرات به انسانها امکان میدهند به صورت همزمان، عملکردهای گوناگون را برای شرایط متفاوت ایجاد کنند. برای مثال، شاید شخصی بخواهد در ترافیک، آرام و محافظه کارانه حرکت کند و یا هنگامی که ترافیک سبک تر است، با سرعت زیادی براند.
لازم به ذکر است، این پژوهش، در«نشست رباتیک علوم و سیستمها RSS» ارائه خواهد شد.