با تلاش محققان نسل جدیدی از روباتها ساخته میشوند که تنها با دیدن فعالیت انسانها، انجام وظایف پیچیده را از آنها یاد میگیرند.
به گزارش خبرنگار فناوری خبرگزاری دانشجو، تربیت کردن روباتهای تاثیرگذار روزی میتواند بدون نیاز به برنامهریزی تخصصی، برای هرفردی کار آسانی باشد. رباتیستها روباتهای خودکاری توسعه دادند که میتوانند وظایف جدید را تنها با دیدن انسانها یاد بگیرند. در خانه میتوانید به روباتهای یاد دهید که وظایف را چگونه انجام دهند یا در ادارات میتوانید روباتها را شبیه یک کارمند استخدام کرده و انجام وظایف را به آنها یاد بدهید.
محققان MIT سیستمی طراحی کرده اند که به این نوع از رباتها اجازه میدهد تا وظایف پیچیده را یاد بگیرند. یکی از این وظایف چیدن میز شام است. محققان با سیستم خاصی توانایی برنامهریزی شبیه به انسان را به روباتها میدهند تا بطور همزمان بسیاری از وظایف پیچیده را انجام دهند. در انجام این فعالیت ها، سیستم همیشه محتملترین وظیفه را بر اساس مشخصات کار انجام میدهد.
محققان در کار خود، مجموعهای از دادهها را با اطلاعاتی در مورد چگونگی قرار دادن هشت شیء جمع آوری کردند. ابتدا بازوی رباتیک به طور تصادفی فعالیتهای انسانی را در چیدن میز با اشیا انتخاب میکند، سپس؛ محققان بازو را برای چیدن میز در شکل خاصی به کار میگیرند.
Ankit Shah، نویسنده اول این پروژه و فارغ التحصیل رشته هوانوردی میگوید: چشم انداز ما این است که برنامه نویسی را به گونهای انجام دهیم که وظایف از طریق برنامهریزیهای بصری رخ بدهند نه برنامهریزیهای مشخص مهندسی.
روباتها برنامهریزهای خوبی هستند و با مشخصات خاص به تعریف وظایفی که ربات باید انجام بدهد، تفکر درباره فعالیتها، محیط و هدف نهایی، کمک میکند. یادگیری تنها با دیدن برای روباتها مملو از اتفاقهای غیر منتظره است. براساس منو، جایگاه مهمانها و صندلیها، اقلام باید در موقعیتهای خاصی قرار بگیرند و ممکن است روبات در تشخیص آنها دچار مشکل شود. رویکردهای حال حاضر توانایی مقابله با چنین اتفاقها را ندارد.
یک رویکرد رایج برای برنامهریزی فناوری یادگیری ماشینی، «تقویت یادگیری» با استفاده از آزمون و خطاست که روباتها برای فعالیتهایی که کامل انجام میدهند، پاداش یا جریمه دریافت میکنند اما برای وظایفی که ویژگیهای نامشخص دارد، تعریف یک پاداش یا مجازات سخت است. بصورت خلاصه روباتها هیچگاه، کاملا نمیتوانند صحیح را از غلط تشخیص بدهند.
سیستم خاص محققان موسوم به PUnS روبات را قادر میسازد تا وظایف گستردهای را بتواند درک کند. این درک به خودی خود میتواند برای از بین بردن پاداشها و مجازاتها استفاده شود. این سیستم براساس «منطق موقتی خطی»، یک زبان پر معنی است که روبات را قادر میسازد تا برای اتفاقهایی که رخ میدهد، دلیل بیاورد. محققان الگوهای موجود در این سیستم را که وضعیتهای زمانی مختلف را مدلسازی میکند، توضیح میدهد؛ از جمله اینکه چه چیزی باید در حال حاضر رخ بدهد، در نهایت رخ بدهد یا همزمان با اتفاق دیگری رخ بدهد. این سیستم فرمولهای مختلفی دارد و هر فرمول چیزهای متفاوتی را رمزگذاری میکند. محققان چندین معیار را توسعه دادند که روبات را به سمت فرمولهای انتخاب شده سوق میدهد تا درنهایت خطا را به حداقل برسانند.