محققان دانشگاه صنعتی امیرکبیر موفق به تحلیل تصویر چهره با استفاده از فناوری هوش مصنوعی شدند که میتواند حالت چهره را بهصورت مستقل از شخص در تصاویر کنترلنشده شناسایی کند.
به گزارش گروه فناوری خبرگزاری دانشجو، حمید صادقی فارغالتحصیل دانشگاه صنعتی امیرکبیر و مجری طرح «شناسایی حالت چهره از شخص در تصاویر کنترلنشده» گفت: تحلیل تصاویر چهره در دنیای امروز کاربردهای زیادی دارد. یکی از تحلیلهای مهم در چهره، تشخیص یا شناسایی احساسی است که فرد در چهره خود ابراز میکند (خشم، تنفر، ترس، شادی، غمگینی، تعجب و عادی) که به آن حالت چهره گفته میشود.
وی افزود: حال سوالی که مطرح میشود این است که شناسایی حالت چهره چه کاربردی دارد که برای پاسخ به این سوال فرض کنید یک پزشک بخواهد به طور مداوم در طول شبانهروز شرایط بیمار را ثبت و آمار آن را بررسی کند.
محققان دانشگاه صنعتی امیرکبیر ادامه داد: با استفاده از یک دوربین و پردازنده میتوان چهره فرد را همواره به صورت خودکار بررسی، حالت چهره آن را شناسایی و برای پزشک ثبت کرد؛ حالت درد در چهره، یکی از حالتهای چهرهای است که میتوان برای این مسأله متصور بود.
صادقی با اشاره به یکی از ضعفهای تشخیص حالت چهره گفت: افت کارایی روشهای موجود در مواجه با تصاویر دنیای واقعی (غیر آزمایشگاهی) یا به اصطلاح «تصاویر کنترلنشده» از ضعفهای این حوزه به شمار میرود.
وی افزود: به همین دلیل، ما در این رساله دکتری به دنبال شناسایی حالت چهره در تصاویر کنترلنشده بودیم؛ یعنی تصاویری که خارج از شرایط آزمایشگاهی و در محیط واقعی ثبت میشود. بهعنوان مثال در این تصاویر فرد لزوماً به طور مستقیم به دوربین نگاه نمیکند.
محققان دانشگاه صنعتی امیرکبیرافزود: در این تحقیق، با استفاده از هوش مصنوعی روشهای جدیدی ارائه کردیم که باعث شد شناسایی حالت چهره هم در تصاویر کنترلشده و هم در تصاویر کنترلنشده که پیچیدگی بیشتری دارند، با دقت بسیار بهتری نسبت به دیگر سامانههای موجود انجام شود.
وی عنوان کرد: روشهای جدید ارائه شده در این تحقیق، محدود به شناسایی حالت چهره نیستند و میتوانند در مسائل مختلف یادگیری ماشین نیز استفاده شوند. این ادعا با آزمایش در مسائل مختلف (مثل تشخیص نوع اشیاء) اثبات شدهاست.
محققان دانشگاه صنعتی امیرکبیر با بیان اینکه یکی از مهمترین تئوریهایی که در این تحقیق مطرح شد، یک روش یادگیری متریک برای طبقهبندی ویژگیهای هیستوگرامی است، گفت: محققانی که در زمینه بینایی ماشین کار میکنند، بهخوبی میدانند که ویژگیهای هیستوگرامی استفاده زیادی در این زمینه دارند و روش ارائه شده در حل این مسائل بسیار مؤثر خواهد بود.
صادقی تصریح کرد: چهرههای تصاویر کنترل نشده معمولاً پیچیدگیهای زیادی دارند. مثلاً تغییرات شدید زاویه سر، پوشیدگی بخشهای مختلف چهره، شرایط نوری نامناسب، ابعاد کوچک چهره در تصویر و ... همگی از عواملی هستند که دقت شناسایی حالت چهره را تحت تأثیر قرار میدهند. با این توصیف، شناسایی حالت چهره در تصاویر کنترلنشده مثل یک مسأله بسیار پیچیده است.
محققان دانشگاه صنعتی امیرکبیر بیان کرد: در یادگیری ماشین، برای حل این مسائل بهتر است که از یادگیری مبتنی بر نمونه استفاده شود. اگر کمی پیشرفتهتر به مسأله نگاه کنیم، میتوان از یادگیری متریک بهعنوان یک رویکرد پیشرفته از یادگیری مبتنی بر نمونه در این نوع مسائل استفاده کرد. با این پیشزمینه، رویکرد یادگیری متریک برای شناسایی حالت چهره در تصاویر کنترلنشده انتخاب شد.
وی عنوان کرد: در شناسایی حالت چهره، ابتدا تصویر چهره با مجموعهای از اطلاعاتی که به آن بردار ویژگی گفته میشود، توصیف میشود. در ادامه از یک روش یادگیری ماشین برای طبقهبندی این ویژگی یا تعیین نوع حالت چهره استفاده میشود.
صادقی گفت: ویژگیهایی که در بینایی ماشین و پردازش تصویر استفاده میشوند معمولاً از جنس هیستوگرام هستند؛ به همین دلیل، در این طرح یک روش جدید یادگیری متریک جدید با هدف طبقهبندی ویژگیهای هیستوگرامی ارائه کردیم که مبنای ریاضی آن استفاده از فاصله مربع کای است.
محققان دانشگاه صنعتی امیرکبیرادامه داد: گام بعدی در این تحقیق این بود که به جای استفاده از ویژگیهای متداول هیستوگرامی، یک ویژگی قابل یادگیری برای کاربرد مد نظر خود طراحی کنیم.
وی با بیان اینکه برای تحقق این هدف، یک شبکه عصبی کانولوشنی طراحی شد که ویژگیهای از جنس هیستوگرام از تصویر استخراج میکند، گفت: این شبکه عصبی از تئوری یادگیری متریک بومی ذکرشده برای شناسایی حالت چهره استفاده میکند.
صادقی اظهار کرد: با استفاده از این شبکه عصبی، نه تنها بخش طبقهبندی، بلکه بخش استخراج ویژگی از تصویر هم قابل آموزش بوده و باعث میشود دقت شناسایی حالت چهره افزایش قابل توجهی داشته باشد.
وی با اشاره به کاربرد این تحقیقات گفت: تئوریهای یادگیری متریک و همچنین شبکه عصبی کانولوشنی ارائه شده در این تحقیق در حل مسائل مختلف پردازش تصویر و بینایی ماشین قابل استفاده است. علاوه بر مسائل حوزه بینایی ماشین، روش یادگیری متریک ارائهشده میتواند در طبقهبندی سایر ویژگیهای مبتنی بر هیستوگرام نیز استفاده شود.
محققان دانشگاه صنعتی امیرکبیر با اشاره به مزیتهای رقابتی طرح گفت: علاوه بر دقت بالاتر نسبت به روشهای دیگر، در این پژوهش سعی شدهاست که پیچیدگی محاسباتی در الگوریتم طراحیشده هم پایین باشد تا پیادهسازی آن هزینه زیادی دربرنداشته باشد. بهعنوان مثال، معماری شبکه عصبی پیشنهادی در این تحقیق برمبنای بخشی از شبکه عصبی کانولوشنی شناختهشده MobileNet (نه تمام این شبکه عصبی) است که محاسبات نسبتاً کمی دارد.
صادقی با اشاره به کاربردهای این پروژه خاطرنشان کرد: معرفی این پروژه را با یک کاربرد پزشکی (تشخیص درد در چهره) انجام دادیم. اما روشهای ارائه شده برای شناسایی حالت چهره در این تحقیق میتوانند در کاربردهای مختلفی مانند ساخت رباتهای با قابلیت تشخیص حالت چهره انسان، ارتباط انسان با رایانه، هوشمندسازی پخش موسیقی متناسب با حالت چهره فرد و ... مورد استفاده قرار گیرند.
گفتنی است؛ استاد راهنمای این پروژه ابوالقاسم اسدالله راعی عضو هیئت علمی دانشگاه صنعتی امیرکبیربوده است.