محققان دانشگاه MIT با طراحی یک ماشین یادگیری توانستند یک زبان مرده و منسوخ شده را رمزگشایی کنند.
به گزارش گروه فناوری خبرگزاری دانشجو، تحقیقات اخیر دانشمندان نشان میدهد که بیشتر زبانهایی که در دنیا وجود دارند، دیگر مورد استفاده قرار نمیگیرند. دهها زبان از این زبانهای مرده گم شدهاند یا هنوز رمزگشایی نشدهاند؛ به این معنا که ما هیچ اطلاعی از دستور زبان، واژگان یا نحو آنها در دسترس نداریم تا مفهوم آنها را متوجه شویم.
زبانهای منسوخ شده چیزی فراتر از یک کنجکاوی علمی هستند. در واقع بدون آنها دانش ما از افراد مختلف در سرتاسر جهان ناقص است. متاسفانه از اکثر این زبانها نسخههای بسیار کمی در دست است و از این دانشمندان نمیتوانند آنها را رمزگشایی کنند. برخی از آنها زبان «نسبی» ندارند به این معنا که زبان نزدیکی برای مقایسه با آنها وجود ندارد و اغلب نیز فاقد فضای خالی میان علائم نگارشی هستند.
با این حال، محققان آزمایشگاه علوم کامپیوتر و هوش مصنوعی (CSAIL) موسسه فناوری ماساچوست اخیرا پیشرفت بزرگی در این زمینه داشتهاند و سیستم جدیدی را طراحی کردهاند که بدون نیاز به دانش پیشرفته در مورد ارتباط آن با سایر زبانها، میتواند به طور خودکار زبان منسوخ شده را رمزگشایی کند. محققان در آزمایشهای خود نشان دادند که این سیستم میتواند روابط بین زبانها را تشخیص دهد و با این کار تائید کردند که زبان ایبریایی هیچ ارتباطی با زبان باسک ندارد.
این محققان قصد دارند با کمک سیستم ماشین یادگیری خود و با استفاده از فقط چند هزار کلمه از یک زبان مرده که دههها از زبانشناسان دور مانده، رمزگشایی کنند.
این سیستم بر چند اصل مبتنی بر دانش زبانشناسی تاریخی متکی است و از جمله این واقعیت که زبانها معمولا فقط به روشهای خاص قابل پیشبینی تکامل مییابند. به عنوان مثال، در یک زبان به ندرت یک صدای کامل اضافه یا حذف شود و شاید فقط تغییراتی در آن ایجاد شود. مثلا کلمه P در زبان مادری ممکن است به تدریج به b تبدیل شود، زیرا این دو از نظر آوایی خیلی متفاوت نیستند، اما هیچ وقت به K تغییر آوایی نمیدهند، زیرا بین این دو خیلی تفاوت آوایی وجود دارد.
محققان با تعریف این محدودیتهای زبانی و سایر محدودیتهای دیگر برای این ماشین یادگیری، الگوریتم رمزگشایی خود را به گونهای طراحی کردند که بتواند تحولات احتمالی زبان را تشخیص دهد. این الگوریتم میآموزد که اصوات زبانی را در یک فضای چند بعدی قرار دهد که تفاوت در تلفظ آنها در فاصله بین بردارهای مربوطه منعکس میشود. این طراحی آنها را قادر میسازد تا الگوهای مربوط به تغییر زبان را به دست آورند و آنها را به عنوان محدودیتهای محاسباتی بیان کند. مدل بدست آمده میتواند کلمات را در یک زبان باستانی تقسیمبندی و آنها را با نمونههای مشابه در یک زبان مرتبط ترسیم کند.
محققان این سیستم را برای رمزگشایی یک زبان مرده «اوگاریتی» و «خط ب» به کار بردند که رمزگشایی آن قبلا چندین دهه طول کشیده بود. با این حال یک تفاوت اساسی با این پروژه این بود که تیم تحقیقاتی میدانست که این زبانها به ترتیب به زبانهای عبری و یونانی مربوط میشوند.
زبان اوگاریتی، تنها بر پایه نوشتههای بر جا مانده در شهر گمشده اوگاریت در سوریه شناخته شده است که به دست باستانشناسان فرانسوی در سال ۱۹۲۸ یافت شد. این یافته برای پژوهشگران عهد عتیق برای دریافت متون عبری بسیار مهم بوده و بخش بزرگی از عبارات مشترک، گویشهای ادبی و اصطلاحاتی را که یهودیت از فرهنگهای گوئیم (ناکلیمی) مجاور به کار میبرد، آشکار کرده است.
خط ب نیز یک خط هجانگار بود که زبان یونانی میسنی که کهنترین زبان تائید شده یونانی است، به آن نگاشته میشد. تاریخ این خط به چندین سده پیش از خط یونانی کنونی بازمیگردد.