نخستين ريشه ساز فارسي طراحی شد
کد خبر:۵۶۸۷۸
رئيس مركز منطقه‌اي اطلاع‌رساني علوم و فن‌آوري:

نخستين ريشه ساز فارسي طراحی شد

رئيس مركز منطقه‌اي اطلاع‌رساني علوم و فن‌آوري از طراحي نخستين ريشه ساز فارسي در اين مركز خبر داد و گفت: اين ريشه ساز فارسي كاربردهاي مختلفي در دسته‌بندي، پردازش و بازيابي رايانه‌يي اطلاعات دارد.                  

به گزارش گروه علمي «شبکه خبر دانشجو»، دكتر جعفر مهراد اذعان داشت: طراحي «ريشه ساز فارسي ريسست» به عنوان نخستين ريشه ساز زبان فارسي در مركز منطقه ا‌يي اطلاع‌رساني علوم و فن‌آوري، 40 سال پس از ساخت نخستين ريشه ساز جهان موسوم به «لاوينز» انجام شده كه در سال 1968 ارائه شد.

وي با بيان اينکه ريشه ساز بعدي توسط مارتين پورتر در سال 1980 نوشته شد، افزود:اين دو ريشه ساز كه مهمترين ريشه سازهاي مورد استفاده اند، تك زباني بوده و بر روي زبان انگليسي كاربرد دارند.

رئيس مركز منطقه ا‌يي اطلاع‌رساني علوم و فن‌آوري تصريح کرد: مطالعاتي نيز در مورد ساير زبان‌ها از جمله اسپانيولي و عربي انجام شده و ريشه سازهاي چند زبانه نيز نوشته شده و قواعد ريخت شناسي يك يا چند زبان را به طور هم زمان به جاي قواعدي كه جست‌وجوي اصطلاحات را تنها در يك زبان واحد تفسير مي‌كنند، به كار مي‌برند.

مهراد اضافه كرد: اكثر ريشه سازها از الگوريتم مشابه مانند پورتر جهت ريشه سازي استفاده كرده‌اند و به همين دليل داراي مزايا و معايب مشابه بوده و در كل داراي تفاوت‌هاي جزئي از جمله تفاوت در فهرست‌ها و تعداد قواعد هستند اما ريشه ساز فارسي «ريسست» با به كارگيري دانش زبان شناختي و الگوريتم استاندارد با پشتوانه 10 پسوند جمع ساز و تقريبا دو هزار استثناء (اسامي مكسر نيز جزو آنها محسوب مي‌شود) عمليات خود را آغاز كرد.

وي با بيان اينکه ريشه ساز فارسي ريسست توانايي ساخت اسم مفرد از صيغه جمع را دارد، گفت: اين نظام شامل بخش هاي تشخيص اسم مفرد از جمع، تشخيص پسوندهاي جمع ساز، حذف پسوندهاي جمع ساز و ارائه اسم به صورت مفرد، تشخيص استثناهاي موجود، تشخيص جمع مكسر و ارائه مفرد آن و تشخيص اسم جمع از مفرد است.

رئيس مركز منطقه ا‌يي اطلاع‌رساني علوم و فن‌آوري بيان داشت: از اين نظام مي‌توان براي كاهش شكل‌هاي مختلف يك اسم، دسته بندي خودكار متون در فايل‌هاي بزرگ رايانه‌ ايي و پژوهش در بن و ريشه كلمه‌ها جهت استفاده در نظام‌هاي بازيابي اطلاعات به منظور صرفه‌جويي 30 تا 35 درصدي در فضاي ذخيره سازي داده‌ها استفاده كرد./انتهاي پيام/ 

پربازدیدترین آخرین اخبار