نخستين ريشه ساز فارسي طراحی شد
به گزارش گروه علمي «شبکه خبر دانشجو»، دكتر جعفر مهراد اذعان داشت: طراحي «ريشه ساز فارسي ريسست» به عنوان نخستين ريشه ساز زبان فارسي در مركز منطقه ايي اطلاعرساني علوم و فنآوري، 40 سال پس از ساخت نخستين ريشه ساز جهان موسوم به «لاوينز» انجام شده كه در سال 1968 ارائه شد.
وي با بيان اينکه ريشه ساز بعدي توسط مارتين پورتر در سال 1980 نوشته شد، افزود:اين دو ريشه ساز كه مهمترين ريشه سازهاي مورد استفاده اند، تك زباني بوده و بر روي زبان انگليسي كاربرد دارند.
رئيس مركز منطقه ايي اطلاعرساني علوم و فنآوري تصريح کرد: مطالعاتي نيز در مورد ساير زبانها از جمله اسپانيولي و عربي انجام شده و ريشه سازهاي چند زبانه نيز نوشته شده و قواعد ريخت شناسي يك يا چند زبان را به طور هم زمان به جاي قواعدي كه جستوجوي اصطلاحات را تنها در يك زبان واحد تفسير ميكنند، به كار ميبرند.
مهراد اضافه كرد: اكثر ريشه سازها از الگوريتم مشابه مانند پورتر جهت ريشه سازي استفاده كردهاند و به همين دليل داراي مزايا و معايب مشابه بوده و در كل داراي تفاوتهاي جزئي از جمله تفاوت در فهرستها و تعداد قواعد هستند اما ريشه ساز فارسي «ريسست» با به كارگيري دانش زبان شناختي و الگوريتم استاندارد با پشتوانه 10 پسوند جمع ساز و تقريبا دو هزار استثناء (اسامي مكسر نيز جزو آنها محسوب ميشود) عمليات خود را آغاز كرد.
وي با بيان اينکه ريشه ساز فارسي ريسست توانايي ساخت اسم مفرد از صيغه جمع را دارد، گفت: اين نظام شامل بخش هاي تشخيص اسم مفرد از جمع، تشخيص پسوندهاي جمع ساز، حذف پسوندهاي جمع ساز و ارائه اسم به صورت مفرد، تشخيص استثناهاي موجود، تشخيص جمع مكسر و ارائه مفرد آن و تشخيص اسم جمع از مفرد است.
رئيس مركز منطقه ايي اطلاعرساني علوم و فنآوري بيان داشت: از اين نظام ميتوان براي كاهش شكلهاي مختلف يك اسم، دسته بندي خودكار متون در فايلهاي بزرگ رايانه ايي و پژوهش در بن و ريشه كلمهها جهت استفاده در نظامهاي بازيابي اطلاعات به منظور صرفهجويي 30 تا 35 درصدي در فضاي ذخيره سازي دادهها استفاده كرد./انتهاي پيام/