کد خبر:۳۱۹۴۴۰

تولید نرم‌افزاری برای خلاصه‌سازی فایل‌های صوتی/ خلاصه‌سازی بر اساس بیشترین تکرار

محققان دانشگاه صنعتی امیرکبیر نرم‌افزاری طراحی کردند که بر اساس الگوی بیشترین کلمات تکرار شده اقدام به خلاصه‌سازی فایل‌های صوتی به اندازه دلخواه کاربران می‌کند.
هدی‌ السادات جعفری، مجری طرح در گفتگو با خبرنگار علمی «خبرگزاری دانشجو»، با بیان اینکه دنیای کنونی دنیای انتقال اطلاعات بوده و این انتقال به صورت‌های مختلفی مانند متن،‌ صوت و تصویر انجام می‌شود، گفت: امروزه، با رشد روز افزون اطلاعات و قرار گرفتن حجم بالایی از فایل‌های صوتی بر روی شبکه‌ها و کامپیوترها، یافتن راه‌حل‌های کارا برای ذخیره‌سازی، بازیابی، جستجو و مرورگری سریع این فایل‌های صوتی مورد نیاز است. 
 
وی خلاصه‌سازی گفتار را یکی از راه‌های پیشنهادی برای حل مشکلات انتقال اطلاعات نام برد و اظهار داشت: خلاصه‌سازی یک فایل گفتاری به معنای استخراج بخش‌های مهم و شاخص گفتار به منظور دسترسی، جستجو، استخراج و مرورگری آسان‌تر و کم‌هزینه‌تر اطلاعات فایل‌های صوتی است.
 
مجری طرح با بیان اینکه همواره گوش دادن به فایل‌های صوتی طولانی، زمان‌بر بوده و پیدا کردن اطلاعات مهم در این فایل‌ها کار سخت و دشواری است، از طراحی و ساخت نرم‌افزاری برای خلاصه‌سازی فایل‌های صوتی خبر داد و یادآور شد: نرم‌افزاری که در این طرح عرضه شده قادر است تا اطلاعات مهم فایل‌های صوتی را پیدا کند و به صورت خلاصه شده در خروجی به کاربر تحویل دهد.
 
جعفری با تاکید بر اینکه طراحی این نرم‌افزار صرفه‌جویی در زمان و تسهیل دسترسی به نکات کلیدی فایل‌های صوتی به دنبال خواهد شد، خاطرنشان کرد: در طراحی این نرم افزار  از روش یادگیری ماشین به نام روش «نیمه‌نظارتی» استفاده شده است؛ به این معنی که یکسری داده از قبل به ماشین ارائه می‌شود تا ماشین چگونگی خلاصه‌سازی را یاد بگیرد، به این ترتیب ماشین با استفاده از الگو می‌تواند فایل‌های بعدی را خلاصه‌سازی کند.
 
مجری طرح با بیان اینکه نرم‌افزار طراحی شده در مرحله تحقیقاتی قرار دارد، تاکید کرد: پیش از این نرم‌افزارهای مشابه با استفاده از برنامه‌های تبدیل گفتار به متن، خلاصه‌سازی را انجام می‌داد، در صورتی که در نرم‌افزار تولید شده مستقیماً فایل صوتی خلاصه‌سازی می‌شود.
 
وی در مورد چگونگی خلاصه‌سازی فایل‌های صوتی در نرم‌افزار توضیح داد: در این نرم‌افزار کاربران با وارد کردن فایل صوتی و انتخاب درصد خلاصه‌سازی می‌توانند از فایل خلاصه‌سازی شده استفاده کنند.
 
جعفری اضافه کرد: در این نرم افزار خلاصه‌سازی گفتار بدون استفاده از سامانه بازشناسی گفتار ارائه شده است، به ‌این صورت که بخش‌های شاخص گفتار مستقیماً از روی سیگنال گفتار شناسایی می‌شوند.
 
مجری طرح با تاکید بر اینکه این نرم‌افزار شامل سه مرحله اصلی تعیین انتهای جملات، تشخیص الگوهای کلیدی و شناسایی جملات شاخص است، توضیح داد: یک پیکره خلاصه‌سازی گفتار خبری برای زبان فارسی با نام «فاخر» تهیه شد و سپس، روشی برای تشخیص انتهای جملات با استفاده از ویژگی‌های نوایی و طیفی و همچنین روشی برای تشخیص الگوهای کلیدی در گفتار ارائه گردید؛ در نهایت از موارد فوق در سامانه پیشنهادی خلاصه‌سازی استخراجی گفتار فارسی، مستقیماً از روی سیگنال گفتار با استفاده از روش‌های نیمه‌نظارتی استفاده شد.
 
وی با تاکید بر اینکه این نرم‌افزار براساس امتیازبندی‌های موجود نکات کلیدی فایل‌های صوتی را تشخیص می‌دهد، خاطرنشان کرد: نرم‌افزار ارائه شده با استفاده از الگوهایی از قبیل بیشترین تکرار کلمات، جملات ابتدایی و جملات انتهایی می‌تواند فایل‌های صوتی را براساس مهمترین نکات کلیدی خلاصه‌سازی کند.
 
جعفری با بیان اینکه در حال حاضر این نرم افزار برای خلاصه سازی فایل‌های صوتی رسمی کاربرد دارد، یادآور شد: اضافه کردن قابلیت‌هایی مانند پشتیبانی از خلاصه‌سازی فایل‌های جلسات که چندین گوینده دارد، سخنرانی‌ها،‌ کلاس‌های درس، فایل‌های صوتی رادیو و تلویزیون از دیگر برنامه‌های پیش روی این نرم‌افزار هستند.
 
مجری طرح استفاده از این نرم‌افزار را در موتورهای جستجو مفید دانست و عنوان کرد: با پیشرفت این نرم افزار می‌توانیم فایل‌های صوتی را با استفاده از کلمات کلیدی جستجو کنیم.
 
وی در توضیح کاربردهای این نرم افزار گفت: نرم افزار طراحی شده علاوه بر موتورهای جستجو قادر خواهد بود تا در شرکت‌ها و یا سازمان‌هایی که از پیغام گیر استفاده می‌کنند نیز مفید باشد، به طوری که با استفاده از آن می توان پیغام‌ها را براساس موضوعات دسته‌بندی کرد.
ارسال نظر
captcha
*شرایط و مقررات*
خبرگزاری دانشجو نظراتی را که حاوی توهین است منتشر نمی کند.
لطفا از نوشتن نظرات خود به صورت حروف لاتین (فینگیلیش) خودداری نمايید.
توصیه می شود به جای ارسال نظرات مشابه با نظرات منتشر شده، از مثبت یا منفی استفاده فرمایید.
با توجه به آن که امکان موافقت یا مخالفت با محتوای نظرات وجود دارد، معمولا نظراتی که محتوای مشابهی دارند، انتشار نمی یابد.
پربازدیدترین آخرین اخبار