محققان دانشگاه صنعتی امیرکبیر نرمافزاری طراحی کردند که بر اساس الگوی بیشترین کلمات تکرار شده اقدام به خلاصهسازی فایلهای صوتی به اندازه دلخواه کاربران میکند.
هدی السادات جعفری، مجری طرح در گفتگو با خبرنگار علمی «خبرگزاری دانشجو»، با بیان اینکه دنیای کنونی دنیای انتقال اطلاعات بوده و این انتقال به صورتهای مختلفی مانند متن، صوت و تصویر انجام میشود، گفت: امروزه، با رشد روز افزون اطلاعات و قرار گرفتن حجم بالایی از فایلهای صوتی بر روی شبکهها و کامپیوترها، یافتن راهحلهای کارا برای ذخیرهسازی، بازیابی، جستجو و مرورگری سریع این فایلهای صوتی مورد نیاز است.
وی خلاصهسازی گفتار را یکی از راههای پیشنهادی برای حل مشکلات انتقال اطلاعات نام برد و اظهار داشت: خلاصهسازی یک فایل گفتاری به معنای استخراج بخشهای مهم و شاخص گفتار به منظور دسترسی، جستجو، استخراج و مرورگری آسانتر و کمهزینهتر اطلاعات فایلهای صوتی است.
مجری طرح با بیان اینکه همواره گوش دادن به فایلهای صوتی طولانی، زمانبر بوده و پیدا کردن اطلاعات مهم در این فایلها کار سخت و دشواری است، از طراحی و ساخت نرمافزاری برای خلاصهسازی فایلهای صوتی خبر داد و یادآور شد: نرمافزاری که در این طرح عرضه شده قادر است تا اطلاعات مهم فایلهای صوتی را پیدا کند و به صورت خلاصه شده در خروجی به کاربر تحویل دهد.
جعفری با تاکید بر اینکه طراحی این نرمافزار صرفهجویی در زمان و تسهیل دسترسی به نکات کلیدی فایلهای صوتی به دنبال خواهد شد، خاطرنشان کرد: در طراحی این نرم افزار از روش یادگیری ماشین به نام روش «نیمهنظارتی» استفاده شده است؛ به این معنی که یکسری داده از قبل به ماشین ارائه میشود تا ماشین چگونگی خلاصهسازی را یاد بگیرد، به این ترتیب ماشین با استفاده از الگو میتواند فایلهای بعدی را خلاصهسازی کند.
مجری طرح با بیان اینکه نرمافزار طراحی شده در مرحله تحقیقاتی قرار دارد، تاکید کرد: پیش از این نرمافزارهای مشابه با استفاده از برنامههای تبدیل گفتار به متن، خلاصهسازی را انجام میداد، در صورتی که در نرمافزار تولید شده مستقیماً فایل صوتی خلاصهسازی میشود.
وی در مورد چگونگی خلاصهسازی فایلهای صوتی در نرمافزار توضیح داد: در این نرمافزار کاربران با وارد کردن فایل صوتی و انتخاب درصد خلاصهسازی میتوانند از فایل خلاصهسازی شده استفاده کنند.
جعفری اضافه کرد: در این نرم افزار خلاصهسازی گفتار بدون استفاده از سامانه بازشناسی گفتار ارائه شده است، به این صورت که بخشهای شاخص گفتار مستقیماً از روی سیگنال گفتار شناسایی میشوند.
مجری طرح با تاکید بر اینکه این نرمافزار شامل سه مرحله اصلی تعیین انتهای جملات، تشخیص الگوهای کلیدی و شناسایی جملات شاخص است، توضیح داد: یک پیکره خلاصهسازی گفتار خبری برای زبان فارسی با نام «فاخر» تهیه شد و سپس، روشی برای تشخیص انتهای جملات با استفاده از ویژگیهای نوایی و طیفی و همچنین روشی برای تشخیص الگوهای کلیدی در گفتار ارائه گردید؛ در نهایت از موارد فوق در سامانه پیشنهادی خلاصهسازی استخراجی گفتار فارسی، مستقیماً از روی سیگنال گفتار با استفاده از روشهای نیمهنظارتی استفاده شد.
وی با تاکید بر اینکه این نرمافزار براساس امتیازبندیهای موجود نکات کلیدی فایلهای صوتی را تشخیص میدهد، خاطرنشان کرد: نرمافزار ارائه شده با استفاده از الگوهایی از قبیل بیشترین تکرار کلمات، جملات ابتدایی و جملات انتهایی میتواند فایلهای صوتی را براساس مهمترین نکات کلیدی خلاصهسازی کند.
جعفری با بیان اینکه در حال حاضر این نرم افزار برای خلاصه سازی فایلهای صوتی رسمی کاربرد دارد، یادآور شد: اضافه کردن قابلیتهایی مانند پشتیبانی از خلاصهسازی فایلهای جلسات که چندین گوینده دارد، سخنرانیها، کلاسهای درس، فایلهای صوتی رادیو و تلویزیون از دیگر برنامههای پیش روی این نرمافزار هستند.
مجری طرح استفاده از این نرمافزار را در موتورهای جستجو مفید دانست و عنوان کرد: با پیشرفت این نرم افزار میتوانیم فایلهای صوتی را با استفاده از کلمات کلیدی جستجو کنیم.
وی در توضیح کاربردهای این نرم افزار گفت: نرم افزار طراحی شده علاوه بر موتورهای جستجو قادر خواهد بود تا در شرکتها و یا سازمانهایی که از پیغام گیر استفاده میکنند نیز مفید باشد، به طوری که با استفاده از آن می توان پیغامها را براساس موضوعات دستهبندی کرد.