«طوسا»؛ دستیار هوش مصنوعی وزیر میراث فرهنگی با بودجه ۱۵ میلیارد تومانی راهاندازی شد

به گزارش خبرنگار دانشگاه خبرگزاری دانشجو؛ محمدمهدی اثنیعشری استاد دانشگاه و عضو هیئت علمی دانشگاه صنعتی خواجه نصیرالدین طوسی، و مدیر پروژه «دستیار هوشمند هوش مصنوعی ویژه وزیر میراث فرهنگی، گردشگری و صنایع دستی» گفت: این پروژه در چارچوب طرحهای تعریفشده توسط معاونت علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری شکل گرفت. آغاز رسمی پروژه از نظر قراردادی در تاریخ ۲۵ اسفندماه سال گذشته بوده است، هرچند فعالیتهای مقدماتی شامل تعریف پروپوزال، نیازسنجی و طراحی مفهومی از بهمنماه سال گذشته آغاز شد و اجرای عملی پروژه بهصورت تماموقت از ابتدای اسفندماه کلید خورد.
مدیر پروژه «دستیار هوشمند هوش مصنوعی ویژه وزیر میراث فرهنگی، گردشگری و صنایع دستی» گفت: هدف اصلی پروژه، طراحی و پیادهسازی یک دستیار هوشمند مبتنی بر دادههای خود وزارتخانه است؛ سامانهای که ساختار، مأموریتها، قوانین و دادههای وزارتخانه را بشناسد و بتواند بهعنوان ابزار پشتیبان تصمیمگیری در اختیار وزیر قرار گیرد. تأکید میشود که این سامانه تصمیمگیر یا تصمیمیار خودکار نیست و هیچگونه پیشنهاد یا حکم اجرایی ارائه نمیدهد، بلکه صرفاً با برجستهسازی اطلاعات، اسناد و جوانب کمتر دیدهشده، به شفافتر شدن فرآیند تصمیمگیری کمک میکند تا تصمیمها با آگاهی کاملتری اتخاذ شوند.
اثنیعشری گفت: در مسیر دسترسی به دادههای وزارتخانه، محدودیتهای امنیتی متداول در دستگاههای دولتی وجود داشت؛ ازاینرو امکان دریافت همه دادهها فراهم نشد. بر همین اساس، تمرکز فاز نخست پروژه بنا به درخواست وزارتخانه، بر قوانین و مقررات عمومی کشور و بهصورت ویژه قوانین حوزه گردشگری قرار گرفت. در این راستا، بیش از ۱۶۰ هزار سند قانونی و مقرراتی مصوب کشور (از سالهای گذشته تاکنون) که پیشتر گردآوری شده بودند، در اختیار پروژه قرار گرفت. همچنین دادهها و مستندات عمومی مرتبط با حوزه گردشگری از سطح اینترنت گردآوری شد؛ از جمله سالنامههای آماری گردشگری، دادههای گردشگری، اطلاعات مرتبط با سازمان هواپیمایی کشوری و سایر اسناد مرتبط با سفر و گردشگری این مجموعه مستندات هماکنون در سامانه قابل مشاهده است و شامل قوانین عمومی، مقررات تخصصی گردشگری، اسناد مرتبط با موزه ملی و سایر حوزههای مرتبط میشود.
مدیر پروژه «دستیار هوش مصنوعی ویژه وزیر میراث فرهنگی، گردشگری و صنایع دستی» گفت: فاز اولیه پروژه در اردیبهشتماه سال ۱۴۰۴ راهاندازی شد و نسخه نخست سامانه، هرچند بهصورت محدود و ابتدایی، در دسترس قرار گرفت. پس از آن تلاش شد بهصورت ماهانه نسخههای جدید سامانه با بهبودهای تدریجی ارائه شود. با این حال، در برخی مقاطع به دلیل شرایط خاص کشور از جمله دوره جنگ تحمیلی ۱۲ روزه و نیز محدودیتهای مقطعی دسترسی به اینترنت امکان بهروزرسانی منظم سامانه فراهم نبود. با وجود این وقفهها، در سایر بازههای زمانی روند توسعه و ارتقای سامانه بهصورت مستمر ادامه یافته است.
وی در ادامه بیان کرد: در ادامه مسیر توسعه سامانه، نسخهها بهصورت تدریجی تقویت و بهروزرسانی شدند. برای نامگذاری سامانه، عنوان «طوسا» انتخاب شد که هم اشارهای به هوش مصنوعی دارد و برگرفته از نام دانشگاه صنعتی خواجه نصیرالدین طوسی است. با توجه به اینکه معاونت علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری کارفرمای اصلی پروژه است، فاز نخست پروژه مطابق با برنامه زمانبندی تعریفشده، در مهرماه به این معاونت تحویل داده شد. در فرآیند ارزیابی، ناظر معرفیشده از سوی معاونت علمی مجموعهای از پرسشها و سناریوهای پرسشوپاسخ را شامل قوانین و مقررات عمومی کشور و قوانین تخصصی حوزه گردشگری بر روی سامانه اجرا کرد و پاسخها از نظر صحت و دقت مورد ارزیابی قرار گرفت.
مدیر پروژه «دستیار هوشمند هوش مصنوعی ویژه وزیر میراث فرهنگی، گردشگری و صنایع دستی» گفت: این ارزیابی بهصورت مقایسهای میان حدود ۱۵ دانشگاه و شرکت که مجری پروژههای مشابه برای وزارتخانههای مختلف بودند انجام شد و نتایج در سطوح مختلف (۴۰، ۵۰، ۶۰، ۷۰ و ۸۰ درصد) دستهبندی شد. در این ارزیابی، پروژه دانشگاه صنعتی خواجه نصیرالدین طوسی در حوزه وزارت میراث فرهنگی، گردشگری و صنایع دستی در سطح ۸۰ درصد صحت و دقت قرار گرفت. شایان ذکر است که در این مرحله، هیچیک از مجریان به سطح ۹۰ درصد نرسیدند. با توجه به پیشبینی بازارزیابی مجدد، بهبودهایی برای سامانه در دست انجام است و امید میرود در ارزیابیهای آتی، سامانه به سطح ۹۰ درصد نیز دست یابد.
وی در ادامه بیان کرد: از این مرحله به بعد، پروژه عملاً وارد دو مسیر موازی میشود. مسیر نخست، ادامه پروژه مطابق با فازبندی تعریفشده از سوی معاونت علمی است. در فاز دوم، تمرکز پروژه از دادههای متنی (قوانین و مقررات) به سمت دادههای عددی و آماری منتقل میشود. در این فاز، هدف آن است که سامانه علاوه بر نمودارهای از پیش تعریفشده، قادر باشد به درخواستهای تحلیلی جدید پاسخ دهد؛ به این معنا که وزیر بتوانند یک گزارش موردنظر را بهصورت متنی در سامانه وارد کنند و سامانه بهصورت هوشمند به پایگاه داده متصل شده، دادههای لازم را استخراج کند و گزارش تحلیلی موردنظر را بهصورت خودکار تولید و ارائه دهد. این بخش در حال حاضر در دست اجراست و محور اصلی فاز دوم پروژه محسوب میشود.
اثنیعشری گفت: مسیر دوم، تحویل و استقرار سامانه در وزارت میراث فرهنگی، گردشگری و صنایع دستی است. اگرچه فاز نخست پروژه به معاونت علمی تحویل داده شده و ارزیابی کلان آن انجام شده است، اما این ارزیابی عمومی و غیرتخصصی بوده و جایگزین ارزیابی تخصصی وزارتخانه نمیشود. در این مرحله، لازم است سامانه به وزارتخانه تحویل داده شود تا کارشناسان تخصصی وزارتخانه با انجام پرسشوپاسخهای واقعی، بازخوردهای دقیق ارائه دهند. این بازخوردها مبنای بهبود سامانه قرار خواهد گرفت تا کیفیت پاسخها متناسب با نیازهای واقعی حوزه میراث فرهنگی، گردشگری و صنایع دستی ارتقا یابد.
مدیر پروژه «دستیار هوشمند هوش مصنوعی ویژه وزیر میراث فرهنگی، گردشگری و صنایع دستی» گفت: بنابراین، تأیید فاز نخست توسط معاونت علمی هرچند با سطح ۸۰ درصد صحت و دقت به این معنا نیست که سامانه در وضعیت فعلی قادر به پاسخگویی کامل به همه نیازها و مسائل تصمیمسازی وزیر باشد، بلکه نشاندهنده دستیابی به حداقلهای فنی قابل قبول است. رسیدن به سطح مطلوب و عملیاتی، مستلزم همکاری مستمر با وزارتخانه و دریافت بازخورد کارشناسان تخصصی است.
وی در ادامه بیان کرد: همین رویکرد در خصوص فاز دوم پروژه نیز دنبال خواهد شد؛ بدین معنا که پس از تحویل به معاونت علمی، سامانه باید در اختیار وزارتخانه قرار گیرد، گزارشهای تولیدشده بهصورت خودکار مورد ارزیابی کیفی و صحتسنجی قرار گیرند و پس از تأیید نهایی، بهعنوان ابزار پشتیبان تصمیمگیری در اختیار وزیر قرار گیرد. در خصوص زمانبندی پروژه، لازم به ذکر است که با توجه به شرایط پیشآمده، برنامه زمانی اولیه پروژه با جابهجایی مواجه شد. در ابتدا، مدت زمان پروژه ۶ ماه پیشبینی شده بود و قرار بود تا پایان شهریورماه به اتمام برسد. با این حال، شرایط خاص کشور و بهویژه عدم تأمین بهموقع زیرساخت سختافزاری موجب تأخیر شد. بر اساس برنامه، سختافزار پروژه میبایست از ابتدای اجرا در اختیار تیم قرار میگرفت، اما سکوی ملی هوش مصنوعی که مسئول تأمین این زیرساخت بود، تا مردادماه دسترسی لازم را فراهم نکرد. در عمل، نخستین دسترسی مؤثر به زیرساخت سختافزاری در مردادماه و تقریباً یک ماه پیش از پایان رسمی زمانبندی اولیه پروژه فراهم شد که طبیعتاً تأثیر مستقیم بر روند اجرای پروژه داشت.
وی در ادامه بیان کرد: با وجود اینکه از مردادماه امکان استفاده از زیرساخت سختافزاری فراهم شد، اما واقعیت این است که مشکلات در سطح کلان کشور وجود داشته و همچنان نیز وجود دارد. علاوه بر این، ذات پروژههای نرمافزاری نیز بهگونهای است که معمولاً بیش از زمان پیشبینیشده به طول میانجامند؛ بهطوری که در ادبیات فنی گفته میشود اغلب پروژههای نرمافزاری حداقل سه برابر زمان برآورد اولیه زمان میبرند، حتی اگر این موضوع از ابتدا در نظر گرفته شده باشد.
مدیر پروژه هوش مصنوعی گفت: بر همین اساس، اگرچه در قرارداد رسمی مدت پروژه ۶ ماه تعیین شد، اما از ابتدا نیز اعلام کرده بودیم که بازه زمانی ۱۸ ماهه برای چنین پروژهای واقعبینانهتر است. با وجود این، بهمنظور تسریع در اجرا، زمان پروژه به ۶ ماه کاهش یافت. با این حال، همچنان برآورد ما این است که رسیدن سامانه به سطحی که بتواند پاسخگوی قابل اتکایی برای نیازهای تصمیمسازی وزیر باشد، به حدود ۱۸ ماه زمان نیاز دارد. در خوشبینانهترین حالت، دستیابی به حداقل سطح مطلوب تا شهریورماه ۱۴۰۵ ممکن است، اما برآورد واقعبینانهتر، آذرماه ۱۴۰۵ است. فاز نخست پروژه تحویل معاونت علمی شده و فاز دوم طبق برنامه قرار بود تا پایان سال جاری تکمیل شود، اما واقعیت این است که تاکنون چارچوب دقیق ارزیابی فاز دوم بهصورت شفاف اعلام نشده است. آنچه بهصورت کلی مطرح شده، عبور از «گفتوگو با داده» به سمت تحلیل روندها و پیشبینی بر اساس دادههای موجود است؛ موضوعی که میتواند در قالب فاز سوم نیز تعریف شود. بر این اساس، جمعبندی نهایی پروژه را میتوان با نگاه خوشبینانه در آذرماه سال آینده متصور بود.
وی در ادامه بیان کرد: تیم پروژه از چهار بخش اصلی تشکیل شده است تیم مدل که این تیم مسئول کار با مدلهای زبانی و طراحی منطق تولید پاسخ متناسب با پرسشهای ورودی است و بخش اصلی کارهای فنی مرتبط با هوش مصنوعی را بر عهده دارد. تیم زیرساخت که با توجه به اینکه تأمین زیرساخت قرار بود از سوی سکوی ملی هوش مصنوعی انجام شود، اما در زمان مقرر محقق نشد، ناچار شدیم این بخش را بهصورت مستقل در دانشگاه راهاندازی کنیم. در حال حاضر، سامانه بر روی سرورهای دانشگاه صنعتی خواجه نصیرالدین طوسی مستقر است و تیم زیرساخت از ابتدای پروژه درگیر پشتیبانی و مدیریت فنی این بخش بوده است. تیم داده که مسئولیت جمعآوری، پالایش و ساختدهی دادهها بر عهده این تیم است در فاز دوم پروژه، با توجه به تمرکز بر «گفتوگو با دادههای عددی»، نقش بسیار پررنگتری خواهد داشت و همچنین؛ تیم محصول که طراحی تجربه کاربری، رابط کاربری و پیادهسازی سامانه قابل استفاده توسط کاربران نهایی بر عهده این تیم بوده است و در خصوص مدلهای هوش مصنوعی مورد استفاده، به دلیل ملاحظات امنیتی، پایداری در شرایط محدودیت اینترنت و حساسیت دادههای وزارتخانه، امکان استفاده از مدلهای تجاری خارجی وجود ندارد. به همین دلیل، از مدلهای متنباز که بهصورت داخلی و بر بستر سکوی ملی هوش مصنوعی میزبانی شدهاند استفاده میشود.
مدیر پروژه هوش مصنوعی وزارت میراث فرهنگی، گردشگری و صنایع دستی گفت: در خصوص سطوح دسترسی و محرمانگی اطلاعات، این نکته کاملاً در طراحی سامانه دیده شده است. با توجه به حساسیت دادهها، حتی در درون یک وزارتخانه نیز ممکن است همه کاربران مجاز به دسترسی به همه اطلاعات نباشند. در سامانه این امکان پیشبینی شده که سطوح دسترسی متفاوت تعریف شود؛ بهگونهای که هر کاربر صرفاً به مجموعهای مشخص از مستندات و دادهها دسترسی داشته باشد و تنها در همان حوزه امکان پرسشوپاسخ برای او فراهم باشد. طبیعتاً وزیر بهعنوان بالاترین سطح مدیریتی، میتوانند به تمامی دادهها و اطلاعات دسترسی داشته باشند، اما برای سایر کاربران، این موضوع کاملاً وابسته به سیاستهای داخلی وزارتخانه خواهد بود. سامانه از نظر فنی این انعطافپذیری را دارد که هم دسترسیهای محدود و هم دسترسیهای کلان را پشتیبانی کند و نحوه استفاده نهایی، بر اساس تصمیم وزارتخانه تنظیم خواهد شد.
اثنیعشری افزود: در عین حال، تأکید میشود که پروژه هنوز به مرحله ارائه مستقیم به وزیر نرسیده است. در حال حاضر، سامانه در مرحلهای قرار دارد که باید به بدنه کارشناسی وزارتخانه تحویل داده شود تا کارشناسان تخصصی با آن کار کنند، پرسشوپاسخ انجام دهند، بازخورد بدهند و ایرادات احتمالی مشخص شود. هدف از این مرحله، جلوگیری از ارائه اطلاعات نادرست یا ناقص در سطوح تصمیمگیری کلان است؛ چراکه در صورت ارائه داده نادرست، سامانه نهتنها کمکی به تصمیمگیری نخواهد کرد، بلکه میتواند باعث بروز خطا در تصمیمات شود. در خصوص بودجه پروژه، برای پروژه دستیار هوشمند وزارت میراث فرهنگی، گردشگری و صنایع دستی، بودجهای در حدود ۱۴ تا ۱۵ میلیارد تومان پیشبینی و تخصیص داده شده است. واقعیت این است که این بودجه در صورتی کفایت داشت که پروژه مطابق برنامه اولیه و در بازه زمانی تعیینشده به پایان میرسید. اما با توجه به شرایط موجود، پروژه قطعاً یکساله به پایان نخواهد رسید و برآورد فعلی ما این است که حداقل ۹ تا ۱۰ ماه دیگر نیز درگیر توسعه و تکمیل پروژه خواهیم بود.
مدیر پروژه هوش مصنوعی وزیر میراث فرهنگی، گردشگری و صنایع دستی گفت: از سوی دیگر، هزینههای زیرساخت سختافزاری نیز به پروژه تحمیل شده است؛ در حالی که در برنامه اولیه، تأمین سختافزار بر عهده سکوی ملی هوش مصنوعی بوده و این هزینه در بودجه پروژه لحاظ نشده بود. در عمل، ناچار شدیم از زیرساخت دانشگاه صنعتی خواجه نصیرالدین طوسی استفاده کنیم. هرچند این زیرساخت متعلق به دانشگاه است، اما استفاده از آن برای پروژه مشمول هزینه بوده و دانشگاه بابت این استفاده هزینه دریافت میکند. مجموع این عوامل باعث میشود که در صورت تداوم شرایط فعلی، پروژه در ماههای آینده با چالشهای جدی بودجهای مواجه شود. امیدواریم با توجه به پیشرفتهای حاصلشده، در این زمینه تجدیدنظر و بازبینی بودجهای صورت گیرد.
اثنیعشری گفت: اما شاید بزرگترین چالش توسعه این سامانه، مسئله دیتاست و دسترسی به دادهها باشد. عملکرد مطلوب مدلهای هوش مصنوعی بهشدت وابسته به وجود دادههای کامل، تمیز و ساختیافته است. در حال حاضر، دسترسی ما به دادههای وزارتخانه محدود است که این موضوع کاملاً قابل درک بوده و در تمامی سازمانهای دولتی، به دلیل ملاحظات امنیتی، وجود دارد. حتی اگر فرض کنیم تضمینهای لازم از سوی معاونت علمی برای حفاظت از دادهها ارائه شود، باز هم مسئله اصلی به زیرساخت نگهداری دادهها بازمیگردد. در حال حاضر، دادهها بر روی سرورهای دانشگاه میزبانی میشوند و طبیعتاً برای وزارتخانه، انتقال دادههای حساس به زیرساخت دانشگاهی ـ با توجه به محدودیتهای بودجهای دانشگاهها در حوزه امنیت سایبری ـ کار سادهای نیست. حتی در سطح کشور نیز شاهد بودهایم که سازمانها و بانکهای بزرگ با بالاترین سطح ملاحظات امنیتی، دچار مشکلات امنیتی شدهاند؛ بنابراین انتظار تأمین امنیت در سطح بسیار بالا از زیرساخت دانشگاهی، واقعبینانه نیست.
مدیر پروژه گفت: بر همین اساس، تا زمانی که زیرساخت امن و اختصاصی برای میزبانی دادهها از سوی سکوی ملی هوش مصنوعی یا یک نهاد ملی مورد تأیید فراهم نشود، طبیعی است که وزارتخانهها با احتیاط بیشتری دادههای خود را در اختیار پروژه قرار دهند. در حال حاضر، سکوی ملی هوش مصنوعی صرفاً دسترسی API به مدلها را در اختیار ما قرار داده است، اما فضایی که امکان میزبانی کامل سامانه و دادهها را داشته باشد، هنوز فراهم نشده است. بدیهی است که از منظر تیم پروژه، محل استقرار سامانه تفاوتی ایجاد نمیکند؛ چه بر بستر زیرساخت دانشگاه باشد، چه بر روی زیرساخت وزارتخانه یا سکوی ملی. هر زیرساختی که بهصورت رسمی در اختیار پروژه قرار گیرد، از نظر فنی برای ما قابل استفاده خواهد بود. اما حل مسئله زیرساخت امن، شرط اساسی برای رفع چالش دیتاست و در نتیجه، ارتقای کیفیت و کارآمدی سامانه در سطح تصمیمسازی کلان است.
اثنیعشری گفت: در این خصوص، ما کاملاً آمادگی انجام این کار را داریم؛ با این حال، یک نکته مهم وجود دارد. در حال حاضر، مدلهای زبانی مورد استفاده سامانه از طریق سکوی ملی هوش مصنوعی تأمین میشوند. بنابراین، حتی در صورتی که سامانه بهطور کامل در داخل وزارتخانه میزبانی شود، دادهها بهصورت اجتنابناپذیر یک رفتوبرگشت ارتباطی با سکوی ملی خواهند داشت؛ مگر آنکه زیرساخت سختافزاری وزارتخانه به اندازهای قدرتمند باشد که امکان میزبانی کامل مدلهای زبانی نیز در داخل خود وزارتخانه فراهم شود. در صورتی که وزارتخانه بتواند چنین زیرساختی را فراهم کند، این گزینه از نظر ما ایدهآلترین سناریو است. در این حالت، هم سامانه و هم مدلهای هوش مصنوعی بهصورت کاملاً داخلی میزبانی خواهند شد و دسترسی به دادهها با اطمینان و آسودگی خاطر بسیار بیشتری انجام میشود. تیم پروژه بهطور کامل آمادگی دارد که در صورت فراهم شدن این زیرساخت، کل سامانه و مدلها را در داخل وزارتخانه مستقر و راهاندازی کند.
مدیر پروژه «دستیار هوش مصنوعی وزیر میراث فرهنگی، گردشگری و صنایع دستی» گفت: برای شفافسازی موضوع، اگر بخواهیم یک برآورد تقریبی از نیاز سختافزاری ارائه دهیم، حداقل زیرساخت لازم شامل دو کارت گرافیک یا معادل آن است تا بتوان مدلها را در مقیاس عملیاتی راهاندازی کرد. قیمت هر کارت A۱۰۰ در شرایط فعلی، در حدود ۵ تا ۶ میلیارد تومان برآورد میشود؛ به این معنا که تنها هزینه کارتهای به حدود ۱۰ تا ۱۲ میلیارد تومان میرسد. علاوه بر آن، هزینههای مربوط به سرور میزبان، مرکز داده، سیستمهای خنککننده، تجهیزات شبکه و الزامات پایداری نیز باید در نظر گرفته شود. با احتساب این موارد، برآورد حداقلی هزینه زیرساخت سختافزاری برای میزبانی کامل سامانه و مدلها، رقمی در حدود ۲۰ میلیارد تومان خواهد بود. چنانچه چنین زیرساختی هماکنون در وزارتخانه موجود باشد، میتوان از همان امکانات موجود استفاده کرد و هزینههای اضافی را به حداقل رساند. اما در صورتی که این زیرساخت وجود نداشته باشد، تصمیمگیری درباره تأمین آن، نقش تعیینکنندهای در مسیر آینده پروژه، سطح امنیت دادهها و میزان استقلال سامانه از زیرساختهای بیرونی خواهد داشت.