به گزارش خبرگزاری بینالمللی اهلبیت(ع) ـ ابنا ـ مرکز تحقیقات کامپیوتری علوم اسلامی (نور) صبح امروز در نشستی که برای معرفی نخستین محصول هوشمند حوزه تاریخ برگزار شد، از راهاندازی سامانهای خبر داد که قادر است از مجموعه گسترده گزارشها و منابع تاریخی استخراجشده، خلاصهسازی و توصیف مستند هر رویداد تاریخی را بهصورت ماشینی تولید کند.
به گزارش خبرنگار ابنا، حجتالاسلام دکتر محمدعلی رحیمیثابت، مدیر گروه علمی تاریخ مرکز، در این نشست با اشاره به سابقه پژوهشی پایگاه جامع تاریخ گفت: «پایگاه جامع تاریخ که از سال ۱۳۹۷ در بستر اینترنت عرضه شده است، بر پایه استخراج خطبهخط منابع اصلی تاریخ اسلام و با تمرکز اولیه بر دوره صدر اسلام شکل گرفت.» وی افزود پژوهشگران مرکز با مطالعه منابع اصلی تاریخی — از جمله متون کلاسیک — رویدادها را استخراج، زمانبندی، مکان و کلیدواژهها را ثبت کردهاند و اکنون مجموعهای ارزشمند از دادههای تاریخی در اختیار است.
مهندس علی دانش، مدیر بخش پردازش هوشمصنوعی، در توضیح فنی سامانه اعلام کرد که تیم فنی مرکز مجموعهای از گزارشهای متمرکز از منابع مختلف (بیش از ۲۷۰ هزار گزارش) را پردازش کرده و با استفاده از مدلهای زبانی بزرگ و زیرساخت سختافزاری داخلی، برای بیش از ۱۸۰ هزار رویداد تاریخی مقالات کوتاه و مستند تولید نمودهاند. وی تاکید کرد که تولید متنها صرفاً مبتنی بر دادههای در اختیار مرکز انجام شده و مدلها از منابع خارجی «بدون کنترل» تغذیه نشدهاند: «ما بهمنظور کاهش خطا و توهم در خروجی مدلها، هر پاراگراف تولیدشده را به منبع ارجاع دادهایم تا کاربر با یک کلیک منبع اصلی را مشاهده کند.»

قابلیتها و روش کار
براساس توضیحات ارائهشده، سامانه جدید دارای قابلیتهای زیر است:
-
دستهبندی رویدادها بر اساس نوع (نظامی، سیاسی، فرهنگی، دینی و غیره)، بازه زمانی، شخص یا مکان محور.
-
امکان محدودسازی جستوجو به دورهها یا افراد خاص و نمایش مجموعه کامل رویدادهای مرتبط با آن محور.
-
استخراج و یکپارچهسازی گزارشهای متعدد از منابع مختلف و تولید یک متن خلاصه و منظم بهعنوان «شرح رویداد» همراه با فهرست منابع.
-
مکانیزمهای پردازش برای استانداردسازی تاریخها (تبدیل عبارات تاریخی مختلف به تاریخهای مشخص)، استخراج اعلام اشخاص و اماکن و برچسبگذاری محتوایی.
-
ارائه دسترسی از طریق زیرساختهای داخلی مرکز و نیز یک درگاه یکپارچه تحت عنوان «جیپیتی» برای تسهیل دسترسی به مدلهای زبانی (با رعایت مسائل فنی و امنیتی)، و امکان استفاده از سرویسها با کارتهای داخلی.
مدیر فنی مرکز درباره زیرساخت گفت که مرکز از ترکیب دو رویکردِ استفاده از مدلهای متنباز مستقر بر سرورهای داخلی و استفاده محدود از سرویسهای خارجی بهره میبرد تا ضمن پاسخگویی به نیازها، مسائل مربوط به محرمانگی و هزینهها را مدیریت کند.
تضمین مستند بودن و مقابله با خطا
در بخشی از جلسه به یکی از چالشهای اصلی کاربرد مدلهای زبانی — یعنی «توهم» یا تولید اطلاعات غیرمستند — اشاره شد. تیم فنی مرکز برای مقابله با این مسئله روشهایی اتخاذ کردهاند که از آن جملهاند:
-
محدودسازی دامنه ورودی مدلها به گزارشها و منابعی که خودِ مرکز استخراج و تایید کرده است.
-
الزام مدل برای ارجاعدهی هر پاراگراف به منبع یا منابع مبدأ، بهطوریکه کاربر بتواند سند اصلی را با یک کلیک مشاهده و صحت مطالب را بررسی کند.
-
انجام بازبینیهای پژوهشی و اصلاحات متعدد بر خروجیهای اولیه در فاز آزمایشی پیش از بارگذاری عمومی.
روند توسعه و برنامههای آینده
مسوولان مرکز اعلام کردند این رونمایی صرفاً گام نخست است و برنامههای توسعهای متعددی در دست اقدام است؛ از جمله:
-
بهکارگیری مدلهای زبانی بزرگتر برای استخراج مستقیم رویدادها از متون تاریخی و غنیسازی پایگاه داده.
-
توسعه بانک داده اعلام اشخاص و اماکن بهصورت منظم و اتصال آنها به مقالات و رویدادهای مربوطه تا پژوهشگران بتوانند فهرستهای موضوعی و فردی را بهسادگی در اختیار داشته باشند.
-
طراحی و پیادهسازی یک سامانه گفتوگوی هوشمند (چتبات تاریخی) که کاربران بتوانند بهصورت تعاملی درباره رویدادها سوال کنند و پاسخهای مستند دریافت نمایند؛ این پروژه قرار است با اتصال به سایر سرویسهای مرکز مانند سامانههای حدیث و تفسیر، بخشی از «دستیار جامع هوشمصنوعی حوزه علوم اسلامی» را شکل دهد.
-
ادامه گسترش دورهای انتشار محصولات هوشمند؛ بر اساس اعلام ریاست مرکز قرار است معرفی هر ماه یک محصول هوشمند در رشتههای مختلف علوم اسلامی دنبال شود.

پاسخ به دغدغهها درباره کاربردهای اجتماعی و حکمرانی
در نشست، یکی از حاضرین سوالاتی در خصوص کاربردهای این فناوری در حوزههای حکمرانی و سیاستگذاری مطرح کرد. حجتالاسلام رحیمیثابت در پاسخ تاکید کرد که هدف اصلی مرکز «تسهیل دسترسی پژوهشگران و عموم مردم به منابع اصیل و متون اسلامی» است و تولیدات مرکز با رویکرد پژوهشی و مستند برای استفاده علمی و آموزشی عرضه میشود. وی خاطرنشان ساخت که مرکز بستر و دادههای اصیل را در اختیار محققان میگذارد و قضاوت در مورد کاربردهای اجتماعی یا سیاستگذاری بر عهده دستگاههای ذیربط و نخبگان علمی است.
نکات تکمیلی و دسترسی
مسوولان مرکز یادآور شدند که فرایند تجمیع و افزودن دادهها به پایگاه همچنان ادامه دارد و در حال حاضر تیمی از پژوهشگرانِ تخصصی (طلبه و تاریخپژوه) بر استخراج و اعتبارسنجی رویدادها کار میکنند. کاربران میتوانند شرح رویدادها و مقالات کوتاه تولیدشده را در بخش «رویدادها» پایگاه جامع تاریخ به نشانی tarikh.inoor.ir مشاهده کنند.
..............................
پایان پیام/
نظر شما