۴ شهریور ۱۴۰۴ - ۱۲:۲۴
گام تازه در دیجیتال‌سازی تاریخ اسلام؛ رونمایی مرکز نور از سامانه هوشمند تحلیل رویدادها

صبح سه‌شنبه ۴ شهریور ۱۴۰۴، مرکز تحقیقات کامپیوتری علوم اسلامی (نور) از سامانه هوشمند «تحلیل و توصیف رویدادهای تاریخی» رونمایی کرد. در این نشست که با حضور حجت‌الاسلام دکتر محمدعلی رحیمی‌ثابت، مدیر گروه علمی تاریخ، و مهندس علی دانش، مدیر آزمایشگاه هوش‌مصنوعی مرکز، برگزار شد، اعلام شد بخش «رویدادها» در پایگاه جامع تاریخ به نشانی tarikh.inoor.ir حاوی بیش از ۱۸۰ هزار رویداد تاریخی است که با استفاده از فنّاوری‌های هوش‌مصنوعی جمع‌بندی و خلاصه‌سازی شده‌اند.

به گزارش خبرگزاری بین‌المللی اهل‌بیت(ع) ـ ابنا ـ مرکز تحقیقات کامپیوتری علوم اسلامی (نور) صبح امروز در نشستی که برای معرفی نخستین محصول هوشمند حوزه تاریخ برگزار شد، از راه‌اندازی سامانه‌ای خبر داد که قادر است از مجموعه گسترده گزارش‌ها و منابع تاریخی استخراج‌شده، خلاصه‌سازی و توصیف مستند هر رویداد تاریخی را به‌صورت ماشینی تولید کند.

به گزارش خبرنگار ابنا، حجت‌الاسلام دکتر محمدعلی رحیمی‌ثابت، مدیر گروه علمی تاریخ مرکز، در این نشست با اشاره به سابقه پژوهشی پایگاه جامع تاریخ گفت: «پایگاه جامع تاریخ که از سال ۱۳۹۷ در بستر اینترنت عرضه شده است، بر پایه استخراج خط‌به‌خط منابع اصلی تاریخ اسلام و با تمرکز اولیه بر دوره صدر اسلام شکل گرفت.» وی افزود پژوهشگران مرکز با مطالعه منابع اصلی تاریخی — از جمله متون کلاسیک — رویدادها را استخراج، زمان‌بندی، مکان و کلیدواژه‌ها را ثبت کرده‌اند و اکنون مجموعه‌ای ارزشمند از داده‌های تاریخی در اختیار است.

مهندس علی دانش، مدیر بخش پردازش هوش‌مصنوعی، در توضیح فنی سامانه اعلام کرد که تیم فنی مرکز مجموعه‌ای از گزارش‌های متمرکز از منابع مختلف (بیش از ۲۷۰ هزار گزارش) را پردازش کرده و با استفاده از مدل‌های زبانی بزرگ و زیرساخت‌ سخت‌افزاری داخلی، برای بیش از ۱۸۰ هزار رویداد تاریخی مقالات کوتاه و مستند تولید نموده‌اند. وی تاکید کرد که تولید متن‌ها صرفاً مبتنی بر داده‌های در اختیار مرکز انجام شده و مدل‌ها از منابع خارجی «بدون کنترل» تغذیه نشده‌اند: «ما به‌منظور کاهش خطا و توهم در خروجی مدل‌ها، هر پاراگراف تولیدشده را به منبع ارجاع داده‌ایم تا کاربر با یک کلیک منبع اصلی را مشاهده کند.»

قابلیت‌ها و روش کار

براساس توضیحات ارائه‌شده، سامانه جدید دارای قابلیت‌های زیر است:

  • دسته‌بندی رویدادها بر اساس نوع (نظامی، سیاسی، فرهنگی، دینی و غیره)، بازه زمانی، شخص یا مکان محور.

  • امکان محدودسازی جست‌وجو به دوره‌ها یا افراد خاص و نمایش مجموعه کامل رویدادهای مرتبط با آن محور.

  • استخراج و یکپارچه‌سازی گزارش‌های متعدد از منابع مختلف و تولید یک متن خلاصه و منظم به‌عنوان «شرح رویداد» همراه با فهرست منابع.

  • مکانیزم‌های پردازش برای استانداردسازی تاریخ‌ها (تبدیل عبارات تاریخی مختلف به تاریخ‌های مشخص)، استخراج اعلام اشخاص و اماکن و برچسب‌گذاری محتوایی.

  • ارائه دسترسی از طریق زیرساخت‌های داخلی مرکز و نیز یک درگاه یکپارچه تحت عنوان «جی‌پی‌تی» برای تسهیل دسترسی به مدل‌های زبانی (با رعایت مسائل فنی و امنیتی)، و امکان استفاده از سرویس‌ها با کارت‌های داخلی.

مدیر فنی مرکز درباره زیرساخت گفت که مرکز از ترکیب دو رویکردِ استفاده از مدل‌های متن‌باز مستقر بر سرورهای داخلی و استفاده محدود از سرویس‌های خارجی بهره می‌برد تا ضمن پاسخ‌گویی به نیازها، مسائل مربوط به محرمانگی و هزینه‌ها را مدیریت کند.

تضمین مستند بودن و مقابله با خطا

در بخشی از جلسه به یکی از چالش‌های اصلی کاربرد مدل‌های زبانی — یعنی «توهم» یا تولید اطلاعات غیرمستند — اشاره شد. تیم فنی مرکز برای مقابله با این مسئله روش‌هایی اتخاذ کرده‌اند که از آن جمله‌اند:

  • محدودسازی دامنه ورودی مدل‌ها به گزارش‌ها و منابعی که خودِ مرکز استخراج و تایید کرده است.

  • الزام مدل برای ارجاع‌دهی هر پاراگراف به منبع یا منابع مبدأ، به‌طوری‌که کاربر بتواند سند اصلی را با یک کلیک مشاهده و صحت مطالب را بررسی کند.

  • انجام بازبینی‌های پژوهشی و اصلاحات متعدد بر خروجی‌های اولیه در فاز آزمایشی پیش از بارگذاری عمومی.

روند توسعه و برنامه‌های آینده

مسوولان مرکز اعلام کردند این رونمایی صرفاً گام نخست است و برنامه‌های توسعه‌ای متعددی در دست اقدام است؛ از جمله:

  • به‌کارگیری مدل‌های زبانی بزرگ‌تر برای استخراج مستقیم رویدادها از متون تاریخی و غنی‌سازی پایگاه داده.

  • توسعه بانک داده اعلام اشخاص و اماکن به‌صورت منظم و اتصال آن‌ها به مقالات و رویدادهای مربوطه تا پژوهشگران بتوانند فهرست‌های موضوعی و فردی را به‌سادگی در اختیار داشته باشند.

  • طراحی و پیاده‌سازی یک سامانه گفت‌وگوی هوشمند (چت‌بات تاریخی) که کاربران بتوانند به‌صورت تعاملی درباره رویدادها سوال کنند و پاسخ‌های مستند دریافت نمایند؛ این پروژه قرار است با اتصال به سایر سرویس‌های مرکز مانند سامانه‌های حدیث و تفسیر، بخشی از «دستیار جامع هوش‌مصنوعی حوزه علوم اسلامی» را شکل دهد.

  • ادامه گسترش دوره‌ای انتشار محصولات هوشمند؛ بر اساس اعلام ریاست مرکز قرار است معرفی هر ماه یک محصول هوشمند در رشته‌های مختلف علوم اسلامی دنبال شود.

گام تازه در دیجیتال‌سازی تاریخ اسلام؛ رونمایی مرکز نور از سامانه هوشمند تحلیل رویدادها

پاسخ به دغدغه‌ها درباره کاربردهای اجتماعی و حکمرانی

در نشست، یکی از حاضرین سوالاتی در خصوص کاربردهای این فناوری در حوزه‌های حکمرانی و سیاست‌گذاری مطرح کرد. حجت‌الاسلام رحیمی‌ثابت در پاسخ تاکید کرد که هدف اصلی مرکز «تسهیل دسترسی پژوهشگران و عموم مردم به منابع اصیل و متون اسلامی» است و تولیدات مرکز با رویکرد پژوهشی و مستند برای استفاده علمی و آموزشی عرضه می‌شود. وی خاطرنشان ساخت که مرکز بستر و داده‌های اصیل را در اختیار محققان می‌گذارد و قضاوت در مورد کاربردهای اجتماعی یا سیاست‌گذاری بر عهده دستگاه‌های ذی‌ربط و نخبگان علمی است.

نکات تکمیلی و دسترسی

مسوولان مرکز یادآور شدند که فرایند تجمیع و افزودن داده‌ها به پایگاه همچنان ادامه دارد و در حال حاضر تیمی از پژوهشگرانِ تخصصی (طلبه و تاریخ‌پژوه) بر استخراج و اعتبارسنجی رویدادها کار می‌کنند. کاربران می‌توانند شرح رویدادها و مقالات کوتاه تولیدشده را در بخش «رویدادها» پایگاه جامع تاریخ به نشانی tarikh.inoor.ir مشاهده کنند.

https://tarikh.inoor.ir/

..............................

پایان پیام/

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.
captcha