11
مجله محدث شماره دوم

مجله محدث شماره دوم
10




راه‌یابی الكترونیكی به تولیدات پژوهشی دارالحدیث













  
راه‌یابی
الكترونیكی به تولیدات پژوهشی دارالحدیث

  
(گفتگو با مدیر رایانه و اینترنت مؤسسه
درباره نرم افزار سامان دهی اطلاعات)



 























حجم گسترده اطلاعاتی كه در قالب كتاب،
نشریه و مقاله‌های پژوهشی و فرهنگی در
مؤسسه دارالحدیث تولید شده است، نیاز به
استفاده از روش‌های نوین دست‌رسی به
اطلاعات را ایجاد كرده است. استفاده از
نمایه و نیز بانک های اطلاعاتی از جمله
این شیوه هاست. نمایه‌سازی (Indexing) یكی
از این شیوه‌هاست كه جستجوی اطلاعات مورد
نظر به شیوه نوشتاری (چاپی) است.
«نرم‌افزار سامان‌دهی اطلاعات» در همین
راستا و با استفاده از فُرمت گذاری و
تفکیک انواع متون و كاركرد بانك‌های
اطلاعاتی (Databases) در مؤسسه فراهم آمده
است.



 گفتگوی
محدّث با حجة الاسلام و المسلمین احسان
سرخه‌ای
مدیر امور رایانه و اینترنت
دارالحدیث در این باره است كه از نظرتان
می‌گذرد.





پیشینه‌ای از پروژه سامان‌دهی اطلاعات
بیان کنید. این که این ایده چگونه شکل
گرفته است؟



 این
موضوع به سال 1380 بر می‌گردد که مؤسسه
دارالحدیث اولین نرم‌افزار گسترده‌اش را
تولید کرد. مجموعه دوازده جلدی موسوعة
امام علی(ع) تقریباً سومین نرم‌افزاری بود
که در دارالحدیث تولید شد. مشکلاتی که
فرآیند پردازش و آماده‌سازی اطلاعات در آن
نرم‌افزار برای ما ایجاد کرد جرقه‌ای بود
که ما به سمت بازنگری اطلاعات تولید شده
دارالحدیث پیش برویم. معمولاً مؤسّساتی که
تولید اطلاعات دارند این اطلاعات را در
قالب فایل‌های متنی نگهداری می‌کنند و
تبدیلش به یک نرم‌افزار، مراحلی را ایجاب
می‌کند که هم هزینه‌های زمانی دارد و هم
هزینه‌های نیروی انسانی و چه بسا بازنگری
مجدد در اصل متن تولید شده هم لازم شود تا
هم‌سنخ با یک نرم‌افزار بشود و ارائه
دیجیتالی آن امکان‌پذیر باشد. ما هم دچار
این مشکل شدیم. فایل‌هایی که در فرآیند
ارائه اطلاعات در دارالحدیث مورد استفاده
قرار می‌گرفت فایل‌های زرنگاری بودند كه
ارائه آنها به صورت دیجیتالی تبدیل خاص
خودش را ‌داشت. در واقع می‌شود گفت که
انباشت اطلاعات در سال 1385 شروع شده بود
و ما خیلی زود به این نتیجه رسیدیم که
درآینده خیلی نزدیک، حجم داده‌های تولید
شده در دارالحدیث در قالب کتاب و مجله و
مقاله به حدی خواهد بود که دیگر هیچ کدام
از اطلاعات تولید شده قبلی خودمان را
نمی‌توانیم پیدا کنیم. فکر تولید
برنامه‌ای که بتواند دو جهت کار برای ما
انجام بدهد: یکی فرآیند تولید اطلاعات را
برای ما پشتیبانی بکند یعنی مقاطع و
مراحلی را که ما در تولید اطلاعات پیش‌روی
خودمان داشتیم را برای ما امکان‌پذیر کند،
و از جهت دوم بتواند اطلاعات تولید شده را
ذخیره‌سازی و برای استفاده مجدد سرویس دهی
بکند ما را سوق داد به سامان‌دهی اطلاعات.
این کار در قم سابقه نداشت یعنی ما
تقریباً می توانیم بگوییم که در این مرحله
تحلیل و طراحی، از تجربه‌ای نمی‌توانستیم
استفاده کنیم.



اطلاعات موجود در این
برنامه، به چه صورت‌هایی درج شده است؟


1
مجموعه اطلاعاتی که در اینجا تولید می‌شود
با توجه به ساختاری که دارد در سه قالب
کلی گنجانده می‌شود: یکی کتاب، دوم، مجله
و سوم، مقاله. بعد به این نتیجه رسیدیم که
محتوای اطلاعاتی که در اینجا تولید می‌شود
یا آیات قرآن هست یا روایات یا عناوین سر
فصل‌های متن‌ها و محتوا هست، یا فهرستی
هست که در این محتوا چیده شده یا ارجاعاتی
هست که در این کتاب‌ها مورد استفاده قرار
می‌گیرد و یا رسانه‌ها و تصاویر. انواع
دیگری که در استانداردهای ما نمی‌گنجد به
عنوان پاراگراف یا یک متن معمولی در سیستم
گنجاندیم؛ پس در حقیقت از یک روند شاخه‌ای
استفاده کردیم: انواع ما در سه قسم
می‌گنجند و داخل هر کدام از سه قسم، این
انواع متن وجود دارد. اینها داده‌های اصلی
ما بودند بعضی از داده‌های ما به عنوان
داده‌های وابسته به این عناوین کلی در نظر
گرفته می‌شوند، مثل مصادر یا پاورقی‌ها و
شرح لغات و چیزهایی از این قبیل. به این
ترتیب با طراحی یك بانک اطلاعاتی، جداولی
را ایجاد کردیم که در این جداول انواع این
متن‌ها ذخیره‌سازی می‌شود و مجموعه اینها
در یک پازل، یک کتاب یا یک مجله یا یک
مقاله را تولید می‌کند.



از امتیازات منحصر
به فرد برنامه سامان‌دهی اطلاعات در
دارالحدیث سخن بگویید.


 1 طبیعتاً در این
سیستم چون ما با آیات و روایات سر و کار
داشتیم یکی از مقوله‌هایی که در روند
تولید مورد استفاده قرار می‌گرفت
اعراب‌گذاری بود. روایاتی که از منابع
مختلف جمع‌آوری می‌شد در مراحل نهایی،
اعراب‌گذاری می‌شود. ما یک سیستم
اعراب‌گذاری ماشینی را در این سیستم
پیش‌بینی کردیم که خودش به صورت هوشمند
متن وارد شده را می خواند و اعراب‌گذاری
می‌کند و به کاربر ارائه می‌کند تا کاربر
تصمیم بگیرد که اعراب‌هایی که سیستم به او
معرفی کرده آیا صحت دارد یا نه و این
سیستم خودش خودش را ارتقا می‌دهد؛ یعنی
وقتی که شما اعراب‌گذاری را تصحیح و تأیید
می‌کنید، به بانک قبلی اضافه می‌شود و در
مراحل بعدی از همین چیزی که شما تأیید
کردید استفاده خواهد شد. از جمله چیزهای
دیگری که ما در این سیستم دیدیم و جزء
چیزهای مهم هم هست بحث تشخیص لغات مشکل
است. بانکی از لغات مشکل را در این سیستم
آماده‌سازی کردیم. همه لغاتی که اصطلاحاً
به آنها می گوییم «غریب الحدیث» در این
مجموعه گنجانده شده که هم ریشه کلمه را
ذخیره می‌كند و هم مشتق و هم شاهد مثال
را. با توجه به آن اطلاعاتی که از قبل در
بانک غریب الحدیث وارد شده تشخیص می‌دهد
آیا این جزو کلماتی هست که به شرح لغت
احتیاج دارد یا نه؟ اگر احتیاج داشته باشد
به کاربر پیشنهاد می‌کند مراجعه کند. حتی
می‌گوید اینجا کلمه غریبی وجود دارد، این
کلمه غریب ترجمه‌اش این می‌شود، آیا
می‌خواهید به پاورقی این مجموعه اضافه و
از آن استفاده کنید یا نه؟ نکته سوم هم که
واقعاً حائز اهمیت است و یکی از دغدغه‌های
مهم حدیث پژوهان به حساب می‌آید
مشابه‌یابی یا تکراریابی است. استفاده
مجدد از اطلاعاتی که قبلاً فرآیند تولید
را گذراندند مقوله‌ای است كه برای تقلیل
حجم هزینه‌ها توجه به آن لازم است؛ مثلاً
فرض بفرمایید متنی که قبلاً اینجا تولید
شده، بر روی آن اعراب‌گذاری انجام شده،
غریب الحدیثش درآمده و ویراستاری و ترجمه
شده حالا در این سیستم موجود هست. اگر این
سیستم بتواند به کاربر بگوید حدیثی که شما
قبلاً در سیستم وارد کردید ، فرآیند تولید
را طی کرده طبیعتاً دیگر به این کارهای
مجدد نیازی نیست. ما با استفاده از
پیشرفته‌ترین الگوریتم‌هایی که وجود دارد،
سیستم مشابه‌یابی را در این برنامه
گذاشتیم. در حقیقت آن روندی را که دوستان
ما الآن به صورت دستی برای پیدا کردن
منابع و مآخذ یک حدیث استفاده می‌کنند، ما
به صورت ماشینی درآوردیم و سیستم
مشابه‌یابی در مجموعه سامان‌دهی هم اكنون
فعال است.



گویا این طرح در چند فاز پیش
بینی شده است.


بلی، این طرح در چهار فاز
پیش‌بینی شده که عملیاتی بشود؛ فاز اوّل،
پیاده سازی و نصب بانک‌های اطلاعاتی آن
بود، به علاوه یکی از خروجی‌ها که همان
خروجی فایل آن است. فاز اوّل در سال 83 ـ
1382 نهایی شد. فاز دوم، خروجی سی‌دی (CD)
بود یعنی بتوانیم از اطلاعاتی که در این
سیستم مستقر کردیم بتوانیم در کوتاه‌ترین
مدت ممکن خروجی نرم‌افزاری داشته باشیم که
این نرم‌افزار قابل تکثیر و ارائه به
دیگران باشد و دیگر نیازی نباشد كه برای
هر منبع جدید و یا مجموعه‌ای از منابع
سفارش سی‌دی بدهیم و خوش‌بختانه نگارش دوم
موسوعة الامام علی بن ابی‌طالب (ع) را که
مجموعه كتاب‌های عربی با ترجمه در24 جلد و
متن کتاب منتخب میزان الحکمة بود را با
همین سیستم ارائه کردیم و الآن هم
نرم‌افزار حج و عمره در کتاب و سنت در
دستور کار است که آخرین مراحل را طی
می‌کنیم. آنچه در دستور کار داریم این است
كه مثلاً مجموعه نشریات یا مجموعه
دانش‌نامه‌های مختلف مثل دانش‌نامه عقاید
اسلامی، دانش‌نامه احادیث پزشکی و ... در
غالب سی‌دی ارائه بشود. فاز سوم این
پروژه، انتقال این اطلاعات به سایت پویا
(Dynamic) بود. سایت دارالحدیث به نام
hadith.net مدت‌ها بود که در اینترنت فعال
بود و صفحاتی که در این سایت طراحی شده
بود به صورت سایت ایستا (Static) بود كه
با فرمت‌های HTML طراحی و آماده سازی
می‌شد. ما طراحی سایت را کلاً به صورت
بانک‌های اطلاعاتی دگرگون كردیم و از حالت
ایستا به صورت پویا درآوردیم؛ یعنی از
Static به Dynamic تبدیل شد. بسیاری از
این کارها به صورت ماشینی انجام می‌شود.
از جمله کارهایی که اکنون در این فرآیند
انجام می‌شود انتقال اطلاعات موجود در
سیستم سامان‌دهی به سایت است. اطلاعاتی که
قبلاً آنالیز و در سیستم سامان‌دهی ذخیره
شده با همان خصوصیات به سایت منتقل می‌شود
و در اینترنت هم قابل دسترسی است. من
سایتی را به این ویژگی سراغ ندارم که با
استفاده از فُرمت‌های مختلف، امکان دسترسی
به متن را به کاربرش بدهد. فاز چهارم ما
که جزء چیزهای نو و بدیع هم به حساب
می‌آید، خروجی نرم‌افزاری از سیستم
سامان‌دهی است که این نرم‌افزار روی
گوشی‌های موبایل قابل استفاده است. از
جمله چیزهایی که جزء مظلومیت‌های متون
اسلامی، بویژه حدیث است این است که هنوز
در گوشی‌های موبایل قابل استفاده نیست. به
همین خاطر مترصد شدیم که نرم‌افزاری تولید
کنیم که این نرم افزار، امکان دسترسی
کاربران گوشی موبایل را به متن بدهد. ما
روی متن کتاب منتخب میزان الحکمة این کار
را انجام دادیم. کاربر می تواند این
برنامه را نصب و از طریق فهرست و جستجو از
آن استفاده كند. ماهیت کتاب را در همه
خروجی‌هایمان حفظ کردیم؛ چه در سایت، چه
در سی‌دی و چه در گوشی همراه، اگر کسی
کتاب را مقابلش بگذارد و به آن نرم‌افزار
مراجعه بکند، هر دو را یکسان خواهد دید.
این چهار فازی بود که در سیستم سامان‌دهی
پیش‌بینی شده است.



بین تولید اطلاعات در
دارالحدیث و ارتقا یا به‌روز شدن
نرم‌افزار سامان‌دهی چقدر فاصله هست؟



بعد از این‌که سیستم سامان‌دهی در
دارالحدیث به بهره‌برداری رسید دو دیدگاه
کاملاً متقابل پیش روی ما بود: یکی اولویت
دادن به انبوهی از اطلاعات که قبلاً تولید
شده بود و یکی هم اطلاعاتی که الآن در حال
تولید است. طبیعتاً ما اطلاعاتی که قبلاً
تولید شده بود را در اولویت قرار دادیم و
در پروژه زمان‌بندی شده، ظرف یک سال و
نیم، تمام اطلاعات دارالحدیث را در این
سیستم مستقر کردیم. روندش هم به این صورت
بود که این اطلاعات که به صورت فایل‌های
متنی بود، علامت‌گذاری یا اصطلاحاً
فُرمت‌گذاری شد و با استفاده از بعضی
ابزارهایی که اطلاعات فرمت‌گذاری شده را
در بانک‌های ساماندهی مستقر کردیم که این
نرم‌افزارهای کمکی متن را تکه تکه می‌کند
و هر تكه را سر جای خودش قرار می‌دهد.
می‌توانم با خوش‌بختی خدمت شما عرض بکنم
که ما الآن به‌روز هستیم؛ یعنی ف. ما
اكنون روش‌هایی را پیش می‌گیریم که قبل از
این‌که کتاب برای چاپ ارسال بشود، کار
فرمت‌گذاری و علامت‌گذاری فایل را شروع
کنیم که همزمان با چاپ کتاب، خروجی سیستم
سامان‌دهی را هم داشته باشیم و همزمان با
کتابی که در بازار ارائه می‌شود در سایت
هم قابل دست‌رسی باشد و این فاصله را به
حداقل زمان ممکن برسانیم.



استفاده از
برنامه سامان‌دهی از طریق سایت هم
امکان‌پذیر است این آیا برای عموم كاربران
میسر است یا افراد با شرایط خاصی
می‌توانند از امکانات این نرم‌افزار
استفاده کنند؟


این نرم‌افزار در حقیقت
سفارش دارالحدیث بود و با مساعدت و
کمک‌هایی که خود مجموعه در تحلیل و طراحی
آن داشته برای استفاده داخلی خودش آن را
تولید کرده است. این سیستم قابل ارائه به
دیگران نیست؛ چون با ساختار دارالحدیث
طراحی شده، البته خروجی‌های مختلفی که این
سیستم به ما می‌دهد امکان دست‌رسی کاربران
دیگر را به اطلاعات داخلی مؤسسه برقرار
می‌کند.



با توجه به فرمایشات شما فکر می
کنم به راحتی بشود گفت که این نرم‌افزار
در حوزه حدیث‌پژوهی کاملاً بی‌سابقه است.


 زحمت‌های زیادی قبل از ما کشیده شده
است. ما در حقیقت از دست‌رنج پیش‌کسوت‌های
این کار بهره بردیم و اگر بتوانیم از
تجربه دیگران استفاده بهینه بکنیم باید
خیلی شکرگزار باشیم. این سیستم در چرخه
ارتقای نرم‌افزارهای علوم اسلامی یک پله‌
را برداشته است. اگر بگوییم بی‌سابقه است،
شاید جفا در حق کسانی باشد که واقعاً
قدم‌های مهم و اوّلیه را در این زمینه
برداشتند. این یک گام برای ارتقای تولید
نرم‌افزارها بود. البته این گام به کسان
دیگری که می‌خواهند نرم‌افزارهای دیگری
تولید بکنند كمك می‌كند تا از این تجربه
استفاده بکنند. خوش‌بختانه مطلع شدیم که
نرم‌افزارهای دیگری با تجربه ما درحال
شکل‌گیری است و این هم جای سپاس و شکر
دارد.

















  • نام منبع :
    مجله محدث شماره دوم
    تاريخ انتشار :
    مهر و آبان 1385
تعداد بازدید : 15645
صفحه از 10
پرینت  ارسال به