حجم گسترده اطلاعاتی كه در قالب كتاب، نشریه و مقالههای پژوهشی و فرهنگی در مؤسسه دارالحدیث تولید شده است، نیاز به استفاده از روشهای نوین دسترسی به اطلاعات را ایجاد كرده است. استفاده از نمایه و نیز بانک های اطلاعاتی از جمله این شیوه هاست. نمایهسازی (Indexing) یكی از این شیوههاست كه جستجوی اطلاعات مورد نظر به شیوه نوشتاری (چاپی) است. «نرمافزار ساماندهی اطلاعات» در همین راستا و با استفاده از فُرمت گذاری و تفکیک انواع متون و كاركرد بانكهای اطلاعاتی (Databases) در مؤسسه فراهم آمده است.
گفتگوی محدّث با حجة الاسلام و المسلمین احسان سرخهای مدیر امور رایانه و اینترنت دارالحدیث در این باره است كه از نظرتان میگذرد.
پیشینهای از پروژه ساماندهی اطلاعات بیان کنید. این که این ایده چگونه شکل گرفته است؟
این موضوع به سال 1380 بر میگردد که مؤسسه دارالحدیث اولین نرمافزار گستردهاش را تولید کرد. مجموعه دوازده جلدی موسوعة امام علی(ع) تقریباً سومین نرمافزاری بود که در دارالحدیث تولید شد. مشکلاتی که فرآیند پردازش و آمادهسازی اطلاعات در آن نرمافزار برای ما ایجاد کرد جرقهای بود که ما به سمت بازنگری اطلاعات تولید شده دارالحدیث پیش برویم. معمولاً مؤسّساتی که تولید اطلاعات دارند این اطلاعات را در قالب فایلهای متنی نگهداری میکنند و تبدیلش به یک نرمافزار، مراحلی را ایجاب میکند که هم هزینههای زمانی دارد و هم هزینههای نیروی انسانی و چه بسا بازنگری مجدد در اصل متن تولید شده هم لازم شود تا همسنخ با یک نرمافزار بشود و ارائه دیجیتالی آن امکانپذیر باشد. ما هم دچار این مشکل شدیم. فایلهایی که در فرآیند ارائه اطلاعات در دارالحدیث مورد استفاده قرار میگرفت فایلهای زرنگاری بودند كه ارائه آنها به صورت دیجیتالی تبدیل خاص خودش را داشت. در واقع میشود گفت که انباشت اطلاعات در سال 1385 شروع شده بود و ما خیلی زود به این نتیجه رسیدیم که درآینده خیلی نزدیک، حجم دادههای تولید شده در دارالحدیث در قالب کتاب و مجله و مقاله به حدی خواهد بود که دیگر هیچ کدام از اطلاعات تولید شده قبلی خودمان را نمیتوانیم پیدا کنیم. فکر تولید برنامهای که بتواند دو جهت کار برای ما انجام بدهد: یکی فرآیند تولید اطلاعات را برای ما پشتیبانی بکند یعنی مقاطع و مراحلی را که ما در تولید اطلاعات پیشروی خودمان داشتیم را برای ما امکانپذیر کند، و از جهت دوم بتواند اطلاعات تولید شده را ذخیرهسازی و برای استفاده مجدد سرویس دهی بکند ما را سوق داد به ساماندهی اطلاعات. این کار در قم سابقه نداشت یعنی ما تقریباً می توانیم بگوییم که در این مرحله تحلیل و طراحی، از تجربهای نمیتوانستیم استفاده کنیم.
اطلاعات موجود در این برنامه، به چه صورتهایی درج شده است؟
1 مجموعه اطلاعاتی که در اینجا تولید میشود با توجه به ساختاری که دارد در سه قالب کلی گنجانده میشود: یکی کتاب، دوم، مجله و سوم، مقاله. بعد به این نتیجه رسیدیم که محتوای اطلاعاتی که در اینجا تولید میشود یا آیات قرآن هست یا روایات یا عناوین سر فصلهای متنها و محتوا هست، یا فهرستی هست که در این محتوا چیده شده یا ارجاعاتی هست که در این کتابها مورد استفاده قرار میگیرد و یا رسانهها و تصاویر. انواع دیگری که در استانداردهای ما نمیگنجد به عنوان پاراگراف یا یک متن معمولی در سیستم گنجاندیم؛ پس در حقیقت از یک روند شاخهای استفاده کردیم: انواع ما در سه قسم میگنجند و داخل هر کدام از سه قسم، این انواع متن وجود دارد. اینها دادههای اصلی ما بودند بعضی از دادههای ما به عنوان دادههای وابسته به این عناوین کلی در نظر گرفته میشوند، مثل مصادر یا پاورقیها و شرح لغات و چیزهایی از این قبیل. به این ترتیب با طراحی یك بانک اطلاعاتی، جداولی را ایجاد کردیم که در این جداول انواع این متنها ذخیرهسازی میشود و مجموعه اینها در یک پازل، یک کتاب یا یک مجله یا یک مقاله را تولید میکند.
از امتیازات منحصر به فرد برنامه ساماندهی اطلاعات در دارالحدیث سخن بگویید.
1 طبیعتاً در این سیستم چون ما با آیات و روایات سر و کار داشتیم یکی از مقولههایی که در روند تولید مورد استفاده قرار میگرفت اعرابگذاری بود. روایاتی که از منابع مختلف جمعآوری میشد در مراحل نهایی، اعرابگذاری میشود. ما یک سیستم اعرابگذاری ماشینی را در این سیستم پیشبینی کردیم که خودش به صورت هوشمند متن وارد شده را می خواند و اعرابگذاری میکند و به کاربر ارائه میکند تا کاربر تصمیم بگیرد که اعرابهایی که سیستم به او معرفی کرده آیا صحت دارد یا نه و این سیستم خودش خودش را ارتقا میدهد؛ یعنی وقتی که شما اعرابگذاری را تصحیح و تأیید میکنید، به بانک قبلی اضافه میشود و در مراحل بعدی از همین چیزی که شما تأیید کردید استفاده خواهد شد. از جمله چیزهای دیگری که ما در این سیستم دیدیم و جزء چیزهای مهم هم هست بحث تشخیص لغات مشکل است. بانکی از لغات مشکل را در این سیستم آمادهسازی کردیم. همه لغاتی که اصطلاحاً به آنها می گوییم «غریب الحدیث» در این مجموعه گنجانده شده که هم ریشه کلمه را ذخیره میكند و هم مشتق و هم شاهد مثال را. با توجه به آن اطلاعاتی که از قبل در بانک غریب الحدیث وارد شده تشخیص میدهد آیا این جزو کلماتی هست که به شرح لغت احتیاج دارد یا نه؟ اگر احتیاج داشته باشد به کاربر پیشنهاد میکند مراجعه کند. حتی میگوید اینجا کلمه غریبی وجود دارد، این کلمه غریب ترجمهاش این میشود، آیا میخواهید به پاورقی این مجموعه اضافه و از آن استفاده کنید یا نه؟ نکته سوم هم که واقعاً حائز اهمیت است و یکی از دغدغههای مهم حدیث پژوهان به حساب میآید مشابهیابی یا تکراریابی است. استفاده مجدد از اطلاعاتی که قبلاً فرآیند تولید را گذراندند مقولهای است كه برای تقلیل حجم هزینهها توجه به آن لازم است؛ مثلاً فرض بفرمایید متنی که قبلاً اینجا تولید شده، بر روی آن اعرابگذاری انجام شده، غریب الحدیثش درآمده و ویراستاری و ترجمه شده حالا در این سیستم موجود هست. اگر این سیستم بتواند به کاربر بگوید حدیثی که شما قبلاً در سیستم وارد کردید ، فرآیند تولید را طی کرده طبیعتاً دیگر به این کارهای مجدد نیازی نیست. ما با استفاده از پیشرفتهترین الگوریتمهایی که وجود دارد، سیستم مشابهیابی را در این برنامه گذاشتیم. در حقیقت آن روندی را که دوستان ما الآن به صورت دستی برای پیدا کردن منابع و مآخذ یک حدیث استفاده میکنند، ما به صورت ماشینی درآوردیم و سیستم مشابهیابی در مجموعه ساماندهی هم اكنون فعال است.
گویا این طرح در چند فاز پیش بینی شده است.
بلی، این طرح در چهار فاز پیشبینی شده که عملیاتی بشود؛ فاز اوّل، پیاده سازی و نصب بانکهای اطلاعاتی آن بود، به علاوه یکی از خروجیها که همان خروجی فایل آن است. فاز اوّل در سال 83 ـ 1382 نهایی شد. فاز دوم، خروجی سیدی (CD) بود یعنی بتوانیم از اطلاعاتی که در این سیستم مستقر کردیم بتوانیم در کوتاهترین مدت ممکن خروجی نرمافزاری داشته باشیم که این نرمافزار قابل تکثیر و ارائه به دیگران باشد و دیگر نیازی نباشد كه برای هر منبع جدید و یا مجموعهای از منابع سفارش سیدی بدهیم و خوشبختانه نگارش دوم موسوعة الامام علی بن ابیطالب (ع) را که مجموعه كتابهای عربی با ترجمه در24 جلد و متن کتاب منتخب میزان الحکمة بود را با همین سیستم ارائه کردیم و الآن هم نرمافزار حج و عمره در کتاب و سنت در دستور کار است که آخرین مراحل را طی میکنیم. آنچه در دستور کار داریم این است كه مثلاً مجموعه نشریات یا مجموعه دانشنامههای مختلف مثل دانشنامه عقاید اسلامی، دانشنامه احادیث پزشکی و ... در غالب سیدی ارائه بشود. فاز سوم این پروژه، انتقال این اطلاعات به سایت پویا (Dynamic) بود. سایت دارالحدیث به نام hadith.net مدتها بود که در اینترنت فعال بود و صفحاتی که در این سایت طراحی شده بود به صورت سایت ایستا (Static) بود كه با فرمتهای HTML طراحی و آماده سازی میشد. ما طراحی سایت را کلاً به صورت بانکهای اطلاعاتی دگرگون كردیم و از حالت ایستا به صورت پویا درآوردیم؛ یعنی از Static به Dynamic تبدیل شد. بسیاری از این کارها به صورت ماشینی انجام میشود. از جمله کارهایی که اکنون در این فرآیند انجام میشود انتقال اطلاعات موجود در سیستم ساماندهی به سایت است. اطلاعاتی که قبلاً آنالیز و در سیستم ساماندهی ذخیره شده با همان خصوصیات به سایت منتقل میشود و در اینترنت هم قابل دسترسی است. من سایتی را به این ویژگی سراغ ندارم که با استفاده از فُرمتهای مختلف، امکان دسترسی به متن را به کاربرش بدهد. فاز چهارم ما که جزء چیزهای نو و بدیع هم به حساب میآید، خروجی نرمافزاری از سیستم ساماندهی است که این نرمافزار روی گوشیهای موبایل قابل استفاده است. از جمله چیزهایی که جزء مظلومیتهای متون اسلامی، بویژه حدیث است این است که هنوز در گوشیهای موبایل قابل استفاده نیست. به همین خاطر مترصد شدیم که نرمافزاری تولید کنیم که این نرم افزار، امکان دسترسی کاربران گوشی موبایل را به متن بدهد. ما روی متن کتاب منتخب میزان الحکمة این کار را انجام دادیم. کاربر می تواند این برنامه را نصب و از طریق فهرست و جستجو از آن استفاده كند. ماهیت کتاب را در همه خروجیهایمان حفظ کردیم؛ چه در سایت، چه در سیدی و چه در گوشی همراه، اگر کسی کتاب را مقابلش بگذارد و به آن نرمافزار مراجعه بکند، هر دو را یکسان خواهد دید. این چهار فازی بود که در سیستم ساماندهی پیشبینی شده است.
بین تولید اطلاعات در دارالحدیث و ارتقا یا بهروز شدن نرمافزار ساماندهی چقدر فاصله هست؟
بعد از اینکه سیستم ساماندهی در دارالحدیث به بهرهبرداری رسید دو دیدگاه کاملاً متقابل پیش روی ما بود: یکی اولویت دادن به انبوهی از اطلاعات که قبلاً تولید شده بود و یکی هم اطلاعاتی که الآن در حال تولید است. طبیعتاً ما اطلاعاتی که قبلاً تولید شده بود را در اولویت قرار دادیم و در پروژه زمانبندی شده، ظرف یک سال و نیم، تمام اطلاعات دارالحدیث را در این سیستم مستقر کردیم. روندش هم به این صورت بود که این اطلاعات که به صورت فایلهای متنی بود، علامتگذاری یا اصطلاحاً فُرمتگذاری شد و با استفاده از بعضی ابزارهایی که اطلاعات فرمتگذاری شده را در بانکهای ساماندهی مستقر کردیم که این نرمافزارهای کمکی متن را تکه تکه میکند و هر تكه را سر جای خودش قرار میدهد. میتوانم با خوشبختی خدمت شما عرض بکنم که ما الآن بهروز هستیم؛ یعنی ف. ما اكنون روشهایی را پیش میگیریم که قبل از اینکه کتاب برای چاپ ارسال بشود، کار فرمتگذاری و علامتگذاری فایل را شروع کنیم که همزمان با چاپ کتاب، خروجی سیستم ساماندهی را هم داشته باشیم و همزمان با کتابی که در بازار ارائه میشود در سایت هم قابل دسترسی باشد و این فاصله را به حداقل زمان ممکن برسانیم.
استفاده از برنامه ساماندهی از طریق سایت هم امکانپذیر است این آیا برای عموم كاربران میسر است یا افراد با شرایط خاصی میتوانند از امکانات این نرمافزار استفاده کنند؟
این نرمافزار در حقیقت سفارش دارالحدیث بود و با مساعدت و کمکهایی که خود مجموعه در تحلیل و طراحی آن داشته برای استفاده داخلی خودش آن را تولید کرده است. این سیستم قابل ارائه به دیگران نیست؛ چون با ساختار دارالحدیث طراحی شده، البته خروجیهای مختلفی که این سیستم به ما میدهد امکان دسترسی کاربران دیگر را به اطلاعات داخلی مؤسسه برقرار میکند.
با توجه به فرمایشات شما فکر می کنم به راحتی بشود گفت که این نرمافزار در حوزه حدیثپژوهی کاملاً بیسابقه است.
زحمتهای زیادی قبل از ما کشیده شده است. ما در حقیقت از دسترنج پیشکسوتهای این کار بهره بردیم و اگر بتوانیم از تجربه دیگران استفاده بهینه بکنیم باید خیلی شکرگزار باشیم. این سیستم در چرخه ارتقای نرمافزارهای علوم اسلامی یک پله را برداشته است. اگر بگوییم بیسابقه است، شاید جفا در حق کسانی باشد که واقعاً قدمهای مهم و اوّلیه را در این زمینه برداشتند. این یک گام برای ارتقای تولید نرمافزارها بود. البته این گام به کسان دیگری که میخواهند نرمافزارهای دیگری تولید بکنند كمك میكند تا از این تجربه استفاده بکنند. خوشبختانه مطلع شدیم که نرمافزارهای دیگری با تجربه ما درحال شکلگیری است و این هم جای سپاس و شکر دارد.
|