مدیریت اطلاعات با رویکرد فازی

چکیده

منطق فازی که در سال 1965 توسط دانشمند ایرانی، پروفسور لطفی­زاده به جهان عرضه شد، در تقابل با منطق دوارزشی ارسطویی، ابهام را به عنوان بخشی از سیستم پذیرفته و بر مفاهیم مبهم و نامعیّن دلالت می­کند. در شرایطی که ماشین قادر به درک مفاهیم کیفی ـ که به راحتی برای انسان قابل فهم است ـ نیست، منطق فازی شیوه تفکر انسان را به فناوری منتقل می­کند. از منطق فازی در بسیاری از شاخه­های علوم از جمله «مدیریت اطلاعات» استفاده می‌شود. در سال 1975، با انتشار مقاله­ای به زبان فرانسه در مورد جستجوی اطلاعات در شرایط فازی، این واژه به طور رسمی وارد ادبیات کتابداری و اطلاع­رسانی شد. طبق اطلاعات ثبت­شده در بانک اطلاعاتی LISA، بخش عمده­ای از آنچه تاکنون در خصوص منطق فازی و مدیریت اطلاعات منتشر شده، بر ذخیره و بازیابی اطلاعات تمرکز داشته است. پس از آن، بیشترین کاربرد این مقوله به ترتیب در سازماندهی و فراهم­آوری اطلاعات بوده است. اکنون برای تضمین امنیت شبکه­های اطلاعاتی، از منطق فازی بهره­برداری می­شود. در برخی زمینه­ها مانند مستند­سازی و مدیریت رکوردها نیز تاکنون پژوهشی با موضوع فازی به انجام نرسیده است. در سالهای اخیر، رویکرد عمده این بحث به سمت نظامهای خبره و هوش مصنوعی سوق یافته است. به نظر می‌رسد برای حل بسیاری از گره‌­های موجود در حوزه مدیریت اطلاعات، می­توان از منطق فازی کمک گرفت.

کلیدواژه­ها: منطق فازی، مدیریت اطلاعات، ذخیره و بازیابی، سازماندهی، فراهم‌آوری، امنیت ‌شبکه­ها، خدمات کاربران.

مقدمه

مفاهیم بسیاری پیرامون ما وجود دارد که آنها را در قالب عبارتهای مختلف در بیان مسائل روزانه خود به کار می‌بریم. وقتی می­گوییم «هوا خوب است»، در واقع هیچ کمیّتی برای خوب بودن هوا نداریم تا آن را اندازه بگیریم و این خوب بودن کاملاً یک مفهوم کیفی است. در واقع، مغز انسان با در نظر گرفتن عوامل گوناگون و بر پایة تفکر استنتاجی، جمله­هایی را تعریف و ارزش­گذاری می­کند که الگوبندی آنها به زبان و فرمولهای ریاضی اگر ناممکن نباشد، کاری بسیار پیچیده خواهد بود.

«منطق فازی»[3] بر آن است بر این مفاهیم غیردقیق و کیفی دلالت کند. منطق یا تئوری فازی «یک نوع منطق است که روش های نتیجه­گیری در مغز بشر را جایگزین    می­کند». (ویکی پدیا، 2006)

در جهان واقع نیز آدمی بسیاری از مفاهیم را به صورت فازی (به معنای غیردقیق و مبهم) درک می­کند و به­کار می­بندد. هرچند کلمات و مفاهیمی همچون «گرم، سرد، بلند، کوتاه، پیر، جوان» و نظایر آنها به عدد خاص و دقیقی اشاره ندارند، ذهن انسان با سرعت و انعطاف­پذیری شگفت­آوری همه را می­فهمد و در تصمیمها و نتیجه‌گیریهای خود، به شمار می­آورد. این در حالی است که ماشین فقط اعداد را می‌فهمد و ماهیتاً دقیق است.

منطق کلاسیک یا ارسطویی، تنها دو حالت برای موقعیتهای مختلف قایل است: سیاه و سفید؛ آری و نه؛ روشن و تاریک؛ صفر و یک؛ درست و غلط، حال آنکه قایلان به تفکر فازی معتقدند ابهام در ماهیت علم است؛ یعنی همان‌طور که این ابهامها در ذهن بشر وجود داشته و بشر با درک و توجه به آنها در ذهن خود پدیده­ها را تغییر و مدل­سازی   می­کند، منطق فازی نیز سعی دارد مدلهایی ارائه دهد که ابهام را به عنوان بخشی از سیستم ارائه کند. قوانین علمی گذشته، مثل ریاضیات، فیزیک، و مکانیک نیوتونی، همه بر اساس همین منطق دو ارزشی استوار شده­اند، اما بدیهی است که ذهن ما کارهایش را با منطق دیگری انجام می‌دهد و تصمیمهایش را می‌گیرد. با کمک منطق فازی می­توان شیوه تفکر انسان را به فناوری منتقل کرد (فرخیان، 2006).

منطق فازی در سال 1965 توسط دانشمند ایرانی به نام لطف‌علی­عسگرزاده که جامعه بین­الملل به نام پروفسور لطفی زاده از ایشان یاد می­کند، ارائه شد. وی پس از پایه­گذاری تئوری «مجموعه فازی»، در زمینه کاربردهای این تئوری در حافظه مصنوعی، زبان شناسی، منطق، نظریه تصمیمها، نظریه کنترل، سیستمهای خبره و شبکه‌های اعصاب، تحقیقات گسترده‌ای نمود. در حال حاضر، تحقیقات پروفسور لطفی زاده در زمینه منطق فازینرم رایانه‌ای، محاسبات رایانه‌ای بر مبنای کلمات، نظریه رایانه‌ای ادراک و زبان طبیعی است.

وی در یک مقالة علمی کلاسیک که در سال 1965 به چاپ رسید، مفهوم «مجموعه فازی»، را که اساس نظریه تجزیه و تحلیل سیستمهای پیچیده است، معرفی نمود که در آن «زبان طبیعی» به جای متغیرهای عددی برای تشریح رفتار و عملکرد سیستمها به کار می­رود. پس از معرفی مجموعه فازی، بیش از 15000 مقاله علمی توسط دانشمندان جهان درباره منطق فازی و کاربردهای گسترده آن در نشریه‌های علمی منتشر گردید و حدود 3000 درخواست ثبت اختراع در این زمینه در کشورهای مختلف جهان به عمل آمده است.

پس از آن لطفی زاده به پژوهشهای خود درزمینه مجموعه فازی ادامه داد تا آنکه در سال 1973، در یک مقاله کلاسیک دیگر با عنوان «شرحی بر دیدی نو در تجزیه و تحلیل سیستمهای پیچیده و فرایندهای تصمیم‌گیری» مفهوم استفاده از متغیرهای زبانی را در سیستمهای حافظه و کنترل مطرح کرد. اینمقاله اساس فناوری کنترل بر مبنای منطق فازی است که در آینده اثرهای عمیق در طراحی سیستمهای کنترل هوشیار خواهد داشت.گرچهمنطق فازی کاربردی بسیار وسیع‌تر از منطق متداول دارد، ولی پرفسور لطفی‌زاده معتقداست منطق فازی اکسیر و نوشدارو نیست. وی می­گوید: «کارهای زیادی هست که انسان می‌تواند به آسانی انجام دهد، در حالی که رایانه‌ها و سیستمهای منطقی قادر به انجامآنها نیستند. (پروفسور لطفی­زاده، 2006)

شکل زیر به خوبی می­تواند مفهوم فازی را نشان دهد:

 

در این شکل، سرد بودن، گرم بودن، و داغ بودن، توابعی برای مقایسه درجه حرارت هستند و هر نقطه­ای روی این خطوط می­تواند دارای یکی از سه ارزش بالا باشد. به عنوان مثال، برای یک درجه حرارت خاص که در شکل با یک خط نشان داده شده است، می­توان گفت «مقداری سرد است»، «اندکی گرم است»، یا «اصلاً داغ نیست». که هر سه این مفاهیم، نادقیق هستند.

از جمله مفاهیمی که از دل منطق یا تفکر فازی بیرون آمده، نظریه مجموعه­های فازی[4] است. با بسط این نظریه می توان توضیحات دقیق­تری در خصوص منطق فازی ارائه کرد. مجموعه­ای از اعداد را در نظر می­گیریم. مثلاً «مجموعه اعداد بزرگتر از 3 بر روی تاس». یعنی:

{6 ،5 ،4}A:

در این مجموعه عدد 4 هست، ولی عدد 3 نیست. حال «مجموعه اعداد بزرگ بر روی یک تاس» را در نظر می‌گیریم. عدد 4 در این مجموعه هست؟ در حقیقت، نمی­توان با قاطعیت وجود یا نبودِ وجود 4 را در این مجموعه پذیرفت. چنین مجموعه‌ای یک مجموعه فازی است.

چنانکه قبلاً گفته شد، در منطق کلاسیک یا دو ارزشی، اشیا در یک مجموعه دو حالت می پذیرند: تعلق و عدم تعلق، یا به زبان ریاضی صفر و یک. اما در منطق فازی، درجه عضویت هر شیء می­‌تواند عددی بین صفر و یک را بپذیرد. به عنوان مثال، اگر قد علی 185 سانتی­متر باشد و بخواهیم ببینیم علی بلند قد است یا نه، در منطق ارسطویی دو حالت داریم: یا علی «بلند است» یا «بلند نیست». اما در منطق فازی، قد علی ممکن است «تا حدودی بلند» باشد. در این منطق، به قد علی عددی بین صفر و یک نسبت می دهیم. مثلاً می‌گوییم او به اندازه 8/. متعلق به بلندقدهاست. اما اگر قد وی 200 سانتی­متر باشد، او را کاملاً بلند قد می­دانیم و می گوییم: او به اندازه 1 متعلق به بلند قدهاست.

بر همین اساس، یک انسان در نور کافی قادر به درک میلیونها رنگ است، ولی یک روبات چگونه می‌تواند این تعداد رنگ را تشخیص دهد؟ حال اگر بخواهیم روباتی طراحی کنیم که بتواند رنگها را تشخیص دهد، از منطق فازی کمک می­گیریم و با اختصاص اعدادی به هر رنگ، آن را برای روبات طراحی­شده، تعریف می­کنیم (هادی، 1384).

 

منطق فازی و مدیریت اطلاعات

چنانکه گفته شد، منطق فازی در زمینه­های متنوع و متفاوتی کاربرد دارد و تقریباً حدود 10 سال پس از ابداع آن به متون کتابداری راه یافت. به گواهی بانک چکیده­های مقاله‌های کتابداری و اطلاع­رسانی (LISA, 1969-2006) مفهوم فازی اولین بار با عبارت «تئوری مجموعه­های فازی» و در مقاله­ای تحت عنوان «جستجوی یک فایل در شرایط فازی» در دنیای کتابداری و اطلاع­رسانی مطرح شد. در این مقاله[5] که در سال 1975 و به زبان فرانسه منتشر شده بود، به کاربرد نظریه و مجموعه­های فازی در بازیابی اطلاعات پرداخته شده بود.

به جز مقاله­ای که در سال 1976 در خصوص کاربردهای عملی مجموعه­های فازی در حل مشکلات مربوط به سازماندهی اطلاعات با عنوان «مجموعه­های پراکنده در نظریه رده­بندی» به زبان روسی منتشر شد[6]، چند سالی تقریباً تمامی پژوهشها و مقاله­های انتشار یافته در خصوص منطق فازی در عرصه کتابداری و اطلاع­رسانی، بر مباحث مترتب بر بازیابی اطلاعات متمرکز بود، به نحوی که از مجموع 32 مقاله­ای که در فاصله سالهای 1975 تا 1990 با موضوع فازی منتشر شده، 25 مورد آن به نقش و کاربردهای منطق فازی در ذخیره و بازیابی اطلاعات و راهبردهای جستجو و... اختصاص داشته است.

مجموعاً 266 رکورد که واژه فازی جزء توصیفگرهای آنها بود و در مقاله‌های انتشار یافته در فاصله سالهای 1969 تا نیمه سال 2006 میلادی منتشر و در LISA فهرست شده­اند، بازیابی شد. این 266 مورد شامل تمامی جنبه­های کتابداری و اطلاع­رسانی می­شود که لزوماً در تعریف مدیریت اطلاعات لحاظ نشده­اند. مواردی مانند کتابسنجی، نظامهای هوشمند، هوش مصنوعی و...       

در پژوهش حاضر، کاربردهای منطق و نظریه‌های مجموعه­های فازی در مدیریت اطلاعات بررسی می‌شود، بنابراین ابتدا باید تعریفی از مدیریت اطلاعات ارائه گردد تا با در نظر گرفتن مؤلفه­های موجود در این تعریف، به شکل دقیق­تری کاربرد منطق فازی در این مقوله دنبال شود. در کتاب «فرهنگ توصیفی واژگان اطلاع­رسانی و علوم وابسته» «مدیریت اطلاعات» چنین تعریف شده است:

اعمال مهارتمندانه کنترل بر فراهم­آوری، سازماندهی، ذخیره، ایمنی، بازیابی و اشاعه منابع اطلاعاتی که برای انجام موفقیت­آمیز عملیات در یک پیشه، نهاد، سازمان، یا مؤسسه ضروری است و مستندسازی، مدیریت رکوردها و زیرساختار فنی را در بر می­گیرد (ریتز، 1383).

چنانکه از تعریف فوق مستفاد می­شود، «فراهم­آوری»، «سازماندهی»، «ذخیره و بازیابی»، «ایمنی»، «اشاعه منابع اطلاعاتی»، «مستندسازی»، «مدیریترکوردها» و «زیرساختار فنی» واژه‌هایی هستند که بر عملیات مدیریت اطلاعات دلالت دارند.

در مرحله بعد، هر یک از واژگان فوق به صورت جداگانه با واژه Fuzzy ترکیب شده و در فیلد کلیدواژه­ها LISA جستجو شد که حاصل این جستجوها در جدول 1 آمده است:

جدول1. توزیع فراوانی رکوردهای موجود در LISA با کلیدواژه فازی به تفکیک موضوع

واژه ترکیب شده با فازی

تعداد رکوردهای بازیابی شده

فراهم­آوری

6

سازماندهی

4

رده­بندی

11

فهرست­نویسی

0

ذخیره

37

بازیابی

62

ایمنی

2

اشاعه اطلاعات

0

مستندسازی

0

مدیریت رکوردها

0

زیرساختارفنی

0

جمع

112

 

در توضیح داده­های جدول 1، بهتر است به نکات زیر توجه شود: در بانک LISA همواره واژه ذخیره (storage) با واژه بازیابی (retrieval) قرین بوده در هیچ رکوردی این واژه به تنهایی مشاهده نشد. بنابراین، 62 مورد اعلام شده در خصوص بازیابی، 37 مورد ذخیره را نیز پوشش می­دهد.

واژه‌های «رده­بندی» و «فهرست­نویسی» با وجود آنکه عیناً در تعریف ODLIS نیامده بودند، اما از آنجا که از مفاهیم نهفته[7] در سازماندهی[8] بودند، به طور مستقل در LISA جستجو شدند. نتایج به دست آمده هیچ گونه همپوشانی با نتایج حاصل از جستجوی سازماندهی نداشت. در خصوص «فراهم­آوری»[9]، عبارت «مجموعه­گستری»[10] نیز که یکی از مفاهیم نهفته در فراهم‌­آوری بود، جداگانه جستجو شد که یک مورد از نتایج جستجوی آن در فهرست حاصل از جستجوی فراهم­آوری نیز مشاهده شده بود، بنابراین در جمع بندی رکوردها محاسبه نشد.

همان‌طور که از اطلاعات جدول می­توان برداشت کرد، در برخی موارد مثل «ایمنی» و «مدیریت رکوردها» موارد اندکی بازیابی شده و برای دیگر کلیدواژه­ها یعنی «اشاعه اطلاعات»، «مستندسازی»، و «زیرساختار فنی» نیز، رکوردی بازیابی نگردید.

البته، خارج از چارچوب تعریف ODLIS، امروزه نظریه مجموعه­های فازی بیشتر به سمت نظامهای هوشمند و هوش مصنوعی سوق یافته است، به نحوی که در فاصله سالهای 1991 تا 2006 ، 110 مقاله در خصوص این دو موضوع و منطق فازی، در بانک LISA چکیده و نمایه شده است. در این پژوهش، تعداد مقاله­های بازیابی شده در هریک از مباحث فوق، به نشانة میزان گسترش و اهمیت منطق فازی در بحث مذکور تلقی شده است، بنابراین از آنجا که بیشترین رکورد بازیابی شده در حوزه بازیابی اطلاعات بوده است، این بحث را با کاربرد مجموعه­های فازی در بازیابی اطلاعات آغاز می‌کنیم.

 

بازیابی اطلاعات

چنانکه رکوردهای به ثبت رسیده در LISA نیز نشان می­دهد، کاربرد عمده مجموعه­های فازی در کتابداری و اطلاع­رسانی، در حوزه بازیابی اطلاعات است. اساساً مفهوم ربط به دلیل نامشخص و نسبی بودنش، یک مفهوم فازی است                               (Hood & Wilson, 2002). در جریان جستجو و یافتن اطلاعات به رکوردهایی می‌رسیم که نمی­توان به طور قطع آنها را مرتبط یا کاملا بی­ربط با موضوع مورد جستجو تلقی کرد. بنابراین دو مفهوم ربط و فازی را می توان قرین و همزاد یکدیگر دانست.

عمده­ترین ابزار ریاضی در بازیابی اطلاعات به شکل سنتی، جبر بولی است. تقریباً هر کسی که با یکی از پایگاه­های اطلاعاتی، فهرستهای رایانه­ای، یا شبکه جهانی وب کار کرده باشد، از عملگرهای بولی بویژه برای انجام جستجوهای پیچیده استفاده کرده است. جبر بولی بر مبنای نظریه مجموعه­هاست. هر اصطلاحی که در مجموعه­ای از مدارک قابل بازیابی برای جستجو یا نمایه به کار می­رود، می­تواند با عملگرهای بولی (و، یا، نه) ترکیب شود. این اصطلاحات با یک سلسله مدارک موجود در نظام اطلاعاتی تطبیق داده می­شود.

مفهوم ربط به دلیل نامعیّن بودنش، می­تواند به راحتی به وسیله مدلهای مجموعة فازی مدل­سازی شود. بنابراین، نظامهای بازیابی فازی به این صورت عمل می­کنند: وقتی مدارک به سیستم اضافه می­شوند، یک سلسله اصطلاحات به مدرک اختصاص یافته و به هر اصطلاحی وزنی داده می­شود که درجه وابستگی آن اصطلاح به مدرک را نشان       می­دهد. نمایه‌ساز آزاد است تعیین کند یک اصطلاح فقط تا حدودی به یک مدرک مرتبط است بدون اینکه ناگزیر باشد در خصوص مرتبط بودن یا نبودن آن اصطلاح، تصمیم قطعی بگیرد. در یک نظام بازیابی اطلاعات فازی، بازیابی بیشتر بر مبنای منطق مجموعه­‌های فازی است تا مجموعه­های جبری بولی. در نظام فازی، همان عملگرهای بولی (و، یا، نه) مورد استفاده قرار می­گیرند، اما متکی بر «اجتماعِ» فازی، «اشتراکِ» فازی، و «به جز» فازی.

این رویکرد به بازیابی اطلاعات جنبه­های نظری بسیاری دارد، زیرا به عنوان مدلی که در فرایند انتخاب منابع مرتبط توسط کاربران به مراتب مفیدتر است، ظاهر می­شود. این مدل همچنین به نوعی جرح و تعدیل در نظام سنتی مکانیزمهای بازیابی بولی است، در حالی که قسمت عمده­ای از مکانیزمها و زیرساختهای موجود در بازیابی اطلاعات، همچنان مفید هستند. به علاوه، بازیابی اطلاعات فازی در تخصیص اصطلاحات نمایه با استفاده از اصطلاحات مرتبط به قدر اصطلاحات کاملاً مرتبط، انعطاف­پذیر است.

سیستمهای بازیابی اطلاعات فازی با وجود تمام محاسنی که دارند، چندان در مقیاس وسیع به کار گرفته نشده­اند. دلیل این امر نیز هزینه­های بالای نمایه کردن با روش فازی است. با وجود این، تحقیقات در نظام بازیابی فازی همچنان ادامه دارد و روز به روز نیز وسعت بیشتری می­یابد(Hood & Wilson, 2002) .

اکنون به به اختصار[11]، به ارائه توضیحاتی درخصوص چگونگی کاربرد منطق یا تئوری مجموعه­های فازی در بازیابی اطلاعات می­پردازیم:

چنانکه قبلاً گفته شد، به جای این فرض که یک عنصر عضوی از یک مجموعه است، از تابع عضویت برای شناسایی درجه عضویت عنصر در یک مجموعه استفاده می‌شود. مجموعه­های فازی برای بازیابی اطلاعات مفیدند، زیرا این مجموعه­ها می­توانند «موضوع» مدرک را توصیف کنند. به علاوه، از آنجا کهدر منطق فازی «زبان طبیعی» به جای متغیرهای عددی برای تشریح رفتار و عملکرد سیستم به کار می­رود، می­توان برای بازیابی اطلاعات در بانکهای اطلاعاتی، به نحو مؤثری از آن بهره جست.

مجموعه­ای از عناصر که در آن هر عنصری محدوده مدرک را توصیف کند، ذاتاً مجموعه­ای فازی است. مدرکی که درباره «کتابهای کودکان و نوجوانان» است، ممکن است راجع به «روانشناسی کودک و نوجوان» نیز گفتگو کند. از این رو، ممکن است موضوع این مدرک تا حدودی درباره «روانشناسی کودک و نوجوان» باشد. قرار دادن روان­شناسی کودک و نوجوان به عنوان عنصری از مجموعه، صحیح نیست، اما نادیده گرفتن آن نیز ما را از دقت لازم دور می­کند.

یک مجموعه فازی دارای عضویتی است که در آن قوّت عضویت هر عنصر به شکل ذاتی دقیق نیست. در مثال بالا مجموعه­ای از مفاهیم که مدرک را توصیف می­کند، به قرار زیر است:

C= {(children's books, 1.0),(children's psychology, 0.5)}

مجموعه C یک مجموعه فازی است، زیرا این مجموعه دارای درجات عضویت مربوط به هر عضو است. به طور قراردادی، یک مجموعه فازی که شامل مفاهیم موجود در  C={c1,c2,….cn}باشد، به صورت زیر نمایش داده می­شود:

در اینجا ،تابع عضویتی است که درجه عضویت عنصری را در مجموعه نشان می­دهد (گراسمن و فریدر، 1384، ص 112-113).

از نظریة مجموعه­های فازی به شکلهای گوناگون در بازیابی اطلاعات استفاده می‌شود. یکی از رایج­ترین این شکلها که در متون زیادی به آن پرداخت شده، بازیابی بولی مجموعه­های فازی است.

بسط مجموعه فازی به منظور بازیابی بولی، در اواخر دهه 70 میلادی انجام گرفت (گراسمن و فریدر، 1384، ص113). ضریب تشابه بولی می­تواند به وسیلة بررسی اصطلاحات موجود در مدرک به صورت فازی محاسبه گردد، زیرا عضویت اصطلاحات بر اساس تعداد رویداد آنها در مدرک صورت می­پذیرد.

برای مثال، مجموعهD را که شامل همه مدارک مجموعه است، در نظر بگیرید. مجموعه فازیDt میتواند به صورت مجموعه D که تمام مدارک دارای اصطلاح t را توصیف می کند، محاسبه شود. این مجموعه به صورت:

نمایش داده می شود. دراینجا d1 شامل عنصرt با قوّت 0.8 و d2 شامل عنصرt با قوّت 0.5 است.

همین­طور، مجموعه Ds به صورت مجموعه‌ای از تمام مدارک که شامل اصطلاح S است، تعریف می‌شود. این مجموعه می تواند به صورت:

تعریف شود.

عملیات اصلی اشتراک، اجتماع، و متمم که اساس منطق بولی را تشکیل می­دهد، در مجموعه­های فازی به این صورت بیان شده است: اشتراک از حداقل دو تابع عضویت و اجتماع از حداکثر دو تابع عضویت که برای یک عنصر تعریف شده است، استفاده می­کند. از تعاریف زیر برای به دست آوردن این مفاهیم استفاده می­شود:

 

 

محاسبه به محاسبه و محاسبه  به محاسبه  نیاز دارد. این محاسبات می تواند با استفاده از مقدار حداکثر برای اجتماع، و مقدار حداقل برای اشتراک انجام شود. از این رو داریم :

درخصوص این روش، نکته­ای که حتماً باید در نظر گرفته شود این است که این مدل، حاوی وزن اصطلاحات پرس و جو نیست (گراسمن ...، ص114).

روش دیگری که با استفاده از منطق فازی در بازیابی اطلاعات به کار گرفته       می­شود، روش استفاده از سلسله مراتب مفهومی و مجموعه­های فازی است. این روش که برای اولین بار در سال 1991 معرفی شد، از شبکه مفهومی برای نشان دادن مفاهیم موجود در مدارک و پرس و جوها و نشان دادن ارتباط این مفاهیم، استفاده می­کند (گراسمن ...، ص114). بعدها محققان ایرانی توانستند با بسط این روش، شیوه­ای مؤثر برای بازیابی اطلاعات در زبان فارسی ابداع کنند.به منظور برطرف کردن نقایص موجود در روشهای کلاسیک بازیابی و عملگرهای اولیه، یک درجه «کمیّت نمای فازی»[12] برای هر عبارت در یک پرس و جو محاسبه می­شود. مثال زیر این روش را روشن­تر می­کند. فرض کنید یک کاربر علاقه­مند است مدارکی به شرح زیر دریافت کند:

حداقل سه مورد از چهار اصطلاحی که در اختیار اوست، همراه با یک اصطلاح پنجم که حتماً باید در نتیجه جستجو باشد. چنین درخواستی بدین صورت نوشته می­شود:

At least 3 (t1, t2, t3, t4) and t5

برای محاسبه درخواست فوق، جدول زیر را ملاحظه کنید:

At least 3 of the α cut

The α cut set

The α value

0

Ø

0.3

0

{t4}

0.25

0

{t4, t3}

0.15

1×0.1=0.1

{t4, t3, t2}

/ 0 نظر / 80 بازدید