موتور جستجوگر

23
!"# $% "& ’(

Upload: morteza-rikhtegarzadeh

Post on 16-Mar-2016

217 views

Category:

Documents


1 download

DESCRIPTION

!"# $% "& '( ) ''&++$ 7 11++11 : 11$""#3 !ABC29"1"1& : 1"12($%&''@++1"" '#""/!K ;9 ++"&$% !"# ,'& ,,'&

TRANSCRIPT

1WwW.NiaziSoft.blogfa.CoM

به نام خدا

سهراب نيازي: سازنده

WwW.NiaziSoft.blogfa.CoM:وب سايت

[email protected]: ايميل

كنديكارمچگونهموتورجستجوگر:موضوع

2WwW.NiaziSoft.blogfa.CoM

3WwW.NiaziSoft.blogfa.CoM

كند؟موتور جستجوگر چگونه كار مي

وقتي جستجويي در يك موتور جستجوگر انجام و نتايج جستجو ارايه مي شود، كاربران در واقع نتيجه كار بخش

پايگاه داده اش را آماده كرده است و اين گونه "موتور جستجوگر قبال. هاي متفاوت موتور جستجوگر را مي بينند

سياري از خود مي پرسند كه چگونه امكان دارد ب. نيست كه درست در همان لحظه جستجو، تمام وب را بگردد

گوگل در كمتر از يك ثانيه تمام سايت هاي وب را بگردد و ميليون ها صفحه را در نتايج جستجوي خود ارايه

كند؟

همه آنها در زمان پاسخ گويي به . نه گوگل و نه هيچ موتور جستجوگر ديگري توانايي انجام اين كار را ندارند

! ها در پايگاه داده اي كه در اختيار دارند به جستجو مي پردازند و نه در وبكاربران، تن

موتور جستجوگر به كمك بخش هاي متفاوت خود، اطالعات مورد نياز را قبالً جمع آوري، تجزيه و تحليل مي كند

.داده مي گرددو آنرا در پايگاه داده اش ذخيره مي نمايد و به هنگام جستجوي كاربر تنها در همين پايگاه

:بخش هاي مجزاي يك موتور جستجوگر عبارتند از

•Spiderيا عنكبوت

•Crawlerيا خزنده

•Indexerيا بايگاني كننده

•Databaseيا پايگاه داده

•Rankerيا سيستم رتبه بندي

4WwW.NiaziSoft.blogfa.CoM

-Spider)عنكبوت(

، نرم افزاري است كه كار جمع آوري اطالعات مورد نياز يك موتور جستجوگر را بر )Robot(اسپايدر يا روبوت

اسپايدر به صفحات مختلف سر مي زند، محتواي آنها را مي خواند، اطالعات مورد نياز را جمع آوري . عهده دارد

. مي كند و آنرا در اختيار ساير بخش هاي موتور جستجوگر قرار مي دهد

همانطور كه كاربران، صفحات مختلف را بازديد مي كنند، . بسيار شبيه كار كاربران وب استكار يك اسپايدر،

صفحات را مي بيند اما HTMLاسپايدر هم درست اين كار را انجام مي دهد با اين تفاوت كه اسپايدر كدهاي

.كاربران نتيجه حاصل از كنار هم قرار گرفتن اين كدها را

Index.htmlمي بينند) 1(ه كاربران آنرا به صورت شكل صفحه اي است ك:

اما يك اسپايدر آنرا چگونه مي بيند؟

صفحات HTMLبراي اين كه شما هم بتوانيد دنياي وب را از ديدگاه يك اسپايدر ببينيد، كافي است كه كدهاي

دنبال ) 2(براي اين كار در مرورگر مورد استفاده خود، مسير نشان داده شده در شكل . را مشاهده كنيد

)View Menu---<Souce.(كنيد

:به شما نشان داده مي شود) 3(با انجام اين كار فايل متني شكل

5WwW.NiaziSoft.blogfa.CoM

آيا اين دنياي متني براي شما جذاب است؟

شما اگر اجازه دسترسي به . اسپايدر، به هنگام مشاهده صفحات، از خود بر روي سرورها رد پا برجاي مي گذارد

صورت گرفته از يك سايت و اتفاقات انجام شده در آنرا داشته باشيد، مي توانيد مشخص آمار ديد و بازديدهاي

.كنيد كه اسپايدر كدام يك از موتورهاي جستجوگر صفحات سايت را مورد بازديد قرار داده اند

.انجام مي شود تحليل آمار همين ديد و بازديدها مي باشدSEMيكي از فعاليتهاي اصلي كه در

اسپايدرها كاربردهاي ديگري نيز دارند، به عنوان مثال عده اي از آنها به سايت هاي مختلف مراجعه مي كنند و

.مي گردند) Email(فقط به بررسي فعال بودن لينك هاي آنها مي پردازند و يا به دنبال آدرس پست الكترونيكي

-Crawler)خزنده(

آن مشخص مي كند كه اسپايدر . ك فرمانده براي اسپايدر عمل مي كندكراولر، نرم افزاري است كه به عنوان ي

در واقع كراولر تصميم مي گيرد كه كدام يك از لينك هاي صفحه اي كه . كدام صفحات را مورد بازديد قرار دهد

كند و يا ممكن است همه آنها را دنبال كند، بعضي ها را دنبال. اسپايدر در حال حاضر در آن قرار دارد، دنبال شود

.هيچ كدام را دنبال نكند

برنامه ريزي شده باشد كه آدرس هاي خاصي را طبق برنامه، در اختيار اسپايدر قرار دهد "كراولر، ممكن است قبال

دنبال كردن لينك هاي يك صفحه به اين بستگي دارد كه موتور جستجوگر چه حجمي از . تا از آنها ديدن كند

6WwW.NiaziSoft.blogfa.CoM

اند در پايگاه داده اش ذخيره كند و همچنين ممكن است اجازه دسترسي به بعضي از اطالعات يك سايت را مي تو

.صفحات به موتورهاي جستجوگر داده نشده باشد

شما به عنوان دارنده سايت، همان طور كه دوست داريد موتورهاي جستجوگر اطالعات سايت شما را با خود ببرند،

تان دور كنيد و اجازه دسترسي به محتواي آن صفحات را به آنها مي توانيد آنها را از بعضي از صفحات سايت

انجام مي Robotsتنظيم ميزان دسترسي موتورهاي جستجوگر به محتواي يك سايت توسط پروتكل . ندهيد

.مي گويند) Crawling(به عمل كراولر ، خزش . شود كه در مقاالت ديگر سايت به آن پرداخته شده است

-Indexer)ني كنندهبايگا(

در اين بخش اطالعات ارسالي . تمام اطالعات جمع آورش شده توسط اسپايدر در اختيار ايندكسر قرار مي گيرد

تجزيه و تحليل بدين معني است . مورد تجزيه و تحليل قرار مي گيرند و به بخش هاي متفاوتي تقسيم مي شوند

ه حجمي دارد، كلمات موجود در آن كدام است، كه مشخص مي شود اطالعات از كدام صفحه ارسال شده است، چ

... . كلمات چندبار تكرار شده است، كلمات در كجاي صفحه قرار دارند و

در حقيقت ايندكسر، صفحه را به پارامترهاي آن خرد مي كند و تمام اين پارامترها را به يك مقياس عددي تبديل

.ات مختلف را با هم مقايسه كندمي كند تا سيستم رتبه بندي بتواند پارامترهاي صفح

7WwW.NiaziSoft.blogfa.CoM

در زمان تجزيه و تحليل اطالعات، ايندكسر براي كاهش حجم داده ها از بعضي كلمات كه بسيار رايج هستند

.از اين گونه كلمات هستند... . و a ،an ،the ،www ،isكلماتي نظير . صرفنظر مي كند

-Database)پايگاه داده(

در اين بخش داده ها گروه بندي، . تمام داده هاي تجزيه و تحليل شده در ايندكسر، به پايگاه داده ارسال مي گردد

همچنين داده ها قبل از آنكه ذخيره شوند، طبق تكنيكهاي خاصي فشرده مي شوند . كدگذاري و ذخيره مي شود

. تا حجم كمي ُُاز پايگاه داده را اشغال كنند

وگر بايد پايگاده داده عظيمي داشته باشد و به طور مداوم حجم محتواي آنرا گسترش دهد و يك موتور جستج

بزرگي و به روز بودن پايگاه داده يك موتور جستجوگر براي آن . البته اطالعات قديمي را هم به روز رساني نمايد

اه داده آنها و همچنين روش يكي از تفاوتهاي اصلي موتورهاي جستجوگر در حجم پايگ. امتياز محسوب مي گردد

.ذخيره سازي داده ها در پايگاه داده است

.حجم پايگاه داده چند موتور جستجوگر با هم مقايسه شده است) 4(در شكل

2001مقايسه حجم پايگاه داده چند موتور جستجوگر در دسامبر -4شكل

GG= Google, AV= Altavista, Fast =AllTheWeb

INK= Inktomi, NL= NorthernLight

8WwW.NiaziSoft.blogfa.CoM

-Ranker)سيستم رتبه بندي(

كاربران چند . بعد از آنكه تمام مراحل قبل انجام شد، موتور جستجوگر آماده پاسخ گويي به سواالت كاربران است

منتظر پــاسخ مي Enterآن وارد مي كنند و سپس با فشردن ) Search Box(كلمه را در جعبه جستجوي

. مانند

ه درخواست كاربر، ابتدا تمام صفحات موجود در پايگاه داده كه به موضوع جستجو شده، مرتبط براي پاسخگويي ب

پس از آن سيستم رتبه بندي وارد عمل شده، آنها را از بيشترين ارتباط تا كمترين . هستند، مشخص مي شوند

.ارتباط مرتب مي كند و به عنوان نتايج جستجو به كاربر نمايش مي دهد

ور جستجوگر بهترين و كامل ترين پايگاه داده را داشته باشد اما نتواند پاسخ هاي مرتبطي را ارايه حتي اگر موت

در حقيقت سيستم رتبه بندي قلب تپنده يك موتور جستجوگر . كند، يك موتور جستجوگر ضعيف خواهد بود

.است و تفاوت اصلي موتورهاي جستجوگر در اين بخش قرار دارد

اي پاسخ گويي به سواالت كاربران، پارامترهاي بسياري را در نظر مي گيرد تا بتواند بهترين سيستم رتبه بندي بر

ياد مي ) الگوريتم( Algoبه طور خالصه از آن به SEMحرفه اي هاي دنياي . پاسخ ها را در اختيار آنها قرار دارد

. كنند

ا اعمال آنها بر پارامترهاي صفحات موجود در الگوريتم، مجموعه اي از دستورالعمل ها است كه موتور جستجوگر ب

در حال حاضر . پايگاه داده اش، تصميم مي گيرد كه صفحات مرتبط را چگونه در نتايج جستجو مرتب كند

.قدرتمندترين سيستم رتبه بندي را گوگل در اختيار دارد

9WwW.NiaziSoft.blogfa.CoM

ه، موتور جستجوگر را شامل سه بخش �ُمي توان با ادغام كردن اسپايدر با كراولر و همچنين ايندكسر با پايگاه داد

:زير دانست كه اين گونه تقسيم بندي هم درست مي باشد

كراولر•

بايگاني•

سيستم رتبه بندي•

به ميان مي آيد، مقصود اين ) شدن(براي سهولت در بيان مطالب بعدي هر گاه صحبت از بايگاني كردن -تذكر

.داده موتور جستجوگر وارد مي شوداست كه صفحه تجزيه و تحليل شده و به پايگاه

براي آنكه تصور درستي از نحوه كار يك موتور جستجوگر داشته باشيد داستان نامتعارف زير را با هم بررسي مي

.كنيم

:او تصميم به شكار مي گيرد. داستان ما يك شكارچي دارد

: كار كراولر-

) شمالي ترين شهر خراسان بزرگ(او قصد دارد براي شكار به منطقه حفاظت شده ابيورد، واقع در شهرستان درگز

. برود

10WwW.NiaziSoft.blogfa.CoM

:Robotsپروتكل -

:ابتدا تمام محدوديت هاي موجود براي شكار در اين منطقه را بررسي مي كند

آيا در اين منطقه مي توان به شكار پرداخت؟•

ي توان شكار كرد؟كدام حيوانات را م•

حداكثر تعداد شكار چه ميزاني است؟ •

... . و •

. را از شكارباني منطقه دريافت مي كند) نوعي آهو(فرض مي كنيم او مجوز شكار يك اوريال

كار اسپايدر-

.او اوريالي رعنا را شكار مي كند و سپس آنرا با خود به منزل مي برد

كار ايندكسر-

آنرا بسته بندي مي كند و بخش هاي زايد ... كرده، گوشت، استخوان، دل و قلوه، كله پاچه و شكار را تكه تكه

. شكار را دور مي ريزد

11WwW.NiaziSoft.blogfa.CoM

كار پايگاه داده-

. بسته هاي حاصل را درون فريزر قرار داده، ذخيره مي كند

كار سيستم رتبه بندي-

ممكن است عده اي كله . براي آنها غذا طبخ مي كندمهمانان سراغ او مي آيند و همسر او بسته به ذائقه مهمانان

. پخت غذا طبق سليقه مهمانان كار سختي است. دوست داشته باشند... پاچه، عده اي آبگوشت، عده اي جگر و

!بامزه ترين آبگوشت را مي خواهند"ممكن است همه آنها آبگوشت بخواهند اما آنها مسلما

:نكته ها

شكار كبك يا اوريال و يا هر دو به آن منطقه برود همانطور كه موتور جستجوگر مي شكارچي مي توانست براي•

.درخواست كند...) عكس، فايل متني، فايل اجرايي و (تواند از سرور سايت شما انواع فايل

اگر شكارچي بهترين شكار را با. غذاي خوشمزه را مي توانيد با نتايج جستجوي دقيق و مرتبط مقايسه كنيد•

.خود به منزل ببرد اما غذايي خوشمزه و مطابق سليقه مهمانان طبخ نگردد، تمام زحمات هدر رفته است

به عنوان آخرين نكته اين مقاله ياد آوري مي كنم كه به شكار اوريالي رعنا آن هم در منطقه حفاظت شده •

!).بدون اسلحه(يدن فرماييد اما توصيه مي شود كه حتما از طبيعت بكر آن د. ابيورد، اصال فكر نكنيد

12WwW.NiaziSoft.blogfa.CoM

جستجو گر داخلي سايت

وسعتي كه در صورتيكه پورتال و يا وب سايت شما داراي آنچنان

نياز به نصب و راه اندازي موتور جستچو در كارگزار اختصاصي، وجود

.شما مي توانيد مشترك خدمات جستجوي سفارشي ما شويدندارد،

. توان پردازشي و ذخيره سازي باال نصب و راه اندازي شده استرايانه هاي قدرتمند باموتور جستجوگر رادكام در

همه اين كارها براي آن انجام شده است تا . پر سرعت به شبكه جهاني وب متصل هستنداين رايانه ها با خطوط

.گرددسالجستجوي واژگان مورد نظر شما انجام و به شما ار)كمتر از يك ثانيه(كمترين زمان در

طراحي شده است و در PHP,CSharp,Visual Basic, JSPبا زبانهاي (API)رابط هاي برنامه نويسي

سايت و يا پورتال خود، رابط شما متناسب با زبان برنامه نويسي مورد استفاده در وب. اختيارتان قرار خواهد گرفت

برنامه نويسي طوري پياده شده اند كه به راحتي با برنامه اين رابط هاي. نصب مي كنيدمناسب را انتخاب و آن را

كاربران وب سايت شما هيچگاه متوجه نخواهند شد كه عمليات جستجو از خارج از .هاي شما يكپارچه شوند

جستجو از چرا كه هنگامي كه كاربر جستجويي را آغاز مي كند، عبارت مورد. سايت انجام مي شودمحدوده وب

جستجو در شبكه رادكام ارسال مي امه نويسي جاسازي شده در برنامه هاي وب سايت، به كارگزارطريق رابط برن

را در براي رابط برنامه نويسي در وب سايت شما ارسال مي اين كارگزار عبارت را جستجو كرده و نتيجه آن. گردد

سب با وب سايت ، در اختيار شما براي تغيير و تحول و عرضه با شكل و قالب متناكند سپس اين رابط نتيجه را

وب سايت رادكامنمونه بارز اين خدمت را در. همه اين كارها در كمتر از يك ثانيه انجام مي گردد. دهدقرار مي

13WwW.NiaziSoft.blogfa.CoM

www.radcom.irدر اين وب سايت رابط برنامه نويسي با زبان. مي توانيد مشاهده كنيدCSharpو

.قرار گرفته استمورد استفادهdot Netدرمحيط

Alltheweb: 2002درسال . يك موتورجستجوي خيلي بزرگ كه اعتبار و عموميت زيادي دارد

در يك بررسي صورت گرفته . بشمار مي رفت Googleاهراً يكي از مهمترين رقباي

انجام شده است ، 2002در چهارمين سه ماه سال ، كه Pandecta magazineتوسط

همچنين در , دومين و بزگترين پايگاه داده را دارد allthewebتخمين زده شده است كه

اما در تست . در رتبه سوم است wisenutتست ارتباط نيز خوب كار ميكند و بعد ازگوگل و

.ال شكست ميخوردسرعت معمو

Altavista: موتورجستجوي پيشگامي است كه توسطoverture خريداري 2003درفوريه

.شده است

Ask jeeves: ادعايش براي شهرت اين است كه به . يك موتورجستجوي نسبتاً عمومي است

كليدي بتوانيد درخواست خود را بصورت يك شما اجازه ميدهد تا بجاي استفاده تنها از كلمات

نتايج ODPو teoma ،overtureاز Ask jeeves .سئواالت متني توضيحي واردكنيد

.جستجو را دريافت ميكند

14WwW.NiaziSoft.blogfa.CoM

Excite: يكي از موتورهاي اصلي جستجو است.

Google:گوگل با سيستم. جستجو است بزرگترين ، سريعترين و دقيقترين موتورpagerank

.خودش مشهور است

Hotbot: يك موتورجستجوي نسبتاً عمومي است ، اگرچه محبوبيت آن شديدا با تسلط پيدا

يكبار گزارش شده است كه بزرگترين پايگاه داده را Hotbot .كردن گوگل كاهش يافته است

تخمين زده شده pandecta magazineدريك بررسي صورت گرفته توسط. ار دارددر اختي

.دارد wisenutو allthewebاست كه چهارمين پايگاه داده بزرگ را بعد ازگوگل ،

hotbot شبكه ( به منظور رسيدن به سرعت از فن آوري محاسبه موازي بهره برداري ميكند

ايستگاه هاي كاري زماني كه شما قدرت محاسبه تركيبي اين مولفه هاي كوچكتر را اضافه

.ميكنيد، شما كارايي طبقاني ابركامپيوتر را به دست مي آوريد

Lycos: داراي رتبه 90خود را به عنوان يك موتورجستجو مطرح كرده است و در اواخر دهه

.بااليي از لحاظ محبوبيت بين كاربران اينترنتي بوده است

Overture: بزرگترين و عمومي ترين موتورجستجويPPC كه قبالً به عنوان, استGoTo

.شناخته شده است

Teoma : درمقايسه با. يك موتورجستجوي نسبتاً جديد استoldiesمانندaltavista

15WwW.NiaziSoft.blogfa.CoM

Yahoo: يكي ازاولين و دوست داشتني ترين دايركتوريهاي وب است. Yahoo درحال حاضر )

.سايتي است كه بيشترين بازديد كننده را در اينترنت دارد) 2009

ريسمون نخستين موتور جستجوگر

.شبكه جهاني وب استدرريسمون نخستين موتور جستجوگر مستقل منابع فارسي

مي پيمايد و محتويات و را در دوره هاي زماني يك ماههLink.irاين جستجوگر همه وب سايتهاي فهرست

ارائه خدمات جستجو به مراجعه كنندگان مطالب آنها را نمايه سازي مي كند و در بانك اطالعاتي خود جهت

.نگهداري مي نمايد

گرديد و هم اكنون پس از بيش از يك سال آغازشركت رادكامدر1383پروژه جستجوگر ريسمون از مهرماه

.آزمايشي قرار گرفته استتالش و پيگيري مستمر در مرحله راه اندازي

است و ممكن است در ارائه خدمات خود دچار راه اندازي شدهدر حال حاضر ريسمون به صورت آزمايشي

رفع مشكالت آن و ارائه بهتر خدمات به كار خواهيم بست و در ما همه كوشش خود را در جهت. مشكالتي باشد

.اشدشما ياريگر ما بپيشنهادات و نظراتاين راه اميدواريم تا

به اجرا درآمده است و اين شركت در شركت رادكامبوسيلهدر اينجا الزم به ذكر است كه پروژه ريسمون منحصرا

هيچ گونه پشتيباني مادي و معنوي ديگران عمل نموده است طراحي، اجرا و راه اندازي آن به طور مستقل و بدون

.دولتي و خصوصي و يا شخصي بدهكار نيستمورد ريسمون به هيچ نهادو در

16WwW.NiaziSoft.blogfa.CoM

معماري ريسمون

مؤلفه هاي يك موتور جستجوي مستقل نوعي، 1شكل .ريسمون داراي مؤلفه هاي اصلي يك موتور جستجو است

.در بستر وب را نشان مي دهد

:مؤ پيمايش و نمايه سازي

ها، محتويات آنها را براي فرايند نمايه سازي و قراردادن در خزيدن در وب سايتاين مؤلفه سامانه اي است كه با

اين سامانه معموال براي يافتن وب سايت ها، از فهرست مرجع خود استفاده مي. مي كندبانك اطالعاتي، پااليش

البته در (تندنيس،ديگر تنها به فهرست مرجع خود متكيGoogleموتورهاي جستجوگر غول پيكري مانند. كند

اما در مورد . صورت زنجيره اي دنبال مي كنندبلكه همه پيوندهاي موجود در هر وب سايتي را به) ابتدا متكي بود

17WwW.NiaziSoft.blogfa.CoM

با توجه به محدود بودن دامنه وب سايتها، فهرست مرجعي وجود موتور هاي جستجوگر كوچك و يا منطقه اي

در مورد ريسمون اين. ه سازي وب سايتهاي آن اقدام مي نمايدنمايه سازي تنها به نمايدارد كه سامانه پيمايش و

.خواهد شداست كه در بخش هاي بعدي به تفصيل در مورد آن صحبت Link.irفهرست مرجع، وب سايت

:مؤ پويش و جستجو

مورد نظر، پيمايش و نمايه سازي پر شده است را براي عبارات اين مؤلفه، بانك اطالعاتي را كه بوسيله مؤلفه

در مورد اين مؤلفه آنچه از همه. هسته اصلي جستجوگر در اين اين مؤلفه نهفته استدر واقع. كند¬جستجو مي

كارا، براي به مهمتر است زمان پاسخ آن است و بايد الگوريتم هاي مناسب و نيز زيرساختهاي سخت افزاري

.حداقل رساندن زمان پاسخ اين مؤلفه به كار گرفته شود

:مؤ پايش و نظارت

اطالعات آماري كه از اين مؤلفه استخراج مي . جستجوگر دارداين مؤلفه نقش نظارتي و تحليلي بر خدمات موتور

به عنوان مثال مشخص مي كند كه مردم بيشتر به چه چيزي عالقه دارند و به دنبال گردد بسيار ارزشمند است و

اطالعات آماري از تحليل اين. طالعات آماري جغرافيايي نيز وجود داردعالوه بر اين امكان ارائه ا. گردندچه مي

.مهم و قابل توجه استديدگاه هاي مختلف تجاري، فرهنگي و اجتماعي و حتي امنيت ملي بسيار

18WwW.NiaziSoft.blogfa.CoM

:خ ارزش افزوده

وب، ارائه مي دهد؛ به عنوان يكي از نيازهاي اوليه كاربران با باال رفتن مخاطبين وب سايتي كه خدمات جستجو را

در اين عرصه مثال زدني Googleشايد تجربه. در اين وب سايت باال خواهد رفتتوان اجراي طرحهاي تجاري

در نتايج كه اين وب سايت پس از جذب مخاطبين بيشمار از همه نقاط دنيا، با اجراي طرح تبليغاتچرا. باشد

.دجستجو توانست به موفقيت تجاري چشم گيري دست ياب

تا سايتها براي هرچه باالرفتن تعداد مخاطبين باز هم به ارائه خدمات جديد اقدام مي كنندبه عالوه اين وب

موفق ترين باشد، Googleباز هم در اين زمينه شايد. كاربران را هرچه بيشتر به خدمات خود وابسته نگه دارند

وبسياري خدمات ديگر، Froogle ،Orkut،GoogleEarth ،GMailاين وب سايت با عرضه خدماتي مانند

.مخاطب ربوده استگوي سبقت را از ساير رقباي خود در جذب

به عنوان مرجع پيوند خود، در وب Link.irفهرستدر ريسمون مؤلفه پيمايش و نمايه سازي با استناد به

اين . العاتي خود ذخيره مي كنداز استخراج و نمايه سازي در بانك اطخزد و اطالعات آنها را پس¬سايتها مي

طول روز به10ميليون صفحه، به مدت 2حاضر با توجه به زيرساختهاي موجود براي نمايه سازي فرايند در حال

مؤلفه پويش و جستجو قرار پس از پايان اين فرايند بانك اطالعاتي براي عمليات جستجو در اختيار. مي انجامد

به . قديمي را دريافت و كار خود را دوباره آغاز مي كندسازي، بانك اطالعاتي¬ايهمي گيرد و سامانه پيمايش و نم

با اين. اطالعاتي جداگانه براي خود دارد تا كار آنها با يكديگر تداخل نداشته باشدعبارت ديگر هر مؤلفه، يك بانك

.ابيميروش به حداكثر كارايي براي هر مؤلفه در تعامل آن با بانك اطالعاتي دست مي

19WwW.NiaziSoft.blogfa.CoM

عمل مي نمايد؛ اين مؤلفه عبارات مؤلفه پايش و نظارت نيز به عنوان واسط بين كاربر و مؤلفه پويش و جستجو

.بعدي ثبت مي نمايدمورد جستجو و ساير اطالعات كاربر را جهت پردازش هاي

مون جتسجوي هم اكنون در وب سايت ريس. استمؤلفه خدمات ارزش افزوده نيز در ريسمون در نظرگرفته شده

118است كه از بانك اطالعاتي كارگزارهاي مركز خدمات كل كشور پياده سازي شده118اطالعات تلفني

به عالوه يك سامانه تبليغاتي نيز در حال پياده سازي است كه نسخه هاي اوليه. نمايدمخابرات تهران استفاده مي

.نصب و راه اندازي شده است Link.irآن در فهرست

20WwW.NiaziSoft.blogfa.CoM

قابليت هاي عمومي ريسمون

:قابليتهاي عمومي ريسمون عبارتند از

Open Office, Text RTF, Microsoftنمايه سازي اسناد و پرونده هايي با قالبهاي.1

Office, PDF, HTML با پشتيباني كامل از زبان فارسي.

توليد شده اند عربينمايه سازي محتويات فارسي بصورت جامع ، بطوريكه صفحاتي كه با كاف و ياي .2

.گردندنيز به صورت فارسي نمايه سازي مي شوند و در خروجي جستجو ظاهرمي

.امن شده اند SSLنمايه سازي وب سايتهايي كه با پروتكل.3

.سايت قراردارند FTPنمايه سازي اسناد و پرونده هايي كه در.4

.زي شدهبراي نگهداري اسناد و صفحات نمايه سا Cachingبهره مندي از.5

.زمانبندي نمايه سازي مجدد.6

يك وب دسته بندي وب سايتهايي كه نمايه سازي مي شوند و امكان ارائه خدمات جستجو بصورت.7

.سرويس به وب سايتهاي تابعه پورتالها دارد

.گذرواژه نياز استقابليت اعتبارسنجي براي ورود به بخشهاي اينترانتي كه براي دسترسي به آنها به.8

نتيجه براي مشخص كردن كلمات و يا عباراتي كه الزم نيست در stop wordsيباني ازپشت.9

...، "به"، "از"، "و"جستجو ظاهر شوند، مانند حروف اضافه

.جستجوي منطقي بصورت تركيب عطفي، فصلي و يا نفي از منطق بولي.10

21WwW.NiaziSoft.blogfa.CoM

.مورد نظربه موضوعبهره مندي از جستجوي پيشرفته با قابليتهايي نظير محدود كردن جستجو.11

.مشخص كردن كلمات يافت شده در نتيجه جستجو.12

.نمايش خالصه صفحه و يا سند يافت شده در نتيجه جستجو.13

.نمايه سازياجراي چند نسخه از برنامه نمايه سازي و عملكرد همزمان آنها براي تسريع در امر.14

بيشتر، رتبه ات و اسناد با ارتباطبهره مندي از روال رتبه بندي نتايج جستجو به طوريكه صفح.15

.باالتري در خروجي جستجو دارند

.نمايش تعداد كل نتايج يافت شده.16

.محاسبه و نمايش زماني كه صرف جستجو شده است.17

���������قابليت منحصر به فرد ريسمون�

د كردن دامنه موضوع ارائه خدمات جستجو با امكان محدواز جمله قابليتهاي منحصر به فرد جستجوگر ريسمون

يافتن مطالب بدون تعويض عبارت مورد جستجو و صرفا با تحديد موضوع، اين قابليت، امكان. جستجو است

.كاربر فراهم مي كندجستجو را براي

تعبيه شده Link.irموجود در فهرستهم اكنون در ريسمون امكان تحديد نتايج جستجو بر حسب موضوعات

كاربر متناسب با موضوع خود و يافتن صفحات و مطالب مورد نظر يش نتايج جستجو بوسيلهاست و اين امر به پاال

.كنداو كمك شاياني مي

22WwW.NiaziSoft.blogfa.CoM

اكنون بخش جستجوي هم. به عالوه با اين روش حتي مي توان در ريسمون جستجوهاي تخصصي ايجاد كرد

.نمايددر ريسمون به عنوان يك خروجي تخصصي جستجو عمل مي"شعر و ادب"

منحصر به فرد ريسمون نسبت به در نتايج جستجو است و از امكانات Zoomبه عبارت ديگر اين امكان نوعي

.ساير رقباي خارجي آن مي باشد

به عنوان مرجع پيوندهاي ريسمون����� ��معرفي فهرست

لينك امكان مرور عالوه براين فهرست . استفاده مي كندبه عنوان مرجع پيوند خود Link.irريسمون از فهرست

امكاني كه از جهت ويژگيهاي خود، تنها يك فهرست، مي تواند . نيز فراهم مي كندموضوعي وب سايتهاي ايراني را

و اگر كاربر اختيار قرار دهد، چرا كه هدف جستجوگر ها يافتن و دسترسي به محتويات وب سايت ها استدر

هيچ ابزاري به جز يك فهرست فعاليت مي كنند را بيابد،بخواهد فهرست وب سايتهايي كه در يك موضوع خاص

.اين امكان را در اختيار او قرار نمي دهد

كه مسووليت افرادي به عنوان ويراستار سرفصل هاي اصلي، فعاليت مي كنند؛ Link.irحاضر در فهرستدر حال

دسته بندي وب سايتها و وارد كردن كار. دسته بندي و درج پيوند وب سايتهاي سرفصل زير مجموعه خود را دارند

اول ساده به نظر برسد، ولي بسيار وقت گير است و دقت آنها در شاخه هاي مرتبط، كاري است كه شايد در نگاه

كه اين كار را انجام مي دهد بايد آشنايي الزم را با نوع فعاليت وب سايت خاص خود را مي طلبد چرا كه فردي

.را در دسته مرتبط با آن ثبت كندتا بتواند آن داشته باشد

23WwW.NiaziSoft.blogfa.CoM

مطالعه وب سايت و حصول اطمينان از حداقل هاي شرايط ثبت در فهرستويراستار هر سرفصل پس از بررسي و

Link.ir درباره جايگاه را در ميان شاخه زير مجموعه خود انتخاب و وب سايت را به همراه توضيحاتي، بهترين

اين فرايند يك نامه پس از. آن وب سايت، در آن شاخه درج مي نمايدوب سايت و نيز اطالعات تماس با

را از اين امر مطلع مي كند تا اگر نظر وب سايت ثبت شده، ارسال مي گردد و او Webmasterالكترونيكي به

.شده داشت، ويراستار را مطلع گرداندخاصي درباره شاخه، يا توضيحات وب سايت ثبت