چطور موتورهاي جستجو كار مي‌كنند؟

2009/06/23 at 9:23 ق.ظ. بیان دیدگاه

نلاين– همشهري‌آنلاين- هادي زجاجي:
وقتي جستجويي در يك موتور جستجوگر انجام و نتايج جستجو ارايه مي‌شود، كاربران در واقع نتيجه كار بخش‌هاي متفاوت موتور جستجوگر را مي‌بينند.

موتور جستجوگر قبلاً پايگاه داده‌اش را آماده كرده است و اين گونه نيست كه درست در همان لحظه‌ي جستجو، تمام وب را بگردد.

بسياري از خود مي‌پرسند كه چگونه ممكن است گوگل در كمتر از يك ثانيه تمام سايت‌هاي وب را بگردد و ميليون‌ها صفحه را در نتايج جستجوي خود ارايه كند؟

گوگل و هيچ موتور جستجوي ديگري توانايي انجام اين كار را ندارند. همه آنها در زمان پاسخ‌گويي به جستجوهاي كاربران، تنها در پايگاه داده‌اي كه در اختيار دارند به جستجو مي‌پردازند و نه در وب! موتور جستجوگر به كمك بخش‌هاي متفاوت خود، اطلاعات مورد نياز را قبلاً جمع‌آوري، تجزيه و تحليل مي‌كند، آنرا در پايگاه داده‌اش ذخيره مي‌نمايد و به هنگام جستجوي كاربر تنها در همين پايگاه داده مي‌گردد. بخش‌هاي مجزاي يك موتور جستجوگر عبارتند از:
Spider يا عنكبوت
Crawler يا خزنده
Indexer يا بايگاني كننده
Database يا پايگاه داده
Ranker يا سيستم رتبه‌بندي

الف: Spider (عنكبوت)
اسپايدر يا روبوت (Robot) نرم افزاري است كه كار جمع‌آوري اطلاعات مورد نياز يك موتور جستجو را بر عهده دارد. اسپايدر به صفحات مختلف سر مي‌زند، محتواي آنها را مي‌خواند، لينك‌ها را دنبال مي‌كند، اطلاعات مورد نياز را جمع‌آوري مي‌كند و آنرا در اختيار ساير بخش‌هاي موتور جستجوگر قرار مي‌دهد. كار يك اسپايدر، بسيار شبيه كار كاربران وب است. همانطور كه كاربران، صفحات مختلف را بازديد مي‌كنند، اسپايدر هم درست اين كار را انجام مي‌دهد با اين تفاوت كه اسپايدر كدهاي HTML صفحات را مي‌بيند اما كاربران نتيجه حاصل از كنار هم قرار گرفتن اين كدها را.

اسپايدر، به هنگام مشاهده صفحات، بر روي سرورها رد پا برجاي مي‌گذارد. شما اگر اجازه دسترسي به آمار ديد و بازديدهاي صورت گرفته از يك سايت و اتفاقات انجام شده در آن را داشته باشيد، مي‌توانيد مشخص كنيد كه اسپايدر كدام يك از موتورهاي جستجوگر صفحات سايت را مورد بازديد قرار داده است. يكي از فعاليت‌هاي اصلي كه در SEM انجام مي‌شود تحليل آمار همين ديد و بازديدها است.

اسپايدرها كاربردهاي ديگري نيز دارند، به عنوان مثال عده‌اي از آنها به سايت‌هاي مختلف مراجعه مي‌كنند و فقط به بررسي فعال بودن لينك‌هاي آنها مي‌پردازند و يا به دنبال آدرس ايميل (E-mail) مي‌گردند.

ب: Crawler (خزنده)
كراولر، نرم‌افزاري است كه به عنوان يك فرمانده براي اسپايدر عمل مي‌كند. كراولر مشخص مي‌كند كه اسپايدر كدام صفحات را مورد بازديد قرار دهد. در واقع كراولر تصميم مي‌گيرد كه كدام يك از لينك‌هاي صفحه‌اي كه اسپايدر در حال حاضر در آن قرار دارد، دنبال شود. ممكن است همه آنها را دنبال كند، بعضي‌ها را دنبال كند و يا هيچ كدام را دنبال نكند.

كراولر، ممكن است قبلاً برنامه‌ريزي شده باشد كه آدرس‌هاي خاصي را طبق برنامه در اختيار اسپايدر قرار دهد تا از آنها ديدن كند. دنبال كردن لينك‌هاي يك صفحه به اين بستگي دارد كه موتور جستجو چه حجمي از اطلاعات يك سايت را مي‌تواند (يا مي‌خواهد) در پايگاه داده‌اش ذخيره كند. همچنين ممكن است اجازه دسترسي به بعضي از صفحات به موتورهاي جستجوگر داده نشده باشد.

شما به عنوان دارنده سايت، همان طور كه دوست داريد موتورهاي جستجو اطلاعات سايت شما را با خود ببرند، مي‌توانيد آنها را از بعضي صفحات سايت‌تان دور كنيد و اجازه دسترسي به محتواي آن صفحات را به آنها ندهيد. موتور جستجو اگر مودب باشد قبل از ورود به هر سايتي ابتدا قوانين دسترسي به محتواي سايت را (در صورت وجود) در فايلي خاص بررسي مي‌كند و از حقوق دسترسي خود اطلاع مي‌يابد. تنظيم ميزان دسترسي موتورهاي جستجو به محتواي يك سايت توسط پروتكل Robots انجام مي‌شود. به عمل كراولر، خزش (Crawling) مي‌گويند.

Entry filed under: Google.com. Tags: , , , , , .

آشنايي با 10 ابزار مهم گوگل جست‌وجوي گوگل براي مكينتاش

پاسخی بگذارید

در پایین مشخصات خود را پر کنید یا برای ورود روی شمایل‌ها کلیک نمایید:

نشان‌وارهٔ وردپرس.کام

شما در حال بیان دیدگاه با حساب کاربری WordPress.com خود هستید. بیرون رفتن / تغییر دادن )

تصویر توییتر

شما در حال بیان دیدگاه با حساب کاربری Twitter خود هستید. بیرون رفتن / تغییر دادن )

عکس فیسبوک

شما در حال بیان دیدگاه با حساب کاربری Facebook خود هستید. بیرون رفتن / تغییر دادن )

عکس گوگل+

شما در حال بیان دیدگاه با حساب کاربری Google+ خود هستید. بیرون رفتن / تغییر دادن )

درحال اتصال به %s

Trackback this post  |  Subscribe to the comments via RSS Feed


مشترک خوراک این وبلاگ شوید :

توضیح

من یک علاقه مند به مطالب آی تی هستم، به جهت علاقه مدی خود به موتورجستجوی بی همتای گوگل، بر آن شدم وبلاگ مخصوص آن را به زبان پارسی منتشر کنم و در آن به جمع آوری مطالبی در مورد گوگل خواهم بود. اگر شما نیز مطالبی در مورد گول دارید در نظرات بگذارید انتشار می کنم

برترین مطالب

Blog Stats

  • 33,640 hits

%d وب‌نوشت‌نویس این را دوست دارند: