موتورهای جستجو چگونه کار می کنند؟
در فضای نامحدود اینترنت میلیون ها وب سایت وجود دارد که موتورهای جستجو بر اساس الگوریتم و قوانین خود باید آن صفحات را بررسی کنند، محتوایی که در صفحات قرا داده شده است را جستجو کنند و با توجه به نیاز کاربر دراختیارش قرار دهند.
موتورهای جستجو هم چون دکتر داروخانه عمل می کنند. دکتر با اطلاع از جایگاه داروها به سرعت می تواند شروع به پیچیدن نسخه بیمار می کند و آن را به بیمار تحویل دهد. این دکتر با آگاهی که نسبت به جایی که هر دارو قرار دارد سریعا نسخه را بررسی کرده و در کمترین زمان جوابگوی نیاز بیمار خواهد بود. دکتر داروخانه هم چون گوگل عمل کرده است.
در دنیای امروز ما وابسته به موتورهای جستجو شده ایم. تقریبا برای پیدا کردن جواب هر سوالی در گوگل به جستجوی آن می پردازیم. زیرا موتورهای جستجو به سرعت پاسخگوی سوالات ما هستند.
آیا لحظه ای به این موضوع فکر کرده اید که موتورهای جستجو چگونه کار می کنند و بعد از جستجوی هر کلمه ای اطلاعات مرتبط به آن را با چه ترتیبی در اختیارمان قرار می دهند؟
موتورهای جستجو برای این که بتوانند در کمترین زمان ممکن پاسخ مرتبط را در اختیار کاربر قرار دهند نیاز است که اطلاعاتی در کتابخانه اش داشته باشد. در همین خصوص نیاز به انجام سه مرحله است تا موتور جستجو بتواند صفحه های مرتبط به سوال را به نمایش بگذارد.
در این مقاله با ما همراه باشید تا با نحوه کار موتورهای جستجو آشنا شوید.
3 مرحله از عملکرد اصلی موتورهای جستجو
کراول کردن (Crawling): ربات های خزنده به جستجوی لینک ها و سایت ها می پردازند.
ایندکس کردن (Indexing): اطلاعاتی که ربات ها در صفحات کروال می کنند ذخیره و ساماندهی می شوند.
رتبه بندی کردن (Ranking): بهترین و مرتبط ترین نتیجه جستجو در بالاترین صفحه اول موتور جستجو به نمایش می گذارد.
Crawling کراولینگ موتور جستجو
به فرآیندی که موتورهای جستجو از صفحه ای به صفحه ی دیگر به جستجوی اطلاعات جدیدی می پردازند کراول کردن می گویند.
کراول کننده ها به طور پیوسته در هر زمانی صفحات وب را مرور می کنند تا اطلاعات داخل صفحات را بدانند و همیشه اطلاعات به روز از تمام صفحات در اختیار داشته باشند. اگر محتوای سایتی تغییر پیدا کند آن تغییرات هم قابل جستجو است.
کراولینگ وب چطور کار میکند؟
لازم است بدانید که الگوریتم های موتورهای جستجو دائما در حال تغییر و به روزرسانی می باشند. تعداد صفحاتی که در دنیای وب وجود دارد بسیار زیاد است و به طور پیوسته در حال افزایش است. کرالینگ وب با لیستی از URL های شناخته شده آغلز می گردد و با کرال کردن صفحات سایت و لینک ها ادامه پیدا می کند.
آن ها را به لیست صفحات وب افزوده تا اگر محتوای جدیدی بارگذاری شد آن ها را هم کرال کند. در اینترنت به دلیل این که صفحات بسیاری برای جستجو لیست می شوند این روال به طور نامحدود تداوم دارد.
ایندکس کردن (Index) موتور جستجو
اطلاعاتی که از قبل توسط موتورهای جستجو گر در صفحات سایت ها کرال شده اند نیاز است تجزیه و تحلیل شوند تا در صورت جستجوی کاربر پاسخی مرتبط داده شود. به این عملیات تجزیه و ساماندهی اطلاعات وب سایت ها ایندکس کردن می گویند.
رتبه بندی (Rankin) موتور جستجو
رتبه بندی موتور جستجوی یک وب سایت به صفحه نتیجه موتور جستجو اشاره دارد. موتورهای جستجو بسته به موضوعی که سرچ می شود ممکن است تعداد صفحاتی را برای شما به عنوان نتیجه به نمایش بگذارد اما با توجه به رتبه ای که صفحات دارند در نتایج بالاتر در صفحه اول قرار می گیرند.
صفحات وب مرتبطی که رتبه بندی پایینی دارند در صفحات بعدی به نمایش درمی آیند.
سخن آخر
موتورهای جستجو از برنامه های کامپیوتری پیچیده ای ایجاد شده اند. نحوه ی کار آن ها ساده نمی باشد و نیاز به تصمیم گیری دارد. خوشحال هستیم که تا آخر مقاله با ما همراه بودید و امیدواریم این مقاله برایتان مفیدبوده باشد.