Поисковые системы

Поисковая машина — ее еще называют пауком, гусеницей или роботом (Spider, Crawler, Robot) — программа, которая посещает web-сайты, считывает и индексирует полностью или частично их содержимое и далее следует по ссылкам, найденным на сервере. Поисковая машина регулярно, например, каждый месяц, возвращается на сайты и повторяет индексацию страниц.

· Индексы поисковой системы. Сюда попадает все или основная часть того, что находит и считывает поисковая машина. Индексы системы представляют собой гигантское хранилище информации, где хранятся текстовые копии всех страниц, которые посетила и проиндексировала поисковая машина.

· Программа, которая в соответствии с запросом пользователя перебирает индексы поисковой системы в поисках информации и выдает ему в порядке убывания релевантности (степени соответствия заданному критерию) найденные документы. Разумеется, далеко не всегда документ, признанный поисковой системой наиболее релевантным, будет таковым, по мнению самого пользователя.

Таким образом, действие поисковой системы заключается в постоянном последовательном исследовании всех узлов Интернета, доступных данной системе поиска, со всеми их связями и ответвлениями. В связи с постоянным обновлением информации машина поиска через определенный срок (порядка месяца) регулярно возвращается к уже изученным узлам, чтобы обнаружить и зарегистрировать изменения. Вся прочитанная информация индексируется, то есть создается специализированная база данных, в которой закодированы все исследованные системой страницы Интернета.

При поступлении запроса от пользователя, машина поиска рассматривает всю индексированную информацию и выдает список документов, соответствующих задаче поиска. Найденные документы ранжируются в зависимости от местоположения ключевых слов (в заголовке, в начале текста, в первых параграфах) и частоты их появления в тексте.

Запрос по определенным ключевым словам или выражениям в каждой из поисковых систем обычно рождает разные результаты. Это связано с тем, что, несмотря на схожий принцип работы, машины поиска различаются по языкам запроса, зонам поиска, глубине поиска внутри документа, методам ранжирования и приоритетов, поэтому применение разных поисковых машин дает различные результаты.

Поисковые средства постоянно развиваются. Совершенствование идет по всем главным аспектам: рост объемов баз данных, возможности составления запроса и дружественность интерфейса, выдача результатов и наличие дополнительных сервисных функций. Системы, которые долгое время не внедряют новых элементов и не оптимизируют уже имеющиеся функции, постепенно выводятся из активного использования.

Наиболее широко известными международными поисковыми системами являются Alta Vista (www. altavista. com), Excite (www. excite. com), Lycos (www. lycos. com), WebCrawler (www. webcrawler. com). Среди русскоязычных можно выделить системы Яndex (www. yandex. ru), Rambler (www. rambler. ru) и Апорт! (www. aport. ru).

БЕСПЛАТНЫЙ домен! Лучший хостинг от AGAVA >>>Здесь