ЗАРЕГИСТРИРУЙТЕСЬ
и получите бесплатно:
1.Чек-лист по созданию информационного сайта.
2.3 видеоурока с первыми шагами в сайтах.
3.10 лучших материалов из Базы Знаний.



или Регистрация
Восстановление пароля

Список поисковых систем — лучшие российские и зарубежные сервисы

Поисковая система (ПС) — это сайт, который ищет информации в Интернете и предоставляет ссылки на страницы с информацией, которую искал пользователь. Чтобы было понятно, давайте рассмотрим следующий пример.

Вы купили комнатную розу и не знаете, как за ней ухаживать. Чтобы узнать это, вы идете в Интернет, открываете поисковик и вводите фразу «как ухаживать за комнатными розами». Поисковик ищет такую информацию по всему Интернету, после чего выдает вам ссылки на страницы, где вы можете прочитать об уходе за комнатными розами.

Поисковик работает как фильтр: пропускает сквозь себя все страницы в сети, оставив для вас только те, где находится нужная вам информация.

Принцип работы

Весь принцип работы поисковой системы можно разделить на три этапа: сканирование, индексация и ранжирование.

Рассмотрим все три процесса более подробно на примере Яндекса.

Сканирование

Это процесс сбора в базу данных всех имеющихся в глобальной сети веб-страниц.

Сканирование осуществляется поисковыми роботами, которые называются краулерами. Они обходят все сайты в Интернете и загружают в свои сервера их копии, а точнее копии страниц этих сайтов. Боты можно классифицировать по назначению: одна группа роботов индексирует картинки, другая — видео, третья — текстовый материал и так далее.

Робот загружает копии страниц в свою базу, чтобы позже быстро совершать по ним поиск нужной информации. Но это уже следующий этап.

Индексирование

Индексирование — это процесс, благодаря которому сайт появляется в поисковой выдаче.

Когда пользователь вводит интересующую его фразу в Яндекс, поисковик сначала подвергает ее детальному лингвистическому анализу. Этот процесс состоит из следующих этапов:

  • Определение языка: Яндекс распознает язык не только по наличию букв того или иного алфавита, но и по характерному сочетанию символов. Именно поэтому поисковик может верно определить слово даже тогда, когда вы напишете его, не поменяв раскладку клавиатуры.
  • Определение морфологии: поисковик дополняет введенное пользователем слово различными морфологическими формами и синонимами. Например, если вы введете в Яндекс слово «клавиатура», то он ищет не только это конкретное слово, но и другие его формы: «клавиатуры», «клавиатур», «клавиатурой». Это делается для расширения зоны поиска.
  • Исключение омонимии: анализируя частоту и сочетаемость слов, Яндекс исключает омонимы — слова с одинаковыми написанием и звучанием, но с разными значениями. Это позволяет дать пользователю наиболее точную информацию. Введите в Яндекс фразу «купить лук», и в результатах вы увидите как репчатый лук, так и стрелковое оружие. А теперь попробуйте сначала ввести «купить лук семена», а потом «купить лук для стрельбы». В первом случае вы увидите в выдаче только репчатый лук, а во втором случае — только стрелковое оружие. Таким образом, Яндекс, проанализировав сочетаемость слов «семена — лук» и «стрельба — лук», выдал нам точный ответ.
  • Расширение запроса: на этом этапе Яндекс ищет синонимы к введенному пользователем слову, находит однокоренные слова, аббревиатуры и написание названий брендов/компаний на других языках. Например, введите в Яндекс слово «торрент», и в результатах вы увидите «uTorrent». Или попробуйте ввести аббревиатуру «ПК», а в результатах будет словосочетание «персональный компьютер».

Ранжирование

Когда поисковик найдет в своем индексе все страницы, в которых содержится нужная пользователю информация, список все равно оказывается внушительным.

Давать результат в таком виде пользователю нельзя. Поэтому полученный список ссылок проходит через последний этап, который называется ранжированием.

Ранжирование — это сортировка ссылок на страницы веб-сайтов в порядке убывания их полезности.

То есть, когда вы вводите в Яндекс фразу «как ухаживать за комнатными розами», поисковик выдаст вам сотни ссылок на страницы, в которых содержится инструкция по уходу.

Однако ссылки на страницы с наиболее точным ответом на ваш вопрос размещаются на первых строчках выдачи, а все остальные — ниже. Такой процесс сортировки веб-страниц и называется ранжированием.

Рейтинги поисковиков в Интернете

Если расположить 10 поисковых систем по убыванию популярности в мире, то получится следующий рейтинг:

  1. Google занимает почетное первое место. Треть пользователей этого поисковика находятся в Америке. Говорят, что изначально компанию собирались назвать «Googol», но при регистрации домена допустили ошибку.
  2. Bing — продукт компании Microsoft, был разработан в 2009 году. Поисковик имеет простой интерфейс с периодически обновляемым фоном.
  3. Yahoo — самая старая поисковая машина. была разработана в 1994 году.
  4. Baidu за счет огромного количества пользователей в КНР, эта поисковая машина занимает четвертое место в мире по популярности. В странах СНГ Baidu не пользуется спросом из-за навязчивых расширений для перевода интерфейса, которые воспринимаются как посторонние вредоносные ПО.
  5. Яндекс занимает пятое место в мире и первое — в России. Отличительной чертой поисковика является наличие огромного числа всевозможных виджетов на главной странице: новости, погода, лента Яндекс.Дзен и др. Пользователи могут персонализировать эти виджеты под себя.
  6. AOL — американская поисковая машина, расшифровывается как «America Online». На начальной странице имеются виджеты с последними новостями, сводками погоды, гороскопами и др.
  7. Ask любую поисковую фразу воспринимает в качестве вопроса, и в результатах выдачи не показывает форумы и обсуждения — только информационные сайты. На главной странице находятся анонсы популярных статей по категориям: культура, шоу-бизнес, телевидение и др.
  8. Excite осуществляет поиск по текстовым материалам, картинкам, видео и новостям. На главной странице под поисковой строкой есть сводка самых популярных новостей, прогноз погоды и гороскоп.
  9. DuckDuckGo популярен тем, что не собирает информацию у пользователей.
  10. Mail.ru — российская поисковая система. Начальная страница содержит очень много виджетов новостей, киноафиш и др. Это не только поисковик, но и почтовый сервис, игровой портал и социальная сеть.

Какие, кроме Яндекса, поисковые системы популярны в Рунете

Если возьмем только русскоязычный сегмент Интернета, то самым популярным поисковиком будет Яндекс. После него идет Google, затем Mail.ru, а далее — Rambler. Рамблер был запущен в 1996 году, это самый старый поисковик в Рунете.

Диаграмма доли поисковиков в Рунете

Поисковая система — это сложная машина, которая за считанные доли секунды должна совершить огромное количество операций. Разработчики активно работают над усовершенствованием алгоритмов сканирования, индексации и ранжирования веб-страниц, постоянно улучшают интерфейс для удобства пользователей.

Как вы считаете, какой из поисковиков лучше всего находит информацию? Делитесь в комментариях!

Комментарии