Как работают поисковые системы интернета ч.2

Что же такое поиск? По какому принципу поисковик выделяет из миллионов хранящихся в базе данных страниц именно те, которые нам нужны?

В прошлой статье «Как работают поисковые системы интернета» описывались принципы работы поисковых систем Google, Яндекс и других, а также принципы работы «поисковых пауков» и «роботов-краулеров».

Какой по порядку выведется та или иная страница, зависит от множества факторов. Ранжирование — это сложный процесс построения списка страниц, релевантных запросу пользователя, и расположены они в соответствии с весом и ценностью содержащейся информации.

Принципы ранжирования у разных поисковиков совершенно разные, и потому сайт, оказывающийся на первом месте в поиске у Yandex, может «провалиться» в середину страницы у Rambler.

В первую очередь поисковик сравнивает запрос с ключевыми словами, заложенными в информации о сайте, и с текстом страницы. Именно содержание и ключевые слова, находящиеся в шапке страницы и в метатегах (keywords, description), определяют позицию сайта в поисковом списке.

Помимо того ключевые слова должны быть прописаны на сайте не один раз: в заголовках разных уровней, непосредственно в тексте и так далее. Некоторые теги (< strong >, <hl>,<b>) искусственно обращают на себя первоначальное внимание поисковых машин, поэтому ключевые слова в тексте стоит выделять. Поисковики очень сильно придают вес тем словам, которые расположенны ближе к началу предложения и к началу документа.

Искусство так разместить ключевые слова на сайте и составить такой текст, чтобы он легко и четко индексировался и выдавался поисковиком в первой десятке результатов, называется SEO-копирайтингом. Попробуем в кратце объяснить, что такое SEO-копирайтинг. Это разработка и оформление, специально для поисковой оптимизации, контента сайта на основе ключевых слов ядра поисковых запросов с грамотным использованием языка гипертекста HTML и каскадных таблиц стилей CSS. По сути, это разновидность составления рекламных текстов с учетом особенностей Интернета.

В искусстве составления грамотного контента сайта очень важно не переборщить. Суть в том, что при перенасыщении страницы одноплановыми ключевыми словами поисковый робот может распознать спам и исключить сайт из поиска вообще.

Оптимальным процентом повторяющихся ключевых слов является примерно 4-7% от всего текста. Очень часто задачей SEO-копирайтера является рерайтинг — пересказ заранее составленного текста таким образом, чтобы статья включала в себя достаточное количество ключевых слов и лучше индексировался.

Другим, хотя и менее значимым, фактором является так называемая авторитетность страницы. Это понятие ввели разработчики системы Google (PR — Google PageRank), теперь подобные показатели используют почти все поисковые системы. Если говорить именно о Google PR, то это умноженная на нормирующий коэффициент сумма весов всех ссылок, ведущих на данную страницу.

Общий принцип определения веса ссылки примерно таков: вес ссылки будет тем больше, чем выше присвоен PR у страницы, на которой была установлена ссылка, и тем вес будет меньше, чем больше ссылок опубликовано на этой странице. К примеру, Yandex пользуется понятием «авторитетность блогов», а рейтинг авторитетности является довольно модным инструментом соревнования среди блоггеров.

Еще одним инструментом является так называемое ссылочное ранжирование. Нужно заметить, что поисковые системы не только учитывают кроме самого факта ссылки на ту или иную страницу сайта, но ещё и то, какие имено слова написаны в тексте этой ссылки. Предположим, поисковик обнаруживает ссылку <а href:= microsoft.com>синие утята </а>. Точнее, не одну, а множество таких ссылок. И по запросу «синие утята» этот сайт автоматически поднимается вверх в списке результатов, хотя никаких синих утят на нем нет.

Это свойство поисковиков используют хакеры и спамеры для издевательства над сайтами популярных политиков, партий, организаций. Широко известен случай, когда запрос «аццкий сотона» первой ссылкой в Google отправлял на сайт президента Республики Беларусь.

Сам процесс поиска прост: пользователь дает запрос, поисковик сравнивает искомые слова со своей базой данных и выдает ранжированный результат. Но возникает последний вопрос: как дать такой запрос, чтобы получить именно то, что нужно?

Ведь поисковик — это машина, она не умеет читать мысли и понимать тайные желания «заказчика».

Продолжение следует….

Понравилась статья? Поделитесь с друзьями:


Читайте также по теме...

2 комментариев

  • Вебсайт
    Август 18, 2014 2:03 ппОпубликовано 2 год тому
    Юрий

    Я начинающий сайтостроитель. С удовольствием прочитал Вашу работу. Мне статья очень понравилась. Хотелось бы прочитать часть 1 Вашей статьи. Есть отдельные вопросы, но задам позже, когда ещё раз обдумаю и изучу Вашу статью. Чтобы не отвлекать Вас не нужными вопросами. Ещё раз спасибо за очень качественную статью. Юрий.

    Ответить
    • Август 18, 2014 8:35 ппОпубликовано 2 год тому
      Imre Vise (Author)

      Спасибо за внимание :)

      Ответить

Оставьте Ваш комментарий

Ваше имя: (обязательно)

E-Mail: (обязательно)

Website: (не обязательно)

Введите код авторизации: (обязательно)


Текст Вашего комментария: (обязательно)

Прокомментировать