Мы уже рассматривали файл robots.txt, который закрывает и запрещает поисковой системе индексировать определенный страницы. Сегодня мы разберемся с файлом sitemap.xml, зачем он нужен и какую пользу приносит ресурсу.

Что такое файл sitemap.xml?

Sitemap.xml – это файл который содержит определенные инструкции для поисковых роботов. Сам файл как видно создается в .xml формате и многие могут подумать, что для этого необходимо знать язык разметки xml. Расслабьтесь, существует много онлайн генераторов, а также модулей и плагином для движков, которые сделают эту работу вместо Вас.

Вот как может выглядеть этот файл:

файл Sitemap.xml
файл Sitemap.xml

И вот как он будет выглядеть в .xml формате:

Sitemap.xml
Sitemap.xml
Инструкции которые вытягивает из файла поисковый робот:
  1.  Адрес (url) страницы (категории, статьи).
  2. Все страницы ресурса имеют свой приоритет от 0 до 100%. В зависимости от того, какой приоритет имеет соответствующая страница, в такой поочередности и будет проходить индексация сайта. Если приоритет одинаковый у разных страниц, то робот сам определяет их поочередность индексации.
  3. Частота обновления страницы. Если страница обновляется часто, то и робот будет ее чаще индексировать.
  4. Так же учитывается последнее изменение страницы.
  5.  Другая информация, которая может быть известна, только поисковой системе.
К содержанию ↑

Зачем нужен файл sitemap.xml?

Это файл, необходим для того, что бы показать поисковому роботу, какие страницы должны быть проиндексированы в первую очередь, а какие второстепенно. Как уже говорилось индексация происходить в зависимости от приоритета страницы. Сайт должен быть сделан удобно не только для людей, а и для роботов, которые будут посещать ваш ресурс.

Положительные и отрицательные стороны sitemap.

К положительным сторонам можно отнести:

  • страницы доступны через flash или javascript (flash сайт или javascript меню), в этом случае поисковый робот их не сможет просто найти, если не будет внешних ссылок. Поэтому в этом случае использование этого файла, есть правильным.

К отрицательным сторонам относим:

  • бывают случаи, что некоторые страницы Вы удаляете с ресурса и если не смотреть за файлом sitemap.xml, то он может их сохранить и поисковики будут индексировать их. Это может отрицательно сказаться на сайте, что может привести к санкциям с боку поисковых систем.
  • так же у вас могут грабить контент (парсить его), sitemap – показывает самый важный контент на сайте. Как с этим бороться можете поискать в интернете.

Это даже не отрицательные стороны, а больше советы для того что бы не допускать ошибок.

Делаем выводы, сайтмэп – файл который должен быть на каждом сайте. Он помогает поисковым системам найти страницы, изображения и видео, которые робот не может определить при использовании навигации сайта.

Поделиться