Ми вже розглядали файл robots.txt , який закриває і забороняє пошуковому роботу індексувати певні сторінки. Сьогодні ми розберемося з файлом sitemap.xml, навіщо він потрібен і яку користь приносить ресурсу.

Що таке файл sitemap.xml?

Sitemap.xml – це файл який містить певні інструкції для пошукових роботів. Сам файл як видно створюється в .xml форматі і багато хто може подумати, що для цього необхідно знати мову розмітки xml. Розслабтеся, існує багато онлайн генераторів, а також модулів і плагіном для двигунів, які зроблять цю роботу замість Вас.

Ось як може виглядати цей файл:

Файл Sitemap.xml
Файл Sitemap.xml

І ось як він буде виглядати в .xml форматі:

Sitemap.xml в XML формате
Sitemap.xml в XML формате

Інструкція яку витягує з файлу пошуковий робот:

  1. Адреса (url) сторінки (категорії, статті).
  2. Всі сторінки ресурсу мають свій пріоритет від 0 до 100%. Залежно від того, який пріоритет має відповідна сторінка, в такий черговості і буде проходити індексація сайту. Якщо пріоритет однаковий у різних сторінок, то робот сам визначає їх черговість індексації.
  3. Частота оновлення сторінки. Якщо сторінка оновлюється часто, то і робот буде її частіше індексувати.
  4. Так само враховується остання зміна сторінки.
  5. Інша інформація, яка може бути відома, тільки пошуковій системі.
К содержанию ↑

Навіщо потрібен файл sitemap.xml?

Це файл, необхідний для того, що б показати пошуковому роботу, які сторінки повинні бути проіндексовані в першу чергу. Як вже говорилося індексація відбуватися в залежності від пріоритету сторінки. Сайт повинен бути зроблений зручно не тільки для людей, а й для роботів, які будуть відвідувати ваш ресурс.

Позитивні і негативні сторони sitemap.

До позитивних сторін можна віднести:

  • сторінка зроблена через flash або javascript (flash сайт або javascript меню), в цьому випадку пошуковий робот їх не зможе просто знайти, якщо не буде зовнішніх посилань. Тому в цьому випадку використання цього файлу, є правильним.

До негативних сторін відносимо:

  • бувають випадки, що деякі сторінки Ви видаляєте з ресурсу і якщо не дивитися за файлом sitemap.xml, то він може їх зберегти і пошуковики будуть індексувати їх. Це може негативно позначитися на сайті, що може призвести до санкцій з боку пошукових систем.
  • так само у вас можуть грабувати контент (парсити його), sitemap – показує найважливіший контент на сайті. Як з цим боротися можете пошукати в інтернеті.

Це навіть не негативні сторони, а більше поради для того що б не допускати помилок.

Робимо висновки, Sitemap – файл який повинен бути на кожному сайті. Він допомагає пошуковим системам знайти сторінки, зображення та відео, які робот не може визначити при використанні навігації сайту.

Поділитися