Что такое сопли Google (supplemental results). Причины и способы нахождения.

Поисковые системы все время следят за качество поисковой выдачи. Чем лучше выдача (релевантнее), тем быстрее посетитель найдет нужную ему информацию по запросу. Для этого тратятся огромные деньги на сканирование и хранение информации на серверах поисковиков. Компания Google в 2003 году, ввела дополнительный индекс (сопли Google, supplemental results), что бы сократить хранение не качественной информации в главном индексе.

Сопли Google (supplemental results) — это документы, страницы ресурса, которые не находятся в основном индексе системы Google.

Supplemental results (Сопли Google).

Supplemental results (Сопли Google).

Что значит страницы не находятся в основном индексе?

Если просмотреть множество сайтов, которые находятся в интернете, то у большого количества страницы находятся именно в соплях, что есть плохо. Такие страницы:

  • плохо индексируются;
  • не ранжируются, и как следствие не приводят трафик (посетителей) на ресурс;
  • их не можно найти по запросам;
  • дают мало пользы посетителям;

Ниже давайте рассмотрим причины по которым страницы могут попасть в дополнительные результаты.

Причины по которым страницы могут попасть в дополнительные результаты.

В так званные дополнительные результаты попадают страницы не несущее полезной информации для пользователя. Это страницы которые:

  1. содержат не уникальный контент (скопирован с другого источника).
  2. не содержат текста, пустые страницы.
  3. имеют большой уровень вложенности, как правило больше 4.
  4. имеют дублированный контент, так называемые дубли.
  5. не имеют доверия у поисковой системы.

Давайте по порядку рассмотрим каждый из вариантов.

1. Страницы содержат не уникальный контент.

Как правило, если страница содержит не уникальный контент (скопированный с другого источника), то она может попасть в сопли, так как не несет полезной информации для посетителей. Множество сайтов на просторах интернета страдают именно из-за не уникального текста на своих страницах.

За не уникальный контент можно не только залететь в сопли, а и получить фильтр и долго выходить из под него.

Про фильтры поисковой системы Google читайте: “Фильтры поисковой системы Google”. Делайте качественный контент и все будет хорошо.

2. Страницы, которые не содержат текста (пустые).

Такие страницы с большой вероятностью попадают в дополнительные результаты Google. Я уже выше писал, что поисковая система тратит миллиарды долларов на хранение информации. Так как страница является пустой и не содержит текста, она будет отправлена в сопли.

3. Страница имеет большой уровень вложенности (4 и выше).

Необходимо делать качественные сайты, где пользователи могли бы находить необходимую им информацию за 2-3 клика. Страницы которые не возможно найти и которые лежат далеко от главной, с большой вероятностью могут попасть в дополнительный индекс.

4. Дубли страниц.

Одна из причин, по которой страницы попадают в сопли — это дублирование контента. Дубли на сайте могут появляться из-за различных причин. Необходимо следить за их появление и вовремя устранять.

Про дубли можете почитать здесь: “Дубли страниц на сайте, методы поиска” и как их удалять вот здесь: “Как удалить дубли страниц или закрыть их от индексации”.

5. Страницы которые не имеют доверия у поисковой системы.

Когда страница и сайт в целом подозрительный с точки зрения поисковой системы, то это может стать еще одной причиной попадания в дополнительные результаты. Необходимо повышать траст сайта и узнаваемость продукта, бренда.

Главные причины попадания страниц мы узнали, теперь давайте разберемся как определять страницы в соплях Google.

Как найти страницы которые попали в дополнительный индекс?

Для начала, я рекомендую воспользоваться сервисом:

http://xseo.in/indexed

здесь можно узнать точную картину, сколько страниц в главном индексе, сколько в соплях. У меня в соплях 26, если смотреть на картинке ниже.

Сервис xseo.in

Теперь переходим в поисковую систему Google, что бы посмотреть количество страниц в дополнительном индексе. Здесь необходимо прописать в строке поиска:

site:loleknbolek.com -inallurl:loleknbolek.com (вместо loleknbolek.com — Ваш домен).

Я вижу, что мне показывает 171 страницу, это все страницы сайта. Все хорошо так как сервис, который запускали ранее показал, что всего 172 страницы.

выдача google

Если пролистать немного дальше, то можно увидеть, что в дополнительной выдаче, есть страницы которые запрещены файлом robots.txt. Данные страницы, были проиндексированы ранее, закинуты в дополнительную выдачу и просто еще не удалились с нее.

Выдача google

Таких страниц почти 26 штук. Поэтому я могу сделать вывод, что в соплях у меня почти нету страниц, что является хорошо. Вообще лучше всего проверять в ручную (в excel файле) и находить там сопли, их видно сразу.

Как убрать страницы с дополнительного индекса?

  • Писать уникальный контент для сайта.
  • Закрывать дубли страниц от индексации с помощью meta noindex (так как это команда для поисковиков, а в robots.txt — это рекомендация), 301 редиректа или атрибута rel=«canonical».
  • Использовать карту сайт (sitemap.xml).
  • Делать качественную перелинковку и равномерно распределять вес по сайту.
  • Делать структуру сайта или переделывать, что бы страницы имели уровень вложенности не выше 4.
  • Наращивать авторитет ресурса.

Одна из бед “соплей” — в том, что Google такие страницы обходит реже, чем те страницы, что находятся в главном индексе. Поэтому, если Вы даже исправите положение, обновления можно ждать и месяц, пока Гугл в кэше заменит содержание страниц и выпустит их в основной индекс.

Следите за своим ресурсом и старайтесь держать свой сайт в основном индексе поисковой системы Google.

Оцените статью:

Очень плохоПлохоНормальноХорошоОтлично (6 Рейтинг: 4,33 из 5)
Loading...Loading...

Если Вам понравилась статья, поделитесь с друзьями в соц. сетях:

Вам также может понравиться...

Комментариев: 9

  1. Олег:

    Сопли Google реально не несут ничего полезного в себе, сам стараюсь, чтобы у меня на сайте «соплей» не было вообще.

  2. Никита Геленев:

    Хм, интересная статья, нужно будет свой форум проверить на наличие этих «соплей», может быть поэтому он в топ и не выходит.

  3. Bolek:

    Никита, всякое может быть. Кинь ссылку на форум, гляну может подскажу куда смотреть надо. Сопли один из вариантов.

  4. Дмитрий:

    Нашел, что в индексе яндекса попался такой мусор:
    infoto.com.ua/news/article
    infoto.com.ua/news/author
    infoto.com.ua/product/search
    и еще много чего другого.
    Скажите, их лучше и через robots закрыть и через 301 редирект?

  5. Bolek:

    Через robots.txt необходимо закрыть. Корректность работы файла можно как в Гугле, так и в Яндексе проверить в вебмастере.
    301 редирект не нужно делать.

  6. Дмитрий:

    Но если страницы не нужны, то может, лучше сделать 301?
    Что тогда делать со страницами вида
    infoto.com.ua/module/article_list/getlist;cpath;1;page;4;limit;5
    infoto.com.ua/product/search;search;Canon%20BG-E11
    infoto.com.ua/news/article/infoto;article_id;0
    По сути это же бесполезные страницы.

  7. Bolek:

    Такие страницы как правило, лучше всего или попробовать удалить с сайта, либо закрыть в robots.txt. Вариант с robots.txt будет лучше и эффективнее.
    Если Вы с мусорных страниц сделаете 301 редирект, то ситуация на сайте может ухудшиться.
    Вы же в robots.txt можете их полностью закрыть

    Disallow: */article_list/*
    Disallow: */search
    Disallow: */infoto
    Disallow: */author

    И т.д.

    После того как закроете в robots.txt, можете немного почистить индекс и руками страницы по удалять в гугл вебмастере (Вкладка — Индекс Google -> Удалить URL адреса).

  8. Дмитрий:

    Я понял теперь. Просто я думал, что robots.txt — это всего лишь рекомендация для поисковика и ждать изменений на сайте придется долго.
    В роботсе прописано
    Disallow: /*;search
    Но в индекс страницы все же попали.
    Спасибо за ответы.

  9. Bolek:

    В Гугл вебмастере смотрите корректность файла robots.txt. Последнее время есть не большие проблемы с роботсом, приходится немного с ним повозится

Добавить комментарий

Уважаемые пользователи!


Администрация сайта проверяет все комментарии на наличие спама и оскорблений в адрес других людей. Если в оставленном Вами комментарии будут обнаружены выше перечисленные нарушения, администрация сайта может наложить на Вас санкции или забанить без предупреждения!


С уважением, Администрация сайта.


Ваш e-mail не будет опубликован. Обязательные поля помечены *

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>



Связаться с нами

Если у Вас возникли какие либо вопросы, предложения и пожелания для развития нашего ресурса, связаться с нами Вы можете по e-mail: loleknbolek.com@gmail.com, или заполните форму что находиться ниже.

Пишите мы будем рады Вам ответить!