Продвигаем бизнес в Интернете с 2001 года

Как SEO-тексты влияют на позиции сайта на самом деле?

Большинство интернет-магазинов в обязательном порядке размещают seo-тексты, созданные специально для поисковиков. Нужны ли они на сайте? Ценят ли их Google и Яндекс и как именно? Разобрался Михаил Волович, руководитель «Лаборатории поисковой аналитики».

Последнее обновление: 21 мая 2024 года
19256

Предлагаем вашему вниманию расшифровку его доклада «SEO-тексты глазами Яндекса, Google и "Тургенева"» на конференции Optimization 2018.

Как мы анализируем данные

В нашей «Лаборатории поисковой аналитики» мы постоянно исследуем результаты поисковой выдачи в Яндексе, Google, Mail.ru по коммерческим запросам. Выдачу можно сравнивать по разным параметрам; сейчас их количество перевалило за 600. Анализируем всё: коммерческие параметры, ссылочные, текстовые, трафиковые, поведенческие, технические.

Для каждого из трех поисковиков (Яндекс, Google, Mail.ru) проверяем:

  • есть ли статистически значимая связь между значением параметра и попаданием в топ-30;

  • есть ли корреляция с позицией внутри топ-30.

В 2017 и 2018 году выходили подробные аналитические отчеты. Отчет по факторам ранжирования за 2023 год выложен на наш сайт.

В этом докладе остановимся на текстовых параметрах и их значении для раскрутки сайтов.


Доставляем экспертный контент

Отправляем полезные статьи, советы наших специалистов, приглашаем
на отраслевые мероприятия.
Подпишитесь, чтобы первыми узнавать об эффективных методах продвижения
вашего бизнеса!

Нажимая на кнопку «Подписаться», я даю согласие на обработку персональных данных
и соглашаюсь c политикой конфиденциальности

Спасибо за подписку!

Мы отправили вам проверочное письмо — пожалуйста, подтвердите адрес электронной почты, перейдя по ссылке внутри письма.

Произошла ошибка

Пожалуйста, попробуйте еще раз

Типичный текстовый параметр

Типичный текстовый параметр.png

Посмотрим на примере конкретного параметра — количество вхождений слов запроса и их синонимов в текст найденной страницы.

Слова запроса и синонимы.png

Влияние этого параметра очень высоко. На верхней диаграмме указаны значения слева для Google, справа для Яндекса. Верхняя линейка — топ-3, дальше топ-30, самая нижняя — «фон» (то, что попало в топ в других поисковиках, а в этом нет).

Видно, что из слов запроса и синонимов в сумме набирается где-то 30-40 запросов. Считается это так. Если запрос из трех слов, то, в зависимости от частотности этих слов, кому-то из них дается вес, например, 0,4, кому-то — 0,2. Дальше каждое вхождение слова или его синонима мы засчитываем за тот вес, который ему приписан. В сумме набирается на 30-40 запросов. Это на самом деле очень много. И если мы возьмем другие параметры, то тоже цифры окажутся большими.

На оранжевых диаграммах внизу — средние значения по позициям на нашей стандартной выборке, которая ничем особо не хороша, кроме того, что мы за ней наблюдаем уже почти четыре года.

Слева Google. Видно, какая сильная корреляция с позицией. Значение корреляции (это ранговый критерий Спирмена) выписано у треугольничка на верхней диаграмме — в данном случае это значение 0,22 (и это очень много). Но при этом в Google средние значения меньше, чем в Яндексе, у которого есть статически значимая связь с попаданием в топ-30 и есть небольшая корреляция с позицией, гораздо более слабая. И мы считаем, что в данном случае вероятное влияние на попадание в топ в Яндексе важнее, чем влияние на позицию в Google.

Принцип антибуквализма

Принцип антибуквализма.png

Как устроено ранжирование по разным параметрам и по разным зонам страницы? Главная вещь, которую про это можно сказать, можно назвать принципом антибуквализма.

Прошли те времена, когда нужно было, чтобы ключевик в точной форме определенное количество раз встретился в тексте. На самом деле, он всё равно встречается довольно часто — у нас получается где-то 3-4 раза на страницу. Но при этом корреляции слабые. Два перечеркнутых треугольника — это отсутствие корреляции.

Видно, что в Яндексе корреляции начинают возникать при подъеме по этой лестнице из параметров, а внизу их просто нет. В Google корреляции при подъеме по лестнице усиливаются. И точно так же в какой-то момент в Яндексе начинает возникать связь с попаданием в топ-30, а для нижних параметров ее нет.

Кроме того, важны не только и часто не столько слова запроса, но и другие слова, которых в запросе нет. Мы смотрим на две группы слов — это синонимы слов запроса и слова, которые выделяют в сниппетах Яндекс и Google. И часто оказывается, что попадание этих слов, которых в запросе нет, важнее, чем попадание самих слов запроса.

Можно предположить, что, кроме этого, важны еще какие-то другие слова, но на это нет параметров.

Посмотрим, что получилось в Google:

Google сводная таблица.jpg

Буквами «Т» здесь обозначена связь с попаданием в топ, буквами «П» — корреляция с позицией. Есть четыре градации для каждого случая. Две буквы «П» — сильная корреляция, одна большая буква — средняя, маленькая буква — слабая. А бледная маленькая буква означает, на нашей, относительно небольшой, выборке корреляции не видно, но она видна на больших выборках. Группа параметров, которую мы смотрели, выделена полужирным — это вхождения в текст страницы.

Сводная таблица для Яндекса:

Яндекс сводная таблица.png

Что здесь важно? Для Google в основном видны буквы «П», для Яндекса — «Т». Грубо говоря, это означает, что в Яндексе текстовое ранжирование происходит в основном при предварительном отборе, когда выбираются, например, 1000 страниц для дальнейшего подробного ранжирования. И гораздо меньше влияет на позицию при окончательном выборе, кого показать выше, кого ниже. А в Google какие-то из текстовых факторов в полный рост влияют на окончательное ранжирование. И меньше влияют на предварительном этапе, если вообще влияют. И на той, и на другой картинке принцип антибуквализма очень ярко проявляется — справа налево заметно усиливается «густота» букв.

Есть одно важное исключение из этого принципа. В Google точный запрос без форм, прямо в его исходном виде, оказывается очень важным (потому что буква «Т» вообще важнее, чем буква «П») в title. И в меньшей степени в H1 и в description. Это надо учитывать.

Оказывается довольно маловажен в Яндексе заголовок H1, как и H2–H4. И title тоже неубедительный. Про keywords видно, что они, скорее всего, просто не работают.

Еще бывают попадания слов запроса в доменное имя и в URL.


Домен и URL

Домен и URL.png

Домен важен в обоих поисковиках. URL не смотрится убедительно в Google, но это может быть из-за того, что Яндексе он важнее. То есть, может быть, он влияет на попадание в топ как-то, но в Яндексе «человекопонятные» URL крайне важны. И там в основном буквы «Т». То есть они важны на предварительном отборе.

И обратите внимание на высокие цифры. В части адреса после домена в среднем набирается вхождений слов на треть запроса. На самом деле, этого очень много.

Вторая вещь, которую обязательно надо учитывать — важна не только страница, на которую мы смотрим, но и весь сайт.


Подсайт и сайт

Подсайт и сайт.png

Очень важный параметр и с очень большими значениями — верхняя строчка — это сколько страниц найдено с сайта, релевантных запросу. Важно, сколько внутренних ссылок на сайте — без привязки к текстам. Выигрывают те страницы, на которых их много. И слов запроса во внутренних ссылках тоже очень много. И то, что у вхождений в элементы списка (li) высокая значимость, это тоже, скорее всего, про это.

SEO-тексты

Приведем пример типичного seo-текста в интернет-магазине.

А что с SEO-текстами.png

Что об этом можно сказать? Когда мы делали сервис «Тургенев» для проверки текста на риск «Баден-Бадена», мы продумали много разных параметров о текстовой спамности и качестве текста. Мы их делали для себя, чтобы научиться оценивать качество текстов.

Выяснилось, что они неплохо цепляют какие-то тонкие струны души поисковиков.

По тургеневским местам.png

По многим из них оказываются видны или корреляции с позицией, или связь с попаданием в топ. Особенно порадовала выделенная жирным в четвертой строчке снизу очень сильная связь с параметром плотности стилистических проблем в тексте.

Как это делалось? Брали большой словарь разных стилистических ошибок и смотрели, какое количество текста ими покрыто. Выяснилось, что Яндекс к этому неравнодушен (что очень приятно). Вторая вещь, которая очень порадовала — цифра 7,91 в верхней строке. Мы прикинули, от какого значения начинаются совсем плохие тексты после того, как мы им поставили баллы. Поставили порог сильного риска «Баден-Бадена» — 8. В среднем в Яндексе сейчас получается 7,91.

Теперь та таблица, которую мы уже видели, с двумя лишними строчками. Одна — SEO-текст, другая — текст за вычетом SEO-текста.

В Google:

Google сильнее текста.jpg

Что мы видим? В Google основной блок с seo-текстом ранжируется сильнее, чем собственно текст. Буквы «П» гуще, где-то буквы «Т» появляются. А если его вычесть, получается немного пожиже, хотя и не сильно.

В Яндексе иначе:

В Яндексе — прочерки. Ни корреляции с позицией, ни связи с попаданием в топ не видно. А вот если вычесть блок seo-текста, то получается лучше, чем просто текст.

Похоже, что действительно, прежде чем запускать «Баден-Баден», Яндекс научился выделять текстовый блок и игнорировать его.  И когда вы заказываете копирайтеру seo-текст, он на позиции в Google влияет, а на попадание в топ Яндекса — практически нет.



Немного про «Тургенева»

Это наш сервис, который оценивает риск «Баден-Бадена». Рассмотрим в нем текст про кофе.

Тексты глазами Тургенева.png

В этом тексте риск 19 баллов, это очень много. Проблемы с повторами, стилистикой и запросами.

Начнем с повторов.

Повторы.jpg

В тексте нет «сверхчастых» слов, но очень много повторов, таких, которые влияют на метрику «академическая тошнота». Это плохо.

Есть большие проблемы со стилистикой.

Стилистика.jpg

Много слов и выражений, которые либо вообще плохи (например, «вкусовые качества», «вы можете быть уверены, что приобретаете») или просто часто встречаются в не очень хороших текстах.

Есть проблемы с запросами.

Запросы.jpg

В «Тургеневе» эта вкладка умеет конструировать и длинные запросы из ядер и модификаторов, подключая частые словосочетания из текста. Здесь текст оказался покрыт длинными запросами, за что и получил баллы. Все эти ошибки нужно исправлять.


Кейс Balcon-msk.ru

Ласковые ураганы Яндекса.png

Это написал человек, которому действительно удалось почти невозможное. Сейчас средний возраст сайта в результатах поиска Яндекса — то ли девять, то ли десять лет. И за последний год этот средний возраст увеличился на полтора года! То есть обновление результатов поиска идет за счет более старых, крупных, заслуженных сайтов. Новому сайту пролезть в выдачу очень тяжело. Сайтов моложе четырех лет в выдаче примерно столько же, сколько сайтов старше пятнадцати. Тем не менее, им удалось.

Посмотрим, как устроен этот сайт, за счет чего у них это получилось.

Как это сделано.jpg

Внизу примеры карточек товаров. Они разнообразны, но в них поместилась вся нужная лексика.

Домен — один из ключевых факторов. Там указано и главное ключевое слово, и регион. Это знак для Яндекса подкинуть сайт в «многорукого бандита», а дальше срабатывают уже поведенческие факторы.

В разделе «Специалисты» есть недоработки, но это уже ни на что не повлияло.

Результат.jpg

О seo-текстах рассказал Михаил Волович, руководитель «Лаборатории поисковой аналитики» на нашей конференции Optimization в своем докладе «SEO-тексты глазами Яндекса, Google и «Тургенева». Презентация доклада — на сайте конференции.
Михаил Волович
Лого АиП
Михаил Волович
Руководитель Лаборатории поисковой аналитикиЭксперт
Лаборатория поисковой аналитики регулярно оценивает, какие параметры сайта могут влиять на ранжирование и насколько сильно. Даем практические рекомендации и выясняем, что именно нужно делать на сайте.

Вам будет интересно

Хотите обсудить ваш проект?
Напишите нам о своих бизнес-задачах, и мы предложим проверенные решения.