SEO	– Читать 13 минут

Все, что вы хотели знать об инструменте Serpstat «Текстовая аналитика»

Фото Инны Arsa, главного редактора в Serpstat

Инна Arsa

Главный редактор в Serpstat

Надеюсь, у вас было достаточно времени, чтобы прочитать пост об инструменте кластеризации ключевых слов. Данная статья будет посвящена второй части этого инструмента — текстовой аналитике.

Читайте внимательно, чтобы ничего не упустить.
Или можете все узнать из этого видео:

Содержание

1. Что такое текстовая аналитика и зачем она нужна?
2. В чем основная трудность любой текстовой аналитики?
3. Каковы преимущества нашего алгоритма?
4. Как работает текстовая аналитика в Serpstat?
5. Как настроить текстовую аналитику?
6. Что вы получаете в отчете по текстовой аналитике?

Что такое текстовая аналитика и зачем она нужна?

Текстовая аналитика — это инструмент, который поможет оптимизировать текст на страницах вашего сайта. Ни для кого не секрет, что одним из важнейших показателей ранжирования является текст. Именно на оптимизацию этого фактора направлен наш инструмент.

Предположим, что ваша целевая страница не находится в топе по необходимым ключевикам. В таком случае имеет смысл изменить содержание страницы, чтобы повысить ее релевантность заданным поисковым запросам. Цель нашей текстовой аналитики — создать рекомендательную базу по оптимизации контента на вашей странице.

Ее можете использовать для решения основных задач:

1. генераций заданий для копирайтеров на основе анализа текстов конкурентов, находящихся в топ-15;
2. анализа текстового фактора ранжирования вашей страницы и расширения семантического ядра;
3. анализа важных слов в тематике и получения списка LSI-слов (слов, определяющих тематику).

Как вы уже наверняка догадались, инструменты «Кластеризация» и «Текстовая аналитика» связаны между собой. Кластеризация нужна для того чтобы выбрать ключи, которые можно разместить на одной странице. Текстовая аналитика — чтобы их проанализировать. Кластеризация помогает не только разбить фразы на группы, но и автоматически назначить страницу (url) вашего домена к кластеру, чтобы потом провести по ней текстовую аналитику.

Это мощная связка, позволяющая автоматизировать весь процесс работы с ключевиками.

В чем основная трудность любой текстовой аналитики?

Очевидный факт для всех, кто занимается SEO-анализом страницы — если страница попала в топ по запросу, то, значит, ее содержимое воспринимается поисковым алгоритмом, как релевантное запросу, и поисковик поставил ее на высокую позицию. Поэтому так важен SEO - аудит сайта.

И как следствие мы получим то, что страницы попавшие в топ по запросу содержат в себе те признаки, которые «привели» их в этот топ.

То есть достаточно исследовать конкурентов с помощью поисковой аналитики и сравнить их с целевой страницей, чтобы получить все необходимые рекомендации по семантике? Но не все так просто.

Проблема в том, что мало кто знает, на основе каких URL-ов нужно давать рекомендацию. Ведь наша целевая страница может быть информационной, а в выдаче будут попадаться коммерческие запросы. Или же наоборот. В выдаче могут быть видео, нужно ли учитывать их? А может наш целевой урл это видео, и нам нужна рекомендация на основе текстов и описаний именно других роликов. А что, если мы не очень хорошо разбираемся в предметной области, и неверно указали некоторые ключевики, тем самым внося шум.

Мы постарались решить эти проблемы.

Каковы преимущества нашего алгоритма?

Мы тщательно отбираем тематику страниц, на основе которых строится рекомендательная база текстовой аналитики. Другие же сервисы собирают слова из всех тематических групп сразу, не фильтруя их при этом.

Так например, для продвижения страницы по доставке продуктов на дом Serpstat предложит только слова, которые логически связаны с доставкой еды. Другие сервисы могут предложить вам внести в текст ключевые фразы из другой ниши. В продукты они могут порекомендовать добавить и антивирус Касперского и разные SaaS-ы, которые будут в поисковой выдаче под словом "продукт".

Качественно подбираем слова для рекомендательной базы, используя собственный алгоритм, который вытаскивает только значимые слова для тематики. У нас вы не найдете в рекомендациях добавить предлоги, союзы и прочий нерелевантный мусор, как это делают другие инструменты.

Мы не советуем конкретное количество употребления слов и их словоформ, мы анализируем лексему целиком. Контролируем переспам текста и советуем сократить частоту одного и того же слова в тексте.

Мы не советуем конкретную длину текста, мы рекомендуем приемлемый диапазон длин. Анализируем текст полностью и находим отсутствующие слова в тексте, которые есть у конкурентов в топе и которые влияют на ранжирование.

Мы показываем релевантность поисковых запросов к вашему тексту не в сухих числах, а используем визуализацию, которая показывает в каком диапазоне релевантности конкурентов находится ваш текст.

Дальше — подробности.

Как повысить текстовую релевантность страниц сайта: инструмент Serpstat «Текстовая Аналитика»

Кластеризовали, кластеризовали, и наконец выкластеризовали: как работает инструмент «Кластеризация ключевых слов»

Как работает текстовая аналитика в Serpstat?

Упрощенно текстовая аналитика в Serpstat работает следующим образом:

1. Разделяет топы URL-ов в выдаче по заданным поисковым запросам на группы, например: видеозаписи, информационные статьи, каталоги, коммерческие страницы и т.д и определяет к какой группе из них наиболее близок целевой URL.

Фильтрация происходит даже для учета страниц, содержащих видео. Если среди указанных поисковых запросов попадаются фразы, не совсем релевантные тематике, они никак не повлияют на результаты текстовой аналитики. Чтобы избежать рекомендаций, основанных на нерелевантных предметах, Serpstat делит страницы ваших конкурентов на семантические группы. Такой алгоритм предоставляет более точную рекомендательную базу.

ТА проводится на основе страницы сайта (если указан URL), списка ключевых фраз из кластера, для которых оптимизируется эта страница, и топ-15 страниц, показывающихся в результатах поисковой системы (далее ПС) по анализируемым фразам.

Возьмем, например, ключевое слово «продукт». Вот так выглядит поисковая выдача Google по этому запросу:

По одному общему запросу поисковые системы показывают, как информационную, так и коммерческую выдачу

Как видите, Google предлагает как страницы о пищевых продуктах, так и о SaaS-продуктах. Мы делим эти результаты на две группы и даем рекомендации на основе тех URL, которые вы добавили. Соответственно, если ваша страница посвящена только SaaS-продуктам, мы исключим из отчета нерелевантные результаты по страницам из пищевых продуктов.

Если вы не добавите при настройках целевую страницу, то рекомендации будут строиться на результатах анализа самой крупной группы конкурентов по фразе.То же самое работает с коммерческими и информационными запросами. Если вы введете macbook в Google, то получите:

Пример смешанной выдачи по запросу MacBook

Результаты содержат как информационные страницы, так и коммерческие.

Если вас интересует покупка макбуков, Serpstat проанализирует содержимое вашей страницы, отбросит нерелевантных информационных конкурентов и даст рекомендации на основе анализа коммерческих.

2. На основе анализа других страниц в этой группе дает рекомендации по улучшению текстовой составляющей нашей страницы и увеличения релевантности страницы по отношению к фразам.

На этом этапе мы настраиваем список ключевых слов для каждой области страницы: Title, H1 и Body. Список ключевых слов формируется с помощью трехуровневой метрики «TF-IDF-CDF» (term frequency, inverse document frequency, cluster's document frequency). Ее мы применяем для ранжирования слов, определяющих тематику для целого кластера.

Она:

учитывает количество вхождений ключа в текст (TF);
контролирует малоинформативные слова — слова встречающиеся в большом проценте текстов, стоп-слова (IDF);
находит самые значимые для каждого кластера слова — LSI-слова(СDF).

Иллюстрация к текстовой аналитике книги Мастер и Маргарита

Следующий пример показывает применение алгоритма к тексту "Мастера и Маргариты".

Теги всего текста:

маргарита — 0.011
воланд — 0.008
коровьев — 0.008
прокуратор — 0.008
азазелло — 0.005
пилат — 0.005
кот — 0.004
варенуха — 0.004
берлиоз — 0.004
иешуа — 0.004
мастер — 0.003

Как видите, результат показал нам действительно ключевые фразы текста. Наименее частотных в перечне нет. Кроме того, слова, которые чаще всего используются в лексиконе языка, но действительно имеющие мало значения для книги, в списке не присутствуют.

Хотите узнать, как Serpstat может помочь в достижении целей вашего бизнеса?

Оставляйте заявку и наши специалисты проконсультируют вас по развитию вашего проекта, поделятся обучающими материалами, а также предложат тестовый доступ к Serpstat!

Заказать бесплатную консультацию

Как настроить текстовую аналитику?

Если вы уже забыли, то напомню, текстовая аналитика проводится:

на основе целевой страницы (если при настройке указан URL);
списка ключевых фраз из кластера, для которых оптимизируется наша страница.

В случае если указана целевая страница, анализируется весь текстовый контент вашей страницы и даются рекомендации по использованию различных фраз, исходя из контента конкурентов по фразе из топ-15.

Если не указана целевая страница, то наши рекомендации будут строиться исходя из анализа самой крупной группы конкурентов по фразе. При этом некоторые отчеты, например, оптимизированность страницы для ключевой фразы в сравнении с конкурентами, будут отсутствовать.

Поэтому для того, чтобы провести текстовую аналитику, сначала нужно сгруппировать фразы с помощью кластеризации. Как настроить фразы для кластеризации читайте в этом фрагменте нашей предыдущей статьи.

Итак, у вас завершенный проект кластеризации ключевых фраз. Что делать дальше?

Перейдите в проект кластеризации ключевых слов и выберите кластер, для которого хотите выполнить анализ текста. Затем нажмите «ТА» (Начать текстовую аналитику) → «Начать анализ» в верхнем правом углу.

Настройка текстовой аналитики в Serpstat

Если вы укажете свой домен при запуске кластеризации ключевых слов, мы выберем наиболее подходящий URL-адрес и подключим его к кластеру. Если вы упустите этот шаг, ни в одном из кластеров не будет рекомендованных URL-ов. Если хотите, можете добавить или изменить URL-адрес для конкретного кластера перед началом анализа текста. Если у вас нет сайта, и ваша цель — настроить контент для предстоящего домена, оставьте, как есть.

Если хотите провести текстовую аналитику для всех кластеров нажмите на кнопку справа «Текстовая аналитика» и всплывет окошко:

Сортировка кластеров для текстовой аналитики по запросу микроволновая печь

Нажмите «Выбрать все» или выделите конкретные кластеры, для которых хотите провести кластеризацию.

По завершении анализа нажмите «Просмотреть результаты».

Просмотр результатов по текстовой аналитике

Как Serpstat экономит время
SEO-специалистов — опыт Ingate

Как с помощью Кластеризации и Текстовой аналитики выйти в топ-3, уделив всего 2 часа — опыт Kazconference.kz

Что вы получаете в отчете по Текстовой аналитике?

Если вы следовали всем моим инструкциям, вскоре увидите страницу со следующими отчетами:

Список ключевых слов из этого кластера с показателями «Коэффициент штиля» и «релевантность».

Коэффициент штиля — показатель семантической близости фразы к тематике кластера по шкале от нуля до 100 процентов.

Релевантность — показатель соответствия страницы к ключевой фразе по сравнению с конкурентами. Наведите курсор на цветную полоску и увидите минимальный, средний и максимальный показатели релевантности среди группы страниц-конкурентов по данной фразе, а также релевантность вашей страницы.

Релевантность ключевиков в тексте и коэффициент штиля в тексте

Затем идет список рекомендуемых ключевых слов для всех областей вашего текста: Title и H1. Рядом с каждым ключевым словом вы увидите его показатели — значимость, популярность и покрытие.

Рекомендуемые слова — список слов, которые желательно включить в соответствующий элемент страницы, если в колонке «Покрытие» указано отсутствие cлова в Title вашей страницы. Мы приводим лемматизированные слова, но вы можете использовать рекомендованные слова в любой подходящей форме.

Значимость — это значимость слова для Title в рамках анализируемой группы страниц. Рассчитывается как соотношение данного слова к набору ("мешку", стат.) слов, используемых в title конкурентов.

Популярность — процент страниц-конкурентов из группы анализируемых URL, в Title которых встречается данное слово.

Покрытие — колонка может иметь три значения:

Включено — слово присутствует в Title целевой страницы.
Не включено — слово отсутствует в Title ключевой страницы.
Переспам — слово слишком часто употребляется в Title по сравнению с конкурентами; рассмотрите возможность уменьшения количества вхождений данного слово в Title целевой страницы.

Если целевой URL не указан, мы покажем употребление слова в лемматизированной форме в процентах по отношению к общему количеству уникальных слов, полученных из Title группы страниц-конкурентов по фразам из кластера. Такая функция будет полезна при написании статьи или подготовке технического задания для копирайтера.

Ключевые слова, которые должны входить в Title и H1

Последний фрагмент отчета посвящен Body целевой страницы, он разделен на две части.

Первая из них похожа на отчет Title / H1:

Список ключевых слов для Body текста, отсортированные по популярности и покрытию

Во второй части вы найдете анализ объема текста — алгоритм приводит минимальное, максимальное и оптимальное количество слов в Body на основе анализа соответствующих областей страниц конкурентов. А также дает рекомендации по увеличению или уменьшению объема текста.

Рекомендации по количеству слов в Body текста со списком возможных слов, минимальным и максимальным числом

Вот и все! Попробуйте наши новые инструменты прямо сейчас;) Задавайте вопросы в комментариях или пишите в техподдержку.:) А также вступайте в чат любителей Серпстатить и подписывайтесь на наш канал в Telegram.

Потестить текстовую аналитику

Serpstat — набор инструментов для поискового маркетинга!

Находите ключевые фразы и площадки для обратных ссылок, анализируйте SEO-стратегии конкурентов, ежедневно отслеживайте позиции в выдаче, исправляйте SEO-ошибки и управляйте SEO-командами.

Набор инструментов для экономии времени на выполнение SEO-задач.

7 дней бесплатно

Оцените статью по 5-бальной шкале

4.5 из 5 на основе 20 оценок

Нашли ошибку? Выделите её и нажмите Ctrl + Enter, чтобы сообщить нам.

Используйте лучшие SEO инструменты

Проверка обратных ссылок

Быстрая проверка обратных ссылок вашего сайта и конкурентов

API для SEO

Получите быстро большие объемы данных используя SЕО API

Анализ конкурентов

Сделайте полный анализ сайтов конкурентов для SEO и PPC

Мониторинг позиций

Отслеживайте изменение ранжирования запросов используя мониторинг позиций ключей