Все, что вы хотели знать об инструменте Serpstat «Текстовая аналитика»
Читайте внимательно, чтобы ничего не упустить.
Или можете все узнать из этого видео:
Что такое текстовая аналитика и зачем она нужна?
Предположим, что ваша целевая страница не находится в топе по необходимым ключевикам. В таком случае имеет смысл изменить содержание страницы, чтобы повысить ее релевантность заданным поисковым запросам. Цель нашей текстовой аналитики — создать рекомендательную базу по оптимизации контента на вашей странице.
Ее можете использовать для решения основных задач:
1. генераций заданий для копирайтеров на основе анализа текстов конкурентов, находящихся в топ-15;
2. анализа текстового фактора ранжирования вашей страницы и расширения семантического ядра;
3. анализа важных слов в тематике и получения списка LSI-слов (слов, определяющих тематику).
Как вы уже наверняка догадались, инструменты «Кластеризация» и «Текстовая аналитика» связаны между собой. Кластеризация нужна для того чтобы выбрать ключи, которые можно разместить на одной странице. Текстовая аналитика — чтобы их проанализировать. Кластеризация помогает не только разбить фразы на группы, но и автоматически назначить страницу (url) вашего домена к кластеру, чтобы потом провести по ней текстовую аналитику.
Это мощная связка, позволяющая автоматизировать весь процесс работы с ключевиками.
В чем основная трудность любой текстовой аналитики?
И как следствие мы получим то, что страницы попавшие в топ по запросу содержат в себе те признаки, которые «привели» их в этот топ.
То есть достаточно исследовать конкурентов с помощью поисковой аналитики и сравнить их с целевой страницей, чтобы получить все необходимые рекомендации по семантике? Но не все так просто.
Проблема в том, что мало кто знает, на основе каких URL-ов нужно давать рекомендацию. Ведь наша целевая страница может быть информационной, а в выдаче будут попадаться коммерческие запросы. Или же наоборот. В выдаче могут быть видео, нужно ли учитывать их? А может наш целевой урл это видео, и нам нужна рекомендация на основе текстов и описаний именно других роликов. А что, если мы не очень хорошо разбираемся в предметной области, и неверно указали некоторые ключевики, тем самым внося шум.
Мы постарались решить эти проблемы.
Каковы преимущества нашего алгоритма?
Так например, для продвижения страницы по доставке продуктов на дом Serpstat предложит только слова, которые логически связаны с доставкой еды. Другие сервисы могут предложить вам внести в текст ключевые фразы из другой ниши. В продукты они могут порекомендовать добавить и антивирус Касперского и разные SaaS-ы, которые будут в поисковой выдаче под словом "продукт".
Как работает текстовая аналитика в Serpstat?
1. Разделяет топы URL-ов в выдаче по заданным поисковым запросам на группы, например: видеозаписи, информационные статьи, каталоги, коммерческие страницы и т.д и определяет к какой группе из них наиболее близок целевой URL.
Фильтрация происходит даже для учета страниц, содержащих видео. Если среди указанных поисковых запросов попадаются фразы, не совсем релевантные тематике, они никак не повлияют на результаты текстовой аналитики. Чтобы избежать рекомендаций, основанных на нерелевантных предметах, Serpstat делит страницы ваших конкурентов на семантические группы. Такой алгоритм предоставляет более точную рекомендательную базу.
Если вы не добавите при настройках целевую страницу, то рекомендации будут строиться на результатах анализа самой крупной группы конкурентов по фразе.То же самое работает с коммерческими и информационными запросами. Если вы введете macbook в Google, то получите:
Если вас интересует покупка макбуков, Serpstat проанализирует содержимое вашей страницы, отбросит нерелевантных информационных конкурентов и даст рекомендации на основе анализа коммерческих.
2. На основе анализа других страниц в этой группе дает рекомендации по улучшению текстовой составляющей нашей страницы и увеличения релевантности страницы по отношению к фразам.
На этом этапе мы настраиваем список ключевых слов для каждой области страницы: Title, H1 и Body. Список ключевых слов формируется с помощью трехуровневой метрики «TF-IDF-CDF» (term frequency, inverse document frequency, cluster's document frequency). Ее мы применяем для ранжирования слов, определяющих тематику для целого кластера.
Она:
- учитывает количество вхождений ключа в текст (TF);
- контролирует малоинформативные слова — слова встречающиеся в большом проценте текстов, стоп-слова (IDF);
- находит самые значимые для каждого кластера слова — LSI-слова(СDF).
Теги всего текста:
маргарита — 0.011
воланд — 0.008
коровьев — 0.008
прокуратор — 0.008
азазелло — 0.005
пилат — 0.005
кот — 0.004
варенуха — 0.004
берлиоз — 0.004
иешуа — 0.004
мастер — 0.003
Как видите, результат показал нам действительно ключевые фразы текста. Наименее частотных в перечне нет. Кроме того, слова, которые чаще всего используются в лексиконе языка, но действительно имеющие мало значения для книги, в списке не присутствуют.
Как настроить текстовую аналитику?
- на основе целевой страницы (если при настройке указан URL);
- списка ключевых фраз из кластера, для которых оптимизируется наша страница.
Если не указана целевая страница, то наши рекомендации будут строиться исходя из анализа самой крупной группы конкурентов по фразе. При этом некоторые отчеты, например, оптимизированность страницы для ключевой фразы в сравнении с конкурентами, будут отсутствовать.
Поэтому для того, чтобы провести текстовую аналитику, сначала нужно сгруппировать фразы с помощью кластеризации. Как настроить фразы для кластеризации читайте в этом фрагменте нашей предыдущей статьи.
Итак, у вас завершенный проект кластеризации ключевых фраз. Что делать дальше?
Перейдите в проект кластеризации ключевых слов и выберите кластер, для которого хотите выполнить анализ текста. Затем нажмите «ТА» (Начать текстовую аналитику) → «Начать анализ» в верхнем правом углу.
Если хотите провести текстовую аналитику для всех кластеров нажмите на кнопку справа «Текстовая аналитика» и всплывет окошко:
По завершении анализа нажмите «Просмотреть результаты».
Что вы получаете в отчете по Текстовой аналитике?
Релевантность — показатель соответствия страницы к ключевой фразе по сравнению с конкурентами. Наведите курсор на цветную полоску и увидите минимальный, средний и максимальный показатели релевантности среди группы страниц-конкурентов по данной фразе, а также релевантность вашей страницы.
Значимость — это значимость слова для Title в рамках анализируемой группы страниц. Рассчитывается как соотношение данного слова к набору ("мешку", стат.) слов, используемых в title конкурентов.
Популярность — процент страниц-конкурентов из группы анализируемых URL, в Title которых встречается данное слово.
Покрытие — колонка может иметь три значения:
- Включено — слово присутствует в Title целевой страницы.
- Не включено — слово отсутствует в Title ключевой страницы.
- Переспам — слово слишком часто употребляется в Title по сравнению с конкурентами; рассмотрите возможность уменьшения количества вхождений данного слово в Title целевой страницы.
Первая из них похожа на отчет Title / H1:
Serpstat — набор инструментов для поискового маркетинга!
Находите ключевые фразы и площадки для обратных ссылок, анализируйте SEO-стратегии конкурентов, ежедневно отслеживайте позиции в выдаче, исправляйте SEO-ошибки и управляйте SEO-командами.
Набор инструментов для экономии времени на выполнение SEO-задач.
Используйте лучшие SEO инструменты
Проверка обратных ссылок
Быстрая проверка обратных ссылок вашего сайта и конкурентов
API для SEO
Получите быстро большие объемы данных используя SЕО API
Анализ конкурентов
Сделайте полный анализ сайтов конкурентов для SEO и PPC
Мониторинг позиций
Отслеживайте изменение ранжирования запросов используя мониторинг позиций ключей
Рекомендуемые статьи
Кейсы, лайфхаки, исследования и полезные статьи
Не успеваешь следить за новостями? Не беда! Наш любимый редактор подберет материалы, которые точно помогут в работе. Только полезные статьи, реальные кейсы и новости Serpstat раз в неделю. Присоединяйся к уютному комьюнити :)
Нажимая кнопку, ты соглашаешься с нашей политикой конфиденциальности.