LSI-фразы: что это такое и как их собрать

Нет комментариев

Делюсь самым эффективным алгоритмом поиска LSI-фраз, которые постоянно использую в работе. В итоге вы тоже научитесь за полчаса вычислять необходимое количество LSI и находить нужные.

Что такое LSI-копирайтинг

«Пишите для людей», – говорят они. Как поисковику дать понять, что содержание мой страницы удовлетворяет желания пользователей? Эту задачу выполняет LSI-копирайтинг.

LSI-копирайтинг («латентное семантическое индексирование») – это механика, которая помогает повысить релевантность веб-страницы с помощью поисковых фраз.

Если пользователь вводит в поисковик фразу «консультация гинеколога», он, как минимум, хочет увидеть информацию о ценах, задать уточняющий вопрос и заполнить форму записи. То есть фразы «гинеколог задать вопрос», «гинеколог цены», «запись к гинекологу» и «гинеколог онлайн» являются синонимами запроса.

LSI-фразы: что это такое и как их собрать

Поисковик запоминает, на каких страницах пользователи задерживаются дольше и, отталкиваясь контента этих страниц, составляет список LSI-фраз. Далее при поиске он использует уже не только конкретный запрос, но и LSI-фразы.

Поисковик классифицирует страницу как коммерческую или информационную, отталкиваясь в том числе от LSI.

Сложно продвигать коммерческую страницу, если ее текстовый контент изобилует фразами, присущими информационному запросу, и наоборот. То есть LSI важен для правильной классификации страницы.

Один и тот же пользователь на разных сервисах пишет разные запросы, соответствующие одному и тому же интенту. То есть вводит разные запросы в поисковике, YouTube и TikTok, хотя хочет получить один и тот же результат. При наличии доступа к данным разных сервисов можно собрать более обширную базу LSI-фраз.

Ранжирование документов с LSI-оптимизацией и без

Между внутренними страницами сайта и внешними документами рассчитывается связь. Она похожа на связь при перелинковке и получении ссылок с других доменов, но только состоит из слов. Чем сильнее связь, тем лучше ранжируется страница. Напрямую об этом говорит патент Google (ранжирование документов с использованием словесных связей). Чем обширнее представлена LSI-семантика в документе и на сайте целиком, тем проще продвигать страницы.

Без применения LSI в конкурентных сферах делать нечего: поисковик воспримет контент сайта как недостаточно качественный, то есть неудовлетворяющий запросы.

##READMORE_BLOCK_91855##

Откуда взять LSI-семантику

Проблема 1. Как придумать синонимы и связанные фразы? Можно использовать мозговой штурм и сбор поисковых подсказок. В таком случае появляется другая проблема.

Проблема 2. Как понять, какие LSI-фразы из полученного массива имеют наибольшее значениее для поисковика?

Есть простой способ решить обе проблемы.

Шаг 1. Сбор маркерных запросов

Маркерные запросы – это костяк семантического ядра. Например, для коммерческого сайта по продаже кирпичей – «купить кирпичи», «кирпичи с доставкой» и т. д.

Маркерные запросы невозможно сократить. Если из фразы «купить кирпичи» удалить одно из слов, оставшееся не будет запросом. Купить можно что угодно, а кирпич сам по себе не коммерческий. Это может быть фото кирпича или самостоятельное изготовление кирпича.

Базовая частотность – это сколько раз встречается фраза «купить кирпичи» во всех возможных вариациях: «купить силикатный кирпич», «купить красный кирпич дешево» и т. д.).

Точная частотность – количество конкретных запросов «купить кирпичи» без уточнений.

Чем больше разница между базовой частотностью и точным вхождением, тем больше можно сделать фраз из маркерного запроса добавляя другие слова и LSI-фразы.

Маркерные запросы имеют своей особенностью большую числовую разницу между базовой частотностью и точным вхождением фразы. Поэтому мы и ищем именно маркерные запросы по конкретному кластеру (смысловой группе) для 1 посадочный страницы.

Сформируйте и постранично сгруппируйте семантическое ядро для продолжения работы. Собирайте пока. Я пойду налью чай – вода уже закипает.

Шаг 2. Поиск конкурентов для изъятия LSI-фраз

Открываем Arsenkin Tools, ищем инструмент «Выгрузка топ-10 сайтов». Забиваем туда все маркерные запросы для одной страницы, выставляем регион (всегда делайте это, даже если сайт без геопривязки) и жмем «Начать проверку».

В качестве альтернативы Arsenkin можно использовать сервисы Key Collector, PR-CY, Serpstat, Pixeltools, Topvisor.

Если у вас маленькое семантическое ядро, и не удается набрать хотя бы 10 маркерных запросов, берите все что есть.

Мы получили по каждому запросу из введенного нами списка по столбику. В каждом столбике 10 сайтов из топа «Яндекса» по этому запросу. Рекламные объявления, разумеется, в столбиках отсутствуют. Столбики разноцветные: одинаковые URL, разбросанные по разным столбикам, подсвечены одним оттенком:

LSI-фразы: что это такое и как их собрать

Наша задача – пролистать ниже до этого блока:

Часто встречающиеся URL

Как видите, я уже вычеркнул агрегаторы и выделил первые 10 подходящих ссылок. Эти страницы наиболее часто встречаются в результатах выгрузки, а значит, находятся в топе по большему количеству запросов, чем остальные. Делаем вывод, что маркерные запросы на этих страницах распарсены широко, охватывают много LSI, а страницы имеют хорошие поведенческие факторы.

Шаг 3. Таблица для исследования и веб-анализа LSI-семантики конкурентов

У меня было два варианта – считать все вручную для каждой страницы или внедрить формулы и сохранить шаблон для использования по мере необходимости. Я изготовил шаблон насколько мне это позволили навыки Excel. Я известный профессионал по Excel… Выглядит это вот так:

Лист 1

Лист 2

Обратим внимание на верхний блок и имеющиеся в нем строки: количество символов, тошнота, максимальная тошнота и минимальная тошнота. Мы вычислим эти значения для каждой из 10 страниц, а таблица посчитает среднее арифметическое. Так мы сможем увидеть тренды, в зависимости от которых страницы находятся в топе. Например, объем текста или плотность ключевых фраз.

Чуть ниже находятся два поля – бежевое и серое. Столбец формул левее этих полей представляет из себя переход от средней максимальной тошноты до средней минимальной тошноты, умноженный на 100 для удобства подсчетов.

В желтом поле будут находиться 5 страниц, возглавляющих топ, а в сером поле – замыкающая пятерка. Разница между первой и второй пятеркой заключается в их ранжировании. Первая пятерка имеет кратно превосходящий вес.

Все цифровые значения, которые мы получим в процессе работы, будем умножать на коэффициент. Для желтого поля он составит 1, а для серого – 0,5.

Справа внизу листа 1 – результаты нашей выборки, где каждому слову присваевается ранг. Чем выше ранг, тем ближе к максимальной тошноте должна быть плотность вхождений этого слова в тело документа. Чем ниже, тем ближе к минимуму, но все равно в интервале не меньше минимального.

##READMORE_BLOCK_92264##

Шаг 4. Парсинг LSI-фраз и обработка результатов

Переходим на сервис SeoLik (или его аналог p2pi) и находим инструмент «Анализ контента»:

LSI-фразы: что это такое и как их собрать

Берем первую из десяти ссылок и вставляем в окошко для анализа контента страницы. В результатах ищем поля с картинок ниже и выписываем значения из них в таблицу в соответствующие ячейки:

Вычисление длины текста на веб-странице

Тошнота страницы

На второй картинке видим список слов. Выписываем первые 20 в желтое поле таблицы в столбик. Значение минимальной тошноты для этой страницы у нас будет равно тошноте 20-го слова: «запой», «лечение», «врач», «пациент» и т. д.

Ту же процедуру повторяем с остальными девятью страницами, постепенно заполняя желтое и серое поля:

LSI-фразы конкурентов

Теперь остановимся на желтом поле.

Нам нужно найти одинаковые фразы в каждом из пяти столбиков, перемножить каждую на соответствующее ей число из столбика левее желтого поля. Считаем сумму полученных значений, вписываем слово и полученный результат в соответствующие ячейки справа. В столбец «Количество» вписываем число совпадений.

Считаем числовое значение ранга каждого слова

Вписываем полученный результат в соответствующую коэффициенту 1 колонку

Ту же процедуру проделываем отдельно с серым полем, но результаты вычислений вписываем в столбец с коэффициентом 0,5:

Вписываем результат в соответствующую коэффициенту 0,5 колонку

Копируем колонки «Фраза», «Количество» и «Ранг». Создаем новый лист в документе нажимам на ячейку B2 правой кнопкой мыши и выбираем «Специальная вставка» > «Вставить только значения»:

LSI-фразы: что это такое и как их собрать

Удаляем столбец «Значения», фильтруем колонку «Ранг» от большего к меньшему. Получаем LSI-семантику. Располагаем слова по важности и узнаем плотность вхождений, которая у них должна быть:

LSI-фразы: что это такое и как их собрать

##READMORE_BLOCK_92155##

Шаг 5. Сравнение

Теперь у нас два пути.

  1. Ситуация первая – у нас нет страницы. Просто создаем посадочную страницу, отталкиваясь от среднего количества символов, полученных фраз и плотности их вхождений.
  2. Ситуация вторая – у нас уже есть страница. Делаем ее анализ на сервисе SeoLik и выписываем фразы в столбец «Акцептор»:

LSI-фразы: что это такое и как их собрать

Шаг 6. Итог

Завершающий этап состоит в сравнении двух списков слов и «подтягивании» LSI-фраз, которые редко встречаются в теле нашей страницы, до необходимого уровня. Проверку проводим в SeoLik (или в p2pi), добавляем нужные фразы или убираем лишние до тех пор, пока столбец «Донор» и «Акцептор» не будут равны.

Сравним донорскую LSI-семантику с LSI-семантикой нашей страницы. Красным маркером пометим фразы, плотность вхождений которых нужно увеличить, а зеленым – слова, которые необходимо удалить:

LSI-фразы: что это такое и как их собрать

Мы получили список: «клиника», «реабилитация», «центр», «нарколог», «кодирование», «помощь», «запой». Вписываем слова в текст страницы-акцептора. Проводим повторный анализ контента, получаем результаты, на которых видно, что список и ранг LSI-фраз донора и акцептора приблизительно равны, что и требовалось.

LSI-фразы: что это такое и как их собрать

About us and this blog

We are a digital marketing company with a focus on helping our customers achieve great results across several key areas.

Request a free quote

We offer professional SEO services that help websites increase their organic search score drastically in order to compete for the highest rankings even when it comes to highly competitive keywords.

Subscribe to our newsletter!

More from our blog

See all posts

Оставить комментарий