Апдейт поста: додала блок інформації про цікавий безкоштовний сервіс Арсенкина за парсингу тегів H1-H6 по конкурентам з ТОП-10 Яндекса або свого довільного списку URL. Це в пункті «Інструменти LSI».

LSI — тема стара, але саме зараз вона набуває нове дихання у зв’язку з останніми тенденціями в змінах алгоритмів ранжирування пошукових систем.

LSI-копірайтинг стає найпотужнішим SEO-трендом 2017 року. І я вважаю, що кожен, хто пов’язаний з просуванням сайтів, або створює свій сайт будь-якого типу, або надає послуги з написання текстів, повинен в обов’язковому порядку вивчити цю тему «від і до» і застосовувати.

Ще в 2010 році на Хабрахабре писали:

«Сьогодні я розповім про один з підходів, яким активно користуються пошукові гіганти і який звучить начебто мантри для SEO aka пошукових оптимізаторів. Цей підхід називає латентно-семантичний аналіз (LSA), він же латентно-семантичне індексування (LSI)«.

Пройшло 7 років..

Тема, звичайно, піднімалася тут і там у SEO-блогерів і в доповідях на конференціях, але поки це було нечисленне. Почалося все з зміною алгоритмів Гугла. А з приходом нових алгоритмів Яндекса — Баден-Бадена і Королева, про LSI заговорили всі.

Зміст статті:

Що таке LSI

Які переваги в плані SEO дає LSI

Як пишеться LSI-текст. Як потрібно давати ТЗ копірайтеру

Як формувати LSI-ядро для тексту

LSI-інструменти

Кращі статті, відео

Що таке LSI

LSI — це додавання в текст супутніх, релевантних термінів і тематичних слів за вашим ключовим запитом.

Тобто обов’язкове додавання в текст всієї сукупності найбільш важливих слів, які формують дану тему.

Це коли ви пишете текст на тему «просування сайтів» і обов’язково додаєте такі слова, як «SEO», «посилальне просування» «линкбилдинг», «пошукова оптимізація», «пошукові системи», «фільтри», «ранжування», «розкручування», «контент» та інші релевантні слова.

А не просто 15 раз повторюєте «ключ, під який ви затачиваете статтю» — «просування сайтів», і ще пару варіантів, як вийде.

Це не обов’язково довгий текст. І один абзац можна зробити насиченим і корисним. Але зазвичай під LSI-текстом мається на увазі «лонгрид», який вміщує в себе всю корисну інформацію з даного питання.

Зараз, коли в SEO кажуть «якісний LSI-текст», то мають на увазі текст компетентний, великий і корисний, насичений словами і термінами з даної тематики, структурований і добре оформлений.

Навіщо це потрібно — щоб і пошукова система, і людина відразу розуміли, про що йде мова.

Зараз термін LSI-текст протиставляється SEO-тексту, який пишеться з певною кількістю знаків та входжень потрібних ключових слів із заданого в ТЗ списку.

Dr.Max:

«LSI тексти — це контент, релевантний наміру користувача, а не ключовим словами. Він складається з однорідних контент-одиниць (абзаців, розділів, статей або розділів), широко розкривають як основну так і суміжні теми. »

Олексій Чекушин:

«Говорячи простою мовою, LSI – це спосіб визначення тематики тексту за що містяться в ньому словами.

Наприклад, якщо в документі зустрічаються слова «зимова», «протектор», «шипи» – то, найімовірніше, це текст про шини.

А якщо – «сковорода», «запікати», «соус» – то це що-те, що відноситься до кулінарії.»

«В «побутовому» сенсі, або стосовно до SEO LSI — це використання тематичних слів при написанні текстів.»

Що таке LSI. Пояснення Олексія Чекушина на відео на 25 секунд )

Які приеимущества в плані SEO дає LSI

1) Поліпшення ранжування в пошуку

Ваш сайт отримає більш високі позиції. Особливо це стосується складних конкурентних ключових запитів, коли вже задіяно багато факторів, а рухи вгору далі не відбувається. Але і для будь-яких інших запитів LSI теж працює.

Це сам по собі — не дуже впливовий фактор. Точне входження запиту — набагато важливіше. Але все-таки.

2) «Подушка безпеки» від фільтрів пошукових систем

LSI-тексти набагато рідше потрапляють під спам-санкції пошукових систем, це відзначають багато SEO-фахівці.

Як говорить Олексій Чекушин, «в спам-алгоритмах LSI має куди більш значну вагу, ніж в ранжируванні. І якщо ваш сайт вже потрапив під санкції – переписування текстів за допомогою «Акварелі» або аналогічних LSI-інструментів дозволяє вийти з-під санкцій. А споконвічне їх написання з використанням LSI – не дає під них потрапити.»

Мова про Баден-Баден та інші.

3) Розширення семантики

Крім вкладу у фактор ранжування, LSI-тексти самостійно залучають трафік з додатковим ключовим та тематичними словами, які ви вживаєте в тексті.

А також ви у ході великого дослідження конкурентів і популярних в тематиці слів, отримуєте масу ідей для окремих, нових матеріалів.

Наприклад, якщо ви збираєте LSI-слова для комерційної сторінки сайту послуг, можете отримати багато тем для нових подібних сторінок та інформаційних ключів для статей.

4) Інші супутні бонуси в ранжируванні

— поліпшення поведінкових факторів
— зростання кількості соцсигналов, посилань

І через це все опосередковано — знову ж підвищення позицій в пошукових системах.

Вашим читачам буде приємніше і зручніше читати корисний і ґрунтовний текст — такий частіше лайкають шерят, ставлять посилання на докладний корисний матеріал, довше затримуються на ньому, хочуть почитати що-небудь ще на такому сайті — ростуть хостовые фактори, поведінкові фактори, зростає загальний авторитет сайту в очах пошукових систем.

Я писала на цю тему «Велике керівництво по Супер-контенту».

Пам’ятайте, що поїзд невблаганно рухається в кінцеву точку, хочете ви цього чи ні.

Алгоритми пошукових систем допрацьовуються саме на користь корисних і природних текстів. Якщо не хочете зловити штрафи пошуковиків, пізніше переписувати тексти, щоб краще ранжируватися — робіть це одразу!

Якщо у вас вже є хороші тексти на сторінці, перевірте, які LSI-слова до них підходять, і уточніть їх наявність, допишіть тексти.

Як пишеться LSI-текст? Як потрібно давати ТЗ копірайтеру

Якщо ви найняли дійсно нормального копірайтера, то, глибоко вивчивши вашу тему, конкурентів, він І ТАК напише корисний текст, з усіма потрібними додатковими тематичними словами.

Тому що сам принцип написання LSI-тексту та аналізу теми для цієї мети практично нічим не відрізняється від аналізу теми для написання просто дійсно якісного тексту.

Найбільший мінус цього всього — дорожнеча звернення до хорошим копірайтерам. Та й сам текст, в якому тема повністю розкрита зазвичай набагато більше «стандартних» 2-3 тис. знаків SEO-текстів.

Але воно того варто і тому що трафіку на такі статті залучається набагато більше, і безпеку від фільтрів, і збільшення довіри до ваших текстів, а якщо вони знаходяться на корпоративному сайті — то і до товарів, послуг. І інші фактори, про які писалося вище.

В ідеалі, щоб найголовніші тексти писав не копірайтер, а той, хто має найбільший досвід у вашої компанії або проекті, найкращим чином обізнаний про всі практичні нюанси.

Якщо це неможливо, то організувати, щоб такий чоловік дав щось на кшталт інтерв’ю або сам написав, написав найважливіші моменти, якісь вузькі, практичні, які він знає на своєму досвіді, а в інтернеті, можливо, про таких взагалі ще не писали. Так, це абсолютно реально, особистий досвід цінується найбільше, а в мережі написано ще поки далеко не про все.

Безкоштовні курси SEO від Ганни Ященко – 20 PDF-уроків – Хороші, для новачків, але і не тільки, досить глибокі, актуальні. Хочете навчитися самостійному безкоштовного просування сайтів? Будь ласка.

А копірайтер щоб розширив текст і навів порядок.

Так що ж з ТЗ?

Багато SEO-фахівці зараз воліють не давати ТЗ своїм копірайтерам на основі LSI-інструментів, а перевіряти якість тексту і роботи копірайтера, вже ПІСЛЯ того, як він напише цей текст, за допомогою тих слів, які видали сервіси.

Я теж вважаю, що так правильніше.

Тому що інакше, якщо дати копірайтеру список слів, він буде зациклений на тому, щоб вставити ці слова і написати до них якийсь контекст, а не на тому, вивчати тему глибоко і робити кращу статтю в Топі.

Як виглядає LSI-текст? Порівняємо 2 таких абзацу, які я швидко написала:

1й текст

LSI-тексти — це найважливіший момент сьогодні в просуванні сайтів. Якщо ви їх не використовуєте, то ви істотно програєте в порівнянні з іншими сайтами. Це самий важливий тренд 2017 року і про це варто пам’ятати.

2й текст

LSI — всього лише один із сотень текстових чинників ранжирування пошукових систем. Але, враховуючи активний розвиток Гугла і Яндекса в цю сторону в 2015-2017 роках, варто обов’язково включити LSI-копірайтинг в зону пріоритетного уваги і освоїти хоча б кілька основних інструментів для добування підсвічувань, підказок, синонімів та інших додаткових ключових і тематичних слів.

У перший текст можна вставити будь-який термін замість LSI — хоч «крауд-маркетинг», і нічого не зміниться. Вода, ніякої користі людині немає. Єдині слова, більш-менш пов’язані з тематикою — «просування сайтів», «сайт» — вони досить загального характеру.

У другому тексті теж мало користі, звичайно. Але сюди складно підставити який-то ще термін і користувачеві (а також пошуковій системі) набагато зрозуміліше, про що йде мова. Тут йде і розширення семантики, і LSI — багато слів по вузькій темі даного питання. Другий текст написаний з великим знанням справи», ніж перший. Він набагато більш релевантним потрібного запитом і досить великої кількості супутніх.

Взагалі, напевно, найкраща стаття за LSI — від Dr.Max, там написано все те, що немає сенсу тут передруковувати іншими словами. Читайте у нього на сайті, передплачуйте у кінці статті на його розсилки, я цього автора давно знаю і дуже рекомендую. Але шматок з цієї його статті нижче все-таки наведу:

Як він пише в цій статті, «секрет і страшна військова таємниця LSI-текстів», полягає в наступному:

«Головним критерієм є сприйняття тексту дитиною 13-14 років. (У коментарі до своєї статті, за посиланням вище, він пояснює цей момент детальніше).

Будь-який, навіть академічної складності текст, наприклад, присвячений квантової фізики, повинен бути викладений мовою, зрозумілим цій дитині. Хорошим прикладом тут можуть бути книги Перельмана, всі його знамениті «Захоплююча Фізика», «Цікава математика» та ін.

Вони чітко відповідають всім критеріям LSI-контенту:

— Короткі, рубані пропозиції, без деепричастных оборотів і інших синтаксичних викрутасів;

— Довгі пропозиції чергуються з короткими;

— Чітке виділення абзаців;

— Повнота і широта викладу матеріалів;

— Наявність ілюстрацій;

— Поєднання теорії і практики (або за іншим, вибірки і конкретики).

Все це обумовлено недостатньою розвиненістю алгоритмів пошукових систем, коли корпус для навчання вибирається обмеженим числом експертів. Надалі, критерії будуть ускладнюватися.

Крім іншого, контент повинен володіти наступними параметрами:

— Безпомилковість тексту;

— Експертний рівень тексту (не потрібно замовляти контент у горі копірайтерів по $1 за 1000 символів. Людина, як мінімум, повинен бути «в темі»);

— Вибірка матеріалу — це добірка теоретичних даних з проблематики, широко розкриває тематику;

— Конкретика матеріалу — це практичний досвід, корисні відомості, порівняння.

Застосування цих методів написання неминуче тягне за собою зростання розміру вмісту, інакше кажучи, виходять величезні текстові онучі, розбавлені медиаматериалами. »

«На маултолке мені вирішили уточнити, що LSI — це царство синонімів. Що потрібно використовувати якомога більше фраз, побудованих саме на синоніми. Але це не так.

До синонімів, правильні LSI тексти мають віддалене відношення. У текстах, для підтвердження релевантності використовуються квазисинонимы. Вони визначаються їх наявністю в тексті поруч з вихідним ключовим словом. Чим ближче до контент-одиниці (речення, абзац, голова і т. д.) коштує ця фраза, чим частіше вона зустрічається в різних текстах всього корпусу, тим більше релевантним фраза буде вихідного ключовому слову.

Наявність кількох таких «релевантних» слів у тексті підтверджує як тематику, так і (що найголовніше), вихідну ключову фразу.

Давайте наведемо експеримент.

Я загадав слово «сонце». За моїми прикидками словами підтвердженнями «жовтий», «вогненний», «куля», «небо». Якщо ми складемо вектора цих слів, то отримаємо початкове ключове слово «сонце».

Для розрахунку скористаємося семантичним калькулятором.

Обчислення синонімів

Як ми бачимо, з імовірністю 0,658 «сонце» знаходиться на перетин векторів слів «жовтий», «вогненний», «куля», «небо». Таким чином, якщо в тексті зустрінуться ці слова в контент-одиниці, то з достатньою впевненістю ми будемо стверджувати, що контент-одиниця розповідає нам саме про «сонце».

Саме на цьому базуються LSI алгоритми.

Якщо ми хочемо підвищити релевантність всієї статті, то потрібно використовувати найбільш правильні релевантні терміни. І використовувати достатню кількість опорних фраз — підтверджень.»

Як формувати LSI-ядро для тексту?

Це не тільки використання існуючих онлайн LSI-інструментів, які в основному парсят підсвічування, підказки, «що ще дивляться з цим».

Це в першу чергу вивчення теми «на око». А також фіксування ідей, як можна зробити краще, ніж у конкурентів.

Це ще:

— аналіз основних запитів Яндекс вордстат.

— перегляд ТОПа, сніппетів.

— перегляд сайтів конкурентів і схожих тематичних проектів, форумів, youtube-каналів, тематичних соцмереж, соцмереж лідерів думок і так далі.

— аналіз статистики вашої контекстної реклами, запитів, по яким дають контекстну рекламу конкуренти (через той же Спайвордс або Семраш).

Коли мало часу на дослідження, я люблю просто глянути Яндекс вордстат, Топ — заголовки та описи фрагмента, і підказки, «що ще шукають» по декільком найбільш важливим запитам сторінки і відразу стає ясно, які важливі слова я упустила.

Ось дані одного тільки Яндекса:

Аналіз ТОПа:


«Що ще шукають»:

Підказки Яндекса:

Яндекс вордстат — https://wordstat.yandex.ru :

Яндекс вордстат «схожі запити»:

Це все я швидко глянула вручну, але, звичайно, можна скористатися інструментами автоматизації.

З одного боку, в Топі сайти часто тримаються за рахунок інших факторів (не за рахунок вживання відповідних слів), але з іншого боку, якщо прикласти голову — то це все одно відмінний джерело для пошуку додаткових ключових і тематичних слів і термінів.

LSI-інструменти

Я наведу тут найпопулярніші, яких цілком достатньо:

1) Сервіс Арсенкина. Парсити підсвічування Яндекса і додаткові тематичні слова.

2) Підказки Яндекса і Гугла. Парсити той же сервіс Піксель Тулс. Безкоштовний сервіс парсинга Яндекс підказок — Гугл підказок.

3) «Що ще шукають разом із запитом». Парсити теж безкоштовний Піксель Тулс

4) Яндекс Вордстат Можна парсити Киколлектором, наприклад.

Можна використовувати зручний онлайн-сервіс Моабіт, який поєднує парсинг і Вордстата, і підказок, чистить і це об’єднує в одне.

Є ще аналіз ТОПа від Піксель Тулс, який видає найуживаніші слова з ТОПа (ручна вибірка сайтів відповідного типу або просто ТОП5-15), які не зустрічаються у вас (порівнює з вашої релевантної в Яндексі сторінкою).

Помилку (Error) сервіс видає, якщо порушена ієрархія заголовків H.

Ще є ось такий цікавий безкоштовний онлайн-сервіс від Арсенкина — «Парсинг тегів H1-H6 по конкурентам з ТОП-10»

Його теж можна і потрібно активно використовувати як для пошуку LSI-слів і синонімів, додаткових ключових слів. Для пошуку ідей для максимально повного охоплення питання в поточному матеріалі, для створення нового контенту на сайті.

Можна задати запит і отримати аналіз ТОП 5 або 10 з Яндекса, а можна дати свій список з 20 URL сторінок-конкурентів.

Зручно, що можна відразу спарс і їх Title і Meta Description.

Результат:

Є пара хороших статей з описом інструментів:

«Де і як шукати LSI ключові слова? 11 кращих інструментів і сервісів»

«Інструменти для пошуку LSI-фраз» (Сергій Кокшаров)

Dr.Max у своїй статті докладно досвідом описує стратегію пошуку LSI-слів за допомогою Semrush.

Є сервіс Олексія Чекушина «Акварель-генератор» (в рамках Just-Magic.org)

У цього SEO-інструменту мінусом зазвичай називають його дорожнечу.

У цій статті Олексій Чекушин докладно описує свій підхід до збору LSI-слів.

«Незважаючи на явні плюси, подібний метод має і свої мінуси. По-перше, він дуже ресурсоемок: на перевірку одного слова витрачається 3 XML-запиту; а на складання списку за допомогою «Акварель-генератора» йде в середньому 2300 XML-запитів.

У результаті перевірка таким способом виходить значно дорожче інших, які сьогодні доступні практично безкоштовно.»

Олексій Праць винаходить свій LSI-інструмент в рамках сервісу «Без бубна». Подробиці початку цього експерименту можна почтитать тут. Поки є сервіс видає слова тільки в тематиках «Медицина» і «Юриспруденція».

Обидва — і Праць, і Чекушин визнають деяку помилковість підходу «найпростіших» LSI-сервісів. І намагаються розробити більш ефективний автоматизований інструмент.

Від Олексія Трудова:

«На практиці сервіси, генеруючі LSI, часто працюють із вмістом або сниппета сторінок з ТОПа видачі за запитом. До чого це призводить?

Вибірка для аналізу — всього лише кілька десятків документів. Високий ризик зібрати тільки занадто очевидні і тому даремні слова.

Далеко не факт, що вивчаються сторінки взагалі не містять потрібні слова. Факторів ранжирування безліч, в Топі легко можуть триматися сайти з малої текстової релевантністю (за рахунок хостовых, посилальних, поведінкових…).

Спираючись на тексти конкурентів можна піднятися до їх рівня, а не зробити краще.

Я спробував зайти з іншого боку.

Що вийшло?

Вийшло не так чарівно, як я хотів. Ідея тільки звучить так просто, насправді роботи досить багато. Потрібно зібрати базу текстів, очистити її від сміття, перевести у формат, зручний для word2vec, протестувати різні параметри моделі…

Я зробив 2 моделі за тематиками «медицина» і «юриспруденція». Для інших сфер сервіс поки що неактуальний. Проте те що є — працює досить непогано, можна отримувати цікаві результати.

(Втім, неспеціалісту писати інформаційні статті в таких серйозних тематиках взагалі не варто, швидше з міркувань моралі, а не SEO. Так що по розуму більше сервіс для підготовки контенту на корпоративні сайти — коли потрібно просто грамотно розповісти про послугу, а не описувати «як зробити своїми руками»).

Звичайно, інструмент сирої.»

Ще статті, відео

Ще кілька хороших статей LSI:

«LSI в SEO: розкладаємо по поличках. Як використовувати тематичні слова ефективно» — Олексій Праць

«LSI-текст vs. SEO-текст: виживе тільки один» — Нетпік

«LSI – оптимізація без ключових слів» — Олексій Чекушин

«Латентно-семантичний аналіз» на Хабрахабре

«Все про оптимальній довжині SEO-тексту» щоденника «Нетологии» — як ранжуються лонгриды, чи читають їх.

І подивіться вебінар Сергія Кокшарова (Девакі) на 40 хвилин.

До речі, я його не дивилася, а слухала (хоча там є презентація, і дивитися зручніше). Робила я ось цим своїм способом, протягом півгодини, поки відвозила і привозила дитини на байку в дитячий сад ) Інакше — не встигнути вивчити стільки корисного матеріалу.

Запис вебінару «LSI тексти: Як поліпшити ваші тексти з допомогою LSI»

Як завжди, чекаю ваших коментарів!