Факторы продвижения сайта

Факторы продвижения сайта – это то, что учитывают поисковики при ранжировании сайтов в поисковой выдаче и, соответственно, то, на что можно воздействовать, чтобы обеспечить сайту хорошие позиции в поиске. Основными факторами, в наибольшей степени влияющими на рейтинг сайта, его позиции и органический трафик, являются полнота и связность контента, а также внешние сигналы, свидетельствующие о качестве этого контента – ссылки на этот сайт с других ресурсов, пользовательское поведение на страницах сайта, сигналы из соцсетей.

Поисковые алгоритмы стараются научиться оценивать сайт так, как его оценил бы человек, поэтому количество факторов, учитываемых поисковыми машинами постоянно растет. Например, Гугл утверждает, что его поисковые алгоритмы учитывают около двухсот факторов, в свою очередь Bing, детище майкрософта, по заявлениям его создателей, учитывает более тысячи факторов продвижения. На что гугл утверждает, что в своих двухстах факторах на самом деле содержится огромное количество подфакторов. В общем, количество учитываемых факторов является в какой-то степени «пузомеркой» поисковых компаний.

 

Коротко: как нужно воздействовать на SEO-факторы, чтобы эффективно продвигаться? Нужно тщательно работать над контентом и по возможности промоутировать его в социальных сетях, не делая при этом грубых технических ошибок. Всё.

Содержание (кликните на разделе, чтобы перейти непосредственно к нему):

  1. Какие существуют факторы продвижения сайта
  2. Внешние факторы продвижения сайта
    1. Входящие ссылки
    2. Исходящие ссылки
  3. Внутренние факторы продвижения сайта
  4. Факторы текстовой релевантности глазами разработчиков поисковиков
    1. TF-IDF
    2. BM25
    3. Формула ранжирования Яндекса образца 2006 года
    4. Матрикснет
    5. YMW как фактор текстового ранжирования
    6. Латентно-семантические модели в поисковом ранжировании
    7. Самовыявляемые факторы
  5. Сколько факторов ранжирования сайтов использует Яндекс?
  6. Внутренние факторы ранжирования глазами SEO-аналитиков
  7. Периодическая таблица факторов от портала SearchEngineLand
  8. 200 SEO-факторов от Брайана Дина
  9. Выводы относительно факторов продвижения сайтов
  10. Источники и материалы про факторы продвижения сайтов и смежным темам
 

Какие существуют факторы продвижения сайта и их виды

Факторов, учитываемых поисковиками, бесчисленное количество, как утверждалось выше, но все же это не значит, что их нельзя никак категоризовать. Если попытаться как-то разделить факторы, то можно увидеть, что наиболее легкими основаниями для деления оказываются два. По первому основанию можно поделить факторы на внешние внутренние.

  • Внешние факторы имеют такое название, поскольку не имеют отношения к тому, какую семантику несет в себе сайт. То есть, для того, чтобы их оптимизировать не надо вообще ничего знать про тему данного сайта. Таким фактором можно назвать внешние ссылки: купил их себе на бирже ссылок и все.
  • Внутренние факторы – это такие факторы, для оптимизации которых требуется погружение в тему, которую освещает данный сайт. Например, для написания корректных статей о предметах, которые рассматриваются на сайте.

Вторым основанием для деления факторов можно считать способ их получения поисковыми алгоритмами. По этому основанию факторы делятся на явно вносимые в поисковую систему её разработчиками и, так скажем, «самовыявляемые факторы». С явно вносимыми факторами всё более-менее ясно: о том, что их принимают во внимание разработчики поисковых систем пишут открыто. Со вторыми же несколько сложнее. На сегодняшнем этапе развития интернета существует большое количество информации, из которой можно «выжать» неявные закономерности методами датамайнинга и вебмайнинга. Примерно таким способом обучают поисковые машины: их «натравливают», например, на статьи в википедии, которые считаются образцовыми, а те, проанализировав их, обнаруживают факторы, ранее неизвестные. Такими факторами или показателями энциклопедичности статьи могут служить слова-маркеры: виды, типы, классификация и так далее.

 

Внешние факторы продвижения сайта

В этом разделе рассматриваются внешние факторы продвижения сайта. Попробуем их перечислить.

  • Ссылки на ресурс. Про них наверняка многие слышали, поисковики оценивают качество сайта, отчасти базируясь на том, сколько других ресурсов на него ссылается. Это один из наиболее манипулируемых факторов. Для накрутки ссылок существуют целые ссылочные фермы, которые продают ссылки, эти фермы регулярно закрывают, а их все равно открывают на новых площадках.
  • Ссылки с ресурса. В данном случае, поисковик смотрит, нет ли с сайта ссылок на какие-то «левые» ресурсы, то есть не является ли сам сайт такой ссылочной фермой. Особенно важно это для каких-либо форумов, на которых возможно размещают ссылки какие-то рекламщики. В настоящее время для того, чтобы форумом на сайте не пользовались как источником ссылок, а также для того, чтобы избежать некорректного распознавания рекламных ссылок, введено значение атрибута rel у тега a. Если это значение =nofollow, то такая ссылка не учитывается поисковиком.
 

Входящие ссылки

О входящих ссылках как о внешних факторах стоит знать следующее. Использовать стоит для современного линкбилбинга проверенные, лично вам знакомые партнерские сайты, а также размещение пресс-релизов и, если получится, гостевой блогинг. НО: минимальные требования для площадок, на которых будет вестись размещение здесь. Они сводятся к следующему:

  • Ненулевая видимость домена-донора в сервисе serpstat.com (хотя бы больше 0,1). Именно на этот хостовый параметр стоит обращать внимание, а не на тИЦ или какие-то еще ему подобные «пухомерки».
  • Незаспамленность домена-донора согласно сервису checktrust.ru
  • Высокая виральность (число лайков и репостов и других соцсигналов) типовой страницы, с которой дается ссылка с домена-донора на ваш сайт. Например, хостовые параметры этой страницы неплохие, (то есть домен авторитетен), но виральность того раздела, где этот сайт размещает ссылки – низкая: эти страницы почти никто не видит, так как, вероятнее всего, они не промоутируются сайтом «эксперт.ру» по его каналам. Следовательно, этот сайт не подходит для размещения пресс-релизов. Виральность веб-страниц можно поглядеть, кроме прочего, сервисом soc.c3h.ru

Если выразить формулу работающей ссылки в одном предложении, то это та ссылка, по которой идут десятки и сотни живых переходов пользователей. Если страницу-донор никто не увидит, то и переходов не будет.

 

Исходящие ссылки

Существуют исследования (например, вот это), которые показывают, что исходящие ссылки положительно влияют на ранжирование в поисковой выдаче. Это представляется вполне естественным и логичным: здесь онлайн-реалии вполне соответствуют офлайн-реалиям. Даже уровень научных работ – особенно в гуманитарных науках – оценивают часто по списку литературы: если в нём присутствуют источники редкие, но при этом весьма авторитетные, значит, автор, как минимум, хорошо, глубоко разобрался в теме. А это всегда выгодно отличает от большинства.

Поэтому не удивительно, что разработчики поисковых систем когда-то решили потестировать этот фактор, и, по-видимому, результаты машинного обучения показали, что это повышает качество поиска, поэтому авторитетность исходящих ссылок была включена в факторы ранжирования, что и видно по результатам экспериментов независимых аналитиков.

 

Внутренние факторы продвижения сайта

Здесь мы будем рассматривать внутренние факторы поискового продвижения.

  • Статьи – это, пожалуй, один из наиболее значимых факторов продвижения сайта. Статьи должны быть написаны энциклопедическим стилем, в них должны указываться определения того, что рассматривается, основные качества, типология, если таковая имеет место быть. Нумерованные или маркированные списки, несколько подзаголовков Н2. Самое важное – это структурный текст, статьи не должны представлять собой набор вывесок на базаре.
  • Соотношение статей. Поскольку поисковик рассматривает некий сайт на предмет того, как в нем раскрыта заявленная тема, то логично предположить, что во всякой теме есть популярные и не очень аспекты, соответственно статьи должны покрывать не только популярные аспекты. Статьи должны располагаться в определенном соотношении друг к другу в зависимости от широты запроса. Примерное деление запросов по ширине такого: меньше 1 запроса в месяц – сверхузкий, до 100 запросов – узкий, до 1000 запросов – средний, больше тысячи – широкий. Соотношение такого: 3 к 1. То есть на один средний запрос должно приходиться три узких, на 1 широкий – три средних.
  • Дескрипшн – это один из метатегов html. Этот тег должен заполняться в обязательном порядке, причем заполняться он должен не просто набором ключевых слов, а являться связным предложением, в котором ключевые слова упоминаются, но в несколько измененном виде, например, в другом падеже.
  • Перелинковка. Она должна быть осуществлена грамотно: статьи должны быть пересосланы друг на друга в анкоре.
  • Тайтл – это название страницы. Тайтл должен полностью совпадать с запросом, под который страница оптимизируется.
 

Факторы текстовой релевантности глазами разработчиков поисковиков

Разработчики поисковых систем – Google и Яндекс – последовательно усложняли и продолжают усложнять формулу определения релевантности документа (так в их терминах называется веб-страница) запросу. Рассмотрим последовательно эти стадии в большей степени на примере Яндекса, так как про логику его развития мне больше известно открытых источников.

 

TF-IDF

TF-IDF отражает вклад, который вносит частота встречаемости термина в документе в общую оценку релевантности данного термина документу: чем больше количество вхождений термина в документ и чем этот термин реже встречается во всей коллекции документов, тем выше значение TF-IDF. Существуют различные математические формы отразить данную зависимость. Например, одновременный учет и частоты вхождения, и редкости в наиболее распространенных вариантах представляется произведением двух сомножителей, хотя, вообще говоря, совершенно не очевидно, что именно этой аналитической функцией это должно быть отражено. Кроме того, математическая запись вышеописанной зависимости еще пытается ухватить «затухающий» рост вклада параметров редкости, а иногда и частоты в итоговую оценку релевантности. Делается это чаще всего с использованием логарифма и гиперболы, но делается это лишь из-за математического удобства, а не потому, что у нас действительно есть весомые основания считать, что затухание происходит именно по такой зависимости. Эти концептуальные неувязки, которые проистекали из необходимости простоты кодирования и быстроты расчета по данной зависимости, разрешены в алгоритме машинного обучения «Матрикснет».

Формула расчета TF-IDF

где

  • lDl – число документов в корпусе,
  •   число документов из коллекции D, в которых встречается термин t.
  • tf – частотность термина (term frequency).
  • idf – обратная частотность термина (inverse document frequency) в корпусе документов, а точнее редкость термина в этом корпусе.
  • есть число вхождений слова t в документ, а в знаменателе формулы для tf – общее число слов в данном документе.

Но ведь нам нужно определять релевантность не термина, а запроса, который может состоять из нескольких слов (терминов)! Поэтому для ранжирования  документов в поиске напрямую эта метрика не годится. Её модификация, распространяющаяся на случай нескольких слов, была названа BM25 и представляет она собой по сути не одну формулу, а целое семейство формул (так же, как и TF-IDF).

 

BM25

Согласно Википедии, BM25 — поисковая функция на неупорядоченном множестве термов («мешке слов») и множестве документов, которые она оценивает на основе встречаемости слов запроса в каждом документе, без учёта взаимоотношений между ними (например, близости). Это не одна функция, а семейство функций с различными компонентами и параметрами. Одна из распространенных форм этой функции описана ниже.

Формула BM25

Формула IDF в BM25

 

Формула ранжирования Яндекса образца 2006 года

В 2006 году в рамках конференции РОМИП вышла статья Яндекса, где авторы представили некую формулу ранжирования, которая и отличалась в некоторых моментах от «боевой» формулы ранжирования, но не принципиально. Несмотря на то, что с того времени сама формула стала длиннее в миллионы раз, многие идеи, в неё заложенные, остаются актуальными и по сей день.

Формула ранжирования Яндекса в 2006 году

Здесь есть несколько моментов, на которых стоит остановиться. Попробуем разглядеть тренды будущего (по отношению к 2006-му году) поиска в этих шести членах формулы.

  • Фраза про то, что была выбрана аддитивная модель, выделена мной в тексте неспроста: уже тогда компанией был сделан выбор в пользу этой модели, которая через несколько лет нашла логическое завершение в технологии «Матрикснет», использующей градиентный бустинг на деревьях решений.
  • Для расчёта Wsingle используется одна из модификаций рассмотренной выше метрики BM25. Причём авторы не стесняются творчески к ней подходить и смело экспериментировать с её доработками. Итог: и IDF усовершенствован, и в самой BM25 не все как у других. Окончательные формулы приводить не буду, их можно посмотреть в докладе по ссылке выше. Вывод: делать формулу длиннее – это не дурная бесконечность, а прогресс, и он может достигать цели. И мы увидим, что Яндекс и далее последовательно держался этой стратегии, и сейчас формула достигла огромных размеров.
  • Член формулы WHalfPhrase, дающий небольшой «бонус» за наличие многих слов из запроса в одном предложении, предвосхищает собой метрику YMW (Yandex minimal window), которая рассчитывает длину минимального участка текста статьи, содержащего максимальное количество слов запроса.
  • Член формулы WPRF предвосхищает работу с латентно-семантическими моделями (LSA, LDA, Word2vec, DSSM, а также нейросетями), больше известными рядовым потребителям SEO-услуг как нечто, связанное с LSI-семантикой. Видим, что популярный сейчас в 2017 году тренд начал обозначаться уже тогда, в 2006-м году.
 

Матрикснет

Матрикснет – это «целая совокупность разных методов машинного обучения, но все они так или иначе используют алгоритм под названием Gradient Boosted Regression Trees (GBRT)», по официальной информации Яндекса на август 2016 года. Матрикснет был выпущен в 2009 году. «Что это такое? Это множество решающих деревьев, которые подобраны таким образом, чтобы суммируя значения в листьях этих деревьев, мы бы получили хорошее предсказание оценки релевантности, которую поставил асессор. В узлах дерева расположены разделяющие условия, которые представляют собой приблизительно такое: фактор №50 больше, чем 0,5 или меньше? Если больше, то мы идем налево, а если меньше, то направо. И строим такие вот деревья глубиной чуть больше, чем на рисунке, и в листьях такие числа подбираем, что если множество таких деревьев просуммировать, мы бы получили хорошее предсказание асессорской релевантности».

Матрикснет как Gradient Boosted Regression Trees

Уже в феврале 2017 года появилась более полная и более свежая информация. Подтвердилась информация о том, что матрикснет – это градиентный бустинг на деревьях решений. Оказалось, что он применяется в Яндексе практически повсеместно, даже в определении размеров денежных премий.

 

Применения Матрикснета в Яндексе

 

Еще раз про то, как выглядит суммирование деревьев решений

Суммирование деревьев решений

 

В Матрикснете используются не обычные, а так называемые oblivious-деревья решений. «Oblivious-дерево – это такое дерево, где на каждом уровне находятся разбиения по одному и тому же признаку и и одному и тому же числу». Почему используются именно такие деревья?

  • Модель на таких деревьях оказывается устойчивой к переобучению: очень много таких деревьев можно сложить.
  • Для вычисления листового значения нужно вычислить значения всех разбиений («сплитов»), значит не важно в каком порядке мы будем это делать. Это используется для оптимизации применения и обучения.
  • «Oblivious-дерево эквивалетно табличке просто».

 

 Oblivious-деревья решений

Рассмотрим, как велика формула ранжирования Яндекса: сколько в ней деревьев решений и сколько байт она занимает. Как видим, в настоящий момент в формуле суммируется более 70 000 деревьев решений, «весит» формула 840 мегабайт.

 

Число деревьев решений в формуле Яндекса и её размер

 

YMW как фактор текстового ранжирования

Итак, YMW – это фактор релевантности запроса документу, учитывающий размер минимального «куска» текста, в котором содержится максимальное число слов из запроса: чем этот «кусок» меньше, тем документ релевантнее запросу. Аббревиатуре YMW приписывают расшифровку Yandex minimal window, однако в статье-источнике 2010 года такая расшифровка отсутствует.

Фактор текстовой релевантности YMW

Как же такая метрика влияет на ранжирование практически? Какие сигналы посылает SEO-оптимизаторам, к чему их подталкивает, какие мотивационные поля формирует для участников SEO-рынка? Алексей Трудов подробно разобрал, как эта метрика будет отсекать LSI-спам (бездумное «распихивание» LSI-семантики по тексту статьи): «полного эффекта, который могло бы дать расширение семантики мы не получим».

YMW подталкивает выражать свои мысли более кратко и ёмко, LSI-семантику не «раскидывать» по тексту, а наоборот увязывать ключевые слова и фразы с латентными, высказывать свое суждение об их соотнесении. YMW позволяет ловить тех, демагогов, которые не делают свой вклад в знание о том, как именно соотносятся между собой различные аспекты, отраженные в ключевых и латентных фразах. YMW мотивирует высказывать более строгие и конкретные гипотезы, а также давать «работоспособные» определения. И таким образом в целом создает предпосылки для развития энциклопедического подхода.

 

Латентно-семантические модели в поисковом ранжировании

По статистике, около 40% запросов пользователей к поисковой системе являются уникальным и никогда больше не повторяются. Набрать по ним статистику, на которой можно обучить алгоритм, достаточно сложно, и здесь на помощь приходят латентно-семантические модели (LSA, LSI, LDA, Word2vec, DSSM, нейросети). На этой волне в ноябре 2016 года вышел алгоритм Яндекс.Палех. Он использует модель DSSM, которая использует нейросети. Упрощенно говоря, значение релевантности документа запросу согласно данному фактору определяется так. И запросу, и документу сопоставляется вектор в 300-мерном пространстве. Задача подобрать пространства таким образом, чтобы косинусное расстояние между этими векторами было тем больше, чем больше релевантность. А установлением соответствия между этими двумя пространствами так, чтобы косинусное расстояние было именно таким, занимается нейросеть. Более подробно об этом можно прочесть в блоге Яндекса на Хабрахабре.

Что этот тренд – применение латентных семантических моделей поисковиками – значит для SEO-оптимизаторов? Как они на него отреагировали? Они поняли, что сейчас важно писать насышенные тексты с правильно употребленной LSI-семантикой. Это ответ оптимизаторов на этот тренд. Главное делать это правильно.

Коротко. Современный сайт должен быть тематически целостным, то есть корректно (с точки зрения специфики предметной области) сочетать, состыковывать ключевые слова и тематические слова.

Например, если Ваш сайт посвящен комнатным растениям, то Вы можете сделать в дополнениям к статьям о драцене и хлорофитуме выложить статьи про лекарственные свойства календулы, которые не будут релевантны каким-либо запросам, но будут понятны для чтения пользователями.

 

Самовыявляемые факторы

Самовыявляемые факторы – это факторы, которые изначально не закладываются в алгоритмы, а выявляются при машинном обучении роботов. Посмотрите прекрасное видео ниже: руководитель службы нейросетевых технологий Яндекса просто, понятно и одновременно корректно и точно в деталях рассказывает о сущности современной стадии машинного обучения и буме технологий на базе искусственного интеллекта.

Эти факторы могут быть не известны ранее вообще, и находиться при помощи дата-майнинга или быть известны примерно, но «в цифрах» и «частотности» быть достаточно мутными. К таковым выявленным факторам можно отнести частоту правок статей, определенные обороты речи, использование определенных профессиональных лексик, части статей, в которых происходит обновление, свидетельствующее о свежести контента, о том, что над ним работают. Роботы учатся определять, что, допустим, добавление или редактирование разделов статьи говорит скорее о качественной переработке текста, а изменение отдельных слов на всем «полотне» статьи скорее таковым не является или это либо какая-то корректура редактора, либо попытка сымитировать качественную проработку текста и такое лучше просто не учитывать.

Появление самовыявляемых факторов кажется естественным, поэтому не удивительно и кажется закономерным, что в 2017 году стали появляться сообщения о том, что в Матрикснете разрабатывают автоматическую генерацию «фичей». Под фичей в данном случае понимается некий фактор ранжирования, «скармливаемый» Матрикснету, который сам является в свою очередь некой комбинацией факторов, не попадающих напрямую в Матрикснет. Кроме того, вышла работа, посвященная «метафичам» – этаким фичам над другими фичами, где последние представляют собой латентно-семантические модели оценки релевантности запроса документу.

Коротко. Уровни иерархии в системе управления поиском постепенно наращиваются, и машинное обучение начинает надстраиваться над машинным обучением, искусственный интеллект начинает обучать искусственный интеллект. В этом смысле исследования по повышению качества поиска выходят на метауровень, и находятся сейчас (2017 год) на нем, отсюда появление приставок «мета». А значит, LSI-оптимизация должна становиться все органичней и глубже, иначе не будет работать.

 

Сколько факторов ранжирования сайтов использует Яндекс?

По информации на 4 августа 2016 года, Яндекс использует примерно 1500 факторов (это видно на 14-й секунде 11-й минуты).

 

Внутренние факторы ранжирования глазами SEO-аналитиков

Довольно абстрактный тезис о том, что контентное видение очень важно для продвижения в поисковой выдаче, недавно нашел очередное экспериментальное подтверждение. Команда сервиса Ahrefs.com провела исследование связи между высокими позициями в выдаче Гугла и различными внутренними факторами SEO-оптимизации, проанализировав 2 миллиона поисковых запросов. Чтобы изучить только внутренние факторы и исключить влияние внешних факторов, сравнивались отдельно сайты, имеющие сопоставимую ссылочную массу. В результате получилось, что двумя самыми важными факторами являются возраст страницы и объем текста на странице. Другое, более позднее исследование этой же команды показало, что средний возраст страницы, необходимый для выхода в Топ-10 – примерно два с половиной года. Лишь 5,7% страниц удается выйти в первую десятку за первый год существования. Это не касается лишь очень низкочастотных запросов – по ним можно продвинуться буквально за пару недель, а то и быстрее. Для остальных время выхода, на которое можно ориентироваться, – два-три года. Время раскрутки страницы сайта зависит от авторитетности домена, но весьма не сильно.

Все остальные факторы, включая всем известное название веб-страницы (тег title), все же менее важны. Кроме того, корреляция отдельно считалась для запросов любой частотности, низко-, средне- и высокочастотных.



Корреляции между внутренними seo-факторами и позициями в поисковой выдаче

Что же из этого следует? По сути самое важное, что нужно делать, зная, что именно эти факторы наиболее важны, это развивать контентное видение, чтобы «застолбить территорию» раньше других. Так с течением времени статья будет набирать авторитет больше и больше, время будет работать на вас. Это самый главный вывод. После него дальше уже можно было бы ничего не писать, если бы не возникали вопросы. Но они возникают. Итак, что еще нужно делать, кроме того, что занять вовремя контентную территорию? Нужно в первую очередь «обживать» эту территорию, укреплять и развивать вглубь найденную тему. Сложно? Да! Непонятно, что делать? А как же. Но по-другому никак. Это единственный способ войти прочно в поисковую выдачу в 2017 году. И дальше в ней оставаться.

Итак, тема найдена, территория застолблена, что дальше? Нужно регулярно дополнять уже написанную статью. Самое важное здесь, стараться передать максимум информации минимумом слов. Я бы не советовал сразу писать статью объемом 3000 слов. Лучше сначала написать статью в 700 слов. Потом спустя какое-то время, когда понимание темы углубится, и появятся новые тезисы по теме, статью имеет смысл дополнить, и она станет объемом, скажем, 1200 слов. И так далее. Важно писать лишь тогда, когда есть, о чем сказать.

Часто спрашивают, как
поисковики поймут, какая статья «водянистая», а какая – содержательная и ценная для конечного пользователя, ведь роботы если и понимают смысл написанного, то точно не до конца? Для этого у поисковых систем есть несколько инструментов, используемых в комплексе. Во-первых, можно проверить частоту употребления различных групп слов – специализированных и общеупотребительных, например: если частоты у групп не попадают в диапазоны, характерные для заведомо содержательного текста, значит этот текст должен насторожить. Кроме того, поисковики учитывают поведение пользователя на странице и даже на части страницы: где пользователь останавливает мышку, скроллит вверх или вниз и как далеко. Все это видно, в частотности, на тепловых картах. Искусственный интеллект сведет все эти факторы вместе, так что если один из факторов не подтверждается другими – он это заметит. Пытаться его перехитрить – слишком сложная работа, проще и эффективнее дополнять статью ценной информацией по мере её поступления. Это работает уже сейчас и в ближайшие годы, по-видимому, будет работать все лучше и лучше. Как наработать контентное видение, мы в этой статье рассматривать не будем, сейчас мы лишь пытаемся разобраться, насколько обоснованно, что оно необходимо.

Итак, видим загодя отраслевой тренд, пишем про него проработанную детально статью, по мере появления новой содержательной информации дополняем статью и промоутируем заново. Всё.

А как же обстоит дело с остальными SEO-факторами?

Другие внутренние факторы SEO-оптимизации

Все остальное из внутренних SEO-факторов менее важно. Если коротко, игры с тегами, кроме title, мало эффективны. Думать о встречаемости ключевых слов непосредственно в тексте совсем не нужно, лучше ориентироваться на запрос (интент) пользователя. Прежде, чем перейти к деталям, напомним читателю, что из корреляции не обязательно следует причинно-следственная связь. Понимание этого важно для правильной интерпретации результатов проведенного эксперимента.

Итак, что же мы видим?

  • Корреляция позиций со вхождением ключевого слова в название домена одна из самых высоких из полученных в исследовании. Выше только корреляция с возрастом страницы. С одной стороны, мы можем сделать вывод, что нужно зашивать самые важные для сайта слова в название домена (главное, не переусердствовать, чтобы не попасть под фильтр EMD). С другой стороны, ясно, что практическое использование этой корреляции ограничено, так как в любом случае многого в домен не зашьешь, и поэтому придется «налягать» на другие SEO-факторы.
  • Ориентироваться на тайтл можно и нужно, более того, самое важное в нем должно быть размещено в начале: есть значимая корреляция между размещением в начале и более высокими позициями.
  • Как это ни странно высока связь между позициями и встречаемостью ключевых слов в описании картинок. Как это проинтерпретировать? Кажется, это тот самый случай, когда из корреляции не следует причинность. То есть, если на сайте со слабым контентом «вдруг» описать все картинки позиции вряд ли резко скаканут вверх. 
  • Тратить время на распределение ключевых слов по заголовкам (тег H1) и подзаголовкам (тег H2) полезно, но увлекаться особо не стоит, так как корреляция близка к ускользающей (отсутствующей?).
  • Танцевать с бубном вокруг частоты вхождения ключа в текст совсем не стоит - корреляция хоть и положительная, но очень-очень маленькая.
  • Вхождение в метаописание (метатег description) имеет почти такую же корреляцию, как и вхождение ключа в текст. Однако, работать над составлением метаописания все равно стоит, хотя бы и из других соображений: оно очень часто попадает в сниппет поисковой выдачи и, соответственно, «работает» на конверсию из поисковой выдачи в переходы на сайт.
  • И уж точно не стоит беспокоиться о том, что интересующее нас ключевое слово не встречается в первых ста словах: можно вставить ключ тогда, когда он нужен по смыслу.
  • Намеренно зашивать ключевые слова в URL тоже не стоит: корреляция вообще отрицательная. То есть, опять же, хуже от этого, скорее всего, не будет, но тенденция явно идет к более коротким и ёмким веб-адреса. С другой стороны, несмотря на то, что влияния на поисковую выдачу особо нет, включать в веб-адрес ключевые слова полезно с точки зрения конверсии, так как поисковики в сниппетах выделяют выделяют ключевые слова, присутствующие в запросе.
  • Самым, наверное, полемичным является то, что существует небольшая положительная корреляция между позициями и использованием защищенного протокола HTTPS. Совершенно не ясно, использование ли https приводит к повышению позиций или ресурсы, продвигаемые командой с хорошим SEO-видением, обладают не только хорошим контентом (что приводит к более высоким позициям), но и используют защищенный протокол как передовую фишку.
  • Самым неожиданным, по-видимому является то, что есть очень небольшая, но все же положительная корреляция между высокими позициями и исходящими ссылками на авторитетными сайты. Опять же не ясно, что является причиной чуть более высоких позиций, но, в любом случае, подтверждение тезисов авторитетными источниками – явно тренд.
  • Еще стоит развенчать широко распространенный миф о том, что нужно скорость загрузки страницы улучшать и улучшать. В исследовании прямо сказано, что если сайт является ужасающе медленным, настолько, что это будет сильно раздражать пользователей, то это, скорее всего, негативно скажется на ранжировании. Но если сайт не вызывает ощущения явно медленного, то несколько отвоеванных миллисекунд никак не скажутся на ранжировании.

«And according to the results of our research, the correlation of this on page factor with higher position in Google is very small.


Sidenote.
We’ve only studied the load speed of the base HTML code of the page. Ahrefs crawler doesn’t download any images, css, js, etc».

Таким образом, из это следуют следующие рекомендации относительно погони за скоростью:

«I believe that if your site is utterly slow (to the point when it starts to irritate your visitors) it would be totally fair if Google would give a (very small) bit of preference to sites that are faster than yours.

But if your site loads “fast enough” to keep your visitors happy, optimizing it even further and cutting down on a few dozen milliseconds might not be the best use of your time and resources».

 

Периодическая таблица факторов сайта

Сайт Search Engine Land, один из крупнейший сайтов в английском языковом разделе интернета, опубликовал интересную инфографику под названием «Периодическая таблица факторов SEO». Представим её Вам:

Периодическая таблица факторов поискового продвижения

 

На картинке мы можем увидеть разделение факторов на те, которые располагаются на продвигаемой странице и те, которые имеют отношение, но при этом не «располагаются» на странице напрямую. Вначале перечислим группы факторов, которые располагаются на продвигаемой странице:

  1. Контент
    • Качество контента
    • Исследование контента на предмет ключевых слов, может ли пользователь по ним найти, то что его интересует в этом тексте
    • Ключевые слова есть ли они в тексте и не перебарщивает ли с ними автор текста
    • Привлекательность контента. Интересен ли этот контент пользователям
    • Свежесть тем: обсуждается ли что-то новое в этом тексте или только обмусоливается вопрос бытия и сознания.
    • Тощий ли контент: насколько большая статья раскрывает ту или иную тему
    • Реклама: содержится ли в тексте рекламная информация
  2. HTML простроенность страницы
    • Тайтлы : совпадают ли заголовки первого уровня с запросами или нет
    • Дескрипшн: заполнен ли дескрипшн, если заполнен, то как.
    • Хедеры: есть ли в тексте заголовки второго и третьего уровня, показывающие разбитость текста, его структурную простроенность.
    • Структура: простроенность страницы в целом
    • Начинка: (stuffing), чрезмерное использование ключевых слов.
    • Скрытые слова: используются ли на странице скрытые слова и тексты. То есть, показывается ли поисковому боту и человеку разные тексты или нет. Например, текст с высотой букв в 1 пиксель.
  3. Архитектура страницы
    • Перемещение со страницы на страницу: насколько легко переходить с одной страницы на другую, можно ли в один клик попасть с любой страницы на любую
    • Дубликаты: в том случае, если один и тот же контент располагается на разных страницах, то следует указывать, какая из страниц является оригинальной и, на которую можно ориентироваться.
    • Урлы: используются человеко-понятные урлы или нет. Для русскоязычного раздела интернета следует использовать кириллические урлы
    • Мобильная версия сайта: есть ли она, удобно ли заходить с телефона на этот сайт или нет.
    • Клоакинг: используются ли разные страницы для поискового бота и для человека

Если рассматривать список факторов, которые не располагаются на странице, то можно выделить следующую структуру:

  1. Ссылки
    • Качество: есть ли внешние ссылки на ресурс, который продвигается, и каково качество этих ссылок. С каких ресурсов идут эти ссылки, с уважаемых сайтов или с линкоферм.
    • Текст: даются ли ссылки в анкорном тексте или нет.
    • Количество. Количество ссылок на ресурс
    • Купленные ссылки: покупаются ли ссылки или нет
    • Спамные ссылки: висят ли на сайте ссылки, ведущие на спам-ресурсы
  2. Доверие
    • Авторитетность сайта: есть ли у сайта какие-либо подтверждающие его надежность факторы. Например, расшэренные страницы, лайки в социальных сетях, ссылки на этот ресурс.
    • История: давно ли существует сайт, какая у него история
    • Идентификация: идентифицируются ли авторы сайта. Открыта ли информация относительно владельцев домена. Здесь имеется в виду тот факт, что если информация о владельце открыта, то это положительно влияющий фактор. Таким образом владелец подтверждает, что он владеет только одним сайтом по какой-то тематике.
    • Пиратский контент: присутствует ли он
  3. Социальные факторы
    • Репутация сайта в соцсетях
    • Шэры в социальных сетях
  4. Персональные факторы
    • Страна, в которой сайт зарегистрирован
    • Локализация: город, регион, в котором сайт располагается. Это важно для различных сайтов магазинов, которые предоставляют свои услуги в определенном месте, соответственно локализации.
    • История: насколько регулярно сайт посещается, есть ли посетители, для которых этот сайт является одним из приоритетных в их веб-серфинге.
    • Социальный фактор: хорошо ли ваши друзья оценивают Ваш сайт. 

Авторы периодической таблицы факторов решили вспомнить и поиграть с таким химическим качеством, как валентность. Они разбили факторы на 6 категорий и присвоили факторам значения положительного или отрицательного влияния на позиции сайта. Попробуем составить списки факторов, по принципу качества и степени влияния на позиции в выдаче:

  1. Факторы с влиянием +3:
    • Факторы, располагающиеся на странице:
      1. Качество контента
      2. Исследование
      3. Заголовки
      4. Легкость перемещения со страницы на страницу
    • Факторы, не располагающиеся на странице:
      1. Качество ссылок
      2. Авторитетность
      3. Страна
      4. Локализация в регионе или городе
      5. История
  2. Факторы с влиянием +2:
    • Факторы, располагающиеся на странице:
      1. Ключевые слова в контенте
      2. Свежесть тем
      3. Интересный контент
      4. Дескрипшн
      5. Дубликат
    • Факторы, не располагающиеся на странице:
      1. Анкорный текст
      2. Репутация в социальных сетях
      3. Социальный фактор (из персональных)
  3. Факторы с влиянием +1:
    • Факторы, располагающиеся на странице:
      1. Подзаголовки
      2. Структура страницы
      3. Скорость загрузки
      4. Урлы
      5. Мобильная версия
    • Факторы, не располагающиеся на странице:
      1. Количество ссылок
      2. История ресурса
      3. Идентификация
      4. Шэры в социальных сетях
  4. Факторы с влиянием -1:
    • Факторы, располагающиеся на странице:
      1. Реклама в тексте
      2. Начинка
      3. Спрятанные слова, замаскированные текст
    • Факторы, не располагающиеся на странице:
      1. Пиратский контент на сайте
  5. Факторы с влиянием -2:
    • Факторы, располагающиеся на странице:
      1. Тощий контент
    • Факторы, не располагающиеся на странице:
      1. Спам
  6. Факторы с влиянием -3:
    • Факторы, располагающиеся на странице:
      1. Клоакинг
    • Факторы, не располагающиеся на странице:
      1. Купленные ссылки 

 

Важными факторами продвижения сайта в поиске являются структурная связность сайта и семантическая целостность и полнота контента. Что же такое и как этого добиться?

 

200 SEO-факторов

Недавно вышла статья Брайана Дина, в которой перечислялись те самые 200 факторов, которые учитывает Гугл при оценке качества сайта. Ниже приведены факторы из этого списка, не упоминавшиеся ранее в данной статье. В оригинальной статье они даны одноуровневым списком, здесь они разбиты по категориям для более легкого восприятия информации.

  • Доменные факторы
    1. Возраст домена, он влияет, но как сказал сам Мэтт Катс, не сильно
    2. Ключевые слова в имени домена (особенно ключевые слова в начале доменного имени) положительно влияют на оценку
    3. Оплачен ли домен на время вперед или нет (ценные домены оплачиваются загодя)
    4. Банятся домены, названия которых заточены под узкий запрос (Exact-match domain – это новый фильтр гугла, нацеленный на такие левые сайты)
    5. Припаркованные домены гугл не очень жалует
    6. Подозрительный владелец домена
    7. Домен первого уровня также играет роль: повышает позицию в выдаче по региону (например, ru, но отрицательно сказывается на международной выдаче)
    8. Авторитетность доменного хостинга
    9. Доверие к домену
    10. Местонахождение сервера
  • Ссылочные факторы
    1. Не перебарщивайте с исходящими ссылами
    2. Количество внутренних ссылок, отправляющих на страницу (отображают важность страницы)
    3. Неработающие ссылки вредят оценке сайта
    4. Не следует перебарщивать с партнерскими ссылками (также слова «партнерский», «спонсорский» рядом с ссылкой понижают её вес)
    5. Ссылки со старых доменов ценятся выше
    6. Ссылки с Википедии демонстрируют качество сайта, хотя и содержат rel=nofollow
    7. Ссылки с различных сайтов ценятся выше, чем ссылки с однотипных
    8. Количество ссылающихся веб-страниц на сайт
    9. Ссылки, которые идут с сайтов, зарегистрированных на доменах .edu .gov придают вес сайту
    10. Ссылки с конкурирующих сайтов
    11. Ссылки с авторитетных доменов ценятся выше
    12. Ссылки со страниц с высоким PageRank ценятся выше при оценке
    13. Разнообразие ссылок и разнообразие источников ссылок на сайт
    14. Ссылки с недобросовестных сайтов отрицательно влияют на оценку
    15. Ссылка на страницу вписана в текст положительной окраски или нет. Касается ссылок из блогов, постов, статей.
    16. Место положение ссылки на странице также влияет (внутри контента ценится выше, чем вне)
    17. Ссылки с топовых ресурсов (типа агрегаторов)
    18. Скорость распространения ссылок (чем выше, тем лучше)
  • Факторы, касающиеся формального (технического) устройства сайта
    1. Скорость загрузки
    2. Макет страницы (чем он лучше, тем выше оценка страницы)
    3. Карта сайта (также на вес страницы может влиять её приоритетность на карте сайта)
    4. Ошибки в HTML
    5. Юзабилити
    6. Мобильные версии сайтов начинают влиять на оценку все больше и больше
    7. Слишком длинный урл отрицательно влияет на оценку сайта
    8. Страницы «Политика конфиденциальности», «Правила сайта» прибавляют веса
    9. Использование Гугл аналитикс и Гугл для вебмастеров положительно влияет на оценку
    10. Не используйте 301 редирект слишком много
  • Факторы, касающиеся контента
    1. Тайтлы должны не только содержать ключевые слова, но и начинаться с ключевых слов
    2. Количество ключевых слов в контенте (не перебарщивать с ними)
    3. Обновление контента (лучше всего «идут» старые страницы, которые регулярно обновляют какие-то части контента)
    4. Наличие ключевых слов в первых 100 словах статьи положительно влияет на оценку страницы
    5. Порядок совпадения ключевых слов страницы. Если ключевые слова употреблены также как и в запросе – это плюс
    6. Изображения, видео (предпочтительнее использовать Youtube) и аудио на странице с контентом также добавляют баллов в копилку
    7. Оригинальность, грамотность и орфография
    8. Страницы лучше разбивать по категориям
    9. Указывание источников информации на страницы (отсылка к академической статье – идеальный источник)
  • Факторы, связанные с социальными сетями
    1. Наличие страниц в соцсетях
    2. Отзывы посетителей
    3. Количество комментариев
    4. Страницы в соцсетях (фейсбук, твиттер) лайки и шейры с них
    5. Ссылки из блогов
    6. Количество твитов
    7. Авторитетность твиттер-аккаунтов и аккаунтов соцсетей в целом
    8. Факторы релевантности социальных сетей
  • Поведенческие факторы
    1. Посещение
    2. Повторные посещения
    3. Показатель отказов
    4. Время нахождения на сайте
  • Факторы брендов
    1. Привычные выражения, обозначающие бренд положительно влияют при написании о нем
    2. Сотрудники компании, зарегистрированные в Linkedin
    3. Упоминание о компании в новостных сайтах
    4. Количество RSS подписчиков
    5. Цитирование брендов, непривязанных к ссылкам
    6. Упоминание компании в списке Google+
    7. Связан ли сайт компании с платящим налоги предприятием
 

Выводы относительно факторов продвижения сайтов

Рассмотрев различные виды факторов, основным выводом относительно их существования и дальнейшего развития интернет поиска может стать то, что особое внимание постепенно переключается от внешних факторов к внутренним. Машинные алгоритмы все больше становятся «похожими на людей», поисковики стремятся перестать уже наконец учитывать ссылки и оценивать сам сайт, его наполнение, тексты, его образующие. Вероятно, в будущем поисковики будут смотреть еще на того, кто этот самый текст написал. Сейчас Гугл активно склоняет пользователей к тому, чтобы не просто писать статьи, а еще и указывать свое авторство, которое может быть подтверждено через аккаунт социальной сети гугл плюс или через почту, в том же домене, на котором располагается и сайт со статьями. Вполне возможно, что через какое-то количество лет поисковики сами будут формировать статьи, которые будут собраны как мозаика из отдельных суждений различных авторов. Суждения эти можно будет описывать в тексте и пояснять, что это именно суждение и доказательство к нему через внедрение микроразметки, которая со временем будет иметь словарь не только для того, чтобы пометить адрес, телефон, издательство или год выхода того или иного фильма, а еще и для выделения смысловых отрывков в тексте статей. Так что на данном этапе лучше заботиться в первую очередь не о количестве ссылок на свой сайт и не о том, сколько ключевых слов указано в соответствующем теге или на единицу площади текста, а о структурной связности статей и их соотношении по количеству запросов в месяц.

 

Источники и материалы про факторы продвижения сайтов

 

Смотрите также по смежным темам

 
Сергей Салтыков – SEO-консультант
 
Сергей Салтыков – консультант по SEO, SEO-практик, экс-доцент НИУ ВШЭ. Автор прикладных и научных статей по SEO.

 

 

 

 
 
 
Основные статьи

Как продвинуть сайт самому

SEO-алгоритмы

SEO-стратегии

SEO

SEO-аудит

SEO-консультации

Курсы по SEO

SEO-портфолио и отзывы

SEO-услуги и цены

Кластеризация семантики сайта

SEO-факторы

  

Статьи на блоге Devaka.Ru

Google-определения

Постинг в Google+

Метрика опасности ссылок

 

Шпрингер: научные статьи

Typology of SEO-Strategies

 
 
 

Нужна помощь? Закажите seo-консультацию и seo-аудит по почте sergey.saltykov@gmail.com или в соцсетях – vk.com/sergiustoday и fb.com/sergey.saltykov.75 – прямо сейчас!

Читать в Телеграме – t.me/seotuition