Новости поиска

Google: копированный контент иногда релевантнее оригинала

16.12.2020 by newsmaker 11 комментариев

Джон Мюллер в ответе на вопрос о копированном контенте указывает, что иногда копия оказывается более релевантной, нежели оригинальное размещение. Эксперт рассказывает о типах копирования и как Google относится к такому явлению.

Вебмастер интересовался, как Google отличает копию от первоисточника. Мюллер указывает, что основной принцип определения — сравнение. Но при обнаружении копированного контента, Google оценивает и сам сайт, где размещена копия.

Google не способен определить первоисточник

В ответе Мюллер признается, что Google не способен определить первоисточник, потому как процесс достаточно сложный.

Почему копированный контент может быть релевантнее оригинала

Мюллер приводит пример официального блога Google и других сайтов, заимствующих его контент, которые ранжируются выше самого блога.

В примере с постами в блоге Мюллер указывает, что часто при копировании авторы добавляют много полезных деталей, которые повышают полноту и ценность информации.

Когда пользователь ищет информацию, ему может быть интересен именно оригинальный источник либо дополненные данные.

Иногда оригинал не значит лучший, когда кто-то ищет эту информацию.

Цитирование источника и комментирование такого заимствования рассматривается как честное, законное использование. Мюллер указывает, что большее значение имеет то, как контент соответствует намерению пользователя.

Иногда это ответы на вопросы почему и что, которые предполагал пользователь, когда вводил поисковый запрос, которые лучше раскрываются в тексте копии, чем в оригинальном источнике.

Итак, Мюллер указывает, что копированный контент может быть релевантнее оригинала. Но эксперт указывает, что есть два типа копирования:

полное — когда копия технически совпадает с оригинальным контентом;
частичное — когда материал дополняется полезной информацией. Это могут быть наблюдения автора, ссылки на похожие события, новости, тематические страницы, мнения других экспертов и прочая информация, которая повысит ценность контента.

Опыт показывает, что даже полное заимствование часто для Google не становится преградой отранжировать копированную версию выше (в статье о проверке качества контента мы показывали пример). Из этого можно сделать 2 вывода:

уникальность контента — слабый фактор ранжирования, он учитывается, но далеко не в первую очередь;
факторы авторитетности сайта — возраст, ссылки — имеют намного больший вес, чем техническая уникальность контента. Это подтверждает Мюллер, указывая, что Google оценивает и сам сайт при оценке контента.

Расскажите о своем опыте, были ли случаи заимствования контента с ваших сайтов? Как ранжировалась копия относительно оригинала? Что предпринимали?

Эта новость также доступна на Дзен-канале Миралинкс!

10+

11 комментариев

Лабуда 17.12.2020 at 17:47

«Google не способен определить первоисточник, потому как процесс достаточно сложный» — это всё что нужно знать о гугле! 🙂
Вообще гугл в последнее время странно себя ведёт, деградирует.

0
Дмитрий 17.12.2020 at 16:41

С индексацией понятно, пока видать нету такого процессора что-бы в один день все сайты пинговал, вот не понятно почему они дату не принимают как доки?

0
Антон 17.12.2020 at 08:41

Всё они прекрасно знают и могут определять первоисточник по времени и дате индексации (на то они и поисковики). Просто выбор делается в пользу более коммерчески выгодных (или по другим мотивам выгодных) страниц.

0
SHOPTOP 16.12.2020 at 18:34

Расскажу о своем опыте: например, на нашем ресурсе SHOPTOP (Рейтинг интернет-магазинов), пользователи оставляют отзывы об интернет-магазинах, оставляя при этом свой текст-комментарий-отзыв. Очень часто также такой же текст отзыва они копируют и оставляют и на других сайтах отзывов, так что иногда получается один и тот же контент на нескольких сайтах. Что мы заметили и к каким выводам пришли? Если текст только частично скопирован, то есть, например, есть 20 отзывов, а 5 из них полная копия на нашем сайте и на других — это не мешает странице хорошо ранжироваться, но если весь текст страницы — копия, тогда дело плохо, страница в таком случае выпадает из ТОПа. Выводы: даже если текст скопировали, разбавляйте и дополняйте его другой ценной информацией.

0
- newsmaker 18.12.2020 at 11:18
  
  Спасибо за такое ценное дополнение!
  
  0
tisua 16.12.2020 at 16:05

Скоро первое поколение СЕОшников состарится, а «умный» Гугл так и не научится ранжировать оригинал выше копипастов.
Траст сайта — значение выше, чем оригинальная идея первоисточника, да-да, есть миллион примеров и это крайне печально.
Совет г-ну (тут много вариантов вместо черточки;)) Мюллеру, используйте дату первой индексации контента, еще часто в самой статье есть дата публикации, но «ИМ» как-то на это плевать.
Уже на дворе скоро 2021, а тут те же лыжи как в 2012 до Панд и Пингвинов — БЕДА просто (хочется кричать!)

5+
- newsmaker 16.12.2020 at 16:11
  
  В нашей практике тоже есть примеры, когда оригиналы статей ранжировались ниже копий. И да, траст сайта определяет в таком случае позиции.
  
  1+
- Ilonka 17.12.2020 at 16:13
  
  Легко изменить «datePublished»: «2020-10-27», «dateModified»:»2020-10-27″, да и Вебкеш не всегда правильно отображает первоисточник.
  
  Главная цель ранжировать выше не первоисточник а то, что более полезно пользователю.
  
  По поводу траста.. Если сайт новый, а страницы похожи со старым сайтом, то по низкочастотным выходит в топ новый сайт. Не морда сайта, а именно страницы.
  
  А если два равных трастовика, с копированными страницами, то в том выходит более свежая… Но это неточно 🙂
  
  0
- Alb 18.12.2020 at 00:49
  
  Использование первой даты индексации спорный совет, у меня на новостном сайте индексация происходит за минуту после размещения, а на многих блогах с небольшим количеством контента (даже отличного качества) индексация может занимать часы или даже дни. Соответственно если я буду регулярно отслеживать появление нового контента на таких сайтах и копировать к себе, то для гугла я во многих случаях стану первоисточником.
  Ну а учет даты публикации в статье — это совсем ерунда. Если так делать, то на половине сайтов в интернете датой публикации всех материалов станет 01.01.1970.
  
  0
Дмитрий 16.12.2020 at 14:46

Опыта заимствования контента с моих проектов не было. Но информация в статье правдивая. Не раз видел и вижу примеры, когда сайт с полностью скопированными текстами (особенно описаниями товаров), сотнями и тысячами таких текстов — стабильно в ТОПе годами.

2+
- Евгений 16.12.2020 at 23:09
  
  >> (особенно описаниями товаров)
  
  для коммерческих сайтов это нормально, для них в фаворе далеко не оригинальность.
  
  1+

Google: копированный контент иногда релевантнее оригинала

Google не способен определить первоисточник

Почему копированный контент может быть релевантнее оригинала

11 комментариев

Рубрики

Ссылки