Джон Мюллер в ответе на вопрос о копированном контенте указывает, что иногда копия оказывается более релевантной, нежели оригинальное размещение. Эксперт рассказывает о типах копирования и как Google относится к такому явлению.
Вебмастер интересовался, как Google отличает копию от первоисточника. Мюллер указывает, что основной принцип определения — сравнение. Но при обнаружении копированного контента, Google оценивает и сам сайт, где размещена копия.
Google не способен определить первоисточник
В ответе Мюллер признается, что Google не способен определить первоисточник, потому как процесс достаточно сложный.
Почему копированный контент может быть релевантнее оригинала
Мюллер приводит пример официального блога Google и других сайтов, заимствующих его контент, которые ранжируются выше самого блога.
В примере с постами в блоге Мюллер указывает, что часто при копировании авторы добавляют много полезных деталей, которые повышают полноту и ценность информации.
Когда пользователь ищет информацию, ему может быть интересен именно оригинальный источник либо дополненные данные.
Иногда оригинал не значит лучший, когда кто-то ищет эту информацию.
Цитирование источника и комментирование такого заимствования рассматривается как честное, законное использование. Мюллер указывает, что большее значение имеет то, как контент соответствует намерению пользователя.
Иногда это ответы на вопросы почему и что, которые предполагал пользователь, когда вводил поисковый запрос, которые лучше раскрываются в тексте копии, чем в оригинальном источнике.
Итак, Мюллер указывает, что копированный контент может быть релевантнее оригинала. Но эксперт указывает, что есть два типа копирования:
- полное — когда копия технически совпадает с оригинальным контентом;
- частичное — когда материал дополняется полезной информацией. Это могут быть наблюдения автора, ссылки на похожие события, новости, тематические страницы, мнения других экспертов и прочая информация, которая повысит ценность контента.
Опыт показывает, что даже полное заимствование часто для Google не становится преградой отранжировать копированную версию выше (в статье о проверке качества контента мы показывали пример). Из этого можно сделать 2 вывода:
- уникальность контента — слабый фактор ранжирования, он учитывается, но далеко не в первую очередь;
- факторы авторитетности сайта — возраст, ссылки — имеют намного больший вес, чем техническая уникальность контента. Это подтверждает Мюллер, указывая, что Google оценивает и сам сайт при оценке контента.
Расскажите о своем опыте, были ли случаи заимствования контента с ваших сайтов? Как ранжировалась копия относительно оригинала? Что предпринимали?
Эта новость также доступна на Дзен-канале Миралинкс!
«Google не способен определить первоисточник, потому как процесс достаточно сложный» — это всё что нужно знать о гугле! 🙂
Вообще гугл в последнее время странно себя ведёт, деградирует.
С индексацией понятно, пока видать нету такого процессора что-бы в один день все сайты пинговал, вот не понятно почему они дату не принимают как доки?
Всё они прекрасно знают и могут определять первоисточник по времени и дате индексации (на то они и поисковики). Просто выбор делается в пользу более коммерчески выгодных (или по другим мотивам выгодных) страниц.
Расскажу о своем опыте: например, на нашем ресурсе SHOPTOP (Рейтинг интернет-магазинов), пользователи оставляют отзывы об интернет-магазинах, оставляя при этом свой текст-комментарий-отзыв. Очень часто также такой же текст отзыва они копируют и оставляют и на других сайтах отзывов, так что иногда получается один и тот же контент на нескольких сайтах. Что мы заметили и к каким выводам пришли? Если текст только частично скопирован, то есть, например, есть 20 отзывов, а 5 из них полная копия на нашем сайте и на других — это не мешает странице хорошо ранжироваться, но если весь текст страницы — копия, тогда дело плохо, страница в таком случае выпадает из ТОПа. Выводы: даже если текст скопировали, разбавляйте и дополняйте его другой ценной информацией.
Спасибо за такое ценное дополнение!
Скоро первое поколение СЕОшников состарится, а «умный» Гугл так и не научится ранжировать оригинал выше копипастов.
Траст сайта — значение выше, чем оригинальная идея первоисточника, да-да, есть миллион примеров и это крайне печально.
Совет г-ну (тут много вариантов вместо черточки;)) Мюллеру, используйте дату первой индексации контента, еще часто в самой статье есть дата публикации, но «ИМ» как-то на это плевать.
Уже на дворе скоро 2021, а тут те же лыжи как в 2012 до Панд и Пингвинов — БЕДА просто (хочется кричать!)
В нашей практике тоже есть примеры, когда оригиналы статей ранжировались ниже копий. И да, траст сайта определяет в таком случае позиции.
Легко изменить «datePublished»: «2020-10-27», «dateModified»:»2020-10-27″, да и Вебкеш не всегда правильно отображает первоисточник.
Главная цель ранжировать выше не первоисточник а то, что более полезно пользователю.
По поводу траста.. Если сайт новый, а страницы похожи со старым сайтом, то по низкочастотным выходит в топ новый сайт. Не морда сайта, а именно страницы.
А если два равных трастовика, с копированными страницами, то в том выходит более свежая… Но это неточно 🙂
Использование первой даты индексации спорный совет, у меня на новостном сайте индексация происходит за минуту после размещения, а на многих блогах с небольшим количеством контента (даже отличного качества) индексация может занимать часы или даже дни. Соответственно если я буду регулярно отслеживать появление нового контента на таких сайтах и копировать к себе, то для гугла я во многих случаях стану первоисточником.
Ну а учет даты публикации в статье — это совсем ерунда. Если так делать, то на половине сайтов в интернете датой публикации всех материалов станет 01.01.1970.
Опыта заимствования контента с моих проектов не было. Но информация в статье правдивая. Не раз видел и вижу примеры, когда сайт с полностью скопированными текстами (особенно описаниями товаров), сотнями и тысячами таких текстов — стабильно в ТОПе годами.
>> (особенно описаниями товаров)
для коммерческих сайтов это нормально, для них в фаворе далеко не оригинальность.