Уникальность – один качественных показателей контента , отражающий количественную долю повторений опубликованной информации на других сайтах в интернете. Чаще всего свойство уникальности относится к текстам, хотя может быть применено и к графическому контенту, видео, аудио и информации в любом формате.
Уникальность тестов выражается в процентах и, предположительно – влияет на ранжирование контента и сайтов в поисковых системах. Хотя абсолютной ясности в этом вопросе не существует. Реальные алгоритмы поисковых систем не известны никому за пределами рабочих кабинетов Яндекса и Google.
Как оценивается уникальность
Для определения процентного содержания заимствованного контента существуют разные программы и онлайн-сервисы, каждые из которых используют собственные принципы и алгоритмы.
- Это могут быть законы Зипфа, с сегментацией текстов по шинглам – блокам из заданного количества слов.
- Другие сервисы используют семантический анализ и делают акцент на информационную уникальность.
- Третьи просто проверяют наличие одинаковых кусков текста в интернете.
Проблемы возникают, когда автор статьи, с целью повысить качество информации, использует ссылки и цитаты из сторонних источников. Что это – плагиат или экспертный уровень подачи сведений?
Лучшие из программ для определение текстового плагиата имеют базы данных общеупотребительных оборотов, идиом, терминологии, способны определять “добросовестные цитирования”.
Еще один из проблемных вопросов относится к размещениям спецификации товаров в интернет-магазинах. Каким образом можно обеспечить уникальность в технических данных продукта, продаваемого на сотнях электронных площадок?
Влияние уникальности на поисковое продвижение
Есть основания полагать, что программисты поисковых систем отлично понимают перечисленные выше проблемы с уникальностью и не пессимизируют сайты по результатам только лишь машинной проверки уникальности. При определении качества контента используется целый комплекс взаимосвязанных параметров.
- Поведенческие факторы – могут ли пользователи эффективно решать свои задачи на сайте?
- Насколько авторитетные источники цитируются?
- Каков авторитет и траст самого ресурса, допустившего копипаст.
В отношении последнего пункта – на более известных и старых сайтах процесс индексации апдейтов происходит значительно быстрее, чем на молодых проектах. Таким образом, даже если новый автор опубликовал совершенно уникальную статью, а ее перепечатали на более трастовых ресурсах – приоритет индексами, а следовательно и авторства будет за корифеями.