Rel canonical тега link. WordPress и канонические URLs: Когда и как их использовать

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Канонический URL – помощник в борьбе с дублированным контентом

Многие современные CMS (системы управления контентом сайта) могут создавать . Это приводит к тому, что страница сайта может существовать в сети под двумя и более различными адресами. Поисковые системы негативно относятся к дублированному контенту и понижают его в выдаче. Поэтому одна из первостепенных задач вебмастера – любым доступным способом избавиться от страниц-дублей.

Больше видео на нашем канале - изучайте интернет-маркетинг с SEMANTICA

Пример дубля web-документа

Стартовая страница интернет ресурса может быть доступна по нескольким адресам:

primer.ru
ru/index.php

Поисковый робот распознает эти адреса, как четыре разных web-документа с идентичным содержанием.

Что такое канонический URL

Атрибут позволяет указать поисковому роботу каноническую, то есть основную версию документа. Этим атрибутом потребуется пометить не только основную продвигаемую страницу интернет проекта, но и ее дубли. Если робот найдет на сайте копии канонической страницы, то он пометит их, как малозначительные. Канонический – это самый легкий метод борьбы с дублированным контентом.

Как работает каноническая ссылка

Предположим, у нас есть основная страница http://yoursite.ru/statya1 , которую также можно найти еще по нескольким адресам:

Чтобы указать поисковику каноническую страницу, нужно в код каждого из вышеуказанных документов добавить следующую строчку:

Этот фрагмент кода следует поместить между тегами . Это увеличит шансы на то, что в результатах выдачи будет отображаться основной документ, а не его дубли. Нужно отметить, что атрибут rel="canonical" принимается во внимание большинством современных поисковых систем.

Почему CMS создают дубли

Не нужно полагать, что система управления контентом намеренно генерирует дубли страниц. Обычно такие копии создаются вследствие некорректной настройки CMS. К самым распространенным причинам появления дублей относятся:

создание архивов из старых статей;
наличие открытых ссылок на документы в PDF-версии (для печати);
неправильная структура сайта, добавление одинаковых страниц в разные категории;
наличие динамических URL (характерно для интернет-магазинов).

Чтобы выявить дубликаты страниц и использовать атрибут rel canonical, можно воспользоваться инструментами Google для вебмастеров. Нужно перейти на вкладку «вид в поиске» и кликнуть по ссылке «оптимизация Html». В открывшемся разделе указаны страницы с повторяющимися метаописаниями. Такие документы нередко имеют дублированный контент.

ПС Google советует не указывать атрибут rel="canonical" в качестве директивы для robots.txt. Это может вызвать проблемы с индексацией сайта. Нельзя указывать разные канонические урлы для одной страницы (к примеру, один URL в карте сайта, а другой – непосредственно в разделе страницы).

Чтобы снизить вероятность ошибки при индексации сайта, следует указывать в качестве атрибута link rel абсолютные, а не относительные пути. Иными словами, вместо структуры /blog/page-1 нужно использовать полный адрес http://yoursite/blog/page-1.

Поисковые системы очень негативно относятся к дублированию контента и постоянно борются с этой проблемой. Уникальность контента - основная его ценность, и за копии можно легко попасть под санкции. Чтобы этого избежать, можно использовать несколько методов борьбы с дублями. В этой статье разберем один из них - канонические URL.

Существует несколько причин образования дублей, например, CMS могут создавать дополнительные копии, где страница доступна по адресу с www и без. Особенно часто копии возникают в интернет-магазинах, где страницы товара отличаются только фотографией.

Канонический URL - это предпочитаемый адрес страницы, то есть, именно он будет индексироваться из группы схожих.

Канонический URL в борьбе с дублями.

Допустим, есть несколько адресов, ведущих на одну и ту же страницу:

mysite.ru/main
mysite.ru/blog/2364
mysite.ru/blog/page?id=2364

Если мы хотим индексировать только одну из них, необходимо использовать атрибут rel=canonical .

Например, если основной является страница - mysite.ru/main, тогда в коде двух других появится строчка:

Стоит отметить, что поисковые системы не гарантируют стопроцентного следования данному правилу. Однако, если вы не укажете каноническую страницу, то ПС может сделать это сама. В этом случае вы потеряете контроль над индексацией, так как поисковый робот выберет страницу рандомно и занесет в индекс.

Злоупотреблять атрибутом rel=canonical также не стоит. Встречались сайты, которые теряли позиции в результатах поиска после того, как разработчики ошибочно записывали в rel=canonical всех страниц сайта одинаковый url.

Как правильно использовать канонические урлы?

Выберите основную страницу (каноническую).
Используйте атрибут rel=canonical для указания на нее с других страниц - дублей. Важно прописывать абсолютные пути: http:// mysite.ru/blog/page?id=2364, а не /blog/page?id=2364.
Укажите канонические страницы в файле Sitemap.xml. Это не гарантирует правильную индексацию, но поможет поисковому роботу определить, какие страницы нужно считать основными.

В чем разница между канонической ссылкой и 301-редирект?

Различие в принципе их действия. Атрибут rel=canonical показывает поисковой системе, какую страницу нужно индексировать и отображать в поиске. Остальные страницы не ранжируются, но на сайте пользователю видны. При использовании 301-редирект, вас автоматически перенаправляют на основную страницу. Если рассматривать с позиции передачи веса, то оба варианта будут передавать определенную часть веса канонической странице.

Одновременное использование rel=canonical и 301-редирект может оказаться плохой идеей. Мы говорим о тех случаях, когда вы указываете на страницу, как на каноническую, перенаправляя с нее, в свою очередь, на другую 301-редиректом. Скорее всего, поисковый робот посчитает это ошибкой. Возможно, передаваемый вес потеряется внутри этой цепи, что приведет к потере позиций в выдаче. Лучше не соединять канонические ссылки в цепь, а использовать только в пределах одного шага до основной страницы.

И еще несколько правил

Не закрывайте канонические URL в файле robots.txt.
Следите, чтобы основной адрес в Sitemap.xml и в rel=canonical совпадали.
На странице может быть указана только одна каноническая.
Не стоит указывать канонической страницу с другого домена.

Использование канонических URL не обязательное правило. Но если у вас есть дублированный контент, лучше решить эту проблему самостоятельно. Иначе поисковая система решит ее по-своему.

Атрибут rel=canonical позволяет бороться с дублями страниц. Когда одно и то же содержимое доступно по разным URL, канонические ссылки указывают главную страницу. Эта страница (приоритетная) как раз и будет находиться в индексе поисковых систем и весь вес со страниц дубликатов будет перетекать на основную страницу.

Атрибут canonical прописывается на страницах дублей с указанием наиболее приоритетной страницы в разделестраницы вот так:

Данный тег прекрасно понимают все основные поисковые системы и канонические ссылки являются для некоторых типов страниц неотъемлемыми с точки зрения SEO оптимизации. Об этом всем мы с вами поговорим сегодня.

Rel canonical: что это

Когда на один и тот же контент можно попасть с помощью разных URL’ов, в индексе поисковых систем начинает участвовать сразу несколько страниц. В итоге ни одна страница толком не продвигается, так как внутренние ссылки идут то на одну страницу, то на другую.

Тоже самое касается внешних ссылок. Невозможно сосредоточиться максимально на продвижении одной страницы, а это в итоге не раскрывает потенциал страницы полностью. Или же, к примеру, покупаются ссылки на одну страницу, а на самом деле в индексе совершенно другая страница.

В результате чего сайт будет занимать позиции ниже, чем мог бы. Атрибут rel=canonical как раз позволяет нам оставить в индексе только самую приоритетную страницу. Также весь ссылочный вес передается на нее.

Чтобы в индексе была только одна страница, нужно прописать на страницах дубликатах в разделеканоническую ссылку на приоритетную:

Откуда могут появиться дублирующиеся страницы?

Если для удаления дублей, можно воспользоваться , я рекомендую в первую очередь обратить внимание на него. Если же 301 редирект не помогает или его использование неуместно, то на помощь можно позвать канонические ссылки, только будьте аккуратными.

Статья сайта относится к нескольким рубрикам

Партнерская программа

Когда реализуете партнерскую программу, часто много ссылок c “хвостами” начинают ссылаться на вас. Получается, что-то вроде этого: site.ru/?partner=id777. С подобных страниц тоже нужно прописывать атрибут canonical, чтобы они не попали в индекс.

Как правильно использовать rel=canonical

Как вы уже поняли, чтобы в индексе был только 1 вариант страницы, нужно со всех дублирующихся страниц проставить атрибут canonical. Вот как он должен выглядеть

Данный тег должен находиться внутри.

Как правильно выбрать канонический урл?

Каноническая страница – это та страница, которая рекомендуется поисковикам для индексации среди всех дублей. Какую же лучше выбрать?

Если страница раньше имела только 1 url, то лучше сделать канонической ее, так как скорей всего она уже проиндексирована, также имеет определенный вес. То есть с новой страницы проставить rel=canonical на старую.
Если же страницы создавались примерно в одно время, лучше каноническим URL сделать ту, которая находится в индексе.
Если же несколько страниц-дублей находится в индексе поисковиков, то лучше выбрать тот, который будет продвигаться. Чаще всего тот URL, который имеет меньше всего уровень вложенности, либо уже имеет входящие ссылки.
Если же все условия идентичные у страниц дублей, обычно берется за приоритетную страницу та, которая подходит под некий шаблон товара/статьи по сайту и предпочтение отдается единообразию.

Частые ошибки с атрибутом rel=canonical

Тег rel=”canonical” – это не строгая директива. Он лишь предлагает основную страницу для поисковиков, то есть просто-напросто советует.
Нельзя использовать другой домен в данном атрибуте. Допускаются ссылки только внутри домена или поддомены.
Для проставления канонических ссылок необязательно иметь 100% дублированный контент, если есть небольшие различия – это нормально. Такое может быть, когда продукты расставлены в другом порядке или поисковый робот посетил страницы в разное время, например.
Если документ по каноническому адресу недоступен (отдает 404 ошибку, допустим), то поисковики могут проигнорировать его.
Также поисковые роботы могут проигнорировать данный атрибут, если на странице указано несколько канонических урлов.
Для указания канонического ссылки допускается использовать не полный URL адрес, а относительный путь:
Но будьте аккуратны, можете “наломать дров”, лучше использовать полный URL, с указанием вашего домена.
Каноническая страница должна быть индексируемой.

Запомните: rel=canonical передает вес входящих ссылок .

Почитайте еще эти статьи (официальные руководства от Яндекса и Google):

Частные случаи использования rel=canonical

Сanonical сама на себя

Меня не раз спрашивали, можно ли ставить каноническую ссылку саму на себя? Такое обычно происходит при автоматической генерации с помощью разных плагинов или силами CMS. Ответ – да, можно, ничего в этом плохого нет.

Canonical для страниц пагинации

Многие вебмастера хотят сделать rel=canonical со страниц пагинации (site.ru/category/page/2) на первую страницу (site.ru/category). Это неправильно, как я считаю. Все-таки здесь встречаются не полные дубли, такие страницы пагинации лучше закрыть с помощью:

Многие SEO плагины для WordPress очень хорошо дружат с атрибутом rel=canonical. Мой любимый и, как я считаю, вообще ничего не требует. Просто достаточно его активировать и необходимые канонические URL сами прописываются.

В некоторых других SEO плагинах в настройках нужно просто поставить галочку напротив “Канонические страницы” (или еще что-то подобное).

То есть по умолчанию, если статья на моем блоге присвоена сразу к нескольким категориям, то автоматически прописывается каноническая страница..html у меня прописан следующий атрибут rel=canonical (обратите внимание, это другой URL):

По умолчанию, благодаря плагину Yoast SEO, если пост располагается сразу в нескольких категориях, в индекс же попадает только один вариант.

Выводы

Я надеюсь, что вполне понятно, смог объяснить, что такое атрибут rel=canonical и как им пользоваться. Настоятельно рекомендую ознакомиться вам еще с этим уроком: . Все эти действия с rel=canonical, 301-ым редиректом, meta name robots, файлом robots.txt позволят сделать выдачу вашего сайта “чистым”.

Я за “чистый” индекс без дублей, служебных страниц и пр. ненужных вещей. Благодаря чистоте SEO продвижение сайта будет проще и правильнее.

И еще: чтобы не было подобных заморочек я рекомендую будущие ваши сайты создавать без указания категорий в URL статей/товаров. То есть пусть будет что-то вроде:

site.ru/statya.html (для блогов);
site.ru/catalog/iphone6s (для интернет-магазинов).

Отдельное спасибо за ретвиты и репосты, мои друзья. Обязательно жду ваших мыслей в комментариях.

Если ваш сайт имеет идентичный или очень похожий контент, доступный по разным URL , тогда новый формат позволит указать тот URL , который должен возвращаться в поисковой системе. Также можно быть уверенным, что все характеристики, такие как ссылочный вес и т.д. передадутся на нужную версию адреса.

Теперь вы можете добавить этот тег, для указания вашей версии адреса, внутри тега на страницах с дублированным контентом:

Таким образом, Google поймет, что все дубликаты ссылаются на канонический адрес, указанный в теге. Дополнительные свойства адреса, такие как PageRank и связанные сигналы также перенесутся с дублированных страниц на указанную.

Подобный тег будет полезным в основном при использовании различных движков (phpBB, IPB , WordPress, и т.д., напр. сайту ipbskins.ru – разработка дизайна сайта на IPB , приходится использовать длинный robots.txt в целях избежания дублированного контента), создающих множество похожих страниц, например, это могут быть страницы:

печатной версии статьи:
http://site.ru/article01.html?print=true
текстовой версии статей для моб. телефонов:
http://site.ru/lofiversion/article01.html
дублированные из-за недостатка движка:
http://site.ru/articles/?id=1&category=new
http://site.ru/articles/?id=1&tag=keyword
и ряд других…

Этот стандарт может быть адаптирован любой поисковой машиной при индексации сайта.

Для популярного блог-движка WordPress уже разработан плагин canonical , вставляющий тег на нужные страницы. Другие популярные движки для блогов, форумов, интернет-магазинов и т.д. также в ближайшем будущем расширят свою функциональность (следите за обновлениями).

Ответы на некоторые популярные вопросы по тегу:

Является ли rel=“canonical” подсказкой или директивой?
Это подсказка, которую мы берем во внимание и во взаимодействии с другими сигналами вычисляем наиболее релевантную страницу для отображения в поисковых результатах.

Могу ли я использовать относительный путь для указания canonical, например так: ?
Да, относительные пути распознаются также, как и в обычном теге . Даже если вы введете тег с ссылкой на документ, тогда относительные пути будут считаться в соответствии с базовым URL .

Это нормально, если канонические адреса содержат не полностью дублированный контент?
Мы позволяем небольшие различия, такие как порядок сортировки в таблице продуктов. Также мы понимаем, что канонические адреса могут парситься роботом в разное время, поэтому все это нормально.

Что если rel=“canonical” возвращает 404 ошибку?
Мы продолжим индексировать ваш контент и использовать эвристический подход, для определения канонического адреса, однако, мы рекомендуем, чтобы вы использовали существующие URL в качестве канонических.

Что если rel=“canonical” ещё не проиндексирован?
Мы стараемся достучаться до канонического URL быстро. Как только мы его проиндексируем, тогда сразу же перерассмотрим подсказку rel=“canonical”.

Может ли канонический урл содержать редирект?
Да, вы можете указать редирект, в этом случае поисковая машина обработает просесс перенаправления как обычно и попытается проиндексировать новый адрес.

Что если я имею противоречивые сигналы для rel=“canonical”?
Наши алгоритмы мягкие: мы можем следовать по каноническим цепям, однако, мы настоятельно рекомендуем, чтобы вы на страницах указывали единственный канонический адрес, чтобы быть уверенным в оптимальном результате канонизации.

Может ли этот тег для ссылки предложить канонический адрес на совершенно другом домене?
Нет. Чтобы мигрировать на другой домен, более подходящ. В настоящее время Google поддерживает канонизацию внутри поддоменов или внутри одного домена. Таким образом, владельцы сайтов могут указать www.example.com вместо example.com или help.example.com , однако, не могут указать example.com вместо example-widgets.com .

Звучит интересно, но могу ли я увидеть пример?
Да, wikia.com помогла нам, как трастовый тестер. Например, вы замтетите, что исходный код по адресу http://starwars.wikia.com/wiki/Nelvana_Limited содержит rel=canonical http://starwars.wikia.com/wiki/Nelvana .

Два адреса почти идентичны, исключая то, что Nelvana_Limited, первый URL , содержит короткое сообщение возле заголовка. Это хороший пример использования тега в будущем. С rel=canonical, свойства двух адресов обьединяются и поисковые результаты отображают нужную версию.

Если у вас есть какие-либо вопросы по использованию нового тега, вы можете их задать в комментариях на официальном блоге Google для вебмастеров .

1. Помимо избавления от естественного дублированного контента (из-за недостатка движка), мы также избавляемся от дублированного контента искусственного, когда конкуренты нам пытаются насолить, добавляя в страницы с произвольными параметрами в URL .

2. Теперь нет надобности использовать robots.txt для запрета индексации таких страниц, как “печатная версия” и других дубликатов (напр. в WordPress нужно было закрывать путь /teg/) и угождать каждому поисковику отдельно (есть общие стандарты для robots.txt, но есть также и ряд особенностей работы каждого поисковика с этим файлом, поэтому мы раньше не могли предусмотреть запрет индексации некоторых страниц сразу для всех ботов).

3. Мы теперь имеем хороший инструмент для ускорения индексации сайта 🙂