Урок 5.8 – Атрибут Canonical, метатеги noindex, nofollow
Атрибут Canonical
Атрибут Canonical (каноническая ссылка) – указывает поисковым роботам приоритетную страницу для индексации. Пример использования в теге <head></head>:
<link rel = «canonical» href = «https://site.ru/str/» />,
где https://site.ru/str/ — URL страницы, по которому она должна быть проиндексирована в поиске.
Использование данного атрибута обязательно, так как если его нет, то поисковые роботы сочтут страницу неканонической и могут исключить ее из поиска.
Какие проблемы позволяет решить использование Canonical
- Если в адресе страницы появляются GET параметры, то поисковый робот индексирует URL, той страницы, что указана в атрибуте Canonical. Рассмотрим на примере. Если Вы даете рекламу на сайт, то обычной практикой для определения каналов трафика является использование UTM-меток. Каждая такая метка это и есть GET параметр и поисковый робот расценивает такие страницы как дубли, что негативно влияет на ранжирование сайта в поиске. Пример ссылки с UTM метками: «/domen.ru/?utm_source=yandex&utm_medium=cpc».
- Если у Вас один и тот же товар лежит в разных разделах каталога, то это тоже может привести к дублированию страниц. Этого можно избежать используя rel = «canonical».
- Если у Вас есть страницы пагинации и вы хотите все их проиндексировать, то также поможет этот атрибут.
Метатег «Noindex»
Данный метатег используется, если Вы хотите закрыть страницу от индексации в HTML коде сайта.
Если Вы хотите полностью закрыть страницу от индексации, то в тег <head></head> нужно прописать:
<meta name = «robots» content = «noindex» />
Также существует возможность закрыть страницу от индексации через файл robots.txt, но поисковый робот может проигнорировать такой способ закрытия от индексации в случае, когда на данную страницу есть внешние ссылки с других сайтов.
Плюс при закрытии страницы от индексации через файл robots.txt, тратится краулинговый бюджет.
Если использовать «noindex», то поисковый робот не читает всю страницу, он доходит в <head> до объявления данного метатега и далее исключает страницу из индекса, не читая ее содержимое. Закрытие страницы через метатег «noindex» дает 100% гарантию, что страница не попадет в поиск.
Можно закрыть страницу от индексации не полностью а только для какого-то одного поискового робота, например закрытие от индексации поисковым роботом Googlebot выглядит следующим образом:
<meta name = «googlebot» content = «noindex»/>
Метатег и атрибут «Nofollow»
Если указать в <head></head> страницы метатег:
<meta name = «robots» content = «nofollow»/>,
то это запрещает поисковым роботам переходить по всем ссылкам в коде данной страницы.
Можно использовать «nofollow» как атрибут в коде конкретной ссылки:
<a href = «адрес ссылки» rel = «nofolow»> анкор ссылки </a>
В этом случае поисковым роботам запрещен переход для данной конкретной ссылки.
Таким образом «nofollow» используют обычно для того, чтобы запретить передачу веса своей страницы сторонним внешним сайтам, и ставят его на все ссылки на внешние ресурсы.