Урок 6.1 – URL, ЧПУ, дубли страниц, зеркала сайта
Как правильно формировать URL
Ваш сайт и каждая его страница имеет свой уникальный адрес в интернете – URL (на сленге урл).
Адрес вашего сайта складывается из следующих частей:
- Протокол передачи данных:
- http:// – незащищенный,
- https:// – защищенный.
- Имя домена, например domen.
- Доменная зона, например:
- .ru – Россия,
- .com – весь мир.
Итого полностью адрес главной страницы сайта может быть таким: https://domen.ru
Доменные зоны указывают на соответствующую страну. У одной и той же страны может быть несколько доменных зон.
Например, Россия имеет следующие доменные зоны:
- .su,
- .ru,
- .рф,
- .дети,
- .москва,
- .moscow
- .рус,
- .yandex.
Я бы рекомендовал выбирать названия доменов и доменных зон на английском языке, так как домены на русском языке в мессенджерах и социальных сетях отображаются нечитабельным набором ascii кодов, поэтому когда вы будете делиться ссылкой на свой сайт, например, домен окново.рф, ссылка на него будет выглядеть так: https://xn--b1apjccb.xn--p1ai/.
Адреса для всех страниц сайта я бы также рекомендовал делать в английской транскрипции, так как все урл, в которых есть русские буквы, будут выглядеть как на примере выше.
Что такое ЧПУ и как правильно его формировать
ЧПУ – человеко-понятный урл (URL), это адрес страницы сайта, сформированный таким образом, чтобы по нему было сразу видно положение страницы в структуре сайта и ее содержание.
Существует несколько вариантов адресации страниц сайта. Один из вариантов – с использование GET параметров. Для такого варианта URL может выглядеть так:
https://domen.ru/index.php?category=1&tovar=2
Где:
- category – GET параметр, в котором передается идентификатор категории,
- tovar – GET параметр, в котором передается идентификатор товара.
GET параметры называются также динамическими параметрами и могут быть абсолютно любыми.
Например при разметке рекламы используются UTM метки – это тоже GET параметры, которые нужны для отслеживание по каким запросам и по какому каналу идет трафик на сайт.
Метод адресации с использованием GET параметров поисковые машины считают некорректным, так как посетитель не является программистом и навряд ли поймет что написано в URL, плюс многие GET параметры не влияют на содержимое страницы, как например UTM метки, и приводят к появлению дублей страниц в поиске.
Правильное ЧПУ
Пример правильно сформированного ЧПУ:
https://domen.ru/catalog/category/tovar/
где:
- https – защищенный протокол передачи данных,
- domen.ru – имя домена и доменной зоны в латинской транскрипции,
- catalog – адрес страницы каталога,
- category – адрес категории товара,
- tovar – наименование товара.
Правила формирования правильного ЧПУ:
- Названия URL категорий и товаров должны соответствовать названию на русском языке в латинской транскрипции разделенных дефисом «-».
- URL любой страницы товара должен соответствовать наименованию товара в полном или сокращенном варианте на русском в латинской транскрипции. Если наименование товара состоит из нескольких слов – они разделяются дефисом.
- Допускается вместо транскрипции переводить название на английский язык,
- Не нужно вместо дефиса использовать нижнее подчеркивание.
- По URL должно быть понятно, где находится данная страница в структуре сайта.
- Если URL получается слишком длинным, то его нужно оптимизировать, сократив словосочетания, которые не важны для продвижения.
Пример правильного ЧПУ для мебельного магазина:
https://mebel.ru/catalog/divany/uglovoi-divan-elza/
Что такое дубли страниц и как их убрать
Если одна и та же страница сайта доступна по разным URL, то такие страницы считаются дублями.
Проверить наличие дублей можно в сервисе Яндекс Вебмастер. Если у Вас на сайте есть дубли страниц, то в вебмастере Вам придет уведомление об этом и ссылка, где можно посмотреть какие именно страницы Яндекс посчитал дублями.
Очень часто дубли появляются из-за наличия GET параметров в URL.
Наличие дублей является критической ошибкой для SEO и их нужно отслеживать и удалять.
В Яндексе для удаления дублей страниц, содержащих GET параметры нужно прописать в файле robots.txt директиву clean-param, а также указать каноническую ссылку. Можно также закрыть дубли от индексации в robots.txt, используя директиву disallow.
Что такое зеркало сайта
Зеркало сайта – это когда один и тот же домен доступен по разным URL.
Если у вас основной индексируемый домен: https://domen.ru, то его зеркалами могут быть:
- http://domen.ru
- http://domen.ru
- https://domen.ru
Если Ваш сайт доступен по разным зеркалам и они проиндексированы, то это является ошибкой и приводит к появлению дублей всех страниц сайта.
Чтобы выбрать основной URL, по которому сайт будет участвовать в поиске, нужно настроить на него редиректы (переадресацию) со всех остальных зеркал.