Урок 5.2 – Создание XML карты сайта sitemap.xml
Sitemap.xml – это файл в формате XML, который содержит список всех страниц сайта подаваемых на индексацию.
Какие параметры должен содержать sitemap.xml
Обязательные параметры:
- URL адреса всех страниц сайта, которые должны быть проиндексированы.
Желательные параметры:
- «lastmod» — атрибут, содержащий дату последнего изменения страницы. Если данного атрибута нет, то поисковый робот не узнает, что страница была изменена и не запустит ее на переиндексацию.
- «changefreq» — атрибут, указывающий частоту обновления страницы, может принимать значения: всегда, ежедневно, еженедельно, ежемесячно, никогда. Этот параметр показывает поисковому роботу как часто нужно переобходить данную страницу. Для главной страницы и основных разводящих страниц рекомендуется использовать значение «всегда».
- «priority» — приоритет страницы. Более важные и часто изменяемые страницы должны иметь более высокий приоритет. Этот параметр важен, так как у каждого поисковика есть свой краулинговый бюджет. И может получится так, что он кончится, и поисковый робот обойдет не нужные страницы, а важные пропустит и не внесет изменения в поисковый индекс.
Каких страниц не должно быть в сайтмап
- Страниц дублей,
- Страниц редиректов,
- Страниц выдающих код ошибки 404 – страница не найдена.
- URL закрытых от индексации.
- Служебных страниц, которые не должны быть проиндексированы.
Практически во всех современных системах управления сайтами (CMS) есть модули для автоматического формирования файла Sitemap.xml.
Проверить корректность сформированного файла sitemap.xml вы может использовав сервис Яндекс Вебмастер (Инструменты -> Анализ файлов Sitemap).