Использование файла Sitemap
Sitemap — это файл со ссылками на страницы сайта, который сообщает поисковым системам об актуальной структуре сайта. Яндекс поддерживает форматы XML и TXT. Формат XML позволяет передавать дополнительную информацию.
- В каких случаях нужен файл Sitemap
- Поддерживаемые Яндексом форматы
- Требования к файлу
- Как создать файл и сообщить о нем Яндексу
- Вопросы и ответы
В каких случаях нужен файл Sitemap
Яндекс разрабатывает специальные алгоритмы, по которым индексирующий робот узнает о сайте. Например, с помощью внутренних и внешних ссылок — переходя с одной страницы на другую. Иногда робот может пропустить страницы. Используйте Sitemap, если на сайте:
- большое количество страниц;
- отдельные страницы без навигационных ссылок;
- глубокая вложенность.
Поддерживаемые Яндексом форматы
Яндекс поддерживает протокол Sitemap. Чтобы передать информацию, используйте следующие элементы:
Тег | Обязательно | Описание |
---|---|---|
loc | Да | Адрес страницы. |
lastmod | Нет | Дата последнего обновления страницы. Максимальный размер — 100 байтов. |
changefreq | Нет | Частота изменения страницы. Максимальный размер — 100 байтов. |
priority | Нет | Значимость страницы. Робот загружает страницы поочередно с учетом наличия и значения коэффициента от 0.0 до 1.0. Укажите коэффициент для тех URL, которые наиболее важны для сайта. Максимальный размер — 100 байтов. |
Тег | Обязательно | Описание |
---|---|---|
loc | Да | Адрес страницы. |
lastmod | Нет | Дата последнего обновления страницы. Максимальный размер — 100 байтов. |
changefreq | Нет | Частота изменения страницы. Максимальный размер — 100 байтов. |
priority | Нет | Значимость страницы. Робот загружает страницы поочередно с учетом наличия и значения коэффициента от 0.0 до 1.0. Укажите коэффициент для тех URL, которые наиболее важны для сайта. Максимальный размер — 100 байтов. |
Пример:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/page1.html</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
...
</urlset>
Пример:
https://www.example.com/page1.html
https://www.example.com/page2.html
Также с помощью Sitemap вы можете передать информацию о локализованных страницах сайта и об изображениях (см. раздел Справки Яндекс Картинок).
Чтобы передавать в файле Sitemap информацию о видео, используйте микроразметку и добавьте страницы с видео в Sitemap.
Требования к файлу
- Используйте кодировку UTF-8. Кириллические URL робот Яндекса распознает как в закодированном виде, так и в оригинале.
- Максимальное количество ссылок — 50 000. Вы можете разделить Sitemap на несколько отдельных файлов и указать их в файле индекса Sitemap.
- Максимальный размер файла в несжатом виде — 50 МБ.
- Указывайте ссылки на страницы только того домена, на котором будет расположен файл.
- Разместите файл на том же домене, что и сайт, для которого он составлен.
- При обращении к файлу сервер должен возвращать HTTP-код 200.
Как создать файл и сообщить о нем Яндексу
- Определите канонические URL для страниц, которые будут указаны в файле Sitemap. Это необходимо, если на сайте есть несколько страниц со схожей информацией.
- Выберите формат и с помощью одного из сторонних ресурсов сформируйте файл.
- Проверьте файл с помощью инструмента Анализ файлов Sitemap.
- Укажите ссылку на файл в robots.txt или в разделе Файлы Sitemap Яндекс Вебмастера.
При необходимости вы можете удалить информацию о Sitemap.
Вопросы и ответы
- Робот обошел файл Sitemap недавно и еще не успел обработать его. Подождите две недели. Если вы используете файл индекса Sitemap с несколькими файлами, то их обработка может занять больше времени, чем одного файла Sitemap.
- Сайт ранее был недоступен для индексирующего робота. Необходимо дождаться следующего посещения сайта роботом.
Как правило, в Sitemap принято включать все значимые страницы сайта. Если на сайте множество страниц, вы можете удалить из Sitemap уже известные Яндексу страницы и вносить в файл только новые или часто обновляющиеся.
Если вы используете файл индекса Sitemap отметьте тегом lastmod файлы Sitemap, которые часто обновляются.
Определить, какие страницы сайта уже известны Яндексу, можно в Вебмастере на странице
.Отображение файла Sitemap и других XML-файлов как исключенных страниц носит только информативный характер и никак не влияет на индексирование сайта или обработку Sitemap.
Файл Sitemap может отображаться в группе исключенных страниц, так как робот попытался проиндексировать его как обычную страницу. Не смотря на это файлы Sitemap не участвуют в поиске.
Файл Sitemap может содержать только определенные XML-элементы. Если Вебмастер обнаружит в файле другие элементы, например, указание на мобильную версию, в Вебмастере появится ошибка «Неизвестный тег». Неподдерживаемые элементы игнорируются роботом при обработке Sitemap, при этом данные из поддерживаемых элементов учитываются. Поэтому менять файл Sitemap необязательно.
Если содержимое файла будет изменено, потребуется до двух недель на обновление информации в Вебмастере.
Файл Sitemap может быть не проиндексирован по нескольким причинам: