Зачем нужен файл Sitemap?
В большинстве случаев грамотной внешней и внутренней перелинковки страниц достаточно, чтобы поисковые роботы узнали о всем содержимом сайта. Вместе с тем использование Карты сайта может заметно ускорить процесс полной индексации, особенно если:
- Интернет-ресурс создан относительно недавно и пока не может похвастаться богатым профилем внешних ссылок;
- в структуре сайта присутствуют многочисленные архивы веб-документов, не связанных между собой;
- проект располагает большим количеством страниц, разделов, подразделов;
- в структуре ресурса преобладают динамические страницы.
Во всех этих случаях всеобъемлющая индексация сайта поисковыми системами может оказаться под вопросом, если своевременно не позаботиться о файле Sitemap.
Базовые критерии создания файла Sitemap
К созданию Карты сайта выдвигается несколько основных требований, о которых веб-мастер должен всегда помнить.
Во-первых, количество URL-адресов в файле Sitemap не должно превышать 50 тысяч единиц. Если их больше, то необходимо создать несколько отдельных Карт сайта, которые прописываются в файле индекса Sitemap.
Во-вторых, максимальный размер файла – 10 Мб. Если несжатый файл превышает этот размер, его можно уменьшить при помощи архиватора gzip.
В-третьих, файл Sitemap должен находиться на том же домене, что и веб-сайт, для которого он создан.
В-четвертых, составление Карты сайта предполагает использование кодировки UTF-8, а также латинских букв и цифр.
Допустимые форматы Карты сайта
Особое требование предъявляется к формату файла Sitemap. Так, Карта сайта может быть создана в виде XML-файла, текстового файла или посредством RSS, mRSS и Atom 1.0. При этом наиболее распространенным форматом, который распознают все поисковые системы, считается XML-файл. С его помощью поисковикам можно сообщить не только о правильном местоположение страницы в иерархии сайта, но и:
- о частоте обновления веб-документа в принципе (атрибут – changefreq);
- о дате последнего обновления на странице (атрибут – lastmod);
- о разной важности тех или иных страниц ресурса (атрибут – priority).
Пример Карты сайта в формате XML для PR-CY.ru, если бы он состоял из одной страницы и содержал упомянутые теги, мог бы выглядеть так:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.pr-cy.ru/</loc> <lastmod>2016-03-21</lastmod> <changefreq>daily</changefreq> <priority>0.8</priority> </url> </urlset>
Как создать и где разместить файл Sitemap?
При желании составить Карту сайта можно самому (вручную), что, впрочем, выглядит весьма трудозатратной затеей. Поэтому лучше создавать файл Sitemap автоматически, обратившись к услугам бесплатных онлайн-сервисов таких, как этот или этот.
После того, как Карта сайта готова, файл необходимо определить в корневую директорию. В этом случае ссылка, указывающая поисковым системам путь к файлу Sitemap, может быть следующей: http://www.pr-cy.ru/sitemap.xml
Добавление Карты сайта в поисковые системы
Чтобы о новом файле Sitemap как можно быстрее узнали поисковые роботы, веб-мастеру необходимо внести изменения в файл robots.txt, прописав в нем особую директиву, указывающую точный маршрут к Карте сайта:
Sitemap: http://www.pr-cy.ru/sitemap.xml
Кроме того, готовый файл Sitemap проверяется на наличие ошибок и добавляется в Яндекс или Гугл при помощи Яндекс.Вебмастера или Google Search Console.
Подводя итог, необходимо отметить, что наличие у веб-ресурса правильно составленной Карты сайта не является 100%-ной гарантией индексации абсолютно всех его страниц. Данный файл – всего-навсего серьезная подсказка поисковикам, как тщательнее просканировать ваш сайт.
В-пятых, ответом сервера на обращение к файлу Sitemap должен быть HTTP-статус с кодом 200 OK.