Файл sitemap xml – примеры создания, проверка и анализ

Файл sitemap xml - примеры создания, проверка и анализ

Индексация каждой отдельной страницы сайта современной поисковой системой Google или Яндекс возможна только при наличии активной ссылки на нее. Для упрощения и ускорения процедуры для интернет-ресурса, насчитывающего большое количество в своем составе URL-страниц, используют карту или sitemap.

Последняя представляет стандартную html страницу либо файл в формате .xml, где собраны все ссылки на ключевые разделы и отдельные страницы. Фактически, она выступает в качестве своеобразного оглавления книги, по которому пользователю или непосредственно роботу поисковиков Google, Яндекс проще найти новую или актуальную информацию. Здесь ему понадобится сделать только 1-2 клика при переходе с главной страницы вашего сайта и не перелопачивать всю информацию.

Разновидности карт сайта

Правила создания карты вашего сайта

Дополнительные возможности XML-карты сайта

Синтаксис XML-файла sitemap

Как проинформировать поисковик о наличии sitemap

С точки зрения современных методик продвижения, отсутствие sitemap на ресурсе не является критичной ошибкой. Одновременно с ее помощью упрощается вывод в топ по основным ключевикам из семантического ядра, так как есть гарантия, что количество служебных или мусорных страниц, дублей, URL-адресов с ошибкой 404 в индексе поисковика будет минимальным. В итоге реально достижение нужного результата меньшими усилиями и расходами, ускорение получения нужного итога.

Разновидности карт сайта

Поисковые роботы индексируют все страницы постепенно. В первую очередь, под их интерес подпадает главная страница ресурса, затем первый уровень вложенности и так далее. Для больших ресурсов полная индексация может занимать несколько месяцев, что не устраивает владельцев крупных проектов. Для ускорения процесса создают sitemap, позволяющий фактически вынести ссылки на все URL-страницы ресурса непосредственно на главную страницу.

Файл sitemap xml - примеры создания, проверка и анализ

Sitemap сегодня может быть двух типов (форматов):

  • в виде HTML-файла;
  • в формате .xml.
Файл sitemap xml - примеры создания, проверка и анализ

Sitemap в виде HTML-файла имеет наглядный для человека формат, поэтому выступает для упрощения ориентации для именно реальных пользователей, а не роботов. HTML-формат нагляден, но имеет ограничение по числу ссылок, которые могут быть размещены на одной странице. Если не соблюсти здесь «рамки приличия», то подобный адрес за ссылочный спам может быть исключен из индекса даже при условии, что с нее можно перейти только на внутренние страницы сайта. Для предотвращения проблем не рекомендовано размещать на подобной sitemap более сотни ссылок. Подобной цифры достаточно, чтобы даже на сайте крупного интернет-магазина или портала уместить ссылки все основные разделы с подразделами.

С технической точки зрения карты в формате HTML имеют структуру дерева. Для повышения наглядности ее элементы могут быть оформлены графическими инструментами, CSS-стилями, JS-скриптами. Размещать карту ресурса в зависимости от специфики и размеров последнего можно в следующих местах:

  • ошибка с возвратом страницы 404;
  • отдельная специальная страница со списком;
  • навигационное меню сбоку страницы;
  • подвал.
Файл sitemap xml - примеры создания, проверка и анализ

Sitemap в формате .xml представляет файл с набором ссылок сайта в специальном формате, который чаще всего находится в корневой папке сайта. Использование именно этого варианта имеет следующие преимущества:

  • это специальный формат, который одобрен непосредственно поисковиками, включая Яндекс, Google;
  • возможность указания до 50 000 ссылок в одном файле sitemap;
  • возможность определения пула закрытых для индексирования страниц;
  • возможность указания частоты обновления ваших страниц и установки относительного приоритета для роботов.

Обратим внимание, что последние параметры в sitemap выступают в качестве рекомендации, но не указания для робота поисковой системы.

Использование XML-карты для фомирования sitemap обязательно для ресурсов при выполнении одного из следующих условий:

  • большой размер (в этом случае поисковые роботы могут пропускать и поздно индексировать изменения или создание новых страниц);
  • неоднозначная внутренняя перелинковка (часто станица может быть пропущена роботом поисковой системы при условии, что она становится доступной при определенных условиях или находится в скрытом месте);
  • наличие URL-страниц без специальных навигационных ссылок;
  • высокая степень вложенности.

Файл XML-карты для вашего sitemap должен соответствовать следующим условиям:

  • кодировка исключительно UTF-8;
  • предельный размер файла sitemap в несжатом состоянии – 50 МБ;
  • максимальное число ссылок в одном файле – 50 000;
  • при обращении к данному файлу сервер, где расположен сайт, должен возвращать обязательно код 200 HTTP;
  • ссылки сайта соответствуют главную зеркалу и домену.

Правила создания карты вашего сайта

Для формирования sitemap можно использовать следующие инструменты:

  • генерация sitemap на CMS (система управления, на которой чаще всего ведут разработку для дальнейшего упрощения наполнения контентом, обслуживания) при наличии у нее подобной возможности, которая обычно представлена в формате дополнительных плагинов или сервисов;
  • скачивание XML-карты вашего сайта со специального стороннего сервиса (часто у последних есть ограничение по функционалу, поэтому обязательно оценивайте полноту итогового результата);
  • использование специализированного программного обеспечения (обычно подобное ПО платное, но они обеспечивают формирование полной карты (sitemap), возможность оперативной генерации и обновления данных для нескольких проектов);
  • автоматическое формирование с помощью инструментов Bitrix, WordPress, Joomla;
  • ручное создание (вариант подходит только для небольших ресурсов из-за высокой трудоемкости процесса).

Дополнительные возможности XML-карты сайта

Кроме ускорения индексации оптимизатор или веб-мастер с помощью XML-карты или sitemap сможет оперативно определять и устранять ряд ошибок:

  • закрытие от индексации нужных страниц;
  • ошибки во время сканирования;
  • ложные ошибки;
  • неверная ссылка.

Синтаксис XML-файла sitemap 

Для упрощения работы робота и повышения наглядности страницу сайта на sitemap описывается отдельно в тегах . Внутри указывают следующие параметры:

  • указание в XML-файле конкретной страницы;
  • указание степени регулярности обновления контента на страницы по конкретному URL-адресу. Может иметь значения always, never, yearly, monthly, weekly, daily, hourly. Он предназначен для указания роботу поисковой системы частоты изменения данных. Сегодня тег относится к категории рекомендуемых и не влияет прямым образом на частоту индексации. Тег используется довольно редко.
  • указание на дату и время внесения актуальных изменений данных на странице, находящейся по точному конкретному URL-адресу. Это позволит роботу поисковой системы узнать о необходимости дополнительной индексации.
  • указание поисковому роботу о важности. Главная страница имеет всегда приоритет 1, а остальные могут находиться в диапазоне 0,1-0,9.

Отдельную историю составляет ситуация, когда сайт генерирует мультимедийный контент (фотографии, видеоролики). Подобный момент также важно отобразить на sitemap, выполненной в формате XML. Это обеспечит дополнительный приток пользователей за счет инструментов типа «Поиск по картинкам», расширения объема данных в базе поисковика о конкретном сайте, поэтому подобной возможностью не стоит пренебрегать. Для этого в XML-файле вашего sitemap указывают дополнительно ряд тегов:

  • URL-адрес непосредственно размещаемой для индексации картинки;
  • URL-адрес с дополнительной информации о размещенном изображении;
  • содержание подписи к картинке;
  • указание названия изображения;
  • указание локации фотографии;
  • указание о наличии лицензии на картинку.

Для видеороликов в XML-карте сайта (sitemap) можно указать следующие дополнительные теги:

  • данные о видео-файле;
  • URL-адрес размещения страницы с видеоматериалом;
  • общее описание к ролику (ограничение в 2050 символов);
  • URL-адрес расположения заставки для видеоролика;
  • заголовок ролика.

При формировании карты сайта в XML в автоматическом формате или с помощью специальных интернет-сервисов, стороннего ПО надо обязательно проконтролировать отсутствие конфликтов с правилами в robots.txt. Например, в файле XML недопустимо нахождение URL-страниц, которые по задумке не должны попасть в индекс.

Файл sitemap xml - примеры создания, проверка и анализ

Как проинформировать о наличии sitemap

На сегодня доступны следующие варианты:

  • непосредственно указание в robot.txt с помощью записи типа: Sitemap: https://nameSite.com/sitemap.xml;
  • непосредственно добавление XML-файла в раздел Вебмастера на Яндексе и консоль в сервисе Google Search.

Второй вариант имеет преимущество в возможности сканирования карты интернет-ресурса с указанием возможных ошибок. К числу последних относят:

  • ошибка 404 из-за наличия битых ссылок;
  • наличие закрытых от индексации страниц;
  • проблемы при сканировании адреса;
  • возврат ложных ошибок при обращении к URL-адресу.

В справке Вебмастера Яндекса можно сразу найти способы решения подобных проблем для повышения качества индексации с использованием файла XML.

Проверить карту сайта (sitemap) на ошибки можно и с помощью стороннего ПО типа Screaming Frog (этой программе доступно сканирование XML-карт любого типа).  

Магазин SEO и фриланс-услуг Статьи навсегда

О проекте   |   Оптимизаторам   |   Вебмастерам   |   Блог   |   Правила/Частые вопросы   |   Техподдержка