Loading...
X

Файлы sitemap.xml: для чего нужны, как использовать и как обойти ограничения на размер и количество ссылок


Оглавление

  1. Что такое файлы Sitemap
  2. Какие ограничения для файлов Sitemap
  3. Как можно сжать файл Sitemap
  4. Можно ли использовать несколько файлов Sitemap
  5. Какая структура файлов Sitemap
  6. Как генерировать файлы Sitemap
  7. Как импортировать Sitemap в Google Search Console
  8. Статус файла sitemap.xml «не получено»
  9. Обязательно ли нужно использовать файл sitemap.xml?
  10. Что делать, если файл Sitemap содержит ошибку. Как удалить файл Sitemap из Google Search Console

Что такое файлы Sitemap

Файлы Sitemap — это файлы в формате XML, которые содержат список URL адресов страниц вашего сайта, для передачи в поисковую систему Google, чтобы та могла быстрее о них узнать и проиндексировать.

Какие ограничения для файлов Sitemap

  1. Размер файла не должен быть более 50 Мб
  2. В одном файле может быть не более 50 000 ссылок

Как можно сжать файл Sitemap

Кроме простого текстового формата с разметкой XML, файл может быть сжат в архив .gz. В этом случае размер файла уменьшается драматически, поскольку текстовые файлы сжимаются очень хорошо. Например, мой файл размером в 25 Мегабайт удалось сжать в файл размером 500 Килобайт.

Для этого достаточно сжать исходный файл sitemap.xml в формат .gz. В качестве ссылке в Google Search Console нужно указать путь до архива, например: https://site.net/sitemap.xml.gz

Если при попытке открыть файл https://site.net/sitemap.xml.gz в веб-браузере он скачивает его на компьютер, вместо того, чтобы показать содержимое как для файла sitemap.xml, то это нормально. В любом случае Google Search Console сможет обработать этот файл.

Можно ли использовать несколько файлов Sitemap

Для каждого сайта или доменного ресурса можно создавать множество файлов Sitemap и все их импортировать в Google Search Console — это не только разрешено, но и рекомендуется самой Google для слишком больших файлов Sitemap.

Если файлов Sitemap много, то полный их список можно собрать в отдельном файле Sitemap. Этот файл называется «Файл индекса Sitemap». Пример содержимого файла sitemap.xml:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
	<sitemap>
		<loc>https://site.net/sitemaps/sitemap_1.xml</loc>
	</sitemap>
	<sitemap>
		<loc>https://site.net/sitemaps/sitemap_2.xml</loc>
	</sitemap>
	<sitemap>
		<loc>https://site.net/sitemaps/sitemap_3.xml</loc>
	</sitemap>
</sitemapindex>

После этого достаточно импортировать этот главный файл в Google Search Console.

Остальные файлы sitemap, перечисленный в главном индексном файле, автоматически будут импортированы в Google Search Consol.

Чтобы их увидеть, кликните на имя файла. Вы увидите список импортированных файлов Sitemap.

Нужно подождать, прежде чем эти файлы будут обработаны и их статус смениться на «Успешно».

Какая структура файлов Sitemap

Файлы Sitemap имеют следующую структуру:


<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
	<url>
		<loc>https://domain.site.net/?p=1</loc>
		<lastmod>2022-10-08T14:14:27+00:00</lastmod>
		<changefreq>monthly</changefreq>
		<priority>0.8</priority>
	</url>
<url>
	<loc>https://domain.site.net/?p=2</loc>
		<lastmod>2022-10-08T14:14:27+00:00</lastmod>
		<changefreq>monthly</changefreq>
		<priority>0.8</priority>
	</url>
	<url>
		<loc>https://domain.site.net/?p=3</loc>
		<lastmod>2022-10-08T14:14:27+00:00</lastmod>
		<changefreq>monthly</changefreq>
		<priority>0.8</priority>
	</url>
</urlset>

Каждая запись состоит из четырёх элементов:

  1. Адрес страницы
  2. Дата последней модификации
  3. Частота модификации (например, ежемесячно)
  4. Приоритет

Как генерировать файлы Sitemap

Если вы используете WordPress, то самый простой способ, это установить плагин для создания файлов Sitemap.

Если для движка вашего сайта отсутствует какой-либо плагин для создания файлов Sitemap, то его довольно легко сгенерировать самостоятельно, поскольку это просто текстовый файл с XML разметкой.

Как импортировать Sitemap в Google Search Console

Перейдите в Google Search Console, выберите сайт, для которого вы хотите сообщить о файле Sitemap, введите адрес файла Sitemap.

Статус файла sitemap.xml «не получено»

Вначале может появиться надпись, что файл sitemap.xml не получен. Эта надпись появляется даже если с файлом sitemap.xml всё в порядке. Нужно просто немного подождать.

Суть в том, что эта надпись не означает, что имеются проблемы с файлом sitemap.xml. Просто ещё не пришла очередь на анализ этого файла.

Чуть позже статус файла смениться на «Успешно». В это же время будет показано, сколько выявлено URL благодаря этому файлу.

Ещё позже можно будет просмотреть отчёт об индексации ссылок из файла sitemap.xml.

Обязательно ли нужно использовать файл sitemap.xml?

На самом деле я обычно не использую файл sitemap.xml. Статьи на большинство сайтов я добавляю вручную и, на мой взгляд, файл sitemap.xml особо не нужен, поскольку страницы на таких сайтах индексируются очень быстро.

Но если вы недовольны скоростью индексирования вашего сайта, либо вам нужно быстро сообщить о большом количестве URL адресов для индексирования, то попробуйте использовать файлы sitemap.xml.

Что делать, если файл Sitemap содержит ошибку. Как удалить файл Sitemap из Google Search Console

Если после попытке обработки файла Sitemap вы обнаружили, что он содержит ошибки (например, неправильный формат даты или битые ссылки, то вам необязательно дожидаться, когда придёт время следующей проверки.

Вы можете удалить файл Sitemap из Google Search Console и сразу добавить его снова. После этого довольно быстро (в течение нескольких минут) Google снова проверит файл Sitemap.

Для удаления файла Sitemap из Google Search кликните на него. На открывшейся странице в правом верхнем углу найдите кнопку с тремя горизонтальными точками. Нажмите её и выберите «Удалить файл Sitemap».

После этого файл Sitemap будет удалён и вы, после исправления в нём ошибок, сразу можете заново добавить файл Sitemap с таким же или другим URL.


Рекомендуется вам:


Leave Your Observation

Ваш адрес email не будет опубликован.

wp-puzzle.com logo