Ремонты цифровой техники
Вернуться:
Дополнительно
Поиск по сайту
поиск

Формат файла Sitemap.xml

Файл карты сайта Sitemap.xml обязательно должен удовлетворять таким требованиям как:

  1. Формат файла UTF-8 w/o BOM
  2. Только определенный набор и синтаксис тегов
  3. Не должен содержать более 50000 страниц, в случае превышения нужно создавать еще файл и файл структуры карты сайта

Рассмотрим наиболее интересный второй пункт. Карта сайта представляет собой документ с заголовком в начале, тег ?xml и открывающийся urlset, который может иметь следующий вид:

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

	xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

	xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9

	http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">

далее в файле sitemap xml идет набор тегов, описывающих сами страницы вашего сайта

<url>

	<loc>http://mysite.ru/page1.html</loc>

	<lastmod>2016-02-22T02:43:34+03:00</lastmod>

	<changefreq>weekly</changefreq>

	<priority>0.83</priority>

</url>

для страницы page1.html, для page2.html и так далее

<url>

	<loc>http://mysite.ru/page2.html</loc>

	<lastmod>2016-02-22T02:43:34+03:00</lastmod>

	<changefreq>weekly</changefreq>

	<priority>0.83</priority>

</url>

После последней страницы идет закрывающий тег для urlset

</urlset>

Разберем подробно теги внутри < url > :

Тег < loc > является обязательным и отвечает за адрес страницы, он должен быть указан вместе с протоколом, в данном случае это http://. Максимальная длина не должна превышать 2048 символов, если вы вдруг используете в своих URL спецсимволы &, ', ", <, >, то их необходимо заэкранировать, заменить их на сущности в следующем соответствии:

символ замена
& &amp;
' &apos;
" &quot;
< &lt;
> &gt;

 

 

 

 

 

Вообще говоря, лучше ознакомиться со списком всех допустимых символов в URL, это довольно полезная информация. Остальные три тега являются необязательными, если они не указаны то будут взяты их значения по умолчанию.

Тег < lastmod > указывает на дату последнего изменения на странице, обратите внимание что он указывается именно в формате W3C Datatime. Тег < changefreq > показыват насколько часто страница может меняться. Может принимать значения

  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never

 Где всегда означает что контент страницы меняется при каждом заходе на нее посетителя, например если на сайте стоит страница голосования то это значение вполне подойдет. Никогда отлично подойдет для устаревших документов, которые более не планируется редактировать, но запросы по ним еще идут и нет смысла удалять этот контент. Стоит помнить что различными изменениями этого значения в файле Sitemap xml не удастся однозначно повысить количество визитов поисковых роботов на сайт, это лишь дополнительная информация. Тег < priority > показывает относительную значимость страниц вашего сайта относительно друг друга. Диапозон его значений от 0 до 1, если тег не указан, то все страницы считаются равнозначными и его значение полагается равным 0.5. Увеличением этого значения в Site map xml не получится повысить релевантность ваших страниц в поисковых запросах относительно других сайтов.

Для большого количества страниц на сайте лучше всего использовать плагины для админ панели или онлайн сервисы для создания карты сайта Sitemap xml. Например, Вы можете создать карту сайта Sitemap xml бесплатно до 1500 страниц с помощью моего online сервиса.


Опубликовано 2016-02-26 04:01:29