Sitemaps — це XML-файл з інформацією для пошукових систем (таких як Google, Yahoo, Ask.com, Bing, Яндекс) про сторінки вебсайту, які підлягають індексації. Sitemaps може допомогти пошуковикам визначити розташування сторінок сайту, час їхнього останнього поновлення, частоту оновлення та важливість щодо інших сторінок сайту для того, щоб пошукова машина змогла більш розумно індексувати сайт.
Використання протоколу Sitemaps не є гарантією того, що вебсторінки будуть проіндексовані пошуковими системами, це всього лише додаткова підказка для сканерів, які зможуть виконати ретельніше сканування Вашого сайту.[1]
Формат протоколу Sitemap
Формат протоколу Sitemap складається з XML-тегів. У файлі необхідно використовувати кодування UTF-8.
Приклад XML-файлу Sitemap
Нижче наведено приклад файлу Sitemap, в якому міститься тільки одна URL-адреса та використані всі необов'язкові теги.
<?xml version = "1.0" encoding = "UTF-8"?><urlsetxmlns="http://www.sitemaps.org/schemas/sitemap/0.9"><url><loc>http://example.com/</loc><lastmod>2005-01-01</lastmod><changefreq>monthly</changefreq><priority>0.8</priority></Url></Urlset>
Використання файлів індексу Sitemap
Можна надати декілька файлів Sitemap, однак у кожному з цих файлів має бути не більше 50000 URL, а розмір кожного з цих файлів не повинен перевищувати 10 МБ. При необхідності файл Sitemap можна стиснути за допомогою архіватора gzip, щоб його розмір не перевищував 10 МБ, і тим самим зменшити вимоги до пропускної здатності каналу.
Якщо необхідно перерахувати більше ніж 50000 URL, слід створити декілька файлів Sitemap, при цьому необхідно перерахувати кожний з цих файлів у файлі індексу Sitemap (Sitemap index). Формат файлу індексу Sitemap схожий на формат файлу Sitemap.
Канал синдикації (RSS 2.0, а також Atom 0.3 або 1.0)
Текстовий файл (у текстовому файлі в кожному рядку повинен бути тільки один URL)
Розташування файлу Sitemap
Рекомендується розташовувати файл Sitemap в кореневій директорії сервера, щоб посилання виглядала приблизно так: http://example.com/sitemap.xml[недоступне посилання з серпня 2019].
Всі посилання, перераховані у файлі Sitemap, повинні знаходитися в тому ж домені, що і сам Sitemap.
Після того, як файл Sitemap створений та розміщений на вебсервері, необхідно повідомити про місцезнаходження цього файлу пошуковим системам, що підтримують цей протокол. Це можна зробити наступним чином:
за допомогою інтерфейсу пошукової системи
вказавши місце розташування файлу Sitemap у файлі robots.txt
виславши HTTP-запит
Потім пошукові системи зможуть отримати файл Sitemap і дозволити своїм сканерам доступ до URL-адресами.
Використання файлу robots.txt
Щоб повідомити пошуковим системам місце розташування файлу Sitemap, можна в robots.txt додати рядок виду:
Де <sitemap_location> необхідно замінити на повний URL файлу Sitemap. Наприклад, щоб додати файл http://arquivo.pt/wayback/20120125215620/http://www.example.com/sitemap.xml у пошуковик Google, потрібно відправити HTTP-запит http://www.google.com/webmasters/sitemaps/ping?sitemap=http://www.example.com/sitemap.xml.