K čemu je mapa stránek?
Soubor sitemap pomáhá internetovým vyhledávačům (vyhledávacím robotům) v orientaci na webových stránkách. Vyhledávací roboti, kteří prochází stránky, přijdou do mapy stránek, kde najdou seznam všech stránek daného webu. Další informace v sitemapě (datum poslední změny, priorita, jak často probíhají změny) umožní robotům efektivněji a rychleji projít celý váš web. Sitemapa má nejčastěji formát XML, ale může mít i jinou podobu. Nejlepší je, když je soubor sitemapy uložený přímo v kořenovém adresáři, nebo když na něj směřuje odkaz v robots.txt.
Každý crawler má na procházení stránek vymezený určitý čas, proto není dobré, aby procházel vícekrát po sobě stránky, které neprošly žádnou změnou.
Kdy je důležité mít sitemapu?
Pokud je váš web skutečně rozsáhlý (obsahuje veliké množství podstránek), je to velice skoro nezbytné. Ale není to jediný případ. U nových webů umožňuje rychlejší indexování do výsledků vyhledávání, u webů s multimediálním obsahem (videa apod.) je to také výhodné. U skutečně gigantických webů, které mají tisíce stránek, je dobré rozdělit mapu stránek do více souborů. Samostatný soubor sitemap by měly mít i PDF soubory (pokud jich je mnoho). Pokud chcete, aby byl web zaindexován co nejrychleji, určitě vložte dané URL k indexaci na stránkách Seznamu a v Google Search Console. Do služby Google Search Console navíc můžete nahrát odkaz na sitemapu a Google tak rychle zjistí, které stránky má projít.
Já osobně říkám, že soubor sitemap.xml by měl mít úplně každý web, protože jeho vytvoření nezabere skoro žádný čas a je vždy lepší ho mít.

Složky sitemapy
Soubor s mapou stránek obsahuje různé složky. Některé jsou povinné, jiné ne. Povinné jsou:
- <urlset> (kořenový element - vše je v něm)
- <url> (obalovací element pro položky sitemapy)
- <loc> (úplná URL)
Nepovinné složky jsou:
- <lastmod> (datum poslední změny na stránkách)
- <changefreq> (jak často stránky měníte
- <priority> (důležitost jednotlivých stránek - je od 1.0 do 0.0, kde 1 má nejvyšší prioritu, 0 nejnižší)
Google dnes některé nepovinné značky (např. <changefreq> a <priority>) téměř ignoruje, jejich použití je spíše formální. <lastmod> ale bývá stále užitečný, zejména u zpravodajských nebo často aktualizovaných webů.
Co je ještě o sitemapách dobré vědět?
- Pokud máte více než 50 000 URL, nebo soubor sitemapy přesahuje 50 MB, je nutné sitemapu rozdělit a využít tzv. sitemap index (<sitemapindex>, obsahuje <sitemap> tagy).
- Můžete mít automatické ukládání nových URL do sitemapy. Pokud jej nemáte, konzultujte to se svým webařem nebo marketingovou agenturou nebo SEO specialistou (a nenechte se uchlácholit, že to nejde - jde to). Dokonce to lze automaticky "pingnout" do Google nebo Bing, díky čemuž budou nové stránky ještě rychleji na indexu.
- Weby mohou mít zvlášť XML soubor např. s obrázky či videi nebo třeba pdf soubory.
- Vícejazyčné weby mohou mít přidaný hreflang anotaci přímo v sitemapě.
- Pokud nechcete, aby některá stránka na indexu byla, neměla by se zobrazovat v sitemapě!