Mit einer Sitemap kann den Suchmaschinen einen Index seiner Webseite zur Verfügung stellen. Damit kann man sicherstellen das auch schwer auffindbare URLs in den Index aufgenommen werden. Bei Umfangreichen Webseiten beschleunigt es die Indizierenung.
Die Sitemap ist im XML Format und muss mit UTF-8 Codiert sein. Es dürfen maximal 50.000 URLs angegeben werden und die Datei darf nicht größer als 10MB sein. Wenn eine Sitemap mehr URLs beinhaltet oder größer ist muss sie aufgeteilt werden. Dazu eignet sich eine Index-Sitemap.
Elemente
- urlset
- Fast alle URLs zusammen.
- url
- Gruppierung für alle Parameter einer URL. Enthält alle Informationen zu der Seite.
- loc
- Die URL der Seite. Die URL muss absolut sein und darf nicht länger als 2024 Zeichen sein.
- lastmod
- Das Datum der letzten Modifikation der Seite, dieses sollte im Format von W3C Datetime sein. (Optional)
- changefreq
- Wie häufig eine Seite geändert wird. Gültige Werte sind always, hourly, daily, weekly, monthly, yearly und never. (Optional)
- priority
- Die Wichtigkeit einer Seite relativ gesehen zu alle Unterseiten auf einer Webseite. Dieser Wert muss zwischen 1.0 und 0.0 liegen. (Optional)
Beispiel Sitemap
<?xml version="1.0" encoding="utf-8" ?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<priority>1</priority>
<lastmod>2012-01-01</lastmod>
</url>
<url>
<loc>http://www.example.com/imprint.html</loc>
<priority>0.5</priority>
<lastmod>2012-01-01T12:30:00+02:00</lastmod>
</url>
</urlset>
Sitemap einreichen
Damit die Sitemap von den Crawlern gefunden wird, sollte sie in der robots.txt verlinkt werden. Da die Bezeichnung einer Sitemap nicht standardisiert ist.
User-agent: *
Sitemap: http://www.example.com/sitemap.xml
Quellen: