Mapa witryny, znana również jako sitemap, jest protokołem w formacie XML umożliwiającym webmasterom informowanie wyszukiwarek internetowych o adresach URL na stronie, które są dostępne do indeksowania. Pozwala na dodanie dodatkowych informacji o każdym URL, takich jak data ostatniej aktualizacji, częstotliwość zmian oraz ważność w stosunku do innych adresów URL na stronie. Dzięki temu wyszukiwarki mogą bardziej efektywnie przeszukiwać stronę i odnajdywać URL-e, które mogą być odizolowane od reszty zawartości witryny. Mapa witryny jest szczególnie użyteczna na dużych stronach, gdzie istnieje ryzyko, że niektóre nowe lub niedawno zaktualizowane treści mogą zostać przeoczone przez roboty wyszukiwarek. Protokół Sitemap jest komplementarny do pliku robots.txt, który służy do wykluczania URL-i z indeksowania.
Mapa witryny, znana również jako sitemap, jest plikiem w formacie XML, który umożliwia webmasterom informowanie wyszukiwarek internetowych o dostępnych do indeksowania adresach URL na stronie. Każdy wpis URL w mapie witryny zawiera dodatkowe informacje, takie jak data ostatniej aktualizacji, częstotliwość zmian oraz ważność w stosunku do innych adresów URL na stronie. Te informacje pomagają wyszukiwarkom w bardziej efektywnym przeszukiwaniu strony. Mapa witryny może również być dostarczona w formie zwykłego pliku tekstowego, gdzie każdy wiersz reprezentuje jeden URL.
Pojedynczy plik mapy witryny w formacie XML musi być zakodowany w UTF-8 i może zawierać maksymalnie 50 000 adresów URL lub zajmować maksymalnie 50 MB (nieskompresowane). Większe strony, które przekraczają te limity, mogą używać indeksu mapy witryny, który odnosi się do wielu map witryny.
Mapa witryny przynosi wiele korzyści, zwłaszcza dla dużych stron internetowych. Dzięki niej, wyszukiwarki są w stanie odnaleźć adresy URL, które mogą być odizolowane od reszty zawartości witryny. Ma to znaczenie w kilku przypadkach:
Protokół Sitemap jest komplementarny do pliku robots.txt, który służy do wykluczania URL-i z indeksowania. Możliwość autodetekcji mapy witryny przez robots.txt została wprowadzona w 2007 roku i jest szeroko stosowana. Wystarczy dodać do pliku robots.txt linię o następującej postaci:
Sitemap: https://www.example.com/sitemap.xml
Poza umieszczeniem lokalizacji mapy witryny w pliku robots.txt, istnieje możliwość bezpośredniego zgłoszenia mapy witryny do wyszukiwarek. Polega to na „pingowaniu” wyszukiwarki informacją o lokalizacji mapy witryny, co pozwala na uzyskanie informacji o stanie jej przetwarzania oraz ewentualnych błędach.
Natychmiastowe zgłoszenie mapy witryny może skrócić czas potrzebny na zaindeksowanie nowych lub zaktualizowanych treści, co jest kluczowe w dynamicznie zmieniających się witrynach oraz w serwisach z dużą ilością treści.
Tekst został wygenerowany przy pomocy AI i został sprawdzony przez Dominik Fajferek.