Mapa witryny

Mapa witryny, znana również jako sitemap, jest protokołem w formacie XML umożliwiającym webmasterom informowanie wyszukiwarek internetowych o adresach URL na stronie, które są dostępne do indeksowania. Pozwala na dodanie dodatkowych informacji o każdym URL, takich jak data ostatniej aktualizacji, częstotliwość zmian oraz ważność w stosunku do innych adresów URL na stronie. Dzięki temu wyszukiwarki mogą bardziej efektywnie przeszukiwać stronę i odnajdywać URL-e, które mogą być odizolowane od reszty zawartości witryny. Mapa witryny jest szczególnie użyteczna na dużych stronach, gdzie istnieje ryzyko, że niektóre nowe lub niedawno zaktualizowane treści mogą zostać przeoczone przez roboty wyszukiwarek. Protokół Sitemap jest komplementarny do pliku robots.txt, który służy do wykluczania URL-i z indeksowania.

Spis treści

Format i struktura mapy witryny

Mapa witryny, znana również jako sitemap, jest plikiem w formacie XML, który umożliwia webmasterom informowanie wyszukiwarek internetowych o dostępnych do indeksowania adresach URL na stronie. Każdy wpis URL w mapie witryny zawiera dodatkowe informacje, takie jak data ostatniej aktualizacji, częstotliwość zmian oraz ważność w stosunku do innych adresów URL na stronie. Te informacje pomagają wyszukiwarkom w bardziej efektywnym przeszukiwaniu strony. Mapa witryny może również być dostarczona w formie zwykłego pliku tekstowego, gdzie każdy wiersz reprezentuje jeden URL.

Pojedynczy plik mapy witryny w formacie XML musi być zakodowany w UTF-8 i może zawierać maksymalnie 50 000 adresów URL lub zajmować maksymalnie 50 MB (nieskompresowane). Większe strony, które przekraczają te limity, mogą używać indeksu mapy witryny, który odnosi się do wielu map witryny.

Korzyści z używania mapy witryny

Mapa witryny przynosi wiele korzyści, zwłaszcza dla dużych stron internetowych. Dzięki niej, wyszukiwarki są w stanie odnaleźć adresy URL, które mogą być odizolowane od reszty zawartości witryny. Ma to znaczenie w kilku przypadkach:

  • Strony z obszarami niedostępnymi przez interfejs przeglądania: Niektóre części strony mogą być trudno dostępne dla robotów wyszukiwarek, co może prowadzić do ich pominięcia podczas indeksowania.
  • Zastosowanie technologii AJAX, Silverlight lub Flash: Te technologie mogą nie być standardowo przetwarzane przez wyszukiwarki, a mapa witryny zapewnia, że zawartość generowana dynamicznie również zostanie zauważona.
  • Bardzo duże strony: Na dużych stronach istnieje ryzyko, że nowe lub niedawno zaktualizowane treści mogą zostać przeoczone przez roboty wyszukiwarek.
  • Słabo połączone strony: Jeśli strona ma wiele izolowanych lub słabo połączonych stron, mapa witryny pomaga wyszukiwarkom w ich odnalezieniu i zindeksowaniu.
  • Niewielka liczba linków zewnętrznych: Witryny, które mają niewiele linków prowadzących do nich z innych miejsc w sieci, mogą skorzystać z mapy witryny, aby ułatwić ich indeksowanie przez wyszukiwarki.

Integracja z plikiem robots.txt oraz wysyłanie mapy witryny

Protokół Sitemap jest komplementarny do pliku robots.txt, który służy do wykluczania URL-i z indeksowania. Możliwość autodetekcji mapy witryny przez robots.txt została wprowadzona w 2007 roku i jest szeroko stosowana. Wystarczy dodać do pliku robots.txt linię o następującej postaci:

Sitemap: https://www.example.com/sitemap.xml

Poza umieszczeniem lokalizacji mapy witryny w pliku robots.txt, istnieje możliwość bezpośredniego zgłoszenia mapy witryny do wyszukiwarek. Polega to na „pingowaniu” wyszukiwarki informacją o lokalizacji mapy witryny, co pozwala na uzyskanie informacji o stanie jej przetwarzania oraz ewentualnych błędach.

Natychmiastowe zgłoszenie mapy witryny może skrócić czas potrzebny na zaindeksowanie nowych lub zaktualizowanych treści, co jest kluczowe w dynamicznie zmieniających się witrynach oraz w serwisach z dużą ilością treści.

Tekst został wygenerowany przy pomocy AI i został sprawdzony przez Dominik Fajferek.