Deindeksacja strony: co to jest i na co wpływa

Deindeksacja strony internetowej to proces, w którym wyszukiwarka — najczęściej Google — usuwa jedną lub więcej stron ze swojego indeksu. Strona zaindeksowana pojawia się w wynikach wyszukiwania; strona zdeindeksowana znika z nich całkowicie. Deindeksacja może być celowa (samodzielnie blokujesz strony przed wyszukiwarkami) lub niecelowa (Google usuwa je z powodu błędów technicznych, naruszeń jakości lub błędnej konfiguracji witryny).
Strona zdeindeksowana nie generuje żadnego ruchu organicznego z Google — niezależnie od jakości treści i liczby linków przychodzących.

Czym jest deindeksacja strony?
Indeks wyszukiwarki to baza danych wszystkich stron, które Google odwiedził, przeanalizował i uznał za godne wyświetlenia w wynikach wyszukiwania. Gdy strona trafia do indeksu, może pojawiać się w rankingach dla odpowiednich zapytań. Gdy opuszcza indeks — znika z wyszukiwarki całkowicie.
Deindeksacja dotyczy konkretnych URL, a nie całego domenu (o ile nie blokujesz całej witryny). Serwis może mieć tysiące zaindeksowanych stron i kilka zdeindeksowanych — to normalna sytuacja dla dużych witryn.
Celowa deindeksacja: kiedy i po co
Właściciele witryn celowo deindeksują strony w następujących sytuacjach:
- Duplikaty treści — strony filtrów, parametrów sortowania, tagów, kategorii z minimalną unikalną zawartością
- Strony testowe i administracyjne — środowiska staging, strony panelu admina, tymczasowe landing pages
- Strony z cienką treścią — poniżej 300 słów, bez unikalnej wartości dla użytkownika
- Dane osobowe i prawne — strony z informacjami osobistymi, które nie powinny być publiczne
- Przestarzałe lub błędne treści — artykuły, których fakty są nieaktualne i nie warte aktualizacji
- Strony po migracji — stare URL po redesignie, na które skonfigurowano już przekierowanie 301
Niecelowa deindeksacja: główne przyczyny
Niecelowa deindeksacja to jeden z najniebezpieczniejszych incydentów technicznego SEO, bo często pozostaje niezauważona przez tygodnie.
- Błąd w robots.txt —
Disallow: /lub nieprawidłowa ścieżka blokująca całą witrynę lub ważne sekcje - Przypadkowo dodany noindex — wtyczka cache, szablon lub aktualizacja CMS dodała meta tag do wszystkich stron
- Błędy serwera — jeśli strona zwraca 5xx lub 404 przez kilka kolejnych tygodni, Google usuwa ją z indeksu
- Ręczne działania Google — kara za naruszenie wytycznych dla webmasterów (thin content, spam links, cloaking)
- Usunięcie przez filtr algorytmiczny — po aktualizacjach algorytmu (Panda, HCU) słabe strony mogą być masowo deindeksowane
- Wygasły hosting lub domena — witryna zwraca błąd, Google przestaje crawlować i ostatecznie deindeksuje
Co powinno być w robots.txt
Plik robots.txt to plik tekstowy w katalogu głównym witryny, który informuje roboty wyszukiwarek, które strony odwiedzać, a które pomijać. Nie gwarantuje deindeksacji, ale kontroluje wydawanie budżetu crawlowania.
Wymagane dyrektywy w robots.txt
- User-agent — określa, do którego robota odnosi się reguła.
User-agent: *oznacza wszystkie roboty;User-agent: Googlebotdotyczy tylko Google - Disallow — ścieżki zablokowane przed crawlowaniem. Przykład:
Disallow: /admin/ - Allow — wyjątki wewnątrz zablokowanego katalogu. Na przykład, jeśli
/admin/jest zablokowany, ale/admin/publiczna-stronama być dostępna - Sitemap — link do mapy witryny XML. Przykład:
Sitemap: https://twojadomena.pl/sitemap.xml
Przykład poprawnego robots.txt
User-agent: *
Disallow: /wp-admin/
Disallow: /cart/
Disallow: /checkout/
Disallow: /my-account/
Disallow: /search/
Allow: /wp-admin/admin-ajax.php
User-agent: Googlebot-Image
Disallow: /wp-content/uploads/private/
Sitemap: https://twojadomena.pl/sitemap.xmlCzego NIE blokować przez robots.txt
- Pliki CSS i JS — Google potrzebuje ich do renderowania i oceny stron
- Zdjęcia produktów lub artykułów — generują ruch z Google Grafika
- Strona główna i kluczowe strony docelowe — oczywiste, ale to się zdarza
- Strony kategorii i tagów — zablokowanie ich powoduje utratę widoczności, jeśli mają ruch
Ważne: robots.txt vs noindex
Jeśli celem jest usunięcie strony z indeksu, użyj tagu noindex, a nie Disallow w robots.txt. Powód: jeśli strona jest zablokowana przez Disallow, ale prowadzą do niej linki zewnętrzne, Google może zachować URL w indeksie (bez snippetu) — po prostu dlatego, że widzi linki, ale nie może zweryfikować treści. Tag noindex jest odczytywany podczas crawlowania i gwarantuje usunięcie.
Metody deindeksacji: porównanie
1. Tag noindex (zalecany)
Dodaj do <head> strony: <meta name="robots" content="noindex, follow">
Lub przez nagłówek HTTP: X-Robots-Tag: noindex (odpowiedni dla plików PDF i innych zasobów non-HTML)
- Gwarantuje usunięcie strony z indeksu po kolejnym crawlowaniu
- Zachowuje autorytet linkowy (jeśli użyto
follow) - Googlebot nadal odwiedza stronę — nie oszczędza budżetu crawlowania
2. Disallow w robots.txt
Blokuje crawlowanie, ale nie gwarantuje deindeksacji. Jeśli linki zewnętrzne prowadzą do strony, Google może zachować URL w indeksie bez treści.
Używaj do: oszczędzania budżetu crawlowania, blokowania sekcji administracyjnych bez linków zewnętrznych.
3. URL Removal Tool w Google Search Console
Rozwiązanie tymczasowe. Strona znika z indeksu na około 6 miesięcy, po czym wraca (jeśli nie dodano noindex). Przydatny do pilnego usunięcia wrażliwych danych.
Ścieżka: Google Search Console → Usunięcia → Tymczasowe usunięcia.
4. Tag canonical (pośrednia deindeksacja)
Wskaż rel="canonical" ze strony duplikatu na stronę główną. Google stopniowo przeniesie sygnały rankingowe na kanoniczny URL i przestanie pokazywać duplikat w wyszukiwarce.
Wpływ deindeksacji na SEO
Deindeksowanie pojedynczych stron to standardowa procedura dla zdrowia witryny. Masowa lub niecelowa deindeksacja może jednak spowodować:
- Nagły spadek ruchu — wszystkie zapytania dla zdeindeksowanych stron znikają z wyników
- Spadek autorytetu domeny — jeśli deindeksowane są strony z linkami przychodzącymi
- Pogorszenie pokrycia indeksowania — raport Pokrycie w GSC pokazuje nowe błędy
- Utrata pozycji — nawet po reindeksacji pozycje mogą potrzebować 2–12 tygodni na odbudowę
Jak sprawdzić deindeksację
Google Search Console
Raport „Indeksowanie stron” (dawniej „Pokrycie”) to najbardziej kompleksowe narzędzie. Dzieli wszystkie URL witryny na: zaindeksowane, wykluczone, z błędami i z ostrzeżeniami. Nagły skok w kategorii „Wykluczone” to pierwszy sygnał niecelowej deindeksacji.
Operator site: w wyszukiwarce
Wpisz w Google: site:twojadomena.pl. Pokaże liczbę zaindeksowanych stron. Nagły spadek w porównaniu z poprzednim tygodniem to powód do szczegółowego audytu.
Narzędzie inspekcji URL w GSC
Wpisz konkretny URL i uzyskaj jego status: „Strona jest zaindeksowana” lub „Strona nie jest zaindeksowana” z wyjaśnieniem przyczyny.
Jak odzyskać zdeindeksowaną stronę
- Zidentyfikuj przyczynę — sprawdź GSC, robots.txt, meta tagi noindex i kod HTTP strony
- Usuń przyczynę — usuń noindex, popraw robots.txt, przywróć status 200
- Wyślij do reindeksacji — przez narzędzie inspekcji URL w GSC → „Prośba o indeksowanie”
- Sprawdź po 1–14 dniach — strona powinna pojawić się w indeksie i stopniowo odbudować pozycje
Zapobieganie niecelowej deindeksacji
- Sprawdzaj robots.txt po każdej aktualizacji CMS lub wtyczek
- Skonfiguruj alerty GSC dla błędów indeksowania
- Monitoruj tygodniowo liczbę zaindeksowanych stron (Screaming Frog, GSC)
- Testuj środowisko staging z zablokowanym robots.txt i upewnij się, że nie trafia na produkcję
- Weryfikuj tagi noindex po każdym wdrożeniu nowej wersji strony
Checklista kontroli indeksowania strony
- Sprawdzono robots.txt: brak niepożądanych reguł Disallow dla ważnych stron
- Zweryfikowano tagi noindex na wszystkich kluczowych stronach
- GSC: raport „Indeksowanie” przejrzany, brak anomalnego wzrostu wykluczeń
- Liczba zaindeksowanych stron zgodna z oczekiwaną
- Dla stron do deindeksacji: dodano noindex lub canonical
- Sekcje administracyjne (/admin/, /cart/, /checkout/) zablokowane w robots.txt
- sitemap.xml zawiera tylko zaindeksowane strony (bez URL z noindex)
- Skonfigurowano alerty GSC dla nowych błędów indeksowania
- Zweryfikowano kody statusu: wszystkie ważne strony zwracają 200
- robots.txt i tagi noindex sprawdzane po każdym wdrożeniu
Najczęściej zadawane pytania o deindeksację
Czym jest deindeksacja strony?
Deindeksacja to usunięcie strony lub całej witryny z indeksu wyszukiwarki. Strona zdeindeksowana nie pojawia się w wynikach Google i nie może przyciągać ruchu organicznego. Deindeksacja może być celowa (skonfigurowana przez właściciela strony) lub niecelowa (spowodowana błędami technicznymi lub naruszeniami zasad jakości).
Czym różni się robots.txt od tagu noindex?
robots.txt blokuje crawlowanie — Googlebot nie odwiedza strony i nie może odczytać jej treści. Strona może jednak pozostać w indeksie (jako URL bez opisu), jeśli prowadzą do niej linki zewnętrzne. Tag noindex pozwala Googlebot odwiedzić stronę, ale nakazuje nie umieszczać jej w indeksie. Dla pewnego usunięcia ze strony wynikowej używaj noindex, a nie Disallow w robots.txt.
Ile czasu zajmuje deindeksacja po dodaniu noindex?
Google zazwyczaj przetwarza tag noindex w ciągu 1–14 dni po kolejnym crawlowaniu strony. Aby przyspieszyć ten proces, wyślij URL do ponownego crawlowania przez Google Search Console (narzędzie inspekcji URL → Prośba o indeksowanie). W pilnych przypadkach użyj URL Removal Tool w GSC — strona znika w ciągu kilku godzin.
Co dzieje się z SEO po deindeksacji strony?
Zdeindeksowana strona traci cały ruch organiczny z Google. Linki wewnętrzne do niej stają się 'martwe’ z punktu widzenia przekazywania autorytetu. Dla zdrowia SEO: ustaw przekierowanie 301 do odpowiedniej strony (jeśli treść się przeniosła) lub zablokuj przez noindex (jeśli treść nikomu nie służy).
Jak sprawdzić, czy strona jest zaindeksowana?
Najprostsza metoda to wpisanie w Google: site:twojadomena.pl/twoja-strona. Jeśli strona pojawia się w wynikach — jest w indeksie. Szczegółową analizę przeprowadzisz w Google Search Console: raport Pokrycie lub narzędzie inspekcji URL (kliknij konkretny URL i sprawdź status indeksowania).
Przypadkowo zdeindeksowałeś ważne strony lub chcesz poprawnie zablokować zbędne? Spilno Agency przeprowadza audyty techniczne SEO i konfiguruje właściwe indeksowanie Twojej witryny.


