Deindeksacja strony: co to jest i na co wpływa

Autor Валерій Красько | 15 maj 2026 | 9 min czytania 0 wyświetleń

Deindeksacja strony: co to jest i na co wpływa

Deindeksacja strony internetowej to proces, w którym wyszukiwarka — najczęściej Google — usuwa jedną lub więcej stron ze swojego indeksu. Strona zaindeksowana pojawia się w wynikach wyszukiwania; strona zdeindeksowana znika z nich całkowicie. Deindeksacja może być celowa (samodzielnie blokujesz strony przed wyszukiwarkami) lub niecelowa (Google usuwa je z powodu błędów technicznych, naruszeń jakości lub błędnej konfiguracji witryny).

Strona zdeindeksowana nie generuje żadnego ruchu organicznego z Google — niezależnie od jakości treści i liczby linków przychodzących.

Czym jest deindeksacja strony?

Indeks wyszukiwarki to baza danych wszystkich stron, które Google odwiedził, przeanalizował i uznał za godne wyświetlenia w wynikach wyszukiwania. Gdy strona trafia do indeksu, może pojawiać się w rankingach dla odpowiednich zapytań. Gdy opuszcza indeks — znika z wyszukiwarki całkowicie.

Deindeksacja dotyczy konkretnych URL, a nie całego domenu (o ile nie blokujesz całej witryny). Serwis może mieć tysiące zaindeksowanych stron i kilka zdeindeksowanych — to normalna sytuacja dla dużych witryn.

Celowa deindeksacja: kiedy i po co

Właściciele witryn celowo deindeksują strony w następujących sytuacjach:

Duplikaty treści — strony filtrów, parametrów sortowania, tagów, kategorii z minimalną unikalną zawartością
Strony testowe i administracyjne — środowiska staging, strony panelu admina, tymczasowe landing pages
Strony z cienką treścią — poniżej 300 słów, bez unikalnej wartości dla użytkownika
Dane osobowe i prawne — strony z informacjami osobistymi, które nie powinny być publiczne
Przestarzałe lub błędne treści — artykuły, których fakty są nieaktualne i nie warte aktualizacji
Strony po migracji — stare URL po redesignie, na które skonfigurowano już przekierowanie 301

Niecelowa deindeksacja: główne przyczyny

Niecelowa deindeksacja to jeden z najniebezpieczniejszych incydentów technicznego SEO, bo często pozostaje niezauważona przez tygodnie.

Błąd w robots.txt — Disallow: / lub nieprawidłowa ścieżka blokująca całą witrynę lub ważne sekcje
Przypadkowo dodany noindex — wtyczka cache, szablon lub aktualizacja CMS dodała meta tag do wszystkich stron
Błędy serwera — jeśli strona zwraca 5xx lub 404 przez kilka kolejnych tygodni, Google usuwa ją z indeksu
Ręczne działania Google — kara za naruszenie wytycznych dla webmasterów (thin content, spam links, cloaking)
Usunięcie przez filtr algorytmiczny — po aktualizacjach algorytmu (Panda, HCU) słabe strony mogą być masowo deindeksowane
Wygasły hosting lub domena — witryna zwraca błąd, Google przestaje crawlować i ostatecznie deindeksuje

Co powinno być w robots.txt

Plik robots.txt to plik tekstowy w katalogu głównym witryny, który informuje roboty wyszukiwarek, które strony odwiedzać, a które pomijać. Nie gwarantuje deindeksacji, ale kontroluje wydawanie budżetu crawlowania.

Wymagane dyrektywy w robots.txt

User-agent — określa, do którego robota odnosi się reguła. User-agent: * oznacza wszystkie roboty; User-agent: Googlebot dotyczy tylko Google
Disallow — ścieżki zablokowane przed crawlowaniem. Przykład: Disallow: /admin/
Allow — wyjątki wewnątrz zablokowanego katalogu. Na przykład, jeśli /admin/ jest zablokowany, ale /admin/publiczna-strona ma być dostępna
Sitemap — link do mapy witryny XML. Przykład: Sitemap: https://twojadomena.pl/sitemap.xml

Przykład poprawnego robots.txt

User-agent: *
Disallow: /wp-admin/
Disallow: /cart/
Disallow: /checkout/
Disallow: /my-account/
Disallow: /search/
Allow: /wp-admin/admin-ajax.php

User-agent: Googlebot-Image
Disallow: /wp-content/uploads/private/

Sitemap: https://twojadomena.pl/sitemap.xml

Czego NIE blokować przez robots.txt

Pliki CSS i JS — Google potrzebuje ich do renderowania i oceny stron
Zdjęcia produktów lub artykułów — generują ruch z Google Grafika
Strona główna i kluczowe strony docelowe — oczywiste, ale to się zdarza
Strony kategorii i tagów — zablokowanie ich powoduje utratę widoczności, jeśli mają ruch

Ważne: robots.txt vs noindex

Jeśli celem jest usunięcie strony z indeksu, użyj tagu noindex, a nie Disallow w robots.txt. Powód: jeśli strona jest zablokowana przez Disallow, ale prowadzą do niej linki zewnętrzne, Google może zachować URL w indeksie (bez snippetu) — po prostu dlatego, że widzi linki, ale nie może zweryfikować treści. Tag noindex jest odczytywany podczas crawlowania i gwarantuje usunięcie.

Metody deindeksacji: porównanie

1. Tag noindex (zalecany)

Dodaj do <head> strony: <meta name="robots" content="noindex, follow">

Lub przez nagłówek HTTP: X-Robots-Tag: noindex (odpowiedni dla plików PDF i innych zasobów non-HTML)

Gwarantuje usunięcie strony z indeksu po kolejnym crawlowaniu
Zachowuje autorytet linkowy (jeśli użyto follow)
Googlebot nadal odwiedza stronę — nie oszczędza budżetu crawlowania

2. Disallow w robots.txt

Blokuje crawlowanie, ale nie gwarantuje deindeksacji. Jeśli linki zewnętrzne prowadzą do strony, Google może zachować URL w indeksie bez treści.

Używaj do: oszczędzania budżetu crawlowania, blokowania sekcji administracyjnych bez linków zewnętrznych.

3. URL Removal Tool w Google Search Console

Rozwiązanie tymczasowe. Strona znika z indeksu na około 6 miesięcy, po czym wraca (jeśli nie dodano noindex). Przydatny do pilnego usunięcia wrażliwych danych.

Ścieżka: Google Search Console → Usunięcia → Tymczasowe usunięcia.

4. Tag canonical (pośrednia deindeksacja)

Wskaż rel="canonical" ze strony duplikatu na stronę główną. Google stopniowo przeniesie sygnały rankingowe na kanoniczny URL i przestanie pokazywać duplikat w wyszukiwarce.

Wpływ deindeksacji na SEO

Deindeksowanie pojedynczych stron to standardowa procedura dla zdrowia witryny. Masowa lub niecelowa deindeksacja może jednak spowodować:

Nagły spadek ruchu — wszystkie zapytania dla zdeindeksowanych stron znikają z wyników
Spadek autorytetu domeny — jeśli deindeksowane są strony z linkami przychodzącymi
Pogorszenie pokrycia indeksowania — raport Pokrycie w GSC pokazuje nowe błędy
Utrata pozycji — nawet po reindeksacji pozycje mogą potrzebować 2–12 tygodni na odbudowę

Jak sprawdzić deindeksację

Google Search Console

Raport „Indeksowanie stron” (dawniej „Pokrycie”) to najbardziej kompleksowe narzędzie. Dzieli wszystkie URL witryny na: zaindeksowane, wykluczone, z błędami i z ostrzeżeniami. Nagły skok w kategorii „Wykluczone” to pierwszy sygnał niecelowej deindeksacji.

Operator site: w wyszukiwarce

Wpisz w Google: site:twojadomena.pl. Pokaże liczbę zaindeksowanych stron. Nagły spadek w porównaniu z poprzednim tygodniem to powód do szczegółowego audytu.

Narzędzie inspekcji URL w GSC

Wpisz konkretny URL i uzyskaj jego status: „Strona jest zaindeksowana” lub „Strona nie jest zaindeksowana” z wyjaśnieniem przyczyny.

Jak odzyskać zdeindeksowaną stronę

Zidentyfikuj przyczynę — sprawdź GSC, robots.txt, meta tagi noindex i kod HTTP strony
Usuń przyczynę — usuń noindex, popraw robots.txt, przywróć status 200
Wyślij do reindeksacji — przez narzędzie inspekcji URL w GSC → „Prośba o indeksowanie”
Sprawdź po 1–14 dniach — strona powinna pojawić się w indeksie i stopniowo odbudować pozycje

Zapobieganie niecelowej deindeksacji

Sprawdzaj robots.txt po każdej aktualizacji CMS lub wtyczek
Skonfiguruj alerty GSC dla błędów indeksowania
Monitoruj tygodniowo liczbę zaindeksowanych stron (Screaming Frog, GSC)
Testuj środowisko staging z zablokowanym robots.txt i upewnij się, że nie trafia na produkcję
Weryfikuj tagi noindex po każdym wdrożeniu nowej wersji strony

Checklista kontroli indeksowania strony

Sprawdzono robots.txt: brak niepożądanych reguł Disallow dla ważnych stron
Zweryfikowano tagi noindex na wszystkich kluczowych stronach
GSC: raport „Indeksowanie” przejrzany, brak anomalnego wzrostu wykluczeń
Liczba zaindeksowanych stron zgodna z oczekiwaną
Dla stron do deindeksacji: dodano noindex lub canonical
Sekcje administracyjne (/admin/, /cart/, /checkout/) zablokowane w robots.txt
sitemap.xml zawiera tylko zaindeksowane strony (bez URL z noindex)
Skonfigurowano alerty GSC dla nowych błędów indeksowania
Zweryfikowano kody statusu: wszystkie ważne strony zwracają 200
robots.txt i tagi noindex sprawdzane po każdym wdrożeniu

Najczęściej zadawane pytania o deindeksację

Czym jest deindeksacja strony?

Deindeksacja to usunięcie strony lub całej witryny z indeksu wyszukiwarki. Strona zdeindeksowana nie pojawia się w wynikach Google i nie może przyciągać ruchu organicznego. Deindeksacja może być celowa (skonfigurowana przez właściciela strony) lub niecelowa (spowodowana błędami technicznymi lub naruszeniami zasad jakości).

Czym różni się robots.txt od tagu noindex?

robots.txt blokuje crawlowanie — Googlebot nie odwiedza strony i nie może odczytać jej treści. Strona może jednak pozostać w indeksie (jako URL bez opisu), jeśli prowadzą do niej linki zewnętrzne. Tag noindex pozwala Googlebot odwiedzić stronę, ale nakazuje nie umieszczać jej w indeksie. Dla pewnego usunięcia ze strony wynikowej używaj noindex, a nie Disallow w robots.txt.

Ile czasu zajmuje deindeksacja po dodaniu noindex?

Google zazwyczaj przetwarza tag noindex w ciągu 1–14 dni po kolejnym crawlowaniu strony. Aby przyspieszyć ten proces, wyślij URL do ponownego crawlowania przez Google Search Console (narzędzie inspekcji URL → Prośba o indeksowanie). W pilnych przypadkach użyj URL Removal Tool w GSC — strona znika w ciągu kilku godzin.

Co dzieje się z SEO po deindeksacji strony?

Zdeindeksowana strona traci cały ruch organiczny z Google. Linki wewnętrzne do niej stają się 'martwe’ z punktu widzenia przekazywania autorytetu. Dla zdrowia SEO: ustaw przekierowanie 301 do odpowiedniej strony (jeśli treść się przeniosła) lub zablokuj przez noindex (jeśli treść nikomu nie służy).

Jak sprawdzić, czy strona jest zaindeksowana?

Najprostsza metoda to wpisanie w Google: site:twojadomena.pl/twoja-strona. Jeśli strona pojawia się w wynikach — jest w indeksie. Szczegółową analizę przeprowadzisz w Google Search Console: raport Pokrycie lub narzędzie inspekcji URL (kliknij konkretny URL i sprawdź status indeksowania).

Przypadkowo zdeindeksowałeś ważne strony lub chcesz poprawnie zablokować zbędne? Spilno Agency przeprowadza audyty techniczne SEO i konfiguruje właściwe indeksowanie Twojej witryny.

Валерій Красько Spilno Agency Wszystkie artykuły autora →

← Powrót do bloga

Deindeksacja strony: co to jest i na co wpływa

Czym jest deindeksacja strony?

Celowa deindeksacja: kiedy i po co

Niecelowa deindeksacja: główne przyczyny

Co powinno być w robots.txt

Wymagane dyrektywy w robots.txt

Przykład poprawnego robots.txt

Czego NIE blokować przez robots.txt

Ważne: robots.txt vs noindex

Metody deindeksacji: porównanie

1. Tag noindex (zalecany)

2. Disallow w robots.txt

3. URL Removal Tool w Google Search Console

4. Tag canonical (pośrednia deindeksacja)

Wpływ deindeksacji na SEO

Jak sprawdzić deindeksację

Google Search Console

Operator site: w wyszukiwarce

Narzędzie inspekcji URL w GSC

Jak odzyskać zdeindeksowaną stronę

Zapobieganie niecelowej deindeksacji

Checklista kontroli indeksowania strony

Najczęściej zadawane pytania o deindeksację

Czym jest deindeksacja strony?

Czym różni się robots.txt od tagu noindex?

Ile czasu zajmuje deindeksacja po dodaniu noindex?

Co dzieje się z SEO po deindeksacji strony?

Jak sprawdzić, czy strona jest zaindeksowana?

Czytaj również

Reklama w ChatGPT: dla kogo jest dostępna i jak ją uruchomić w 2026 roku

Co zrobić, gdy freelancer lub agencja nie oddaje dostępu do konta Google Ads

Zapytania niskoczęstotliwościowe, średnio- i wysokoczęstotliwościowe: czym są i jak z nimi pracować