Podczas hangouta z Johnem Muellerem w dniu 13.08.2021 r. webmaster wyraził zaniepokojenie liczbą 500 błędów pojawiających się w Google Search Console.
John wyjaśnił, że nie ma w tym przypadku żadnych rzeczywistych progów. Wyjaśnił również, że Google będzie wielokrotnie ponawiać próby usunięcia błędów 5xx, a błędy te pozostaną zaindeksowane.
Jeśli po kilku próbach Google stwierdzi, że tych stron rzeczywiście nie ma, usunie je.
Oto efekty, jakie zobaczysz w przypadku 500 błędów. Jeśli problem z tymi błędami wynosi więcej niż 1 procent w porównaniu z liczbą stron w Twojej witrynie, warto sprawdzić witrynę pod kątem poważnych problemów na wypadek, gdyby coś uległo uszkodzeniu.
Webmaster był również zaniepokojony błędami 504 i problemem było to, czy odczytanie błędu 200 dokładnie w tym samym czasie – pod tym samym adresem URL co błąd 500 – stanowi problem.
Webmaster 4 13:46
Fajny. Dziękuję, John. Dlatego też pewne podstawy, nasze systemy i sieć dostarczania treści zaprojektowano tak, aby umożliwić wszystkim prawdziwym użytkownikom przeglądanie naszych treści i odfiltrowywanie niektórych botów, a jednocześnie przepuszczanie innych, takich jak Googlebot. I tylko dla dodatkowego kontekstu. Na początku tego roku zmieniliśmy nasz pakiet monitorowania serwerów. I myśleliśmy, że przenieśliśmy wszystkie potrzeby w zakresie raportowania. Musieliśmy mieć pewność, że Googlebot będzie miał dostęp do naszych treści.
Niestety, wygląda na to, że niektóre przeoczyliśmy i zauważyliśmy w Search Console, że pod koniec zeszłego miesiąca pojawiło się około 500 błędów serii. Nasz zespół ds. technologii zadał pytanie, czy odzwierciedla to rzeczywisty wpływ na użytkownika i dlaczego mielibyśmy zwracać uwagę konkretnie na Googlebota, a nie na rzeczywiste dane o użytkownikach, aby udowodnić, że w tym przypadku występuje problem. W związku z tym kontekstem mam kilka pytań. Po pierwsze, należy po prostu usunąć problemy technologiczne. Jak z Twojej perspektywy Googlebot postrzega błędy serii 500? Czy mógłbyś wyjaśnić, wiesz, ustalone progi, w których momencie Googlebot będzie, no wiesz, indeksował treść źródłową w oparciu o te błędy, a nie w oparciu o te błędy?
Jana 14:58
Nie mamy w tym zakresie żadnych mocnych progów. Ale zasadniczo w przypadku 500 błędów spróbujemy je powtórzyć. A jeśli nadal będziemy widzieć, że jest to 500 błędów, to w pewnym sensie spowolnimy indeksowanie. Jeśli w dalszym ciągu będziemy widzieć, że jest to 500 błędów, usuniemy te adresy URL z indeksu. Jeśli od czasu do czasu na poszczególnych stronach pojawi się błąd 500, to nic wielkiego, jeśli spróbujemy je powtórzyć, pozostaną one zaindeksowane.
I następnym razem spróbujemy ich ponownie tym razem. Ale jeśli duża część witryny stale zawiera 500 błędów i możemy założyć, że to my jesteśmy przyczyną problemu, spowolnimy indeksowanie całej witryny i w pewnym momencie powiemy: „No cóż, , wygląda na to, że tych stron naprawdę nie ma, więc je usuniemy. To są w zasadzie efekty, które tam zobaczysz.
A jeśli mówisz o dużej witrynie i zastanawiasz się, jaki procent z 500 błędów jest w porządku? Nie wiem, mam wrażenie, że jeśli widzisz coś więcej niż 1 procent, to brzmi to tak, jakby coś było, jest w pewnym sensie zepsute i prawdopodobnie zaczęlibyśmy zwalniać. Nie sądzę jednak, abyśmy mieli jakieś sztywne progi, przy których powiedzielibyśmy, że jest tak wiele żądań, a tak wiele błędów oznacza tak duże spowolnienie.
Webmaster 4 16:28
Ok spoko. Dziękuję. Ponadto nasze dzienniki serwera pokazują, że Googlebot otrzymał kod 200 o tej samej sygnaturze czasowej, co kod 504 w Search Console, a nasza sieć dostarczania treści informuje nas, że jeśli Googlebot otrzyma kod 504 z sieci CDN, automatycznie spróbuje pobrać z pochodzenie. Czy mógłbyś mi to potwierdzić, zaprzeczyć lub ewentualnie pomylić?
Jana 16:54
Nie sądzę, żebyśmy zrobili coś specjalnego w odniesieniu do 504. Ale w pewnym sensie muszę to zrobić, musiałbym jeszcze raz sprawdzić. Dlatego w dokumentacji programisty wyszukiwania umieściliśmy stronę ze wszystkimi kodami stanu HTTP i naszą reakcją na to. Nie sądzę, żebyśmy mieli cokolwiek, co powiedzielibyśmy, że odroczylibyśmy pochodzenie inne niż CDN, ponieważ tak naprawdę nie widzimy tej różnicy. Ponieważ z naszego punktu widzenia uzyskujemy dostęp do nazwy domeny. A jeśli nazwa domeny zostanie przekształcona w CDN, to właśnie to otrzymamy. Nie powiemy: „No cóż, weźmiemy inny adres IP i spróbujemy ponownie”.
Webmaster 4 17:39
Ok spoko. To faktycznie pomoże w dalszej dyskusji z naszym CDN. Więc dziękuję. Ostatnie pytanie. Czy jeśli zarządzam witryną herbaciarni, wszystkie moje strony będą miały wartość 418? Wiesz, pomóż mi uzyskać lepszą pozycję w rankingach? Prawdopodobnie nie. Prawidłowy.
Jana 17:56
Właściwie nie wiem, co byśmy z tym zrobili. Prawdopodobnie usunęliśmy je jako błędy 400. Więc to wydaje się złym pomysłem. Przepraszam. Po prostu uwielbiałem kod statusu 418. To po prostu świetna zabawa.