Jeden ze specjalistów ds. SEO zapytał Johna Muellera podczas hangouta o kontrolowanie indeksowania witryny przez Google za pomocą żądań API.
Ich pytanie brzmiało: A zatem mają platformę do zakupów z transmisją na żywo jako swoją witrynę internetową i obecnie ich witryna wydaje około 20 procent budżetu indeksowania subdomeny API i kolejne 20 procent na miniatury obrazów wideo.
Żadna z subdomen nie zawiera treści stanowiących część ich strategii SEO. Czy powinni uniemożliwić dalsze indeksowanie tych subdomen?
W jaki sposób wykrywane i/lub wykorzystywane są punkty końcowe interfejsu API?
John wyjaśnił, że punkty końcowe API są ostatecznie wykorzystywane przez JavaScript w Google i to one będą renderować Twoje strony.
A jeśli uzyskają dostęp do interfejsu API znajdującego się w witrynie, Google spróbuje załadować treść z tego interfejsu API i użyć jej do renderowania strony.
Ponadto, w zależności od konfiguracji interfejsu API i kodu JavaScript, może się zdarzyć, że Google będzie miał trudności z buforowaniem wyników interfejsu API. Oznacza to, że być może Google indeksuje wiele żądań API, aby uzyskać wyrenderowaną wersję Twoich stron, aby móc ich użyć do indeksowania.
Zwykle jest to miejsce, w którym zostaje to odkryte. Możesz w tym pomóc, upewniając się, że wyniki API również mogą być buforowane.
Nie wstawiasz więc żadnych znaczników czasu do adresów URL.
Na przykład, jeśli używasz JavaScript dla API, wszystkie te rzeczy tam są. Jeśli nie przejmujesz się treścią zwracaną przez te punkty końcowe API, możesz oczywiście zablokować indeksowanie tej subdomeny za pomocą pliku robots.txt.
A to zablokuje wszystkie żądania API. Zatem przede wszystkim musisz ustalić, czy wyniki interfejsu API stanowią część treści podstawowej, czy też są to ważne treści o znaczeniu krytycznym, które chcesz zaindeksować przez Google?
A jeśli tak, to może nie powinieneś blokować indeksowania. Jeśli jednak generuje coś, co ma prawie drugorzędne znaczenie w stosunku do Twoich stron lub cokolwiek, co nie jest krytyczne dla samych stron, warto dokładnie sprawdzić, jak to wygląda, gdy są blokowane.
Transkrypcja Hangouta Johna Muellera
Jan (pytanie)
OK, następne pytanie, jakie mam, pochodzi od Van Songa. Nasza witryna jest platformą umożliwiającą zakupy strumieniowe na żywo. Nasza witryna wydaje obecnie około 20% budżetu indeksowania na subdomenę API, kolejne 20% na miniatury obrazów wideo. Żadna z tych subdomen nie zawiera treści stanowiących część naszej strategii SEO. Czy powinniśmy uniemożliwić indeksowanie tych subdomen? Albo w jaki sposób wykrywane i wykorzystywane są punkty końcowe API?
Jan (odpowiedź)
Może więc najpierw ostatnie pytanie. W wielu przypadkach punkty końcowe API są wykorzystywane przez JavaScript w naszej witrynie, a my będziemy renderować Twoje strony. A jeśli uzyskają dostęp do interfejsu API znajdującego się w Twojej witrynie, spróbujemy w pewnym sensie załadować treść z tego interfejsu API i użyć jej do renderowania strony. W zależności od konfiguracji interfejsu API i kodu JavaScript może być dla nas trudno buforować wyniki interfejsu API, co oznacza, że być może indeksujemy wiele żądań interfejsu API, aby uzyskać wyrenderowany wersję Twoich stron, abyśmy mogli wykorzystać je do indeksowania. Zwykle jest to miejsce, w którym coś zostaje odkryte.
Możesz w tym pomóc, upewniając się, że wyniki interfejsu API mogą być również dobrze buforowane i że nie wstawiasz żadnych znaczników czasu do adresów URL. Na przykład, jeśli używasz JavaScript dla API, wszystkie te rzeczy tam są. Jeśli nie zależy Ci na treści zwracanej z tymi punktami końcowymi interfejsu API. Następnie możesz oczywiście zablokować indeksowanie całej subdomeny za pomocą pliku robots.txt. A to zasadniczo zablokuje wszystkie żądania API. Więc to jest coś, w czym musisz przede wszystkim dowiedzieć się, czy te wyniki API faktycznie stanowią część głównej treści czy ważnej treści krytycznej, którą chcę zaindeksować z Google?
A jeśli tak, to prawdopodobnie nie powinieneś blokować indeksowania. Jeśli jednak jest to coś, co zasadniczo generuje coś, co ma prawie drugorzędne znaczenie w stosunku do Twoich stron lub cokolwiek, co nie jest krytyczne dla samych stron, warto dokładnie sprawdzić, jak to wygląda, gdy są blokowane. Jednym ze sposobów, aby to sprawdzić, jest utworzenie osobnej strony testowej, która nie wywołuje interfejsu API lub używa uszkodzonego adresu URL punktu końcowego interfejsu API. Dzięki temu możesz zobaczyć, jak ta strona faktycznie renderuje się w mojej przeglądarce? Jak to renderuje dla Google? Więc to są rzeczy, na które bym tam spojrzał.