Specjalista ds. SEO miał wątpliwości dotyczące indeksowania i tego, czy Googlebot będzie indeksował za pośrednictwem identyfikującego adresu IP.
Mają Googlebota indeksującego określone adresy URL skonfigurowane ze względów reklamowych. Mianowicie adresy URL parametrów UTM, wyświetlane adresy URL Google i uniwersalne kampanie promujące aplikacje.
Mimo to profesjonalista sprawdził i nie widzi żadnych linków prowadzących skądkolwiek do tych adresów URL.
Więc to zachowanie ich zaskoczyło.
John wyjaśnił, że chociaż nie wie tego od razu, wierzy, że będą one indeksować te strony za pomocą Googlebota, aby mieć pewność, że będą mogły je pobrać i przenieść do Merchant Center.
Jeśli istnieją otagowane adresy URL, takie jak adresy URL UTM, możliwe, że zwykły Googlebot je zaindeksuje i wyświetli w Google Search Console.
Możliwe jest również, że ktoś działający w ich imieniu również prześle adresy URL.
Najbardziej prawdopodobny powód jest taki, że jeśli Google znajdzie gdzieś linki do tych stron, spróbuje je zaindeksować.
Jeśli w dowolnym miejscu witryny znajdują się oznaczone linki wewnętrzne, Google podejmie próbę ich przetworzenia i zaindeksowania.
Na przykład, jeśli masz coś skonfigurowanego w JavaScript i adresy URL z tymi parametrami są gdzieś skonfigurowane, Google może potencjalnie je zaindeksować.
Wyjaśnił również, że Google nie przeszukuje adresów URL na dużą skalę, nie pokazując w szczególności, że to Googlebot.
Dzieje się to mniej więcej w 54:22 momencie filmu.
Profesjonalista SEO 9 54:22
Cześć John. Mam też pytanie dotyczące raczkowania. Widzimy w naszych plikach dziennika i również udowodniliśmy, że jest to bot Google, za pośrednictwem IEP. Dużo indeksowania od organicznego bota do adresów URL parametrów UTM, sieci reklamowej Google i uniwersalnych kampanii promujących aplikacje. Sprawdziliśmy jednak i nie widzimy żadnych linków prowadzących skądkolwiek do tych adresów URL. Dlatego jesteśmy trochę zaskoczeni takim zachowaniem. Czy masz pomysł, gdzie i dlaczego może się to zdarzyć?
Jana 55:07
Jakiego rodzaju są to adresy URL tagów?
Profesjonalista SEO 9 55:11
Wyświetlacz Google. Czyli UTM, Google Display i uniwersalna kampania promująca aplikację. Obie są w zasadzie kampaniami displayowymi.
Jana 55:24
Teraz nie wiem, od razu. Jedynym miejscem, w którym za pomocą Googlebota indeksujemy także strony wymienione w kampaniach reklamowych, jest, jak sądzę, wyszukiwarka produktów. Jeśli więc masz kanał wyszukiwania produktów lub kanał Merchant Center, nie jestem pewien, jak się nazywa i jest skonfigurowany, wtedy indeksujemy również te strony dla Googlebota, aby upewnić się, że możemy je pobrać do Merchant Center.
A jeśli masz tam otagowane adresy URL, może się to zdarzyć. Zachowamy te otagowane adresy URL i przetworzymy je ponownie. Nie wiem od razu, jak to działa z Merchant Center. Możliwe, że inne osoby będą mogły przesyłać tego rodzaju produkty, na przykład z Twojej witryny, w osobnym pliku danych. Zatem niekoniecznie Ty je przesyłasz, ale być może ktoś, kto pracuje w Twoim imieniu lub ma na to pozwolenie.
Ale to wydaje się najbardziej prawdopodobną przyczyną czegoś takiego. Inną kwestią jest to, że jeśli znajdziemy gdzieś linki do tych stron, spróbujemy je zaindeksować. Jeśli więc otagowałeś linki wewnętrzne w witrynie, nadal będziemy próbować je wychwycić i zaindeksować. Jeśli masz skonfigurowane rzeczy w JavaScript, być może masz gdzieś skonfigurowane adresy URL z tymi parametrami.
A kiedy przetwarzamy JavaScript, wygląda na to, że jest to link do tych linków monitorujących, możemy to również przetworzyć. Wydaje mi się jednak, że w przypadku Twojej witryny nie zdarzają się pojedyncze przypadki, ale raczej duża liczba tych adresów URL. A to bardzo przypomina centrum handlowe.
Profesjonalista SEO 9 57:18
Ok, tak, bo jest, jest dość duży. Zatem te adresy URL są indeksowane. Czyli w zasadzie 50 procent naszego pełzającego budżetu lub pełzającego naszej części organicznej. Rzecz w tym, że sprawdzałem także Search Console i w Search Console nie zgłoszono tego. Nie widzimy więc adresów URL tych parametrów w Search Console. Czy to może o czymś świadczyć?
Jana 57:45
To zależy od tego, gdzie spojrzysz w Search Console. Zatem jeśli w raporcie statystyk indeksowania są one indeksowane przez infrastrukturę Googlebota, powinny one również zostać tam wymienione. Nie sądzę, żebyśmy je wymieniali w witrynie dotyczącej zasięgu indeksu i wyników wyszukiwania.
Profesjonalny SEO 9 58:00
Tak, nie, nie było tego w raporcie indeksowania.
Jana 58:04
Jeśli więc nie są one widoczne w raporcie indeksowania, można odnieść wrażenie, że dzieje się coś dziwnego w tym sensie, że może to nie oficjalny Googlebot Cię tak indeksuje? Nie wiem, trudno powiedzieć. Ponieważ mamy różne systemy korzystające z infrastruktury Googlebota, które umożliwiają odwrotne wyszukiwanie adresów IP. Wszystko to powinno znaleźć się w raporcie statystyk indeksowania w Search Console.
Profesjonalista SEO 9 58:38
OK, ponieważ dla kilku z nich ręcznie sprawdziliśmy adres IP, a także wyszukiwanie DNS. I wygląda na to, że to Googlebot.
Jana 58:47
Czy jest mapowany z powrotem do Google, czy bezpośrednio do Googlebota? Ponieważ w Google Cloud możesz także uruchamiać usługi, a te adresy IP wracają do Google. Ale nie wracają do Googlebota.
Profesjonalny SEO 9 59:05
Nie, sprawdza terminal i okazuje się, że to Googlebot.
Jana 59:09
Dobra. Tak. W takim razie zdecydowanie powinny znaleźć się w raporcie statystyk indeksowania w Search Console.
Profesjonalista SEO 9 59:17
Dobra. Taka tajemnica – i mam kolejne pytanie, jeśli można. Czy Google kiedykolwiek indeksuje strony internetowe, nie będąc Googlebotem?
Jana 59:36
Nie będąc Googlebotem?
Profesjonalista SEO 9 59:37
Więc nie wiem, czy na przykład w przypadkach takich jak ty próbujesz to sprawdzić, mogę to nazwać, jak pokazanie dwóch różnych wersji użytkownikom i botowi, czy coś w tym stylu. Nie wiem, czy istnieją takie systemy.
Jana 59:51
Nie sądzę, żebyśmy się tak czołgali. Możemy sprawdzać poszczególne adresy URL. Istnieje wiele innych systemów, które również się tym zajmują, na przykład coś w rodzaju „Nie wiem”, Tłumacz Google. To mogłoby się przydać – jestem całkiem pewien, że używa normalnego klienta przeglądarki. Ale nadal przechodzi przez infrastrukturę przypominającą infrastrukturę Google. Ale nie przeszukalibyśmy Tłumacza Google, byłoby to po prostu indywidualnym żądaniem. Z mojego punktu widzenia nie sądzę, abyśmy przetwarzali dużą liczbę adresów URL w ten sposób. Oprócz, jak wspomniałem, spraw związanych z centrum handlowym lub sprawdzaniem stron docelowych reklam. To także duża liczba adresów URL, ale opierają się na tym, co odpowiednio przesyłasz do tych systemów.
Profesjonalista SEO 9 1:00:46
W każdym razie byłyby one zazwyczaj indeksowane przez bota reklamowego Google, prawda?
Jana 1:00:52
Tak, myślę, że Merchant Center nie. Myślę, że Merchant Center byłby normalnym Googlebotem.
Profesjonalista SEO 9 1:00:59
OK, więc w zasadzie żaden Google nie będzie indeksował na dużą skalę bez pokazywania, że to w jakiś sposób Google?.
Jana 1:01:06
Tak, i tak nie sądzę, żebyśmy to robili ze względów politycznych, ale wydaje mi się, że teoretycznie może być tak, że ktoś kiedyś tego próbował. Nie sądzę jednak, żebyśmy zrobili to celowo.