Surfen wie ein Google Bot

surfen-wie-ein-google-bot-board-error-msg
Oft sucht man bei Google nach Problemen oder Fehlermeldungen. Die Suchergebnisse sind dann teilweise Gespräche in Foren, wo man eventuell die Lösung finden könnte. Einige Foren aber verweigern den Lesezugriff, so kann man sich den Thread nicht durchlesen.
Oder man hat bei einem Gastbesuch gemerkt, dass eine Person viel Ahnung hat und möchte das Profil der Person aufrufen, das meistens als Gast verboten wird.

Tipp #1: Google Cache
Wenn der Google Bot durch ein Forum huscht dann packt er alle besuchten Seite in einen Cache. Dieser ist fix aber kann oft auch betrachtet werden, wenn der eigentliche Lesezugriff zu der Seite nicht erlaubt ist.
surfen-wie-ein-google-bot-cache
Per Klick auf „Cached“ erhaltet ihr die vom Google Bot erfasste Seite. Sobald ihr dort aber einen Link anklicken wollt, zum Beispiel für die nächste Seite, werdet ihr wieder auf die Board Nachricht treffen, dass ihr euch erst registrieren müsst. Daher der

Tipp #2: Trojanisches Pferd: Identität des Google Bots annehmen
Ihr könnt euren User Agent umändern. Der Google Bot hat eine ganz spezielle Browserkennung (User Agent), den könnt ihr selber auch nutzen.
Im Firefox ist das ganz simpel, öffnet einfach die about:config („about:config“ in die Adressleiste eingeben) und sucht nach „useragent“.
Die Kennung steht bei „general.useragent.extra.firefox„, tragt dort den Wert „Googlebot/2.1 (+http://www.google.com/bot.html)“ und evtl. könnt ihr dann das ganze Forum durchsuchen.

Tipps:
Es gibt noch mehr Useragents, die man einstellen kann. Und es gibt Dienste, wie diesen hier, die euch mit einem modifizierten Useragent an eine bestimmte URL weiterleiten, dann müsst ihr bei euch den Wert nicht ändern. Dann sollte allerdings (wenn ich mich nicht irre) nur diese eine Seite funktionieren, keine Links.

3 Kommentare

  1. Auf meinen Seiten kontrolliere ich regelmäßig teilautomatisiert die Logs. Wenn ein User-Agent sich als googlebot ausweist aber nicht von der IP 66.249.xx.xx. kommt, ist er für mich suspekt und die IP (bzw. der Range) wird gesperrt.

  2. Das ist natürlich an sich clever, da Google Bots ja feste IPs haben (wobei Änderungen an der Range 66.249.x.x nicht ausgeschlossen sind). Aber die Range sperren würde ich auf keinen Fall, das betrifft ja dann auch weitere Server vom selben Anbieter des Googlebot-Fakers. Also schadet auch deinem Forum.

Schreibe einen Kommentar