Re: Neuer Googlebot ohne Beachtung von robots.txt?
Von: Klaus Medeke (k.medeke@gmx.de) [Profil]
Datum: 31.01.2008 15:15
Message-ID: <47a1d6d2.828126@news.individual.de>
Newsgroup: de.comm.infosystems.suchmaschinen
Datum: 31.01.2008 15:15
Message-ID: <47a1d6d2.828126@news.individual.de>
Newsgroup: de.comm.infosystems.suchmaschinen
On Thu, 31 Jan 2008 13:40:16 +0100, Uwe Schröder wrote: >> Ich vermute, dass es um Verifikation dabei geht. > >Das liegt nahe. Aber das heißt immer noch nicht, daß es ein Bot sein >muß. Da können auch ein paar studentische Hilfskräfte sitzen und >stichprobenartig URLs ansurfen. Dafür wäre dann die robots.txt per >Definition irrelevant. Oder ist von den IPs ein typisches >Crawler-Pattern festzustellen? Nicht eindeutig. Unterschiedlich viele Aufrufe pro Tag in unterschiedlich großem Abstand zueinander. Manchmal 3 oder 4 Aufrufe in 1 Sekunde mehrere Sekunden hintereinander, dann wieder längere Pausen dazwischen. >In meinen Weblogs findet sich davon übrigens nichts. Bei mir nur bei der Domain, die mit session-IDs arbeitet. Viele Grüße, Klaus[ Auf dieses Posting antworten ]
