Erfahrungen mit "SISTRIX Crawler" ??
Verfasst: 31.07.2011, 09:29
Hallo zusammen,
da das ja durchaus eine bekannte Firma / Software ist wollte ich mal fragen, was eure Erfahrungen mit den Crawler sind bzw. ob Ihr wisst, was der denn genau macht.
Hintergrund ist, dass heute Nacht um 4:32 mein Handy meinte es müsse mich mit lauter Warn-SMS aus dem Schlaf hohlen. Server down - Nicht der Webserver, sondern der Datenbank-Server und damit alle meine Webseiten.
Gut, das hatte sich wenige Minuten später wieder beruhigt, doch nun prüfe ich schon seit Stunden meine Logfiles. Das einzige was mir da auffällt ist der
"compatible; SISTRIX Crawler; https://crawler.sistrix.net/"
Der kam kurz vor dem Zusammenbruch, ist bis jetzt durchgehend da und belegt 3 Apache-Prozesse (99% CPU Last). Ok, nicht weiter schlimm, kann ja mal hängen. Doch nix da. Apache neu gestartet und sofort wieder. Ein Prozess - 70% CPU Last.
Der Crawler jagt nun also schon seit heute Nacht über meine Seite und ruft so 3-6 Seiten pro Sekunde ab. Der scheint aber aber auch nicht zu warten bis die Seite fertig ist, denn so schnell sind die teilweise nicht.
So, nun stelle ich mir die Frage: Was tun? Laufen lassen? Sperren? Gibt es ein Delay (hab nichts gefunden)?
da das ja durchaus eine bekannte Firma / Software ist wollte ich mal fragen, was eure Erfahrungen mit den Crawler sind bzw. ob Ihr wisst, was der denn genau macht.
Hintergrund ist, dass heute Nacht um 4:32 mein Handy meinte es müsse mich mit lauter Warn-SMS aus dem Schlaf hohlen. Server down - Nicht der Webserver, sondern der Datenbank-Server und damit alle meine Webseiten.
Gut, das hatte sich wenige Minuten später wieder beruhigt, doch nun prüfe ich schon seit Stunden meine Logfiles. Das einzige was mir da auffällt ist der
"compatible; SISTRIX Crawler; https://crawler.sistrix.net/"
Der kam kurz vor dem Zusammenbruch, ist bis jetzt durchgehend da und belegt 3 Apache-Prozesse (99% CPU Last). Ok, nicht weiter schlimm, kann ja mal hängen. Doch nix da. Apache neu gestartet und sofort wieder. Ein Prozess - 70% CPU Last.
Der Crawler jagt nun also schon seit heute Nacht über meine Seite und ruft so 3-6 Seiten pro Sekunde ab. Der scheint aber aber auch nicht zu warten bis die Seite fertig ist, denn so schnell sind die teilweise nicht.
So, nun stelle ich mir die Frage: Was tun? Laufen lassen? Sperren? Gibt es ein Delay (hab nichts gefunden)?