Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Hilfe! Googlebot läuft Amok :(

Dieses Forum ist für Informationen über Google gedacht (Ausser PageRank!).
Neues Thema Antworten
it-worker
PostRank 1
PostRank 1
Beiträge: 20
Registriert: 03.03.2007, 16:02

Beitrag von it-worker » 07.04.2008, 12:05

Googlebot besucht meine Seiten in letzter Zeit sehr häufig. Das ist eigentlich ja positiv, aber er besucht so intensiv, das der Server inzwischen das nicht mehr verträgt. Es werden wahnsinnig viele Apache-Prozesse gleichzeitig gestartet, der Apache-Dienst fällt 1 bis 2x pro Tag ganz aus :(

Ich hab die Besuche von Googlebot mal mit den Vormonaten verglichen. Seit ca. 1 Monat besucht Google ca. 10x so häufig was die Visits betrifft und erzeugt ein paarhundert mal so viele Hits als vorher.

Ich hab die MaxClients im apache2.conf jetzt mal raufgedreht auf 250 (Standardwert 150). Jetzt hab ich einen Load der liegt immer zwischen 1 und 3, dafür werden die Seiten noch geöffnet. Vorher lag der Load zwischen 0,5 und 1, aber dafür gingen die Seiten nicht mehr auf weil zu viele Prozesse offen waren. Angst dass er trotzdem wieder mal völlig ausfällt hab ich schon :(

Also ich bin irgendwie ratlos. Was soll ich tun? Ich kann doch nicht den Googlebot aussperren :)

Vielleicht noch was zur Website die es hauptsächlich betrifft:
Es handelt sich um eine Seite wo sehr viel Content vorhanden ist auf diversen Unterseiten - wirklich sehr viel. Aber der Content ist nicht so neu, die Website gibt's seit 2004 wo sich der Content nach und nach aufbaute. Aber die Probleme traten schlagartig auf.

Kann es vielleicht sein, dass die Crawler von Google irgendwie anders arbeiten seit ca. 1 Monat? Hat Google vielleicht ein paartausend Server dazugekauft, dass öfter/intensiver gespidert werden kann? Irgend einen Grund muss es doch geben. Was meint ihr?

Anzeige von ABAKUS

von Anzeige von ABAKUS »

Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

linux
PostRank 7
PostRank 7
Beiträge: 524
Registriert: 05.05.2004, 09:45

Beitrag von linux » 07.04.2008, 12:10

was ist bei dir viel? 1 mil mal am tag pro domain? was für ein server ist das ram, cpu...
man kann sicher mit ner einstellungen was machen, aber dazu sind diese angaben nötig

gruß

linux

Ilka
PostRank 1
PostRank 1
Beiträge: 4
Registriert: 04.09.2007, 16:53
Wohnort: Ostseebad Nienhagen

Beitrag von Ilka » 07.04.2008, 12:17

Ich habe das Problem auch gehabt. Ich hatte leider Session IDs an meinen Seiten die Google munter verfolgte. Das konnte ich aber abstellen. Dir empfehle ich aber in den Webmastertools den Punkt: Crawling-Geschwindigkeit festlegen" zu wählen und dort auf "Langsam" zu schalten. Das wirkt sofort.


Stürmische Grüße
Ferienwohnung an der Ostsee mit DSL / WLAN ganzjährig zu vermieten.
Suche Tauschpartner für BL im Bereich Ferienwohnung / Reisen

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


it-worker
PostRank 1
PostRank 1
Beiträge: 20
Registriert: 03.03.2007, 16:02

Beitrag von it-worker » 07.04.2008, 12:24

Danke für die überaus schnelle Antwort!

Für die hauptsächlich betroffene Domain:
360868 Zugriffe in der letzten Woche durch Google

Linux Debian Etch Apache2, Kernel 2.6
1GB Ram
2,8GHz PIV

230 vHosts laufen drauf, wobei 100 nur Mini-Seiten sind mit einer Index und einem Bildchen. Der Server produziert so 80 bis 100GB Traffic pro Monat. Die betroffene Domain hat ca. 2.000 bis 3.000 Besucher am Tag - aber auch erst seit ca. 1 Monat. Davor waren es so an die 800 bis 1.000 pro Tag. Wo die herkommen ist mir aber auch ein Rätsel. Von Google kommen sie nicht - sagt zumindest Webalizer. Auffällig ist nur, dass der Googlebot der mit Abstand beste Besucher ist :) Auch was die Anzahl der Tasks betrifft

SeoBlogger.de
PostRank 4
PostRank 4
Beiträge: 101
Registriert: 09.04.2007, 16:06
Wohnort: Teublitz

Beitrag von SeoBlogger.de » 07.04.2008, 12:30

it-worker hat geschrieben: Für die hauptsächlich betroffene Domain:
360868 Zugriffe in der letzten Woche durch Google
pro stunde oder pro tag?

bei letzterem empfehle ich diese lektüre: https://dev.mysql.com/doc/refman/5.1/de ... index.html
Bild

Yafamedia
PostRank 2
PostRank 2
Beiträge: 43
Registriert: 17.03.2008, 13:13

Beitrag von Yafamedia » 07.04.2008, 12:50

Wow
So ein problem is mir noch nie begegnet.

die meisten träumen vom regelmäßigen Besuch der google bot :D

it-worker
PostRank 1
PostRank 1
Beiträge: 20
Registriert: 03.03.2007, 16:02

Beitrag von it-worker » 07.04.2008, 12:50

@Seoblogger.de: Sorry, vergessen: Das ist für einen Zeitraum von 6 Tagen. Betrifft aber nur die eine Domain. Die Domain fällt halt besonders aus im access.log

@Ilka: Danke für den Tipp, das habe ich jetzt mal gemacht. Bin schon gespannt wie sich das auswirkt.

SeoBlogger.de
PostRank 4
PostRank 4
Beiträge: 101
Registriert: 09.04.2007, 16:06
Wohnort: Teublitz

Beitrag von SeoBlogger.de » 07.04.2008, 12:52

du hast probleme bei 360.000 hits auf 6 tage? das sind 60.000 hits pro tag.
optimier mal deine datenbank...60k hits sollte ein normal-moderner server pro stunde vertragen...
Bild

linux
PostRank 7
PostRank 7
Beiträge: 524
Registriert: 05.05.2004, 09:45

Beitrag von linux » 07.04.2008, 13:02

yupp seoblogger.de hat recht ein webserver sollte 60.000 pro stunde sogar aushalten. wenn ich das richtig verstehe sind da 230 vhosts drauf, ist da eine datenbank drauf oder nur apache?

schnelles wiesel

https://www.linux-magazin.de/heft_abo/a ... les_wiesel

sonst einfach fragen posten kann dann sicher helfen, aber wie gesagt der server muß VIEL mehr aushalten

gruß

linux

Pegasus
PostRank 7
PostRank 7
Beiträge: 537
Registriert: 13.07.2004, 20:53

Beitrag von Pegasus » 17.10.2008, 09:30

hey,

googlebot läuft bei uns gerade richtig amok. wir haben heute bereits 270.000 anfragen und es ist kein ende in sicht. wenn das so weiter geht sind wir bald tot.

hat jemand noch ein paar nützliche tipps?

elbwicht
PostRank 4
PostRank 4
Beiträge: 142
Registriert: 24.06.2008, 23:08

Beitrag von elbwicht » 17.10.2008, 10:10

kann das ein generelles "problem" heute sein?
bei mir sinds auch vormittags 3x soviele zugriffe von google, wie sonst am vormittag...

proit
PostRank 8
PostRank 8
Beiträge: 664
Registriert: 15.10.2007, 12:05

Beitrag von proit » 17.10.2008, 10:53

scheint so, bei mehreren domains, immer drei Bots aus dem gleichen IP Range
z.B. 66.249.71.4x unterwegs, teilweise mehr als 1 Seite pro Minute.

Komisch, sowas ist mir bisher auch noch nicht aufgefallen.

Pompom
PostRank 10
PostRank 10
Beiträge: 3751
Registriert: 10.09.2004, 16:38

Beitrag von Pompom » 17.10.2008, 11:11

teilweise mehr als 1 Seite pro Minute.

ehrlich ?!
Das war wohl ein kranker Bot im Rollstuhl.

proit
PostRank 8
PostRank 8
Beiträge: 664
Registriert: 15.10.2007, 12:05

Beitrag von proit » 17.10.2008, 11:39

Pompom hat geschrieben:
teilweise mehr als 1 Seite pro Minute.

ehrlich ?!
Das war wohl ein kranker Bot im Rollstuhl.
Also von den Seiten die ich betreue und für meine Verhältnisse stark frequentiert sind, macht der Google bot so in der Regel 1 Seite in 1 - 2 Minuten. In den Logs heute sehe ich, dass teilweise nur 02 - 30 s vergehen bis zum nächsten Aufruf, und das mit 3 Bots gleichzeit. Daher bin ich schon etwas erstaunt.

Pompom
PostRank 10
PostRank 10
Beiträge: 3751
Registriert: 10.09.2004, 16:38

Beitrag von Pompom » 17.10.2008, 12:28

crawl-66-249-72-xxx.googlebot.com - - [17/Oct/2008:12:33:04 +0200] "GET
crawl-66-249-72-xxx.googlebot.com - - [17/Oct/2008:12:33:09 +0200] "GET
crawl-66-249-72-xxx.googlebot.com - - [17/Oct/2008:12:33:09 +0200] "GET
crawl-66-249-72-xxx.googlebot.com - - [17/Oct/2008:12:33:10 +0200] "GET
crawl-66-249-72-xxx.googlebot.com - - [17/Oct/2008:12:33:10 +0200] "GET

Das ist nur der Bot unter einer IP auf einer Seite, die mit "normal"-Geschwindigkeit gecrawlt wird.

Die Botaktivität unterliegt (bei meinen Domains derzeit) noch einer Schwankung um bis zu 800%.

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag