Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

cuil-spider nervt

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
catcat
PostRank 10
PostRank 10
Beiträge: 10292
Registriert: 02.08.2006, 13:21
Wohnort: Litauen

Beitrag von catcat » 16.01.2010, 13:29

Moinsen,
der verdammte spider von www.cuil.com hat die letzten 2 Tage meine shops besucht und zig GB-Traffic verursacht *narf
Ich hab den jetzt gesperrt. Aus die Maus.

Der google-bot ist irgendwie schlauer.
Der spidert wenigstens meine Produktattribute nicht durch.

Gib Dir das mal: Der spidert alle Produktattribute durch... Wenn 1 Artikel in 3 Farbkombinationen erhältlich ist, ich 40 Farben habe und 6 Größen dazu... dann sind das 40³x6 Seiten je Artikel. Im Schnitt habe ich ca. 250 Artikel in jedem Shop.
Das macht: 40³x6x250 Seiten = 96Mio.
Und dann geht das Mistding noch in die Suche und macht da weiter... :o

Anzeige von ABAKUS

von Anzeige von ABAKUS »

Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

profo
PostRank 9
PostRank 9
Beiträge: 1703
Registriert: 18.01.2007, 18:51

Beitrag von profo » 16.01.2010, 14:36

Cuil ist der Moritz unter den Suchmaschinen...

3DCG
PostRank 7
PostRank 7
Beiträge: 550
Registriert: 22.01.2006, 20:11
Wohnort: FFM

Beitrag von 3DCG » 16.01.2010, 15:01

Nach der Lachnummer die die geboten haben scheinen die es jetzt wieder zu versuchen die suchmaschine zu werden

.

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


jackwiesel
PostRank 10
PostRank 10
Beiträge: 5820
Registriert: 09.09.2007, 09:44
Wohnort: Bochum

Beitrag von jackwiesel » 16.01.2010, 15:17

Mich würde viel eher interessieren, wer den Spider von bigfinder.de programmiert hat. Ich hab hier ne winzige Handwerker-HP mit fünf Inhaltsseiten und der lutscht das Ding (da wurde seit drei Jahren nix geändert) im Schnitt 20 mal am Tag aus. Seit nem Monat darf er nicht mal drauf, "klopft" aber artig weiter in der gleichen Frequenz an... :o

catcat
PostRank 10
PostRank 10
Beiträge: 10292
Registriert: 02.08.2006, 13:21
Wohnort: Litauen

Beitrag von catcat » 16.01.2010, 15:54

bigfinder? Dem hab ich schon lange die Rote gegeben. Der spider ist von Eike gecoded worden, wetten?

Aber mal ne Frage: In welcher Sprache weden eigentlich spider und bots geschrieben? In C? C++ oder wat? Und welche Serverhardware wird da eigentlich benötigt? So ne Dinger verursachen doch sicher ne irre Serverlast, oder?

Alda
PostRank 10
PostRank 10
Beiträge: 4584
Registriert: 27.01.2009, 20:19
Wohnort: Kaiserslautern

Beitrag von Alda » 16.01.2010, 16:05

3DCG hat geschrieben:Nach der Lachnummer die die geboten haben scheinen die es jetzt wieder zu versuchen die suchmaschine zu werden.
Es scheint wirklich so. In meinem Bereich ist deren Index mittlerweile nicht mal so schlecht.

profo
PostRank 9
PostRank 9
Beiträge: 1703
Registriert: 18.01.2007, 18:51

Beitrag von profo » 16.01.2010, 17:10

catcat hat geschrieben:Aber mal ne Frage: In welcher Sprache weden eigentlich spider und bots geschrieben? In C? C++ oder wat? Und welche Serverhardware wird da eigentlich benötigt? So ne Dinger verursachen doch sicher ne irre Serverlast, oder?
Die Sprache ist vergleichsweise unwichtig, C++, Java, PHP, Perl, Google Go, was Du willst... Solange das Parsing der Seiten einigermaßen schlau gehalten wird, macht der IO die Hauptlast aus - also der Datentransfer und das Abspeichern. Insofern sind schnelle Festplatten wichtig, der Prozessor ist heute vergleichsweise wurscht.

seonewbie
PostRank 9
PostRank 9
Beiträge: 1939
Registriert: 21.10.2006, 20:50

Beitrag von seonewbie » 16.01.2010, 18:13

Da Cuil nicht auf die robtots.txt hört hatte ich den
Privider angeschrieben. Der fühlte sich nicht zuständig.

Eigentlich sollte das hier reichen:
User-agent: twiceler
Crawl-Delay: 10
Disallow: /

Geht der Bot aber einfach drüber. Das ist echt igorantes Pack
sowohl bei Cuil wie bei softlayer.com.!

Nun gut ich habe auf allen Routern die ich betreue
softlayer.com auf REJECT gesetzt.

Das IP Netz ist: 174.36.0.0-174.36.0.127

Solltet ihr auch machen wer sich nicht mal an die robots.txt
hält gehört überall ausgesperrt!
Suche Linktausch zum Thema Mode. Bitte PM
Backlink-Generator | Artikelverzeichnis | PageRank | SEnuke X
Don't smoke, don't fight, don't light no cigarettes,
Or else you'll wind up in the can!
No jokes, no rights, sit tight, don't fool around,
You are a guest of Uncle Sam!
AC/DC "I'll be damned"

catcat
PostRank 10
PostRank 10
Beiträge: 10292
Registriert: 02.08.2006, 13:21
Wohnort: Litauen

Beitrag von catcat » 19.01.2010, 10:54

Danke seonewbie!
Hätt ich auch von selbst draufkommen können. Bin ich aber nicht :(

Hat eigentlich irgendwer nennenswerten traffic von cuil erhalten? Also ich nicht. Kein einziger user... nur ne bot-party in meinen shops. :evil:
Zeitweilig gaben sich da 3 bots von denen gleichzeitg die Kante. 110GB traffic. Find ich nich lustig. Die kommen mir nicht wieder ins Haus.

Nullpointer
PostRank 10
PostRank 10
Beiträge: 4790
Registriert: 22.04.2005, 19:14
Wohnort: West Berlin

Beitrag von Nullpointer » 19.01.2010, 14:06

man müßte sowas wie ne botfalle implementieren :wink:

catcat
PostRank 10
PostRank 10
Beiträge: 10292
Registriert: 02.08.2006, 13:21
Wohnort: Litauen

Beitrag von catcat » 19.01.2010, 14:22

Man müsste den cuil-bot dazu bringen, die google-Serverfarmen zu spidern :) HARHAR.
Das wäre mal fies^^

smilla
PostRank 5
PostRank 5
Beiträge: 268
Registriert: 28.07.2008, 19:14

Beitrag von smilla » 21.01.2010, 11:50

Ich hatte mit denen mal richtig stress, ich meinte dass ich deren Server auch mal spidern werde und dann drohten die mir gleich mit Anzeige :)

Ich wollte die immer noch Fragen welche IP's die haben, damit ich deren Bots keinen Content liefere, sondern einen Kackhaufen. Mich würde interessieren, was die darauf antworten würden :)

seonewbie
PostRank 9
PostRank 9
Beiträge: 1939
Registriert: 21.10.2006, 20:50

Beitrag von seonewbie » 22.01.2010, 14:40

Das sind übrigens ein paar ehemalige Google Azubis die wohl nicht
übernommen wurden (Klar angeblich haben sie sich Selbstständig
gemacht weil sie es besser als Google machen wollten LOL)
und haben und jetzt aus Frusst Cuil gegründet.
Schlimm daran ist das die auch noch einen Geldgeber gefunden haben
der ihnen ermöglicht ihre Experimente ausserhalb des Klassenzimmers
zu veranstalten.

Die haben bei einem Kunden mehrere WordpressMU Server vollständig
lahm gelegt. Die Shopserver die ich betreue sind nur nicht in Mitleidenschaft
gezogen worden da alle PHP Seiten als html gecached werden. Ich bin
mir sicher das das eine Schadensersatzklage nach sich gezogen hätte
wenn die gestanden hätten.

Mich wundert das Cuil in den USA noch nicht verklagt wurde oder zumindest
beid er Cyber Crime Devision angezeigt wurde, da der
Robot wirklich so aggressiv ist das er normale PHP Systeme komplett
in die Knie zwingt wenn er sich einmal festgefressen hat.
Suche Linktausch zum Thema Mode. Bitte PM
Backlink-Generator | Artikelverzeichnis | PageRank | SEnuke X
Don't smoke, don't fight, don't light no cigarettes,
Or else you'll wind up in the can!
No jokes, no rights, sit tight, don't fool around,
You are a guest of Uncle Sam!
AC/DC "I'll be damned"

SeriousBadMan
PostRank 10
PostRank 10
Beiträge: 4005
Registriert: 16.06.2008, 22:26
Wohnort: Welt

Beitrag von SeriousBadMan » 22.01.2010, 19:01

Aber Cuil ist toll. Meine Seite, die seit nem Jahr in 1000 Filtern ist, rankt bei Cuil auf den Hauptkeys auf Rang1 :D :D

catcat
PostRank 10
PostRank 10
Beiträge: 10292
Registriert: 02.08.2006, 13:21
Wohnort: Litauen

Beitrag von catcat » 22.01.2010, 19:04

Bild

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag