bodomalo hat geschrieben:Wieso nimmt google den exakt gleichen Text so oft auf?
sooooooooooo oft? ..... 7 Ergebnisse (0,32 Sekunden)
suchen wir mal etwas "normaler"
https://www.google.de/search?q=Medizine ... ng+Douglas
= 72.300 Ergebnisse (0,21 Sekunden)
catcat hat geschrieben:das google DC nicht gern hat, braucht man eigentlich gar nicht reden.
Nur, weil einige "grosse" Sites das dürfen, darfst Du (und ich) das noch lange nicht.
dürfen die das?
oder hat G noch nicht gemerkt das?
warum sind bei meiner Suche die Ergebnisse so anders .... vielleicht weil die DCs schon "abgestraft" sind?
bodomalo hat geschrieben:Wieso nimmt google den exakt gleichen Text so oft auf?
sooooooooooo oft? ..... 7 Ergebnisse (0,32 Sekunden)
Wenn Du eine Sekrätärin wärest und einen Brief bekommst ....
... wird der dann abgeheftet oder prüfst Du erstmal (sehr gründlich) ob der Brief vielleicht schon abgeheftet ist
7 Ergebnisse (0,32 Sekunden)
wie lange braucht Google um eine Seite zu spidern und abzulegen?
Ich habe glaub Server zu Server mal mit einem Speed von 250 oder 350 Mega pro Minute kopiert
300 Mega pro Minute = 5 Mega pro Sekunde
eine Seite hat vielleicht 100 Kilo = 0.1 Mega an html
eine Seite lesen braucht eine 50tel Sekunde 1 / 50 = 0.02 Sekunden + die Zeit wo der Server braucht die Seite aufzuarbeiten von z.B. 0.08 .... aber Google wird sicherlich in mehrere Threads Seiten einlesen und wärend der Wartezeit wird keine CPU verbraucht
7 Ergebnisse (0,32 Sekunden)
es werden also 0.02 Sekunden CPUtime verbraucht um zu lesen und die Festplatte zu schreiben
und wieviel CPUtime wird verbraucht um jetzt alle Sätze zu entnehmen und zu prüfen ob die schon auf Anderen Seiten vorhanden sind
7 Ergebnisse (0,32 Sekunden)
Bei 10 Sätzen wären das 3 Sekunden ... vielleicht nur 2 Sekunden ....
Google braucht zum lesen 0.02 Sekunden + 2 Sekunden für die Prüfung
Der CPUverbraucht ver100facht sich ....
.... Google hat viele Computer und auch viel Geld um sich die zu leisten
Die haben aber sicher nicht 100mal soviele wie nötig ....
.... hier und da mal eine Stichprobe, wenn die Alarm schlägt genauer prüfen
und auch wenn DC gefunden wurde
(a) Datei löschen und beim nächsten mal wieder spidern und wieder prüfen und wieder löschen
(b) Datei lassen wo sie ist und das "ranking" absenken (siehe auch meine Suche)
(b2) Wer es (das genaue, den DC) sucht, darf es auch finden