Seite 1 von 2
Alte Inhalte aus Archive.org löschen
Verfasst: 26.06.2009, 23:21
von alph
Hallo
ich würde gerne wissen, ob durch den Code
User-agent: ia_archiver
Disallow: /
User-agent: ia_archiver/1.6
Disallow: /
in der robots.txt die bereits vor Jahren abgespeicherten Daten nach und nach
unwiderruflich aus den Archiven gelöscht werden oder ob sie nach dem Entfernen des Codes oder der robots.txt wieder auftauchen und man sie nur durch das persönliche Anschreiben der Betreiber von Archive.org löschen lassen kann?
Ich meine, dass durch diese Maßnahme keine neuen Daten von der Webseite abgespeichert werden ist mir klar, aber ob dieser Code auch dafür sorgt, dass auch die alten daten, die bereits in deren Archiven jahrelang abgelegt worden sind, für immer gelöscht werden, konnte ich nicht so richtig in deren FAQs herauslesen.
Die schreiben dort irgendwie: falls man die robots.txt nicht verwenden kann, soll man Sie anschreiben und die zu löschende URL mitteilen. Hat jemand schon die FAQs gelesen? Mein englisch ist leider extrem unausreichend für sowas
danke im Voraus!
gruß
alph
Verfasst:
von
SEO Consulting bei
ABAKUS Internet Marketing Erfahrung seit 2002
- persönliche Betreuung
- individuelle Beratung
- kompetente Umsetzung
Jetzt anfragen:
0511 / 300325-0.
Verfasst: 26.06.2009, 23:54
von r-alf
Und was soll der Sinn dieser Sache mit dem Löschen sein ????

Verfasst: 26.06.2009, 23:57
von DanielS
r-alf hat geschrieben:Und was soll der Sinn dieser Sache mit dem Löschen sein ????

Dass die Inhalte dort nicht mehr verfügbar sind.
Ich verstehe nicht, warum immer jemand was zum Meckern/Wundern findet. Ist doch eine relativ einfache Frage hier.
Verfasst: 27.06.2009, 00:00
von r-alf
DanielS hat geschrieben:r-alf hat geschrieben:Und was soll der Sinn dieser Sache mit dem Löschen sein ????

Dass die Inhalte dort nicht mehr verfügbar sind.
Ich verstehe nicht, warum immer jemand was zum Meckern/Wundern findet. Ist doch eine relativ einfache Frage hier.
Es geht nichts ums Meckern oder Wundern sondern um das Warum?!
Wenn du die Frage nicht verstehst, dann blubber bitte nicht!
Verfasst: 27.06.2009, 00:01
von alph
r-alf hat geschrieben:Und was soll der Sinn dieser Sache mit dem Löschen sein ????

ich will einfach mit einpaar Seiten komplett abschließen und will deshalb nicht, dass meine persönlichen daten (Name, Adresse etc, auf einer Seite auch mein Porträt

usw) dort weiterhin "für alle Ewigkeiten" herumschwirren
Verfasst: 27.06.2009, 00:03
von r-alf
alph hat geschrieben:r-alf hat geschrieben:Und was soll der Sinn dieser Sache mit dem Löschen sein ????

ich will einfach mit einpaar Seiten komplett abschließen und will deshalb nicht, dass meine persönlichen daten (Name, Adresse etc, auf einer Seite auch mein Porträt

usw) dort weiterhin "für alle Ewigkeiten" herumschwirren
Dann würde ich Archive.org anschreiben direkt anschreiben und das Löschen verlangen.
Verfasst: 27.06.2009, 00:07
von r-alf
r-alf hat geschrieben:alph hat geschrieben:r-alf hat geschrieben:Und was soll der Sinn dieser Sache mit dem Löschen sein ????

ich will einfach mit einpaar Seiten komplett abschließen und will deshalb nicht, dass meine persönlichen daten (Name, Adresse etc, auf einer Seite auch mein Porträt

usw) dort weiterhin "für alle Ewigkeiten" herumschwirren
Dann würde ich Archive.org anschreiben direkt anschreiben und das Löschen verlangen.
PS. Deine robots sperrt ja nur das aktuelle Cachen aus. Was eine Datenkrake einmal hat, gibt sie nich freiwillig wieder her

Verfasst: 27.06.2009, 00:10
von alph
r-alf hat geschrieben:
Dann würde ich Archive.org anschreiben direkt anschreiben und das Löschen verlangen.
das befürchte ich auch

aber vielleicht hat bereits jemand die erfahrung damit gemacht, dass der besagte Code sich auch um die alten inhalte kümmert. Bei google ist doch auch so, wenn man die Seiten mit
User-agent: *
Disallow: /
ausschließt, dann verschwinden sie nach und nach alle aus dem Index.
Verfasst: 27.06.2009, 00:12
von r00kie
Ich meine, dass durch diese Maßnahme keine neuen Daten von der Webseite abgespeichert werden ist mir klar, aber ob dieser Code auch dafür sorgt, dass auch die alten daten, die bereits in deren Archiven jahrelang abgelegt worden sind, für immer gelöscht werden, konnte ich nicht so richtig in deren FAQs herauslesen.
Hier
https://www.archive.org/about/exclude.php heisst es explizit, das mit der robots.txt auch alle bereits archivierten Inhalte einer Domain gelöscht werden.
Die robots.txt kannst Du hier "bekanntmachen":
https://www.alexa.com/help/webmasters#crawl_site
Verfasst: 27.06.2009, 00:18
von DanielS
r-alf hat geschrieben:DanielS hat geschrieben:r-alf hat geschrieben:Und was soll der Sinn dieser Sache mit dem Löschen sein ????

Dass die Inhalte dort nicht mehr verfügbar sind.
Ich verstehe nicht, warum immer jemand was zum Meckern/Wundern findet. Ist doch eine relativ einfache Frage hier.
Es geht nichts ums Meckern oder Wundern sondern um das Warum?!
Wenn du die Frage nicht verstehst, dann blubber bitte nicht!
Naja, wenn es Dir wirklich nur um das Warum ginge, hätte ein Fragezeichen auch ohne seine drei Freunde und dem o-Smiley ausgereicht.
Aber ich lass Euch Alfs mal alleine, anscheinend versteht Ihr Euch.
Verfasst: 27.06.2009, 00:19
von alph
tatsächlich, das beruhigt einwenig! Aber wegen einpaar Seiten, die mir nicht mehr gehören und die ein grabber gekrallt hat, werde ich doch noch hinschreiben müssen

Verfasst: 27.06.2009, 00:24
von alph
DanielS hat geschrieben:
Aber ich lass Euch Alfs mal alleine, anscheinend versteht Ihr Euch.
alf vor ever

Verfasst: 27.06.2009, 00:26
von r-alf
alph hat geschrieben:
tatsächlich, das beruhigt einwenig! Aber wegen einpaar Seiten, die mir nicht mehr gehören und die ein grabber gekrallt hat, werde ich doch noch hinschreiben müssen

wenn es um den Grabber geht, dann lass ihn weiter grabben und bringe im <head> <base href="
https://www.meie-webseite.tld">
Verfasst: 27.06.2009, 17:49
von alph
KAW hat geschrieben:ich denke, er hat einige Seiten nicht mehr in seinem Besitz und kann dann natürlich auch kein <base href="
https://www.meie-webseite.tld"> einfügen, will aber dennoch die Abbilder seiner damals ihm gehörenden Domain aus dem Archiv haben.
Da bleibt wirklich nur anschreiben
genauso siehts aus

Was hat es eigentlich mit diesem <base href="
https://www.meie-webseite.tld"> auf sich?? Was bringt es genau?
Verfasst: 29.06.2009, 15:56
von WilliWusel
Ich hatte den Spider mal aus Versehen eine Zeit lang ausgesperrt, nachdem ich das korrigiert habe, waren auch die alten Inhalte wieder da (in diesem Fall zum Glück).
