Herzlich willkommen im Archiv vom ABAKUS Online Marketing Forum
Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.
Würde da noch eine Seite mit einer kurzen Beschreibung hinzufügen. Mache ich zumindest so, wenn ich ein Script vorstelle.maniac hat geschrieben:So könnte ich ja folgendes eintragen:
Mozilla/5.0 (compatible;
Backlink crawler/1.0;
+https://www.meineseite.de)
Code: Alles auswählen
Mozilla/5.0 (compatible; Backlink crawler/1.0; +http://www.meineseite.de/beschreibung.html)
Du crawlest doch nicht die ganzen Seiten, du rufst doch sicherlich nur gelegentlich die Seiten auf, die einen Backlink zu Deinen Seiten enthalten oder wie? Ich wüsste nicht, was dagegen sprechen sollte. Außerdem, soweit ich weiß, gibt es beim Scrapen und Crawlen kaum Einschränkungen, so lange keine Rechte verletzt werden.maniac hat geschrieben:Ist es eigentlich rechtlich bedenklich andere Seiten zu crawlen?
Ich lesen und verwende den Inhalt nicht, sondern werte ihn ja nur aus.
Unsinn - natuerlich "liest" du den inhalt; wieso wuerdest du ihn sonst crawlen wollen.maniac hat geschrieben: Ist es eigentlich rechtlich bedenklich andere Seiten zu crawlen?
Ich lesen und verwende den Inhalt nicht, sondern werte ihn ja nur aus.
Wenn ein Betreiber nicht möchte, dass man seine Inhalte nicht liest, sollte er am besten lokal hostennerd hat geschrieben: Unsinn - natuerlich "liest" du den inhalt; wieso wuerdest du ihn sonst crawlen wollen.
Dazu sollte es reichen, statt GET oder POST eventuell Head als Request-Methode zu benutzen, um nur den Header mit Statuscodes abzurufen.maniac hat geschrieben:Bei normalen Links "interessante Links für meine Besucher" checke ich bei Bedarf auf die Erreichbarkeit der Domain.
Ja, damit geht es.maniac hat geschrieben:ich mach das mit curl,
Code: Alles auswählen
$request = "HEAD ".$this->seite." HTTP/1.1\r\n";