Hallo
Wenn mit Frames gearbeitet wir, -besser nicht- gehört der Body in die NoFrame-Section.
Von daher ist die Frage komisch....
Wenn es wirklich um Keywords geht dann ist das ein Geschichte die ich unter MetaTags einordnen würde, demzufolge im Head.
Gruß Kristian
Hallo Seit etwa 15:00 Uhr hatte ich dann mal Zeit die Geschichte auf dem ersten Rechner zu installieren und den Betrieb aufzunehmen. Es würde mich sicherer machen, wenn ich die eine oder andere Url hätte, wo ich in der robots.txt gesperrt bin. Da gibt es hier bestimmt ein paar. ;-) Wenn ihr mir da h...
Hallo Um Screenshots zu machen braucht es eine grafische Oberfläche. Diese wird auf *nixen durch einen X-Server gestellt. Um diesen Screenshot selbst zu erstellen braucht es einen Browser, dessen Fensteranzeige dann von irgendeinem Programm "geknipst" wird. Ein einfaches Script, auch das g...
Hallo Bei mir wurde es erst besser, als ich den Wert durch einen beim besten Willen nicht mehr als Session-ID zu interpretierenden Wert ersetzt habe. Welchen fixen Wert hast du denn verwendet? Ich habe damals das Wort "abraxas" benutzt. Das sollte so gut oder schlecht sein wie jedes andere...
Hallo Ich versuche mich ja auch ab und zu in "Suchmaschinentechnologie". Mit der Spracherkennnung ist das gar nicht so einfach. Bei Seiten mit wenig Text ist es einfach unmöglich. Bei Seiten ohne typische Kennzeichen Umlaute etc, haut die Spracherkennung daneben. Ich manipuliere die Sprach...
Hallo Zum Thema Session-ID: Es muß klar sein, dass Bots bei jedem Neuspidern einer Seite eine neue ID zugewiesen bekommen. Alle Links der gerade gespiderten Seite haben diese neue ID. So schafft man eine Bot-Falle, da durch ewig neue ID's ständig neue Seiten produziert werden. Es gibt wohl keinen Bo...
Hallo WWWeasel Du denkst auch an die Möglichkeit, dass der Coder des Scripts nicht dumm war und sein Script mit der Möglichkeit versehen hat auf IF_MODIFIED_SINCE zu reagieren. Ich könnte mir vorstellen, dass es Leute gibt, die sowas machen um die Dynamik ihrer Anwendung zu verschleiern, meist wohl ...
Hallo Nicht ganz richtig...Ein Spider sollte z.B. mindestens in der Lage sein das "Last Modified" (allg. Header-Daten) abzuwägen, damit er Seiten die sich - seit dem letzten Visit - nicht geändert haben NICHT sinnlos "heimschleppt" Nicht ganz richtig. Der Bot sollte IF_MODIFIED_S...
Hallo @WWWeasel Irgendwie kann ich mir die Zahlen nicht vorstellen. 11,8 Mio. Seiten auf 50 GB. Entweder mein Taschenrechner ist kaputt oder ich habe einen brutalen Denkfehler. Hmm, vieviel KB bleiben da pro Seite? Dein Bot vervollständigt Links selbstständig, sprich er hängt ein '/' an, wenn es nöt...
Sorry Leute
Die Frage des OP ist ernst.
Schön daß ihr hier Spaß habt, aber es verwirrt die Neulinge doch nur.
Umlaute sind IMHO kein Spaß. Bitte seit nett und ehrlich.
Gruß Kristian
Hallo Chris Beim Testlauf in der kommenden Woche geht es mir erstmal um die Funktion der Suma. Deine "Befürchtung", daß der Kontent irgendwannmal in diversen Pseudo-Sumas auftaucht ist allerdings absolut gerechtfertigt und begründet. Es wird so kommen, wenn auch nicht mit dem Kontent, den ...
Hallo Dies ist mein erster Beitrag in diesem Forum, also will ich die Gelegenheit nutzen, mich kurz vorzustellen. Ich bin Programmierer, spezialisiert auf Internet und Internetdienstleistungen. Meine "Muttersprache" ist Perl. Ich beschäftige mich derzeit wiedermal mit dem Thema Suchmaschin...