Seite 1 von 1

Was macht OpenISearch auf meinen Paßwortseiten?

Verfasst: 14.08.2007, 12:01
von Alayna
Hallöchen,

nach tagelangen stillen Mitlesen in diesem Forum, habe ich schon so einiges über Suchmaschinen, Roboter, etc. gelernt. Danke dafür. Habe gerade eben zum ersten Mal eine robot.txt erstellt.

Nun aber zu meiner Frage:
Da hatte ich gerade meine Privatseiten mit einem JavaScript-Paßwortschutz (ich weiß, das ist nicht sehr sicher, aber das war Absicht) hochgeladen, schaute OpenISearch bei mir vorbei und indizierte ausschließlich diese Paßwortseiten. Ja gibt denn ein Roboter Paßwörter ein? Oder wie muss ich mir das vorstellen? Und wieso wollte der nur diese Seiten? Und darf der sich so einfach über das Paßwort-Script hinwegsetzen?

72.44.60.149 - - [24/Jul/2007:14:21:51 +0200] "GET /privat/xxx/passwortseite1.html HTTP/1.1" 200 2808 "-" "OpenISearch/1.3.1 (+https://www.openisearch.com/faq.html)" "www.meineseite.de"
und so weiter ... bis hin zu
72.44.60.177 - - [24/Jul/2007:14:47:39 +0200] "GET /privat/xxx/loesung/yyyi.html HTTP/1.1" 200 4673 "-" "OpenISearch/1.3.1 (+https://www.openisearch.com/faq.html)" "www.meineseite.de"

Ab 14:21 Uhr versucht, über Fehlerseiten und Paßwortseiten zu der Lösungsseite vorzudringen. Um 14:47 Uhr - also gut 20 Minuten später, hat das Ding es noch nicht ganz geschafft, allerdings war dieses Ding recht flexibel, denn es hat wohl "geraten" und dachte sich: ach, ich guck mal ob es ein Verzeichnis "Lösung" gibt und so kam der Pfad /privat/xxx/loesung/yyyi.html zustande.

Ist das normal? Wäre nett, wenn mir jemand etwas dazu sagen könnte.

Verfasst:
von

Verfasst: 14.08.2007, 12:56
von bloddy newbie
Hi,

Robots führen deinen JS Passwortschutz nicht aus, so dass du davon ausgehen kannst, dass die Lösungen gespidert wurden. Spider finden in der Regel auch Links, die nicht in <a href> Tags eingebunden sind, sondern zum Besipiel im JS Code auftauchen...eventuell kam dieser Spider so an den Link zu den Lösungen.

Wie du schon sagst - JS und Passwortschutz passen nicht zueinander.

mfg Bloddy

Verfasst: 14.08.2007, 13:21
von Alayna
Hi Bloddy,

das kann ich so weit nachvollziehen. Danke für deine Antwort.

Allerdings stolpere ich - gedanklich - noch über die Tatsache, dass der vermeintliche Spider selbsttätig "herum probierte", indem er ein Verzeichnis "loesung" in den Pfad packte. Dieses Verzeichnis gibt es bei mir nicht, respektive es heißt anders.

Was war da also los?

Verfasst:
von

Verfasst: 15.08.2007, 09:53
von nerd
webspider "raten" nicht, wenn dem so waere wuerden deine error logs voll sein mit 404 fuer geratene urls. irgendwo auf der seite muss der 'loesungen' stehen, wahrscheinlich im <form action> deiner js-login seite oder du hast sie in der robots.txt erwaehnt. selbst wenn der pfad unter "deny" steht heisst das nicht das ihn alle spider ignorieren.

Verfasst: 15.08.2007, 10:19
von Alayna
Hi nerd,

ja, stimmt.
"loesungen" steht nicht auf derselben Seite, sondern ist bei mir ein neues Verzeichnis.

Ist ja interessant, welche "Mühe" sich so mancher Spider macht, das habe ich nicht gewusst. Danke dir.