nach tagelangen stillen Mitlesen in diesem Forum, habe ich schon so einiges über Suchmaschinen, Roboter, etc. gelernt. Danke dafür. Habe gerade eben zum ersten Mal eine robot.txt erstellt.
Nun aber zu meiner Frage:
Da hatte ich gerade meine Privatseiten mit einem JavaScript-Paßwortschutz (ich weiß, das ist nicht sehr sicher, aber das war Absicht) hochgeladen, schaute OpenISearch bei mir vorbei und indizierte ausschließlich diese Paßwortseiten. Ja gibt denn ein Roboter Paßwörter ein? Oder wie muss ich mir das vorstellen? Und wieso wollte der nur diese Seiten? Und darf der sich so einfach über das Paßwort-Script hinwegsetzen?
Ab 14:21 Uhr versucht, über Fehlerseiten und Paßwortseiten zu der Lösungsseite vorzudringen. Um 14:47 Uhr - also gut 20 Minuten später, hat das Ding es noch nicht ganz geschafft, allerdings war dieses Ding recht flexibel, denn es hat wohl "geraten" und dachte sich: ach, ich guck mal ob es ein Verzeichnis "Lösung" gibt und so kam der Pfad /privat/xxx/loesung/yyyi.html zustande.
Ist das normal? Wäre nett, wenn mir jemand etwas dazu sagen könnte.
Robots führen deinen JS Passwortschutz nicht aus, so dass du davon ausgehen kannst, dass die Lösungen gespidert wurden. Spider finden in der Regel auch Links, die nicht in <a href> Tags eingebunden sind, sondern zum Besipiel im JS Code auftauchen...eventuell kam dieser Spider so an den Link zu den Lösungen.
Wie du schon sagst - JS und Passwortschutz passen nicht zueinander.
das kann ich so weit nachvollziehen. Danke für deine Antwort.
Allerdings stolpere ich - gedanklich - noch über die Tatsache, dass der vermeintliche Spider selbsttätig "herum probierte", indem er ein Verzeichnis "loesung" in den Pfad packte. Dieses Verzeichnis gibt es bei mir nicht, respektive es heißt anders.
webspider "raten" nicht, wenn dem so waere wuerden deine error logs voll sein mit 404 fuer geratene urls. irgendwo auf der seite muss der 'loesungen' stehen, wahrscheinlich im <form action> deiner js-login seite oder du hast sie in der robots.txt erwaehnt. selbst wenn der pfad unter "deny" steht heisst das nicht das ihn alle spider ignorieren.