Herzlich willkommen im Archiv vom ABAKUS Online Marketing Forum
Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.
Der Googlebot macht sowas.DbDdhkP07 hat geschrieben:Welcher Bot macht denn sowas?
Wenn der Googlebot schon so grenzdebil ist, GET-Formulare auszufüllen, hindert ihn wenig daran, das auch mit POST-Formularen zu machen. Vielleicht momentan noch nicht, aber die Erweiterung ist eine Sache von einem Dutzend Programmzeilen.Fridaynite hat geschrieben:Der Googlebot macht sowas.
Am besten die Seite tatsächlich für den Bot in der htaccess sperren oder auf "post" umstellen. Du hast vermutlich "get" als Formularbefehl.
Wenn du das Formular in der robots.txt gesperrt hast, wird es kaum der Googlebot sein, der den Unsinn veranstaltet. Die Ergebnisseiten könntest und solltest du davon abgesehen leicht aussperren, indem du sie mit einem <meta>-noindex (evt. zzgl. follow) bestückst - insofern sehe ich das Problem nicht so ganz.wehwehweh hat geschrieben:der pumpt mir immer mehr seiten in den index, obwohl ich die mit robots.txt ausgeschlossen habe.
ja ist ein formular mit vorgegebenen werten. hier werden alle mögliche kombination gesendet.Was sendet Google denn dann? Oder ist das ein Formular mit vorgegeben Werten? Also jetzt keine Suche oder sowas.
nicht das formular ist mit robots.txt gesperrt sondern die ergebnisseiten.Wenn du das Formular in der robots.txt gesperrt hast, wird es kaum der Googlebot sein, der den Unsinn veranstaltet. Die Ergebnisseiten könntest und solltest du davon abgesehen leicht aussperren, indem du sie mit einem <meta>-noindex (evt. zzgl. follow) bestückst - insofern sehe ich das Problem nicht so ganz.
Soweit ich das bislang immer mitbekommen habe, kann die Version „URL ohne alles“ im Index landen, wenn die URL zwar per robots.txt gesperrt, aber auf einer anderen, indizierten Seite vermerkt wurde - was bei dir ja letztlich durch das Formular der Fall ist. <meta>-noindex verhindert hingegen auch das Speichern der URL an sich.wehwehweh hat geschrieben:die ergebnisseiten sind ohne snippet und ohne title im index, nur als dateinamen mit den angehängten werten.
[…]
wenn ich jetzt denke dass der bot die seiten nicht in den index nimmt, muss ich annehmen dass er entweder die meta-anweisung kennt (und auch den content) oder dass das andere projekt ausnahme ist.
Vielleicht hindert ein (per CSS verstecktes) <input>-text-Feld die Googlesche Neugierde? (Bei <input>-hidden hast du wieder einen vorgegebenen Wert, kommt also nicht in Frage, es muss schon CSS sein.)ist ein formular mit vorgegebenen werten.
google benutzt die GET-forms, um zu sehen was es noch auf der seite zu sehen gibt, da z.b. viele seiten eine interne suchfunktion haben und die datenmenge manchmal so gross ist das man sie nicht sinnvoll verlinken kann ohne den user dabei ueber mehr als 3 seiten klicken zu lassen. dabei werden imho woerter probiert, die haeufig auf der seite vorkommen. der google bot benutzt keine formulare die POST verwenden.Mork vom Ork hat geschrieben: Wenn der Googlebot schon so grenzdebil ist, GET-Formulare auszufüllen, hindert ihn wenig daran, das auch mit POST-Formularen zu machen. Vielleicht momentan noch nicht, aber die Erweiterung ist eine Sache von einem Dutzend Programmzeilen.
Wenn sich die GETerei erstmal als nützlich für Google erwiesen hat, kommt die POSTerei garantiert auch - früher oder später.nerd hat geschrieben:google benutzt die GET-forms, […] da z.b. viele seiten eine interne suchfunktion haben […] dabei werden imho woerter probiert, die haeufig auf der seite vorkommen. der google bot benutzt keine formulare die POST verwenden.Mork vom Ork hat geschrieben: Wenn der Googlebot schon so grenzdebil ist, GET-Formulare auszufüllen, hindert ihn wenig daran, das auch mit POST-Formularen zu machen.