Seite 1 von 1

GET /this_page_should_not_exist.fake

Verfasst: 21.07.2011, 18:57
von profo
Heute hatte ich eine komische Abfrage in den Logs, und zwar nach der URL "/this_page_should_not_exist.fake". Zu dem Thema hab ich nur den Post von Chris Faron gefunden - ein Seo in Italien, der es für den Besuch eines QRs hält.

Die Suche bringt eine ganze Reihe Ergebnisse, in denen die Abfrage zu einer (Fake-) Content-Seite verwurstet wurde. Ein korrekter 404 für solche Queries wäre wohl nicht unschlau, wenn wirklich Google dahinter steckt...

Verfasst:
von

Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

Re: GET /this_page_should_not_exist.fake

Verfasst: 21.07.2011, 20:27
von 800XE
profo hat geschrieben:Ein korrekter 404 für solche Queries wäre wohl nicht unschlau, wenn wirklich Google dahinter steckt...
Querie? Request!

und was ist "für solche"?

was ist mit Dingen wie
www.alexa.com/siteinfo/8xe.de
www.alexa.com/siteinfo/www.8xe.de
habs mit "www" probiert, dachte das Alexa dann auf "ohne" geht ... bleibt aber
und egal ob mit oder ohne .... der Link zu mir ist "ohne" und das ist falsch
da ich dann einen Redirect mache, ist es egal (und ob da ein rel=nofollow ist, ist jetzt unwichtig)

Was ist mit Freaks die Sites spidern und unterseiten anlinken ....
... und aus welchem Grund auch immer, die URLs in Kleinbuchstaben umwandeln?

https://BrotscheibenHalbierer.xe.vg/dc/ ... -senf.html
---> brotscheibenhalbierer.xe.vg/DC/Die-Rache-des-Senf.html
und aus welchem Grund auch immer, die URLs in Kleinbuchstaben umwandeln?
Ein Grund könnte sein, das ein "Schlaumeier" dir erzählen will das da was nicht stimmt ...
... z.B. solche CMSe die sich die "id" abgreifen
z.B.
Domain.tld/DC/666-Die-Rache-des-Senf.html
und der "Schlaumeier" macht dann
Domain.tld/DC/666-das-Imperium-ist-auch-nur-ein-Jedi.html
Domain.tld/DC/666-Schnippsel-Schnappsel-alles-bleibt-hier(falsch).html
Domain.tld/DC/666-Der-Senf-bestelltNochnBierNochnKorn-hicks.html


und wenn wir schon über Optimirung nachdenken
ich geht auch mal gern über [pfeil nach oben]
in der /hira/chie/ nach oben ... und wenn ich da dann lauter 404er sehe schüttel ich immer den Kopf ...
... ist doch total unlogisch das da Dateien in "mehreren"Ordnern liegen die irgendwie sinnlos, weil selbst nicht existent, sind

Verfasst: 21.07.2011, 21:36
von chris21
und wenn wir schon über Optimirung nachdenken
ich geht auch mal gern über [pfeil nach oben]
in der /hira/chie/ nach oben ... und wenn ich da dann lauter 404er sehe schüttel ich immer den Kopf ...
... ist doch total unlogisch das da Dateien in "mehreren"Ordnern liegen die irgendwie sinnlos, weil selbst nicht existent, sind
Genau damit hat der Slurp Bot von Yahoo früher Webmaster genervt.

@profo:

Der Einschätzung aus dem Blog, da würde gleich ein QR dahinterstecken, folge ich nicht. a) SF IP ist dafür kein hinreichendes Indiz b) könnte es eher ein Tool sein - und wenn das nicht von einer G IP kommt, würde ich es auch nicht Google zuordnen. Könnte also alles mögliche sein - ein Kunstprojekt, dass 404er sammelt?

Verfasst:
von
Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

Verfasst: 21.07.2011, 22:21
von profo
chris21 hat geschrieben:@profo:Der Einschätzung aus dem Blog, da würde gleich ein QR dahinterstecken, folge ich nicht. a) SF IP ist dafür kein hinreichendes Indiz b) könnte es eher ein Tool sein - und wenn das nicht von einer G IP kommt, würde ich es auch nicht Google zuordnen. Könnte also alles mögliche sein - ein Kunstprojekt, dass 404er sammelt?
Von den Logs her sieht es nach einer kurzen Browsersession aus - CSS und JS werden geladen und innerhalb einer Minute ein paar wenige Seiten abgesurft; für ein automatisiertes Tool scheint mir das zulange auf der Seite. Ob's wirklich Google ist bleibt natürlich unklar; solche Tests machen aber am ehesten für Suchmaschinen Sinn und insofern läge es schon nahe.

Verfasst: 22.07.2011, 02:44
von 3rr0r
es gibt da doch einen Bot, der auf CatchAll Subdomain prüft um genau an der Stelle dann einzubrechen.
"/this_page_should_not_exist.fake"
Diese Abfrage ist eigentlich nur sinnvoll um zu sehen ob eine eigene 404 existiert.

Wenn ich eine Seite hacken will um eigenen Code zu plazieren, wäre die nicht existierende SubDomain oder die eigene 404 Seite ein guter Platz:

1. kann ich die URL kompetent wirken lassen
2. kann ich mehrere URLs bilden mit gleicher Ausgabe
3. weniger Risiko entdeckt zu werden
[/quote]

Verfasst: 22.07.2011, 09:19
von profo
3rr0r hat geschrieben:es gibt da doch einen Bot, der auf CatchAll Subdomain prüft um genau an der Stelle dann einzubrechen.
"/this_page_should_not_exist.fake"
Diese Abfrage ist eigentlich nur sinnvoll um zu sehen ob eine eigene 404 existiert.
Wenn ich eine Seite hacken will um eigenen Code zu plazieren, wäre die nicht existierende SubDomain oder die eigene 404 Seite ein guter Platz: ...
Ich meine, Du liegst da nicht so ganz richtig 8)

Es gibt natürlich massenhaft Versuche, eine URL in fremde Seiten über dynamisch generierte Inhalte einzuschleusen. Das geht im Prinzip immer so, dass die URL einfach in die Request-Parameter eingebaut wird, und dann nachgeschaut wird, ob sie auf der Site als Link wieder auftaucht (egal ob auf der Root- oder auf einer Subdomain). Diese dynamisch generierte Seite wird dann noch kurz gepusht und schon ist wieder ein Backlink da. Ein 404 macht diese Art des Parasite-Hostings aber gerade zunichte; denn Links auf 404ern sind komplett wertlos.

Die Bots, die standardmäßig auf 404er oder 500er checken (wootwoot und co), suchen eher nach Serverinformationen auf der Suche nach Exploits.

Wo Du natürlich Recht hast ist, dass mit dem Check geprüft wird, ob eine 404 existiert. Der Grund für den Check aus Sicht der Suchmaschinen läge aber einfach darin herauszufinden, ob die Site wertlose dynamische Inhalte erstellt.

Verfasst: 22.07.2011, 09:41
von 3rr0r
profo hat geschrieben:Ein 404 macht diese Art des Parasite-Hostings aber gerade zunichte; denn Links auf 404ern sind komplett wertlos.
Die Bots, die standardmäßig auf 404er oder 500er checken (wootwoot und co), suchen eher nach Serverinformationen auf der Suche nach Exploits.
Thanx ... wieder was dazu gelernt.

Re: GET /this_page_should_not_exist.fake

Verfasst: 22.07.2011, 10:01
von templer
Jetzt mal ehrlich.
Das soll nun keinesfalls respektlos erscheinen, aber...
...wie stehst Du eigentlich so zu Drogen? :lol:

Re: GET /this_page_should_not_exist.fake

Verfasst: 22.07.2011, 10:07
von dein_opi
templer hat geschrieben:
Jetzt mal ehrlich.
Das soll nun keinesfalls respektlos erscheinen, aber...
...wie stehst Du eigentlich so zu Drogen? :lol:

"gefällt mir" :lol:

Re: GET /this_page_should_not_exist.fake

Verfasst: 22.07.2011, 10:45
von 3rr0r
templer hat geschrieben:...wie stehst Du eigentlich so zu Drogen? :lol:
Ich bin mir da nicht sicher, ob das nicht eine geniale Idee ist.
Man machte mehrere Seiten zu einem Produkt was keiner hat, dann Linktausch dazu.
Und dann denkt tante G. das gibt es wirklich und Du rankst richtig oben.

Dazu ist Brotscheibenhalbierer ja nun auch vom Thema her mit vielen Produkten und Nischen relevant.

Verfasst: 22.07.2011, 10:55
von templer
Ich meinte eher sein "Gedicht" ;)

Verfasst: 22.07.2011, 11:54
von web_worker
hehe, ich musste auch gleich an Drogenmissbrauch denken. Schon bei obigem Antwortposting auf die Frage...

Schönes Wochenende,
ww

Re: GET /this_page_should_not_exist.fake

Verfasst: 23.07.2011, 09:58
von 800XE
templer hat geschrieben:
Jetzt mal ehrlich.
Das soll nun keinesfalls respektlos erscheinen, aber...
...wie stehst Du eigentlich so zu Drogen? :lol:
hatte dazu mal ne Zeitlang ne Signatur ....
... weil die Frage immer wieder kam ....
... dann kam die Frage nicht mehr ...
... nun kommt sie wieder immer wieder
web_worker hat geschrieben:hehe, ich musste auch gleich an Drogenmissbrauch denken.
https://bazinga.xe.vg/Archiv/CUT/Appell ... onsum.html

Verfasst: 26.07.2011, 14:15
von 800XE
Manni-Mark hat da auch gerade nen Problem
https://www.abakus-internet-marketing.d ... tml#808872

nochmal zum

.... BrotscheibenHalbierer.xe.vg/dc/die-rache-des-senf.html
---> brotscheibenhalbierer.xe.vg/DC/Die-Rache-des-Senf.html

oder
brotscheibenhalbierer.xe.vg/DC/Die-malkuckenwaspassiert-Senf.html
---> brotscheibenhalbierer.xe.vg/DC/


oder
www.warum-verdammt-ist-dieser-domainnam ... ch-toll.de
**** /domain-name/14606.TESTtestTEST.de.html
---> /domain-name/14606.bierdatenbank.de.html


wie ich im Ersten Post schon anmerkte
**** und was ist "für solche"? *****
Warum expliziet sich um Google(oder Yahoo) TestURLs kümmern ....
... einfach immer die aufgerufene URL beim Ausliefern der Seite nachbauen und mit der requesteten URL vergleichen ....
.... gibt es einen Unterschied einen Redirect machen

Verfasst: 26.07.2011, 14:26
von profo
800XE hat geschrieben: ... einfach immer die aufgerufene URL beim Ausliefern der Seite nachbauen und mit der requesteten URL vergleichen ....
.... gibt es einen Unterschied einen Redirect machen
Ja, das funktioniert, oder den canonical-Tag einbauen. Das spart dann den 301.