Seite 1 von 1

Quelltext von Webseiten durchsuchen

Verfasst: 10.04.2007, 18:03
von Advertiseman
Guten Tag,

Gibt es eine Möglichkeit mit einer Suchmaschine im gesamten Google Index nach einem Bestandteil des Quelltextes zu suchen?

Ein kleines Beispiel:

Sie entwickeln eine Software und versehen diese mit einem Copyright Hinweis per HTML Kommentar. Jetzt möchten Sie wissen, wer Ihre Software illegal einsetzt und suchen nach dem Kommentar mit Google.

Leider liefert Google jedoch keine passenden Seiten, da Kommentare nicht in die Suche mit eingenommen werden.


Vielen Dank im Voraus

Verfasst:
von

Verfasst: 10.04.2007, 18:15
von muck
Gefunden wird das was im Index ist.
Wußte nicht das Sumas auch Software indiziert.
Hast du dich falsch ausgedrückt?

Verfasst: 10.04.2007, 18:20
von Advertiseman
Mit Software war eine Webapplication gemeint, wie z.B. ein Forum.

Ein besseres Beispiel ist folgendes:

Auf der Webseite test.de befindet sich im HTML Quelltext "<!-- noxum publishing-studio 4 - 2007-04-10 17:21:45 (UTC) -->". Nun möchten Sie durch die Eingabe dieses Kommentars alle Webseiten finden, die ebenfalls dieses Kommentar in Ihrem Quellcode haben.

Verfasst: 10.04.2007, 19:19
von Jeuners
Nein, Kommentare werden nicht (mehr) indexiert.

Verfasst: 11.04.2007, 09:06
von coins
https://www.google.com/codesearch Vielleicht hilft das?

Verfasst: 11.04.2007, 13:20
von Advertiseman
Nein, Codesearch ist nicht dafür gedacht

Verfasst: 11.04.2007, 13:44
von Vitali Neumann
Jeuners hat geschrieben:Nein, Kommentare werden nicht (mehr) indexiert.
warum nicht und wo hast du das her ?

Verfasst: 11.04.2007, 13:50
von Ehemalige Nutzer Z
also im cache von google sind sie drin! die guten alten kommentare

Verfasst: 11.04.2007, 14:08
von hot-elle
Und wenn du den Copyright nicht in einen Kommentar sonder versteckt einbindest? (https://www.css4you.de/visibility.html)

Glaube das wird von Google indiziert...

Verfasst: 12.04.2007, 04:25
von Advertiseman
Das Problem ist, dass die Seiten die alte Copyright Methoden schon enthalten und eine Software bereits im Umlauf ist. Es müsste praktisch eine Suchmaschine geben, die HTML Tags als Suche erlaubt und den Google Index spidert. Somit wäre es möglich HTML Kommentare ausfindig zu machen.

Verfasst: 12.04.2007, 07:11
von marc75
zuendschnur hat geschrieben:also im cache von google sind sie drin! die guten alten kommentare
Und alles andere was im Quelltext steht, ist auch im Google Cache enthalten. Nur anzeigen wird dir Google nix, was in Kommentaren vorkommt, warum auch.

Verfasst: 12.04.2007, 07:49
von Jeuners
POZ hat geschrieben:
Jeuners hat geschrieben:Nein, Kommentare werden nicht (mehr) indexiert.
warum nicht und wo hast du das her ?
Hatte mal die gleiche Idee und habe es getestet 8) Probier es doch mal aus... einfach ein unmögliches Wort ausdenken und als Kommentar auf einer indexierten Seite ablegen. Nach 4 Monaten konnte ich mein Keyword noch nicht in den SERPS entdecken.

Verfasst: 12.04.2007, 08:48
von SISTRIX
Google Cache != Google Index. Wenn Google anfangen würde, die komplette Seite inkl. aller HTML-Tags, Kommentare usw in den Suchindex zu legen, würde dieser mind. um den Faktor 2 wachsen ... => Was nicht im Index ist, kann nicht gefunden werden => Es gibt keine Möglichkeit, den Quelltext zu durchsuchen.

Gruß Johannes

Verfasst: 12.04.2007, 09:38
von Margin
Ich gehe da anders vor, wenn ich z.B. "alle Foren des Typs XY suche".

Die meisten Scripte (Gäbus, Foren, Kataloge, Kalender ...) enthalten irgendwelche unscheinbaren Formulierungen, die vom Benutzer kaum wahrgenommen und somit auch so gut wie nie geändert werden. Bei Foren können das z.B. irgendwelche Wortfolgen aus der Forenhilfe sein, bei Gästebüchern solch überflüssige Formulierungen aus dem Kleingedruckten wie z.B. "Bitte übertragen Sie den Sicherheitscode in das nebenstehende Feld." Sicher, diese Formulierungen gibt es dann auch bei anderen GäBu-Anbietern, aber nur sehr selten mit exakt der gleichen Zeichenfolge.

Just my two cents

Margin