Google kann gar nix *wirklich* semantisch. Die statistischen Methoden (und Google macht das nach eigener Aussage statistisch-mathematisch, null linguistisch), mit deren Hilfe sie sowas wie "Semantik" reinzubringen versuchen, können für jede Sprache gleichermaßen angewendet werden.
Und wirkliche Semantik ist dann doch ein wenig komplizierter; ich hab mich grad 3 Monate im Rahmen meiner Staatsexamensarbeit damit auseinandergesetzt, welche linguistischen und teilweise kognitionspsychologisch angehauchten Theorien es gibt und wie man den Kram eventuell Maschinen beibiegen kann. Selbstlernende Systeme, die versuchen, die entsprechenden Zusammenhänge durch Statistik zu erschließen, kriegen das noch nicht sonderlich gut gebacken.
Auf einer Seite, auf der es um Häuser geht, wird wohl das Wort Haus öfter vorkommen. Und selbst wenn nicht, so werden andere Wörter vorkommen, die überproportional häufig auf Seiten vorkommen, auf denen es ebenfalls um Häuser geht.
Für so richtigen DC im Sinne von Abschreiben reicht aber schon ein reines Matching der vorkommenden Wörter und Phrasen, das hat jetzt gar nichts mit Semantik zu tun. Und für gleiche Inhalte in verschiedenen Sprachen sehe ich da keinerlei Gefahr. Warum sollte sowas auch abgestraft werden? Ist schließlich ein Service für den User(!), der ggf. nur einer dieser Sprachen mächtig ist.
Jetzt weiß ich was Super Seo uns beibringen will.
Wenn die gleiche Seite in einer anderen Sprache dargestellt wird, ist dies nicht DC, da google ja nicht die Seiten auf eine Sprache übersetzt und dann vergleicht.
Das Problem war für mich aber gleich sprachige Seiten, wie z.B. .at und .de
Ich fürchte das will er uns nicht beibringen. Er meint das schon so, wie er
es geschrieben hat. G00gle kann halt nur Englisch, logisch das da die
deutschen SERPs voller Spam sind. Da muss man g00gle verstehen.
DC in verschiedenen Sprachen gibt es so und so nicht, da der Satzbau zum
Beispiel im englischen auch wesentlich anders ist.
Gleichzeitig ergibt eine andere Aneinanderreihung von Buchstaben auch
eine andere Schreibweise in "Maschinensprache".