Spracherkennung
Verfasst: 20.09.2004, 06:23
Da mein Hauptprojekt dreisprachig ist habe ich auch drei Googles zu beobachten (com de it). Nun sind manche Seiten zwar auf beispielsweise englisch, und dies ist auch hinreichend deutlich und konventionsgemäß vermittelst
<html xmlns="https://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
gekennzeichnet. Dennoch meint .com, ein "Translate this page" dahinter setzen zu müssen. Es scheint also, als ob der Bot lang-Attribute vollständig ignoriert. Titel, h1, Linktext enthalten ein italienisches Wort und Eigennamen. Restlicher Text ist englisch, mit vereinzelten italienischen Wörtern. Nun tritt dies aber nicht bei allen Seiten auf, nämlich bei jenen nicht, bei denen der restliche Text ausreichend umfangreich ist.
<html xmlns="https://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
gekennzeichnet. Dennoch meint .com, ein "Translate this page" dahinter setzen zu müssen. Es scheint also, als ob der Bot lang-Attribute vollständig ignoriert. Titel, h1, Linktext enthalten ein italienisches Wort und Eigennamen. Restlicher Text ist englisch, mit vereinzelten italienischen Wörtern. Nun tritt dies aber nicht bei allen Seiten auf, nämlich bei jenen nicht, bei denen der restliche Text ausreichend umfangreich ist.