Ich meinte jetzt nicht PHP damit oder irgendwelchen Code, mir ist nur nichts Besseres als Beispiel eingefallen. Ich meinte damit, Google scheint keine Probleme damit zu haben, einen beliebigen Suchstring oder Longtail zu finden, egal wie der im Quelltext formatiert ist. Also, wenn ich das jetzt "keyword1 keyword2 keyword3" mit Anführungszeichen eingeben würde, dann würde Google "keyword1 keyword2 keyword3" als String finden, egal wie die einzeln Keywords im Quelltext formatiert sind.
Anderes Beispiel, gerade getestet:
<strong><big>P</big>artnerschaften</strong>
Erkennt Google problemlos als zusammenhängendes Wort Partnerschaften, obwohl durch Tags unterbrochen. Meiner Meinung nach entfernt Google alle Tags und alle Styles aus einem Text und vergleicht nur den nackten Text.
Hat aber erst einmal nichts mit dem Bot zu tun, denn der liest ja erst einmal die Seite nur ein. Ist mehr eine Frage der Aufbereitung. Du hast doch schon Bots programmiert, für die Anzeige der Treffer wirfst Du doch da auch alles <von bis> heraus und gibst nur das aus, was keine spitzen Klammern mehr enthält bzw. gibst nur das aus, was sich als Value >zwischen spitzen Klammern< befindet und eliminierst den Rest.
Also ich sehe das so, der Bot ruft die URI auf, lädt die Seite, speichert die ab. Das ist das, was dann als Cache abgerufen werden kann. In einem zweiten Arbeitsschritt wird die Seite dann ausgewertet, wobei Titel, h1 usw. eine entsprechende Flag erhalten, gleichzeitig werden alle Tags und Styles entfernt. In der DB liegt dann nur noch:
Und ein paar Felder und Flags mehr, die fürs Ranking wichtig sind
(vielleicht auch 200 oder eine binäre Summe aus 200 Flags für die Page, aus der sich gleich eine Position fürs Ranking ableiten lässt. Die Seite mit der höchsten oder niedrigsten Summe wird dann am höchsten oder niedrigsten gelistet.), alles andere ist weg, wird entfernt aus Titeln und Text. Es dauert ein paar Millisekunden, bis Google aus einigen Milliarden Webseiten die Ergebnisse bei einer Suchanfrage liefert, das wäre nicht möglich, wenn sich Google bei jeder Suchanfrage noch durch ein paar Milliarden formatierter Texte zu kämpfen hätte. In irgendeiner Form werden die als Daten aufbereitet.