Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

H1 mit schriftgröße 0

Hier können Sie Ihre Fragen zum Thema Suchmaschinenoptimierung (SEO) / Positionierung stellen
Gamling
PostRank 6
PostRank 6
Beiträge: 457
Registriert: 14.04.2007, 03:37

Beitrag von Gamling » 23.11.2009, 18:43

mit nem png kann man da lustigerweise wirklich noch den Text rausbekommen, der mal drunterstand :)

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

800XE
PostRank 10
PostRank 10
Beiträge: 5223
Registriert: 02.12.2004, 03:03

Beitrag von 800XE » 24.11.2009, 05:25

Gamling hat geschrieben:mit nem png kann man da lustigerweise wirklich noch den Text rausbekommen, der mal drunterstand :)
wofür steht png ?

potenziell (oder problemlos)
nachbearbeitbare
grafikbestandteile

Stephan Zöllner
PostRank 3
PostRank 3
Beiträge: 99
Registriert: 26.11.2009, 19:37
Wohnort: Westerstetten

Beitrag von Stephan Zöllner » 27.11.2009, 11:10

Die wirklich normale Lösung ist schlicht:

Alt-Tag nutzen

@800XE
Die Auswertung durch die Suchmaschine beginnt üblicherweise damit die Kommentare durch ein striptags("erlaubte Tags"), die nur die als relevant eingestuften Tags übrig läßt. In der PHP-Version der Funktion ist es hard-Coded, daß die Kommentare entfernt werden. Das ist auch logisch weil das die Datenlast beim Abarbeiten der zwischengespeicherten SeitenTexte verringert, die keine relevanten Infos enthalten (die Komentare sieht der Besucher ja nicht)

Also für Kommentare sind die Bots und Sumas blind!

Anzeige von ABAKUS

von Anzeige von ABAKUS »

Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

Margin
PostRank 10
PostRank 10
Beiträge: 4646
Registriert: 09.09.2005, 08:25

Beitrag von Margin » 27.11.2009, 12:04

Wenn es um Google geht, gilt auch die Google-Hausordnung, so einfach ist das:
https://www.google.com/support/webmaste ... swer=66353

800XE
PostRank 10
PostRank 10
Beiträge: 5223
Registriert: 02.12.2004, 03:03

Beitrag von 800XE » 28.11.2009, 07:48

Stephan Zöllner hat geschrieben:Das ist auch logisch weil das die Datenlast beim Abarbeiten
wie macht Google das? oder redest du von KidiDownload.to SuchmaPHPs?

Wenn erst ein StripTags über alles geht, dann wird der komplette Text einmal gelesen um den gewünschten Text zu extrahieren bzw um den unerwünschten Teil zu überlesen

Danach kommt das eigentlich lesen = es wird alles zum 2ten mal gelesen

Ein gescheiter Parser würde den originalText lesen und auswerden .... direkt beim lesen das unerwünschte überlesen = nur einmal lesen

Auserdem hat stripTAG einen blösen bösen Fehler

Code: Alles auswählen

mein altes Auto<br>steht in der Garage
wird zu

Code: Alles auswählen

mein altes Autosteht in der Garage
?????? Autosteht ???????
:wink: Wer probleme hat mit dem Ranking, sollte vielleicht mal seine Keywords analysieren ob sie als solche oder Andere verarbeitet werden und gegebenenfalls vor und nach TAGs jeweils (zumindest auf einer Seite) einen BLANK hinzufügen damit durch stripTAGs nicht unbeabsichtigt Wörter zusammenbacken .... euer WebSiteBaker
Margin hat geschrieben:Wenn es um Google geht, gilt auch die Google-Hausordnung, so einfach ist das:
https://www.google.com/support/webmaste ... swer=66353
Google hat geschrieben:Der Link verbirgt sich hinter einem kleinen, unauffälligen Zeichen,
zum Beispiel einem Bindestrich mitten in einem Abschnitt.
hm, wenn ich jetzt
3w.ABC--------------------------------------XYZ.de hätte und würde da das Alphabet als Navi machen
wären die "-" von >C bis <X dann versteckte Links?

oder würde da quasie der Boot denken "das sind soviele versteckte(schwer sehbare) zusammen die kann man nicht übersehen = die sind nicht versteckt"

Stephan Zöllner
PostRank 3
PostRank 3
Beiträge: 99
Registriert: 26.11.2009, 19:37
Wohnort: Westerstetten

Beitrag von Stephan Zöllner » 28.11.2009, 13:30

@800XE
Ich habe mal eben kontrolliert: Google speichert die Seiten vollständig im Cache - sie haben ja genug Speicher ;-) zur Verfügung ...
Die Kommentare werden dabei nicht entfernt!

Allerdings kannst Du trotzdem davon ausgehen, daß beim Analysieren einer der ersten Schritte darin besteht Dinge, die gewiß nicht relevant sind oder als nicht relavant eingestuft werden zu entfernen.

Google wird das warscheinlich NICHT mit striptag machen sondern eine eigene Programmierung verwenden, die genau auf die Bedürfnisse /Anforderungen zugeschniten ist und keine Worte zusammenBackt :-)

Es ist durchaus möglich, daß Google einen SinglPassParser für diese Zwecke programmiert hat, da dabei aber laut Google selbst bis zu 500.000 Variablen mit einbezogen werden halte ich das eher für unwarscheinlich. Es ist für mich eher anzunehmen, daß die logischen Schritte nacheinander abgearbeitet werden und die Ergebnisse in die Datenbanken geschrieben werden. Wenn dabei auf die Cache-Inhalte zugegriffen wird (die sich noch im Speicher befinden können) geht das auch relativ flott ... vor allem weil in einer Multi-Prozessor-Umgebung durch die Paralellisierung sogar Zeitvorteile entstehen während paralelle Threads auf den gleichen Speicherinhalt zugreifen können.

Das StripTags-Problem kann man übrigens relativ einfach lösen indem man "<" und ">" vorher durch " <" und "> " ersetzen läßt, StripTags aufruft und anschließend die doppelten WhiteSpaces wieder eindampft (was man sonst vor der Analyse sowieso gerne tut). Das ist natürlich etwas umständlicher als wenn StripTags das selbst wie gewünscht erledigen würde, aber verhindert zuverlässig den von Dir angeführten Problemfall.

800XE
PostRank 10
PostRank 10
Beiträge: 5223
Registriert: 02.12.2004, 03:03

Beitrag von 800XE » 28.11.2009, 14:24

Stephan Zöllner hat geschrieben:Es ist durchaus möglich, daß Google einen SinglPassParser für diese Zwecke programmiert hat, da dabei aber laut Google selbst bis zu 500.000 Variablen mit einbezogen werden halte ich das eher für unwarscheinlich. Es ist für mich eher anzunehmen, daß die logischen Schritte nacheinander abgearbeitet werden und die Ergebnisse in die Datenbanken geschrieben werden.
Die 500.000 $Variablen stehen aber nicht im HTML?
Die meisten sind wohl dann gewichtungswerte
z.B. "Link near of end from Page = think it is in the Footer = $link['weight']=$gewichtung['footer']
( sorry, hät vielleicht doch bäsa uf deutsch? )

Ich hab mir die Tage einen HTML-Parser gefrikelt (angefrikelt)
soll mal dazu dienen die Struktur zu prüfen undoder analysieren ...
... Table(oder DivVerschachtelung) korekt?

ich lese da zeichen für Zeichen
manche sind "Steuerzeichen"
z.B.

Code: Alles auswählen

if     &#40; $TOK==ord&#40;'<'&#41; &#41; &#123; if &#40; $readTAG==0 &#41; &#123; $readTAG=1; $TAG=''; $readCOM=0;$readSTR= 0; &#125; &#125;
elseif &#40; $TOK==ord&#40;'>'&#41; &#41; &#123; if &#40; $readTAG    &#41; &#123; $readTAG=0; $TAG=''; $readCOM=0;$readSTR=-1;$STR=''; &#125; &#125;
TAG beginnt bzw hört auf

Strin beginnt bzw hört auf .....
.... in dem Fall gleiches Steuerzeich
ob jetzt Ende oder Anfang = if "bin ich schon drin?"

Code: Alles auswählen

      elseif &#40; $readTAG && &#40; $TOK==ord&#40;'"'&#41; || $TOK==ord&#40;"'"&#41; &#41; &#41;
      &#123;
        if &#40; $readSTR==0 &#41; &#123; $readSTR=1; $STR=''; &#125;
        else               &#123; $readSTR=0; $STR=''; &#125;
      &#125;

<meta name="lang" content="de">

Dort wird 1 TAG gelesen, welcher dann in der DB später noch 2 PARA Datenzeilen hat

Ein <!-- html Kommentar --> wird beim Pars einfach ... eben Zeichen für Zeichen .... gelesen aber dann nicht weiter beachtet (wenn den nicht gewünscht)


Wie gesagt .... beim Pars einfach überlesen
da, wenn er vor dem Pars entfernt werden würde, müßte man vor dem Pars ja alles extra "schoneinmal" lesen

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag