Seite 1 von 1

Buchstaben-Äquivalente

Verfasst: 04.12.2006, 00:52
von Kralle
Hallo zusammen,

nun ich suche nach euren Erfahrungen, inwiefern welche Buchstaben als Äquivalente in Google und anderen Suchmaschinen gewertet werden (marginale Unterschiede mal ausgenommen).

Also relativ bekannt sollte sein:

ß => ss
ae => ä (und alle anderen Umlaute)
á => a (und alle anderen Vokale mit Akzent)

Aber wie verhält es sich mit anderen (relativ seltenen) Buchstaben?

æ => wird das als ae gewertet?
ſ => früher für ein scharfes s verwendet, wandelte sich in Kombination mit ſs zu unserem heutigen ß

Und weitere Sonderzeichen. Es geht v. A. um die maschinelle Aufbereitung von sehr alten Texten für die es zwar ein entsprechendes ASCII-Zeichen gibt, aber bei denen mir nicht ganz klar ist, ob das Google auch entsprechend erkennt.

Notlösungs-Vorschläge brauch ich keine, hab ich selbst welche in der Tasche. Geht nur darum ob der Aufwand überhaupt notwendig ist.

Verfasst:
von
Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

Re: Buchstaben-Äquivalente

Verfasst: 04.12.2006, 03:57
von 800XE
Kralle hat geschrieben: æ => wird das als ae gewertet?

für die es zwar ein entsprechendes ASCII-Zeichen gibt,
sicher das das im ASCII drin ist ( 1- 127 )
edvsb hat geschrieben: denn Ascii und utf-8 sind fast das gleiche.
wieviele Zeichen sind in utf8 möglich?
sind die 8 oder 16 Bit groß?

--- quote Wiki ----
Zeichencodes mit einem Wert von weniger als 128 werden in UTF-8 als ASCII dargestellt.
-----------------------

schon alleine das scharfeS (ß) ist nicht im Ascii drin, es hat einen Wert zwischen 128 und 255 .... je nach System, denn bei Apple oder Windows sind die Umlaute (und das ß) auf Anderen Plätzen im Zeichensatz

Re: Buchstaben-Äquivalente

Verfasst: 04.12.2006, 07:45
von SloMo
800XE hat geschrieben:wieviele Zeichen sind in utf8 möglich?
sind die 8 oder 16 Bit groß?
Dynamisch von 8 bis 32 ... in der Wikipedia ist es recht gut erklärt.

Verfasst:
von
SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Verfasst: 04.12.2006, 09:58
von ralph12345
Äquivalent ist da irgendwie gar nichts. Ich werde zwarmit ä und ae gefunden - ich benutze ä , aber die Suchergebnisse mit ä und ae sind grundverschieden. Mit ä war ich ne weile in der Sanbox unter Position 70+, mit ae unter den Top 5. Mittlerweise Pos. 1/2 mit ae und 5/8 mit ä...

ß kommt übrigens von ſ + z, nicht von ſ und s,
hier schön nachzusehen:
https://www.susannealbers.de/06wissen-altdeutsch.html

Verfasst: 04.12.2006, 20:25
von Kralle
Ähm, meinte eigentlich utf-8. Ist aber ehrlich gesagt nicht so wichtig, auch nicht das Ranking ob jetzt bei ä oder ae, sondern mir geht es einzig und allein darum, welche Zeichen Google als Äquivalente erkennt und welche nicht!

Das ich auch die neuen Zeichen verwenden könnte ist mir auch klar und für den Notfall macht das auch ein kleines Skript, es ist aber unabdingbar, daß ich diese Zeichen einsetze!

@ralph12345

Danke, dachte es wäre das doppelte s. Aber jetzt wo du's sagst - Eszett sagt man ja auch hin und wieder dazu.

Verfasst: 04.12.2006, 20:36
von Andreas I.
Ich würde mal nach einer Beispielseite im Netz schauen, die altdeutsche Schriften publiziert, mir einen Satz aus dieser Seite herauskopieren, händisch "ſ " gegen "s" ersetzen und dann googlen!

Empirische Forschung sozusagen...

edit: Bald müsste dieser Thread hier als Forschungsobjekt taugen.

Re: Buchstaben-Äquivalente

Verfasst: 04.12.2006, 20:43
von last_letter
Kralle hat geschrieben: æ => wird das als ae gewertet?
Zumindest kann ich dir sagen, dass œ als oe gewertet wird.

Verfasst: 04.12.2006, 20:45
von haha
Kralle hat geschrieben:Äes ist aber unabdingbar, daß ich diese Zeichen einsetze!
Mit Verlaub, wenn es "unabdingbar" ist, dass Du die alten Zeichen nutzt, Du also keine Alternative hast, erübrigt sich doch irgendwie Deine Frage?

Das æ wird in skandinavischen Sprachen auch heute noch rege benutzt und ist mit ae vergleichbar, siehe https://www.google.de/search?q=hjaelpere https://www.google.de/search?q=hjælpere .

Verfasst: 04.12.2006, 20:55
von Andreas I.
Da mich das Thema sehr interessiert, habe ich eben mal selber Nachforschungen angestellt. Hier mal ein altdeutscher Text:
https://www.fh-augsburg.de/~harsch/germ ... _eh12.html

Daraus ein Textausschnitt mit "ſ":
"We mir armen frawen! wie ſoll ich mein ſůße kinder anſehen"

Einige Buchstabenersetzungen: "ſ" ->"s" und "ů"->"ü"
"We mir armen frawen! wie soll ich mein süße kinder ansehen"

Ergebnis: Der modernisierte Textabschnitt wird von Google nicht gefunden, obwohl die altdeutsche Version indexiert ist. Damit ist also ziemlich sicher, dass Google die Textersetzungen "ſ" ->"s" und "ů"->"ü" nicht vornimmt!

Was tun?
einfach zwei Versionen auf derselben Seite bereithalten. Eine altdeutsche und eine modernisierte. Das ist auch kein Double-Content, da die beiden Texte ja auf derselben Seite stehen.

Verfasst: 04.12.2006, 21:35
von Kralle
@Andreas I.

Danke für den prompten Test. Dachte es hat vielleicht schon jemand so ne Art Liste parat oder kennt was dazu im Netz.

Gut, dan muß ich zu Plan B greifen und die alte und neue Variante parallel einstellen. Auch net so schlimm, aber ohne wär's eleganter.