Hast du dich verlesen? Oder schnall ich es nicht? themenentfernt steht da.800XE hat geschrieben:Eine Seite über AutoTuning = "mehr Tempo für die Karre" = relavant zu TempoTaschentuch?xAaron hat geschrieben:ein leichtes die Seiten als extrem Themenentfernt einzustufen. Das Stichwort wurde hier oft genug genannt.
Nein, ist es nicht, hat aber auch niemand behauptet.800XE hat geschrieben:findest du wirklich das das logisch ist?
Das ist doch gerade der Witz bei LSI, dass dies eben vollkommen automatisch aus einer großen Textmenge berechnet wird und hier kein Synonymwörterbuch benötigt wird, sondern Synonyme und die Ähnlichkeit von Begriffen komplett automatisch ermittelt wird.800XE hat geschrieben:xAaron hat geschrieben:Lies dir doch wirklich mal die Sachen zu LSI durch. Dadurch können zwei Seiten, die nicht ein einziges Wort gemein haben als extrem ähnlich eingestuft werden und genau das meint Themenrelevanz.Ergebnisse 1 - 10 von ungefähr 6.950.000 für Pferd.https://de.wikipedia.org/wiki/Latent_Semantic_Indexing
Diese Hauptkomponenten (Konzepte) kann man sich als generelle Begriffe vorstellen. So ist Pferd zum Beispiel ein Konzept, das Begriffe wie Mähre, Klepper oder Gaul umfasst.
und dort sind sicher wirklich nur "Pferd" und keine "Gaul" oder "Klepper" drin
(wir unterscheiden jetzt zwischen SERPS und Linkrelavantz bei Liktausch?)
LSI braucht ein (Synonym)Wörterbuch .... der "Algo" kann das nicht selbst leisten
Damit definiert sich die Ähnlichkeit von Texten nicht mehr darüber, ob gleiche Keywords darin vorkommen, sondern darüber, wie viele Worte in beiden Texten vorkommen, die in anderen Texten in einem ähnlichen Kontext auftauchen. Und deshalb werden Texte als ähnlich klassifiziert, die kein Wort gemeinsam haben, einfach weil die Wörter in den Texten auf denen der Algorithmus seine Werte berechnet hat häufig in ähnlichem Kontext auftauchen.
Um beim Beispiel zu bleiben: ein Text, der sich um Taschentücher dreht würde neben dem Keyword Tempo, das auch im Auto-Text häufig vorkommt, so Begriffe wie Nase, Nießen, Schnupfen,... enthalten, die in Texten, wo es sich um Autos dreht nur sehr selten vorkommen. Andererseits würde der Autotext Begriffe wie Tuning, Porsche, Geschwindigkeit... vorkommen, die normalerweise nur sehr selten in Texten zum Thema Taschentuch auftauchen. Deshalb würde mittels LSI festgestellt, dass trotz Keywordgleichheit, die Texte sehr unterschiedlich sind.
So, ich hoffe es ist klarer geworden.
Darfst du, und die Antwort ist: ja, hin und wieder, allerdings bisher meistens mit anderen KI Methoden. LSI ist zwar sehr cool, hab ich aber noch nicht gebraucht.800XE hat geschrieben:Darf ich mir erlauben zu fragen ob du selbst irgendwo mit LSI oder KI arbeitest und vondaher die Kompetenz hast die Anwendbarkeit zu bewerten?