800XE hat geschrieben:Antikoerperchen hat geschrieben:Das Wort "logisch" ist in der Umgangssprache ein völlig verdrehtes Wort, weil es mit der mathematisch-informatischen Logik gar nichts zu tun hat.
Wer setzt ein "wäre schön wenn" mit logisch gleich?
Wenn ein Auto an die Wnad fährt ist es kaputt? logisch?
einfach nur Antworten=ja
Antwort mit Rückfrage
wie schnell war das Auto?
.... schnell! Antwort =ja
.... langsam .... wie langsam?
.... sehrsehr langsam Antwort=nein, nur ein Kratzerlein an der SToßstange
Bitte?
800XE hat geschrieben:Antikoerperchen hat geschrieben:
Folgende Fragen kann man sich stellen:
*Ab wann ist eine Seite themenrelevant?
(Ist z.B. PHP themenrelevant mit Linux?)
Linux = 996.000.000
php = 2.460.000.000
linux+php = 219.000.000
= 10% der php treffer auch mit Linux
= 20% der Linuxtreffer auch mit php
html = 8.970.000.000
php+html = 441.000.000
= 5% von html auch mit php
= 18% von php auch mit html
Motorrad = 71.400.00
Motorrad+Linux = 1.710.000
= 2.3% von motorrad auch mit Linux
= 0.17% von Linux auch mit Motorrad
Das ist eine annehmbare Annäherung für den "Hausgebrauch", aber nach dieser Milchmädchenrechung ist Linux zu PHP themenrelevanter als PHP zu HTML.
Das Ergebnis wird dadurch verfälscht, dass html und php häufig als Dateiendung benutzt werden. Ein weiteres Problem ist, dass Google die Anzahl der Suchtreffer bei sehr vielen Ergebnissen nur sehr ungenau beziffert. Die aufgeblähten Indizes der letzten Zeit, wo eine kleine Domain plötzlich tausende von Seiten hat, trägt auch nicht gerade zur Genauigkeit bei.
Damit ist auch noch nicht die Frage geklärt, was passiert, wenn man sehr stark auf ein Thema eingeht und dabei das Wort (z.B. PHP) nicht oder kaum benutzt (beispielsweise Code mit einem Link auf das Originalprogramm). Ist ein Link von so einem Dokument weniger themenrelevant, als von einer anderen Seite, die nur rein zufällig php als Dateiendung hat?
800XE hat geschrieben:als "wäre gern Mr. Spock" erkenne ich hier ganz deutlich das Motorrad und Linux hier sehrsehr wenig miteinander zu tun haben
wenn sie irgendwo gleichzeitig auftauschen ... dann nicht weil sie was miteinander zu tun haben
Dir diesen Kommentar zu verkneifen, hätte wahrscheinlich zu viel Selbstdisziplin verlangt, oder?
800XE hat geschrieben:rein (mathematisch) logisch betrachtet
ist Linux+php temenrelevanter
als html+php
= 10+20 zu 5+18 = 30 zu 23(23=nichts ist wie es scheint)
Dann sind wir uns darin einig.
800XE hat geschrieben:rechnet man weiter bzw wertet nach gewichtung
gewichtet also die Themenrelevantz von php zu den beiden Anderen
=
html = 18
Linux nur 10
Also ist php relevanter zu html als zu Linux
Diesen Schritt verstehe ich ehrlich gesagt nicht. Kann auch daran liegen, dass diese Rechnung sehr konstruiert ist und für viele andere Beispiele so nicht ohne Weiteres funktioniert.
800XE hat geschrieben:Antikoerperchen hat geschrieben:
*Bräuchte man dann nicht eine Datenbank, also so etwas wie einen Thesaurus (Synonymlexikon) mit Themen und verwandte
Google hat keine Datenbank?
Synonyme?
= Google? Motorrad linux
? Meinten Sie: Motorrad link
das sagt mir schon mal das G erkennt das die beiden nichts miteinander zu tun haben .....
Die phonetische Suche von Google ist sicher hilfreich und ein nettes Feature, aber manchmal schlägt sie auch Unsinn vor. Jeder hat schon mal die Erfahrung gemacht, dass Google unpassende Vorschläge unterbreitet hat und wir finden das auch alle sehr lustig, wenn Google wie aus heiterem Himmel versaute Wörter vorschlägt. Weniger witzig ist, wenn man eine unausgereifte Technik bewusst auf den Markt schmeißen würde, wo es um Arbeitsplätze geht.
Die "Meinten Sie"-Funktion von Google stellt (höchstwahrscheinlich) auch keine semantischen Zusammenhänge zwischen den Wörtern her. Es wird stattdessen versucht, aufgrund der Suchanfrage Klangähnlichkeiten zu anderen Wörtern zu finden und diese Alternativen dann dem Benutzer zu unterbreiten.
Die phonetische Suche ist also eine andere Baustelle. Ich könnte auch Google ein Wörterbuch zuschicken und sagen "Hier habt ihre eure Datenbank". Die Frage, wie damit jetzt die Wörter in thematische Beziehung gebracht werden können, ist damit noch lange nicht beantwortet.
Genauso ungeklärt ist meine Frage nach der Sprache. (Die phonetische Suche funktioniert übrigens normalerweise nicht sprachübergreifend.)
Beispiele gibt es hinreichend. Was ist mit einem tschechischen Hotel, was hauptsächlich japanische und niederländische Besucher hat und dann von Japanern und Holländern verlinkt wird? Kann Google problemlos darüber urteilen, dass "askjliouw" themenrelevant mit "jasoidu" und "asoiw" ist?
Was ist mit Homonymen (Teekesselchen), bzw. Wörtern aus verschiedenen Sprachen mit verschiedenen Bedeutungen, die aber genauso geschrieben werden?
Werden Hotelbesitzer in Tokio auch in 5 Jahren noch die Themenrelevanz ihrer Links mit einer Band wie Tokio Hotel teilen müssen, wenn sie schon längst nicht mehr aktuell ist?
800XE hat geschrieben:Antikoerperchen hat geschrieben:*Kann der Spider diese Seitenanalyse bei einem vertretbaren Mehraufwand an Rechenpower und Rechenzeit erledigen?
Das macht nicht der Spider ...
... der sammelt die Daten ein
und im "backoffice" werkelt dann ein Anderes Programm
der Konditor macht die Torte
aber Verkauf oder servieren(Cafe) ist nicht sein Job
Wer die Arbeit letztlich macht, ist egal. Wichtig ist nur, dass sie gemacht werden muss und dass dafür Ressourcen nötig sind.