Seite 1 von 1

Neues Google Anti Spam Patent

Verfasst: 29.12.2006, 16:41
von Fox Mulder
Neues Google Anti Spam Patent vom 28 Dezember:
Detecting spam documents in a phrase based information retrieval system
Have fun!

Verfasst:
von
SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Verfasst: 29.12.2006, 16:54
von ole1210
Also mir ist da die KW-Dichte von "spam", "documente" und "phrase(s)" ganz klar zu hoch.

Das wird dann wohl Spam sein!

Verfasst: 29.12.2006, 17:29
von rechtlegal
Schade, ole.

Ich dachte Du hättest es gelesen, übersetzt + eine kurze 2seitige Zusammenfassung auf deutsch geschrieben. :D

Dann mach ich es eben (aber übersetzt hat Google):

[0008] Ein Information Retrieval System und Methodenlehre Gebrauchphrasen zum Index, Suche, Rank und beschreiben Dokumente in der Dokumentansammlung. Das System wird angepaßt, um Phrasen zu kennzeichnen, die genug häufiger und/oder bemerkenswerter Verbrauch in der Dokumentansammlung haben, anzuzeigen, daß sie „gültige“ oder „gute“ Phrasen sind. Phrasen dieses Wortes der Weise in den mehrfachen z.B. Phrasen von vier, können fünf oder mehr Bezeichnungen, gekennzeichnet werden. Dieses vermeidet das Problem des Müssens jedes mögliche Phrasen kennzeichnen und registrieren, resultierend aus den allen möglichen Reihenfolgen einer gegebenen Anzahl von Wörtern.

[0009] Das System wird weiter angepaßt, um die Phrasen zu kennzeichnen, die miteinander bezogen werden, basiert auf der Fähigkeit einer Phrase, das Vorhandensein anderer Phrasen in einem Dokument vorauszusagen. Spezifischer, wird ein Vorhersagemaß verwendet, das die tatsächliche Coauftreten Rate von zwei Phrasen auf einer erwarteten Coauftreten Rate der zwei Phrasen bezieht. Informationen Gewinn, als das Verhältnis der tatsächlichen Coauftreten Rate zu erwarteter Coauftreten Rate, ist ein solches Vorhersagemaß. Zwei Phrasen sind in Verbindung stehend, wo das Vorhersagemaß eine vorbestimmte Schwelle übersteigt. In diesem Fall hat die zweite Phrase bedeutenden Informationen Gewinn in Bezug auf die erste Phrase. Semantisch sind in Verbindung stehende Phrasen die, die allgemein verwendet sind, ein gegebenes Thema oder ein Konzept zu besprechen oder zu beschreiben, wie „Präsident der Vereinigten Staaten“ und „des Weißen Hauses.“ Für eine gegebene Phrase können die in Verbindung stehenden Phrasen entsprechend ihrer Bedeutung oder Bedeutung bestellt werden, die auf ihren jeweiligen Vorhersagemassen basieren.

[0010] Das Information Retrieval System wird angepaßt, um ein Spam Dokument zu kennzeichnen, das auf dem Aussehen der übermäßigen Zahl der in Verbindung stehenden Phrasen im Dokument basiert.

[0011] Die anwesende Erfindung hat weitere Verkörperungen System und Software-in der Architektur, Computerprogrammprodukte und Computer eingeführte Methoden und computererzeugte Benutzerschnittstellen und Darstellungen.

[0012] Die vorangehenden sind einige der Eigenschaften eines Information Retrieval Systems und der Methodenlehre gerecht, die auf Phrasen basieren. Die der Fähigkeit in der kunst der Information Retrievals schätzen die Flexibilität des Allgemeinen der Phrase Informationen zuläßt eine große Vielzahl des Gebrauches und der Anwendungen in der Index-Bewegung, in der Dokumentanmerkung, im Suchen, im Ordnen und in anderem Prozessbereiche Dokumentanalyse und.

Verfasst: 29.12.2006, 18:12
von twiggie
Ajehhh. Wenn google Spam so lausig erkennt wie sie übersetzen.... :lol:

Ist doch wieder nur ein Tropfen auf den heißen Stein. Labern können sie viel nur anwenden tun sie es nicht! :wink:

Sie sollten lieber endlich mal dieses ganzen Link Kauf Wahnsinn unterbinden. Aber da haben Sie ja kein interessa dran wenn man mal logisch denkt. Alles was man "nur für Google" tut um gut gelistet zu sein trägt dazu bei, dass der Hype um diesen Laden nie abreißt.

Doof sind die nicht...
Twigg

0X
Twigg

Verfasst: 29.12.2006, 18:15
von big-timeless
Poah, die Übersetzung ist recht illegal.
Ansonsten schließe ich mich ole1210 an, habe schon bessere Ideen gelesen um Spam zu erkennen und zu eleminieren.

b-t

Verfasst: 29.12.2006, 18:46
von net(t)worker
twiggie hat geschrieben: Ist doch wieder nur ein Tropfen auf den heißen Stein. Labern können sie viel nur anwenden tun sie es nicht! :wink:
hapert sicher noch an der Übersetzung der jeweiligen Webseiten.. :wink:

Verfasst: 29.12.2006, 20:38
von bbnetch
sind doch nur phrasen......

ich spame anders :)

Verfasst: 30.12.2006, 10:08
von Matthias711
Die Idee ist gut, aber die Welt noch nicht bereit, bzw. die künstliche Intelligenz und die Speichermedien...

Ganz schön kompliziertes Dokument/Patent, auch wenn ich es nur überflogen habe... Ich persönlich finde ja die Passage mit den Problemen ganz interessant und schon deshalb würde ich ein solches Patent ablehnen... Ich kann sowas nämlich auch programmieren, brauche nur ein wenig Zeit, ca. 100Jahre, dann programmiere ich 1.000.000.000 verschachtelte "If...then...else"-Schleifen und schon habe ich den Spam ausgefiltert... Natürlich muß ich vorher von Hand die Spam-Dokumente heraussuchen, damit die nicht in die Statistik für die Wahrscheinlichkeiten der rechtschaffenden Nicht-Spam-Dokumente einfliessen...

Und wie bereits vorher erwähnt, ob und wann dieses Patent umgesetzt ist, erkennen wir an der Google-Translation, denn das ist ja auch nichts anderes als ein geschickte Phrasen Erkennung...

Guten Rutsch, Matthias

Verfasst: 30.12.2006, 11:07
von RW
HI,

Google hat die Macht. Ein Projekt von mir hat eine händischen Kick erfahren weil das was Sie als Ihr Patent erscheien lassen schon online zu sehen war. Und es waren keine 100 Jahre insgesamt 6 Wochen Entwicklungszeit. Danke Google!!!

RW

Verfasst: 30.12.2006, 12:42
von mediadonis
Bzgl. des Patents empfehle ich Bill´s Review:
https://www.seobythesea.com/?p=413
excellente Zusammenfassung!