In Bezug auf Google werde ich daraus aber nicht schlau.
Was genau ist da ND und was ft?
ND wird wohl die Anzahl der Dokumente sein, die bei einer Suche verfügbar sind, für den Term "Suchmaschinenoptimierung" sagt Google also
"Ungefähr 7.510.000 Ergebnisse (0,23 Sekunden)" also sollte ND doch 7.510.000 sein, oder? Aber was ist dann ft, das müsste dann doch der gesamte Google index sein, aber wie groß ist der? Oder mache ich da etwas falsch?
Verlier das Ziel nicht aus den Augen, es geht am Ende um Relevanz durch Textanalyse bestehender Dokumente.
Beispiel IDF: d.h. Alle Dokumente zum Begriff "suchmaschinenoptimierung" können den Corpus darstellen also "ND" und ft sind die Begriffe die du benötigst um für ND relevant zu werden...möglichst gewichtet mit einem niedrigen IDF abzgl. Stopwords.