In diesem Beitrag erklären wir die fundamentalen Unterschiede zwischen dem SEO-Tool WDF*IDF und unserer semantischen Lösung zur Relevanzoptimierung mittels SRO.  Schon einmal vorweg: Zwischen beiden Ansätzen liegen Welten.

WDF*IDF = Within Document Frequenzy * Inverse Document Frequency: Diese etwas sperrige Bezeichnung meint ein Tool bzw. ein Verfahren, was schon seit Jahren seine Daseinsberechtigung im Bereich SEO hat. Doch wie gut ist WDF*IDF wirklich und warum kann man es nicht wirklich mit unserem SRO-Ansatz vergleichen?

Was ist WDF*IDF?

Die Analyse nach WDF*IDF berechnet anhand der Häufigkeit von Keywords bzw. Termen in einem Text und in Bezug auf die gesamte Website wichtige Schlagworte und vergleicht diese mit relevanten Websites und Inhalten aus dem Netz. Es geht hierbei also zum einen um die Keyword-Dichte, aber immer in Bezug auf die gesamte Website und im Verhältnis zu Wettbewerber-Seiten.

Ziel ist es, Schlüsselworte zu identifizieren, mit denen sich ein beliebiger Text von den Texten der Konkurrenz abhebt und so sichtbarer wird.

Soweit zur Theorie, nun in die Praxis.

WDF*IDF im Praxistest

Für die Beurteilung der Tauglichkeit habe ich einen bereits veröffentlichten Text von unserem Blog genommen und ihn vom kostenfrei bereitgestellten WDF-IDF Tool von Seobility (fünf freie Analysen pro Tag) analysieren lassen.

Als Textbeitrag dient der Blogpost zu Cognitive Creativity anlässlich unseres ersten Cognitive Marketing Summits in München dieses Jahr.

Der Beitrag ist nach technischer SEO und nach SRO optimiert und angereichert. Er hat 672 Wörter, entsprechende Unterüberschriften und ist auf das Fokus Keyword „Cognitiv Creativity“ hin optimiert.

Schritt 1: die Analyse

Als erstes habe ich die URL zum Beitrag und das Fokus Keyword eingegeben und die Seite analysieren lassen.

WDF-IDF - Schritt 1 - Analyse

Nun werden mir als erstes die gewichteten Terme nach durchschnittlichem WDF*IDF angezeigt. Das bedeutet, hier sehe ich, für welche Schlüsselwörter Wettbewerber-Seiten ranken und in welcher Häufigkeit diese Keywords vorkommen. Ich sehe den höchsten Wert, den eine Seite für ein Keyword hat, den durchschnittlichen WDF-IDF Wert und welchen Wert mein eigener Text hat.

WDF-IDF durchschnittliche Termgewichtung

Beispiel:

Zum Schlüsselwort „Cognitive“ weist meine eigene URL einen Wert von 7 auf. Der maximal gemessene Wert liegt bei 7,12 und der Durchschnitt aller gemessenen Seiten, die dieses Keyword auch verwendet haben, bei 4,28.

Was sagt mir das nun? Dass ich das Keyword „Cognitive“ häufig, aber nicht zu häufig verwendet habe und dass darauf offensichtlich viel Wert gelegt wurde.

Okay, soweit so gut. Schaut man in der Liste nach links und rechts, entdeckt man Begriffe und Abkürzungen wie „pdf“ oder „one“ oder auch „new“, die hier als Term identifiziert wurden.

Man kann hier in der Darstellung noch zwischen „AVG WDF*IDF total“ und „AVG WDF*IDF used“ umschalten. „Total“ bezieht sich auf alle untersuchten Seiten und „used“ nur auf die Seiten mit dem entsprechenden Term im Text.

Schritt 2: Der Wettbewerb

Nachdem ich nun also weiß, wie mein eigener Text im Vergleich mit dem Wettbewerb eingestuft wird, möchte ich auch gern wissen, wer denn eigentlich die Wettbewerber-Seiten sind. Dazu bietet mir das Tool auch eine entsprechende Auswertung.

WDF-IDF Wettbewerb

Interessanterweise wird die URL, die ich als Basis-URL für die Analyse eingegeben habe, also mein eigener Text, noch einmal in den Top-10 Suchergebnissen aufgelistet. Da habe ich anscheinend etwas richtig gemacht. Auffällig ist, dass das Tool die Referenzseite mit 1.193 ausweist, während der Beitrag tatsächlich „nur“ 672 Wörter hat. Hier werden also auch die umgebenden Texte mit in die Analyse einbezogen. Ebenfalls auffällig ist, dass hier vorwiegend englische Suchtreffer aufgelistet sind, wenngleich die Analyse auf google.de eingestellt war.

In der Wertetabelle sehe ich nun noch einmal ganz genau, welche Terme welche Gewichtung haben und wie die Termfrequenz jeweils ist.

Schritt 3: Die Textoptimierung

Das WDF*IDF Tool bietet nun noch einen einfachen Texteditor, der den Inhalt der analysierten Seite ausgibt und in dem ich nun meinen Text bearbeiten kann. Hier sehe ich auch, welcher Content für die Bewertung zugrunde gelegt wurde und es ist tatsächlich die komplette Seite inkl. Header, Footer und Sidebar.

WDF-IDF Texteditor

Für den Redakteur werden hier die Wörter markiert, die öfter in den Text eingearbeitet werden sollen. Neben plausiblen Begriffen wie „Creative“ oder „Digital“ werden hier aber auch Terme vorgeschlagen, die keinen direkten Bezug zum Text oder zum Thema haben, wie beispielsweise „pdf“, „get“ oder „time.

Die Mindestwortanzahl berechnet sich auch aus dem Vergleich mit den Top10-Websites zu den Schlüsselwörtern.

Da meine eigene Seite zum Schlüsselwort „Cognitive Creativity“ schon auf Platz 2 bei Google rankt, ist eine Optimierung hier natürlich nicht mehr sinnvoll.

WDF*IDF im Vergleich mit Smart Relevance Optimization (SRO)

Da wir immer wieder von SEO-Spezialisten auf WDF angesprochen werden, möchte ich anhand dieses Textes einmal aufzeigen, wie SRO arbeitet.

Schritt 1: Die Analyse des Textes

Analog zu WDF*IDF wird auch hier der textliche Inhalt einer Seite analysiert. Nur wird hier bei SRO lediglich der Beitragstext und nicht auch noch der umgebende Content für die Analyse bewertet. Ein weiterer Unterschied: Während das Termgewichtungsverfahren den Inhalt mit den Top10-Suchergebnissen bei Google vergleicht, legt unser Verfahren die Dokumente aus tausenden Quellen und damit mehreren Millionen Datensätze zugrunde.

SRO Textanalyse

 

Hier wird auch schon ein weiterer Unterschied sichtbar. Ihr erinnert euch an die Terme „pdf“ oder auch „get“, die mir im Rahmen der Analyse vorgeschlagen wurden? Das liegt daran, dass WDF*IDF auf Keyword-Basis operiert, also rein Schlagworte miteinander vergleicht.

SRO arbeitet auf semantischer Basis und erkennt Themen, Konzepte und Bedeutungen. Dieses werden in einen Kontext zueinander gesetzt, sodass ich Themen und Schlagwörter vorgeschlagen bekomme, die auch tatsächlich zum Kontext meines Textes passen und auch nur diese Themen und Konzepte werden analysiert und miteinander verglichen.

Die Bewertungsgrundlage bei SRO ist das Relevanzmaß. Hier wird mittels linguistischer Verfahren und Algorithmen bewertet, welche Relevanz ein Thema in Bezug auf ähnliche Dokumente hat. So kann ich einschätzen, ob ich ein Thema und Schlagwort verwende oder eben nicht.

Vereinfacht ausgedrückt: Je mehr Sterne angezeigt werden, desto relevanter ist dieser Begriff offensichtlich im Netz. Daneben bietet mir die CONTEXTSUITE, d.h. unsere Technologie, auch Synonyme an, um einen Beitrag noch abwechslungsreicher zu gestalten.

SRO Synonyme

Auch hier erkennt die Künstliche Intelligenz, in welchem Context die Wörter stehen und bietet mir hier entsprechende Synonyme in verschiedenen Umfeldern an.

Schritt 2: Die Erweiterung des Textes nach holistischen Maßstäben

Während dem Redakteur in der Rubrik „Schlagwörter zum Beitrag“ die Themen und Schlagwörter angezeigt werden, die er zum einen selber schon im Text verwendet hat und die im Netz eine hohe Relevanz haben, werden dem Schreiberling unter „Schlagwörter im Umfeld“ Inhalte angeboten, mit denen er den Text entsprechen anreichern kann. Holismus, also Ganzheitlichkeit, ist hier das Zauberwort. Es geht darum, ein Thema aus möglichst vielen Blickwinkeln und Gesichtspunkten zu betrachten und auch Themen zu erkennen, die im Netz relevant sind und so meinen Beitrag für den Nutzer einfach noch besser machen.

Wichtig: Auch wenn im Plugin die Bezeichnung „Schlagwort“ gewählt wurde, um es dem Redakteur etwas einfacher zu machen, handelt es sich de facto um Themen bzw. Konzepte.

SRO Schlagworte im Umfeld

Hier muss nun der Redakteur selbst entscheiden, zu welchen Themen er noch etwas schreiben möchte, welche Begriffe er an neuralgischen Stellen des Textes platziert (technische SEO) und welche er ggf. auch nicht berücksichtigt.

Unter „Empfohlene Beiträge“ werden dem Texter die Seiten angeboten, die für die Analyse und Bewertung zugrunde gelegt wurden. Hier lässt sich also auch noch einmal wunderbar recherchieren, welche Inhalte es im Netz zu dem Thema gibt.

SRO empfohlene Beiträge

Apropos Recherche: Wie oft kommt es vor, dass Du zu einem Thema etwas schreiben musst, aber nicht weiß, was?

Dann hilft die „Trendanalyse“, relevante Beiträge im Netz zu einem Thema zu finden, auch wenn Dir vielleicht die richtigen Schlagworte nicht einfallen. Auch die Suche erfolgt semantisch, also nicht auf Keyword- sondern auf Bedeutungsebene.

Schritt 3: Nach der Optimierung ist vor der Optimierung

Wenn ein Text wirklich ganz vorn auf Seite 1 ranken soll, dann ist es oft nicht damit getan, ein wenig am Text zu schrauben und den Beitrag dann sich selbst zu überlassen. Natürlich müsst ihr als Content Manager die Beiträge entsprechend beobachten via Webtracking und ggf. noch einmal nachjustieren. Denn jede Einbringung neuer Inhalte in den Text hat neue Relevanzen zur Folge, die den Beitrag noch besser machen.

Wir schreiben für den Nutzer und das erzeugt auch Effekt für die Suchmaschine.

Unterschiede zwischen WDF*IDF und SRO

Wo liegen nun noch einmal die Unterschiede zwischen beiden Verfahren? Zuerst einmal sei festgestellt, dass hier Äpfel mit Birnen verglichen werden, obwohl beide Verfahren das Ziel haben, die organische Sichtbarkeit von Content zu verbessern. Doch damit hören die Gemeinsamkeiten auch schon auf. Die verwendeten Algorithmen, die Datenbasis und auch die Bewertungsgrundlagen sind grundverschieden.

In der Tabelle sind die meiner Meinung nach wichtigsten Unterschiede aufgeführt.

WDF-IDF und semcona SRO im Vergleich

Und was ist nun besser? 

Davon solltet ihr euch selber eine Meinung bilden. Ich für meinen Teil weiß es genau :-).

Leseempfehlung: Latent Semantic Optimization

Jan Pötzscher

Jan Pötzscher leitet und verantwortet als Head of Account Management die Kundenprojekte. Als erfahrener Blogger und Social SEO Experte bringt er sich zu dem auch fachlich in interne und externe Projekte mit ein.