Torsten Hain:
Bereitstellung von Kuratierungsvorschlägen zur Reichweitenerhöhung durch den Einsatz von Maschinellem Lernen
Kurzbeschreibung
In der vorliegenden Masterarbeit wurde die Problematik der Reichweitenvorhersage von Artikeln der Internetseite "der WELT" analysiert und eine Lösung entwickelt, die Redakteuren eine reichweitenoptimierte Kuratierung ermöglicht. Hierzu wurde die Hypothese eines linearen Zusammenhangs zwischen gleichzeitigen Nutzern in den ersten 30 Minuten und der Reichweite nach 24 Stunden aufgestellt. Für die Überprüfung und Optimierung wurden vier Algorithmen zur linearen Regression ausgewählt, umgesetzt und die Modelle verglichen. Aus Artikeldaten und Webtracking-informationen wurden Merkmale erarbeitet, welche Einflüsse auf die Reichweite abbilden. Dabei konnte durch Webtrekking-Merkmale eine lineare Abhängigkeit hergestellt und als Basis für die Vorhersage verwendet werden. Da hohe Reichweiten besonders relevant sind, wurden die besten 10% getrennt betrachtet. Dabei wurden soziale Trends als größter Verbesserungsfaktor festgestellt. Unter anderem wurde außerdem die Ähnlichkeit von Artikeln mit Doc2Vec einbezogen, wobei nur ein geringer Zusammenhang zwischen der Reichweite eines Einzelnen und der Reichweite ähnlicher Artikel identifiziert werden konnte.
In der Umsetzung ist ein Dienst mit austauschbaren Algorithmen und Modellen entstanden. Für den Redakteur wurde die Vorhersage als Reichweitenpotential in das Kuratierungstool integriert.