Michael Wesolek:
Kompression von Englischen Texten unter Verwendung von Lexikalischer Kategorisierung und PPM
Kurzbeschreibung
Die Englische Sprache hat ein starke SPO Struktur. (Subjekt, Prädikat, Object)
Diese Struktur/Redundanz des Satzbaues könnte potenziell zusätzlich genutzt werden um höhere Kompressionsraten zu erhalten. Hierfür wurde ein Kompressionsverfahren entwickelt/erweitert und ausgewertet. Ein Vergleich mit einer PPMC (mit exclusion) Referenz-Implementierung zeigt, dass die Ergebnisse durch das in der Bachelorarbeit vorgestellte Verfahren sich leicht verschlechtert haben. (Vergleich der besten Ergebnisse bei ca. 2000 Datensätzen) Potenzielle Gründe dafür wurden genannt, sodass die Ergebnisse aus dieser Arbeit noch weiter verbessert werden können.