Erik Grahl:
Die theoretische Betrachtung des Bloom-Filters und einige seiner Erweiterungen
Kurzbeschreibung
In dieser Arbeit werden der Bloom-Filter und einige Erweiterungen vorgestellt. Der Bloom-Filter bietet eine Lösung für das statische Wörterbuchproblem. Da der Bloom-Filter eine probabilistische Datenstruktur ist, besitzt der Bloom-Filter eine False Positive Rate. Diese ist eine der großen Schwächen des Bloom-Filters.Die hier vorgestellten Erweiterungen implementieren das dynamische Wörterbuch oder verbessern die False Positive Rate gegenüber dem Bloom-Filter. Die Erweiterungen wurden aus verschiedenen anderen Arbeiten übernommen und werden ausführlich betrachtet und zu jedem der Filter der Pseudocode angegeben um dem Leser die Implementation in einer belieben Programmiersprache zu erleichtern. Es wird auf ihre False Positive Rate eingegangen und sie werden einander gegenübergestellt, um für mögliche Szenarien eine geeignete Erweiterung zu finden. Zum Ende der Arbeit wird die Analyse der False Positive Rate nach Bloom untersucht und festgestellt, dass die Analyse nach Bloom zwar nicht korrekt ist, da sie eine falsche Annahme trifft, aber eine gute Näherung für die False Positive Rate ergibt.
Besonders interessant ist die Arbeit für Leser, die einen Bloom-Filter implementieren oder aus der theoretischen Analyse erfahren wollen, ob ein Bloom-Filter als Lösung ihres Problems in Frage kommt. Auch Leser die den Bloom-Filter schon kennen, aber die in vielen Fällen angegebene False Positive Rate in Frage stellen, werden in dieser Arbeit eine Erklärung zu dieser Problematik finden.