Springe direkt zu Inhalt

SeqAn@FPGA

Principal Investigator:
Research Team:
Funding:

BMBF ● FKZ: 16ME0588K

Term:
Sep 01, 2022 — Aug 31, 2025

 

Das Projekt SeqAn@FPGA: Enabling powersaving and ultrafast approximate sequence search beschäftigt sich mit der Implementierung zentraler Datenstrukturen für die bioinformatische Sequenzanalyse, nämlich des Hierarchical Interleaved Bloom Filter und des FM index auf einem FPGA. Diese sollen dann in die SeqAn C++ Bibliothek für biologische Datenanalyse integriert werden. Der HIBF hat das Potential, als im Hauptspeicher befindliche Datenstruktur in Servern als Vorfilter für die approximative Stringsuche für viele verschiedene biomedizinischen Applikationen eingesetzt werden zu können. Der FM index hingegen ist die standardmäßig verwendete Datenstruktur, auf der praktisch alle read mapper für NGS Daten aufsetzen.

Für beide Datenstrukturen existieren CPU Implementierungen in der SeqAn Bibliothek, welche Multi-Threading und Vektorisierung verwenden. Aus diesem Grund sind Sie effizient, weisen aber gleichzeitig auch einen hohen Energieverbrauch auf. SeqAn@FPGA zielt darauf, eine FPGA basierte Lösung für die Datenstrukturen zu entwerfen und zu implementieren, welche eine ähnliche Performanz wie die CPU basierten Lösungen haben, dabei aber deutlich weniger Energie verbrauchen. Diese Lösungen sollen so in die SeqAn3 Bibliothek integriert werden, dass Applikations-Programmierer einfach Programme entwerfen können, welche die FPGA Varianten einbinden können, je nachdem, ob die entsprechende Hardware vorhanden ist. Diese Einbindung soll auch weitere FPGA basierte Implementierungen leicht ermöglichen.

Schließlich werden wir diese Implementierungen dazu benutzen, als Beispiel für eine typische Anwendung einen verteilten Read Mapper zu implementieren, der beide FPGA basierten Implementierungen benutzt, und dessen Performanz und Energieverbrauch mit der entsprechenen CPU basierten Lösung vergleichen.