Eines der bekanntesten und meist-genutzten Programme im Kontext der Bioinformatik ist NCBI Blast. Blast ist ein heuristisches Tool zum Finden von bedeutenden lokalen Alignments zwischen Eingabesequenzen und einer Datenbank. Mehrere, z.T. deutlich schnellere Programme als Blast existieren bereits, doch diese haben oft eine niedrigere Sensitivität, da sie andere Algorithmen und Heuristiken verwenden.
Aufgabe dieses Software-Projekts ist es den Blast-Algorithmus in seiner häufiggenutzen BlastX-Variante (Suchen von DNA-Sequenzen in Protein-Datenbanken) möglichst genau nach zu entwickeln. Für wesentliche Schritte des Algorithmus und des "Drumherum" kann dabei auf bestehende Funktionalität in SeqAn zurückgegriffen werden, nicht jedoch für alle. Am Ende sollte ein vollständiges Programm entstehen, das dieselben Ergebnisse produziert wie NCBI BlastX. Es wäre zu hoffen, dass eine effiziente Implementierung auf Basis von SeqAn außerdem schneller wäre als NCBI BlastX.Zusatzpunkte gibt es für das einfache Verwenden von Parallelisierung! Bei ausreichender Zeit ließen sich in der Verification-Phase auch noch Algorithmen anpassen bzw. hinzufügen.
Inbesondere Section 2.2.1 zum Algorithmus der Seeding-Phase und Section 2.3.1 zum Algorithmus des Verification-Phase.
Original Paper: