Next Generation Sequencing (NGS) Daten werden heute für unterschiedlichste Aufgaben verwendet. So unter anderem zur Untersuchung von Bodenproben, Geweben und Mageninhalten - oder kurz: In der Metagenomic. Besonders interessant ist dabei zu erfahren, WER WAS macht.
Um dies zu Studieren kann man die Information der NGS Daten mit bestehenden Proteindatenbanken vergleichen. Hierbei ist jedoch die Größe der NGS Daten ein Problem, sodass die Entwicklung einer BlastX Variante für NGS Daten von großem Interesse ist.
Ziel dieser Aufgabe ist es, einen Variante von BlastX zu realisieren.
Dazu soll das 20 Zeichen umfassende Proteinalphabet auf wenige Zeichen reduziert werden und mit Hilfe spezialisierten Mapping-Algorithmen (Masai) eine Proteinsuche umgesetzt werden. Hierzu müssen folgende Fragen geklärt werden:Beschreibung | Bearbeitungszeitraum | Programmierung |
---|---|---|
Testdatensatz erstellen und einlesen | 25.04.13-30.04.13 | Marjan |
Reads und Proteindatenbank übersetzen | 25.04.13-30.04.13 | Annkatrin |
Alphabet erstellen | 01.05.13-07.05.13 | Marjan |
Reads in Datenbank suchen und matches finden | 01.05.13-07.05.13 | Annkatrin |
Matches verifiizieren | 08.05.13-14.05.13 | Annkatrin & Marjan |
Ergebnisse in txt-Datei ausgeben | 15.05.13-20.05.13 | Annkatrin & Marjan |
Evtl. Fehler im Programm beheben anschließend verschiedene Alphabete testen | 21.05.13-25.05.13 | Annkatrin & Marjan |
Die Aufgabe ist in einer kleinen Gruppe zu bearbeiten.