ChIP-Seq ist eine Methode zur genomweiten Untersuchung von Protein-DNA-Interaktion [1]. Mit Hilfe von Antikörpern werden die Proteine von Interesse gemeinsam mit den an sie bindenden DNA-Stücken aus der Lösung selektiert und die DNA anschließend sequenziert. Die Bindestellen weisen dann gegenüber anderen genomischen Regionen eine erhöhte Anzahl auf sie gemappter Sequenzierungs-Reads auf. Beispielsweise führt eine punktuelle Bindung des Proteins an die DNA zu einem „Peak“ in der Read-Dichte. Bei Proteinen, die über breitere Bereiche mit der DNA binden, beispielsweise bei Nukleosomen, ergeben sich kompliziertere Anreicherungsmuster.
Aufgaben Ziel der Bachelorarbeit ist es, ein einfaches Verfahren zur Suche beliebiger Anreicherungsprofile in ChIP-Seq Daten zu implementieren und an realen Daten zu testen. Dabei kann auf die Ergebnisse und Erfahrung eines vorangegangenen Berufspraktikums zurückgegriffen werden. Die Aufgaben im Einzelnen sind:[1] Barski et al., High-Resolution Profiling of Histone Methylations in the Human (2007) Genome. Cell 129 (4), 823-837
[2] Zhang et al., Model-based Analysis of ChIP-Seq (MACS) (2008) Genome Biol. 9 (9), R137 [3] Gogol-Döring and Chen, Finding Optimal Sets of Enriched Regions in ChIP-Seq Data (2010) Proceedings of German Conference on Bioinformatics (GCB 2010), Vol. P-173 of Lecture Notes in Informatics (LNI), pp. 113-121