You are here: ABI » ThesesHome » ChipSeqProfiles
Übersicht

ChIP-Seq ist eine Methode zur genomweiten Untersuchung von Protein-DNA-Interaktion [1]. Mit Hilfe von Antikörpern werden die Proteine von Interesse gemeinsam mit den an sie bindenden DNA-Stücken aus der Lösung selektiert und die DNA anschließend sequenziert. Die Bindestellen weisen dann gegenüber anderen genomischen Regionen eine erhöhte Anzahl auf sie gemappter Sequenzierungs-Reads auf. Beispielsweise führt eine punktuelle Bindung des Proteins an die DNA zu einem „Peak“ in der Read-Dichte. Bei Proteinen, die über breitere Bereiche mit der DNA binden, beispielsweise bei Nukleosomen, ergeben sich kompliziertere Anreicherungsmuster.

Aufgaben

Ziel der Bachelorarbeit ist es, ein einfaches Verfahren zur Suche beliebiger Anreicherungsprofile in ChIP-Seq Daten zu implementieren und an realen Daten zu testen. Dabei kann auf die Ergebnisse und Erfahrung eines vorangegangenen Berufspraktikums zurückgegriffen werden. Die Aufgaben im Einzelnen sind:

  • Erstellung eines Programms, das aus einem gegebenen ChIP-Seq Datensatz sowie einer Menge von Referenzpositionen (z.B. der Transskriptions-Startpositionen von RefSeq-Genen) ein Anreicherungsprofil berechnet, nach dem im Folgenden genomweit gesucht werden kann.
  • Implementierung einer einfachen Suche in ChIP-Seq Daten nach einem gegebenen Anreicherungsprofil, bei dem das Profil als „sliding window“ über das Genom geschoben und an jeder Stelle ein Score berechnet wird.
  • Beschleunigung der Suche dadurch, dass nur an solchen Regionen gesucht wird, die über eine erhöhte Readzahl verfügen (Filter Strategie). Angereicherte Regionen werden mit einem gängigen Peak-Caller wie z.B. MACS [2] gefunden, und anschließend um die gefundenen Regionen herum nach dem Anreicherungsprofil gesucht.
  • Testen des Verfahrens anhand von realen Daten, beispielsweise an einem ChIP-Seq-Datensatz zu der Histonmodifikation H3K4me3, die ein charakteristisches Doppelpeak-Profil um Transskriptions-Startpositionen aufweist [1]. Mit Hilfe der hier erarbeiteten Verfahren sollte eine genauere Vorhersage von Transskriptions-Startpositionen möglich sein als mit herkömmlichen Peak-Calling Methoden allein.

Die Implementierung soll für die ChIP-Seq Analyseplatform qips [3] in Python und C++ erfolgen.

Literatur

[1] Barski et al., High-Resolution Profiling of Histone Methylations in the Human (2007) Genome. Cell 129 (4), 823-837

[2] Zhang et al., Model-based Analysis of ChIP-Seq (MACS) (2008) Genome Biol. 9 (9), R137

[3] Gogol-Döring and Chen, Finding Optimal Sets of Enriched Regions in ChIP-Seq Data (2010) Proceedings of German Conference on Bioinformatics (GCB 2010), Vol. P-173 of Lecture Notes in Informatics (LNI), pp. 113-121
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback