(0)

Script zu Teilen der Bioinformatik

E-book


Die erste Fassung dieses Skripts wurde von Matthias Brandt (Student im WS 2011/2012) erstellt. Überarbeitet und erweitert wurde es von Dr. Rainer Schmidt und Prof. Dr. Georg FĂŒllen. Im Winter 2011/2012 wurde das Script von Melina Schellhorn (zu KĂŒrzesten Wegen, Maximum Likelihood und Single Nucleotide Polymorphismen) erweitert.

Das Skript ist angelehnt an die Vorlesung zur Bioinformatik von Prof. FĂŒllen, die ein Teil der gemeinsam mit Prof. Kundt gehaltenen Vorlesung „Epidemiologie, Medizinische Biometrie und Medizinische Informatik“ ist.

Der erste Teil der Vorlesung basiert teilweise auf dem Buch „Algorithmen und Datenstrukturen - Eine EinfĂŒhrung mit Java“ von Saake/Sattler und auf Materialien von R. König aus Heidelberg (mit freundlicher Genehmigung).

Der vierte Teil des Skripts „Biomarker-Finden mit R“ basiert teilweise auf dem Buch „Applied Statistics for Bioinformatics using R“ von Wim P.Krijnen. In diesem Teil erfolgt auch eine EinfĂŒhrung in die Programmiersprache „R“, mit der nicht nur viele Rechnungen im Bereich der Bioinformatik durchgefĂŒhrt werden, sondern auch die typischen statistischen Untersuchungen fĂŒr medizinische Promotionen im Bereich Biostatistik/Biometrie möglich sind.

Auf den folgenden Seiten soll es um die Bioinformatik gehen. Angelehnt an die Vorlesung haben wir uns mit den Folien (siehe: http://www.ibima.med.uni-rostock.de/IBIMA/ unter „Teaching1“) auseinandergesetzt und versucht, jeweils zu erklĂ€ren, worum es geht. Somit sollte es mit diesem Script möglich sein, den hier behandelten Teil der Vorlesung eigenstĂ€ndig nachzuvollziehen. Doch vorweg erst einmal die Antwort auf die zwei wichtigsten Fragen zu diesem Thema:

Was ist Bioinformatik?

Bioinformatik ist ein Teilbereich der Informatik, welcher mit Hilfe von Programmen Probleme und Fragestellungen der Biologie und Medizin zu lösen versucht.

Was geht mich das an?

Im Rahmen heutiger Fragestellungen, bei denen es nicht mehr nur darum geht, ob z. B. ein Medikament wirkt oder nicht, sondern auch danach gefragt wird, wo es wirkt (Rezeptoren, Carrier, 
) und wie genau es dort angreift, kommt man an der Visualisierung und Berechnung derartiger ZusammenhĂ€nge einfach nicht mehr vorbei. In vielen FĂ€llen sind die Datenmengen, die mit modernen GerĂ€ten gewonnen werden, so groß, dass sie ohne vorherige Sortierung und Organisierung gar nicht greifbar (und somit auswertbar) sind. Jede Information ist immer nur soviel wert wie der Zusammenhang, in den sie gesetzt wird.

Genau hier greift die Bioinformatik an und versucht mit Hilfe von Berechnungen Ordnung ins Chaos zu bringen. Dass uns dies noch nicht tÀglich in der Klinik begegnen wird ist klar. Wenn es jedoch darum geht, Forschung zu betreiben oder zu verstehen, woher die Daten von Genanalysen stammen und was damit gemacht werden kann, ist es recht hilfreich, einen Einblick bekommen zu haben.

In diesem Sinne hoffen wir, dass wir all jenen weiterhelfen können, die Probleme mit dem Themengebiet haben!

Beschrieben werden hier die Inhalte der 1.Vorlesung sowie des 1. Seminars, und die Themen ‚Maximum Likelihood Phylogenie’, ‚Blast’ und ‚SNPs’.

Am Ende der Kapitel befinden sich Übungsaufgaben. Hierbei handelt es sich um Multiple-Choice-Aufgaben, bei denen jeweils nur eine Antwort richtig ist. Die Lösungen zu den Übungsaufgaben befinden sich im Anhang.

Der Inhalt wurde grundsĂ€tzlich auf Korrektheit geprĂŒft. Es kann jedoch hier und da Fehler geben, genauso wie in den Folien zur Vorlesung. Wir bitten um Hinweise.

FĂŒr die 3. Auflage wurde Kapitel 5 zur Informationsverarbeitung neu eingefĂŒgt.

Prof. Georg FĂŒllen: fuellen@uni-rostock.de

Dr. Rainer Schmidt: rainer.schmidt@uni-rostock.de