|
Die Anfrage der Biologen "welche Proteine sind mit
meinem Protein verwandt" wird täglich hunderttausendfach von den
Computern weltweit bearbeitet. Daraus entstand die Idee, alle
bekannten Proteine zu vergleichen ("alle gegen alle") und damit eine
ultimative Lösung des Problems anzubieten. Mit dem Ergebnis in Form
einer Datenbank, können nicht nur Anfragen rasch und effizient
beantwortet werden, der entstandene Datensatz ist eine ideale Basis
zur Beantwortung vieler Fragen der Molekularbiologen. SIMAP ("Similarity
Matrix of Proteins") ist ein Gemeinschaftsprojekt des Lehrstuhls für
Genomorientierte Bioinformatik der Technischen Universität München und
des Instituts für Bioinformatik (MIPS/IBI) am Forschungszentrum für
Umwelt und Gesundheit (GSF) bei München. Mit SIMAP steht eine
vollständige Matrix aller bekannten Proteinverwandtschaften zur
Verfügung, die ständig aktualisiert wird.
Aktuell sind die Sequenzen von ungefähr vier
Millionen Proteinen öffentlich bekannt. Die vollständige Berechnung
der Sequenzähnlichkeiten erfordert eine enorme Rechenkapazität. Auf
einem einzelnen Computer würde die Berechnung der 16.000 Milliarden
Vergleiche etwa 80 Jahre dauern. Daher entschloss sich das Team um Dr.
Thomas Rattei, Roland Arnold und Prof. Dr. Hans-Werner Mewes, auf die
Hilfe von Freiwilligen zurückzugreifen, welche die ungenutzte
Rechenkapazität ihrer Computer zur Verfügung stellen. Diese
Technologie nennt sich Community Grid Computing, prominentestes
Beispiel ist das SETI@HOME Projekt, welches seit vielen Jahren
Radiowellen aus dem Weltraum nach Signalen außerirdischer Intelligenz
durchsucht. SIMAP@HOME ist das erste deutsche Community Grid Projekt
und hat seit Dezember 2005 rund 5000 Freiwillige mit über 10000
Computern aus mehr als 50 Ländern gewinnen können. Die momentane
Rechenkapazität liegt bereits im Leistungsbereich eines Supercomputers
mit weit mehr als 2 Teraflops, eine Leistung, die die Kapazität vieler
Rechenzentren bei weitem übertrifft.
Die vorhandene Information über Gen- und somit
Proteinsequenzen steigt durch die schnell wachsende Zahl an
Genomsequenzierprojekten rapide an. Durch die Hilfe der weltweiten
Community wird das SIMAP-Projekt in der Lage sein, auch in Zukunft mit
dieser Entwicklung Schritt zu halten und wertvolle Daten für
zahlreiche Analysen in der Genom- und Gesundheitsforschung zeitnah zu
liefern. |