bioml & friends george gentsch, lukas stingelin. 5. juni 2002 seminar xml-technologien/bioml...
TRANSCRIPT
BIOML & Friends
George Gentsch, Lukas Stingelin
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
2
BIOML & Friends Übersicht
Allgemeine Einführung in BIOML Biologischer Kontext Implementation biologischer Sachverhalte Struktur und Elemente von BIOML Einführungbeispiele Beispiele aus einer „annotated“ Datenbank Spezieller BIOML Browser und Editor Evtl. „Friends“ von BIOML
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
3
Kurzbeschreibung: BIOML erlaubt alle experimentellen Informationen über eine molekulare Einheit bestehend aus Biopolymeren wie zum Beispiel Proteine und Gene zu spezifizieren und darzustellen.
BIOML- Biopolymer Markup
Language
Working Draft Proposal (kein W3C Working Draft): 10.01.1999 (erste Version) von
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
4
BIOML - Was sind die Ziele? BIOML soll...
ein erweiterbares „Framework“ für die Darstellung von Biopolymeren wie zum Beispiel Proteine und Gene liefern.
ein brauchbares Werkzeug für Biologen und andere Naturwissenschaftler liefern, um Informationen zu biopolymeren Sequenzen über das World Wide Web oder ein Intranet auszutauschen.
die entsprechende Darstellung vereinheitlichen, also einen (firmeninternen) Standard liefern.
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
5
BIOML - Entwicklungskriterien BIOML Dokument soll eine zuverlässige Repräsentation
des Gen-Protein-Konzepts sein. Alle bekannten experimentellen Daten über dieses
Objekt sollen logisch, zu einem biologisch bedeutungsvollen und aussagekräftigen Gebilde zusammengefügt werden.
Das Dokument soll für den Forscher übersichtlich sein. Information soll gebündelt und hierarchisch in eine
Baum-Blatt-Struktur eingepasst werden. Dokument soll leicht erweiterbar, transferierbar und
implementierbar sein. Es soll Konversionen von anderen Daten zu BIOML und
vice versa unterstützen.
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
6
BIOML – „Inhaltsverzeichnis“ Welche Typen von Informationen müssen mit der
biopolymeren Sequenz im BIOML Dokument abgelegt sein, damit die Information nützlich (für die biologische Forschung) ist?
Strukturinformation: Crosslinks Zusammensetzung Notizen zu Modifikationen und Aberrationen
Assoziierte Information (Funktion, Pathologie usw.) Allgemeine Information (Autor, Datum etc.) Literaturreferenzen (u.a. Webadressen) Vergleich mit anderen Daten aus Datenbanken „Key“ Attribute (für Datenbanken)
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
7
BIOML – Biologischer Kontext
Proteine Vom Gen zum Protein Tags, Visualisierung im Browser,
DTD
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
8
Proteine
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
9
Proteine Kontrolle der Stoffwechselvorgänge Zellmaschinerie Strukturelemente Linearer Aufbau mit Querverbindungen
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
10
Vom Gen zum Protein
Transkription (Compile) Translation (Run)
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
11
Transkription 4 verschiedene Zeichen/Basen (ACTG) auf DNA Proteine aus 20 verschiedenen Aminosäuren
aufgebaut
agccctccaggacaggctgcatca
agc cct cca gga cag gct gca tca
Codons StopStart20 Aminosäuren
Abfolge der Codons = Abfolge der Aminosäuren
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
12
Translation
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
13
Translation
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
14
Translation
Aneinanderreihung der Aminosäuren
3D Struktur Proprotein - Protein Domänen, Strukturen
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
15
Tags
<dna>
<promotor>
<gene>
<exon>
<intron>
<ddomain>
<da>
<dmod>
<dvariant>
<dstart>
<dstop>
<rna>
<rdomain>
<ra>
<rmod>
<rvariant>
<rstart>
<rstop>
<protein>
<subunit>
<homolog>
<peptide>
<domain>
<aa>
<amod>
<alink>
<avariant>
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
16
Erweiterbarkeit
domain type (Protein) aa type (Aminosäure)
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
17
BIOML – Allgemeine Elemente (1)
Elemente zum allgemeinen Zweck meistens Blätter in der Baumstruktur z.B. <name>, <note>, <comment>, <copyright>
usw. Organismus definierende Elemente
umschliessen Tags der biopolymeren Sequenzen z.B <organism>, <species>, <common_name> usw.
Ortsdefinierende Elemente z.B <tissue>, <cell>, <organelle> usw.
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
18
BIOML – Allgemeine Elemente (2) Literaturreferenzen
Tag <reference> Blätter von <reference>: <author>, <title>, <journal>,
<pages> usw. Sie haben nur eine Bedeutung, wenn sie von <reference>...</reference> umschlossen sind.
...<reference>
<author>Arber W.</author><title>restriction enzymes</title><journal>Nature</journal><pages>13</pages>...
</reference> ...
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
19
BIOML – Allgemeine Elemente (3) Datenbankreferenzen
Tag <db_entry/> (immer leeres Element) Attribute: format, query, entry Beispiel:
...<reference>
<db_entry format="EMBL“ entry="L03655"/></reference> ...
...<reference>
<db_entry format="GENBANK" query="http://www2.ncbi.nlm.nih.gov/irx/cgi-bin/ birx_doc?genbank+444001"/>
</reference> ...
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
20
BIOML – Allgemeine Elemente (4) URL-basierte Resourcen
Element <file/> mit Attribute: format, query Element <query/> mit Attribute: format, query (CGI) Beide Elemente sind immer leer.
...<file URL="http://www.proteome.com/YPD/STE20.html" format="HTML"/>...
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
21
BIOML – Globale Attribute & Entitäten
Einige Attribute können in alle Elemente implementiert werden:
label Bezeichner für ein bestimmtes Element (Browser
braucht ihn als Platzhalter) state
„hide“, „open“ oder „close“. Information für Browser, wie das entsprechende Element dargestellt werden soll.
id Identifikationsnummer für Katalogisierungszweck
Entitäten - global zur Verfügung stehende Mnemonics: Å: &angstrom; usw.
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
22
„Friends“ von BIOML
MoDL
SBML
CellMLStarDOM
GeneXMLMAGE-ML
GAME
BSML
MSAML
PROXIML
GEML
MAMLChemML
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
23
„Friends“ von BIOML•MoDL: Molecular Dynamics [Markup] Language•SBML: Systems Biology Markup Language•CellML: Cell Markup Language•StarDOM: Transforming Scientific Data into XML•GeneXML: GeneX Gene Expression Markup Language•MAGE-ML: MicroArray and Gene Expression Markup Language•GAME: Genome Annotation Markup Elements•BSML: Bioinformatic Sequence Markup Language •MSAML: XML for Multiple Sequence Alignments•PROXIML: Protein Extensible Markup Language•GEML: Gene Expression Markup Language•MAML: Microarray Markup Language•ChemML: Chemical Markup Language
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
24
BSML – Bioinformatic Sequence Markup Language
~ BIOML Standardisierung
Graphische Darstellung von Sequenzen und spezielle Ausprägungen
Zugriff auf fremde Ressourcen Durchmusterung von Genabschnitten mit Hilfe des
BSML-Browsers
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
25
CellML – Cell Markup Language Speicherung und Austausch von computerbasierten
biologischen Modellen. Unterstützung verschiedener Modell bildenden
Programme Möglichkeit der Wiederverwendung von Komponenten
eines Modells in anderen Modellen > Beschleunigung der Modellbildung
Information zur Modellstruktur, wie die einzelnen Komponenten untereinander organisiert sind.
Information zur Mathematik (Gleichungen für biologische Prozesse) > MathML implementiert
Zusätzliche Daten für Suche von spezischen Modellen in Datenbanken
5. Juni 2002 Seminar XML-Technologien/BIOML & Friends
26
BIOML & Friends - Links BIOML
Homepage http://www.bioml.com/BIOML/index.html WDP http://www.bioml.com/BIOML/b_toc.htm DTD http://www.bioml.com/BIOML/bioml.dtd BioBrowser v1.3 http://www.proteometrics.com/gsc_BioML.
html#browser Übersicht http://xml.coverpages.org/bioml.html XML in Bioinformatik http://bio.perls.org/Projects/XML/
Friends Übersicht von OASIS http://xml.coverpages.org/
<kürzel>.html Praktisch jede Auszeichnungssprache hat ihre Homepage.
Z.B. http://www.bsml.org, http://www.cellml.org.