presentation dess ebi

Post on 04-Jun-2015

780 Views

Category:

Travel

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Funded by:

Rendre les standards de description de biopuces accessibles:

réalisation d'un module de conversion inter-standard

Pierre Marguerite – DESS Bioinformatique Lille

EBI – Microarray Informatics Team

4 mai– 31 octobre 2004

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team2

Sommaire

• L’Institut Européen de Bioinformatique

• l’équipe informatique Microarray

• La standardisation des données de biopuces?

• Le projet•Les standards de description d’agencement•Contribution

•Bilan

Heidelberg

HinxtonUK

Monterotondo

Hamburg

Grenoble

Service Research Training Industry

European Molecular Biology Laboratory

EBI

Services Banques de données

Recherche en bioinformatique et en biologie moleculaire

IndustriePromouvoir des standards

Formation

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team4

Heidelberg

HinxtonUK

Monterotondo

Hamburg

Grenoble

Service Research Training Industry

European Molecular Biology Laboratory

EBI

Services Banques de données

Recherche en bioinformatique et en biologie moleculaire

IndustriePromouvoir des standards

Formation

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team6

l’équipe Microarray MicroArray Informatics Team

• les résultats d’expériences de biopuces

• Une petite équipe : 26 développeurs, annotateurs, doctorants

• Un projet ArrayExpress – Banque de données publique de données de biopuces

– Déclinaison en toxicogénomique et nutrigénomique

• MGED– Standardisation des données de biopuces

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team7

ArrayExpress

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team8

l’équipe Microarray MicroArray Informatics Team

• les expériences de biopuces -> petite équipe : 26 développeurs, annotateurs

• Un projet ArrayExpress – Banque de données publique de données de

biopuces– Déclinaison en toxicogénomique et nutrigénomique

• Le consortium MGED– Standardisation des données de biopuces

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team9

la standardisation ?• Hétérogénéité des applications et des techniques• Des éléments non pris en compte

=> expériences non comparables

• Nombreux formats de données– Même données -> beaucoup de manipulation

• Différents termes -> pour la même signification

• Le même terme -> des concepts différents

MAGE

Ontologie MGED

Recommandations MIAME

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team10

Le projet

• Un constat : de plus en plus de données à traiter et un manque d’outils

• Outil de conversion des fichiers de description d’agencement

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team11

Outil de conversion

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team12

Les descriptions d’agencement• Informations initiales avant une expérience

– méta données (contacts, un numéro de version, …)– Feature: position sur une lame de biopuces, définie par

ses coordonnées– Reporter: élément déposé sur une feature, qui a

certaines caractéristiques,– Composites: séquences composites entre les « reporter

» vers une entité biologique. • 2 formats:

– MAGE-ML :XML– ADF (Array Design File) : fichiers tabulaires

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team13

MAGE-ML (MAGE-OM)

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team14

MAGE-ML (suite)

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team15

Array Design File

adh

adr

adc

Header

contacts

Informations techniques

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team16

Array Design File

adr

adc

Feature /Reporter

FeaturesReporters

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team17

Array Design File

Composite

CaractéristiquesLiens avec les reporters

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team18

Contribution• Application

– indépendante (pas de DB)

– Multi plateforme

• En 2 étapes:– Validation

– conversion

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team19

Validation (une étape obligatoire)

• Analyse syntaxique et lexicale des données– Définition de règles de validation – Utilisation de fichiers XML pour décrire les

structures des fichiers de données (ADF)

Vérification des termes de la ontologie MGEDVérification des banques de données approuvées

Rapport d’erreurs pour correction (standardisation des données)

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team20

Implémentation - choix techniques

-Utilisation de MAGE-stk (perl ou Java)-Simplicité d’installation-Multi plateforme

- Multiples formats de sortie

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team21

Problèmes rencontrés• Mémoire

– Beaucoup de données– Et leur redondance

• Flexibilité– Acceptation et correction d’éléments incorrects– Nouvelles versions des formats de descriptions– Support minimum pour futurs applications des

biopuces

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team22

Une adresse : http://www.ebi.ac.uk/adf

http://www.ebi.ac.uk/adf/

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team23

Bilan• Bilan pour l’équipe

– Premier outil de vérification complète des données de description

– Soulager le travail des annotateurs en déplaçant la validation des données de description à la source (biologistes ou fabricants)

• Un bilan personnel positif, mais douloureux– 6 mois en Angleterre– Gestion de projet– Nombreux contacts

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team24

top related