presentation dess ebi

24
Funded by: Rendre les standards de description de biopuces accessibles: réalisation d'un module de conversion inter-standard Pierre Marguerite – DESS Bioinformatique Lille EBI – Microarray Informatics Team 4 mai– 31 octobre 2004

Upload: pierre-marguerite

Post on 04-Jun-2015

780 views

Category:

Travel


0 download

TRANSCRIPT

Page 1: Presentation Dess Ebi

Funded by:

Rendre les standards de description de biopuces accessibles:

réalisation d'un module de conversion inter-standard

Pierre Marguerite – DESS Bioinformatique Lille

EBI – Microarray Informatics Team

4 mai– 31 octobre 2004

Page 2: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team2

Sommaire

• L’Institut Européen de Bioinformatique

• l’équipe informatique Microarray

• La standardisation des données de biopuces?

• Le projet•Les standards de description d’agencement•Contribution

•Bilan

Page 3: Presentation Dess Ebi

Heidelberg

HinxtonUK

Monterotondo

Hamburg

Grenoble

Service Research Training Industry

European Molecular Biology Laboratory

EBI

Services Banques de données

Recherche en bioinformatique et en biologie moleculaire

IndustriePromouvoir des standards

Formation

Page 4: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team4

Page 5: Presentation Dess Ebi

Heidelberg

HinxtonUK

Monterotondo

Hamburg

Grenoble

Service Research Training Industry

European Molecular Biology Laboratory

EBI

Services Banques de données

Recherche en bioinformatique et en biologie moleculaire

IndustriePromouvoir des standards

Formation

Page 6: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team6

l’équipe Microarray MicroArray Informatics Team

• les résultats d’expériences de biopuces

• Une petite équipe : 26 développeurs, annotateurs, doctorants

• Un projet ArrayExpress – Banque de données publique de données de biopuces

– Déclinaison en toxicogénomique et nutrigénomique

• MGED– Standardisation des données de biopuces

Page 7: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team7

ArrayExpress

Page 8: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team8

l’équipe Microarray MicroArray Informatics Team

• les expériences de biopuces -> petite équipe : 26 développeurs, annotateurs

• Un projet ArrayExpress – Banque de données publique de données de

biopuces– Déclinaison en toxicogénomique et nutrigénomique

• Le consortium MGED– Standardisation des données de biopuces

Page 9: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team9

la standardisation ?• Hétérogénéité des applications et des techniques• Des éléments non pris en compte

=> expériences non comparables

• Nombreux formats de données– Même données -> beaucoup de manipulation

• Différents termes -> pour la même signification

• Le même terme -> des concepts différents

MAGE

Ontologie MGED

Recommandations MIAME

Page 10: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team10

Le projet

• Un constat : de plus en plus de données à traiter et un manque d’outils

• Outil de conversion des fichiers de description d’agencement

Page 11: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team11

Outil de conversion

Page 12: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team12

Les descriptions d’agencement• Informations initiales avant une expérience

– méta données (contacts, un numéro de version, …)– Feature: position sur une lame de biopuces, définie par

ses coordonnées– Reporter: élément déposé sur une feature, qui a

certaines caractéristiques,– Composites: séquences composites entre les « reporter

» vers une entité biologique. • 2 formats:

– MAGE-ML :XML– ADF (Array Design File) : fichiers tabulaires

Page 13: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team13

MAGE-ML (MAGE-OM)

Page 14: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team14

MAGE-ML (suite)

Page 15: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team15

Array Design File

adh

adr

adc

Header

contacts

Informations techniques

Page 16: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team16

Array Design File

adr

adc

Feature /Reporter

FeaturesReporters

Page 17: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team17

Array Design File

Composite

CaractéristiquesLiens avec les reporters

Page 18: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team18

Contribution• Application

– indépendante (pas de DB)

– Multi plateforme

• En 2 étapes:– Validation

– conversion

Page 19: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team19

Validation (une étape obligatoire)

• Analyse syntaxique et lexicale des données– Définition de règles de validation – Utilisation de fichiers XML pour décrire les

structures des fichiers de données (ADF)

Vérification des termes de la ontologie MGEDVérification des banques de données approuvées

Rapport d’erreurs pour correction (standardisation des données)

Page 20: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team20

Implémentation - choix techniques

-Utilisation de MAGE-stk (perl ou Java)-Simplicité d’installation-Multi plateforme

- Multiples formats de sortie

Page 21: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team21

Problèmes rencontrés• Mémoire

– Beaucoup de données– Et leur redondance

• Flexibilité– Acceptation et correction d’éléments incorrects– Nouvelles versions des formats de descriptions– Support minimum pour futurs applications des

biopuces

Page 22: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team22

Une adresse : http://www.ebi.ac.uk/adf

http://www.ebi.ac.uk/adf/

Page 23: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team23

Bilan• Bilan pour l’équipe

– Premier outil de vérification complète des données de description

– Soulager le travail des annotateurs en déplaçant la validation des données de description à la source (biologistes ou fabricants)

• Un bilan personnel positif, mais douloureux– 6 mois en Angleterre– Gestion de projet– Nombreux contacts

Page 24: Presentation Dess Ebi

Funded by:

04/10/2004 - DESS Bioinformatique Pierre Marguerite

Microarray Informatics Team24