présentation de geneprot nicolas jacq – cnrs datagrid laboratoire de biologie des protistes (lbp)
TRANSCRIPT
Présentation de GeneProt
Nicolas Jacq – CNRS DataGRID
Laboratoire de Biologie des Protistes (LBP)
Quelques Chiffres…
• 120 millions de $ d’investissements, levés par GeneProt en moins d’un an, dont – 10 millions de $ de Compaq– 40 millions de $ de Novartis
• 40 millions de $ du client Novartis pour l’analyse par GeneProt de 3 tissus humains en état malades et sains
• 35 millions de $ sur 4 ans de GeneProt pour l’installation, le matériel et la maintenance de son informatique par Compaq
Historique
• 03/00 : fondation de GeneProt• 09/00 : alliance avec Bruker Daltonics
– analyse par spectrométrie de masse
• 10/00 : choix de Compaq, alliance avec Novartis• 12/00 : 120 millions de $ d’investissements obtenus
au total • 02/01 : ouverture du centre (5000 m²)
– premier au monde dans la recherche et la production de protéomes à grande échelle
• 05/01 : centre opérationnel
Objectifs de GeneProt
• Obtenir des quantités massives de protéines à partir des fluides et tissus d’organismes (constitution de bases de données)
• Identifier les protéines• Déterminer les structures, fonctions et interactions
des protéines • Synthétiser des protéines
Applications dans l’industrie pharmaceutique et agro-alimentaire
Méthodologie de GeneProt
• Extraction à un temps donné – plus de 100 000 protéines / tissu ou fluide
• Séparation des protéines (chromatographie…)
• Identification et caractérisation – par spectrométrie de masse : 51 spectromètres– par comparaison avec des bases de données :
algorithmes adaptés– …
Besoins informatiques de GeneProt
• Grande capacité de stockage
• Solutions rapidement disponibles
• Intégration de systèmes hétérogènes
• Analyse des données presque en temps réel
Solution proposée par Compaq
Pour capturer, stocker et analyser les énormes volumes de données générés par GeneProt :
• 1420 processeurs Alpha en parallèle – 1 milliard de comparaisons de séquences par heure
• Système d’exploitation : Tru64 Unix• Système de stockage : StorageWorks• Base de données : Oracle
Analyse complète d’un protéome en 6 mois