industrialisation d'un logiciel pour la prédiction de structures secondaires d'arn non...

18
Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie CHAUDRU Master Génie Biologique et Informatique, première année Gabriel CHANDESRIS

Upload: leonide-raffin

Post on 03-Apr-2015

103 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

Industrialisation d'un logiciel pour la

prédiction de structures secondaires

d'ARN non codants

Maitre de stage : Fariza TAHI

Tuteur universitaire : Valérie CHAUDRU

Master Génie Biologique et Informatique, première année

Gabriel CHANDESRIS

Page 2: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

2

Qu’est ce que

l’industrialisation d’un logiciel ?

Mise à disposition (ici via le web).

• Utilisable sur des jeux de données importants.

Examinable : documentation, tests. Extensible, modifiable : architecture du logiciel.

Page 3: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

3

Contexte Biologique

Structure => Fonction

Structure

secondaire

Structure

tertiaire

Page 4: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

4

Prédiction des

structures secondaires d’ARN Connaître les structures

Techniques expérimentales lourdes (RMN, cristallographie…).

Méthodes informatiques : plus rapides, moins chères.

Méthodes in silico complètent méthodes expérimentales.

Différentes approches :

Approche thermodynamique.

Approche comparative.

Nombreux algorithmes existants :

complexité élevée et/ou manque d’efficacité

Page 5: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

5

TFold / P-DCFold

Page 6: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

6

Mon travail sur le logiciel

Etude et formalisation de l'existant : TFold et P-DCFold Diagrammes UML (classes et cas d'utilisation)

Modifications de P-DCFold. Documentation, tests. Développement de l’interface.

Page 7: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

7

Formalisation de TFold

(cas d’utilisation UML)

*

Page 8: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

8

Etude et modification du

code de P-DCFold

Formalisation

Modification

Documentation et tests

Page 9: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

9

Interface graphique : existant

Page 10: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

10

Interface graphique : web

QuickTime™ et undécompresseur TIFF (LZW)

sont requis pour visionner cette image.

SSCA : Sequence Selection for the Comparative Approach

Page 11: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

11

Interface graphique : web

QuickTime™ et undécompresseur TIFF (LZW)

sont requis pour visionner cette image.

Pseudoknots, Divide and Conquer Fold

Page 12: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

12

Conclusion

Compétence en biologie

Comprendre le modèle utilisé, contexte biologique.

Adapter le modèle : contraintes.

Compétence informatique

Conceptualisation et formalisation objet (UML, classes,

cas d’utilisations…).

Programmation java : modèle, interface, contrôle.

Tests de développement et de fonctionnement (JUnit) .

Page 13: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

13

Perspectives

Export de l'application / importation des données

(soucis de confidentialité).

Amélioration de l’ergonomie de l’interface,

Documentation technique (à destination des

utilisateurs).

Tester massivement avec des données publiques (et

résultats connus).

Extension de TFold pour la recherche des petits ARN.

Page 14: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

14

Page 15: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

15

Intérêt de TFold / P-DCFold

Prédiction de structure secondaire des ARN Construit sur l'approche comparative.

Utilisation de critères thermodynamiques.

But du stage : améliorer et rendre accessible Interface web

Documentation

-----

-----

Page 16: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

16

De l'ARN à la structure secondaire

Que fait le logiciel TFold / P-DCFold ?

Structure

secondaire

Structure

tertiaire

Page 17: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

17

Comment cela fonctionne (++)

Page 18: Industrialisation d'un logiciel pour la prédiction de structures secondaires d'ARN non codants Maitre de stage : Fariza TAHI Tuteur universitaire : Valérie

18

Les algorithmes (++)

« Valeur Ajoutée » : fonctionnement logiciel,

Adaptation des abstractions : Vecteurs (non typés) et

Listes / Ensembles d'instances,

Correction des représentations (simplification),

Résultat : interface, systèmes de tests, recherche de

dysfonctionnements

Documentation et tests : extension à venir.