![Page 1: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/1.jpg)
Introduction générale àGalaxy
1
![Page 2: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/2.jpg)
Qu’est ce que Galaxy?• Galaxy est une application WEB pour l’analyse de
données centrée autour d’applications en biologie
• Galaxy offre un terrain d’entente entre biologistes et bioinformaticiens!
2
![Page 3: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/3.jpg)
Pourquoi Galaxy?• “The Galaxy Project: Online bioinformatics analysis for ALMOST everyone”• Permet d’éviter le dogme : bioinformatique = ligne de commande• Se concentrer sur la question biologique et l’analyse et pas sur la syntaxe et l’installation des outils
• Permet de chaîner des outils pour créer des workflows• Permet de suivre et d’archiver toutes analyses • Reproductibilité accrue• Partage facilité
3
![Page 4: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/4.jpg)
Connexion à Galaxy-bilille
• Une machine virtuelle hébergée à la DSI de l’université de Lille• Un espace personnel pour chaque utilisateur•https://thor.univ-lille.fr/dashboard/
4
![Page 5: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/5.jpg)
OUTILS ECRAN PRINCIPAL HISTORIQUE
BANDEAU SUPERIEUR
5
![Page 6: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/6.jpg)
AIDE DE L’OUTIL
OUTILS
PARAMETRAGE DE L’OUTILChargement des données
En cliquant vous ouvrez la catégorie
En cliquant vous ouvrez
l’outil
HISTORIQUE
Options de l’historique
BANDEAU SUPERIEUR
6
![Page 7: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/7.jpg)
TéléchargementInformations
(emplacement, dates, outils)
Rechargement de l’outil
Outils de visualisation
Visualisation du dataset sur écran
principal
Edition des attributs du
datasets Suppression (archivage)
Annotations/Tags
Pré-visualisation
Datasets
7
![Page 8: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/8.jpg)
En file d’attente
En cours d’exécution
Fini avec succès
Fini en erreur
Statuts des datasets
8
![Page 9: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/9.jpg)
Notion de format
• Format tabulé
Séparateur TABULATION
Similaire à Excel
9
![Page 10: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/10.jpg)
Notion de format
• Format Interval
Régions génomiques
Colonne 1 : numéro de chromosomeColonne 2 : position de débutColonne 3 : position de fin…
• Format BED
Régions génomiques
Colonne 1-3 : identique au format IntervalColonne 4 : NomColonne 5 : ScoreColonne 6 : sens
10
![Page 11: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/11.jpg)
Notion de format
• Autres formats :• Fastq, FASTA… : données génomiques• SAM/BAM : données d’alignements• HTML : visualisation
11
![Page 12: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/12.jpg)
Les outils
• Des outils « génériques »• manipulation de fichiers texte, tableur...
• Des outils standard de bioinformatique• outils de DNA-seq, RNA-seq, ChiP-seq, identification de variants,
métagénomique...
12
![Page 13: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/13.jpg)
Les workflows
• Automatisation d’analyses répétitives
• Permet de standardiser des pipelines d’analyses
• Facilité de partage
• Facilité de reproductibilité13
![Page 14: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/14.jpg)
Pourquoi utiliser l’instance Galaxy-bilille
• Outils et workflows spécifiques déployés
• Plus d’espace disque et (surtout) de puissance que sur une station personnelle
• Support rapide et personnalisé
14
![Page 15: Introduction générale à Galaxy - Université de Lille · 2019. 3. 21. · Qu’est ce que Galaxy? •Galaxy est une application WEB pour l’analyse de données centrée autour](https://reader033.vdocuments.pub/reader033/viewer/2022053118/609dc71595dfcc3add3c1c39/html5/thumbnails/15.jpg)
Utilisation pérenne de l’instance Galaxy-bilille• Attention à la mémoire disque!
• Soyez patient
• Attention au chargement de données de trop grande taille (> 2Gb)
15