Séquençage Haut Débit, outil incontournable de
biologie moléculaire
Audrey Gros, AHUService de Biologie des Tumeurs - CHU [email protected] Toulouse, 13 Mai 2016
Du Sanger au NGS
l’ère du séquençage industriel!
1999Séquençage par
électrophorèse capillaire
1999Séquençage par
électrophorèse capillaire
2009Séquençage de
nouvelle génération
2009Séquençage de
nouvelle génération
1977Séquençage
Sanger
1977Séquençage
Sanger
Principes généraux du NGS
Le NGS ou séquençage nouvelle génération
ADN : Whole Genome, Whole Exome ou cibléARN : RNAseq (expression, transcrits de fusion, découverte de nouveaux transcrits…)
Process général du NGS
Principes généraux du NGS
vs
Génome ou ciblé?
Limites du génome entier:ü Coûtü Taille des données généréesü Analyse complexe des données
But de l’enrichissement ciblé: à Séquencer majoritairement
une/des régions d’intérêt ü Diminution du coût (pooling de
plusieurs ADN)ü Analyse simplifiée
ADN génomique Régions
d’intérêt
Amplicon z A1 P1
Amplicon x A1 P1
A1 Amplicon y P1
Amplicon z A1 P1
Amplicon x A1 P1
A1 Amplicon y P1 Patient 2
Librairie
Stratégie de fabrication de la Librairie:
Capture Amplicon
Hybridation de l’ADN à des sondes couvrant la région cible, lavage de l’ADN non hybridé
Amplification des régions d’intérêt par PCR
Amplicon z A1 P1
Amplicon x A1 P1
A1 Amplicon y P1
Exemple: Librairie par Capture par hybridation en solution
ü Préparation de la librairie de l’ADN génomique (fragmentation, ligationd’adaptateurs…)
ü Hybridation des librairies 24-48h à 65°C avec les sondes ARN complémentaires biotinylées
ü Récupération des hybrides avec les billes magnétiques/streptavidine
ü Lavage et dégradation des sondes ARN (RNase)
Librairie
A1
Librairie par Amplicon
Amplicon BRAFAmplicon BRAF
Amplicon EGFRAmplicon EGFR
Amplification PCRAmplification PCR
Ligation des adaptateurs et barcodes
Ligation des adaptateurs et barcodes
Digestion des amorcesDigestion des amorces
Préparation d’1 ou plusieurs pools d’amorces
Amplicon BRAF
Amplicon EGFR A1 P1
A1 Amplicon KRAS P1
Librairie
Barcodes= petite séquence de 6 ou 8 bases permettant de multiplexer plusieurs échantillons lors du séquençage
Amorce F
P1
EGFRAmorce RAmorce R
Amplification
Stratégie d’amplification
Emulsion Support solide
Amplification
Stratégie d’amplification
ü Emulsion: Mélange huile/eauü 1 fragment d’ADN et une bille capturés dans une goutte (si condition optimale)ü PCR en émulsion: amplification clonale du fragment d’ADN qui se fixe sur la bille
dans un microréacteur PCRü Obtention d'amplicons à la surface des billes
Emulsion
Librairie billes
PCREmulsion
Amplification
Stratégie d’amplification
ü Sélection des billes avec ADN par le complexe biotine/streptavidine
Amplification
Stratégie d’amplification Support solide
Librairie 1Cluster 1 Cluster 2
Flow Cell: support en verre et lieu de l’amplification clonale (formation des clusters) et du séquençageCluster: 1000 fragments de librairies
Librairie 2
Screenshot d’une puce chargée
Incorporation d’un NT= détection d’un H+Modification de pH proportionnelle au nb de NT ajouté
Séquençage
Détection de protons
Séquenceur HiseqScreenshot d’une flowcell
Incorporation d’un NT= détection d’un photon
NT terminateur de chaîne réversible marqué par un fluorochrome
Séquençage
Détection de photons
Émission fluo
Technologies actuelles
Petit génome, Séquençage ciblé
Exome
ApplicationApplication
PGMPGM
ProtonProton
MiSeqMiSeq
NextSeqNextSeq
HiSeq3000 et 4000
HiSeq3000 et 4000
IonS5 et S5XL
IonS5 et S5XL HiSeqXHiSeqX
MiniseqMiniseq
Analyse Bioinformatique
fastQ
Analyse Bioinformatique
SAM
Analyse Bioinformatique
SAM
Analyse Bioinformatique
Détection des variants
Fichier VCF
BAMvisualisation des alignements via un viewer
Analyse Bioinformatique
Résultat: exemple d’un fichier VCF annoté
Reporte les variations nucléotidiques détectées par rapport au génome de référenceàmutations et polymorphismes
Chr Ref.NM Gene exon c.(Mutalyzer)p.(Mutalyzer) Var.freq. Var.Cov. Pos.Cov. Region Type Sensitivity Start_Position Ref.seq Var.seq COSMICchr4 NM_000142 FGFR3 9 c.1173G>T p.(=) 2 2 84 exonic synonymous not found 1806154 G T NAchr4 NM_000142 FGFR3 14 99 164 165 exonic synonymous not found 1807894 G A NAchr4 NM_006206 PDGFRA 12 c.1701A>G p.(=) 100 583 583 exonic synonymous not found 55141055 A G ID=COSM1430082;OCCURENCE=1(large_intestine)chr4 NM_000222 KIT 100 954 954 intronic NA not found 55599436 T C NAchr7 NM_005228 EGFR 19 c.2235_2249delp.(Glu746_Ala750del) 76 1115 1466 exonic nonframeshift sensible 55242465 GGAATTAAGAGAAGC - ID=COSM6223;OCCURENCE=894(lung),2(thyroid),3(upper_aerodigestive_tract),1(oesophagus),2(ovary),4(salivary_gland)chr7 NM_005228 EGFR 20 c.2361G>A p.(=) 18 338 1913 exonic synonymous not found 55249063 G A ID=COSM1451600;OCCURENCE=1(large_intestine),1(breast)chr7 NM_001127500 MET 2 c.534C>T p.(=) 60 689 1140 exonic synonymous not found 116339672 C T ID=COSM1579024;OCCURENCE=1(lung)chr7 NM_001127500 MET 24 133 543 intronic NA not found 116421963 TAAAT ATAAAAC NAchr7 NM_001127500 MET 74 401 543 intronic NA not found 116421967 T C NAchr10 NM_000141 FGFR2 100 318 318 intronic NA not found 123279745 C T NA
Analyse Bioinformatique
Quelques définitions
Reads= lectures= séquences Exemple: ATCGGGTTACCAACCGAAT
Alignement des reads (=mots) sur la séquence de référence (=phrase)
Analyse Bioinformatique
Profondeur-Couverture:
Couverture
Profondeur
Couverture: zone couverte par au moins une lecture, exprimée en %
Profondeur: nombre de lecture de chaque base, exprimée en X
Quelques définitions
Analyse Bioinformatique
Qualités:
Qualité exprimée en QPhred
QPhred= probabilité p d’erreur de mauvaise identification de la base
QPhred=-10log10p
Exemple:
Q20 correspond à une probabilité d’erreur de 1%
Q30 correspond à une probabilité d’erreur de 0.1%
Quelques définitions
Pourquoi le NGS en oncologie?
• Mutations somatiques à faible pourcentage
• Possibilité de quantifier les mutations
• Grand nombre de patients: multiplexage à l’aide de barcodes
• Exhaustivité : plus d’exons, gènes entiers à Thérapie ciblée
• Économie du matériel biologique : qq ng d’ADN pour un grand nombre de gènes ü Intérêt matériel exigu, biopsie
• Analyse moléculaire sur biopsie liquideü Alternative de matériel tumoral (matériel épuisé, mauvaise qualité ADN méta osseuse,
prélèvement non réalisable)
Pourquoi le NGS en oncologie? Cibles thérapeutiques dans le CBNPC
Pratique au Service de Biologie des Tumeurs
Liste des cibles actionnables tumeurs solides: panel custom selon recommandation INCA
Du prélèvement au Compte-Rendu biologique
• Extraction de l’ADN (FFPE, congélation ou plasma)
• Analyse moléculaire par NGS: synthèse librairie, amplification clonale et séquençage
• Interprétation de l’analyse:ü Vérification des témoins, vérification de l’absence de contaminationü Analyse des ADN patient (+/- technique complémentaire)
• Réalisation du Compte-Rendu biologique
Gene Start_Positionexon c. p. Var.freq.PIK3CA 178952085 21 c.3140A>G p.(His1047Arg) 25EGFR 55241707 18 c.2155G>A p.(Gly719Ser) 16,65EGFR 55242465 19 c.2235_2249delp.(Glu746_Ala750del) 6EGFR 55249071 20 c.2369C>T p.(Thr790Met) 6EGFR 55259515 21 c.2573T>G p.(Leu858Arg) 6EGFR 55259524 21 c.2582T>A p.(Leu861Gln) 6BRAF 140453136 15 c.1799T>A p.(Val600Glu) 34KRAS 25378562 4 c.436G>A p.(Ala146Thr) 8KRAS 25398281 2 c.38G>A p.(Gly13Asp) 8KRAS 25398284 2 c.35G>A p.(Gly12Asp) 8ERBB2 37881082 20 c.2411G>A p.(Gly804Asp) 8
Interprétation de l’analyse• Etude de la profondeur
• Analyse des mutations observées
Compte-Rendu biologiqueConclusion : Selon les recommandations en vigueur, seules les mutations pouvant avoir un impact thérapeutique sont mentionnées ci-dessous :
Absence de détection de mutation des exons 11,15 du gène BRAF, dans la limite du prélèvement analysé et des techniques utilisées.
Mise en évidence de la mutation c.2236_2250del;p.LGlu746_Ala750del (L747_E749del) dans l’exon 19 du gène EGFR ainsi que la mutation c.2369C>T;p.Thr790Met (T790M) dans l’exon 20 du gène EGFR.L'association de ces deux mutations a été décrite résistante ou de moindre sensibilité aux inhibiteurs classiques de l’activité tyrosine kinase de l’EGFR mais pouvant répondre à certains inhibiteurs de tyrosine kinase de nouvelle génération.
Absence de détection de mutation des exons 18,21 du gène EGFR, dans la limite du prélèvement analysé et des techniques utilisées.
Absence de détection de mutation de l'exon 20 du gène ERBB2, dans la limite du prélèvement analysé et des techniques utilisées.
Absence de détection de mutation des exons 2,3,4 du gène KRAS, dans la limite du prélèvement analysé et des techniques utilisées.
Absence de détection de mutation des exons 10,21 du gène PIK3CA, dans la limite du prélèvement analysé et des techniques utilisées.
Les essais cliniques en cours sont consultables sur le site <http://www.e-cancer.fr/Professionnels-de-sante/Les-therapies-ciblees/Essais-cliniques-et-therapies-ciblees>.
Arrivée de la 3ème génération…
Ce qui change:ü Le Principeü La Quantité et la Qualité des donnéesü Les Longueurs de Lectures (en kb)
Ce qui change:ü Le Principeü La Quantité et la Qualité des donnéesü Les Longueurs de Lectures (en kb)
Avantages d’une longueur de reads de l’ordre du kb:Information sur les variants structuraux et meilleur assemblage de novo mais taux d’erreur élevé ~15%
ü Polymérase fixée dans un puit très étroitü Fond du puit éclairé par un laserü NT modifié avec marqueur fluorescent (4 différents) fixé sur le Phosphateü Détection de la fluorescence quand incorporation par la polymérase par
clivage de la chaîne Phosphate
àpolymérisation= succession de pics d'émission de fluorescence de différentes couleurs GGATCAG, reconstruction de la séquence de la molécule matrice
Arrivée de la 3ème génération…
Single Molecule, Real-Time (SMRT®) DNA Sequencing Technology
Laser
Sequel System
Arrivée de la 3ème génération…
MinION
ü Nanopore protéique (~ protéine transmembranaire) couplé à une exonucléaseü Pores à travers une bicouche lipidique à laquelle on applique un champ électriqueü Exonucléase détache successivement les basesü NT détachés attirés par le champ électrique et traversent un à un le nanopore protéique ü Résistance électrique à travers le nanopore varie de façon différente si A, C, G ou T
àreconstitution de la séquence de la molécule initiale
PromethION
=512 nanopores
=48x3000 nanopores
Perspectives
ØNouvelles perspectives en oncologie:
• Détection de mutations sur biopsie liquide, « Monitoring »Suivi moléculaire et personnalisé par l’analyse de gènes ou de panels de marqueurs moléculaires de la réponse au traitement, de la résistance, de la progression et de la rechute
• Caractérisation moléculaire des entités anatomopathologiquesWES, WGSRNAseq
A quand la fin du séquençage ciblé…?
Equipe du Service de Biologie des Tumeurs CHU BORDEAUX - Pr JP Merlio