organisation du génome humain notions essentielles...
Post on 12-Sep-2018
216 Views
Preview:
TRANSCRIPT
Biologie Moléculaire et Médecine; Kaplan et Delpech ; Flammarion« How to sequence a genome » (film): www.genome.gov/250 19885Human Genome Project: http://www.genome.gov/HGP/
Organisation du Génome humainNotions essentielles
Analyses génomiques en pathologie humaineProblématiques des études moléculaires en génétique h umaine
Biologie Moléculaire et Médecine; Kaplan et Delpech ; FlammarionHuman Genome Variation Society: www.hgvs.orgNomenclature mutationnelle: www.hgvs.org/mutnomenAnalyse de variants faux-sens: http://genetics.bwh. harvard.edu/pph/Analyse de l’effet de variants de séquence sur l’ép issage: www.umd.be/HSF/Bases de données:
Bases de données « locus-spécifiques »� Listing disponible site HGVS
www.hgvs.org/dblist/glsdb.html
Bases de données « centrales/globales »� Human Gene Mutation Database www.hgmd.org� SNP database www.ncbi.nlm.nih.gov/SNP/� UCSC Genome Browser genome.ucsc.edu� Ensembl www.ensembl.org
Dr. Martin Krahnmartin.krahn@ap-hm.frDépartement de Génétique MédicaleHôpital Timone EnfantsINSERM UMR 910 - Faculté de MédecineUniversité de la MéditerranéeMarseille
Organisation du Génome humainNotions essentielles
Martin Krahn
martin.krahn@ap-hm.frDépartement de Génétique Médicale
Hôpital Timone EnfantsINSERM UMR 910 - Faculté de Médecine
Université de la MéditerranéeMarseille
Organisation du Génome humainNotions essentielles
Quelques rappels historiques
Séquençage du Génome humain
Organisation du Génome humain
M. KRAHN M2 2009
Génome
= ensemble du matériel génétique d'une espèce (ADN)
≠ ensemble des gènes !!!
!
M. KRAHN M2 2009
Pourquoi cartographier le génome ?
� Clonage positionnel : identification de gènes par exploration du génome suivant un balisage de marqueurs
� Médecine:pour localiser les loci morbides, associés à des maladies héréditaires, voire pour appréhender les maladies multifactorielles
� Depuis les premières cartes, plus de 2500 gènes impliqués dans des syndromes héréditaires ont été identifiés (OMIM, sept.2009)
Cette phase est suivie d’exploration thérapeutique(voir site essais cliniques AFM)
� Agronomie:pour localiser et cloner les gènes d’intérêt ou les zones du génome impliquées dans des traits intéressants et les transférer entre espèces…
�Bond des biotechnologies végétales, clonage, OGM…M. KRAHN M2 2009
Histoire
• De l’Antiquité au 19e siècle : transmission de caractères parents-enfants selon diverses théories: préformisme, animalculisme, patroclinisme, ovisme, épigénisme…
• 1865: G. Mendel jette les bases de la génétique moderne, allèles, dominance, hétérozygotie…
• 1910: T. Morgan découvre la recombinaison méiotique et publie ses résultats qui sont les bases de la théorie chromosomique de l’hérédité
• 1913: première carte génétique
M. KRAHN M2 2009
Histoire
• 1953: J. Watson, F. Crick et R. Franklin décryptent des clichés de diffraction et publient la structure en double hélice de l’ADN
• 1965: J. Monod, F. Jacob et A. Lwoff « découvrent » les ARN et la régulation de l’expression génique
• 1973: moratoire sur le clonage et le génie génétique
M. KRAHN M2 2009
Histoire
• Années 1980 : découverte des marqueurs polymorphiques, des techniques de RFLP, des microsatellites, grands progrès du génie génétique. Cartographie intensive
• 1983: découverte de la PCR. Les cartes s’enrichissent de toutes ces techniques
• 1989: un programme mondial de séquençage du génome humain se met en place : HUGO
• 1992-1996: publication des premières cartes du génome humain par le Généthon
M. KRAHN M2 2009
Histoire
• 2000: premiers résultats de thérapie génique sur l’homme (Fischer)
• 2001: premier assemblage de la séquence du génome humain (Science 291, Nature 409)
• 2003: finition de l’assemblage de notre séquence génomique
CELERA
HUGO-HGP
M. KRAHN M2 2009
HUGO – Human Genome Project
• Plus grand projet scientifique mondial lancé en 1988 /1989 HGP démarre en 1990
• Ampleur de la tâche– 1 page = 3000 bases– 1 tome: 500 pages = 1 500 000 bases– 1 génome = 1 000 tomes !!!
• Capacité de séquençage– En 1975, 1 000 nucléotides/semaine ���� 500 ans pour 100 personnes !– En 1986, 10 000 nucléotides/jour ���� 8 ans pour 100 machines– En 1998, 200 000 nucléotides/jour ���� 5 mois pour 100 machines
• Stratégie du Human Genome Projectvs Stratégie de CELERA Genomics
M. KRAHN M2 2009
HGP / CeleraHUGO - HGP CELERA
M. KRAHN M2 2009
Séquence finale
• CELERA: Seuls 2 ADN ont servi de matrice (dont celui de C. Venter). Celera a intégré les données publiques dans sa base au fur et à mesure de leur publication
• HGP: profondeur de séquence: 10X (10 équivalents génomiques séquençés) à partir de près d'une vingtaine d'individus différents
• Travail de "finition" poursuivi jusqu'en avril 2003
• Précision finale: 99.99 % = 1 erreur toutes les 10 000 bases environ
• Coût global: environ 2.7 milliards $
• Parties manquantes: hétérochromatine, télomères et centromèresM. KRAHN M2 2009
Coûts de séquençage
M. KRAHN M2 2009
Organisation du génome humain
1/3 2/3
<3% code des protéines
>50% séquences répétéesM. KRAHN M2 2009
Le génome humain
• Le génome humain est composé de 3 272 millions de nucléotides
• Les régions riches en gènes sont également les régions riches en nucléotides G/C
• Les régions pauvres en gènes sont riches en A/T
Ces différentes régions peuvent généralement être visuali séescomme des bandes claires ou sombres sur les chromosomes métaphasiques (" banding ")Bandes G: riches en AT, pauvres en gènesBandes R: riches en GC, riches en gènes
• Le chromosome 1 contient le plus grand nombre de gèn esestimés (environ 3000) tandis que le chromosome Y en a le moins (231)
• Moins de 3% de l’ADN code pour des protéines
• Les séquences répétées composent environ 50% de la to talité dugénome
M. KRAHN M2 2009
Le génome humain
• Le nombre total de gènes se situe entre 25 000 et 30 000
• La taille moyenne d’un gène est de 3000 bases, 9 exons, mais la taille varie beaucoup
(ex : le gène de la dystrophine a une taille de 2,4 mill ions bp)
• 99.9% des nucléotides sont identiques entre deux personne s. Il existe donc 0,1% de différences (soit environ 3,5 mill ions de
différences par génome)
• Plus de 50% des gènes ont une fonction inconnue
M. KRAHN M2 2009
Organisation du GénomeVitesse de réassociation du génome
On dénature l'ADN par chauffage
On mesure la vitesse de réhybridation
L'ADN d'E. coli se réhybride suivant une courbe sigmoïde simple
���� quand un fragment d'ADN trouve son fragment complémentaire, les séquences adjacentes se réhybrident rapidement de façon coopérative , comme une fermeture éclair
M. KRAHN M2 2009
Vitesse de réassociation du génome
% de réhybridation
0
25
50
75
100
Vitesse de réassociation
10-1 1 101 10210-2
Rapide Lente
E. ColiH. Sapiens
1
3
2
M. KRAHN M2 2009
Le génome est hétérogène
• Zones fortement répétitives���� 10 à 15% du génome, non codées en protéinesCentromères, Télomères, Mégasatellites, Minisatéllites, Microsatellites
• Zones moyennement répétitives���� 20 à 40 % du génome, non codées en protéines Transposons, séquences SINE (Alu) et LINE, Rétrovirus endogènesQuelques gènes codant des rRNA, tRNA, RNA5S et 7SL
• Séquences uniques���� ~50% du génome, contiennent la plupart des gènes codant pour des protéines (ARNm)
M. KRAHN M2 2009
Les zones répétitives
Les minisatellites ou VNTR (Variable Numbers of Tandem Repeats): - séquences de 11 à 16 pb- répétées parfois jusqu'à 1000 fois- Localisations surtout télomériques (ou centromériqu es) - peu utilisés en pratique
Les microsatellites - séquences de 1 à 4 pb- souvent (CA) n, n variant de 12 à 40. - répartition homogène sur tout le génome, tous les 25 à 100 kb- très variables donc informatifs- facilement amplifiés par PCR - utilisation pour les analyses de liaison- utilisation en diagnostic moléculaire (« indirect ») et pour les empreintes génétiques
M. KRAHN M2 2009
Marqueurs génétiques
• Les MARQUEURS génétiques:Variations polymorphes de la séquence d’ADN
- répartis uniformément sur le génome- localisation connue- PAS d’effet direct sur le phénotype
• Microsatellites (utilisés ++) :Polymorphismes de répétitionExple: répétitions de motif « CA »- séquences répétées NON codantes- réparties uniformément dans le génome- polymorphes = à un même endroit du génome, des indi vidus
pris au hasard (pop.gén.) présentent un nombre différent de répétitions sur chaque chrom osome
…ATCGTCTCACACACACACACACATGTCGTAT…
…ATCGTCTCACACACACACACACACACACACATGTCGTAT…
8 répétitions CA
12 répétitions CA
Exemple: chromosome 4
ADNMarqueur
Gène
M. KRAHN M2 2009
Et maintenant ?
M. KRAHN M2 2009
Et maintenant ?
M. KRAHN M2 2009
Et maintenant ?
M. KRAHN M2 2009
Et maintenant ?
Clonage positionnel révolu – gènes localisés
Agronomie dopée – OGM par analyse QTL
Catalogue des gènes: GenAtlas, OMIM, Genome Browser, bases de
données de SNP, de miARN…
Séquençage en masse d'autres organismes
���� Cartes de synténie inter-espèces, évolution
Séquençage personnalisé possible
Nouvelles technologies mêlant bioinformatique, robo tique et
nanobiologie…
Thérapie génique, pharmacologique ou cellulaire uti lisant les
données acquises…
M. KRAHN M2 2009
Analyses génomiques en pathologie humaine
M. KRAHN M2 2009
Anomalies du Génome et Pathologie humaine
MACROLESIONS MICROLESIONS
Echelle du Chromosome Echelle du Gène
?
M. KRAHN M2 2009
Anomalies du Génome et Pathologie humaine
MACROLESIONS MICROLESIONS
� Délétions
� Duplications
� Amplifications
� Translocations
� Inversions
� Insertions
(...)
Echelle du Chromosome Echelle du Gène
� Mutations ponctuelles
� Insertions/délétions
de qques nucléotides
� Insertions/délétions
de qques 10aines ou 100aines de nt
� Mutations dynamiques/amplifications
(...)
Maladies génétiques: anomalies génétiques causalesMaladies polyfactorielles: prédisposition génétique
M. KRAHN M2 2009
Anomalies du Génome et Pathologie humaine
MACROLESIONS MICROLESIONS
Echelle du Chromosome Echelle du Gène
METHODES D’ANALYSE
?
M. KRAHN M2 2009
Anomalies du Génome et Pathologie humaine
MACROLESIONS MICROLESIONS
Echelle du Chromosome Echelle du Gène
METHODES D’ANALYSECARYOTYPE
FISH
CGH
SEQUENCAGE
CRIBLAGE MUTATIONNEL
M. KRAHN M2 2009
Rappel: Mutations « classiques »
Mutations en séquence non codante:
perturbations d‘éléments régulateurs
mutations perturbant l‘épissage
CAAT5´ 3´
Région 5´UTR
Exon Intron
TATA ATG
Région 3´UTR
TAATAGTGA
AATAAA
Mutations en séquence codante:
faux sens
non sens
insertions/délétions
décalage du cadre de lecture
mutations perturbant l‘épissage
=> perte/gain de fonction
GT AGSite donneur Site accepteur
M. KRAHN M2 2009
Problématiques des études moléculaires en génétique humaine
• Stratégies de Diagnostic génétique
• Problèmes d’interprétation de données mutationnelle s
• Perspectives de criblage mutationnel à haut débit
M. KRAHN M2 2009
Les avancées méthodologiques qui ontrévolutionné la génétique moléculaire
1970: Endonucléases de restriction1972-1973: Ligases1975: Séquençage (Sanger&Coulon, Maxam&Gilbert, Hood )1985: PCR (Karry Mullis)1998: Puces à ADN (“microarrays”)Années 1990 à aujourd’hui: Développement +++ de nouvel les techniques
Les applications/progrès réalisées grâce aux technique s de Biologie moléculaire:• Meilleure connaissance des mécanismes physiopathologiq ues des maladies:
- Identification et études fonctionnelles de gènes impl iqués dans des maladies humaines, création et analyse de modèles anim aux, séquençage du génome humain,,…
• Généralisation des applications diagnostiques en routine hospitalièreM. KRAHN M2 2009
ADN
GénomeARN
Transcriptome
Protéines
Protéome
Transcription Traduction
Reverse Transcription
Réplication
Analyses génétiques/ Biologie moléculaire Biochimie
Principes des Études Moléculaires en Génétique Humaine
M. KRAHN M2 2009
ADN
GénomeARN
Transcriptome
Protéines
Protéome
Analyses génétiques/ Biologie moléculaire Biochimie
En principe identiquepour toutes les cellules d’un individu
Spécifiques d’un tissud’un type cellulaired’un état
Principes des Études Moléculaires en Génétique Humaine
M. KRAHN M2 2009
ADN
GénomeARN
Transcriptome
Protéines
Protéome
En principe identiquepour toutes les cellules d’un individu
Spécifiques d’un tissud’un type cellulaired’un état
Prélèvement de « base »en Génétique= prélèvement sanguinpériphérique
Extraction d’ADN génomique à partir de LYMPHOCYTES du sang
Analyses en Génétique moléculaire:Directes ou Indirectes
Autres prélèvements:•Tissus embryonnaires/fœtaux(villosités choriales, liquide amniotique,…) pour DPN• Autres tissus : analyses complémentaires dans certaines pathologies (surtout analyses d’expression du ARNm)
ATTENTION:Toujours avec CONSENTEMENT de l’individu
Principes des Études Moléculaires en Génétique Humaine
M. KRAHN M2 2009
Notions essentielles
• Stratégies de Diagnostic génétique- Diagnostic direct vs indirect- Précriblage mutationnel
• Problèmes d’interprétation de données mutationnelle s- Bases de données mutationnelles- Variants « nouveaux » => recueil d’arguments de pathogén icité- Outils bioinformatiques ++
• Perspectives de criblage mutationnel à haut débit
M. KRAHN M2 2009
Stratégie diagnostique dans les maladies génétiques
CONSULTATION DIAGNOSTIQUE:Interrogatoire et examen clinique Histoire de la maladie
Arbre généalogique/mode de transmissionExamen clinique cibléExamen clinique général
EXAMENS COMPLEMENTAIRES:
Analyses biologiques selon le contexte
Imagerie
Examens ciblés selon orientation
� DIAGNOSTIC CLINIQUE
M. KRAHN M2 2009
Stratégie diagnostique dans les maladies génétiques
CONSULTATION DIAGNOSTIQUE:Interrogatoire et examen clinique Histoire de la maladie
Arbre généalogique/mode de transmissionExamen clinique cibléExamen clinique général
EXAMENS COMPLEMENTAIRES:
Analyses biologiques selon le contexte
Imagerie
Examens ciblés selon orientation
� DIAGNOSTIC CLINIQUE ⇒⇒⇒⇒ DIAGNOSTIC GENETIQUE
ANALYSES GENETIQUES:
Génétique moléculaire:Diagnostic direct: Recherche de l’anomalie génétiqu e primaireDiagnostic indirect: Analyses de liaison
Cytogénétique:Caryotype
constitutionnel standardFISH,… (Cf cours)
M. KRAHN M2 2009
Diagnostic moléculairedes maladies génétiques
� Objectif : établir un diagnostic précis par l’identification de l’anomalie génétique
� Intérêt : certitude diagnostiqueprise en charge adaptée
conseil génétique
� 2 approches :
DIAGNOSTIC DIRECT: Recherche de l’anomalie génétique primaire
� identification de Mutations constitutionnelles délétères
DIAGNOSTIC INDIRECT: Analyses de liaison
� Utilisation de marqueurs pour analyser la coségrégation d’un
phénotype avec un allèle particulier dans une famille
M. KRAHN M2 2009
ADN du patient en faible quantité
Région d’intérêtPCR Région d’intérêt
AMPLIFIEE en grande quantité
Analyse de la TAILLE� Applications diverses� Analyse de Microsatellites
ANALYSEde la région d’intérêt
Analyse de la SEQUENCE� Recherche de MUTATIONS
dans la région d’intérêt
Gène de 3 exons
Exon 1
Exon 2
Exon 3
Rappel: le rôle central de la PCR
M. KRAHN M2 2009
Séquençage complet
Mutation ponctuelle
Exon 1
Exon 2
Exon 3Gène de 3 exons
PRECRIBLAGE puis Séquençage ciblé
Mutation ponctuelle
Exon 1
Exon 2
Exon 3
Profil NORMAL
Profil NORMAL
Profil ANORMAL
- Différentes technologies: SSCP, DHPLC, HRM,…- Intérêt: détecter les exons porteurs d’une variati on de séquence
=> réduction du temps d’analyse et des coûts
M. KRAHN M2 2009
Diagnostic direct et Diagnostic indirect
Patient atteintPhénotype: diagnostic cliniqueOu suspicion diagnostique
Analyses en Génétique moléculaireDIAGNOSTIC DIRECT
Forw.
CAACANNNNNNNNNNNNN
Identification de mutation(s) dans le gène impliqué
Patient atteintPhénotype: diagnostic clinique(certitude diagnostique nécessaire)
Analyses en Génétique moléculaireDIAGNOSTIC INDIRECT
105 113
105 115
113 115
105 115
Coségrégation familiale phénotype/marqueurM. KRAHN M2 2009
Utilisation de marqueurs pour analyser la coségrégation marqueur/maladie
• on connaît la localisation du gène morbide• on connaît des marqueurs localisés à proximité• étude de la Coségrégation familiale phénotype/marqueur
Diagnostic indirect
Patient atteintAvec Diagnostic clinique CERTAIN
Analyses en Génétique moléculaireDIAGNOSTIC INDIRECT
Coségrégation familiale phénotype/marqueur
105 113
105 115
113 115
105 115
Gène morbide
Marqueur
Permet de suivre INDIRECTEMENT la transmission d’une mutation
M. KRAHN M2 2009
Utilisation de marqueurs pour analyser la coségrégation marqueur/maladie
• on connaît la localisation du gène morbide• on connaît des marqueurs localisés à proximité• étude de la Coségrégation familiale phénotype/marqueur
Diagnostic indirect
Gène morbide
Marqueur
Permet de suivre INDIRECTEMENT la transmission d’une mutation
� Approche utilisée quand diagnostic direct non faisa ble, trop difficile…� Principaux problèmes posés:
- nécessite de connaître le gène impliqué (ou le locu s) pour choisir les marqueurs à utiliser
(problème posé si hétérogénéité génétique)- nécessite une certitude du diagnostic clinique- nécessite une étude FAMILIALE- nécessite une famille « informative »: parfois non c oncluant- risque d’erreur par recombinaisonM. KRAHN M2 2009
Diagnostic moléculaire indirectPrincipes
105 113
105 115
113 115
105 115
Étude de microsatellites.Exemple: étude familiale, maladie autosomique domin ante
Gène morbide
Marqueur
M. KRAHN M2 2009
Diagnostic moléculaire indirectPrincipes
105 113
105 115
105 115
Gène morbide
Étude de la Coségrégation familiale phénotype/marqueur
Phénotype atteintAllèles 105 et 113
Phénotype sainAllèles 105 et 115
Phénotype sainAllèles 105 et 115Phénotype atteint
Allèles 113 et 115
113 115L’enfant atteint a reçu l’allèle 113 de son père:Il y a COSEGREGATION entre le PHENOTYPE « atteint » et l’allèle 113 paternel L’allèle 113, d’origine paternelle est lié à l’allèle muté du gène en cause
Marqueur
NB: Diagnostic indirect nécessite- Certitude du diagnostic clinique- Étude familiale
Étude de microsatellites.Exemple: étude familiale, maladie autosomique domin ante
M. KRAHN M2 2009
Diagnostic moléculaire indirectPrincipes
105 113
105 115
113 115
105 115
Gène morbide
Étude de la Coségrégation familiale phénotype/marqueur
Phénotype atteintAllèles 105 et 113
Phénotype sainAllèles 105 et 115
Mutation dansle gène impliqué*
Allèle 105 Allèle 113
Phénotype atteintAllèles 113 et 115*
Allèle 105 Allèle 113Phénotype sainAllèles 105 et 115
Allèle 105 Allèle 115
Allèle 115Allèle 105
Marqueur
L’enfant atteint a reçu l’allèle 113 de son père:Il y a COSEGREGATION entre le PHENOTYPE « atteint » et l’allèle 113 paternel L’allèle 113, d’origine paternelle est lié à l’allèle muté du gène en cause
Étude de microsatellites.Exemple: étude familiale, maladie autosomique domin ante
Chez le père, l’allèle 113 du marqueurest sur le même chromosomeque la mutation impliquée dans la maladie
Lorsque le père transmet le chromosome avec la mutation, il transmet AUSSI l’allèle 113⇒ Permet de suivre indirectement
la transmission de la mutation
M. KRAHN M2 2009
Diagnostic direct
DIAGNOSTIC DIRECT: Recherche de l’anomalie génétique primaire
� identification de mutations constitutionnelles délé tères
� approche utilisée de préférence, permet un diagnost ic de certitude
� principaux problèmes posés:
- parfois lourd sur le plan technique
- parfois non concluant
- polymorphismes ou mutations constitutionnelles dél étères?
Patient atteintPhénotype: diagnostic cliniqueOu suspicion diagnostique
Analyses en Génétique moléculaireDIAGNOSTIC DIRECT
Forw.
CAACANNNNNNNNNNNNN
Identification de mutation dans le gène impliqué
M. KRAHN M2 2009
Diagnostic moléculaire directStratégie
Patient atteintPhénotype: diagnostic cliniqueOu suspicion diagnostique
Gène impliqué de GRANDE TAILLE+/- Spectre mutationnel large
Séquençage ciblédes exons présentant des profils anormaux
Précriblage mutationnel
Séquençage complet trop lourd et trop coûteux
Séquençage complet de la totalitéde la séquence codante d’intérêt(tous les exons codants)
Gène impliqué de PETITE TAILLEet/ou mutations récurrentes
• techniques permettant d’identifier les exons présentant des variations de séquence• mais SANS préciser quelle est la variation de séquence• ORIENTATION
� Identification de variations de séquenceMutation ponctuelle
Profil ANORMAL
M. KRAHN M2 2009
Diagnostic moléculaire directExemple: gène de petite taille
• Gène de la cavéoline-3 (CAV3) : localisé en 3p25
séquence codante de 456 paires de bases (2 exons)
ARNm d’ expression musculaire
Protéine impliquée dans la réparation de la membran e musculaire (?)• Mutations CAV3 :
dystrophie musculaire des ceintures autosomique dom inante
M. KRAHN M2 2009
Diagnostic moléculaire directExemple: gène de petite taille
• Gène de la cavéoline-3 (CAV3) : localisé en 3p25
séquence codante de 456 paires de bases (2 exons)
ARNm d’ expression musculaire
Protéine impliquée dans la réparation de la membran e musculaire (?)• Mutations CAV3 :
dystrophie musculaire des ceintures autosomique dom inante
• Gène de petite taille: analyse « facile » par séquença ge direct
PatientContrôle
For.For. c.298A>T hétérozygotep.Ile100Phe
Confirmation du diagnosticpar IDENTIFICATION directe de la mutation
M. KRAHN M2 2009
Diagnostic moléculaire directExemple: gène de grande taille
• Gène de la dysferline (DYSF) : localisé en 2p13.3-13.1
séquence codante de 6243 paires de bases (55 exons)
ARNm d’ expression musculaire (et autres tissus)
Protéine impliquée dans la réparation de la membran e musculaire (?)• Mutations DYSF :
dystrophie musculaire des ceintures autosomique récessive> 400 mutations différentes rapportées
réparties sur toute la longueur du gène= « Spectre mutationnel large »
• Gène de grande taille +/- spectre mutationnel large:Analyse par séquençage complet techniquement trop l ourd
et trop coûteux: NON faisableUtilisation de techniques de PREcriblage mutationnel
M. KRAHN M2 2009
Diagnostic moléculaire directExemple: gène de grande taille
Patient IVS 6
c.946-1G>A
Patient Exon 17
c.1979A>G
Profil hétéroduplex évident
Profil hétéroduplex difficilement mis en évidence
dHPLC
dHPLC
Séquençage
Séquençage
M. KRAHN M2 2009
Diagnostic moléculaire direct
Identification de variations de séquence
� Comparaison à séquence de référence
- UCSC Genome Browser genome.ucsc.edu
- Ensembl www.ensembl.org
� Description précise du variant : NOMENCLATURE HGVS
www.hgvs.org/mutnomenNomenclature officielle Human Genome Variation Society
Mutations délétèresou
Variations de séquence non pathogènes ?
M. KRAHN M2 2009
Problématiques des études moléculaires en génétique humaine
• Stratégies de Diagnostic génétique
• Problèmes d’interprétation de données mutationnelle s
• Perspectives de criblage mutationnel à haut débit
M. KRAHN M2 2009
Diagnostic moléculaire direct
Identification de variations de séquence
� Description précise du variant : NOMENCLATURE HGVS
� Comparaison à séquence de référence:Mutation délétère… ou simple variation de la normale /polymorphisme?
2 situations:
� la variation de séquence est connue (consultation de bases de données)
� la variation de séquence N’EST PAS connue
M. KRAHN M2 2009
Diagnostic moléculaire direct
Identification de variations de séquence
� Description précise du variant : NOMENCLATURE HGVS
� Comparaison à séquence de référence:Mutation délétère… ou simple variation de la normale /polymorphisme?
2 situations:
� la variation de séquence est connue (consultation de bases de données)
- Caractère délétère confirmé au préalable chez d’aut res patients� Mutation constitutionnelle délétère
- Présence sans effets pathologiques dans la populat ion générale� Polymorphisme
� la variation de séquence N’EST PAS connue
M. KRAHN M2 2009
Diagnostic moléculaire direct
Identification de variations de séquence
� Description précise du variant : NOMENCLATURE HGVS
� Comparaison à séquence de référence:Mutation délétère… ou simple variation de la normale /polymorphisme?
2 situations:
� la variation de séquence est connue (consultation de bases de données)
- Caractère délétère confirmé au préalable chez d’aut res patients� Mutation constitutionnelle délétère
- Présence sans effets pathologiques dans la populat ion générale� Polymorphisme
� la variation de séquence N’EST PAS connue
Séance EDAnalyses mutationnelles en Génétique Humaine
M. KRAHN M2 2009
Consultation de bases de données
Mutation rapportée au préalable ?
Bases de données « locus-spécifiques »� Listing disponible site HGVS
www.hgvs.org/dblist/glsdb.html
Human Genome Variation Societywww.hgvs.org
Porte d’entrée pour les Bases de données mutationnell es
Bases de données « centrales/globales »
� Human Gene Mutation Database www.hgmd.org� SNP database www.ncbi.nlm.nih.gov/SNP/� UCSC Genome Browser genome.ucsc.edu� Ensembl www.ensembl.org
M. KRAHN M2 2009
Diagnostic moléculaire direct
Identification de variations de séquence
� Description précise du variant : NOMENCLATURE HGVS
� Comparaison à séquence de référence:Mutation délétère… ou simple variation de la normale /polymorphisme?
2 situations:
� la variation de séquence est connue (consultation de bases de données)
� la variation de séquence N’EST PAS connue
- Évaluation de différentes données pour conclure su r
le caractère pathogène ou non de la variation de sé quence
- Saisie des résultats dans les bases de données
M. KRAHN M2 2009
Diagnostic moléculaire directVariation de séquence non connue au préalable
Mutation délétère ou Polymorphisme?
?
M. KRAHN M2 2009
Diagnostic moléculaire directVariation de séquence non connue au préalable
Mutation délétère ou Polymorphisme?
� (Consultation de bases de données)
� Nature de la mutation
(non-sens, décalage cadre de lecture, épissage, fau x-sens, isosémantique,…)
� Étude de la ségrégation de la variation de séquence à l’intérieur de la fami lle
� Recherche de la variation dans une population de té moins sains- absence = en faveur du caractère délétère- présence = polymorphisme probable
� Études fonctionnelles : transcriptionnelles, protéiques,…Plus difficile, parfois plutôt domaine de la recher che
� Modélisation bio-informatique:- de l’effet sur l’épissage/l’ARNm- de la conservation du nucléotide impliqué (et AA co rrespondant)
au cours de l’évolution - de l’effet au niveau de la protéine
M. KRAHN M2 2009
Modélisation bio-informatique
Analyse de l’effet sur l’épissage/l’ARNmEpissage anormal, dégradation,..
Analyse de la conservation du nucléotide impliqué(et AA correspondant) au cours de l’évolution => Surtout pour variants faux-sens, isosémantiques e t introniques)
- Conservé= important, donc une variation est susceptible d’ê tre délétère
- Non conservé= moins important, une variation est possible sans effet majeur
Analyse de l’effet au niveau de la protéine Domaines fonctionnels, protéine tronquée,…
M. KRAHN M2 2009
Problématiques des études moléculaires en génétique humaine
• Stratégies de Diagnostic génétique
• Problèmes d’interprétation de données mutationnelle s
• Perspectives de criblage mutationnel à haut débit
M. KRAHN M2 2009
Rappel: Mutations « classiques »
Mutations en séquence non codante:
perturbations d‘éléments régulateurs
mutations perturbant l‘épissage
CAAT5´ 3´
Région 5´UTR
Exon Intron
TATA ATG
Région 3´UTR
TAATAGTGA
AATAAA
Mutations en séquence codante:
faux sens
non sens
insertions/délétions
décalage du cadre de lecture
mutations perturbant l‘épissage
=> perte/gain de fonction
GT AGSite donneur Site accepteur
M. KRAHN M2 2009
Séquençage complet
Mutation ponctuelle
Exon 1
Exon 2
Exon 3Gène de 3 exons
PRECRIBLAGE puis Séquençage ciblé
Mutation ponctuelle
Exon 1
Exon 2
Exon 3
Profil NORMAL
Profil NORMAL
Profil ANORMAL
- Différentes technologies: SSCP, DHPLC, HRM,…- Intérêt: détecter les exons porteurs d’une variati on de séquence
=> réduction du temps d’analyse et des coûts
M. KRAHN M2 2009
Suspicion d’une pathologie particulière…sans identification de mutations
Sensibilité insuffisante des techniques utilisées en routine
Quelles mutations ne sont pas détectées par les stratégies « classiques » ?
� Mutations introniques ? Mutations de régions régulatrices ?
� Mutations dans exons alternatifs ?� Réarrangements intragéniques de grande taille ?� (…)
Hétérozygotes symptomatiques, digénisme…
Exemple: Maladies autosomiques récessives
Mutations dans d’autres gènesMême voie physiopathologique ++
M. KRAHN M2 2009
Réarrangements intragéniques de grande tailleDélétions/Amplifications exoniques
Parfois détectées de manière fortuite
(détection en PCR; variants de séquence pseudo-homo zygotes;…)
Non détectables de manière systématique avec les tec hniques
« classiques » de criblage mutationnel de la séquence c odante génique
Développement récent de techniques adaptées:
- Quantitative multiplex PCR of short fluorescent fr agments(QMPSF; Casilli et al., 2002)
- Multiplex Ligand-dependant Probe Amplification(MLPA; Shouten et al., 2002)
Analyse mono-allélique
Exemple: délétion exonique
M. KRAHN M2 2009
Diagnostic moléculaire de routineMoyens actuels et Perspectives
Techniques de criblage mutationnel « efficaces »Outils bio-informatiques :
- Bases de données mutationnelles- Algorithmes d’analyse de variants de séquence
… mais sensibilité insuffisante des techniques d’anal yse
� Mutations non détectées par les techniques actuelle s de routineDéveloppement de techniques complémentaires
� Mutations dans d’autres gènes / gènes candidats� (…)
Nouvelles technologies d’analyse mutationnelle géno mique à haut débit
Exemples:� CGH Microarrays� Sequence Capture Arrays et Séquençage à haut débit
M. KRAHN M2 2009
Nouvelles technologies d’analyse mutationnelle génomique à haut débit
CGH Arrays
� ADN génomique non amplifiéPatient et contrôle
� Fragmentation aléatoire
� Marquage avec « random 9mers »- 5’-Cy3 (ADN patient)- 5’-Cy5 (ADN contrôle)
et
� Hybridation sur lame (array)
� AnalyseCapture des signaux fluorescents (Scanner)
Analyse des données (Ratio Cy3/Cy5)
ADN patient
ADN contrôle
M. KRAHN M2 2009
Nouvelles technologies d’analyse mutationnelle génomique à haut débit
CGH Arrays
2.1M
4-plex 12-plex4 x 70 K 12 x 135 K
385K
M. KRAHN M2 2009
Duplication hétérozygote exons 37+38 (+39)71684074-71693259
DYSF CGH arrays
Nimblegen-Roche
Délétion homozygote exons 2 à 40 71562000-71720000
M. KRAHN M2 2009
DYS et SGC CGH arrays
γγγγSarcoglycanLGMD2C
DystrophinDMD
Saillour et al, 2008M. KRAHN M2 2009
400000 lecturesFragments de 250-300bp500Mb de séquence/runCouverture 15x/région5Mb de séquence propre/run
Séquençage à haut débit
Nimblegen-Roche
Fragmentation
Ligation d’adaptateur
Création de microréacteurs par émulsion(billes et fragments ADN)
Séquençage et analyse
ADN génomique
PCR en émulsion
M. KRAHN M2 2009
Séquençage à haut débit5Mb de séquence interprétable / run
Sequence Capture arrays et Séquençage à haut débit
Nimblegen-Roche
Régions cible
Fragmentationet ligation d’un « linker »
Sélection/Enrichissementen séquence cible(alternative à PCR)
Hybridation
Élution de la Région d’intérêt
Lavages
Amplification
M. KRAHN M2 2009
2.1M
4-plex 12-plex4 x 70 K 12 x 135 K
1-plex1 x 2.1 M
1-plex1 x 385 K
385K
Nimblegen-Roche
Sequence Capture arrays
M. KRAHN M2 2009
Nouvelles technologies d’analyse mutationnelle génomique à haut débit
PERSPECTIVES
Criblage mutationnel à haut débit en routine� Analyses de séquence
- « Mutations classiques »Substitutions et ins/del de petite taille
- Extension de l’analyse aux régions introniqueset/ou régions régulatrices
(Epissage, 5’UTR, 3’UTR, CNGS, microRNA,…)� Anomalies génomiques quantitatives
- Réarrangements intragéniques de grande tailleDélétions/Amplifications exoniques
- Copy Number Variations
Analyse de gènes candidats et gènes modificateursÉtapes de validation par techniques complémentaires (Séq. direct, Q-PCR; RT-PCR et Q-RT-PCR, MLPA, Micro arrays d’expression,…)
(…)
M. KRAHN M2 2009
Diagnostic moléculairePERSPECTIVES
Procédure actuelle
Procédure future
Approche « gène par gène »
Approche « haut débit »
Orientation cliniqueanatomopathologique
biochimique(…)
Orientation cliniqueanatomopathologique
biochimique(…)
Un ou quelques gènesLong; 1 semaine à 1 an Coûteux
Plusieurs dizaines de gènesRapide; 72 heures à 1 semaine Réduction des coûts
M. KRAHN M2 2009
Conclusion – Notions essentielles
• Stratégies de Diagnostic génétique- Diagnostic direct vs indirect- Précriblage mutationnel
• Problèmes d’interprétation de données mutationnelle s- Bases de données mutationnelles- Variants « nouveaux » => recueil d’arguments de pathogén icité- Outils bioinformatiques ++
• Perspectives de criblage mutationnel à haut débit
M. KRAHN M2 2009
top related