Le test de Jonckheere pour la construction d’algorithme de
résistance dans le VIH
Philippe Flandre
INSERM U 720
CHU Pitié-Salpêtrière
La résistance dans le VIH
• Patients sous traitement• Génotypique
– Gènes env, gag, et pol– Gène pol
• Transcriptase inverse• Intégrase• Protéase virale
• Phénotypique– Définir la sensibilité ou résistance à tel ou tel
molécule
Les traitements
• Inhibiteurs de la Transcriptase Inverse – Nucléosidiques et nucléotidiques (INTI)
• AZT, ABC, DDI, 3TC, FTC, D4T, TDF
– Non nucléosidiques (INNTI)• EFV, NVP, TMC 125
• Inhibiteurs de la Protéase (IP)– IDV, ATZ, FosAPV, DRV, NFV, LPV, SQV, TPV– RTV
• Trithérapie– 2 INTIs + 1 IP – 2 INTIs + 1 INNTI
La réponse aux traitements
• Depuis 1996 et les trithérapies
réduction de la mortalité
• Réponse en terme de charge virale– Baisse de la charge virale (continue)
• Ex: 50 000 copies 500 copies réduction 2 log10
– Baisse > 1 log10 (discret)
– Charge virale < 50 copies/ml (discret)
Les données génotypiques
• Inhibiteurs de la Transcriptase Inverse (INTI)– Liste de 240 positions – La réponse virologique
Ident K30 I31 K32 A33 L34 V35 E36 I37 C38 T39 E40 M41 Y
1 K V K A L V E I C T E M -1.451
2 K I K A L V E I C K F L -0.382
3 K I K A L V E I C K V L -1.372
4 K I Q A L L E I C A E L -0.145
• Inhibiteurs de la Protéase– Liste de 99 positions
ANRS
• Groupe AC 11
• Relation géno-réponse virologique
• Mise à jour régulière des algorithmes– Communication et publications– Propres études du groupe – Études autres
Algorithmes (règles de décision)
• AZT– présence de la T215Y/F– présence d’au moins trois mutations parmi
M41L, D67N, K70R, L210W, 215A/C/D/E/G/H/I/L/N/S/V, K219Q/E
– présence de la Q151M– insertion au codon 69
Analyse statistique
• Procédure en 2 étapes– Relation entre chaque position et la réponse
• Test Wilcoxon p<0.20• Fréquence de la mutation > 5% on retient N mutations
– Recherche de la meilleur combinaison de mutations
• De N on sélectionne K mutations• Test non-paramétrique de Jonckheere
Test de Jonckheere (1954)
• Test à hypothèse alternative spécifiée• Comparaison de K groupes
• On observe Xij i=1,…,k j=1,…,ni • Statistique de Mann-Witney count• Mi,i’ = nombre de pairs telles que
• Le test J
Test de Jonckheere
• Rejet de H0 quand J est grand
• Statistique distribuée normalement
• Grand échantillon
Procédure statistique
• 1ère étape : sélection de N mutations• Recherche la combinaison de K mutations• Procédure descendante
– Score de N mutations N+1 groupes Test pN
– Combinaisons de N-1 mutations pN-1,i < pN
– Même chose avec N-2 mutations– ….– Arrêt quand p ne diminue plus
Procédure statistique
• Procédure ascendante – De 1 mutation jusqu’à K mutations
• Score = somme de mutations– Mutations de résistance +1 (présente) sinon 0– Patient avec 3 mutations score géno = +3
• Mutations impactant positivement la réponse– Mutations -1 (présente) sinon 0– Patient avec 5 mutations score = +1
Essai JAGUAR
• Patients en échec > 1000 copies/mL• Randomisation
– Addition ddI (INTI)– Addition placebo de ddI
• Réponse virologique à S4• Critère baisse de charge virale entre J0 et
S4
Analyse de Jaguar
• Supériorité du bras ddI
• Analyse génotypique– 1ère étape : 10 mutations sont retenues
• 8 mutations de résistance (M41L, D67N, T69D, L74V, V118I, L210W, T215Y/F, K219Q/E)
• 2 mutations se sensibilité (K70R,M184V/I)
Analyse de Jaguar• Étape 0 : Somme des 10 mutations Z = 41 + 67 + 69 – 70 + 74 + 118 – 184 + 210 + 215 + 219 [-2 ; +8]
JT Test, p10
• Étape 1 : 10 combinaisons de 9 mutations – sans 41 JT test, p9,1
– sans 67 JT test, p9,2 – sans 69 JT test, p9,3 – …..
La combinaison produisant plus petite valeur de p est retenue si < p10, la mutation en position 118 est éliminé
• Étape 2 : 9 combinaisons de 8 mutations – sans 118 et 41 p8,1
– sans 118 et 69 p8,2
– …. La combinaison produisant plus petite valeur de p est retenue si <
p9,6, la mutation en position 118 est éliminé
• Arrêt quand p ne diminue plus.
Score IM41L + T69D + L74V + L210W + T215YF + K219QE
Mutations (n) 0 1 2 3 4 5 6
Patients (n) 31 15 19 25 9 1 1
De
cre
as
e i
n H
IV-1
pla
sm
a R
NA
(lo
g10
co
pie
s/m
l)
P=1.2 10-7
Score IIM41L + T69D – K70R + L74V – M184VI + T215YF + K219QE
Genotypic score II -2 -1 0 1 2 3
Patients (n) 8 30 16 30 12 6
De
cre
as
e i
n H
IV-1
pla
sm
a R
NA
(lo
g10
co
pie
s/m
l)
P=4.5 10-9
Discussion des résultats
• Clinicien : quelle est la valeur prédictive de ce score ?
• Analyse non paramétrique pas de mesure de prédiction type R²
Développement d’une mesure de ‘prédiction’
• Test non paramétrique borné– Borne supérieure
J=33
Zj=3.16
Groupe 1 Groupe 2 Groupe 3
-1.50 -0.89 -0.3
-1.25 -0.78 -0.25
-0.98 -0.5 -0.22
-0.45
Mesures d’association
• Mesure Gamma (Goodman et Kruskal)
• 2 variables U et V
• Question ‘Est-ce que U a tendance à augmenter si V augmente’
Interprétation de Gamma
V1 V2 … Vk-1 Vk
U1 n11 n12 n1k-1 n1k
U2 n21 n22 n2k-1 n2k
…
U k-1 nk-11 nk-12 nk-1k-1 nk-1k
Uk nk-11 nk2 nk k-1 nkk
Tableau U x V
Interprétation de Gamma
V1 V2 … Vk-1 Vk
U1 N--ij N-+
ij
U2
………………………………………
U k-1 N+-ij N++
ijUk
Vj
Ui
Tableau U x V
Estimation de Gamma
La mesure Gamma est
P représente 2 fois le nombre de pairs concordantesQ représente 2 fois le nombre de pairs discordantes
Conclusion
• Méthode simple• Test et mesure d’association• Pas de poids pour les mutations• Estimation des poids par bootstrap• Validation externe de ces algorithmes• Le modèle linéaire
– Colinéarité entre les mutations très forte– Effectif faible– Structure du modèle
Les autres méthodes
• Le ‘super learner’• Comparaison de plusieurs méthodes
– Régression Logic– Régression des moindres carrés– Least Angle regression– Deletion/substitution/addition algorithme– Arbres de décision– Régression biaisée (Ridge regression)– ….
• Critère : fonction de cross validation (R², MSE)