dossier présenté pour l’obtention d’une habilitation à diriger des recherches par pierre...
DESCRIPTION
Université de Provence Aix-Marseille I Marseille -2011 Quelques Modèles et Méthodes pour l’Etude de la Cognition. Dossier présenté pour l’obtention d’une Habilitation à Diriger des Recherches par Pierre Courrieu Chargé de Recherche au CNRS Laboratoire de Psychologie Cognitive - UMR 6146 - PowerPoint PPT PresentationTRANSCRIPT
Université de ProvenceAix-Marseille IMarseille -2011
Quelques Modèles et Méthodes pour l’Etude de la Cognition
Dossier présenté pour l’obtention d’une
Habilitation à Diriger des Recherches
par
Pierre CourrieuChargé de Recherche au CNRS
Laboratoire de Psychologie Cognitive - UMR 6146Centre National de la Recherche Scientifique
1
Jury
Professeur Hervé Glotin (rapporteur)Docteur Jonathan Grainger (président)Docteur Ronald Peereman (rapporteur)Professeur Laurent Pezard (examinateur)Docteur Arnaud Rey (rapporteur)Docteur Simon Thorpe (examinateur)
2
Travaux présentés. Perception des lettres
Courrieu & De Falco (1989); Courrieu, Farioli, & Grainger (2004)
. Modèles de codage de donnéesCourrieu (2001, 2002)
. Modèles de codage d’imagesCourrieu (2006, 2007)
. Réseaux de neurones et apprentissage superviséCourrieu (2005)
. Méthodes de calcul des paramètres de modèlesCourrieu (1994, 1997, 2009)
. Méthodes de validation de modèles et bases de donnéesRey et al. (2009); Rey & Courrieu (2010)* Courrieu, Brand-D’Abrescia, Peereman, Spieler, & Rey (2011)
3
Publications récentes
. Dans la catégorie « modèles »:* Courrieu, P. (2011). Quick approximation of
bivariate functions. British Journal of Mathematical and Statistical Psychology, in press.
. Dans la catégorie « méthodes »:Courrieu, P., & Rey, A. (2011). Missing data
imputation and corrected statistics for large-scale behavioral databases. Behavior Research Methods, 43, 310-330.
4
Courrieu, Brand-d’Abrescia, Peereman, Spieler, & Rey (2011)
Validated intraclass correlation statistics to test item performance models
Behavior Research Methods, 43(1), 37-55
. Critères usuels de sélection de modèles (AIC, BIC, Bayes Factor)= Sélectionner un ‘gagnant’ parmi des modèles concurrents
Mais cela ne dit pas si un modèle rend convenablement compte des observations.
. Variance des données = part systématique + part aléatoire
Part systématique = part de variance dont les modèles peuvent rendre compte
5
6
Quelle est la part de variance reproductible dans le vecteur M des moyennes par item ?
Sujet 1 Sujet 2 … Sujet nMoyenn
espar item
Item 1 X(1,1) X(1, 2) … X(1, n) M(1)
Item 2 X(2, 1) X(2, 2) … X(2, n) M(2)
… … … … … …
Item m X(m, 1) X(m, 2) … X(m, n) M(m)
. Si la mesure expérimentale X peut se décomposer en:
X(i,j) = (j) (i) (i,j), 1≤i≤m, 1≤j≤n,
= moyenne générale
= effet sujet = effet item = effet aléatoire
le vecteur M (moyennes par item) contient une part de variance reproductible égale au coefficient de corrélation intraclasse (ICC):
= nq / (nq + 1),avec:
q = Var()/Var().
. Estimation de l’ICC, avec i.c., par analyse de la variance.
. Le test ECVT (Courrieu et al., 2011) permet de savoir si une base de données quelconque est conforme à ce modèle. 7
8La conformité au modèle a été vérifiée pour plusieurs bases de
données (Rey et al., 2009; Rey & Courrieu, 2010; Courrieu et al., 2011)
9
Soit B une variable prédictive exacte, à une transformation linéaire près, c’est-à-dire telle que:
B = a + b, avec a ≠ 0,
Alors on peut montrer que:
r2(M,B) , où est l’ICC des données.
Par ailleurs:
si r2 < (significativement): sous-ajustement = modèle insuffisant
si r2 > (significativement): sur-ajustement = le modèle ajuste du bruit des données (car il utilise trop de paramètres libres).
10Intersection du carré de corrélation avec l’intervalle de confiance (99%) de l’ICC au voisinage du modèle exact
(comp. 20)
11Fréquence de détection des sous-ajustements et sur-ajustements en fonction de l’écart au modèle exact
(complexité 20).
12
Courrieu (2011) - Quick approximation of bivariate functions. British J. Mathematical & Statistical Psychology,
in press
. Apprentissage de fonctions booléennes ou continues= acquisition d’une expertise
. Mais nous savons aussi estimer des fonctions rapidement et sans aucun apprentissage spécifique
= « degré zéro » de l’expertise
Comment procédons-nous?
13
Exemple: quelle sera la température à Montélimar ?
14
Présentation d’un problème (Expérience 1)
15Problèmes et réponses moyennes (± 2.2) de 16 sujets
16
Performances prédictives de 11 modèles(pour l’ensemble des 16 problèmes)
Model r2 AIC BIC
Bayes Factor(≥3.2:
substantial)
Nearest Neighbor
Lipschitz Interpolator
Gaussian RBFN
Phi NN (Courrieu, 2005)
Hardy Multiquadric
Radial Spline
Multilayer Perceptron
Cascade Correlation NN
Shepard (1968)
Quadratic Polynomial
ABI (Courrieu, 2011)
0.705
0.705
0.725
0.838
0.775
0.383
0.819
0.737
0.828
0.576
0.950
28.86
22.50
25.09
12.28
23.08
793.95
14.43
53.88
19.86
147.91
8.00
28.86
22.50
25.09
12.28
23.08
793.95
14.43
53.88
19.86
148.69
9.54
>1000
652
>1000
3.94
871
>1000
11.53
>1000
174.16
>1000
1
Human responses’ ICC.999 confidence interval
0.985[0.959, 0.997]
17Surfaces de généralisation de 4 modèles (données Extrapolation
1)
18
Expression du modèle inconnu par des fonctions de pondération des données
X
€
f (X) = wi(X) × f ii=1
5
∑
Un choix optimal des valeursdes fonctions poids donne:
r2 = 0.976 [0.959, 0.997]
19
Valeurs des fonctions poids sur un problème d’extrapolation
20
Valeurs des fonctions poids sur un problème d’interpolation
21
Comment estimer la fonction en un point (X) étant données ses valeurs (f1 et f2) en deux autres points
(X1 et X2) ?
. Approximation linéaire:
x1
x2
x
f1
f2
€
f1,2(X) = f1 + ( f2 − f1)(X − X1).(X2 − X1)
X2 − X12
f1,2
22Comment choisir des bipoints appropriés ?
L’extériorité ℰ(X,Xi,Xj) est la distance du point X au point le plus proche du segment joignant Xi et Xj (Courrieu, 1994)
Un pavage de Voronoi est construit par le système visuel (Dry, 2008). Il est induit par la distance de X à son plus proche voisin connu: d0(X) = mink d(X,Xk)
La pertinence d’un bipoint (Xi,Xj) dont les extrémités sont voisines dans le pavage de Voronoi est donnée par: ij(X)=exp(-(ℰ(X,Xi,Xj)/d0(X)))
Sa probabilité d’échantillonnage est donnée par la règle de Luce (1977): pij(X) = ij(X) / k,lkl(X).
23
Production des réponses de généralisation
Etant donné un point de généralisation X, échantillonner (avec remise) N bipoints suivant leurs probabilités, et faire la moyenne des approximations linéaires obtenues au point X.
L’espérance et la variance de la réponse sont:
E(f(X)) = ij pij(X) fij(X)
Var(f(X)) = ij pij(X) (fij(X) - E(f(X)))2 / N
où N est en fait une variable aléatoire entière non modélisée pour le moment.
24
Surfaces de généralisation du modèle ABI
25
Performances prédictives du modèle ABI
Réponses moyennesr = 0.975,
r2 = 0.950 [0.959,0.997]Conclusion: Sous-ajustement significatif, mais proche d’une solution acceptable.
Dispersions (S.D.)r = 0.653, p<.01 (N=1 fixé)
r = 0.978, p<.001 (2≤N≤10, mode=4, estimé)
26
Notations financières de dettes souveraines 2010
« The Big Three »
Country Dagong Moody’s Standard & Poor’s
Fitch Ratings
ChinaSaudi ArabRussiaBrazilIndiaIndonesiaVenezuelaArgentinaCanadaNetherlandsGermanyU.S.U.K.FranceBelgiumSpainIsraelItalyThailandMexicoRomaniaIcelandGreecePhilippine
125689
1014111233456688
10111113
43799
10141500000010427799
1012
43779
10121500000011346598
1010
33899
101315000000104367979
10
27
Dagong and « The Big Three »
Notations souveraines de 24 pays par Moody’s, Standard & Poor’s, et Fitch Ratings
ICC= 0.995 (i.c. 99.9%: [0.983, 0.999])
Comparaison des notations par Dagong (agence chinoise)r2 = 0.789 (r2/ICC = 0.793)
Pour qui sont les boulets des Trois Grâces? … Et pour qui celui du Dragon?