modÈle de probabilitÉ de dÉfaut des...
Post on 11-Sep-2018
216 Views
Preview:
TRANSCRIPT
HEC Montréal
MODÈLE DE PROBABILITÉ DE DÉFAUT DES PRÊTS
D’UNE BANQUE CANADIENNE
Par
Fatoumata A dite Woybi Touré
11135079
Science de la gestion
(Ingénierie financière)
Projet supervisé présenté en vue de l’obtention
du grade de maitrise ès science
Directeur de projet :
Georges Dionne
Décembre 2013
© Fatoumata A dite Woybi Touré, 2013
Sommaire
i
SOMMAIRE
La dernière crise financière a mis en exergue la nécessité pour les banques de se doter de modèles
dynamiques et précis d’évaluation du risque de défaut de leurs clients. En effet, malgré
l’abondance et la diversité des modèles, les chocs résultants de la conjoncture de l’économie et
les problèmes d’asymétrie d’information remettent en perspective la nécessité d’une révision
continuelle des modèles existants. La quantification de la probabilité de défaut et sa prédiction
constitue à cet effet, un jalon incontournable des activités de gestion du risque des banques. Dans
un contexte de réglementation et de concurrence soutenue du secteur bancaire, ce paramètre
devient alors un moteur précurseur d’une gestion optimale du risque et dont la quantification
requiert une distinction entre les petites et moyennes entreprises (PME) et les grandes
entreprises. En effet, si les modèles de scoring permettent de discriminer dans le processus
d’octroi de prêt, la disponibilité de l’information et la capacité d’amortissement des chocs
exogènes à leurs activités courantes, rendent l’évaluation du risque des PME fastidieux.
Notamment, les modèles statistiques mettant à contribution des variables qualitatives et
quantitatives ont été prioriser dans l’évaluation de leurs défauts. Dans le présent projet, nous
proposons un modèle économétrique afin de déterminer les variables qui expliquent le défaut
au sein du portefeuille de crédit de PME d’une banque canadienne. Nous mettrons en relief la
pertinence de ce modèle à travers sa propension à prédire et à capter la dynamique des défauts.
Nous apportons des évidences empiriques et nous analysons également des pratiques de la
banque en étude. À cet effet, nous mesurons et testons la significativité du pouvoir prédictif de
notre modèle. Nos résultats établiront la pertinence du modèle ainsi que des variables utilisées,
entérinant par le fait les pratiques de la banque.
Mots clés : risque de crédit, risque de défaut, PME, prédiction du défaut, modèles
économétriques, tests.
Table des matières
ii
TABLES DES MATIÈRES
Sommaire .......................................................................................................................................... i
Liste des figures ............................................................................................................................... iv
Liste des Tableaux ............................................................................................................................ v
Table des annexes .......................................................................................................................... vii
1. Introduction ............................................................................................................................. 8
1.1 Mis en situation ............................................................................................................... 8
1.2 Pratique de la banque et développement d’un modèle économétrique ....................... 9
1.3 Objectifs et apport du projet ......................................................................................... 11
1.4 Organisation du travail .................................................................................................. 12
2. Le risque de crédit des banques ............................................................................................ 14
3. Définition d’une PME ............................................................................................................ 17
4. Revue de littérature .............................................................................................................. 18
5. Modélisation du défaut et validation des modèles ............................................................... 25
5.1 Modèles ......................................................................................................................... 25
5.1.1 Modèle probit ........................................................................................................ 25
5.1.2 Modèle logit .......................................................................................................... 26
5.1.3 Hypothèses ............................................................................................................ 28
5.2 Validation et évaluation du modèle ............................................................................. 29
5.2.1 Validation...................................................................................................................... 29
5.2.2 Évaluation .............................................................................................................. 32
6. Variables explicatives ............................................................................................................ 41
7. Données ................................................................................................................................. 46
8. Résultats : .............................................................................................................................. 49
8.1 Partie 1 : Réplication Simard (2012) .............................................................................. 49
8.1.1 Statistiques descriptives ........................................................................................ 49
8.1.2 Matrice de corrélation ........................................................................................... 49
8.1.3 Résultats des régressions ...................................................................................... 50
8.1.4 Signes des coefficients des régressions et interprétation économique des
variables explicatives significatives ....................................................................................... 54
Table des matières
iii
8.1.5 Test de validité du modèle .................................................................................... 56
8.1.6 Test de stabilité ..................................................................................................... 57
8.2 Partie 2 : Régressions supplémentaires ........................................................................ 58
8.2.1 Régression avec les variables but du prêt ............................................................. 58
8.2.2 Régression avec les variables sectorielles ............................................................. 58
8.2.3 Régression avec toutes les variables qualitatives ................................................. 59
8.3 Partie 3 : validation et évaluation de la spécification finale.......................................... 60
8.3.1 Test de significativité ............................................................................................. 60
8.3.2 Le critère d’information AKAIKE (AIC) et le critère d’information de Bayes (BIC) 61
8.3.3 Test de performance: test d’Hosmer-Lemeshow .................................................. 62
8.3.4 Roc Curve ............................................................................................................... 62
8.3.5 Performance dans la prédiction du défaut: Matrice de confusion (M-C) ............. 65
8.3.6 Robust test : Estimation année 2007 versus Estimation année 2008 ................... 66
8.3.7 Pouvoir prédictif:« Estmation in the sample» - «Prédiction out of the Sample » 68
9. Conclusion ............................................................................................................................. 76
10. Limites et Recommandations ............................................................................................ 79
Bibliographie .................................................................................................................................. 82
Annexes ......................................................................................................................................... 86
Listes des figures
iv
LISTE DES FIGURES
Figure 1: Roc_curve ............................................................................................................................... 36
Figure 2: Roc curve -modèle final probit) ............................................................................................. 64
Figure 3: Roc curve - modèle final (logit) .............................................................................................. 64
Tables des annexes
v
LISTE DES TABLEAUX
Tableau 1: Matrice de confusion (M-C) ................................................................................................ 35
Tableau 2: Échantillonnage «in the sample» - « out of the sample» .................................................... 40
Tableau 3: Variables explicatives .......................................................................................................... 42
Tableau 4: Statistique descriptive des données de défaut .................................................................. 47
Tableau 5 : Modèles correspondant aux différentes estimations ........................................................ 54
Tableau 6: Résultats des tests de vraisemblance respectifs ................................................................. 56
Tableau 7: Résultats du test de Wald ................................................................................................... 60
Tableau 8 : Mesures AIC et BIC pour les spécifications probit .............................................................. 61
Tableau 9 : Mesures AIC et BIC pour les spécifications logit ................................................................ 61
Tableau 10 : Mesures AUC pour les spécifications probit .................................................................... 63
Tableau 11 : Mesures AUC pour les spécifications logit ....................................................................... 63
Tableau 12 : M-C avec un seuil de 20% (toute la population) ............................................................. 65
Tableau 13: M-C avec un seuil de 11,34% (toute la population) .......................................................... 65
Tableau 14 : M-C avec un seuil de conservatisme de 20%( 65% population) ....................................... 69
Tableau 15 : M-C avec un seuil de 11,34% (65% de la population) ...................................................... 69
Tableau 16: M-C avec un seuil de 20% (60% de la population-échantilonn1) ...................................... 70
Tableau 17: M-C avec un seuil de 11,34%(60% de la population-échantilonn1) .................................. 70
Tableau 18 : M-C avec un seuil de 20%(60% de la population-échantilonn2) ...................................... 71
Tableau 19: M-C avec un seuil de 11,34% (60% de la population-échantilonn2) ................................. 71
Tableau 20 : M-C avec un seuil de 20%(60% de la population-échantilonn3) ...................................... 71
Tableau 21 : M-C avec un seuil de 11,34%(60% de la population-échantilonn3) ................................. 72
Tableau 22: M-C avec un seuil de 20%(55% de la population) ............................................................. 72
Tableau 23: M-C avec un seuil de 11,34%(55% de la population) ........................................................ 73
Tables des annexes
vi
Tableau 24: M-C avec un seuil de 20%(échantillon3 de la spécification d’Hauser et Booth (2011)).... 74
Tableau 25 : M-C avec un seuil de 11,34%(échantillon3 de la spécification d’Hauser et Booth (2011))
.............................................................................................................................................................. 74
Tableau 26 : M-C avec un seuil de 20%(échantillon1 de la spécification d’Hauser et Booth (2011)) ... 74
Tableau 27: M-C avec un seuil de 11,34%(échantillon1 de la spécification d’Hauser et Booth (2011))
.............................................................................................................................................................. 75
Tables des annexes
vii
TABLE DES ANNEXES
Annexe 1: Calcul des ratios ................................................................................................................... 86
Annexe 2: statistiques descriptives, matrice de corrélation, test de multicolinéarité ......................... 88
Annexe 3: Résultats des régressions probit .......................................................................................... 96
Annexe 4: résultats des régressions logit............................................................................................ 104
Annexe 5 : résultats régressions supplémentaires avec variables qualitatives .................................. 109
Annexe 6: résultats des estimations avec les échantillons de l'année 2007 et de l'année 2008........ 112
Annexe 7: résultats des estimations « in the sample» ....................................................................... 116
Introduction
8
1. INTRODUCTION
1.1 Mis en situation
Le risque de crédit est inhérent à toute activité de crédit bancaire. De par les composantes qui la
caractérisent, sa modélisation constitue un véritable défi pour les acteurs du secteur bancaire. En
effet, une des difficultés majeures des banques réside dans l’évaluation de la probabilité de
défaut individuelle de leurs clients. L’hypothèse d’asymétrie d’information est centrale dans les
modèles, car on suppose que l’emprunteur détient plus d’information sur sa probabilité de
défaut. De fait, les banques utilisent différentes méthodes pour se prémunir de ce problème
d’information. On peut citer à cet effet : l’autosélection des risques, les collatéraux ou garanties
de prêts et le scoring bancaire. Diverses variables tant d’ordre qualitatif que quantitatif, sont
utilisées pour spécifier les probabilités de défaut des emprunteurs. La contribution de ces
variables ainsi que l’utilisation de toutes informations pertinentes diffèrent selon la politique de
la banque ainsi que les modèles à l’interne.
Parallèlement, l’évolution de la conjoncture économique met en exergue régulièrement les failles
du système existant et nous exhorte à une correction des politiques adaptées. Notamment, la
distinction entre les PME et les grandes entreprises est devenue prépondérante dans la politique
de gestion du risque des banques tant d’un point de vue de modélisation des paramètres du
risque de défaut que de capital économique. Les banques ont, à cet effet, défini des pratiques et
des modèles internes d’évaluation du risque que représentent les PME au vu de la nature
particulière de ces emprunteurs. Ainsi, la diversité des pratiques sujettes aux aléas du cycle
économique et à l’opacité de l’information détenue par l’emprunteur imposent une certaine
révision continuelle des modèles existants. Cet exercice outre d’améliorer les pratiques de la
banque en matière de gestion de risque, favorise un certain appariement entre le risque quantifié
par la banque et le risque réel que représente le client. Par ailleurs, il permet de dégager les
paramètres qui identifient le risque qu’encourt la banque et une modélisation efficiente des
composantes du risque de défaut.
C’est ainsi qu’à la suite d’un stage effectué au sein d’une banque canadienne, que Simard (2012)
a élaboré un modèle économétrique qui se démarque de celui qui est sous-jacent aux pratiques
de la banque. Cette nouvelle spécification dont l’exercice vient tester dans un premier temps les
Introduction
9
pratiques de gestion du risque de la banque (modèles utilisés et processus de prise de décision
d’octroi des prêts), fait écho à la nécessité pour les banques :
1- D’identifier les variables qui expliquent le défaut,
2- De développer les modèles les plus précis,
3- De cultiver une gestion saine du risque de crédit à travers la remise en question et la mise
à jour des modèles existants,
4- De définir de nouveaux modèles qui captent mieux la dynamique des marchés à la suite
de changements importants.
Sur un second volet, ce modèle qui se repose sur les études empiriques, sera un outil innovateur
pour cette banque à travers une nouvelle spécification du risque de crédit que génèrent ses
activités de prêts.
1.2 Pratique de la banque et développement d’un modèle économétrique
La banque commerciale dont les pratiques sont mises en étude dans le présent travail privilégie
les prêts aux PME et à des entreprises dans le secteur des technologies et de l’information. Afin
de préparer les dossiers pour le crédit dans le processus d’octroi de prêt, l’évaluation du risque
de ses clients potentiels est faite sur la base de «certaines analyses»1 comme suit :
- «Analyse financière basée sur divers ratios comptables »
- «Analyse économique basée sur les industries et secteurs d’activités dans lesquels
opèrent les clients, de même que leur position concurrentielle dans leurs marchés
respectifs.»
1 Adréanne Simard (2012)
Introduction
10
- «Analyse environnementale, à laquelle est accordée une attention particulière due à la
mission et au code éthique de la Banque en question. L’importance de cette analyse
provient aussi de son impact sur la valeur attribuée au collatéral offert en garantie sur les
prêts.»
- «Analyse de l’équipe de gestion de la firme, dont :
Niveau de scolarité des entrepreneurs et leur expérience appliquée au domaine
étudié
Scores obtenus grâce à un bureau de crédit (Equifax).»
En ce qui a trait aux pratiques de la banque pour la détermination et la prédiction de la probabilité
de défaut une fois le prêt octroyé, nous n’avons pas la spécification du modèle sous-jacent et le
nom de l’outil informatique permettant de la dériver. Simard(2012) a toutefois suggéré qu’une
spécification économétrique avec 10 variables explicatives comme pour le modèle RiskCalc de
Moody’s serait une bonne spécification.
La précision et la performance prédictive de tout modèle sous-jacent à la détermination des
paramètres du risque de crédit sont d’une importance capitale pour les banques. Notamment, la
précision et le pouvoir prédictif des modèles d’estimation de la probabilité de défaut, soit notre
variable d’intérêt, déterminent une meilleure allocation du capital économique et du capital
réglementaire. Ces deux coussins de capital soutiennent les gestionnaires dans leurs processus
d’octroi de prêts tant pour les nouvelles demandes que pour les renouvellements de prêts.
Fortement influencé par la politique d’appétit pour le risque de la banque, le capital économique
et le capital réglementaire définissent le socle des stratégies de gestion de risque intégrée et de
toute activité susceptible de générer des revenus et du risque au sein de la banque. De fait, ils
dépendent des paramètres de défauts du portefeuille de crédit de la banque. On peut alors
comprendre l’essor des modèles pour l’estimation de ces paramètres, notamment dans le milieu
académique dans un premier temps avant que les banques ne prennent la dimension colossale
de ce problématique dans leur rentabilité. Les banques ont alors développé des modèles qui se
basent essentiellement sur les études académiques antérieures. Ainsi, en passant par l’analyse
Introduction
11
discriminante d’Atlman aux premières spécifications économétriques qui n’ont cessé d’évoluer,
la quantification de la probabilité de défaut ainsi que sa prédiction a connu une expansion
vertigineuse. À cet effet, compte tenu de la nature particulière des PME, les modèles
économétriques ont été mis fortement à contribution pour la quantification du risque de défaut
qu’elles peuvent représenter. Les modèles à variables dépendantes limitées dans leurs domaines
(binaires ou positives), sont alors utilisés pour quantifier et prédire le défaut, prédire le temps
avant le défaut (modèle de comptage) et d’autres spécifications de plus en plus sophistiquées
selon le problème considéré. La richesse de ces recherches justifie le choix de notre spécification
économétrique qui se démarque de celle de la banque et se caractérise à cet effet, comme étant
un nouvel outil. C’est en cela que ce travail constitue d’ailleurs un apport considérable pour la
banque dans sa politique de gestion de risque. En effet, en capitalisant sur les résultats empiriques
des modèles économétriques, les modèles probit et logit mis à contribution dans le présent
travail, lui permettront de juger de la pertinence de son processus de sélection des clients. Ces
modèles permettront également d’indiquer les variables, qui déterminent et prédissent les
défauts au sein de son portefeuille de crédit.
1.3 Objectifs et apport du projet
Le présent travail s’inscrit dans le cadre de la validation des pratiques d’une banque canadienne
en termes d’analyse des différents risques de prêts. Plus précisément, il s’agit dans un premier
temps, d’identifier parmi les paramètres utilisés par la banque, ceux qui prédisent le mieux le
défaut des emprunteurs de types PME (Petites et Moyennes Entreprises) et ce, au moyen d’un
modèle économétrique. Ce volet du travail a été couvert par Adréanne Simard (2012).
Le second volet du projet portera sur la validation de ce modèle économétrique. Cet exercice qui
définit mon apport personnel dans ce travail, nous permettra de montrer dans quelle mesure
notre spécification finale capte la dynamique des probabilités de défaut à travers les pratiques de
la banque. Ainsi, sur la base des résultats obtenus par Simard (2012), ce processus de validation
se définira en quatre étapes :
Introduction
12
- Déterminer dans un premier temps la spécification finale qui ne prendra en compte que les
variables explicatives significatives.
- Dégager des évidences empiriques qui viennent entériner notre choix de spécification et
nos résultats finaux.
- Tester la performance de notre modèle final à travers diverses mesures de performance.
Plus précisément, nous nous servirons des mesures comme le test Hosmer-Lemeschow, de
la Roc curve et de la matrice de confusions. Il s’agit de métriques et concepts sur lesquels
on reviendra en profondeur.
- Vérifier le pouvoir prédictif du modèle en faisant des régressions «in the sample»
(estimation dans l’échantillon) et des prédictions «out of the sample» (prédiction hors
échantillon).
Ainsi ce processus de validation du modèle qui constitue l’objet de ce projet, vient compléter la
partie de la modélisation de Simard (2012). Ces deux étapes traduisent parfaitement l’objectif
principal: l’évaluation du modèle de la banque ainsi que les variables le constituant et l’estimation
d’un nouveau modèle probabilistique mettant à contribution les paramètres utilisés par la
banque.
Ce modèle nous permettra ainsi de tester les pratiques de la banque en matière de politique de
gestion du risque de défaut ainsi que d’octroi de prêts. C’est également un modèle innovateur
par le fait qu’il diffère de celui sous-jacent à la banque et il pourrait permettre à la banque de
développer un modèle plus sophistiqué avec une meilleure précision et un plus grand pouvoir
prédictif et ce, en mettant à profit nos résultats.
1.4 Organisation du travail
Dans cette optique, le reste du rapport est organisé comme suit : une section portant sur le risque
de crédit pour en définir les contours, une seconde section pour définir les caractéristiques
propres aux petites et moyennes entreprises (PME) et du fait qu’elles doivent être traitées
différemment. Une section couvrira la littérature ayant traité du sujet. Nous définirons par la suite
le modèle utilisé et les tests retenus pour le processus de validation de la spécification finale. Les
variables explicatives mises à contribution ainsi que la nature de nos données feront l’objet de
Introduction
13
deux autres sections. La section qui portera sur les résultats aura trois volets : le premier
retraduisant le travail de Simard(2012), le deuxième sur des régressions supplémentaires et un
troisième volet sur nos tests de validation de la spécification finale. Nous finirons enfin avec une
conclusion faisant une synthèse du travail et des recommandations au vu des limites de notre
étude.
Le risque de crédit des banques
14
2. LE RISQUE DE CRÉDIT DES BANQUES
Le risque de défaut représente le risque de perte financière résultant de l’incapacité d’un débiteur
à satisfaire ses obligations de dettes (Longstaff et al. (2011)). Il fait partie du risque de crédit et il
explique en partie les écarts entre les obligations gouvernementales et les obligations privées. La
fin des années 1980 a marqué un tournant important dans son essor. Il devient alors une
préoccupation importante au vu de la récession qui sévissait. Cette période de forte turbulence
économique a ainsi, mis en relief la nécessité de le modéliser et de l’incorporer dans le calcul du
capital de risque des banques. L’accord de Bâle I en 1988 imposant une réglementation sur le
capital économique des banques par rapport à leurs risques de défaut et de faillite, balisa la
gestion du risque de crédit comme composante incontournable de la gestion du risque global de
la banque.
Le risque de crédit peut se diviser en quatre catégories, soit le risque de défaut du client, le risque
de liquidité, le risque de transaction (et de dégradation du rating) et le risque de marché. Le risque
de défaut, qui est en étude dans le présent travail, est déterminé par ces trois composantes que
sont:
- La probabilité de défaut : soit la probabilité qu’une contrepartie ne respecte pas son
engagement.
- Le taux de recouvrement au moment du défaut : soit la fraction de la réclamation ou de
l’actif que la banque recevra au moment du défaut (il est donné par 1-LGD, où LGD est le
Loss Given Default).
- L’exposition au risque de défaut au moment du défaut (EAD) : soit la valeur de l’actif au
moment du défaut, pouvant être mesurée par la valeur faciale de la dette ou par la valeur
au marché d’un actif équivalent n’ayant pas fait défaut2.
2 Dionne, G. Notes de cours de gestions de risques et assurances, chapitre 11, p. 59
Le risque de crédit des banques
15
Le risque de défaut est par définition la probabilité qu’une entreprise se trouve en position de
défaut dans un certain horizon temporel (Beaulieu (2003), p.9) et donc une composante du risque
de crédit comme nous l’avons déjà souligné.
Bien que l’évaluation de ces composantes soit fastidieuse, diverses méthodes sont utilisées dans
la pratique pour les quantifier dont les principales sont :
- Les bureaux de crédit : pour les prêts de plus petite envergure;
- Les cotes d’agences : pour les firmes publiques ;
- Le modèle structurel de Merton (KMV) : qui utilise les valeurs au marché des entreprises;
- Les modèles statistiques : basés sur les états financiers des firmes;
- Credit Metrics : développé par la banque J.P. Morgan, il analyse le risque de crédit d’un
portefeuille à partir de la valeur à risque et des valeurs au marché contrairement aux
variables utilisées dans le présent travail, qui sont exclusivement des valeurs comptables.
Ces variables s’inscrivent dans l’esprit des modèles statistiques, car les entreprises en
étude ne sont pas cotées en bourse.
En effet, compte tenu de la nature des entreprises en étude dans notre travail et de la composante
du risque de crédit qui nous intéresse, l’emphase sera mise sur les modèles statistiques. Il est à
noter toutefois que la méthode la plus discutée dans la littérature pour l’évaluation du risque de
Le risque de crédit des banques
16
crédit est celle appliquée aux obligations mettant à contribution les cotes des agences de cotation.
Ces cotes permettent l’évaluation des probabilités de défaut et de migration d’une classe de
risque à une autre. Elles supposent que les entreprises au sein d’une même cote sont homogènes,
ce qui est une hypothèse très forte. Toutefois, du fait de leurs corrélations négatives avec les
probabilités de défaut, on peut les utiliser directement pour prédire ces probabilités de défaut.
Un des facteurs le plus importants dans la gestion du risque de crédit et qui constitue un véritable
défi pour les banques dans une gestion optimale de leurs risques est : l’asymétrie d’information.
Ce facteur se traduit à travers le risque moral auquel font face les banques. Il peut être de deux
ordres : le risque moral ex ante, relié aux actions de l’emprunteur avant la réalisation du défaut
(prévention) et le risque moral ex post, relatif aux actions après la réalisation du défaut. Selon la
nature du risque auquel la banque fait face, elle ne peut ni observer les actions de ses clients, ni
déterminer le but exact des prêts. De ce fait, ce facteur est déterminant dans toute politique de
gestion de risque de crédit optimale. Nous avons cité à cet effet dans l’introduction quelques
exemples de solutions adoptées par les banques en vue d’amoindrir cet aléa qui ne peut être
résorbé complètement.
Définition d’une PME
17
3. DÉFINITION D’UNE PME
Il convient de donner une définition de ce que l’on entend par PME, pour prendre la dimension
de la problématique entourant la modélisation de leurs probabilités de défaut. Acronyme de
Petites et Moyennes Entreprises, plusieurs critères sont utilisés pour considérer une entreprise
comme faisant partie de cette catégorie. Bien que ces critères soient propres à tous les pays, leurs
spécifications explicites diffèrent d’un pays à un autre, ce qui ne nous permet pas de donner une
définition universelle. Ainsi nous avons que :
- Au Canada, sont considérées comme des PME, les entreprises à exploitation commerciale
qui ont moins de 500 employés et un chiffre d’affaires annuel inférieur 50 millions de dollars
avec certaines exclusions (entreprise constituée de personne morale, les organismes
publics, les organismes à but lucratif, les établissements d’enseignement, les hôpitaux, les
filiales, les coopératives et les sociétés de financement et de contrats de location-
acquisition).
- Aux États-Unis, les small business administration sont dans un premier temps classés par
secteurs d’activités, avec des normes et critères spécifiques à chaque secteur.
- L’Union européenne quant à elle, définit les PME comme des entreprises comptant moins
de 250 employés et avec un chiffre d’affaire annuelle inférieur ou égal à 50 millions d’euros.
La banque en étude étant une banque canadienne qui octroie des prêts à des entreprises
canadiennes, c’est la première définition qui s’appliquera aux compagnies dans notre échantillon.
Revue de littérature
18
4. REVUE DE LITTÉRATURE
La littérature sur la probabilité de défaut est très dense du fait de la nécessité de bien quantifier
le risque de crédit des banques. Ainsi, Beaver (1967) fut l’un des premiers à se pencher sur cette
problématique et ses recherches trouvent écho dans nombre d’études qui ont suivi.
Il convient de noter qu’une distinction est apportée dans l’évaluation des entreprises publiques
et des entreprises privées en raison de la nature et la disponibilité des données de chacune d’elle
respectivement. Les premières études pour l’essentiel traitaient des firmes publiques. Ainsi, les
modèles de probabilité de défaut à partir des informations comptables prennent en compte des
variables explicatives regroupées en cinq catégories :
Des ratios de liquidité,
Des ratios de profitabilité,
Des ratios d’endettement,
Des ratios de solvabilité,
Des ratios d’activité.
Le « Z – score » résultant de l’analyse discriminante multivariée d’Altman(1968) a été
prédominant dans la pratique et s’inscrit dans la même logique. Ce modèle bien que contraignant
de par les hypothèses sur lesquelles il est basé (1- Modèle linéaire avec distribution normale des
variables indépendantes, 2-homogénéité de la variance de défaut), avait le désavantage de ne
pas prendre en compte la non-linéarité entre les données de défaut et les variables explicatives.
Ainsi, en se basant sur 33 données de défauts de compagnies publiques et de 33 données de non-
défauts, Altman (1968), a retenu cinq ratios se répertoriant dans les cinq catégories ci-dessus
comme étant pertinents et essentiels dans la prédiction du défaut d’une entreprise :
Revue de littérature
19
Fonds de Roulement/Actifs totaux,
Bénéfices non répartis/ Actifs totaux,
Bénéfices avant intérêts et impôts/ Actifs totaux,
Valeur de l’équité au marché/ Passifs totaux,
Ventes nettes/Actifs totaux.
Plus flexible par rapport à la nature de l’entreprise, ce modèle est applicable tant aux entreprises
privées qu’aux entreprises publiques contrairement à celui développé par Merton (1974). En
effet, sous l’hypothèse que l’avoir des actionnaires correspond à une option d’achat sur les actifs
de l’entreprise avec comme prix d’exercice la dette (totale ou partielle), Merton (1974) a apporté
une contribution considérable à l’évaluation des probabilités de défaut. Toutefois, ce modèle
n’est applicable qu’aux entreprises publiques.
Edminster (1972) effectua la première étude sur la prévision du défaut qui mettra à contribution
le Z – score d’Altman (1968) sur 43 firmes. Il conclut alors que les ratios de liquidité et
d’endettement ont le plus grand pouvoir prévisionnel du défaut.
Le modèle de régression non- linéaire de type logit fut par la suite proposé par Atlman et Ohlson
(1980) afin de parer aux hypothèses très fortes de l’analyse multivariée. Ces auteurs mettront
l’emphase sur la taille de l’entreprise, la structure du capital, la performance financière et les
liquidités immédiates et ce, en étudiant 2163 firmes pour capter la dynamique des défauts.
La littérature mettant en relief l’évaluation de la probabilité de défaut des PME a connu un grand
essor par la suite. Plusieurs auteurs rebondiront sur l’approche d’Edminster (1972) avec
différentes variantes, notamment l’introduction des variables qualitatives.
Ainsi Lehmann (2003) obtient un modèle prévisionnel plus précis en incluant dans de l’analyse
discriminante multivariée des variables explicatives qualitatives du nom de « Soft Info».
Revue de littérature
20
Beaulieu (2003) analysa le défaut de 3332 PME canadiennes au niveau commercial sur la période
1997-2001 et obtint un modèle avec plus de variables explicatives significatives :
Croissance des ventes,
Croissance de l’avoir net,
ROA,
Couverture des intérêts,
Comptes clients en jours divisés par les ventes nettes,
Ratio de liquidité immédiate,
Passifs totaux /Actifs totaux.
Le travail de Lopez (2006) qui porta sur les prêts octroyés au Puerto Rico, mettra en relief la
nécessité de connaitre la nature du prêteur pour les banques afin de réduire au plus le problème
d’asymétrie d’information. Il indique notamment que les caractéristiques pertinentes pour
distinguer les bonnes firmes des mauvaises firmes sont celles propres aux propriétaires des
entreprises.
Dans Altman et Sabato (2007), les deux auteurs concluent à la pertinence de l’utilisation d’un
modèle logistique par rapport au modèle d’analyse discriminante multivariée. En effet, le modèle
logistique a l’avantage de considérer le problème de multicolinéarité des ratios utilisés et il
permet de relaxer les hypothèses de relation linéaire entre les variables et d’homoscédasticité.
Ainsi, à la suite d’une régression logistique sur 2000 PME américaines, ils retiendront 5 ratios pour
expliquer la probabilité de défaut et deux de ces variables se trouvent parmi celles d’Altman
(1968) :
Revue de littérature
21
Dette à court terme/ Valeur de l’équité au livre,
Bénéfices non répartis/ Actifs totaux,
Bénéfices avant intérêts, impôts et amortissement/ Actifs totaux,
Bénéfices avant intérêts, impôts et amortissement/Dépenses d’intérêts,
Encaisse /Actifs totaux.
Bonfim (2009) dans son étude sur 30 000 firmes portugaises en vue de déterminer les facteurs
qui caractérisent le défaut, mettra l’emphase sur les déterminants résultant des caractéristiques
idiosyncratiques de l’entreprise et sur les déterminants macroéconomiques résultant du risque
systématique. En utilisant des régressions probit et logit respectivement avec des facteurs
macroéconomiques comme le PIB, les taux d’intérêt, la production industrielle et les écarts des
taux obligataires, l’auteur arrive à la conclusion que les ratios propres à l’entreprise sont les plus
pertinents dans la prédiction du défaut. Il souleva entre autres, la nécessité de spécifier la nature
de l’entreprise et trouva cinq ratios importants dans un modèle de probabilité de défaut qui
rejoint la plupart des études antérieures:
Croissance des ventes,
ROA,
Ratio de solvabilité,
Ratio de liquidité,
Taux d’investissement.
Gunawidjaja et Hermanto (2010) ont proposé un modèle qui corrige le problème de
multicolinéarité indiqué par Altman et Sabato (2007). Ce modèle leur a permis d’aligner les
politiques des banques à celles de Bâle II en matière de gestion du risque et ce, en définissant
un coussin de capital requis par les banques pour les PME. Ces auteurs ont défini à cet effet, un
outil d’analyse du risque de crédit pour ce type d’entreprise. Toutefois, l’apport de cette étude
pour notre travail s’inscrit dans l’utilisation de modèles logit et probit sur les 1845 PME
indonésiennes (de 2005 à 2007). En effet, les auteurs trouvent que les principaux paramètres
Revue de littérature
22
utiles à la prédiction du risque de défaut sont les ratios de liquidités courantes, de la couverture
d’intérêt et de la période de collection moyenne des comptes à recevoir, ce qui rejoint les études
d’Edminister (1972) et Altman et Sabato (2007). Par ailleurs, l’une de leurs conclusions
importantes est que les deux modèles probit et logit utilisés sont consistants.
Fidrmuc et Hainz (2010) ont à leur tour modélisé le risque de défaut des PME en mettant en étude
700 prêts octroyés par des banques en Slovaquie sur la période allant de 2000 à 2005. Cette étude
est particulièrement pertinente pour notre travail de par le parallèle entre la période de crise
traversant ce pays sur la période d’étude et la période de crise économique sur laquelle les
données de notre travail ont été collectées. Par ailleurs, telle que dans le présent travail, les
auteurs ont introduit des variables de contrôle afin d’isoler certains effets dépendamment de
l’industrie, de la forme légale de l’entreprise et de la variable dite temporelle. Ils en arrivent à la
conclusion que le défaut diffère d’un secteur à un autre et précise l’importance de tenir compte
de cette variante dans les modèles.
McCann et McIndoe (2012), dans leur étude des prêts octroyés à des PME en Irlande, ont mis en
relief la nécessité de tenir compte du secteur d’activité dans l’analyse de la probabilité de défaut.
Ce résultat est d’autant plus important qu’il fait écho au présent travail. En effet, ils ont réparti
un échantillon de 6745 entreprises entre 10 secteurs d’activités :
Hôtel et restaurant,
Manufacture,
Ventes en gros et ventes en détails,
Construction,
Finance,
Information et communication,
Les services professionnels,
Services publics, locaux et de santé,
Immobilier,
Transport.
Revue de littérature
23
Dans une première régression probit mettant à contribution que ces secteurs en variables
dummy, les deux auteurs trouveront que les secteurs Services publics/ locaux /santé
enregistrent la meilleure santé financière. Par la suite, les auteurs ont rajouté 8 variables
explicatives tant qualitatives que quantitatives : le ratio de taille du prêt, le ratio de Chiffre
d’affaires total/Actifs totaux, une variable indicatrice indiquant si le manager s’est vu
octroyer un prêt de 10 ans ou plus et servant de proxy à l’âge de la firme ainsi que de
l’expérience du manager, le ratio de Bénéfice avant intérêt, dépréciation et taxe/ Actif totaux,
le ratio de Trésorerie d’exploitation/ Actifs totaux, le Fonds de roulement, le ratio de Créance
commerciale/Actifs totaux, et un ratio d’endettement ( ratio of total liabilities). Cette étude
mettra en exergue plusieurs impacts sur le défaut en isolant différents effets. Notamment, les
auteurs ont estimé le modèle probit en utilisant : 1- toutes les variables explicatives, 2- les
variables dummy des secteurs et chacune des autres variables explicatives prises isolement. Ils
en arrivent à conclusion que les secteurs de l’agriculture (comme dans Simard (2012)), de
l’immobilier et de la construction ainsi que des ratios de Prêt/ Actifs totaux, ratio de
liquidité courante, ratio de levier financier, ratio de liquidité et le ratio de profitabilité sont
significatifs dans la détermination du défaut. Les deux conclusions importantes résultantes
de cette étude après avoir isolé les effets sur le défaut dépendamment de l’industrie et des
variables financières, sont que :
1- Les variables qui déterminent le défaut diffèrent d’un secteur à un autre.
2- Certains secteurs captent mieux la dynamique des défauts. Les deux auteurs le traduisent
par l’importance de l’hétérogénéité des prêteurs en référence à la segmentation des secteurs
dans leur travail.
Cette conclusion influence la présente étude puisque l’on a utilisé la même spécification en tenant
compte des caractéristiques des emprunteurs de la banque en étude. Ils ont dégagé également
une mesure des pertes anticipées en utilisant les probabilités de défaut et les expositions de
la banque.
Revue de littérature
24
Sirirattanaphonkun et Pattarathammas (2012) dans leur étude comparative des modèles
MDA (Multiple Discriminant Analysis) et logit des prêts octroyés à des PME en Thaïlande,
arrivent à la conclusion que le modèle logit a un pouvoir prédictif plus élevé que le modèle
MDA et qu’en combinant les variables explicatives retenues dans les deux modèles, on trouve
un modèle hybride avec un plus grand pouvoir de prédiction du défaut.
Les auteurs ont également mis en évidence la nécessité de modéliser le défaut des PME
séparément de celui des grandes compagnies en comparant les modèles de Buggakupta (2004) et
Kiatutkhajornvong (2008) respectivement et leur modèle logit dans le cas de la Thaïlande. Ce point
soulève la contrainte qui impose aux banques de générer des modèles propres aux PME dans une
gestion optimale du risque de crédit.
Plus récensement Dainelli, Giunta et Cipollini (2013) ont mis en exergue dans leur étude de 187
firmes italiennes l’importance de tenir compte des données de crédit historiques au lieu des seuls
postes comptables dans la prédiction du défaut. Les auteurs ont utilisé des modèles logistiques
linéaire et non linéaire respectivement avec un ensemble de 55 variables résultant d’une synthèse
de la littérature existante et regroupées en trois catégories : profitabilité, solvabilité et liquidité,
relation de qualité de crédits. Ils ont retenu 5 variables pertinentes dont trois postes comptables
et deux de données de l’historique de crédit. Ils en arrivent aux conclusions que :
- Les données de crédit historiques sont prédominantes dans le rating de crédit des PME.
- Les deux principaux facteurs qui permettent de mieux détecter et de mieux prévenir la
probabilité de défaut sont : une faible profitabilité et une détérioration de la qualité des
relations de crédit, exprimées par l’utilisation du ratio des lignes de crédit court terme.
Modélisation du défaut et la validation des modèles
25
5. MODÉLISATION DU DÉFAUT ET VALIDATION DES MODÈLES
Cette section retrace les modèles mis à contribution dans le présent travail, les hypothèses posées
pour faire l’inférence statistique et les différentes procédures et mesures utilisées pour valider la
spécification finale et tester sa performance.
5.1 Modèles
Dans le présent travail, les modèles en étude sont des modèles à variables dépendantes
dichotomiques, spécifiquement les modèles logit et probit. Le modèle logit étant le plus utilisé
dans la littérature, il nous servira de benchmark pour les résultats qui seront dérivés. Les deux
modèles diffèrent de par les hypothèses sur les distributions respectives des termes d’erreurs. Les
spécifications propres à chacun sont définies dans ce qui suit.
5.1.1 MODÈLE PROBIT
Soit le modèle linéaire simple latent :
𝑌�̃� = 𝛽′𝑥𝑖 + 𝜀𝑖 (1)
Où :
𝑥𝑖= Vecteur des variables explicatives.
𝛽′ = Vecteur des paramètres.
La variable dépendante 𝑌�̃� est une variable latente non observable mesurant la probabilité de
défaut. Le terme d’erreur suit une loi normale.
Et la règle d’observation associée à la variable latente 𝑌�̃� est définie comme suit:
𝑌𝑖 = {1 𝑠𝑖 𝑑é𝑓𝑎𝑢𝑡 𝑜𝑢 𝑌�̃� > 00 𝑠𝑖𝑛𝑜𝑛
Modélisation du défaut et la validation des modèles
26
La probabilité de défaut est alors définie comme suit:
𝑝(𝑌𝑖 = 1) = 𝑝(�̃�𝑖 > 0) (2)
𝑝(𝑌𝑖 = 1) = 𝑝 (𝛽′𝑥𝑖 + 𝜀𝑖 > 0) (3)
𝑝(𝑌𝑖 = 1) = 1 − 𝑝 (𝛽′𝑥𝑖 + 𝜀𝑖 < 0) (4)
𝑝(𝑌𝑖 = 1) = 1 − 𝑝 (𝜀𝑖 < − 𝛽′𝑥𝑖) (5)
𝑝(𝑌𝑖 = 1) = 1 − 𝜙 (− 𝛽′𝑥𝑖) (6)
𝑝(𝑌𝑖 = 1) = 𝜙 ( 𝛽′𝑥𝑖) (7)
5.1.2 MODÈLE LOGIT
La spécification reste la même telle que ci-dessus avec les mêmes interprétations des variables:
𝑌�̃� = 𝛽′𝑥𝑖 + 𝜀𝑖 (8)
Et la règle d’observation est également :
𝑌𝑖 = {1 𝑠𝑖 𝑑é𝑓𝑎𝑢𝑡 𝑜𝑢 𝑌�̃� > 00 𝑠𝑖𝑛𝑜𝑛
Toutefois, le terme d’erreur suit une loi logistique dont la fonction est la suivante :
Λ(𝛽𝑥𝑖) = 1
1+𝑒−𝛽𝑥𝑖 (9)
Dans le cas où la distribution a des queues plus épaisses indiquant une plus forte concentration
des données dans les extrêmes, le modèle logistique sera le mieux indiqué. Donc notre exercice
de comparaison nous permettra de déterminer entre autres la spécification la mieux indiquée
Modélisation du défaut et la validation des modèles
27
pour capter la dynamique des défauts à travers celui qui aura le plus grand pouvoir explicatif et il
indiquera également la distribution appropriée des termes d’erreurs.
Les deux modèles sont estimés par maximum de vraisemblance, soit en maximisant la fonction
de vraisemblance :
𝐿 = ∏ (𝑃(𝑌𝑖 = 1 ))𝑌𝑖𝑁
𝑖=1 ∗ (𝑃(𝑌𝑖 = 0))1−𝑌𝑖
(10)
𝑃(𝑌𝑖 = 1 ) = La probabilité que 𝑌𝑖 soit égale à 1, soit la probabilité que l’entreprise ait fait
défaut
𝑃(𝑌𝑖 = 0 ) = La probabilité que 𝑌𝑖 soit égale à 0, soit la probabilité que l’entreprise n‘ait pas fait
défaut.
Les modèles probit et logit ont été estimés par maximum de vraisemblance dans STATA via les
commandes probit et logit. Stata utilise «les données individuelles des différents prêts afin
d’ajuster les modèles, et calcule par la suite les statistiques de diagnostic par un modèle
covariable3, en conservant la taille de l’échantillon initial. Ainsi, les sujets (ou prêts) ont des
résultats différents malgré qu’ils aient les mêmes valeurs covariables et ajustées, de même que
les mêmes statistiques de diagnostic».4
3 Modèle qui utilise une variable explicative (covariable) pour laquelle la variation est étudiée comme
facteur causant la variable principale (ici le défaut).
4 Simard, Adréanne, 2012
Modélisation du défaut et la validation des modèles
28
5.1.3 HYPOTHÈSES5
- Les termes d’erreurs sont indépendants des variables explicatives.
- La distribution des termes d’erreur est normale (respectivement logistique) pour le modèle
probit (respectivement pour le modèle logit).
Ces deux conditions doivent être remplies également :
𝑙𝑖𝑚𝑥𝑖,𝛽→∞ 𝑃(𝑌𝑖 = 1) = 1 (11)
𝑙𝑖𝑚𝑥𝑖,𝛽→∞ 𝑃(𝑌𝑖 = 0) = 0 (12)
5 Simard, Adréanne 2012
Modélisation du défaut et la validation des modèles
29
5.2 Validation et évaluation du modèle
L’objectif escompté de cette étude est d’avoir le modèle le plus parcimonieux avec la plus grande
performance prédictive possible. À cet effet, nous ne retiendrons que les variables explicatives
significatives, dont les explications respectives du défaut, prendront un sens économique. Ainsi,
divers tests et statistiques seront mis à contribution pour valider notre spécification finale et
évaluer sa performance. Cette section répertorie les mesures, tests et processus qui seront utilisés
pour cette étape importante du projet.
5.2.1 VALIDATION
La validation d’un modèle est indissociable de tout processus d’estimation. C’est une étape
cruciale dans l’élaboration de tout modèle de prédiction. À cet effet, diverses procédures et
métriques qui permettent de valider un modèle sont utilisées dans la littérature. Nous avons
retenu les plus pertinents pour cette étape et elles sont reproduites dans ce qui suit.
5.2.1.1 Test du rapport de vraisemblance
C‘est un test de spécification du modèle qui compare généralement deux modèles. Basé sur les
fonctions de log vraisemblance dans STATA, la statistique test qui est associée correspond à la
différence entre les logs de vraisemblance respectifs du modèle dit contraint et du modèle sans
restriction. La technique d’estimation par maximum de vraisemblance utilisée pour dériver les
paramètres estimés de nos modèles maximise la fonction de vraisemblance. L’idée sous-jacente
à ce test est que l’omission de toutes variables explicatives pertinentes (modèle contraint)
impliquera une diminution importante de la log vraisemblance. Ainsi, ce ratio devrait traduire
dans quelle mesure l’omission de certaines variables viendra affecter notre inférence indiquant à
cet effet, la pertinence d’une spécification par rapport à une autre. La statistique test
correspondante, du nom de ratio de vraisemblance est la suivante :
𝐿𝑅 = 2(log 𝑙𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑𝑠𝑎𝑛𝑠 𝑟𝑒𝑠𝑡𝑟𝑖𝑐𝑡𝑖𝑜𝑛 − log 𝑙𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑𝑎𝑣𝑒𝑐 𝑟𝑒𝑠𝑡𝑟𝑖𝑐𝑡𝑖𝑜𝑛) (13)
Modélisation du défaut et la validation des modèles
30
Cette statistique est comparée à une chi-carré dont le degré de liberté est donné par le nombre
de restrictions, dans notre cas au nombre de variables explicatives omises. La règle de décision
est que si cette statistique est plus grande que le quantile associé au chi-carré, on rejette
l’hypothèse nulle qui correspond au modèle restreint. De façon équivalente, plus le log
vraisemblance est petit, meilleure est l‘estimation et meilleur est le modèle estimé. L’avantage
de ce test est qu’il assure la plus grande puissance selon le théorème de Neyman-Pearson.
5.2.1.2 Test de stabilité
Ce test vise à déterminer dans quelle mesure les valeurs aberrantes affectent la qualité de notre
inférence. Le principe dans le présent travail est d’éliminer les valeurs aberrantes de l’échantillon
et de voir par la suite, si les variables explicatives significatives de notre modèle final le
demeurent. Pour ce faire, Simard (2012) a choisi d’éliminer les seules valeurs aberrantes de la
variable choisie comme proxy de la taille des entreprises dans l’échantillon, soit les ventes. Ces
valeurs atypiques seront éliminées au seuil de 5% et 1% respectivement. Ces spécifications nous
permettront de capter la dynamique de stabilité du modèle dépendamment du niveau de
conservatisme dans le traitement des valeurs atypiques.
5.2.1.3 Mesures AIC et BIC6
Toujours dans une perspective de validation de notre spécification finale, certaines métriques
seront mises à contribution. La première mesure de validation que nous allons aborder est la
mesure AIC du nom de AKAIKE INFORMATION CRITERIA. Le critère d’information d’Akaike, de son
nom français, mesure la qualité du modèle. Plus précisément, elle permet de pénaliser les
modèles en fonction du nombre de paramètres choisis afin de satisfaire le critère parcimonieux,
l’idée étant de choisir le modèle avec le plus bas critère. Cette analyse va parfaitement dans le
sens de l’exercice de validation de notre modèle final.
6 Cahuzac, E., Bontemps, C., « Stata par la pratique: statistiques, graphiques et éléments de programmation », Stata
Press, édition 2008, p.78.
Modélisation du défaut et la validation des modèles
31
La mesure AIC est définie comme suit :
𝐴𝐼𝐶 = 2𝐾 − 2 log 𝐿 (14)
Où : L = vraisemblance du modèle estimé
k= nombre de paramètres
log correspond au logarithme népérien
La deuxième mesure de validation est la mesure BIC, du nom de Bayesien information criteria.
Cette mesure a été dérivée de la mesure AIC et tient compte, en plus du nombre de variables, de
la taille de l’échantillon également. Elle pénalise à cet effet plus que la mesure AIC pour l’ajout de
nouvelles variables.
La mesure BIC est définie comme suit :
𝐵𝐼𝐶 = 𝐾 log 𝑁 − 2 log 𝐿 (15)
Où : L = vraisemblance du modèle estimé
k = nombre de paramètres
N = taille de l’échantillon
log correspond au logarithme népérien
La règle de décision est la même que pour le critère AIC, choisir le modèle avec la mesure BIC la
plus basse.
Ces deux mesures s’inscrivent parfaitement dans l’optique de dériver le modèle le plus
parcimonieux avec la plus grande précision. En effet, on sait que la précision d’un modèle
augmente avec le nombre de variables explicatives pertinentes. Or, ces deux mesures pénalisent
pour l’ajout de nouvelles variables de sorte qu’elles établissent le seuil auquel, aucune précision
supplémentaire n’est apportée au modèle avec l’ajout de variables non pertinentes.
Modélisation du défaut et la validation des modèles
32
5.2.1.4 Test de significativité
La spécification finale ne tenant compte que des variables significatives, nous allons utiliser le test
de Wald pour vérifier la significativité des coefficients de ces variables. Cet exercice vient en
support à l’objectif de ne retenir que les variables qui expliquent le défaut dans notre modèle de
prédiction. Ce test s’aligne également avec celui du ratio de vraisemblance.
La statistique test de Wald suit une distribution Chi - carré sous l’hypothèse que le coefficient
estimé est nul. Cette statistique test est obtenue en comparant la valeur du maximum de
vraisemblance du coefficient de la variable testée avec l’écart-type du dit coefficient. Dans le
présent travail, nous allons effectuer un test joint des coefficients des variables explicatives de la
spécification finale et des tests individuels de chaque coefficient. Les hypothèses correspondantes
sont formulées comme suit :
Hypothèse nulle du test-joint : 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑛 = 0
Hypothèse nulle des tests individuels : 𝛽𝑖 = 0 pour chaque i, i = 1, …, n
Les 𝛽𝑖 sont les coefficients d’une estimation d’un modèle à n variables explicatives.
L’alternative étant que les coefficients sont différents de zéro pour les deux hypothèses nulles
respectivement.
5.2.2 ÉVALUATION
Du point de vue efficacité, la performance se caractérise par la capacité du modèle à prédire les
défauts et les non-défauts. Pour cette étape, nous nous servirons de la matrice de confusion pour
notre spécification finale dans un premier temps. Par la suite, on se servira du processus
d’estimation «in the sample» – prédiction «out of the sample» qui mettra à contribution
également la matrice de confusion. La ROC curve et le test Hosmer-Lemeshow seront également
mis à contribution. Nous reproduisons les grandes lignes de ces processus et mesures qui
viendront soutenir la pertinence de notre spécification finale.
Modélisation du défaut et la validation des modèles
33
5.2.2.1 Test de performance :
Le test de performance qui sera utilisé dans le cadre d’évaluation du pouvoir prédictif de notre
modèle est celui de Hosmer-Lemeshow. Ce test permet de déterminer la qualité d’ajustement du
modèle aux données. Pour un échantillon de n observations et n valeurs prédites par le modèle,
on considère que l’ajustement est satisfaisant si :
La distance entre la valeur observée et la valeur prédite est petite.
Le modèle est bien estimé c'est-à-dire que les fréquences prédites sont proches de
fréquences réalisées
On obtient des bonnes mesures de sensibilité et de spécificité c'est-à-dire que le
modèle permet de bien discriminer entre les valeurs de y = 0 (non-défaut) et y = 1
(défaut) en fonction variables explicatives du modèle. Pour ce dernier point, bien
que pertinent pour cette mesure de performance, il sera plus observable avec la
ROC curve et la matrice de confusion sur lesquelles on reviendra plus en détail.
La construction de la statistique de test correspondante est basée « sur un regroupement de
probabilités prédites par le modèle, par exemple par décile dans un premier temps. On calcule,
ensuite, pour chacun des groupes, le nombre observé de réponses positives y= 1 (défaut) et
négatives y=0 (non-défaut) que l’on compare à la prédiction par le modèle. On calcule alors la
distance entre les fréquences observées et prédites au moyen d’une statistique du Chi2»7 à h-2
degrés de liberté où h correspond au nombre de groupements choisis. Ainsi, lorsque cette
distance est petite, on considère que le modèle est bien ajusté aux données.
7 Cours de régression logistique appliquée, Patrick Taffée
Modélisation du défaut et la validation des modèles
34
L’hypothèse nulle du test est que le modèle ajuste bien les données. La conclusion escomptée
est de ne pas rejeter cette hypothèse.
5.2.2.2 La matrice de confusion
La capacité d’un modèle à prédire les défauts et les non-défauts est donnée par la matrice de
confusion. Les résultats de la classification des défauts et non défauts déterminés au moyen d’un
seuil préétabli, sont comparés aux défauts et non défauts réalisés. Fondamentalement, il s’agit
d’un tableau qui fournit le type de classification et le pourcentage associé à chaque type. Ces
types sont définis en termes de bonnes classifications et de mauvaises classifications. Les
classifications sont dites bonnes lorsqu’un défaut prédit correspond à un défaut actuel (sensibilité
du modèle) ou un non-défaut prédit correspond à un non-défaut actuel (spécificité du modèle).
Les classifications de type mauvais sont celles qui classent les défauts prédits comme vrais alors
qu’ils correspondent à des non-défauts actuels. Cette mauvaise classification traduit une erreur
de type II. Ce type d’erreur peut amener la banque à revoir son niveau de capital économique
pour se prémunir d’éventuels chocs, ce qui se traduit par un manque à gagner et par ailleurs peut
affecter la qualité de crédit du client. Inversement, une mauvaise classification qui classe les non-
défauts prédits comme vrais alors qu’ils correspondent à des défauts actuels, traduit une erreur
de type I. Les conséquences pour la banque d’une telle classification sont encore plus
importantes puisqu’elles se matérialisent en termes de capital et d’intérêt.
De façon équivalente, nous pouvons définir les mauvaises classifications comme suit :
Si nous supposons une hypothèse nulle définit comme telle :
𝐻0 : 𝑌𝑖 = 1 (ê𝑡𝑟𝑒 𝑒𝑛 𝑑é𝑓𝑎𝑢𝑡).
Les mauvaises classifications seront alors traduites ainsi :
- L’erreur de type I correspond au rejet de 𝐻0 quand 𝐻0 est vrai
- L’erreur de type II correspond à ne pas rejeter 𝐻0 𝑞𝑢𝑎𝑛𝑑 𝐻0 est fausse
Le tableau suivant correspond à une matrice de confusion générale.
Modélisation du défaut et la validation des modèles
35
Tableau 1: Matrice de confusion (M-C)
Modèle prédiction Défauts actuels Non-défauts actuels
Défauts Vrais positifs Erreur de type II
Non - Défauts Erreur de type I Vrais négatifs
Ces classifications sont très sensibles au degré de conservatisme du modèle, soit le seuil que l’on
choisit. Ainsi, plus ce seuil est restrictif, moins on a d’erreurs de type I mais plus d’erreurs de type
II et inversement. La prochaine section nous permettra de donner la mesure de cette sensibilité
à travers la ROC Curve.
5.2.2.3 La ROC curve
La ROC curve (Receiver Operating Charactristic curve), du nom de courbe de spécificité en
français, est une courbe qui permet de synthétiser l’information résultant de différentes matrices
de confusions associées à des seuils de conservatismes correspondants. Elle correspond alors à
une mesure de la performance d’un classificateur binaire comme c’est le cas avec nos modèles
probit et logit. Son axe des abscisses correspond à (1- la mesure de spécificité du modèle), soit le
pourcentage d’erreur de type II. La mesure de sensibilité est reportée sur son axe des ordonnées,
soit le pourcentage de défauts correctement classés comme des défauts par le modèle. Elle est
alors obtenue en faisant varier le seuil de conservatisme du modèle qui permet de générer
différentes combinaisons bonnes de classification de défaut et d’erreurs de type II. Ces différentes
combinaisons permettent ainsi de déterminer dans quelle mesure le modèle est précis pour
discriminer les défauts et des non-défauts.
L’aire sous la ROC curve du nom de mesure AUC (area under curve) est une mesure de la
performance du modèle dans la prédiction du défaut actuel. Un modèle parfait aura une mesure
AUC de 1. Ainsi, plus le modèle est précis, plus la courbure de la ROC curve est proche du coin
gauche du graphique vers le haut et la mesure AUC est proche de 1.
Modélisation du défaut et la validation des modèles
36
Figure 1: Roc_curve
Source : http://www.intechopen.com/books/data-mining-applications-in-engineering-and-medicine
La ROC curve tient essentiellement son avantage de sa capacité à tenir compte des erreurs de
type II ainsi que de la surface sous la courbe qui est une excellente mesure de performance d’un
modèle. Cette courbe vient notamment en support au test de Homer-Lemeshow qui capte la
dynamique d’ajustement du modèle aux données.
Ainsi, on s’attend à ce que la spécification finale ait une capacité d’estimation satisfaisante et un
pouvoir discriminatoire élevé.
5.2.2.4 Estimation «in sample» (estimation dans l’échantillon) - prédiction «out of the sample» (prédiction hors échantillon)
Il s’agit d’une procédure qui vise à tester le pouvoir prédictif du modèle. C’est une étape
indispensable dans notre processus d’évaluation et même de validation du modèle qui vient
soutenir la pertinence de notre spécification finale. Il est à noter que sa performance est très
sensible à la population en étude et requiert à cet effet un échantillonnage de la population dont
les tenants seront reproduits dans les sections subséquentes. Ainsi dans ce qui va suivre, nous
présentons les grandes étapes de la procédure et les techniques d’échantillonnage mises à
contribution pour cet exercice.
Modélisation du défaut et la validation des modèles
37
a. Principe :
L’estimation «in-the sample» et la prédiction «out the sample» consiste à:
1- Constituer deux sous échantillons de la population en étude et selon une spécification
propre aux besoins de l’étude qui l’utilise.
2- Utiliser un des sous échantillons pour estimer le modèle, qui correspond à l’étape de
l’estimation «in the sample».
3- Utiliser les paramètres ainsi obtenus du modèle estimé pour calculer les valeurs prédites
avec le deuxième sous échantillon, soit la prédiction «out of the sample».
4- Vérifier si les valeurs prédites ainsi calculées correspondent aux valeurs réalisées du
deuxième sous échantillon et déduire le pourcentage de bonne classification du modèle.
Dans notre cas, puisque l’on travaille avec un modèle binaire, pour déterminer les défauts prédits
dans le deuxième sous échantillon, il nous faut définir une règle d’observation qui tient compte
du degré de conservatisme du modèle. La règle d’observation des valeurs prédites est la suite :
�̂�𝑖 = {1 𝑠𝑖 𝑑é𝑓𝑎𝑢𝑡 𝑜𝑢 �̆�𝑖 > 𝑑
0 𝑠𝑖𝑛𝑜𝑛 𝑜𝑢 �̆�𝑖 < 𝑑
Où �̂�𝑖 est la classification binaire en termes défaut ou le non-défaut prédits pour la prédiction
«out of the sample» et �̆�𝑖 la probabilité prédite résultant de la prédiction« out of the sample».
La variable d caractérise notre seuil de conservatisme et il est habituellement fixé à 0.5. Toutefois
comme dans l’article de Dionne. G, Artis. M et Montserrat. G (1996) portant sur les prêts octroyés
par une banque espagnole, nous allons tester différents seuils de conservatisme (ou valeurs
critiques associées à la probabilité d’erreur de type I). L’objectif escompté par cet exercice est
alors de déterminer le seuil qui nous permettra d’avoir la classification avec le pourcentage
d’erreurs de type I le plus petit. En effet, comme nous l’avons souligné, l’erreur de type I
Modélisation du défaut et la validation des modèles
38
correspond à une mauvaise classification qui se mesure en terme de perte de capital et d’intérêt
pour la banque et de fait, engendre des coûts énormes. Par ailleurs, cela nous permettra de
dériver différentes matrices de confusions qui donneront la dimension de ce paramètre dans la
prédiction du défaut ainsi que la performance des modèles selon le niveau de conservatisme de
la banque.
b. Échantillonnage :
Comme nous l’avons souligné, la procédure est sensible à la population étudiée puisqu’il est
nécessaire que le sous-échantillon servant à l’estimation «in the sample» conserve la
significativité des variables explicatives du modèle final. L’exercice se faisant avec deux sous
échantillons de la population, il nous a fallu dans un premier temps, identifier la proportion de la
population qui formera l’échantillon pour l’étape de l’estimation «in the sample» et celle qui
servira pour la prédiction «out of the sample». Les deux procédures suivantes ont été utilisées
pour l’étape de l’échantillonnage et se distinguent par la méthode et la proportion de la
population formant les sous- échantillons.
i. Tirage aléatoire des observations:
L’idée sous-jacente à cette procédure est de former les sous-échantillons requis en effectuant un
tirage aléatoire du nombre d’observations nécessaire. Nous utilisons trois spécifications
respectivement pour former les deux sous échantillons requis :
- 35% des observations pour l’estimation «in the sample» et 65% sont utilisées pour la
prédiction «out of the sample».
- 40% des observations pour l’estimation «in the sample» et 60% sont utilisées pour la
prédiction «out of the sample».
- 45% des observations pour l’estimation «in the sample» et 55% sont utilisées pour la
prédiction «out of the sample».
Modélisation du défaut et la validation des modèles
39
L’objectif pour l’étape de l’estimation «in the sample» étant d’avoir un sous échantillons de 35%,
40%, 45% respectivement pour lequel les variables explicatives du modèle final sont toutes
significatives. Nous avons formé 10 sous-échantillons aléatoires pour chacun des fractionnements
de la population (les trois spécifications ci-haut respectivement). Sur les 10 sous-échantillons
aléatoires de chaque subdivision, nous retiendrons que ceux dont les sous-populations de
l’estimation «in the sample» ont toutes les variables explicatives significatives et les secondes
sous-populations correspondantes seront utilisées pour l’étape de la prédiction« out of the
sample».
ii. Three fold cross validation technique (technique de validation de trois groupes croisés):
Cette méthode est basée sur celle de l’étude de Hauser et Booth (2011). Nous reproduisons leur
technique d’échantillon que nous allons utiliser également dans le présent travail, la technique
de mesure de performance étant exactement celle de l’estimation «in the sample» et de la
prédiction «out of the sample».
Les deux auteurs ont utilisé une population de 24 défauts et de 48 non-défauts. Sur une base
aléatoire, ils ont constitué trois sous-groupes pour les défauts et les non- défauts respectivement,
soit trois sous-groupes de 8 défauts et trois sous-groupes de 16 non-défauts. Ils ont par la suite,
formé trois sous-échantillons de 24 observations avec respectivement 8 défauts et 16 non-
défauts. Pour le sous-échantillon servant à l’estimation «in the sample», ils forment des
combinaisons de deux échantillons aléatoires parmi les trois sous-échantillons, pour un total de
trois combinaisons. Pour chaque combinaison résultant de deux sous-échantillons, ils utilisent le
troisième sous-échantillon restant pour la prédiction «out of the sample». Ainsi, on aura trois
subdivisions des données. Chaque subdivison correspondra à une première sous- population
résultant d’une combinaison de deux sous-échantillons aléatoires et à une deuxième sous-
population, soit le troisième sous-échantillon restant.
Nous utilisons le même principe pour former nos échantillons. Notre population comporte 694
défauts, alors nous avons trois sous-groupes aléatoires de 231, 231, et 232 respectivement de
défauts. Nous avons 5401 non-défauts, les sous-groupes correspondants ont respectivement
1800, 1800 et 1801 observations. Par la suite, selon le principe défini ci-dessus, nous avons formé
Modélisation du défaut et la validation des modèles
40
les différentes spécifications qui serviront dans l’estimation «in the sample» et la prédiction «out
of the sample». Le tableau 2 fournit un résumé de cet échantillonnage.
Tableau 2: Échantillonnage «in the sample» - « out of the sample»
spécifications
Sous échantillons
1 2 3
1
Estimation «in the sample»
231 défauts 1800 non-défauts
Estimation «in the sample»
231 défauts 1801 non-défauts
Prédiction «out of the sample» 232 défauts
1800 non-défauts
2
Estimation «in the sample»
231 défauts 1800 non-défauts
Prédiction «out of the sample» 231 défauts
1801 non-défauts
Estimation «in the sample»
232 défauts 1800 non-défauts
3
Prédiction «out of the sample» 231 défauts
1800 non-défauts
Estimation «in the sample»
231 défauts 1801 non-défauts
Estimation «in the sample»
232 défauts 1800 non-défauts
La spécification 1 utilise les sous-échantillons 1 et 2 pour l’estimation «in the sample» et le sous-
échantillons 3 pour la prédiction «out of the sample». Le principe est reproduit pour les autres
spécifications en changeant à chaque fois les combinaisons.
Variables explicatives
41
6. VARIABLES EXPLICATIVES
Étant donné que l’on travaille sur la base des résultats de Simard (2012), nous exposerons dans la
présente section les variables explicatives utilisées ainsi que les signes obtenus dans ces
régressions. Ainsi, selon la littérature évoquée dans le présent travail, les pratiques de la banque
en étude et la disponibilité des données, les variables explicatives retenues sont regroupées en
différentes catégories et définies dans le tableau 3. Cette approche s’apparente à celle en vigueur
dans la littérature, qui en plus d’avoir identifié cinq catégories de variables explicatives, établit la
nécessité de tenir compte des variables de contrôle.
Une attention particulière sera portée aux variables ROA et Actif à court terme/Passif à court
terme, puisque Simard (2012), bien qu’ayant trouvé 8 variables significatives, en arrive à la
conclusion qu’un modèle avec 10 variables explicatives serait le mieux indiqué pour capter la
dynamique des défauts. En occurrence, ce modèle s’alignerait parfaitement avec le modèle
Riskcalc PlusTM de Moody’s dont on suppose que la banque en étude se sert comme outil. Nous
étudierons en profondeur dans la section des résultats les signes obtenus dans les régressions et
reproduits dans le tableau 3. Nous reproduisons toutes les variables explicatives répertoriées au
début de l’étude et les sections subséquentes montreront les étapes qui ont conduit à la
spécification finale.
Variables explicatives
42
Tableau 3: Variables explicatives
Catégories de variables
explicatives
Types de ratios et autres
Variables explicatives Signes
attendus Signes
trouvés Revues
Variables financières
Ratio de liquidité
Ratio de liquidité courante (ou fonds de roulement)
- - a, b, c, f, j
Équité/ Actifs totaux - -
Actifs court terme / Dette totale - +
Ratio de profitabilité Rendements sur actif moyen (ROA) - - c, f
Fonds disponibles - +
Ratio d’endettement Dette / Équité + - e
Ratio de couverture
Ratio de couverture - - h
Lag ratio de couverture - +
Différence entre le ratio de couverture et son retard
-
Ratio de croissance
Croissance des ventes - + c, f
Ratio de croissance de la marge brute
- +
Ratio de croissance de du bénéfice net
- +
Variables de contrôle
Année ? - g, h
Autres variables financières
Taille de la firme-ventes -/ ? - b, f
Tailles de la firme-actifs -/ ? b, f
Dette de la banque/dette totale ? -
Engagement total ? -
But du prêt
Fonds de roulement ? +
Immobilisation ? +
Changement de propriétaire ? + h, d
Refinancement et autre ? +
industries
Manufacture ? + h
Agriculture et construction ? + h, g
Vente en détail ? + h
service ? + h, g autres ? s.o. h
Variables explicatives
43
Le tableau 3 tient compte entre autres des études qui ont utilisé les mêmes variables explicatives
que les modèles à l’étude dans le présent travail. Ces études sont les suivantes :
a. Edminster(1972)
b. Altman et Ohlson (1980)
c. Beaulieu (2003)
d. Lopez (2006)
e. Altman et Sabato (2007)
f. Bonfim (2009)
g. Fidrmuc et Hainz (2010)
h. McCann et McIndoe (2012)
Dans ce qui suit, nous exposons ce qui explique le choix de chaque poste comptable ainsi que sa
pertinence dans la prédiction du défaut et ce, en égard particulièrement aux pratiques de la
banque en étude et de la littérature existante comme nous l’avons déjà souligné.
Les ratios de liquidité sont de bons indicateurs de la capacité d’une entreprise à faire face à ces
dettes à court terme et ils sont utilisés en analyse financière. Bien qu’ils soient assez nombreux,
nous porterons notre attention sur le ratio de liquidité courante qui est une fonction positive de
la capacité de l’entreprise à honorer ses dettes. Les pratiques de la banque à l’étude sont telles
que «les actifs et les passifs à court terme comprennent tous les postes à ce nom au bilan et non
seulement ceux plus liquides (utilisés dans le calcul du ratio de liquidité immédiate)», Simard
(2012).
Les ratios de solvabilité témoignent de la capacité de la firme à rembourser sa dette sur le long
terme. Ainsi les firmes avec des ratios de solvabilité plus élevés, seront plus aptes à soutenir leurs
Variables explicatives
44
dettes de sorte qu’il est moins probable qu’elles fassent défaut. Notre attention se portera sur
celui de l’équité divisée par les actifs totaux dans le présent travail.
Compte tenu des contraintes de liquidité auxquelles font face les entreprises, nous utiliserons
également le ratio d’actifs à court terme sur la dette totale, qui tient compte de ces contraintes
et de fait, parait déterminant pour prédire le défaut de l’emprunteur.
Les ratios de rentabilité évaluent dans quelle mesure une firme est capable de générer des
bénéfices. Nous travaillerons avec deux de ces ratios : le ratio de rendement sur actif qui «
témoigne de l’efficacité de la firme à générer des revenus grâce à ces actifs», Simard (2012) et
les Fonds de roulement qui est «une mesure développée par la banque en étude afin de parer
aux manipulations comptables qui affectent le BAIIA (bénéfice avant intérêts, impôts et
amortissement)». Plus de détails sont rapportés dans Simard(2012) quant aux méthodes que la
banque utilise pour cette métrique, la logique sous adjacent à son utilisation étant donné que
c’est une fonction négative du défaut comme le BAIIA.
Le ratio d’endettement mis à contribution dans le présent travail est celui de la Dette/Équité, qui
traduit la capacité de la firme à résorber un choc. De par sa définition, il parait clair que c’est une
fonction positive de la probabilité de défaut. Par ailleurs, comme explicité dans Simard(2012), «en
lien avec le risque moral ex post, les firmes endettées et devant payer d’importantes redevances
à leur banque sont plus enclines à déclarer défaut».
Le ratio de couverture définit la capacité de la firme à dégager suffisamment de marge
d’exploitation pour supporter sa dette courante ou un refinancement de sa dette tout en
continuant son activité. Il parait alors déterminant dans la prédiction du défaut d’un emprunteur.
En effet, un ratio supérieur à 1 indique que l’entreprise est en mesure d’honorer ses obligations
alors qu’un ratio inférieur à 1 traduit un manque de fonds ne pouvant soutenir la dette. Le calcul
de cette métrique est rapporté dans Simard (2012) et sera reproduit en annexe.
Variables explicatives
45
La prochaine classe de variable est celle des taux de croissance de l’entreprise. Si au premier
abord, cette classe de variables semble être une fonction négative de la probabilité de défaut,
Beaulieu (2003) a établi qu’il existe une relation en U entre ces ratios et la probabilité de défaut.
En effet «dans le cas d’une croissance rapide et soutenue, il est peu probable que les bénéfices
non répartis de la firme soient suffisants pour couvrir les nouveaux besoins ainsi créés, ce qui peut
ainsi forcer cette dernière a contracter une dette supplémentaire et être exposée au risque qui y
est relié», Simard (2012). Notre attention portera particulièrement sur le ratio de croissance des
ventes dans le présent travail.
Une synthèse de la littérature traitant de ce sujet indique la nécessité de tenir compte de la taille
de la firme dans la prédiction du défaut. Bien que son effet semble inconsistant d’une étude à
une autre (Bun et Redwood (2003) trouveront que c’est une fonction négative du défaut alors que
Benito et al, 2004 arriveront à la conclusion opposée), elle demeure un facteur prépondérant dans
la prédiction du défaut. Le proxy retenu par Simard (2012) est celui des ventes.
À l’instar de McCann et McIndoe (2012), qui ont établi la nécessité de spécifier les secteurs
auxquels les emprunteurs se rapportent dans la prédiction du défaut, Simard (2012) a défini 4
catégories de secteurs compte tenu des secteurs d’activité des clients de la banque. Elle établira
que cette classe de variables est pertinente dans la prédiction du défaut et rejoint McCann et
McIndoe (2012) sur la significativité des secteurs de la construction et de la manufacture.
La dernière catégorie de variable est celle de «but du prêt». Elle englobe cinq familles : les prêts
de fonds de roulement, les prêts pour achat ou améliorations d’immobilisations, les prêts
relatifs à un changement de propriétaire et finalement les prêts de refinancement et autre.
Cette variable tient compte également des pratiques de la banque de par son caractère à traduire
le déficit de garantie par rapport au collatéral sur le prêt. Simard (2012) apporte plus de détails
quant aux proportions qui définissent les pratiques de la banque ainsi que les spécifications
propres à chaque famille.
Données
46
7. DONNÉES8
La base de données est celle élaborée par Simard (2012). Il s’agit d’un échantillon de prêts
octroyés par la banque durant les années 2007 et 2008. Plus précisément, les données recueillies
sont sur la période d’avril 2006 à mars 2007 et celle d’avril 2007 à mars 2008, mars étant la fin
d’année financière de la banque en étude. La majorité des emprunteurs dans cet échantillon sont
des PME et Simard (2012) le démontre dans son test de stabilité.
Les caractéristiques suivantes définissent les prêts qui sont déclarés en défaut :
1- Les prêts transférés aux comptes spéciaux suite à trois non-paiements consécutifs (ou
arrérages),
2- Les prêts pour lesquels le remboursement est improbable,
3- Les prêts inscrits en perte dans les livres de la Banque.
Le tableau 4 donne un résumé des statistiques descriptives des défauts par secteur. On peut voir
que les secteurs de « construction et agriculture» et «manufacture» enregistrent les plus grands
taux de défaut. Ce sont ces deux secteurs qui seront statistiquement significatifs dans nos
régressions pour expliquer le défaut. Il en de même pour les variables de la catégorie de but du
prêt, les prêts relatifs «au fonds de roulement» et «au changement de propriétaire», qui ont le
grand pourcentage de défaut, sont les variables qui seront retenues dans notre modèle final.
8 Simard, Adréanne 2012
Données
47
Tableau 4: Statistique descriptive des données de défaut
Année 2007 2008
Défauts 295 399
variables observations Défauts En pourcentage
But du prêt
Fonds de roulement
1472 293 19,90%
Immobilisation 3378 278 8,23%
Refinancement et autre
517 42 8,12%
Changement de propriétaire
728 81 11,13%
industries
Manufacture 1871 294 15, 71%
Agriculture et construction
1250 138 11,04%
Ventes en détails
1391 135 9,71%
Service 1366 112 8,20%
Autre 217 15 6,91%
Ayant fait l’hypothèse que les prêts sont contractés par des compagnies différentes sur toute la
période d’étude et ce, à la suite de son incapacité à établir le nombre de prêts octroyés à la même
entreprise sur les deux ans, Simard (2012) a traité les données en coupe transversale. Nous
traiterons les données en coupe transversale également. Notre échantillon est constitué à cet
effet, de 6095 observations, soit le nombre de prêts octroyés durant la période d’étude, dont 295
ont fait défaut en 2007 et 399 ont fait défaut en 2008.
Plusieurs ratios ont été calculés par Simard (2012) pour établir la base de données. Nous les
reproduisons en annexe ainsi que les définitions des termes.
Vous pouvez vous référer à Simard (2012) qui explique les pratiques de la banque par rapport aux
variables utilisées dans le présent travail et la méthodologie mis à contribution pour analyser les
prêts et les défauts, en l’occurrence les dates minimales supposées des défauts, d’autorisation et
Données
48
de vérification. Elle apporte également des précisions sur les raisons qui ont animé les hypothèses
que nous avons supposées également.
Résultats
49
8. RÉSULTATS :
8.1 Partie 1 : Réplication Simard (2012)
La première partie de ce travail consistera à répliquer le travail de Simard (2012) et d’en reporter
un résumé des résultats. Cet exercice nous servira de tremplin pour la suite de notre analyse et
permettra aux lecteurs de définir un fils conducteur de la suite des résultats. S’agissant d’un
résumé, il est à noter que les résultats seront commentés que brièvement, le lecteur pourra se
référer à Simard (2012) pour amples détails.
8.1.1 STATISTIQUES DESCRIPTIVES
Il apparaît comme dans Simard (2012) que les entreprises de notre échantillon sont en bon état
avec un ratio en croissance des ventes de l’ordre de 85% en moyenne et des ratios de couverture
de 1,4 en moyenne. La plupart des ratios vont dans ce sens (rendement sur actif, fonds de
roulement, etc…). Ce constat est d’autant plus marquant que la période d’étude s’étend sur deux
ans et au début d’une période de crise financière. Toutefois, il a été établi que la majorité des
crises financières sont précédées par des périodes de croissance et de bonne santé financière
(Kaminsky et Reinhard (1999)). Ainsi, bien que les entreprises de notre échantillon soient assez
endettées avec la majorité de leur dette contractée auprès d’autres institutions financières, cela
pourrait expliquer le niveau de croissance des ventes et de leurs santés financières.
8.1.2 MATRICE DE CORRÉLATION
La matrice de corrélation traduit les mêmes résultats que Simard (2012) et a été reproduite dans
l’annexe. Il apparaît ainsi que :
La variable, ratio de couverture est significativement et positivement corrélée avec
les variables Actif à court terme/Dette totale et Équité/Actifs totaux. Toutefois,
seule la variable ratio de couverture est retenue dans notre modèle final. Ces
relations n’affecteront pas alors la qualité de notre inférence finale.
Résultats
50
On remarque également que les variables qualitatives de la même classe sont
fortement corrélées. Ainsi, toutes les variables de la catégorie « but du prêt» sont
fortement et négativement corrélées entre elles. Il en est de même pour les
variables de la catégorie «industries», qui ont une relation linéaire négative et assez
importante. Toutefois, seules les variables «but du prêt-fonds de roulement »;
«but du prêt-changement de propriétaire» de la catégorie but du prêt et les
variables «industrie-manufacture» ; «industrie-agriculture et construction» de la
catégorie secteur d’activités seront retenues dans notre spécification finale.
D’une manière générale, les signes des coefficients de corrélation de nos variables explicatives
suivent pour la plupart les intuitions ainsi que les attentes. Nous avons porté notre attention sur
les variables qui sont corrélées avec celles de notre spécification finale, le lecteur pourra se référer
à Simard (2012) pour plus détails sur l’analyse de la matrice de corrélation.
8.1.3 RÉSULTATS DES RÉGRESSIONS
Toutes les régressions reproduites sont des régressions robustes qui corrigent pour
l’hétéroscédasticité des erreurs selon le test de White.
a. Spécification 1 : Régression probit avec les variables financières
La spécification ne prenant en compte que les variables explicatives a établi que les variables
croissance des ventes, ratios de couvertures sont significatives à un niveau de 5% et la variable
ROA l’est à 10%. Toutefois, seules les variables croissance des ventes et ratios de couvertures
seront retenues dans notre spécification finale. Il est à noter que la variable Équité/ Actifs totaux
bien que pas significative dans la présente régression ainsi que dans notre spécification finale,
sera significative dans des régressions ultérieures.
Résultats
51
b. Spécification 2 : Régression probit avec toutes les variables (22 variables).
Cette régression a été effectuée sur deux volets : dans un premier temps en retenant comme
proxy de la taille de firme les ventes et dans un second temps les actifs comme proxy de la taille.
Il en résulte que ni les ventes ni les actifs ne sont significatifs. Il paraît toutefois, au vu de la
littérature existante que les ventes aient une certaine prépondérance sur les actifs comme proxy
en général de la taille de la firme. Elle ne sera néanmoins pas retenue dans notre spécification
finale. En effet, l’objectif escompté étant d’avoir le modèle le plus parcimonieux avec le plus de
précision, cette variable n’étant pas significative, elle n’apporte aucun pouvoir explicatif au
modèle. Les variables «but du prêt – refinancement et autre» et «industrie-autre» sont des
variables de référence et ne seront pas incluses dans les régressions (voir Simard (2012) pour plus
de détails). Le reste de nos résultats s’alignent avec ceux de Simard (2012) et compte tenu de la
forte corrélation entre les variables qualitatives de la catégorie «but du prêt», seules les deux qui
sont significatives seront retenues pour la suite de la spécification. Pour les variables de la
catégorie «secteurs d’activités », bien que seule la variable «manufacture» est significative (voir
détail dans Simard (2012)), nous en retiendrons trois. Ce choix s’explique par le fait que les trois
variables retenues déterminent la probabilité de défaut dans les études antérieures ce qui laisse
supposer que la présence de multicolinéarité entre nos variables, biaise fortement notre
inférence. En effet, on observe des corrélations de l’ordre de 27% à 30% entre les variables de
cette catégorie. Par ailleurs, les résultats ultérieurs s’aligneront sur les études antérieures puisque
notre spécification finale prendra en compte les variables «secteur-agriculture et construction»
et «secteur-manufacture». Ainsi bien que seulement six variables se relèveront indicatives dans
notre régression globale, les 17 variables suivantes seront retenues pour la prochaine étape :
Année, taille-proxy-ventes, D/E, D Banque/Dtot, E/A tot, Fonds de roulement, A CT/ Dtot,
Croissance des ventes, ROA, Fonds disponibles, ratio de couverture, engagement total, «but du
prêt-fonds de roulement», «but du prêt-changement de propriétaire», «industrie-
manufacture», «industrie- agriculture et construction»,« industrie-vente au détail».
Résultats
52
c. Spécification3 : régressions probit avec 17 variables
Après avoir effectué notre régression probit avec les variables retenues à partir du modèle 2,
seules les variables Équité/Actifs totaux ; ratio de couverture sont significatives à 10% et les
variables croissance des ventes; «but du prêt-fonds de roulement» ; «but du prêt-changement
de propriétaire» ; «industrie-manufacture» ; «industrie-agriculture et construction» sont
significatives à 5%. Il est assez étonnant de constater que la variable Taille estimée par les ventes
ne soit pas significative dans le présent travail puisque Simard (2012) trouve qu’elle l’est et de
même que la plupart des études établissent l’importance de la taille d’une entreprise dans la
prédiction du défaut. Pour la prochaine étape, nous retiendrons les variables qui ont été
significatives ainsi que la proxy de la taille pour établir notre spécification finale puisque certaines
variables par construction sont fortement corrélées.
d. Spécification 4: régressions robust probit avec les variables explicatives significatives (8 variables)
Cette régression est effectuée avec les variables significatives et la proxy de la taille de la firme.
Toutes les variables retenues seront significatives et avec le signe obtenu précédemment sauf la
variable Équité/Actifs totaux et la variable les ventes comme proxy de la de taille.
Comme suggéré par Simard (2012), une régression a été effectuée en ajoutant les variables Actifs
totaux/Dette totale et ROA à la spécification de 8 variables. La variable ROA devient significative
à un niveau de 10% et la variable Actifs totaux/dette totale demeura non significative. Toutefois,
la variable ROA ne sera pas retenue dans notre modèle final, les tests de performance ayant établi
que son ajout n’apporte pas de précision supplémentaire à notre modèle.
Nous avons refait la régression en excluant les variables Équité/Actifs totaux et les ventes
comme proxy de la taille de la spécification à 8 variables. Toutes les variables explicatives
retenues alors sont restées significatives avec les mêmes signes observés qu’antérieurement.
Résultats
53
Ainsi notre modèle final ne prenant en compte que les variables significatives à la suite de nos
régressions antérieures, comptera deux variables financières et 4 variables qualitatives :
croissance des ventes; ratio de couverture, les variables «but du prêt-fonds de roulement »;
«but du prêt-changement de propriétaire» ; «industrie-manufacture» ; «industrie-agriculture
et construction». Ce résultant est d’autant plus frappant qu’il met en exergue la nécessité de tenir
compte des variables qualitatives dans la détermination du défaut telle qu’établit par Fidrmuc et
Hainz (2010) et McCann et McIndoe (2012). Notamment, la variable «agriculture et construction»
que les auteurs trouvent également pertinente dans l’explication du défaut (il faut souligner
toutefois que Fidrmuc et Hainz (2010) font la distinction entre les secteurs agriculture et
construction et ils trouvent que seule l’agriculture est significative dans la prédiction du défaut).
Nous avons effectué à cet effet une étude pour isoler les effets de ces variables sur le défaut d’une
entreprise et établir la pertinence de leurs utilisations dans notre modèle. Les résultats sont
reproduits dans les sections subséquentes.
e. Régressions logit
Les spécifications suivantes ont été testées pour valider notre modèle probit par rapport au logit :
Modèle 7: Logit avec les 17 variables explicatives
Modèle 8 : Logit avec les 10 variables explicatives
Modèle 9 : Logit avec les 8 variables explicatives
Modèle 10 : Logit avec les 6 variables explicatives
On trouve les mêmes résultats pour les spécifications respectives par rapport au probit (même
signe et même variables significatives). Le logit servant de benchmark dans la présente étude, il
corrobore ainsi la pertinence de la spécification choisie.
Résultats
54
Nous reproduisons un résumé des différentes spécifications dans ce qui va suivre qui sera plus
facile à utiliser dans la suite du travail.
Tableau 5 : Modèles correspondant aux différentes estimations
Modèles Spécification Nombres de
variables explicatives
Modèle 1 probit 9 variables
Modèle 2 probit 22 variables
Modèle 3 probit 17 variables
Modèle 4 probit 10 variables
Modèle 5 probit 8 variables
Modèle 6 probit 6 variables
Modèle 7 logit 17 variables
Modèle 8 logit 10 variables
Modèle 9 logit 8 variables
Modèle 10 logit 6 variables
Cette section qui visait à reproduire le travail de Simard(2012) se démarque toutefois des
conclusions et suggestions de son étude. En effet, contrairement à la suggestion d’une
spécification finale avec 10 variables explicatives, notre spécification finale prend en compte 6
variables explicatives. Cette différence s’explique par le fait que nous privilégions la spécification
finale la plus parcimonieuse possible ne prenant en compte que les variables explicatives
significatives. L’ajout de quatre variables supplémentaires n’apporte pas plus de précision à notre
modèle. Cette conclusion se traduira à travers nos différents tests de performance.
8.1.4 SIGNES DES COEFFICIENTS DES RÉGRESSIONS ET INTERPRÉTATION ÉCONOMIQUE DES VARIABLES EXPLICATIVES SIGNIFICATIVES
Les signes obtenus pour les variables explicatives de notre spécification finale sont ceux obtenus
par Simard(2012). Pour donner une dimension économique à nos variables explicatives, il nous
faut, dans un premier temps, les interpréter par rapport à leurs effets marginaux. Ses effets
tiennent compte de leurs vrais impacts sur la probabilité de défaut. En effet, les coefficients des
régressions probit et logit indiquent que des effets partiels de ces variables sur la probabilité de
défaut.
Résultats
55
Ainsi, contrairement au signe attendu, le coefficient de la variable croissance des ventes est
positif. Bien que contre-intuitif, ce résultat pourrait s’expliquer par le fait qu’une croissance non
soutenue pourrait entrainer une hausse de la probabilité de défaut. Ce constat est d’autant plus
marquant que la croissance moyenne des ventes des entreprises de notre échantillon est de 85%.
La variable ratio de couverture a le signe attendu, soit un effet négatif sur la probabilité de défaut.
En effet, ce ratio témoigne de la capacité de l’entreprise à soutenir une nouvelle dette tout en
continuant ces activités et en honorant ses engagements court terme. Ainsi, un ratio supérieur à
1 témoigne de la couverture suffisante de l’engagement. Ce signe négatif suppose alors que la
plupart des compagnies de notre échantillon sont capables de soutenir leurs dettes tout en
continuant leurs activités. Ce résultat est soutenu par l’observation du niveau moyen de ce ratio,
soit de l’ordre de 1,4, témoignant d’une couverture suffisante en moyenne pour les entreprises
de notre échantillon.
Les variables qualitatives ont toutes un effet positif sur la probabilité de défaut. Ce qui semble
indiquer que les secteurs répertoriés et les projets nécessitants les prêts octroyés seraient
quelque peu risqués. Les deux secteurs retenus dans notre spécification finale sont des secteurs
qui suivent le cycle conjoncturel. Les petites et les moyennes entreprises ont très peu de marge
de manœuvre par rapport aux grandes entreprises notamment en période de récession. Si on
ajoute à cela, la spécificité de ces secteurs à suivre le cycle économique, leurs effets positifs sur la
probabilité prennent tous leurs sens. Quant aux variables but du prêt, un changement de
propriétaire peut marquer un changement de culture de gestion qui est un facteur déterminant
dans la réussite des projets de l’entreprise. On prend la mesure de cette variable notamment dans
la politique d’étude de la banque pour l’octroi des prêts à travers la formation et le parcours
professionnel des gestionnaires de l’entreprise. Les prêts relatifs au fonds de roulement visent
généralement à injecter des liquidités à des fins de croissance et de développement de marché.
En particulier, les prêts de cette nature ont une propension à ne pas être garantis, soit générant
Résultats
56
un déficit en garantis de 100%9. Ainsi, le caractère fortement aléatoire de ces deux catégories
témoigne de la propension d’augmenter la probabilité de défaut des emprunteurs qui ont recours
à des prêts pour les raisons qui y sont classifiées.
8.1.5 TEST DE VALIDITÉ DU MODÈLE
Le test du ratio de vraisemblance que nous avons défini antérieurement, est mis à contribution
dans le présent travail pour valider notre spécification finale.
Comme dans Simard (2012), le premier test qui consiste à comparer le modèle 2 au modèle 3
nous confirme que le modèle 3 a une meilleure spécification. De même, le modèle 4 apparaît
comme une meilleure estimation du modèle 3. Enfin, le dernier test indique que notre
spécification finale est une meilleure estimation par rapport au modèle 5 au seuil de significativité
de 1%. Ainsi, l’ajout des variables Équité/Actifs totaux et les ventes comme proxy de la taille à
notre spécification finale n’apportent pas de précision supplémentaire au modèle.
Ces conclusions nous confortent dans le choix de notre spécification finale.
Le Tableau 6 résume les résultats sous-jacents à cette analyse où on désigne par H0 le modèle restreint
et H1 le modèle non restreint.
Tableau 6: Résultats des tests de vraisemblance respectifs 10
Modèles comparés Résultats tests
H0 = modèle 3 Versus H1 = Modèle 2 LR chi2(5) = 1.59
Prob > chi2 = 0.9028*/**/***
H0 = Modèle 4 versus H1 = Modèle 3
LR chi2(7) = 8.13 (Prob > chi2 = 0.3213*/**/***
H0 = Modèle 5 versus H1 = Modèle 4
LR chi2(2) = 5.47 Prob > chi2 = 0.0649*/**
H0 = Modèle 6 versus H1 = Modèle 5
LR chi2(1) = 4.95 Prob > chi2 = 0.0261*
9 Simard (2012)
10 * correspond à un seuil de rejet de 1%, ** correspond à un seuil de rejet de 5%, *** correspond à un seuil
de rejet de 10%.
Résultats
57
8.1.6 TEST DE STABILITÉ
Pour ce faire, selon la méthodologie adaptée par Simard (2012), nous avons effectué les
régressions des modèles 3 et 7 en éliminant de notre échantillon les percentiles extrêmes à 1% et
5% (voir Simard (2012) pour les détails) par rapport aux ventes. On en arrive aux mêmes
conclusions que Simard (2012), à savoir que :
- les résultats diffèrent d’un échantillon à un autre (échantillon avec 1% des percentiles
extrêmes éliminés versus échantillon avec 5% des percentiles extrêmes éliminés),
- Il n’y pas de changement significatif pour l’échantillon de premier percentile par rapport aux
résultats obtenus à partir de tout l’échantillon or mis pour la variable Fonds disponible (non
significative), qui devient négatif dans la régression du modèle3. Ceci traduit un résultat
satisfaisant d’un point de vue de stabilité du modèle.
- On note des changements notables dans la régression du modèle 3 avec le cinquième
percentile. En effet, certaines variables deviennent significatives notamment la variable
année «portant à croire que les prêts octroyés durant la deuxième année ont une plus faible
probabilité de défaut que ceux de 2007», Simard (2012).
Le lecteur peut se référer à Simard (2012) pour plus de détails par rapport aux différents
changements dans les résultats.
Résultats
58
8.2 Partie 2 : Régressions supplémentaires
Outre de rebondir sur le travail de Simard (2012), nous nous sommes beaucoup inspirées du
travail de McCann et McIndoe (2012), qui s’inscrit parfaitement dans ce contexte. À cet effet,
nous avons effectué diverses régressions qui suivent cette optique : une régression probit avec
toutes les variables qualitatives et des régressions probit avec chaque classe de variables
qualitatives respectivement.
8.2.1 RÉGRESSION AVEC LES VARIABLES BUT DU PRÊT
Toutes les variables explicatives de cette catégorie sont significatives à un seuil 10%
contrairement aux résultats de nos régressions antérieures. En effet, les variables «but du prêt-
immobilisation» et «but du prêt-Refinancement» n’étaient pas significatives lorsqu’on les a
mises à contribution avec les autres variables du modèle initial. Par ailleurs, il est assez intéressant
de voir que cette classe de variables à elle seule, a une mesure AUC de 0.6132. Ce résultat met
en exergue la nécessité de tenir compte des caractéristiques propres tant aux gestionnaires de
l’entreprise qu’à la gestion elle-même, puisque ces critères peuvent déterminer entre autres le
but du prêt.
8.2.2 RÉGRESSION AVEC LES VARIABLES SECTORIELLES
Les variables «industrie-service» et «industrie-vente en détail» ne sont pas significatives dans la
prédiction du défaut. La variable «construction-agriculture» que l’on trouve dans la spécification
de McCann et McIndoe (2012), expliquera quant à elle, plus précisément le défaut. Ainsi telle que
défini par ces deux auteurs, le secteur d’activité est prépondérant dans la détermination du
défaut d’une entreprise.
Résultats
59
8.2.3 RÉGRESSION AVEC TOUTES LES VARIABLES QUALITATIVES
Seules les variables« industrie-service» et «industries-vente en détail» ne sont pas significatives
à un seuil de 10% comme lorsqu’on a effectué la régression des variables de la catégorie-industrie.
On a une mesure AUC de l’ordre de 0.6476, assez révélateur quant à la pertinence de ces variables
dans la prédiction du défaut. En effet, d’une part, dans la régression ne prenant en compte que
les variables financières dans la prédiction du défaut, la mesure AUC est de l’ordre de 0.5579.
Cette mesure de performance qui traduit «la théorie d’un modèle dit naïf»11 (soit le modèle
aléatoire, qui n’est pas discriminant) marque une différence notable avec le modèle ne prenant
en compte que les variables qualitatives. D’autre part, la mesure AUC de la spécification finale est
de 0.6598 (probit), ce qui ne fait pas une différence notable par rapport au modèle ne prenant en
compte que les variables qualitatives. Il paraît clair que le secteur d’activité de l’emprunteur et
les raisons qui animent l’emprunt, déterminent fortement la probabilité de défaut (comme
souligné par les auteurs McCann et McIndoe(2012) et Fidrmuc et Hainz (2010)).
La section qui va suivre nous permettra de prendre la mesure de cette analyse préliminaire à
travers les différentes mesures de performance de notre modèle.
11 Dionne et al. , Estimation of Default Risk of Publicly Traded Companies : Evidence from Canada data
(2008)
Résultats
60
8.3 Partie 3 : validation et évaluation de la spécification finale
Cette section vise à valider notre spécification finale à travers diverses métriques et à mesurer sa
performance prédictive.
8.3.1 TEST DE SIGNIFICATIVITÉ
Le premier test de validité du modèle, soit le ratio de vraisemblance a été utilisé dans le travail de
Simard (2012). Le test de Wald vient consolider ces conclusions quant à la pertinence de notre
spécification finale.
Les résultats des différents tests individuels de Wald et du test joint sont regroupés dans le
tableau 7. Il apparait que ce test s’aligne parfaitement avec nos conclusions. En effet, les
coefficients des variables explicatives de notre spécification finale sont tous significatifs.
Notamment, le test joint rejette l’hypothèse nulle à un seuil de significativité de 1%.
Tableau 7: Résultats du test de Wald
Types de test Variables testées Statistique test et p-value
Test individuel
Croissance des ventes chi2(1) = 5.74
Prob > chi2 = 0.0166
Ratio de couverture chi2(1) = 4.47
Prob > chi2 = 0.0345
But du prêt-Fonds de roulement chi2(1) = 127.25
Prob > chi2 = 0.0000
But du prêt-Changement de propriétaire
chi2(1) = 5.76 Prob > chi2 = 0.0163
Industrie- Manufacture chi2(1) = 46.70
Prob > chi2 = 0.0000
Industrie- Agriculture et construction
chi2(1) = 6.97 Prob > chi2 = 0.0083
Test joint Toutes les variables explicatives chi2(6) = 185.28
Prob > chi2 = 0.0000
Résultats
61
8.3.2 LE CRITÈRE D’INFORMATION AKAIKE (AIC) ET LE CRITÈRE D’INFORMATION DE BAYES (BIC)
Les tableaux ci-dessous résument les mesures AIC et BIC obtenues pour nos différents modèles.
Tableau 8 : Mesures AIC et BIC pour les spécifications probit
Modèles- probit AIC BIC
Modèle 3 4145.031 4265.905
Modèle 4 4139.162 4213.029
Modèle 5 4140.632 4201.069
Modèle 6 4138.575 4185.582
Tableau 9 : Mesures AIC et BIC pour les spécifications logit
Modèles - Logit AIC BIC
Modèle 7 4145.281 4266.155
Modèle 8 4139.685 4213.553
Modèle 9 4141.34 4201.777
Modèle 10 4139.248 4186.255
Il paraît la mesure BIC est préférable pour analyser les résultats de la validation du modèle. En
effet, bien que cette mesure soit plus pénalisante quant à l’ajout de nouvelle variable, elle semble
plus consistante dans les résultats produits et permet une meilleure lecture de nos conclusions.
Ainsi, notre spécification finale à la plus petite mesure BIC, ce fait corrobore le choix de notre
spécification finale. La même logique apparaît avec notre modèle benchmark, le logit, où notre
spécification avec 6 variables explicatives a la plus petite mesure BIC respectivement. Ces résultats
nous permettent de conclure que l’ajout de nouvelles variables n’apporte pas plus de précision à
notre spécification finale.
Résultats
62
8.3.3 TEST DE PERFORMANCE: TEST D’HOSMER-LEMESHOW
Ce test qui vise à mesurer la performance prédictive de notre modèle conduit au non- rejet de
l’hypothèse nulle. Ainsi, on peut conclure que l’ajustement global du modèle aux données est
satisfaisant.
Résultat du test d’Hosmer-Lemeshow
number of observations = 6095
number of covariate patterns = 6027
Pearson chi2(6020) = 6057.53
Prob > chi2 = 0.3641
La prochaine section nous permettra de baliser cette performance à travers le pouvoir
discriminatoire du modèle.
8.3.4 ROC CURVE
Toujours en vue de mesurer la performance prédictive de notre modèle, nous avons dérivé la ROC
curve des modèles 2, 3, 4, 5, 6. On peut déjà constater que le degré de précision de nos modèles
est plus au moins acceptable et ce, malgré le fait que le test de performance et les tests de
spécification aient été concluants. En effet, la mesure AUC n’atteint les 70% dans aucun des
modèles. Ainsi, la mesure AUC du modèle 2, soit celui avec toutes les variables explicatives est de
l’ordre de 0.6639 comparativement celle du modèle 3 (prenant en compte 17 variables
explicatives) 0.6633, ce qui n’est pas une différence notable. Ce fait est autant plus marquant par
rapport au modèle 4 dont la mesure AUC est de l’ordre de 66,06%. Ainsi l’ajout de 7 variables
explicatives n’apporte pas plus de précision au modèle, ce qui nous conforte dans la comparaison
des modèles 3 et 4. Le modèle 6 a une mesure AUC de 65,98% comparativement à celle du
modèle 5 de l’ordre de 65,72%. Ainsi, comme établi dans notre test de spécification, le modèle 6
demeure une meilleure estimation que le modèle 5. L’idée étant de dériver le modèle le plus
parcimonieux possible avec le degré de précision le plus élevée et surtout compte tenu de l’écart
Résultats
63
très faible entre les mesures AUC, on peut déduire que notre spécification finale est alors
satisfaisante.
Tableau 10 : Mesures AUC pour les spécifications probit
Modèles probit Mesures AUC
Modèle 2 0.6639
Modèle 3 0.6633
Modèle 4 0.6606
Modèle 5 0.6572
Modèle 6 (spécification finale) 0.6598
La régression logit s’inscrit dans la même optique puisque les résultats restent cohérents avec
celui des modèles probit. Les mesures AUC respectives avec les régressions logit prenant en
compte les mêmes variables explicatives sont à peu près du même ordre que celles des
régressions probit correspondantes. Cette différence comme on l’a soulignée demeure
infinitésimale. La spécification finale demeure satisfaisante.
Tableau 11 : Mesures AUC pour les spécifications logit
Modèles logit Mesure AUC
Modèle 7 0.6632
Modèle 8 0.6604
Modèle 9 0.6568
Modèle 10 (spécification finale) 0.6599
Résultats
64
La figure 2 et la figure 3 correspondent aux roc-curves du modèle final avec la spécification probit
et la spécification logit respectivement.
Figure 2: Roc curve -modèle final probit)
Figure 3: Roc curve - modèle final (logit)
Résultats
65
8.3.5 PERFORMANCE DANS LA PRÉDICTION DU DÉFAUT: MATRICE DE CONFUSION (M-C)
Stata permet de dériver la proportion de bonnes classifications des défauts du modèle après
l’estimation d’un modèle. Elle produit une tabulation croisée des résultats observés et de ceux
prévus, où on prévoit un résultat positif si la probabilité est égale ou plus grande que 50%, soit le
seuil de conservatisme établi par défaut et, un résultat négatif sinon. On peut déduire de ces
classifications les informations requises pour la matrice de confusion. Toutefois, comme nous
l’avons souligné, le choix du seuil est établi de manière à générer la plus petite erreur de type I
possible et dégager le plus glus grand pouvoir prédictif des défauts. Aussi, notre analyse a été
faite en retenant des seuils plus conservateurs, soit un seuil de 20% et un seuil correspondant à
la fréquence des défauts dans la population, soit 11,34% (plus rigoureusement, en de ça de la
fréquence, qui est de 11,38%).
Tableau 12 : M-C avec un seuil de 20% (toute la population)
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 475
68,44% 2560
47,40%
Non - Défauts 219
31,56% 2841
52,60%
Total 694 5401
Tableau 13: M-C avec un seuil de 11,34% (toute la population)
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 558
80.40% 3347
61,97%
Non - Défauts 136
19,60% 2054
38,03%
Total 694 5401
L’exercice qui consiste à faire varier le seuil de conservatisme pour réduire les coûts en perte
d’intérêt et de capital est des plus intéressants. En effet, il apparait comme nous l’avons souligné
Résultats
66
antérieurement, que plus le seuil de conservatisme est restrictif, plus la proportion d’erreurs de
type I est moindre et celle d’erreur de type II, au contraire augmente. Ainsi, le pourcentage
d’erreur de type I passe de 31,56% pour un seuil de conservatisme établi à 20%, à 19, 60% lorsque
le seuil est de l’ordre de 11,34%. Le pourcentage d’erreur de type II augmente plutôt de 47,40%
à 61,91% pour des seuils de conservatisme de 20% et 11,34% respectivement. Compte tenu de
l’importance pour les banques de réduire les coûts engendrés par des erreurs de type I, le seuil le
plus conservateur nous semble le mieux indiqué. Cette conclusion est d’autant pertinente que le
pourcentage de bonne classification en termes de sensibilité du modèle, soit les défauts classés
correctement comme des défauts, augmente lorsqu’on est plus conservateur. En effet, la
proportion de défauts correctement prédits passe de 68,44% à 80,40% pour les deux seuils de
conservatisme considérés respectivement.
Ces résultats sont assez satisfaisants et indiquent la capacité du modèle à prédire le défaut.
8.3.6 ROBUST TEST : ESTIMATION ANNÉE 2007 VERSUS ESTIMATION ANNÉE 2008
Nous utilisions dans la présente section notre spécification finale avec les sous-échantillons
résultants de la première année et de la deuxième année respectivement.
8.3.6.1 Échantillon 2007
Probit : Avec 2511 observations, notre spécification finale mise à contribution avec notre sous-
échantillon de 2007 nous indique que toutes les variables explicatives sont significatives à un seuil
de 5% et 10% sauf la variable «industrie-agriculture et construction».
Logit : En utilisant notre spécification finale dans une régression logit mettant à contribution le
sous-échantillon de la première année, il apparaît que les variables croissances des ventes, «but
du prêt- fond de roulement», «but du prêt- changement de propriétaire et industrie-
manufacture» sont significatives aux seuils de 5% et 10% respectivement, alors que la variable
ratio de couverture est significative seulement au seuil de 10%. La variable «industrie-agriculture
et construction» demeure non-significative.
Résultats
67
8.3.6.2 Échantillon 2008
Probit : Avec un ensemble de 3584 observations mises à contribution dans notre spécification
finale, les résultats des régressions nous indiquent que les variables ratio de couverture et «but
du prêt changement de propriétaire» ne sont pas significatives.
Logit : Lorsque le modèle final est mis à contribution avec les données de la deuxième année et
ce, en estimant un logit, les mêmes variables demeurent non significatives : le ratio de couverture
et «but du prêt changement de propriétaire».
Il apparaît ainsi à la vue de cet exercice que :
1- Toutes les variables explicatives significatives sur la période au complet ne le
demeurent pas sur les sous-échantillons formés.
2- Ce n’est pas les mêmes variables qui expliquent les défauts de la première année et
ceux de la deuxième.
Cette différence peut s’expliquer par le fait que le climat économique diffère fortement pour les
deux sous périodes en étude dans le présent travail. L’année 2008 marquant le début des défauts
durant la crise financière, a vu des secteurs tels que la construction procyclique, réagir fortement
aux effets de la crise. Ce constat est d’autant plus pertinent, que notre variable de contrôle
«agriculture et construction», qui n’explique pas le défaut en 2007, devient significative en 2008.
Résultats
68
8.3.7 POUVOIR PRÉDICTIF:« ESTMATION IN THE SAMPLE» - «PRÉDICTION OUT OF THE SAMPLE »
Cette section vise à déterminer le pouvoir prédictif du modèle. Pour ce faire, différentes
spécifications de sous-échantillonnage ont été utilisées avec plusieurs seuils de conservatisme. Ce
changement de seuil vise essentiellement à déterminer le seuil qui nous permettra d’avoir la
meilleure proportion de bonne classification. Le second volet de changement se caractérise par
le fait qu’il permettra de prendre la dimension de l’influence de ce seuil sur la performance
prédictive du modèle, notamment les proportions d’erreur de type I et d’erreur de type II
résultant de nos différentes classifications.
8.3.7.1 Tirage aléatoire des observations
a. Estimation In sample (35% des observations)- Prédiction out sample (65% des observations) pour tout l’échantillon
Comme nous l’avons spécifié, nous avons formé 10 sous échantillons aléatoires dont les sous-
échantillons de 35% respectifs ont été utilisés dans un premier temps pour notre estimation «in
the sample». Il apparait qu’un seul sous échantillon aléatoire est représentatif de l’échantillon
dans son ensemble. En effet, tous les estimés de l’estimation du modèle avec ce sous-échantillon
sont significatifs.
Les tableaux 14 et 15 résument les matrices de confusion pour les prédictions «out of the sample»
selon différents seuils de conservatismes : 20% et 11,34%. Il apparait une fois de plus, que la
précision prédictive du modèle est très sensible à ce seuil de conservatisme. En effet, bien que la
classification des vrais négatifs (non-défauts réalisés correspondants non-défauts prédits, soit la
mesure de spécificité du modèle) diminue avec le seuil, on observe une augmentation des vrais
positifs (défauts réalisés correspondants aux défauts prédits, soit la mesure de sensibilité du
modèle). Par ailleurs, une diminution du seuil a pour effet d’augmenter la proportion d’erreurs
de type II et de diminuer la proportion d’erreurs de type I. Ainsi, lorsque le seuil de conservatisme
est 20%, la proportion d’erreurs de type I est de 23,26% et celles de type II est de 51,93%. Lorsque
le seuil passe à 11,34%, la proportion d’erreurs de type I diminue à 15,11% et celle d’erreurs de
type II augmente à 66,02%. La mesure de sensibilité, soit le taux de bonne classification de vrais
Résultats
69
positifs augmentent lorsque le seuil diminue, passant de 76,74% à 89,84%. La mesure de
spécificité, quant à elle, elle diminue lorsque le seuil devient plus conservateur.
Cette analyse met en exergue le trade-off auquel on fait face quant au choix de perte de revenu
(erreur de type I) ou de manque à gagner (erreur de type II). Toutefois, les banques canadiennes
sont réputées assez conservatrices dans leur politique de gestion du risque. Aussi, bien que
l’augmentation du seuil nous assure d’avoir à peu près les mêmes fréquences de défaut dans la
population et les sous-échantillons aléatoires, nous restons sur la conclusion que le seuil le plus
conservateur demeure le mieux indiqué.
Cette conclusion vient mettre en perspective le gain d’efficacité en termes de prédiction du
défaut dépendamment du niveau de conservatisme. Ce gain se définit par rapport à la diminution
de l’erreur de type I et à l’augmentation de la mesure de sensibilité du modèle. Si parallèlement
l’erreur de type II augmente et la mesure de spécificité du modèle diminue, la minimisation des
coûts et la capacité à prédire le défaut nous semblent assez prépondérantes pour maintenir un
seuil de conservatisme restrictif. Par ailleurs, le choix d’être le plus conservateur s’aligne avec la
culture de gestion de risque des banques canadiennes, donc de celle à l’étude.
Tableau 14 : M-C avec un seuil de conservatisme de 20%( 65% population)
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 320
76,74% 1840
51,93%
Non - Défauts 97
23,26% 1783
48,07%
Total 417 3543
Tableau 15 : M-C avec un seuil de 11,34% (65% de la population)
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 354
84,89% 2339
66,02%
Non - Défauts 63
15,11% 1204
33,98%
Total 417 3543
Résultats
70
b. Estimation «In sample» (40% des observations)- Prédiction «out of the sample» (60% des observations)
Pour la spécification correspondant à 40% des observations utilisées en estimation «in the
sample», sur les 10 échantillons aléatoires formés, nous avons 3 qui maintiennent la significativité
de toutes les variables explicatives. Pour chacun de ces sous-échantillons, nous fournissons les
matrices de confusion associées aux prédictions «out of the sample» correspondantes et ce, pour
différents niveaux de conservatisme. On trouve les mêmes conclusions qu’avec la spécification
35% in the sample et 65% out the of the sample et ce, pour les trois sous échantillons. Ainsi, la
proportion d’erreurs de type I et la proportion de bonne classification de vrais négatifs également
diminuent lorsque le niveau du seuil de conservatisme baisse et celle d’erreurs de type II
augmente. Comme dans la section précédente, la mesure de sensibilité devient meilleure avec le
resserrement du seuil, ce qui dénote aussi la capacité du modèle a bien classer les défauts comme
étant des défauts, donc à mieux les prédire.
i. Échantillon 1
Tableau 16: M-C avec un seuil de 20% (60% de la population-échantilonn1)
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 310
71,26% 1555
48,26%
Non - Défauts 125
28,74% 1667
51,74%
Total 435 3222
Tableau 17: M-C avec un seuil de 11,34%(60% de la population-échantilonn1)
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 348
80,00% 1959
60,80%
Non - Défauts 87
20,00% 1263
39,20%
Total 435 3222
Résultats
71
ii. Échantillon 2
Tableau 18 : M-C avec un seuil de 20%(60% de la population-échantilonn2)
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 251
67,47% 1582
48,16%
Non - Défauts 121
32,53% 1703
52,84%
Total 372 3285
Tableau 19: M-C avec un seuil de 11,34% (60% de la population-échantilonn2)
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 301
80,91% 2031
61,83%
Non - Défauts 71
19,09% 1254
38,17%
Total 372 3285
iii. Échantillon 3 :
Tableau 20 : M-C avec un seuil de 20%(60% de la population-échantilonn3)
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 241
61,48% 1284
39,33%
Non - Défauts 151
38,52% 1981
60,67%
Total 392 3265
Résultats
72
Tableau 21 : M-C avec un seuil de 11,34%(60% de la population-échantilonn3)
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 285
72,70% 1727
52,89%
Non - Défauts 107
27,30% 1538
47,11%
Total 392 3265
c. Estimation «In the sample» (45% des observations)- Prédiction «out of the sample» (55% des observations) :
Comme avec la spécification 35% des observations pour l’estimation «in the sample», lorsque
l’on utilise 45% pour l’estimation «in the sample», sur les 10 échantillons aléatoires, il n’y a qu’un
seul qui permet d’avoir toutes les variables explicatives significatives. Les matrices de confusion
correspondantes aux différents seuils de conservatisme pour les prédictions «out of the sample»
traduisent les mêmes résultats établis antérieurement. Les taux respectifs d’erreur de type I sont
de 30,25% et 26,16% selon que les seuils de conservatisme soient de 20% et 11,34%
respectivement. La mesure de sensibilité est de 73,84% lorsque le seuil de conservatisme de
11,34%, soit une proportion de 73,84% de défauts correctement prédits, ce qui est assez
satisfaisant. On en déduit alors que le modèle prédit assez bien la dynamique des défauts.
Tableau 22: M-C avec un seuil de 20%(55% de la population)
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 256
69,75% 1620
54,25%
Non - Défauts 111
30,25% 1366
45,75%
Total 367 2986
Résultats
73
Tableau 23: M-C avec un seuil de 11,34%(55% de la population)
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 271
73,84% 1694
56,73%
Non - Défauts 96
26,16% 1292
43,27%
Total 367 2986
8.3.7.2 Three fold cross validation technique (technique de validation de trois groupes croisés)
Sur les trois spécifications résultantes de la méthode du Three fold cross validation technique, il
y en a deux qui gardent toutes les variables explicatives significatives : L’estimation «In the
sample» (échantillon1-échantillon2) - «prédiction «out of the sample» (échantillon3) et
l’estimation «In the sample» (échantillon2-échantillon3) - la prédiction «out of the sample»
(échantillon1). Nous reproduisons à cet effet, les matrices de confusions correspondantes à
différents seuils de conservatisme pour les prédictions «out of the sample» correspondantes à
ces deux spécifications. Les mêmes résultats sont établis : la précision prédictive du modèle est
très sensible au seuil de conservatisme. Ce seuil influe fortement les proportions de bonnes
classifications (sensibilité et spécificité) et les mauvaises classifications (erreur de type I et de type
II). L’erreur de type I et la spécificité du modèle (proportion de non-défauts correctement classés
comme des non défauts), diminuent lorsque le seuil devient plus conservateur au contraire de
l’erreur de type II et de la mesure sensibilité (défauts classés correctement comme défauts) du
modèle, qui augmentent
Résultats
74
a. Estimation In sample (échantillon1-échantillon2)- Prédiction out sample (échantillon3)
Tableau 24: M-C avec un seuil de 20%(échantillon3 de la spécification d’Hauser et Booth (2011))
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 58
25,11% 181
10,05%
Non - Défauts 173
74,89% 1620
89,95%
Total 231 1801
Tableau 25 : M-C avec un seuil de 11,34%(échantillon3 de la spécification d’Hauser et Bo oth (2011))
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 148
64,07% 812
45,09%
Non - Défauts 83
35,93% 989
54,91%
Total 231 1801
b. Estimation In sample (échantillon2-échantillon3)- Prédiction out sample (échantillon1)
Tableau 26 : M-C avec un seuil de 20%(échantillon1 de la spécification d’Hauser et Booth (2011))
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 166
71,55% 886
49,22%
Non - Défauts 66
28,45% 914
50,78%
Total 232 1800
Résultats
75
Tableau 27: M-C avec un seuil de 11,34%(échantillon1 de la spécification d’Hauser et Booth (2011))
Modèle prédiction
Défauts actuels Non-défauts actuels
Défauts 191
82,33% 1202
66,78%
Non - Défauts 41
17,67% 598
33,22%
Total 232 1800
Ainsi il apparait à la vue de ces résultats que notre modèle final capte la dynamique des défauts.
Les résultats, allant dans le sens des études empiriques, sont assez révélateurs également quant
à l’influence du niveau de conservatisme sur la précision prédictive du modèle ainsi que sur
l’échantillon de la population considéré. Un seuil de conservatisme restrictif aura pour effet
d’augmenter l’erreur de type II, ce qui se traduira pour la banque en termes d’une augmentation
de son niveau de capital économique et une dégradation de la cote de crédit de ses clients. Un
seuil de conservatisme moins strict impliquera une augmentation d’erreur de type I ce qui se
traduira pour la banque en termes de perte de capital et d’intérêts. De même, il semble que la
mesure de sensibilité du modèle est inversement liée au seuil de conservatisme. L’objectif
escompté comme nous l’avons souligné, est d’avoir avec le plus grand pouvoir prédictif du défaut,
de fait une proportion d’erreurs de type I moindre pour minimiser les coûts en résultant. Aussi,
un seuil de conservatisme restrictif nous semble le mieux indiqué pour dégager la dynamique des
défauts et confère également au modèle un plus grand pouvoir prédictif.
Conclusion
76
9. CONCLUSION
Cette étude vise à valider un modèle parcimonieux avec le plus de pouvoir prédictif. Ce modèle
testera également les pratiques de la banque à l’étude par rapport à la pertinence des variables
utilisées dans sa prédiction du défaut. Il s’agit de l’estimation d’un modèle de probabilité de
défaut qui tient compte de variables financières et non financières. Les variables retenues dans le
modèle final sont celles qui expliquent le défaut et confèrent le plus grand pouvoir prédictif du
défaut.
Cette étude évalue le risque de défaut des prêts d’une banque canadienne en utilisant des
régressions non linéaires, probit et logit, et des données financières et non financières. Il apparait
que seules deux variables explicatives financières expliquent le défaut des prêts au sein de notre
échantillon : la croissance des ventes et le ratio de couverture. L’étude met en évidence
l’importance de tenir compte du secteur d’activité et des raisons qui animent la demande de prêt
dans l’explication et la prédiction du défaut. Ainsi, il apparait que les secteurs de l’agriculture, de
la construction et de la manufacture expliquent et prédisent significativement la probabilité de
défaut. Nos résultats nous indiquent que la probabilité de défaut est une fonction positive de ces
secteurs d’activités. Cela peut s’expliquer entre autres par le fait que ce sont des industries dont
les fluctuations suivent celles du cycle économique, réduisant leurs capacités de résorption des
chocs négatifs. Ce constat est d’autant plus marquant que notre échantillon est constitué que de
PME. Les mêmes constats s’appliquent aux variables qualitatives significatives « but du prêt» qui
sont également aux nombres de deux. En effet, la probabilité de défaut est une fonction positive
également des variables «but du prêt-Fond de roulement» et «but du prêt-changement de
propriétaire».
Il est assez surprenant de voir que les variables Dette/ Équité et fonds disponibles (bien que
reflété dans le ratio de couverture), une adaptation au BAIIA, ne sont à aucun moment
significatives dans nos estimations. Ces variables étant très utilisées dans la pratique, ces résultats
Conclusion
77
exhortent à une remise en question des ratios traditionnels utilisés dans l’explication et la
prédiction du défaut.
Nous avons utilisé différents tests et procédures pour valider et évaluer la précision de notre
spécification finale. Ces différents tests de validation nous confortent dans le choix de notre
spécification finale. Le test du ratio de vraisemblance établit que la spécification finale est la
meilleure estimation par rapport aux modèles contenant plus de variables explicatives. Le test de
Wald établit que les coefficients des variables explicatives de notre spécification finale sont tous
significatifs. La mesure BIC vient soutenir les conclusions du test du ratio de vraisemblance pour
le modèle final. Bien que la mesure AUC associée à la spécification finale n’atteigne pas 70%,
toutes les autres mesures de performance sont assez concluantes.
Les principaux apports de cette étude sont exprimés comme suit :
Elle a fourni un modèle économétrique parcimonieux avec un bon pouvoir prédictif pour
tester les pratiques de la banque à l’étude. Ce modèle est assez innovateur par rapport
aux pratiques de ladite banque.
Elle a mis en évidence l’importance des variables qualitatives dans la prédiction du défaut
pour la banque à l’étude.
Dans le processus de validation et d’évaluations de la spécification finale, elle établit
l’importance du seuil de conservatisme choisi par la banque à l’étude. Ce seuil
déterminera le niveau d’erreur de type I et d’erreur de type II acceptable pour la banque
et mettra en exergue la sensibilité du pouvoir prédictif des modèles à travers les mesures
de sensibilité et de spécificité respectivement.
Bien que notre principal objectif consiste essentiellement en la validation du modèle de
Simard(2012), notre travail se démarque toutefois du sien en raison de l’orientation que nous
avons donnée à la spécification finale. En effet, notre modèle final ne prend en compte que les
variables significatives pour expliquer le défaut contrairement à celle retenue par Simard(2012)
Conclusion
78
qui suggère une spécification finale avec 10 variables explicatives dont 4 sont non significatives et
ce, pour s’aligner au modèle sous-jacent à Riskcalc PlusTM de Moody12.
12 www.moodysanalytics.com
Limites et recommandations
79
10. LIMITES ET RECOMMANDATIONS
Comme l’a souligné Simard(2012), la période d’évaluation des prêts se fait sur une période de
crise économique. Cela a pu causer un nombre de défauts inhabituels au sein du portefeuille de
crédit de la banque. Cela est d’autant plus vrai que 51,12% des prêts ont été attribués à des
entreprises des secteurs de la construction, de l’agriculture et de la manufacture, secteurs que
nos résultats ont indiqués comme significatifs dans l’explication et la prédiction du défaut. Cette
période de crise financière pourrait fortement affecter les données utilisées dans le modèle, donc
les inférences en résultant. Ainsi, il serait porté à croire que la pertinence de nos résultats soit
réduite à cette période. Il aurait été intéressant de faire l’étude sur une période plus longue. On
aurait pu tenir compte alors de l’effet d’un changement conjoncturel, vérifier la stabilité de notre
spécification finale selon qu’elle soit évaluée sur une période de croissance ou qu’elle soit évaluée
sur une période de récession.
Notre estimation a été faite sur la base des données dont on dispose donc on peut se poser la
question de la transposition de nos résultats sur toute population (tout emprunteurs). En effet,
l’exercice de l’estimation «in the sample » et la prédiction «out of the sample» a établi la nécessité
de la représentativité d’un sous l’échantillon par rapport à notre échantillon au complet à travers
les tirages aléatoires effectués. Cette perspective peut être observée du point de vue de notre
échantillon par rapport à la population d’intérêt. Ainsi, pour que notre échantillon complet soit
représentatif de la population, il faudrait que l’on puisse inférer les caractéristiques de population
en utilisant ledit échantillon, or cette représentativité s’obtient qu’en effectuant un tirage
aléatoire comme l’a démontré l’exercice de l’estimation «in the sample» et la prédiction «out of
the sample». Étant limité par la disponibilité des données, il parait tout à fait légitime de se
demander si on obtiendra les mêmes estimations si on analyse un autre échantillon de la
population.
Limites et recommandations
80
Par ailleurs, cette incapacité de produire un échantillon aléatoire de la population amène ce que
l’on appelle un biais sélection qui pourrait fortement affecter notre inférence. Ce biais pourrait
toutefois être corrigé en utilisant des modèles de sélections.
Nous avons pris la décision de traiter les données en coupe transversale pour une question de
simplicité du modèle. Toutefois, il aurait été intéressant de développer un modèle qui estimerait
le défaut en prenant les données en panel.
Il aurait été intéressant de faire une analyse des résidus après le test de bon ajustement du
modèle aux données. En effet, le test de Hosmer-Lemeshow étant basé sur un regroupement des
données en catégorie, certains « covariante patterns» très mal ajustés, peuvent avoir été
échappés13. Pour ce faire, on aurait pu dériver les résidus de Pearson. Des valeurs très élevées de
ces résidus nous auraient indiqué que le nombre de cas de positifs prédits est différent du nombre
réalisé et que le dominateur de l’expression de ces résidus est petit. Vous pouvez vous référer à
la littérature existante traitant de ces résidus14. Cela nous aurait permis de mieux d’entériner les
conclusions de notre test de performance
Simard(2012) a soulevé la pertinence d’un modèle qui aurait pris en compte la dimension
temporelle telle qu’utilisée par Bonfim (2009) afin de prévoir le défaut ainsi que le moment où il
survient. De même que, retenir les informations sur la marge de crédit (s’il y a) dans le modèle
des entreprises qui ont contracté un prêt, car c’est un signal de risque qui est envoyé à la banque
lorsqu’elle est utilisée à plus 50%. Elle suggère également que, puisque la variable fonds
disponibles qui est un indicateur de la capacité de paiement, n’est pas significative dans cette
étude, une proxy de cette capacité de paiement aurait pu être calculée autrement, soit ``en
13 Cours de régression logistique appliquée, Patrick Taffée
14 Cours de régression logistique appliquée, Patrick Taffée
Limites et recommandations
81
déduisant les dépenses courantes mensuelles estimées d’une firme de son revenu mensuel, et
en y rajoutant les valeurs de ses actifs tangibles divisés par le terme du prêt’’.
Bibliographie
82
BIBLIOGRAPHIE
Altman, E.I., 1968, «Financial Ratios, Discriminant Analysis, and the Prediction of Corporate
Bankruptcy», Journal of Finance, Vol. 23, No. 4, p. 589-609.
Altman, E.I., Sabato, G., 2007, «Modelling Credit Risk for SMEs: Evidence from the US Market»,
Abacus, Vol. 43, No. 3, p. 332-357.
Bartels, J.C., 2002, «Basel II and the Survival of the SME: Are Lenders and Borrowers Ready to
Comply with Basel II ?», Business Credit,1-2.
Beaulieu, S., 2003, «Modèle d’évaluation des probabilités de défaut un an des firmes privées
canadiennes: approche probit non-structurelle», Mémoire en Sciences de la gestion, 68 p.
Beaver, W.H., 1967, «Financial Ratios as Predictors of Failure», Journal of Accounting Research,
Vol. 4, p. 71-111.
Behr, P., Gûttler, A., Plattner, D., 2004, «Credit Scoring and Relationship Lending: The Case of
German SME», JEL, Ver. 16, p. 1-31.
Benito et al., 2004, «A Synthethic Indicator of Financial Pressure for Spanish Firms», Banco de
España Working Paper,No.411.
Bonfim, D., 2009, «Credit Risk Drivers: Evaluating the Contribution of Firm Level Information and
Macroeconomic Dynamics», Journal of Banking and Finance, Vol. 33, No. 2.
Bibliographie
83
Bunn, P., Redwood, V., 2003, «Company Accounts Based Modelling of Business Failures and the
Implications for Financial Stability», Bank of England Working Paper, No. 210.
Carmines, E.G., Zeller, R.A., 1979, «Reliability and Validity Assessment», Sage Publications,
Californie.
Dainelli, F., Giunta, F., Cipollini, F., 2013, «Determinant of SME Credit Worthiness under Basel
Rules: the Value of Credit History Information», PSL Quarterly Review, Vol. 66, n. 264, p. 21-47.
Dionne, G., Artis, M., Guillen, M., 1996, «Count Data Models for a Credit Scoring System», Journal
of Empirical Finance, Vol. 3, p. 303-325.
Dionne, G., Laajimi, S., 2010, «On the Determinants of the Implied Default Barrier», Canada
Research Chair in Risk Management, HEC Montréal, 49 p.
Dionne, G., Laajimi, S., Mejri, S., Petrescu, M., 2008, «Estimation of the Default Risk of Publicly
Traded Companies: Evidence from Canadian Data», Canadian Journal of Administrative Sciences /
Revue Canadienne des Sciences de l’Administration, Vol. 25, No. 2, p. 134-152.
Edmister, R., 1972, «An Empirical Test of Financial Ratio Analysis for Small Business Failure
Prediction», Journal of Financial and Quantitative Analysis, Vol.7, No. 2, p.1477-1493.
Fidrmuc, J., Hainz, C., 2010, «Default Rates in the Loan Market for SMEs: Evidence from Slovakia»,
Economic Systems, Vol. 24, No. 2.
Bibliographie
84
Giesecke, K., Longstaff, F., Schaefer, S., Strebulaev, I., 2011, «Corporate Bond Default Risk: A 150-
Year Perspective», Journal of Financial Economics, Vol. 102, No. 2, p. 233-250.
Gunawidjaja, S., Hermanto, B., 2010, «Default Prediction Model for SME’s: Evidence from
Indonesian Market Using Financial Ratios», p. 1-20.
Hauser, R.P., Booth, D., 2011, «Predicting Bankruptcy with Robust Logistic Regression», Journal of
Data Science, vol. 9, p. 565-584.
Heckman, J.J., 1979, «Sample Selection Bias as a Specification Error», Econometrica, Vol. 47, No.
1, p. 53-161.
Kaminskiy, G.L., Reinhart, C.M., 1999, «The Twin Crises: The Causes of Banking and Balance-of-
Payments Problems», American Economic Review, Vol. 89, No. 3, p. 473-500.
Lehman, B., 2003, «Is it Worth the While? The Relevance of Qualitative Information in Credit
Rating», EFMA 2003 Helsinki Meetings, Helsinki, Finlande, p.1-25
Lopez, A.S., 2006, «Improving Access to Credit of SME’s in Puerto Rico: Exploring Variables to
Forecast Small Business Loan Events», Doctoral Program in Entrepreneurship and Small Business
Management. Autonomous University of Barcelona, Department of Business Economics.
McCann, F., McIndoe-Calder, T., 2012, «Determinant of SME Loan Default: The Importance of
Borrower-Level Heterogeneity», Research Technical paper, Central Bank of Ireland.
Merton, R., 1974, «On the pricing of corporate debt: the risk structure of interest rates», The
Journal of Finance, Vol. 29, No. 2, p. 449-470.
Bibliographie
85
Notes de cours de M. Georges Dionne pour le cours Gestion des risque et assurances, HEC
Montréal, hiver 2011.
Ohlson, J.S., 1980, «Financial Ratios and the Probabilistic Prediction of Bankruptcy», Journal of
Accounting Research, Vol. 18, No. 1, p. 109-131.
Parnes, D., 2012, «Approximating Default Probabilities with Soft Information», The Journal of
Credit risk, Vol. 8, n. 1, p. 3-28.
Shumway, T., 2001, «Forecasting Bankruptcy More Accurately: A Simple Hazard Model», The
Journal of Business, Vol. 74, No. 1, p. 101-124.
Simard, A., 2012, « Modèle de probabilité de défaut des prêts d’une banque canadienne», projet
supervisé, HEC Montréal.
Sirirattanaphonkun, W., Suluck, P., 2012, «Default Prediction for Small-Medium Enterprise in
Emerging Market: Evidence from Thailand», Seoul Journal of Business, Vol. 18, n. 2.
Stulz, R.M., 1996, «Rethinking Risk Management», Journal of Applied Corporate Finance, Vol. 9,
No. 3, p. 8-24.
White, H., 1982, «Maximum Likelihood Estimation of Misspecified Models», Econometrica, Vol.
50, p.1-25.
Woolridge, J.M., 2002, «Introductory Econometrics: A Modern Approach», South-Western Colelge
Pub, 2ndRevised édition.
Annexes
86
ANNEXES Annexe 1: Calcul des ratios
Calculs des Ratios financiers provenant de la base de données 15
1- Ratios de liquidité
Ratio de liquidité courante (ou fonds de roulement)
Actifs à court terme/ Passifs à court terme
Équité/Actifs totaux
Équités totaux/Actifs totaux
Actifs court terme/Dette totale
Actifs court terme/Dette totale
2- Ratios de profitabilité
Rendement sur Actif moyen (ROA)
Bénéfice net/Actifs totaux
Fonds disponibles
Bénéfice net + (amortissement+/-prêts des actionnaires + impôts reportés –
dividendes +/- fonds disponibles des cautions et compagnies garantes)
3- Ratios d’endettement
Dette/Équité
Dette totale/ Equité totale
15 Simard(2012)
Annexes
87
Dette de la banque / Dette totale
Dette contractée au sein de la banque en question/Dette totale
4- Ratios de couverture
Ratio de couverture
Fonds disponible / (PCDT existante + PDCT additionnelle + intérêts additionnels) au
moment de l’autorisation.
Retard (lag) ratio de couverture
Fonds disponible / (PCDT existante + PDCT additionnelle + intérêts additionnels) à
l’année précédente.
5- Ratios de croissance
Ratio de croissance des ventes
(Ventes nettes (t) - ventes nettes (t-1)) / Ventes nettes (t-1)
Ratio de croissance de la marge brute
(Marge brute (t) – Marge brute (t-1)) / Marge brute (t-1)
Ratio de croissance du bénéfice net
(Bénéfice net (t)- Bénéfice net (t-1)) / Bénéfice net (t-1)
Annexes
88
Annexe 2: statistiques descriptives, matrice de corrélation, test de multicolinéarité
Statistique descriptive
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
Dfaut | 6095 .1138638 .3176719 0 1
Anne | 6095 .588023 .4922314 0 1
Tailleave~fs | 6095 2988825 9526862 116760 5.28e+08
DBDCDtot | 6095 .809997 .2350799 0 1
DE | 6095 1.8947 2.815961 0 150.0426
-------------+--------------------------------------------------------
EAtot | 6095 .4154528 .1599983 0 .9964
FR | 6095 2.680648 45.76916 0 3529.412
ACTDtot | 6095 1.337853 2.110748 0 43.82
CroissanceBN | 6095 3.961136 56.9475 -529.3873 3291.778
CroissanceMB | 6095 3.525136 55.11717 -404.1536 2358.448
-------------+--------------------------------------------------------
Croissance~s | 6095 .85337 39.61635 -1 3078.561
ROA | 6095 .4014182 1.349222 -6.7726 31.43
Fondsdispo~s | 6095 1344818 5666998 -1.36e+07 1.85e+08
lagratioco~e | 6095 1.100781 3.834738 -99.999 99.999
ratiocouve~e | 6095 1.456768 2.516684 -73.333 99.999
-------------+--------------------------------------------------------
Annexes
89
engagement~l | 6095 1144234 1371934 15000 1.00e+07
Fondderoul~t | 6095 .2415094 .4280335 0 1
Immo | 6095 .5542248 .4970918 0 1
Refinancem~e | 6095 .0848236 .2786419 0 1
changement~o | 6095 .1194422 .3243347 0 1
-------------+--------------------------------------------------------
Manufacture | 6095 .3069729 .4612759 0 1
Agricultur~n | 6095 .2050861 .4037977 0 1
Service | 6095 .2241181 .4170344 0 1
Venteaudtail | 6095 .2282199 .4197195 0 1
Autre | 6095 .035603 .1853133 0 1
-------------+--------------------------------------------------------
tailleprox~N | 6095 2965.38 1717.861 1 594
Annexes
90
Matrice de corrélation
| Dfaut Anne Taill~fs DE DBDCDtot EAtot FR ACTDtot Croiss~N
-------------+---------------------------------------------------------------------------------
Dfaut | 1.0000
Anne | -0.0095 1.0000
Tailleave~fs | -0.0097 0.0005 1.0000
DE | -0.0139 0.0179 -0.0180 1.0000
DBDCDtot | -0.0318 0.0255 -0.1679 -0.0293 1.0000
EAtot | 0.0075 -0.0433 0.0464 -0.4527 0.0794 1.0000
FR | -0.0067 0.0127 -0.0016 -0.0054 0.0193 0.0050 1.0000
ACTDtot | 0.0186 -0.0220 0.0094 -0.1651 0.0270 0.5150 -0.0090 1.0000
CroissanceBN | -0.0087 -0.0040 -0.0096 0.0007 0.0045 -0.0070 -0.0011 0.0018 1.0000
CroissanceMB | -0.0122 0.0013 -0.0103 -0.0039 0.0067 0.0066 0.0003 0.0009 0.8342
Croissance~s | 0.0401 0.0110 -0.0012 0.0008 -0.0101 -0.0083 -0.0007 -0.0017 0.0029
ROA | -0.0311 -0.0865 -0.0366 -0.0156 -0.0077 0.0256 -0.0016 0.0820 0.0155
Fondsdispo~s | -0.0259 -0.0543 0.2091 -0.0217 -0.1464 0.0406 -0.0032 0.0337 0.0015
lagratioco~e | -0.0092 -0.0103 0.0039 -0.0257 -0.0021 0.0832 -0.0022 0.0870 -0.0151
ratiocouve~e | -0.0304 0.0029 0.0147 -0.0713 0.0499 0.1930 -0.0053 0.1802 0.0144
engagement~l | -0.0205 0.0096 0.2936 0.0106 0.0088 -0.0874 0.0020 -0.0694 -0.0208
Fondderoul~t | 0.1513 -0.0028 -0.0216 -0.0579 -0.0718 0.1588 -0.0109 0.1753 0.0177
Immo | -0.1108 -0.0284 0.0314 0.0316 0.0443 -0.1019 -0.0119 -0.1118 -0.0092
Refinancem~e | -0.0313 0.0179 0.0200 0.0192 0.0048 -0.0057 -0.0060 -0.0284 -0.0112
changement~o | -0.0030 0.0318 -0.0368 0.0114 0.0227 -0.0485 0.0378 -0.0356 0.0003
Annexes
91
Manufacture | 0.0907 -0.0117 0.0616 -0.0546 -0.0609 0.0935 -0.0104 0.0377 -0.0114
Agricultur~n | -0.0055 0.0157 -0.0264 0.0330 0.0014 -0.0499 0.0195 -0.0977 0.0081
Venteaudtail | -0.0288 -0.0142 -0.0018 -0.0528 -0.0080 0.0857 -0.0057 0.1913 0.0159
Service | -0.0539 0.0078 -0.0302 0.0770 0.0595 -0.1297 -0.0015 -0.1091 -0.0091
Autre | -0.0271 0.0097 -0.0236 0.0102 0.0328 -0.0261 -0.0006 -0.0688 -0.0049
tailleprox~N | -0.0039 -0.0313 0.0142 -0.0017 -0.0247 0.0081 0.0058 0.0027 -0.0088
Annexes
92
| Croiss~B Croiss~s ROA Fondsd~s lagrat~e ratioc~e engage~l Fondde~t Immo
-------------+---------------------------------------------------------------------------------
CroissanceMB | 1.0000
Croissance~s | -0.0010 1.0000
ROA | 0.0135 0.0007 1.0000
Fondsdispo~s | 0.0004 -0.0014 0.2604 1.0000
lagratioco~e | -0.0133 -0.0071 0.0238 0.0244 1.0000
ratiocouve~e | 0.0140 0.0007 0.1129 0.0858 0.2340 1.0000
engagement~l | -0.0205 -0.0084 -0.0757 0.1692 0.0180 0.0003 1.0000
Fondderoul~t | 0.0212 -0.0045 -0.0077 -0.0382 0.0050 -0.0068 -0.1199 1.0000
Immo | -0.0112 0.0096 -0.0155 0.0424 -0.0070 -0.0031 0.1364 -0.6292 1.0000
Refinancem~e | -0.0114 -0.0045 -0.0245 0.0042 0.0242 0.0557 0.0210 -0.1718 -0.3395
changement~o | -0.0011 -0.0049 0.0549 -0.0182 -0.0167 -0.0341 -0.0690 -0.2078 -0.4107
Manufacture | -0.0167 -0.0100 -0.0403 0.0336 -0.0078 -0.0243 0.0948 0.0591 -0.0236
Agricultur~n | 0.0089 0.0282 -0.0051 -0.0107 0.0069 -0.0163 -0.0477 -0.0749 -0.0113
Venteaudtail | 0.0200 -0.0088 -0.0182 0.0222 0.0238 0.0205 0.0414 0.0457 -0.0125
Service | -0.0074 -0.0066 0.0725 -0.0373 0.0007 0.0174 -0.0839 -0.0165 0.0411
Autre | -0.0066 -0.0020 -0.0105 -0.0267 -0.0511 0.0104 -0.0370 -0.0505 0.0191
tailleprox~N | -0.0132 -0.0158 0.0370 0.0253 0.0081 -0.0288 0.0301 0.0002 0.0094
| Refina~e change~o Manufa~e Agricu~n Ventea~l Service Autre taille~N
-------------+------------------------------------------------------------------------
Refinancem~e | 1.0000
changement~o | -0.1121 1.0000
Annexes
93
Manufacture | -0.0111 -0.0323 1.0000
Agricultur~n | 0.0612 0.0635 -0.3381 1.0000
Venteaudtail | -0.0056 -0.0363 -0.3619 -0.2762 1.0000
Service | -0.0394 -0.0075 -0.3577 -0.2730 -0.2923 1.0000
Autre | -0.0045 0.0412 -0.1279 -0.0976 -0.1045 -0.1033 1.0000
tailleprox~N | 0.0125 -0.0253 -0.0002 0.0255 -0.0092 -0.0186 0.0074 1.0000
Annexes
94
Test de multicolinéarité
. vif, uncentered
Variable | VIF 1/VIF
-------------+----------------------
EAtot | 11.61 0.086099
DBDCDtot | 11.07 0.090324
Manufacture | 5.99 0.167001
Immo | 5.24 0.190730
Venteaudtail | 4.73 0.211234
Service | 4.54 0.220150
Agricultur~n | 4.19 0.238573
tailleprox~N | 3.82 0.262091
CroissanceBN | 3.31 0.302406
CroissanceMB | 3.31 0.302559
Fondderoul~t | 2.93 0.341508
Anne | 2.38 0.419504
ACTDtot | 2.00 0.499863
engagement~l | 1.86 0.537724
DE | 1.72 0.582989
Refinancem~e | 1.67 0.599859
ratiocouve~e | 1.51 0.662281
ROA | 1.22 0.818449
Annexes
95
Fondsdispo~s | 1.22 0.820193
lagratioco~e | 1.15 0.867532
FR | 1.01 0.994105
Croissance~s | 1.00 0.997948
-------------+----------------------
Mean VIF | 3.52
Annexes
96
Annexe 3: Résultats des régressions probit
Modèle2 : régression probit avec 22 Variables explicatives avec les ventes comme proxy de la taille
Probit regression Number of obs = 6095
Wald chi2(22) = 202.60
Prob > chi2 = 0.0000
Log pseudolikelihood = -2053.7219 Pseudo R2 = 0.0495
-------------------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
Anne | -.0511222 .0440393 -1.16 0.246 -.1374377 .0351933
tailleproxyventesN | -2.02e-06 .0000124 -0.16 0.871 -.0000264 .0000223
DE | -.0209566 .0187599 -1.12 0.264 -.0577254 .0158122
DBDCDtot | -.084193 .093791 -0.90 0.369 -.2680199 .0996338
EAtot | -.4127443.2221568 -1.86 0.063 -.8481637 .0226752
FR | -.0031039 .0062808 -0.49 0.621 -.0154141 .0092063
ACTDtot | .0081694 .0126927 0.64 0.520 -.0167079 .0330467
CroissanceBN | .0001736 .0015897 0.11 0.913 -.0029423 .0032894
CroissanceMB | -.0009026 .0014164 -0.64 0.524 -.0036786 .0018735
Croissanceventes | .0162991 .0069153 2.36 0.018 .0027455 .0298528
ROA | -.0398392 .0254539 -1.57 0.118 -.0897279 .0100496
Annexes
97
Fondsdisponibles | -6.47e-09 7.86e-09 -0.82 0.411 -2.19e-08 8.93e-09
lagratiocouverture | .0006549 .0070398 0.09 0.926 -.0131428 .0144527
ratiocouverture | -.0190317 .0114036 -1.67 0.095 -.0413823 .0033189
engagementtotal | -1.34e-08 1.69e-08 -0.79 0.427 -4.66e-08 1.97e-08
Fondderoulement | .3653651 .0735045 4.97 0.000 .2212989 .5094312
Immo | -.1662965 .0702419 -2.37 0.018 -.3039681 -.0286249
Refinancementetautre | -.1785828 .1027742 -1.74 0.082 -.3800164 .0228509
changementdeproprio | 0 (omitted)
Manufacture | .4063762 .1381865 2.94 0.003 .1355356 .6772169
Agricultureetconstruction | .2236505 .1414392 1.58 0.114 -.0535652 .5008662
Venteaudtail | .1060473 .1420684 0.75 0.455 -.1724017 .3844962
Service | .0348257 .1423739 0.24 0.807 -.244222 .3138733
_cons | -1.07063 .1998191 -5.36 0.000 -1.462268 -.6789914
------------------------------------------------------------------------------------------
Annexes
98
Modèle3 : régression probit avec 17 Variables explicatives
Probit regression Number of obs = 6095
Wald chi2(17) = 199.25
Prob > chi2 = 0.0000
Log pseudolikelihood = -2054.5157 Pseudo R2 = 0.0492
-------------------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
Anne | -.0512721 .044046 -1.16 0.244 -.1376007 .0350566
DE | -.0208813 .0187495 -1.11 0.265 -.0576297 .0158671
DBDCDtot | -.085576 .0940429 -0.91 0.363 -.2698967 .0987447
EAtot | -.4121841.2218057 -1.86 0.063 -.8469152 .0225471
FR | -.0031414 .0063535 -0.49 0.621 -.0155941 .0093113
ACTDtot | .0084432 .0126644 0.67 0.505 -.0163787 .033265
Croissanceventes | .0163302 .0068956 2.37 0.018 .0028151 .0298453
ROA | -.0401857 .0254392 -1.58 0.114 -.0900457 .0096744
Fondsdisponibles | -6.44e-09 7.83e-09 -0.82 0.410 -2.18e-08 8.90e-09
ratiocouverture | -.0189578 .0106068 -1.79 0.074 -.0397469 .0018312
engagementtotal | -1.29e-08 1.69e-08 -0.76 0.446 -4.59e-08 2.02e-08
Fondderoulement | .5332023 .0491888 10.84 0.000 .436794 .6296107
changementdeproprio | .1671808 .0693555 2.41 0.016 .0312466 .3031151
Annexes
99
Manufacture | .3751263 .0599452 6.26 0.000 .2576358 .4926168
Agricultureetconstruction | .1916425 .0677807 2.83 0.005 .0587948 .3244902
Venteaudtail | .0740693 .0677691 1.09 0.274 -.0587557 .2068943
tailleproxyventesN | -1.92e-06 .0000124 -0.15 0.877 -.0000263 .0000225
_cons | -1.208517 .1467207 -8.24 0.000 -1.496085 -.9209501
-------------------------------------------------------------------------------------------
Annexes
100
Effets maginaux
-------------------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
Anne | -.0094062 .0080815 -1.16 0.244 -.0252456 .0064333
DE | -.0038308 .0034391 -1.11 0.265 -.0105713 .0029097
DBDCDtot | -.0156994 .0172542 -0.91 0.363 -.0495171 .0181182
EAtot | -.0756177 .0406914 -1.86 0.063 -.1553714 .0041359
FR | -.0005763 .0011656 -0.49 0.621 -.0028608 .0017082
ACTDtot | .0015489 .0023233 0.67 0.505 -.0030045 .0061024
Croissanceventes | .0029959 .0012645 2.37 0.018 .0005174 .0054743
ROA | -.0073723 .0046678 -1.58 0.114 -.016521 .0017764
Fondsdisponibles | -1.18e-09 1.44e-09 -0.82 0.410 -4.00e-09 1.63e-09
ratiocouverture | -.0034779 .0019478 -1.79 0.074 -.0072955 .0003397
engagementtotal | -2.36e-09 3.10e-09 -0.76 0.446 -8.43e-09 3.71e-09
Fondderoulement | .0978193 .0090006 10.87 0.000 .0801785 .1154601
changementdeproprio | .0306704 .0127182 2.41 0.016 .005743 .0555977
Manufacture | .0688192 .0109924 6.26 0.000 .0472744 .090364
Agricultureetconstruction | .035158 .0124394 2.83 0.005 .0107771 .0595389
Venteaudtail | .0135885 .0124323 1.09 0.274 -.0107783 .0379553
tailleproxyventesN | -3.53e-07 2.28e-06 -0.15 0.877 -4.83e-06 4.12e-06
Annexes
101
Modèle4 : régression probit avec 10 Variables explicatives
Probit regression Number of obs = 6095
Wald chi2(10) = 192.49
Prob > chi2 = 0.0000
Log pseudolikelihood = -2058.5808 Pseudo R2 = 0.0473
-------------------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
tailleproxyventesN | -2.06e-06 .0000124 -0.17 0.869 -.0000265 .0000223
EAtot | -.2508132 .162492 -1.54 0.123 -.5692916 .0676653
Croissanceventes | .0165311 .0069091 2.39 0.017 .0029895 .0300726
ratiocouverture | -.0211083 .0112064 -1.88 0.060 -.0430725 .0008559
Fondderoulement | .5458688 .0484829 11.26 0.000 .4508441 .6408935
changementdeproprio | .1702759 .0687654 2.48 0.013 .0354982 .3050537
Manufacture | .3360358 .0489177 6.87 0.000 .2401588 .4319128
Agricultureetconstruction | .1576315 .0587992 2.68 0.007 .0423872 .2728759
ROA | -.0455979 .0240531 -1.90 0.058 -.0927412 .0015454
ACTDtot | .0093375 .0122356 0.76 0.445 -.0146438 .0333188
_cons | -1.404521 .0778657 -18.04 0.000 -1.557135 -1.251908
-------------------------------------------------------------------------------------------
Annexes
102
Modèle5 : régression probit avec 8 Variables explicatives
Probit regression Number of obs = 6095
Wald chi2(8) = 188.85
Prob > chi2 = 0.0000
Log pseudolikelihood = -2061.3161 Pseudo R2 = 0.0460
-------------------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
tailleproxyventesN | -2.80e-06 .0000124 -0.23 0.822 -.0000271 .0000216
EAtot | -.1942793 .139982 -1.39 0.165 -.4686391 .0800804
Croissanceventes | .0163627 .0069277 2.36 0.018 .0027846 .0299408
ratiocouverture | -.0234493 .0117607 -1.99 0.046 -.0465 -.0003987
Fondderoulement | .5495505 .0481861 11.40 0.000 .4551074 .6439936
changementdeproprio | .1636003 .0684277 2.39 0.017 .0294846 .2977161
Manufacture | .3378377 .0488711 6.91 0.000 .2420521 .4336233
Agricultureetconstruction | .1541889 .0585791 2.63 0.008 .0393759 .2690019
_cons | -1.425979 .0751711 -18.97 0.000 -1.573312 -1.278647
-------------------------------------------------------------------------------------------
Annexes
103
Modèle6 : régression probit avec 6 Variables explicatives (modèle final)
Probit regression Number of obs = 6095
Wald chi2(6) = 185.28
Prob > chi2 = 0.0000
Log pseudolikelihood = -2062.2876 Pseudo R2 = 0.0456
-------------------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
Croissanceventes | .0166124 .0069326 2.40 0.017 .0030249 .0302
ratiocouverture | -.0258369 .0122214 -2.11 0.035 -.0497904 -.0018834
Fondderoulement | .5379439 .047687 11.28 0.000 .4444791 .6314087
changementdeproprio | .1642171 .0683947 2.40 0.016 .0301659 .2982683
Manufacture | .3322322 .0486144 6.83 0.000 .2369497 .4275147
Agricultureetconstruction | .1544515 .0585154 2.64 0.008 .0397634 .2691396
_cons | -1.506539 .0429897 -35.04 0.000 -1.590797 -1.42228
-------------------------------------------------------------------------------------------
Annexes
104
Annexe 4: résultats des régressions logit
Modèle7: régression logit avec 17 Variables explicatives
Logistic regression Number of obs = 6095
Wald chi2(17) = 205.03
Prob > chi2 = 0.0000
Log pseudolikelihood = -2054.6405 Pseudo R2 = 0.0491
-------------------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
Anne | -.0970169 .0840889 -1.15 0.249 -.2618282 .0677943
DE | -.044703 .0427382 -1.05 0.296 -.1284684 .0390624
DBDCDtot | -.1543061 .1787505 -0.86 0.388 -.5046507 .1960385
EAtot | -.803408 .4539988 -1.77 0.077 -1.693229 .0864133
FR | -.0067198 .0144151 -0.47 0.641 -.0349728 .0215333
ACTDtot | .0166224 .0246605 0.67 0.500 -.0317113 .0649561
Croissanceventes | .0282139 .0105322 2.68 0.007 .0075712 .0488567
ROA | -.0756375 .0517396 -1.46 0.144 -.1770453 .0257702
Fondsdisponibles | -1.60e-08 2.02e-08 -0.79 0.430 -5.57e-08 2.37e-08
ratiocouverture | -.0306774 .0178761 -1.72 0.086 -.065714 .0043591
engagementtotal | -1.99e-08 3.31e-08 -0.60 0.549 -8.48e-08 4.51e-08
Annexes
105
Fondderoulement | .9959942 .0910417 10.94 0.000 .8175558 1.174433
changementdeproprio | .3376445 .1343326 2.51 0.012 .0743574 .6009316
Manufacture | .715518 .1159783 6.17 0.000 .4882047 .9428312
Agricultureetconstruction | .3703571 .1330579 2.78 0.005 .1095685 .6311457
Venteaudtail | .1516364 .1334102 1.14 0.256 -.1098427 .4131156
tailleproxyventesN | -5.41e-06 .0000234 -0.23 0.817 -.0000514 .0000405
_cons | -2.070432 .2989746 -6.93 0.000 -2.656412 -1.484453
-------------------------------------------------------------------------------------------
Annexes
106
Modèle8: régression logit avec 10 Variables explicatives
Logistic regression Number of obs = 6095
Wald chi2(10) = 198.71
Prob > chi2 = 0.0000
Log pseudolikelihood = -2058.8426 Pseudo R2 = 0.0472
-------------------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
tailleproxyventesN | -5.56e-06 .0000235 -0.24 0.813 -.0000515 .0000404
EAtot | -.4719257 .3091091 -1.53 0.127 -1.077768 .1339171
Croissanceventes | .0285379 .0104562 2.73 0.006 .0080441 .0490316
ratiocouverture | -.0336243 .0194483 -1.73 0.084 -.0717424 .0044937
Fondderoulement | 1.019794 .0894901 11.40 0.000 .8443965 1.195191
changementdeproprio | .3433754 .1327173 2.59 0.010 .0832542 .6034966
Manufacture | .6361571 .092572 6.87 0.000 .4547193 .8175949
Agricultureetconstruction | .298716 .1136584 2.63 0.009 .0759496 .5214824
ROA | -.0927367 .046086 -2.01 0.044 -.1830636 -.0024098
ACTDtot | .018131 .0235728 0.77 0.442 -.0280709 .0643329
_cons | -2.448644 .1494532 -16.38 0.000 -2.741567 -2.155721
Annexes
107
Modèle9 : régression logit avec 8 Variables explicatives
Logistic regression Number of obs = 6095
Wald chi2(8) = 193.93
Prob > chi2 = 0.0000
Log pseudolikelihood = -2061.6701 Pseudo R2 = 0.0459
-------------------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
tailleproxyventesN | -7.31e-06 .0000234 -0.31 0.755 -.0000532 .0000386
EAtot | -.3581 .2631242 -1.36 0.173 -.8738956 .1575324
Croissanceventes | .0282539 .0104827 2.70 0.007 .0077082 .0487996
ratiocouverture | -.0380598 .0220022 -1.73 0.084 -.0811834 .0050638
Fondderoulement | 1.026516 .0890006 11.53 0.000 .8520784 1.200954
changementdeproprio | .3288726 .132033 2.49 0.013 .0700928 .5876525
Manufacture | .6410643 .0925501 6.93 0.000 .4596695 .8224591
Agricultureetconstruction | .294912 .1133239 2.60 0.009 .0728013 .5170228
_cons | -2.492612 .1439496 -17.32 0.000 -2.774748 -2.210475
Annexes
108
Modèle10 : régression logit avec 6 Variables explicatives (modèle final)
Logistic regression Number of obs = 6095
Wald chi2(6) = 189.44
Prob > chi2 = 0.0000
Log pseudolikelihood = -2062.624 Pseudo R2 = 0.0454
-------------------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
Croissanceventes | .0285583 .0104877 2.72 0.006 .0080027 .0491139
ratiocouverture | -.0422325 .024683 -1.71 0.087 -.0906102 .0061452
Fondderoulement | 1.006396 .0883878 11.39 0.000 .8331593 1.179633
changementdeproprio | .3311804 .1320223 2.51 0.012 .0724215 .5899394
Manufacture | .6303478 .0920281 6.85 0.000 .4499761 .8107195
Agricultureetconstruction | .2960618 .1131734 2.62 0.009 .0742461 .5178776
_cons | -2.648086 .0867792 -30.52 0.000 -2.81817 -2.478001
-------------------------------------------------------------------------------------------
Annexes
109
Annexe 5 : résultats régressions supplémentaires avec variables qualitatives
Régression probit avec les variables «industries» et «but du prêt»
Probit regression Number of obs = 6095
Wald chi2(7) = 176.14
Prob > chi2 = 0.0000
Log pseudolikelihood = -2070.5994 Pseudo R2 = 0.0417
-------------------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
Fondderoulement | .3647132 .0724847 5.03 0.000 .2226458 .5067806
Immo | -.1694843 .0693042 -2.45 0.014 -.305318 -.0336506
Refinancementetautre | -.1906956 .1012992 -1.88 0.060 -.3892385 .0078472
changementdeproprio | 0 (omitted)
Manufacture | .3981221 .1368822 2.91 0.004 .1298378 .6664063
Agricultureetconstruction | .2305866 .1404053 1.64 0.101 -.0446028 .5057759
Venteaudtail | .098388 .1402477 0.70 0.483 -.1764924 .3732684
Service | .0335158 .1413105 0.24 0.813 -.2434477 .3104793
_cons | -1.429468 .1429 -10.00 0.000 -1.709547 -1.149389
Annexes
110
Régression probit avec les variables «but du prêt»
Probit regression Number of obs = 6095
Wald chi2(3) = 133.72
Prob > chi2 = 0.0000
Log pseudolikelihood = -2095.0251 Pseudo R2 = 0.0304
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------------------+----------------------------------------------------------------
Fondderoulement | .3748116 .0719019 5.21 0.000 .2338865 .5157367
Immo | -.1699493 .0689151 -2.47 0.014 -.3050204 -.0348781
Refinancementetautre | -.1769581 .1008124 -1.76 0.079 -.3745468 .0206306
changementdeproprio | 0 (omitted)
_cons | -1.219835 .0614805 -19.84 0.000 -1.340335 -1.099335
Annexes
111
Régression probit avec les variables «industries»
Probit regression Number of obs = 6095
Wald chi2(4) = 55.50
Prob > chi2 = 0.0000
Log pseudolikelihood = -2132.9319 Pseudo R2 = 0.0129
-------------------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
Manufacture | .476042 .1341548 3.55 0.000 .2131034 .7389806
Agricultureetconstruction | .2579401 .137782 1.87 0.061 -.0121077 .5279879
Venteaudtail | .1838128 .1375149 1.34 0.181 -.0857114 .453337
Service | .0905419 .1384759 0.65 0.513 -.1808658 .3619497
_cons | -1.482344 .1295103 -11.45 0.000 -1.736179 -1.22850
Annexes
112
Annexe 6: résultats des estimations avec les échantillons de l'année 2007 et de l'année 2008
Régression probit Année 2007
Probit regression Number of obs = 2511
Wald chi2(6) = 81.54
Prob > chi2 = 0.0000
Log pseudolikelihood = -865.7415 Pseudo R2 = 0.0473
--------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------------+----------------------------------------------------------------
Croissanceve~s | .0212771 .0093743 2.27 0.023 .0029037 .0396505
ratiocouvert~e | -.0440149 .0206064 -2.14 0.033 -.0844027 -.0036271
Fondderoulem~t | .4978242 .0746019 6.67 0.000 .3516072 .6440411
changementde~o | .4203095.1017603 4.13 0.000 .220863 .6197561
Manufacture | .363411 .0743286 4.89 0.000 .2177296 .5090925
Agriculturee~n | .080484 .0929493 0.87 0.387 -.1016932 .2626612
_cons | -1.478599 .0671151 -22.03 0.000 -1.610142 -1.347056
Annexes
113
Régression logit Année 2007
Logistic regression Number of obs = 2511
Wald chi2(6) = 81.03
Prob > chi2 = 0.0000
Log pseudolikelihood = -865.63352 Pseudo R2 = 0.0474
--------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------------+----------------------------------------------------------------
Croissanceve~s | .0333841 .0152012 2.20 0.028 .0035903 .0631778
ratiocouvert~e | -.0742305 .0401422 -1.85 0.064 -.1529077 .0044468
Fondderoulem~t | .9409203 .138763 6.78 0.000 .6689498 1.212891
changementde~o | .8092929.1871217 4.32 0.000 .442541 1.176045
Manufacture | .694696.1399076 4.97 0.000 .4204821 .9689098
Agriculturee~n | .158183.1800296 0.88 0.380 -.1946685 .5110346
_cons | -2.603449.1346183 -19.34 0.000 -2.867296 -2.339602
Annexes
114
Régression probit Année 2008
Probit regression Number of obs = 3584
Wald chi2(6) = 127.30
Prob > chi2 = 0.0000
Log pseudolikelihood = -1187.7626 Pseudo R2 = 0.0512
--------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------------+----------------------------------------------------------------
Croissanceve~s | .0107056 .0043313 2.47 0.013 .0022164 .0191949
ratiocouvert~e | -.0186824 .0123854 -1.51 0.131 -.0429573 .0055924
Fondderoulem~t | .5699816 .0622533 9.16 0.000 .4479674 .6919957
changementde~o | -.0374864 .0951086 -0.39 0.693 -.2238958 .148923
Manufacture | .3002724 .0646839 4.64 0.000 .1734944 .4270505
Agriculturee~n | .2010925 .0756779 2.66 0.008 .0527665 .3494186
_cons | -1.515926 .0544285 -27.85 0.000 -1.622604 -1.409248
Annexes
115
Régression logit Année 2008
Logistic regression Number of obs = 3584
Wald chi2(6) = 128.09
Prob > chi2 = 0.0000
Log pseudolikelihood = -1188.0991 Pseudo R2 = 0.0509
--------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------------+----------------------------------------------------------------
Croissanceve~s | .0189629 .009369 2.02 0.043 .0006 .0373257
ratiocouvert~e | -.0289494 .0202598 -1.43 0.153 -.0686578 .0107591
Fondderoulem~t | 1.061413 .1152954 9.21 0.000 .8354385 1.287388
changementde~o | -.0734718 .1926506 -0.38 0.703 -.4510601 .3041166
Manufacture | .5677122 .1230811 4.61 0.000 .3264778 .8089467
Agriculturee~n | .3875481 .1462194 2.65 0.008 .1009634 .6741328
_cons | -2.663873 .1074157 -24.80 0.000 -2.874404 -2.453342
-------------------------------------------------------------------------------
Annexes
116
Annexe 7: résultats des estimations « in the sample»
Régression probit in the sample avec 35% des données
Probit regression Number of obs = 2135
Wald chi2(6) = 60.02
Prob > chi2 = 0.0000
Log pseudolikelihood = -792.01024 Pseudo R2 = 0.0387
--------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------------+----------------------------------------------------------------
Croissanceve~s | .0259221 .0124574 2.08 0.037 .001506 .0503381
ratiocouvert~e | -.0577059 .0274289 -2.10 0.035 -.1114655 -.0039463
Fondderoulem~t | .4902576 .0891301 5.50 0.000 .3155657 .6649494
changementde~o | .256734 .0900839 2.85 0.004 .0801727 .4332952
Manufacture | .3271638 .0827492 3.95 0.000 .1649783 .4893493
Agriculturee~n | .2328331 .0881451 2.64 0.008 .0600719 .4055943
_cons | -1.351985 .0706158 -19.15 0.000 -1.49039 -1.213581
Annexes
117
Régression probit in the sample avec 40% des données
Échantillon1
Probit regression Number of obs = 2438
Wald chi2(6) = 61.55
Prob > chi2 = 0.0000
Log pseudolikelihood = -791.85788 Pseudo R2 = 0.0407
--------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------------+----------------------------------------------------------------
Croissanceve~s | .0177358 .0072464 2.45 0.014 .0035332 .0319384
ratiocouvert~e | -.0797093 .0303973 -2.62 0.009 -.1392868 -.0201318
Fondderoulem~t | .4274776 .0872467 4.90 0.000 .2564773 .598478
changementde~o | .1827348 .0894965 2.04 0.041 .0073249 .3581447
Manufacture | .3570378 .0811789 4.40 0.000 .19793 .5161456
Agriculturee~n | .2384615 .0880155 2.71 0.007 .0659543 .4109687
_cons | -1.437053 .0730431 -19.67 0.000 -1.580215 -1.293891
--------------------------------------------------------------------------------
Annexes
118
Échantillon2
Probit regression Number of obs = 2438
Wald chi2(6) = 75.16
Prob > chi2 = 0.0000
Log pseudolikelihood = -910.55746 Pseudo R2 = 0.0431
--------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------------+----------------------------------------------------------------
Croissanceve~s | .0311844 .0159866 1.95 0.051 -.0001487 .0625175
ratiocouvert~e | -.0557348 .0251916 -2.21 0.027 -.1051094 -.0063602
Fondderoulem~t | .5223531 .0747222 6.99 0.000 .3759003 .6688059
changementde~o | .3487445 .0957614 3.64 0.000 .1610555 .5364335
Manufacture | .2897842 .0746692 3.88 0.000 .1434352 .4361331
Agriculturee~n | .1935264 .0864047 2.24 0.025 .0241763 .3628764
_cons | -1.383266 .0674458 -20.51 0.000 -1.515458 -1.251075
--------------------------------------------------------------------------------
Annexes
119
Échantillon3
Probit regression Number of obs = 2438
Wald chi2(6) = 90.51
Prob > chi2 = 0.0000
Log pseudolikelihood = -865.9078 Pseudo R2 = 0.0518
--------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------------+----------------------------------------------------------------
Croissanceve~s | .0204089 .0083669 2.44 0.015 .0040101 .0368077
ratiocouvert~e | -.0705141 .0276223 -2.55 0.011 -.1246527 -.0163755
Fondderoulem~t | .6225733 .0762095 8.17 0.000 .4732055 .771941
changementde~o | .3165835 .0945537 3.35 0.001 .1312616 .5019054
Manufacture | .271138 .0768299 3.53 0.000 .1205542 .4217219
Agriculturee~n | .1548742 .0875233 1.77 0.077 -.0166683 .3264167
_cons | -1.415108 .0705247 -20.07 0.000 -1.553334 -1.276882
-------------------------------------------------------------------------------
Annexes
120
Régression probit in the sample avec 45% des données
Probit regression Number of obs = 2742
Wald chi2(6) = 108.77
Prob > chi2 = 0.0000
Log pseudolikelihood = -944.47955 Pseudo R2 = 0.0574
--------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------------+----------------------------------------------------------------
Croissanceve~s | .0150262 .0085902 1.75 0.080 -.0018103 .0318628
ratiocouvert~e | -.0477798 .0200407 -2.38 0.017 -.0870589 -.0085008
Fondderoulem~t | .5390185 .0703529 7.66 0.000 .4011294 .6769076
changementde~o | .3585417.1006773 3.56 0.000 .1612178 .5558656
Manufacture | .4486377 .0716081 6.27 0.000 .3082884 .588987
Agriculturee~n | .1409947 .0878556 1.60 0.109 -.0311991 .3131884
_cons | -1.513547 .0652863 -23.18 0.000 -1.641506 -1.385588
Annexes
121
Régression probit in the sample avec échantillon 1_échantillon2 de la spécification d’Hauser et Booth (2011)
Probit regression Number of obs = 4063
Wald chi2(6) = 95.94
Prob > chi2 = 0.0000
Log pseudolikelihood = -1388.4884 Pseudo R2 = 0.0366
--------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------------+----------------------------------------------------------------
Croissanceve~s | .0196655 .0117665 1.67 0.095 -.0033963 .0427273
ratiocouvert~e | -.0256042 .0145184 -1.76 0.078 -.0540597 .0028514
Fondderoulem~t | .520513 .0583349 8.92 0.000 .4061788 .6348473
changementde~o | .2012347 .0815103 2.47 0.014 .0414774 .360992
Manufacture | .1796982 .060136 2.99 0.003 .0618339 .2975626
Agriculturee~n | .142072 .0695029 2.04 0.041 .0058488 .2782952
_cons | -1.454671 .0523576 -27.78 0.000 -1.557289 -1.352052
Annexes
122
Régression probit in the sample avec échantillon 2_échantillon3 de la spécification d’Hauser et Booth (2011)
Probit regression Number of obs = 4063
Wald chi2(6) = 118.55
Prob > chi2 = 0.0000
Log pseudolikelihood = -1378.831 Pseudo R2 = 0.0419
--------------------------------------------------------------------------------
| Robust
Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------------+----------------------------------------------------------------
Croissanceve~s | .0219457 .0077967 2.81 0.005 .0066644 .037227
ratiocouvert~e | -.0195766 .0114826 -1.70 0.088 -.0420822 .0029289
Fondderoulem~t | .507824 .0594437 8.54 0.000 .3913164 .6243315
changementde~o | .1984155 .0794885 2.50 0.013 .0426209 .3542102
Manufacture | .3634922 .0597571 6.08 0.000 .2463705 .4806138
Agriculturee~n | .1955093 .0708531 2.76 0.006 .0566397 .3343788
_cons | -1.525159 .0510641 -29.87 0.000 -1.625243 -1.425075
top related