modÈle de probabilitÉ de dÉfaut des...

HEC Montréal

MODÈLE DE PROBABILITÉ DE DÉFAUT DES PRÊTS

D’UNE BANQUE CANADIENNE

Fatoumata A dite Woybi Touré

11135079

Science de la gestion

(Ingénierie financière)

Projet supervisé présenté en vue de l’obtention

du grade de maitrise ès science

Directeur de projet :

Georges Dionne

Décembre 2013

Sommaire

SOMMAIRE

La dernière crise financière a mis en exergue la nécessité pour les banques de se doter de modèles

dynamiques et précis d’évaluation du risque de défaut de leurs clients. En effet, malgré

l’abondance et la diversité des modèles, les chocs résultants de la conjoncture de l’économie et

les problèmes d’asymétrie d’information remettent en perspective la nécessité d’une révision

continuelle des modèles existants. La quantification de la probabilité de défaut et sa prédiction

constitue à cet effet, un jalon incontournable des activités de gestion du risque des banques. Dans

un contexte de réglementation et de concurrence soutenue du secteur bancaire, ce paramètre

devient alors un moteur précurseur d’une gestion optimale du risque et dont la quantification

requiert une distinction entre les petites et moyennes entreprises (PME) et les grandes

entreprises. En effet, si les modèles de scoring permettent de discriminer dans le processus

d’octroi de prêt, la disponibilité de l’information et la capacité d’amortissement des chocs

exogènes à leurs activités courantes, rendent l’évaluation du risque des PME fastidieux.

Notamment, les modèles statistiques mettant à contribution des variables qualitatives et

quantitatives ont été prioriser dans l’évaluation de leurs défauts. Dans le présent projet, nous

proposons un modèle économétrique afin de déterminer les variables qui expliquent le défaut

au sein du portefeuille de crédit de PME d’une banque canadienne. Nous mettrons en relief la

pertinence de ce modèle à travers sa propension à prédire et à capter la dynamique des défauts.

Nous apportons des évidences empiriques et nous analysons également des pratiques de la

banque en étude. À cet effet, nous mesurons et testons la significativité du pouvoir prédictif de

notre modèle. Nos résultats établiront la pertinence du modèle ainsi que des variables utilisées,

entérinant par le fait les pratiques de la banque.

Mots clés : risque de crédit, risque de défaut, PME, prédiction du défaut, modèles

économétriques, tests.

Table des matières

TABLES DES MATIÈRES

Sommaire .......................................................................................................................................... i

Liste des figures ............................................................................................................................... iv

Liste des Tableaux ............................................................................................................................ v

Table des annexes .......................................................................................................................... vii

1. Introduction ............................................................................................................................. 8

1.1 Mis en situation ............................................................................................................... 8

1.2 Pratique de la banque et développement d’un modèle économétrique ....................... 9

1.3 Objectifs et apport du projet ......................................................................................... 11

1.4 Organisation du travail .................................................................................................. 12

2. Le risque de crédit des banques ............................................................................................ 14

3. Définition d’une PME ............................................................................................................ 17

4. Revue de littérature .............................................................................................................. 18

5. Modélisation du défaut et validation des modèles ............................................................... 25

5.1 Modèles ......................................................................................................................... 25

5.1.1 Modèle probit ........................................................................................................ 25

5.1.2 Modèle logit .......................................................................................................... 26

5.1.3 Hypothèses ............................................................................................................ 28

5.2 Validation et évaluation du modèle ............................................................................. 29

5.2.1 Validation...................................................................................................................... 29

5.2.2 Évaluation .............................................................................................................. 32

6. Variables explicatives ............................................................................................................ 41

7. Données ................................................................................................................................. 46

8. Résultats : .............................................................................................................................. 49

8.1 Partie 1 : Réplication Simard (2012) .............................................................................. 49

8.1.1 Statistiques descriptives ........................................................................................ 49

8.1.2 Matrice de corrélation ........................................................................................... 49

8.1.3 Résultats des régressions ...................................................................................... 50

8.1.4 Signes des coefficients des régressions et interprétation économique des

variables explicatives significatives ....................................................................................... 54

Table des matières

8.1.5 Test de validité du modèle .................................................................................... 56

8.1.6 Test de stabilité ..................................................................................................... 57

8.2 Partie 2 : Régressions supplémentaires ........................................................................ 58

8.2.1 Régression avec les variables but du prêt ............................................................. 58

8.2.2 Régression avec les variables sectorielles ............................................................. 58

8.2.3 Régression avec toutes les variables qualitatives ................................................. 59

8.3 Partie 3 : validation et évaluation de la spécification finale.......................................... 60

8.3.1 Test de significativité ............................................................................................. 60

8.3.2 Le critère d’information AKAIKE (AIC) et le critère d’information de Bayes (BIC) 61

8.3.3 Test de performance: test d’Hosmer-Lemeshow .................................................. 62

8.3.4 Roc Curve ............................................................................................................... 62

8.3.5 Performance dans la prédiction du défaut: Matrice de confusion (M-C) ............. 65

8.3.6 Robust test : Estimation année 2007 versus Estimation année 2008 ................... 66

8.3.7 Pouvoir prédictif:« Estmation in the sample» - «Prédiction out of the Sample » 68

9. Conclusion ............................................................................................................................. 76

10. Limites et Recommandations ............................................................................................ 79

Bibliographie .................................................................................................................................. 82

Annexes ......................................................................................................................................... 86

Listes des figures

LISTE DES FIGURES

Figure 1: Roc_curve ............................................................................................................................... 36

Figure 2: Roc curve -modèle final probit) ............................................................................................. 64

Figure 3: Roc curve - modèle final (logit) .............................................................................................. 64

Tables des annexes

LISTE DES TABLEAUX

Tableau 1: Matrice de confusion (M-C) ................................................................................................ 35

Tableau 2: Échantillonnage «in the sample» - « out of the sample» .................................................... 40

Tableau 3: Variables explicatives .......................................................................................................... 42

Tableau 4: Statistique descriptive des données de défaut .................................................................. 47

Tableau 5 : Modèles correspondant aux différentes estimations ........................................................ 54

Tableau 6: Résultats des tests de vraisemblance respectifs ................................................................. 56

Tableau 7: Résultats du test de Wald ................................................................................................... 60

Tableau 8 : Mesures AIC et BIC pour les spécifications probit .............................................................. 61

Tableau 9 : Mesures AIC et BIC pour les spécifications logit ................................................................ 61

Tableau 10 : Mesures AUC pour les spécifications probit .................................................................... 63

Tableau 11 : Mesures AUC pour les spécifications logit ....................................................................... 63

Tableau 12 : M-C avec un seuil de 20% (toute la population) ............................................................. 65

Tableau 13: M-C avec un seuil de 11,34% (toute la population) .......................................................... 65

Tableau 14 : M-C avec un seuil de conservatisme de 20%( 65% population) ....................................... 69

Tableau 15 : M-C avec un seuil de 11,34% (65% de la population) ...................................................... 69

Tableau 16: M-C avec un seuil de 20% (60% de la population-échantilonn1) ...................................... 70

Tableau 17: M-C avec un seuil de 11,34%(60% de la population-échantilonn1) .................................. 70

Tableau 18 : M-C avec un seuil de 20%(60% de la population-échantilonn2) ...................................... 71

Tableau 19: M-C avec un seuil de 11,34% (60% de la population-échantilonn2) ................................. 71

Tableau 20 : M-C avec un seuil de 20%(60% de la population-échantilonn3) ...................................... 71

Tableau 21 : M-C avec un seuil de 11,34%(60% de la population-échantilonn3) ................................. 72

Tableau 22: M-C avec un seuil de 20%(55% de la population) ............................................................. 72

Tableau 23: M-C avec un seuil de 11,34%(55% de la population) ........................................................ 73

Tables des annexes

Tableau 24: M-C avec un seuil de 20%(échantillon3 de la spécification d’Hauser et Booth (2011)).... 74

Tableau 25 : M-C avec un seuil de 11,34%(échantillon3 de la spécification d’Hauser et Booth (2011))

.............................................................................................................................................................. 74

Tableau 26 : M-C avec un seuil de 20%(échantillon1 de la spécification d’Hauser et Booth (2011)) ... 74

Tableau 27: M-C avec un seuil de 11,34%(échantillon1 de la spécification d’Hauser et Booth (2011))

.............................................................................................................................................................. 75

Tables des annexes

TABLE DES ANNEXES

Annexe 1: Calcul des ratios ................................................................................................................... 86

Annexe 2: statistiques descriptives, matrice de corrélation, test de multicolinéarité ......................... 88

Annexe 3: Résultats des régressions probit .......................................................................................... 96

Annexe 4: résultats des régressions logit............................................................................................ 104

Annexe 5 : résultats régressions supplémentaires avec variables qualitatives .................................. 109

Annexe 6: résultats des estimations avec les échantillons de l'année 2007 et de l'année 2008........ 112

Annexe 7: résultats des estimations « in the sample» ....................................................................... 116

Introduction

1. INTRODUCTION

1.1 Mis en situation

Le risque de crédit est inhérent à toute activité de crédit bancaire. De par les composantes qui la

caractérisent, sa modélisation constitue un véritable défi pour les acteurs du secteur bancaire. En

effet, une des difficultés majeures des banques réside dans l’évaluation de la probabilité de

défaut individuelle de leurs clients. L’hypothèse d’asymétrie d’information est centrale dans les

modèles, car on suppose que l’emprunteur détient plus d’information sur sa probabilité de

défaut. De fait, les banques utilisent différentes méthodes pour se prémunir de ce problème

d’information. On peut citer à cet effet : l’autosélection des risques, les collatéraux ou garanties

de prêts et le scoring bancaire. Diverses variables tant d’ordre qualitatif que quantitatif, sont

utilisées pour spécifier les probabilités de défaut des emprunteurs. La contribution de ces

variables ainsi que l’utilisation de toutes informations pertinentes diffèrent selon la politique de

la banque ainsi que les modèles à l’interne.

Parallèlement, l’évolution de la conjoncture économique met en exergue régulièrement les failles

du système existant et nous exhorte à une correction des politiques adaptées. Notamment, la

distinction entre les PME et les grandes entreprises est devenue prépondérante dans la politique

de gestion du risque des banques tant d’un point de vue de modélisation des paramètres du

risque de défaut que de capital économique. Les banques ont, à cet effet, défini des pratiques et

des modèles internes d’évaluation du risque que représentent les PME au vu de la nature

particulière de ces emprunteurs. Ainsi, la diversité des pratiques sujettes aux aléas du cycle

économique et à l’opacité de l’information détenue par l’emprunteur imposent une certaine

révision continuelle des modèles existants. Cet exercice outre d’améliorer les pratiques de la

banque en matière de gestion de risque, favorise un certain appariement entre le risque quantifié

par la banque et le risque réel que représente le client. Par ailleurs, il permet de dégager les

paramètres qui identifient le risque qu’encourt la banque et une modélisation efficiente des

composantes du risque de défaut.

C’est ainsi qu’à la suite d’un stage effectué au sein d’une banque canadienne, que Simard (2012)

a élaboré un modèle économétrique qui se démarque de celui qui est sous-jacent aux pratiques

de la banque. Cette nouvelle spécification dont l’exercice vient tester dans un premier temps les

Introduction

pratiques de gestion du risque de la banque (modèles utilisés et processus de prise de décision

d’octroi des prêts), fait écho à la nécessité pour les banques :

1- D’identifier les variables qui expliquent le défaut,

2- De développer les modèles les plus précis,

3- De cultiver une gestion saine du risque de crédit à travers la remise en question et la mise

à jour des modèles existants,

4- De définir de nouveaux modèles qui captent mieux la dynamique des marchés à la suite

de changements importants.

Sur un second volet, ce modèle qui se repose sur les études empiriques, sera un outil innovateur

pour cette banque à travers une nouvelle spécification du risque de crédit que génèrent ses

activités de prêts.

1.2 Pratique de la banque et développement d’un modèle économétrique

La banque commerciale dont les pratiques sont mises en étude dans le présent travail privilégie

les prêts aux PME et à des entreprises dans le secteur des technologies et de l’information. Afin

de préparer les dossiers pour le crédit dans le processus d’octroi de prêt, l’évaluation du risque

de ses clients potentiels est faite sur la base de «certaines analyses»1 comme suit :

- «Analyse financière basée sur divers ratios comptables »

- «Analyse économique basée sur les industries et secteurs d’activités dans lesquels

opèrent les clients, de même que leur position concurrentielle dans leurs marchés

respectifs.»

1 Adréanne Simard (2012)

Introduction

- «Analyse environnementale, à laquelle est accordée une attention particulière due à la

mission et au code éthique de la Banque en question. L’importance de cette analyse

provient aussi de son impact sur la valeur attribuée au collatéral offert en garantie sur les

prêts.»

- «Analyse de l’équipe de gestion de la firme, dont :

Niveau de scolarité des entrepreneurs et leur expérience appliquée au domaine

étudié

Scores obtenus grâce à un bureau de crédit (Equifax).»

En ce qui a trait aux pratiques de la banque pour la détermination et la prédiction de la probabilité

de défaut une fois le prêt octroyé, nous n’avons pas la spécification du modèle sous-jacent et le

nom de l’outil informatique permettant de la dériver. Simard(2012) a toutefois suggéré qu’une

spécification économétrique avec 10 variables explicatives comme pour le modèle RiskCalc de

Moody’s serait une bonne spécification.

La précision et la performance prédictive de tout modèle sous-jacent à la détermination des

paramètres du risque de crédit sont d’une importance capitale pour les banques. Notamment, la

précision et le pouvoir prédictif des modèles d’estimation de la probabilité de défaut, soit notre

variable d’intérêt, déterminent une meilleure allocation du capital économique et du capital

réglementaire. Ces deux coussins de capital soutiennent les gestionnaires dans leurs processus

d’octroi de prêts tant pour les nouvelles demandes que pour les renouvellements de prêts.

Fortement influencé par la politique d’appétit pour le risque de la banque, le capital économique

et le capital réglementaire définissent le socle des stratégies de gestion de risque intégrée et de

toute activité susceptible de générer des revenus et du risque au sein de la banque. De fait, ils

dépendent des paramètres de défauts du portefeuille de crédit de la banque. On peut alors

comprendre l’essor des modèles pour l’estimation de ces paramètres, notamment dans le milieu

académique dans un premier temps avant que les banques ne prennent la dimension colossale

de ce problématique dans leur rentabilité. Les banques ont alors développé des modèles qui se

basent essentiellement sur les études académiques antérieures. Ainsi, en passant par l’analyse

Introduction

discriminante d’Atlman aux premières spécifications économétriques qui n’ont cessé d’évoluer,

la quantification de la probabilité de défaut ainsi que sa prédiction a connu une expansion

vertigineuse. À cet effet, compte tenu de la nature particulière des PME, les modèles

économétriques ont été mis fortement à contribution pour la quantification du risque de défaut

qu’elles peuvent représenter. Les modèles à variables dépendantes limitées dans leurs domaines

(binaires ou positives), sont alors utilisés pour quantifier et prédire le défaut, prédire le temps

avant le défaut (modèle de comptage) et d’autres spécifications de plus en plus sophistiquées

selon le problème considéré. La richesse de ces recherches justifie le choix de notre spécification

économétrique qui se démarque de celle de la banque et se caractérise à cet effet, comme étant

un nouvel outil. C’est en cela que ce travail constitue d’ailleurs un apport considérable pour la

banque dans sa politique de gestion de risque. En effet, en capitalisant sur les résultats empiriques

des modèles économétriques, les modèles probit et logit mis à contribution dans le présent

travail, lui permettront de juger de la pertinence de son processus de sélection des clients. Ces

modèles permettront également d’indiquer les variables, qui déterminent et prédissent les

défauts au sein de son portefeuille de crédit.

1.3 Objectifs et apport du projet

Le présent travail s’inscrit dans le cadre de la validation des pratiques d’une banque canadienne

en termes d’analyse des différents risques de prêts. Plus précisément, il s’agit dans un premier

temps, d’identifier parmi les paramètres utilisés par la banque, ceux qui prédisent le mieux le

défaut des emprunteurs de types PME (Petites et Moyennes Entreprises) et ce, au moyen d’un

modèle économétrique. Ce volet du travail a été couvert par Adréanne Simard (2012).

Le second volet du projet portera sur la validation de ce modèle économétrique. Cet exercice qui

définit mon apport personnel dans ce travail, nous permettra de montrer dans quelle mesure

notre spécification finale capte la dynamique des probabilités de défaut à travers les pratiques de

la banque. Ainsi, sur la base des résultats obtenus par Simard (2012), ce processus de validation

se définira en quatre étapes :

Introduction

- Déterminer dans un premier temps la spécification finale qui ne prendra en compte que les

variables explicatives significatives.

- Dégager des évidences empiriques qui viennent entériner notre choix de spécification et

nos résultats finaux.

- Tester la performance de notre modèle final à travers diverses mesures de performance.

Plus précisément, nous nous servirons des mesures comme le test Hosmer-Lemeschow, de

la Roc curve et de la matrice de confusions. Il s’agit de métriques et concepts sur lesquels

on reviendra en profondeur.

- Vérifier le pouvoir prédictif du modèle en faisant des régressions «in the sample»

(estimation dans l’échantillon) et des prédictions «out of the sample» (prédiction hors

échantillon).

Ainsi ce processus de validation du modèle qui constitue l’objet de ce projet, vient compléter la

partie de la modélisation de Simard (2012). Ces deux étapes traduisent parfaitement l’objectif

principal: l’évaluation du modèle de la banque ainsi que les variables le constituant et l’estimation

d’un nouveau modèle probabilistique mettant à contribution les paramètres utilisés par la

banque.

Ce modèle nous permettra ainsi de tester les pratiques de la banque en matière de politique de

gestion du risque de défaut ainsi que d’octroi de prêts. C’est également un modèle innovateur

par le fait qu’il diffère de celui sous-jacent à la banque et il pourrait permettre à la banque de

développer un modèle plus sophistiqué avec une meilleure précision et un plus grand pouvoir

prédictif et ce, en mettant à profit nos résultats.

1.4 Organisation du travail

Dans cette optique, le reste du rapport est organisé comme suit : une section portant sur le risque

de crédit pour en définir les contours, une seconde section pour définir les caractéristiques

propres aux petites et moyennes entreprises (PME) et du fait qu’elles doivent être traitées

différemment. Une section couvrira la littérature ayant traité du sujet. Nous définirons par la suite

le modèle utilisé et les tests retenus pour le processus de validation de la spécification finale. Les

variables explicatives mises à contribution ainsi que la nature de nos données feront l’objet de

Introduction

deux autres sections. La section qui portera sur les résultats aura trois volets : le premier

retraduisant le travail de Simard(2012), le deuxième sur des régressions supplémentaires et un

troisième volet sur nos tests de validation de la spécification finale. Nous finirons enfin avec une

conclusion faisant une synthèse du travail et des recommandations au vu des limites de notre

étude.

Le risque de crédit des banques

2. LE RISQUE DE CRÉDIT DES BANQUES

Le risque de défaut représente le risque de perte financière résultant de l’incapacité d’un débiteur

à satisfaire ses obligations de dettes (Longstaff et al. (2011)). Il fait partie du risque de crédit et il

explique en partie les écarts entre les obligations gouvernementales et les obligations privées. La

fin des années 1980 a marqué un tournant important dans son essor. Il devient alors une

préoccupation importante au vu de la récession qui sévissait. Cette période de forte turbulence

économique a ainsi, mis en relief la nécessité de le modéliser et de l’incorporer dans le calcul du

capital de risque des banques. L’accord de Bâle I en 1988 imposant une réglementation sur le

capital économique des banques par rapport à leurs risques de défaut et de faillite, balisa la

gestion du risque de crédit comme composante incontournable de la gestion du risque global de

la banque.

Le risque de crédit peut se diviser en quatre catégories, soit le risque de défaut du client, le risque

de liquidité, le risque de transaction (et de dégradation du rating) et le risque de marché. Le risque

de défaut, qui est en étude dans le présent travail, est déterminé par ces trois composantes que

- La probabilité de défaut : soit la probabilité qu’une contrepartie ne respecte pas son

engagement.

- Le taux de recouvrement au moment du défaut : soit la fraction de la réclamation ou de

l’actif que la banque recevra au moment du défaut (il est donné par 1-LGD, où LGD est le

Loss Given Default).

- L’exposition au risque de défaut au moment du défaut (EAD) : soit la valeur de l’actif au

moment du défaut, pouvant être mesurée par la valeur faciale de la dette ou par la valeur

au marché d’un actif équivalent n’ayant pas fait défaut2.

2 Dionne, G. Notes de cours de gestions de risques et assurances, chapitre 11, p. 59

Le risque de défaut est par définition la probabilité qu’une entreprise se trouve en position de

défaut dans un certain horizon temporel (Beaulieu (2003), p.9) et donc une composante du risque

de crédit comme nous l’avons déjà souligné.

Bien que l’évaluation de ces composantes soit fastidieuse, diverses méthodes sont utilisées dans

la pratique pour les quantifier dont les principales sont :

- Les bureaux de crédit : pour les prêts de plus petite envergure;

- Les cotes d’agences : pour les firmes publiques ;

- Le modèle structurel de Merton (KMV) : qui utilise les valeurs au marché des entreprises;

- Les modèles statistiques : basés sur les états financiers des firmes;

- Credit Metrics : développé par la banque J.P. Morgan, il analyse le risque de crédit d’un

portefeuille à partir de la valeur à risque et des valeurs au marché contrairement aux

variables utilisées dans le présent travail, qui sont exclusivement des valeurs comptables.

Ces variables s’inscrivent dans l’esprit des modèles statistiques, car les entreprises en

étude ne sont pas cotées en bourse.

En effet, compte tenu de la nature des entreprises en étude dans notre travail et de la composante

du risque de crédit qui nous intéresse, l’emphase sera mise sur les modèles statistiques. Il est à

noter toutefois que la méthode la plus discutée dans la littérature pour l’évaluation du risque de

crédit est celle appliquée aux obligations mettant à contribution les cotes des agences de cotation.

Ces cotes permettent l’évaluation des probabilités de défaut et de migration d’une classe de

risque à une autre. Elles supposent que les entreprises au sein d’une même cote sont homogènes,

ce qui est une hypothèse très forte. Toutefois, du fait de leurs corrélations négatives avec les

probabilités de défaut, on peut les utiliser directement pour prédire ces probabilités de défaut.

Un des facteurs le plus importants dans la gestion du risque de crédit et qui constitue un véritable

défi pour les banques dans une gestion optimale de leurs risques est : l’asymétrie d’information.

Ce facteur se traduit à travers le risque moral auquel font face les banques. Il peut être de deux

ordres : le risque moral ex ante, relié aux actions de l’emprunteur avant la réalisation du défaut

(prévention) et le risque moral ex post, relatif aux actions après la réalisation du défaut. Selon la

nature du risque auquel la banque fait face, elle ne peut ni observer les actions de ses clients, ni

déterminer le but exact des prêts. De ce fait, ce facteur est déterminant dans toute politique de

gestion de risque de crédit optimale. Nous avons cité à cet effet dans l’introduction quelques

exemples de solutions adoptées par les banques en vue d’amoindrir cet aléa qui ne peut être

résorbé complètement.

Définition d’une PME

3. DÉFINITION D’UNE PME

Il convient de donner une définition de ce que l’on entend par PME, pour prendre la dimension

de la problématique entourant la modélisation de leurs probabilités de défaut. Acronyme de

Petites et Moyennes Entreprises, plusieurs critères sont utilisés pour considérer une entreprise

comme faisant partie de cette catégorie. Bien que ces critères soient propres à tous les pays, leurs

spécifications explicites diffèrent d’un pays à un autre, ce qui ne nous permet pas de donner une

définition universelle. Ainsi nous avons que :

- Au Canada, sont considérées comme des PME, les entreprises à exploitation commerciale

qui ont moins de 500 employés et un chiffre d’affaires annuel inférieur 50 millions de dollars

avec certaines exclusions (entreprise constituée de personne morale, les organismes

publics, les organismes à but lucratif, les établissements d’enseignement, les hôpitaux, les

filiales, les coopératives et les sociétés de financement et de contrats de location-

acquisition).

- Aux États-Unis, les small business administration sont dans un premier temps classés par

secteurs d’activités, avec des normes et critères spécifiques à chaque secteur.

- L’Union européenne quant à elle, définit les PME comme des entreprises comptant moins

de 250 employés et avec un chiffre d’affaire annuelle inférieur ou égal à 50 millions d’euros.

La banque en étude étant une banque canadienne qui octroie des prêts à des entreprises

canadiennes, c’est la première définition qui s’appliquera aux compagnies dans notre échantillon.

Revue de littérature

4. REVUE DE LITTÉRATURE

La littérature sur la probabilité de défaut est très dense du fait de la nécessité de bien quantifier

le risque de crédit des banques. Ainsi, Beaver (1967) fut l’un des premiers à se pencher sur cette

problématique et ses recherches trouvent écho dans nombre d’études qui ont suivi.

Il convient de noter qu’une distinction est apportée dans l’évaluation des entreprises publiques

et des entreprises privées en raison de la nature et la disponibilité des données de chacune d’elle

respectivement. Les premières études pour l’essentiel traitaient des firmes publiques. Ainsi, les

modèles de probabilité de défaut à partir des informations comptables prennent en compte des

variables explicatives regroupées en cinq catégories :

Des ratios de liquidité,

Des ratios de profitabilité,

Des ratios d’endettement,

Des ratios de solvabilité,

Des ratios d’activité.

Le « Z – score » résultant de l’analyse discriminante multivariée d’Altman(1968) a été

prédominant dans la pratique et s’inscrit dans la même logique. Ce modèle bien que contraignant

de par les hypothèses sur lesquelles il est basé (1- Modèle linéaire avec distribution normale des

variables indépendantes, 2-homogénéité de la variance de défaut), avait le désavantage de ne

pas prendre en compte la non-linéarité entre les données de défaut et les variables explicatives.

Ainsi, en se basant sur 33 données de défauts de compagnies publiques et de 33 données de non-

défauts, Altman (1968), a retenu cinq ratios se répertoriant dans les cinq catégories ci-dessus

comme étant pertinents et essentiels dans la prédiction du défaut d’une entreprise :

Fonds de Roulement/Actifs totaux,

Bénéfices non répartis/ Actifs totaux,

Bénéfices avant intérêts et impôts/ Actifs totaux,

Valeur de l’équité au marché/ Passifs totaux,

Ventes nettes/Actifs totaux.

Plus flexible par rapport à la nature de l’entreprise, ce modèle est applicable tant aux entreprises

privées qu’aux entreprises publiques contrairement à celui développé par Merton (1974). En

effet, sous l’hypothèse que l’avoir des actionnaires correspond à une option d’achat sur les actifs

de l’entreprise avec comme prix d’exercice la dette (totale ou partielle), Merton (1974) a apporté

une contribution considérable à l’évaluation des probabilités de défaut. Toutefois, ce modèle

n’est applicable qu’aux entreprises publiques.

Edminster (1972) effectua la première étude sur la prévision du défaut qui mettra à contribution

le Z – score d’Altman (1968) sur 43 firmes. Il conclut alors que les ratios de liquidité et

d’endettement ont le plus grand pouvoir prévisionnel du défaut.

Le modèle de régression non- linéaire de type logit fut par la suite proposé par Atlman et Ohlson

(1980) afin de parer aux hypothèses très fortes de l’analyse multivariée. Ces auteurs mettront

l’emphase sur la taille de l’entreprise, la structure du capital, la performance financière et les

liquidités immédiates et ce, en étudiant 2163 firmes pour capter la dynamique des défauts.

La littérature mettant en relief l’évaluation de la probabilité de défaut des PME a connu un grand

essor par la suite. Plusieurs auteurs rebondiront sur l’approche d’Edminster (1972) avec

différentes variantes, notamment l’introduction des variables qualitatives.

Ainsi Lehmann (2003) obtient un modèle prévisionnel plus précis en incluant dans de l’analyse

discriminante multivariée des variables explicatives qualitatives du nom de « Soft Info».

Beaulieu (2003) analysa le défaut de 3332 PME canadiennes au niveau commercial sur la période

1997-2001 et obtint un modèle avec plus de variables explicatives significatives :

Croissance des ventes,

Croissance de l’avoir net,

Couverture des intérêts,

Comptes clients en jours divisés par les ventes nettes,

Ratio de liquidité immédiate,

Passifs totaux /Actifs totaux.

Le travail de Lopez (2006) qui porta sur les prêts octroyés au Puerto Rico, mettra en relief la

nécessité de connaitre la nature du prêteur pour les banques afin de réduire au plus le problème

d’asymétrie d’information. Il indique notamment que les caractéristiques pertinentes pour

distinguer les bonnes firmes des mauvaises firmes sont celles propres aux propriétaires des

entreprises.

Dans Altman et Sabato (2007), les deux auteurs concluent à la pertinence de l’utilisation d’un

modèle logistique par rapport au modèle d’analyse discriminante multivariée. En effet, le modèle

logistique a l’avantage de considérer le problème de multicolinéarité des ratios utilisés et il

permet de relaxer les hypothèses de relation linéaire entre les variables et d’homoscédasticité.

Ainsi, à la suite d’une régression logistique sur 2000 PME américaines, ils retiendront 5 ratios pour

expliquer la probabilité de défaut et deux de ces variables se trouvent parmi celles d’Altman

(1968) :

Dette à court terme/ Valeur de l’équité au livre,

Bénéfices non répartis/ Actifs totaux,

Bénéfices avant intérêts, impôts et amortissement/ Actifs totaux,

Bénéfices avant intérêts, impôts et amortissement/Dépenses d’intérêts,

Encaisse /Actifs totaux.

Bonfim (2009) dans son étude sur 30 000 firmes portugaises en vue de déterminer les facteurs

qui caractérisent le défaut, mettra l’emphase sur les déterminants résultant des caractéristiques

idiosyncratiques de l’entreprise et sur les déterminants macroéconomiques résultant du risque

systématique. En utilisant des régressions probit et logit respectivement avec des facteurs

macroéconomiques comme le PIB, les taux d’intérêt, la production industrielle et les écarts des

taux obligataires, l’auteur arrive à la conclusion que les ratios propres à l’entreprise sont les plus

pertinents dans la prédiction du défaut. Il souleva entre autres, la nécessité de spécifier la nature

de l’entreprise et trouva cinq ratios importants dans un modèle de probabilité de défaut qui

rejoint la plupart des études antérieures:

Croissance des ventes,

Ratio de solvabilité,

Ratio de liquidité,

Taux d’investissement.

Gunawidjaja et Hermanto (2010) ont proposé un modèle qui corrige le problème de

multicolinéarité indiqué par Altman et Sabato (2007). Ce modèle leur a permis d’aligner les

politiques des banques à celles de Bâle II en matière de gestion du risque et ce, en définissant

un coussin de capital requis par les banques pour les PME. Ces auteurs ont défini à cet effet, un

outil d’analyse du risque de crédit pour ce type d’entreprise. Toutefois, l’apport de cette étude

pour notre travail s’inscrit dans l’utilisation de modèles logit et probit sur les 1845 PME

indonésiennes (de 2005 à 2007). En effet, les auteurs trouvent que les principaux paramètres

utiles à la prédiction du risque de défaut sont les ratios de liquidités courantes, de la couverture

d’intérêt et de la période de collection moyenne des comptes à recevoir, ce qui rejoint les études

d’Edminister (1972) et Altman et Sabato (2007). Par ailleurs, l’une de leurs conclusions

importantes est que les deux modèles probit et logit utilisés sont consistants.

Fidrmuc et Hainz (2010) ont à leur tour modélisé le risque de défaut des PME en mettant en étude

700 prêts octroyés par des banques en Slovaquie sur la période allant de 2000 à 2005. Cette étude

est particulièrement pertinente pour notre travail de par le parallèle entre la période de crise

traversant ce pays sur la période d’étude et la période de crise économique sur laquelle les

données de notre travail ont été collectées. Par ailleurs, telle que dans le présent travail, les

auteurs ont introduit des variables de contrôle afin d’isoler certains effets dépendamment de

l’industrie, de la forme légale de l’entreprise et de la variable dite temporelle. Ils en arrivent à la

conclusion que le défaut diffère d’un secteur à un autre et précise l’importance de tenir compte

de cette variante dans les modèles.

McCann et McIndoe (2012), dans leur étude des prêts octroyés à des PME en Irlande, ont mis en

relief la nécessité de tenir compte du secteur d’activité dans l’analyse de la probabilité de défaut.

Ce résultat est d’autant plus important qu’il fait écho au présent travail. En effet, ils ont réparti

un échantillon de 6745 entreprises entre 10 secteurs d’activités :

Hôtel et restaurant,

Manufacture,

Ventes en gros et ventes en détails,

Construction,

Finance,

Information et communication,

Les services professionnels,

Services publics, locaux et de santé,

Immobilier,

Transport.

Dans une première régression probit mettant à contribution que ces secteurs en variables

dummy, les deux auteurs trouveront que les secteurs Services publics/ locaux /santé

enregistrent la meilleure santé financière. Par la suite, les auteurs ont rajouté 8 variables

explicatives tant qualitatives que quantitatives : le ratio de taille du prêt, le ratio de Chiffre

d’affaires total/Actifs totaux, une variable indicatrice indiquant si le manager s’est vu

octroyer un prêt de 10 ans ou plus et servant de proxy à l’âge de la firme ainsi que de

l’expérience du manager, le ratio de Bénéfice avant intérêt, dépréciation et taxe/ Actif totaux,

le ratio de Trésorerie d’exploitation/ Actifs totaux, le Fonds de roulement, le ratio de Créance

commerciale/Actifs totaux, et un ratio d’endettement ( ratio of total liabilities). Cette étude

mettra en exergue plusieurs impacts sur le défaut en isolant différents effets. Notamment, les

auteurs ont estimé le modèle probit en utilisant : 1- toutes les variables explicatives, 2- les

variables dummy des secteurs et chacune des autres variables explicatives prises isolement. Ils

en arrivent à conclusion que les secteurs de l’agriculture (comme dans Simard (2012)), de

l’immobilier et de la construction ainsi que des ratios de Prêt/ Actifs totaux, ratio de

liquidité courante, ratio de levier financier, ratio de liquidité et le ratio de profitabilité sont

significatifs dans la détermination du défaut. Les deux conclusions importantes résultantes

de cette étude après avoir isolé les effets sur le défaut dépendamment de l’industrie et des

variables financières, sont que :

1- Les variables qui déterminent le défaut diffèrent d’un secteur à un autre.

2- Certains secteurs captent mieux la dynamique des défauts. Les deux auteurs le traduisent

par l’importance de l’hétérogénéité des prêteurs en référence à la segmentation des secteurs

dans leur travail.

Cette conclusion influence la présente étude puisque l’on a utilisé la même spécification en tenant

compte des caractéristiques des emprunteurs de la banque en étude. Ils ont dégagé également

une mesure des pertes anticipées en utilisant les probabilités de défaut et les expositions de

la banque.

Sirirattanaphonkun et Pattarathammas (2012) dans leur étude comparative des modèles

MDA (Multiple Discriminant Analysis) et logit des prêts octroyés à des PME en Thaïlande,

arrivent à la conclusion que le modèle logit a un pouvoir prédictif plus élevé que le modèle

MDA et qu’en combinant les variables explicatives retenues dans les deux modèles, on trouve

un modèle hybride avec un plus grand pouvoir de prédiction du défaut.

Les auteurs ont également mis en évidence la nécessité de modéliser le défaut des PME

séparément de celui des grandes compagnies en comparant les modèles de Buggakupta (2004) et

Kiatutkhajornvong (2008) respectivement et leur modèle logit dans le cas de la Thaïlande. Ce point

soulève la contrainte qui impose aux banques de générer des modèles propres aux PME dans une

gestion optimale du risque de crédit.

Plus récensement Dainelli, Giunta et Cipollini (2013) ont mis en exergue dans leur étude de 187

firmes italiennes l’importance de tenir compte des données de crédit historiques au lieu des seuls

postes comptables dans la prédiction du défaut. Les auteurs ont utilisé des modèles logistiques

linéaire et non linéaire respectivement avec un ensemble de 55 variables résultant d’une synthèse

de la littérature existante et regroupées en trois catégories : profitabilité, solvabilité et liquidité,

relation de qualité de crédits. Ils ont retenu 5 variables pertinentes dont trois postes comptables

et deux de données de l’historique de crédit. Ils en arrivent aux conclusions que :

- Les données de crédit historiques sont prédominantes dans le rating de crédit des PME.

- Les deux principaux facteurs qui permettent de mieux détecter et de mieux prévenir la

probabilité de défaut sont : une faible profitabilité et une détérioration de la qualité des

relations de crédit, exprimées par l’utilisation du ratio des lignes de crédit court terme.

Modélisation du défaut et la validation des modèles

5. MODÉLISATION DU DÉFAUT ET VALIDATION DES MODÈLES

Cette section retrace les modèles mis à contribution dans le présent travail, les hypothèses posées

pour faire l’inférence statistique et les différentes procédures et mesures utilisées pour valider la

spécification finale et tester sa performance.

5.1 Modèles

Dans le présent travail, les modèles en étude sont des modèles à variables dépendantes

dichotomiques, spécifiquement les modèles logit et probit. Le modèle logit étant le plus utilisé

dans la littérature, il nous servira de benchmark pour les résultats qui seront dérivés. Les deux

modèles diffèrent de par les hypothèses sur les distributions respectives des termes d’erreurs. Les

spécifications propres à chacun sont définies dans ce qui suit.

5.1.1 MODÈLE PROBIT

Soit le modèle linéaire simple latent :

𝑌�̃� = 𝛽′𝑥𝑖 + 𝜀𝑖 (1)

𝑥𝑖= Vecteur des variables explicatives.

𝛽′ = Vecteur des paramètres.

La variable dépendante 𝑌�̃� est une variable latente non observable mesurant la probabilité de

défaut. Le terme d’erreur suit une loi normale.

Et la règle d’observation associée à la variable latente 𝑌�̃� est définie comme suit:

𝑌𝑖 = {1 𝑠𝑖 𝑑é𝑓𝑎𝑢𝑡 𝑜𝑢 𝑌�̃� > 00 𝑠𝑖𝑛𝑜𝑛

La probabilité de défaut est alors définie comme suit:

𝑝(𝑌𝑖 = 1) = 𝑝(�̃�𝑖 > 0) (2)

𝑝(𝑌𝑖 = 1) = 𝑝 (𝛽′𝑥𝑖 + 𝜀𝑖 > 0) (3)

𝑝(𝑌𝑖 = 1) = 1 − 𝑝 (𝛽′𝑥𝑖 + 𝜀𝑖 < 0) (4)

𝑝(𝑌𝑖 = 1) = 1 − 𝑝 (𝜀𝑖 < − 𝛽′𝑥𝑖) (5)

𝑝(𝑌𝑖 = 1) = 1 − 𝜙 (− 𝛽′𝑥𝑖) (6)

𝑝(𝑌𝑖 = 1) = 𝜙 ( 𝛽′𝑥𝑖) (7)

5.1.2 MODÈLE LOGIT

La spécification reste la même telle que ci-dessus avec les mêmes interprétations des variables:

𝑌�̃� = 𝛽′𝑥𝑖 + 𝜀𝑖 (8)

Et la règle d’observation est également :

𝑌𝑖 = {1 𝑠𝑖 𝑑é𝑓𝑎𝑢𝑡 𝑜𝑢 𝑌�̃� > 00 𝑠𝑖𝑛𝑜𝑛

Toutefois, le terme d’erreur suit une loi logistique dont la fonction est la suivante :

Λ(𝛽𝑥𝑖) = 1

1+𝑒−𝛽𝑥𝑖 (9)

Dans le cas où la distribution a des queues plus épaisses indiquant une plus forte concentration

des données dans les extrêmes, le modèle logistique sera le mieux indiqué. Donc notre exercice

de comparaison nous permettra de déterminer entre autres la spécification la mieux indiquée

pour capter la dynamique des défauts à travers celui qui aura le plus grand pouvoir explicatif et il

indiquera également la distribution appropriée des termes d’erreurs.

Les deux modèles sont estimés par maximum de vraisemblance, soit en maximisant la fonction

de vraisemblance :

𝐿 = ∏ (𝑃(𝑌𝑖 = 1 ))𝑌𝑖𝑁

𝑖=1 ∗ (𝑃(𝑌𝑖 = 0))1−𝑌𝑖

𝑃(𝑌𝑖 = 1 ) = La probabilité que 𝑌𝑖 soit égale à 1, soit la probabilité que l’entreprise ait fait

défaut

𝑃(𝑌𝑖 = 0 ) = La probabilité que 𝑌𝑖 soit égale à 0, soit la probabilité que l’entreprise n‘ait pas fait

défaut.

Les modèles probit et logit ont été estimés par maximum de vraisemblance dans STATA via les

commandes probit et logit. Stata utilise «les données individuelles des différents prêts afin

d’ajuster les modèles, et calcule par la suite les statistiques de diagnostic par un modèle

covariable3, en conservant la taille de l’échantillon initial. Ainsi, les sujets (ou prêts) ont des

résultats différents malgré qu’ils aient les mêmes valeurs covariables et ajustées, de même que

les mêmes statistiques de diagnostic».4

3 Modèle qui utilise une variable explicative (covariable) pour laquelle la variation est étudiée comme

facteur causant la variable principale (ici le défaut).

4 Simard, Adréanne, 2012

5.1.3 HYPOTHÈSES5

- Les termes d’erreurs sont indépendants des variables explicatives.

- La distribution des termes d’erreur est normale (respectivement logistique) pour le modèle

probit (respectivement pour le modèle logit).

Ces deux conditions doivent être remplies également :

𝑙𝑖𝑚𝑥𝑖,𝛽→∞ 𝑃(𝑌𝑖 = 1) = 1 (11)

𝑙𝑖𝑚𝑥𝑖,𝛽→∞ 𝑃(𝑌𝑖 = 0) = 0 (12)

5 Simard, Adréanne 2012

5.2 Validation et évaluation du modèle

L’objectif escompté de cette étude est d’avoir le modèle le plus parcimonieux avec la plus grande

performance prédictive possible. À cet effet, nous ne retiendrons que les variables explicatives

significatives, dont les explications respectives du défaut, prendront un sens économique. Ainsi,

divers tests et statistiques seront mis à contribution pour valider notre spécification finale et

évaluer sa performance. Cette section répertorie les mesures, tests et processus qui seront utilisés

pour cette étape importante du projet.

5.2.1 VALIDATION

La validation d’un modèle est indissociable de tout processus d’estimation. C’est une étape

cruciale dans l’élaboration de tout modèle de prédiction. À cet effet, diverses procédures et

métriques qui permettent de valider un modèle sont utilisées dans la littérature. Nous avons

retenu les plus pertinents pour cette étape et elles sont reproduites dans ce qui suit.

5.2.1.1 Test du rapport de vraisemblance

C‘est un test de spécification du modèle qui compare généralement deux modèles. Basé sur les

fonctions de log vraisemblance dans STATA, la statistique test qui est associée correspond à la

différence entre les logs de vraisemblance respectifs du modèle dit contraint et du modèle sans

restriction. La technique d’estimation par maximum de vraisemblance utilisée pour dériver les

paramètres estimés de nos modèles maximise la fonction de vraisemblance. L’idée sous-jacente

à ce test est que l’omission de toutes variables explicatives pertinentes (modèle contraint)

impliquera une diminution importante de la log vraisemblance. Ainsi, ce ratio devrait traduire

dans quelle mesure l’omission de certaines variables viendra affecter notre inférence indiquant à

cet effet, la pertinence d’une spécification par rapport à une autre. La statistique test

correspondante, du nom de ratio de vraisemblance est la suivante :

𝐿𝑅 = 2(log 𝑙𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑𝑠𝑎𝑛𝑠 𝑟𝑒𝑠𝑡𝑟𝑖𝑐𝑡𝑖𝑜𝑛 − log 𝑙𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑𝑎𝑣𝑒𝑐 𝑟𝑒𝑠𝑡𝑟𝑖𝑐𝑡𝑖𝑜𝑛) (13)

Cette statistique est comparée à une chi-carré dont le degré de liberté est donné par le nombre

de restrictions, dans notre cas au nombre de variables explicatives omises. La règle de décision

est que si cette statistique est plus grande que le quantile associé au chi-carré, on rejette

l’hypothèse nulle qui correspond au modèle restreint. De façon équivalente, plus le log

vraisemblance est petit, meilleure est l‘estimation et meilleur est le modèle estimé. L’avantage

de ce test est qu’il assure la plus grande puissance selon le théorème de Neyman-Pearson.

5.2.1.2 Test de stabilité

Ce test vise à déterminer dans quelle mesure les valeurs aberrantes affectent la qualité de notre

inférence. Le principe dans le présent travail est d’éliminer les valeurs aberrantes de l’échantillon

et de voir par la suite, si les variables explicatives significatives de notre modèle final le

demeurent. Pour ce faire, Simard (2012) a choisi d’éliminer les seules valeurs aberrantes de la

variable choisie comme proxy de la taille des entreprises dans l’échantillon, soit les ventes. Ces

valeurs atypiques seront éliminées au seuil de 5% et 1% respectivement. Ces spécifications nous

permettront de capter la dynamique de stabilité du modèle dépendamment du niveau de

conservatisme dans le traitement des valeurs atypiques.

5.2.1.3 Mesures AIC et BIC6

Toujours dans une perspective de validation de notre spécification finale, certaines métriques

seront mises à contribution. La première mesure de validation que nous allons aborder est la

mesure AIC du nom de AKAIKE INFORMATION CRITERIA. Le critère d’information d’Akaike, de son

nom français, mesure la qualité du modèle. Plus précisément, elle permet de pénaliser les

modèles en fonction du nombre de paramètres choisis afin de satisfaire le critère parcimonieux,

l’idée étant de choisir le modèle avec le plus bas critère. Cette analyse va parfaitement dans le

sens de l’exercice de validation de notre modèle final.

6 Cahuzac, E., Bontemps, C., « Stata par la pratique: statistiques, graphiques et éléments de programmation », Stata

Press, édition 2008, p.78.

La mesure AIC est définie comme suit :

𝐴𝐼𝐶 = 2𝐾 − 2 log 𝐿 (14)

Où : L = vraisemblance du modèle estimé

k= nombre de paramètres

log correspond au logarithme népérien

La deuxième mesure de validation est la mesure BIC, du nom de Bayesien information criteria.

Cette mesure a été dérivée de la mesure AIC et tient compte, en plus du nombre de variables, de

la taille de l’échantillon également. Elle pénalise à cet effet plus que la mesure AIC pour l’ajout de

nouvelles variables.

La mesure BIC est définie comme suit :

𝐵𝐼𝐶 = 𝐾 log 𝑁 − 2 log 𝐿 (15)

Où : L = vraisemblance du modèle estimé

k = nombre de paramètres

N = taille de l’échantillon

log correspond au logarithme népérien

La règle de décision est la même que pour le critère AIC, choisir le modèle avec la mesure BIC la

plus basse.

Ces deux mesures s’inscrivent parfaitement dans l’optique de dériver le modèle le plus

parcimonieux avec la plus grande précision. En effet, on sait que la précision d’un modèle

augmente avec le nombre de variables explicatives pertinentes. Or, ces deux mesures pénalisent

pour l’ajout de nouvelles variables de sorte qu’elles établissent le seuil auquel, aucune précision

supplémentaire n’est apportée au modèle avec l’ajout de variables non pertinentes.

5.2.1.4 Test de significativité

La spécification finale ne tenant compte que des variables significatives, nous allons utiliser le test

de Wald pour vérifier la significativité des coefficients de ces variables. Cet exercice vient en

support à l’objectif de ne retenir que les variables qui expliquent le défaut dans notre modèle de

prédiction. Ce test s’aligne également avec celui du ratio de vraisemblance.

La statistique test de Wald suit une distribution Chi - carré sous l’hypothèse que le coefficient

estimé est nul. Cette statistique test est obtenue en comparant la valeur du maximum de

vraisemblance du coefficient de la variable testée avec l’écart-type du dit coefficient. Dans le

présent travail, nous allons effectuer un test joint des coefficients des variables explicatives de la

spécification finale et des tests individuels de chaque coefficient. Les hypothèses correspondantes

sont formulées comme suit :

Hypothèse nulle du test-joint : 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑛 = 0

Hypothèse nulle des tests individuels : 𝛽𝑖 = 0 pour chaque i, i = 1, …, n

Les 𝛽𝑖 sont les coefficients d’une estimation d’un modèle à n variables explicatives.

L’alternative étant que les coefficients sont différents de zéro pour les deux hypothèses nulles

respectivement.

5.2.2 ÉVALUATION

Du point de vue efficacité, la performance se caractérise par la capacité du modèle à prédire les

défauts et les non-défauts. Pour cette étape, nous nous servirons de la matrice de confusion pour

notre spécification finale dans un premier temps. Par la suite, on se servira du processus

d’estimation «in the sample» – prédiction «out of the sample» qui mettra à contribution

également la matrice de confusion. La ROC curve et le test Hosmer-Lemeshow seront également

mis à contribution. Nous reproduisons les grandes lignes de ces processus et mesures qui

viendront soutenir la pertinence de notre spécification finale.

5.2.2.1 Test de performance :

Le test de performance qui sera utilisé dans le cadre d’évaluation du pouvoir prédictif de notre

modèle est celui de Hosmer-Lemeshow. Ce test permet de déterminer la qualité d’ajustement du

modèle aux données. Pour un échantillon de n observations et n valeurs prédites par le modèle,

on considère que l’ajustement est satisfaisant si :

La distance entre la valeur observée et la valeur prédite est petite.

Le modèle est bien estimé c'est-à-dire que les fréquences prédites sont proches de

fréquences réalisées

On obtient des bonnes mesures de sensibilité et de spécificité c'est-à-dire que le

modèle permet de bien discriminer entre les valeurs de y = 0 (non-défaut) et y = 1

(défaut) en fonction variables explicatives du modèle. Pour ce dernier point, bien

que pertinent pour cette mesure de performance, il sera plus observable avec la

ROC curve et la matrice de confusion sur lesquelles on reviendra plus en détail.

La construction de la statistique de test correspondante est basée « sur un regroupement de

probabilités prédites par le modèle, par exemple par décile dans un premier temps. On calcule,

ensuite, pour chacun des groupes, le nombre observé de réponses positives y= 1 (défaut) et

négatives y=0 (non-défaut) que l’on compare à la prédiction par le modèle. On calcule alors la

distance entre les fréquences observées et prédites au moyen d’une statistique du Chi2»7 à h-2

degrés de liberté où h correspond au nombre de groupements choisis. Ainsi, lorsque cette

distance est petite, on considère que le modèle est bien ajusté aux données.

7 Cours de régression logistique appliquée, Patrick Taffée

L’hypothèse nulle du test est que le modèle ajuste bien les données. La conclusion escomptée

est de ne pas rejeter cette hypothèse.

5.2.2.2 La matrice de confusion

La capacité d’un modèle à prédire les défauts et les non-défauts est donnée par la matrice de

confusion. Les résultats de la classification des défauts et non défauts déterminés au moyen d’un

seuil préétabli, sont comparés aux défauts et non défauts réalisés. Fondamentalement, il s’agit

d’un tableau qui fournit le type de classification et le pourcentage associé à chaque type. Ces

types sont définis en termes de bonnes classifications et de mauvaises classifications. Les

classifications sont dites bonnes lorsqu’un défaut prédit correspond à un défaut actuel (sensibilité

du modèle) ou un non-défaut prédit correspond à un non-défaut actuel (spécificité du modèle).

Les classifications de type mauvais sont celles qui classent les défauts prédits comme vrais alors

qu’ils correspondent à des non-défauts actuels. Cette mauvaise classification traduit une erreur

de type II. Ce type d’erreur peut amener la banque à revoir son niveau de capital économique

pour se prémunir d’éventuels chocs, ce qui se traduit par un manque à gagner et par ailleurs peut

affecter la qualité de crédit du client. Inversement, une mauvaise classification qui classe les non-

défauts prédits comme vrais alors qu’ils correspondent à des défauts actuels, traduit une erreur

de type I. Les conséquences pour la banque d’une telle classification sont encore plus

importantes puisqu’elles se matérialisent en termes de capital et d’intérêt.

De façon équivalente, nous pouvons définir les mauvaises classifications comme suit :

Si nous supposons une hypothèse nulle définit comme telle :

𝐻0 : 𝑌𝑖 = 1 (ê𝑡𝑟𝑒 𝑒𝑛 𝑑é𝑓𝑎𝑢𝑡).

Les mauvaises classifications seront alors traduites ainsi :

- L’erreur de type I correspond au rejet de 𝐻0 quand 𝐻0 est vrai

- L’erreur de type II correspond à ne pas rejeter 𝐻0 𝑞𝑢𝑎𝑛𝑑 𝐻0 est fausse

Le tableau suivant correspond à une matrice de confusion générale.

Tableau 1: Matrice de confusion (M-C)

Modèle prédiction Défauts actuels Non-défauts actuels

Défauts Vrais positifs Erreur de type II

Non - Défauts Erreur de type I Vrais négatifs

Ces classifications sont très sensibles au degré de conservatisme du modèle, soit le seuil que l’on

choisit. Ainsi, plus ce seuil est restrictif, moins on a d’erreurs de type I mais plus d’erreurs de type

II et inversement. La prochaine section nous permettra de donner la mesure de cette sensibilité

à travers la ROC Curve.

5.2.2.3 La ROC curve

La ROC curve (Receiver Operating Charactristic curve), du nom de courbe de spécificité en

français, est une courbe qui permet de synthétiser l’information résultant de différentes matrices

de confusions associées à des seuils de conservatismes correspondants. Elle correspond alors à

une mesure de la performance d’un classificateur binaire comme c’est le cas avec nos modèles

probit et logit. Son axe des abscisses correspond à (1- la mesure de spécificité du modèle), soit le

pourcentage d’erreur de type II. La mesure de sensibilité est reportée sur son axe des ordonnées,

soit le pourcentage de défauts correctement classés comme des défauts par le modèle. Elle est

alors obtenue en faisant varier le seuil de conservatisme du modèle qui permet de générer

différentes combinaisons bonnes de classification de défaut et d’erreurs de type II. Ces différentes

combinaisons permettent ainsi de déterminer dans quelle mesure le modèle est précis pour

discriminer les défauts et des non-défauts.

L’aire sous la ROC curve du nom de mesure AUC (area under curve) est une mesure de la

performance du modèle dans la prédiction du défaut actuel. Un modèle parfait aura une mesure

AUC de 1. Ainsi, plus le modèle est précis, plus la courbure de la ROC curve est proche du coin

gauche du graphique vers le haut et la mesure AUC est proche de 1.

Figure 1: Roc_curve

Source : http://www.intechopen.com/books/data-mining-applications-in-engineering-and-medicine

La ROC curve tient essentiellement son avantage de sa capacité à tenir compte des erreurs de

type II ainsi que de la surface sous la courbe qui est une excellente mesure de performance d’un

modèle. Cette courbe vient notamment en support au test de Homer-Lemeshow qui capte la

dynamique d’ajustement du modèle aux données.

Ainsi, on s’attend à ce que la spécification finale ait une capacité d’estimation satisfaisante et un

pouvoir discriminatoire élevé.

5.2.2.4 Estimation «in sample» (estimation dans l’échantillon) - prédiction «out of the sample» (prédiction hors échantillon)

Il s’agit d’une procédure qui vise à tester le pouvoir prédictif du modèle. C’est une étape

indispensable dans notre processus d’évaluation et même de validation du modèle qui vient

soutenir la pertinence de notre spécification finale. Il est à noter que sa performance est très

sensible à la population en étude et requiert à cet effet un échantillonnage de la population dont

les tenants seront reproduits dans les sections subséquentes. Ainsi dans ce qui va suivre, nous

présentons les grandes étapes de la procédure et les techniques d’échantillonnage mises à

contribution pour cet exercice.

a. Principe :

L’estimation «in-the sample» et la prédiction «out the sample» consiste à:

1- Constituer deux sous échantillons de la population en étude et selon une spécification

propre aux besoins de l’étude qui l’utilise.

2- Utiliser un des sous échantillons pour estimer le modèle, qui correspond à l’étape de

l’estimation «in the sample».

3- Utiliser les paramètres ainsi obtenus du modèle estimé pour calculer les valeurs prédites

avec le deuxième sous échantillon, soit la prédiction «out of the sample».

4- Vérifier si les valeurs prédites ainsi calculées correspondent aux valeurs réalisées du

deuxième sous échantillon et déduire le pourcentage de bonne classification du modèle.

Dans notre cas, puisque l’on travaille avec un modèle binaire, pour déterminer les défauts prédits

dans le deuxième sous échantillon, il nous faut définir une règle d’observation qui tient compte

du degré de conservatisme du modèle. La règle d’observation des valeurs prédites est la suite :

�̂�𝑖 = {1 𝑠𝑖 𝑑é𝑓𝑎𝑢𝑡 𝑜𝑢 �̆�𝑖 > 𝑑

0 𝑠𝑖𝑛𝑜𝑛 𝑜𝑢 �̆�𝑖 < 𝑑

Où �̂�𝑖 est la classification binaire en termes défaut ou le non-défaut prédits pour la prédiction

«out of the sample» et �̆�𝑖 la probabilité prédite résultant de la prédiction« out of the sample».

La variable d caractérise notre seuil de conservatisme et il est habituellement fixé à 0.5. Toutefois

comme dans l’article de Dionne. G, Artis. M et Montserrat. G (1996) portant sur les prêts octroyés

par une banque espagnole, nous allons tester différents seuils de conservatisme (ou valeurs

critiques associées à la probabilité d’erreur de type I). L’objectif escompté par cet exercice est

alors de déterminer le seuil qui nous permettra d’avoir la classification avec le pourcentage

d’erreurs de type I le plus petit. En effet, comme nous l’avons souligné, l’erreur de type I

correspond à une mauvaise classification qui se mesure en terme de perte de capital et d’intérêt

pour la banque et de fait, engendre des coûts énormes. Par ailleurs, cela nous permettra de

dériver différentes matrices de confusions qui donneront la dimension de ce paramètre dans la

prédiction du défaut ainsi que la performance des modèles selon le niveau de conservatisme de

la banque.

b. Échantillonnage :

Comme nous l’avons souligné, la procédure est sensible à la population étudiée puisqu’il est

nécessaire que le sous-échantillon servant à l’estimation «in the sample» conserve la

significativité des variables explicatives du modèle final. L’exercice se faisant avec deux sous

échantillons de la population, il nous a fallu dans un premier temps, identifier la proportion de la

population qui formera l’échantillon pour l’étape de l’estimation «in the sample» et celle qui

servira pour la prédiction «out of the sample». Les deux procédures suivantes ont été utilisées

pour l’étape de l’échantillonnage et se distinguent par la méthode et la proportion de la

population formant les sous- échantillons.

i. Tirage aléatoire des observations:

L’idée sous-jacente à cette procédure est de former les sous-échantillons requis en effectuant un

tirage aléatoire du nombre d’observations nécessaire. Nous utilisons trois spécifications

respectivement pour former les deux sous échantillons requis :

- 35% des observations pour l’estimation «in the sample» et 65% sont utilisées pour la

prédiction «out of the sample».

L’objectif pour l’étape de l’estimation «in the sample» étant d’avoir un sous échantillons de 35%,

40%, 45% respectivement pour lequel les variables explicatives du modèle final sont toutes

significatives. Nous avons formé 10 sous-échantillons aléatoires pour chacun des fractionnements

de la population (les trois spécifications ci-haut respectivement). Sur les 10 sous-échantillons

aléatoires de chaque subdivision, nous retiendrons que ceux dont les sous-populations de

l’estimation «in the sample» ont toutes les variables explicatives significatives et les secondes

sous-populations correspondantes seront utilisées pour l’étape de la prédiction« out of the

sample».

ii. Three fold cross validation technique (technique de validation de trois groupes croisés):

Cette méthode est basée sur celle de l’étude de Hauser et Booth (2011). Nous reproduisons leur

technique d’échantillon que nous allons utiliser également dans le présent travail, la technique

de mesure de performance étant exactement celle de l’estimation «in the sample» et de la

Les deux auteurs ont utilisé une population de 24 défauts et de 48 non-défauts. Sur une base

aléatoire, ils ont constitué trois sous-groupes pour les défauts et les non- défauts respectivement,

soit trois sous-groupes de 8 défauts et trois sous-groupes de 16 non-défauts. Ils ont par la suite,

formé trois sous-échantillons de 24 observations avec respectivement 8 défauts et 16 non-

défauts. Pour le sous-échantillon servant à l’estimation «in the sample», ils forment des

combinaisons de deux échantillons aléatoires parmi les trois sous-échantillons, pour un total de

trois combinaisons. Pour chaque combinaison résultant de deux sous-échantillons, ils utilisent le

troisième sous-échantillon restant pour la prédiction «out of the sample». Ainsi, on aura trois

subdivisions des données. Chaque subdivison correspondra à une première sous- population

résultant d’une combinaison de deux sous-échantillons aléatoires et à une deuxième sous-

population, soit le troisième sous-échantillon restant.

Nous utilisons le même principe pour former nos échantillons. Notre population comporte 694

défauts, alors nous avons trois sous-groupes aléatoires de 231, 231, et 232 respectivement de

défauts. Nous avons 5401 non-défauts, les sous-groupes correspondants ont respectivement

1800, 1800 et 1801 observations. Par la suite, selon le principe défini ci-dessus, nous avons formé

les différentes spécifications qui serviront dans l’estimation «in the sample» et la prédiction «out

of the sample». Le tableau 2 fournit un résumé de cet échantillonnage.

Tableau 2: Échantillonnage «in the sample» - « out of the sample»

spécifications

Sous échantillons

Estimation «in the sample»

231 défauts 1800 non-défauts

Prédiction «out of the sample» 232 défauts

1800 non-défauts

1801 non-défauts

1800 non-défauts

La spécification 1 utilise les sous-échantillons 1 et 2 pour l’estimation «in the sample» et le sous-

échantillons 3 pour la prédiction «out of the sample». Le principe est reproduit pour les autres

spécifications en changeant à chaque fois les combinaisons.

Variables explicatives

6. VARIABLES EXPLICATIVES

Étant donné que l’on travaille sur la base des résultats de Simard (2012), nous exposerons dans la

présente section les variables explicatives utilisées ainsi que les signes obtenus dans ces

régressions. Ainsi, selon la littérature évoquée dans le présent travail, les pratiques de la banque

en étude et la disponibilité des données, les variables explicatives retenues sont regroupées en

différentes catégories et définies dans le tableau 3. Cette approche s’apparente à celle en vigueur

dans la littérature, qui en plus d’avoir identifié cinq catégories de variables explicatives, établit la

nécessité de tenir compte des variables de contrôle.

Une attention particulière sera portée aux variables ROA et Actif à court terme/Passif à court

terme, puisque Simard (2012), bien qu’ayant trouvé 8 variables significatives, en arrive à la

conclusion qu’un modèle avec 10 variables explicatives serait le mieux indiqué pour capter la

dynamique des défauts. En occurrence, ce modèle s’alignerait parfaitement avec le modèle

Riskcalc PlusTM de Moody’s dont on suppose que la banque en étude se sert comme outil. Nous

étudierons en profondeur dans la section des résultats les signes obtenus dans les régressions et

reproduits dans le tableau 3. Nous reproduisons toutes les variables explicatives répertoriées au

début de l’étude et les sections subséquentes montreront les étapes qui ont conduit à la

spécification finale.

Tableau 3: Variables explicatives

Catégories de variables

explicatives

Types de ratios et autres

Variables explicatives Signes

attendus Signes

trouvés Revues

Variables financières

Ratio de liquidité

Ratio de liquidité courante (ou fonds de roulement)

- - a, b, c, f, j

Équité/ Actifs totaux - -

Actifs court terme / Dette totale - +

Ratio de profitabilité Rendements sur actif moyen (ROA) - - c, f

Fonds disponibles - +

Ratio d’endettement Dette / Équité + - e

Ratio de couverture

Ratio de couverture - - h

Lag ratio de couverture - +

Différence entre le ratio de couverture et son retard

Ratio de croissance

Croissance des ventes - + c, f

Ratio de croissance de la marge brute

Ratio de croissance de du bénéfice net

Variables de contrôle

Année ? - g, h

Autres variables financières

Taille de la firme-ventes -/ ? - b, f

Tailles de la firme-actifs -/ ? b, f

Dette de la banque/dette totale ? -

Engagement total ? -

But du prêt

Fonds de roulement ? +

Immobilisation ? +

Changement de propriétaire ? + h, d

Refinancement et autre ? +

industries

Manufacture ? + h

Agriculture et construction ? + h, g

Vente en détail ? + h

service ? + h, g autres ? s.o. h

Le tableau 3 tient compte entre autres des études qui ont utilisé les mêmes variables explicatives

que les modèles à l’étude dans le présent travail. Ces études sont les suivantes :

a. Edminster(1972)

b. Altman et Ohlson (1980)

c. Beaulieu (2003)

d. Lopez (2006)

e. Altman et Sabato (2007)

f. Bonfim (2009)

g. Fidrmuc et Hainz (2010)

h. McCann et McIndoe (2012)

Dans ce qui suit, nous exposons ce qui explique le choix de chaque poste comptable ainsi que sa

pertinence dans la prédiction du défaut et ce, en égard particulièrement aux pratiques de la

banque en étude et de la littérature existante comme nous l’avons déjà souligné.

Les ratios de liquidité sont de bons indicateurs de la capacité d’une entreprise à faire face à ces

dettes à court terme et ils sont utilisés en analyse financière. Bien qu’ils soient assez nombreux,

nous porterons notre attention sur le ratio de liquidité courante qui est une fonction positive de

la capacité de l’entreprise à honorer ses dettes. Les pratiques de la banque à l’étude sont telles

que «les actifs et les passifs à court terme comprennent tous les postes à ce nom au bilan et non

seulement ceux plus liquides (utilisés dans le calcul du ratio de liquidité immédiate)», Simard

(2012).

Les ratios de solvabilité témoignent de la capacité de la firme à rembourser sa dette sur le long

terme. Ainsi les firmes avec des ratios de solvabilité plus élevés, seront plus aptes à soutenir leurs

dettes de sorte qu’il est moins probable qu’elles fassent défaut. Notre attention se portera sur

celui de l’équité divisée par les actifs totaux dans le présent travail.

Compte tenu des contraintes de liquidité auxquelles font face les entreprises, nous utiliserons

également le ratio d’actifs à court terme sur la dette totale, qui tient compte de ces contraintes

et de fait, parait déterminant pour prédire le défaut de l’emprunteur.

Les ratios de rentabilité évaluent dans quelle mesure une firme est capable de générer des

bénéfices. Nous travaillerons avec deux de ces ratios : le ratio de rendement sur actif qui «

témoigne de l’efficacité de la firme à générer des revenus grâce à ces actifs», Simard (2012) et

les Fonds de roulement qui est «une mesure développée par la banque en étude afin de parer

aux manipulations comptables qui affectent le BAIIA (bénéfice avant intérêts, impôts et

amortissement)». Plus de détails sont rapportés dans Simard(2012) quant aux méthodes que la

banque utilise pour cette métrique, la logique sous adjacent à son utilisation étant donné que

c’est une fonction négative du défaut comme le BAIIA.

Le ratio d’endettement mis à contribution dans le présent travail est celui de la Dette/Équité, qui

traduit la capacité de la firme à résorber un choc. De par sa définition, il parait clair que c’est une

fonction positive de la probabilité de défaut. Par ailleurs, comme explicité dans Simard(2012), «en

lien avec le risque moral ex post, les firmes endettées et devant payer d’importantes redevances

à leur banque sont plus enclines à déclarer défaut».

Le ratio de couverture définit la capacité de la firme à dégager suffisamment de marge

d’exploitation pour supporter sa dette courante ou un refinancement de sa dette tout en

continuant son activité. Il parait alors déterminant dans la prédiction du défaut d’un emprunteur.

En effet, un ratio supérieur à 1 indique que l’entreprise est en mesure d’honorer ses obligations

alors qu’un ratio inférieur à 1 traduit un manque de fonds ne pouvant soutenir la dette. Le calcul

de cette métrique est rapporté dans Simard (2012) et sera reproduit en annexe.

La prochaine classe de variable est celle des taux de croissance de l’entreprise. Si au premier

abord, cette classe de variables semble être une fonction négative de la probabilité de défaut,

Beaulieu (2003) a établi qu’il existe une relation en U entre ces ratios et la probabilité de défaut.

En effet «dans le cas d’une croissance rapide et soutenue, il est peu probable que les bénéfices

non répartis de la firme soient suffisants pour couvrir les nouveaux besoins ainsi créés, ce qui peut

ainsi forcer cette dernière a contracter une dette supplémentaire et être exposée au risque qui y

est relié», Simard (2012). Notre attention portera particulièrement sur le ratio de croissance des

ventes dans le présent travail.

Une synthèse de la littérature traitant de ce sujet indique la nécessité de tenir compte de la taille

de la firme dans la prédiction du défaut. Bien que son effet semble inconsistant d’une étude à

une autre (Bun et Redwood (2003) trouveront que c’est une fonction négative du défaut alors que

Benito et al, 2004 arriveront à la conclusion opposée), elle demeure un facteur prépondérant dans

la prédiction du défaut. Le proxy retenu par Simard (2012) est celui des ventes.

À l’instar de McCann et McIndoe (2012), qui ont établi la nécessité de spécifier les secteurs

auxquels les emprunteurs se rapportent dans la prédiction du défaut, Simard (2012) a défini 4

catégories de secteurs compte tenu des secteurs d’activité des clients de la banque. Elle établira

que cette classe de variables est pertinente dans la prédiction du défaut et rejoint McCann et

McIndoe (2012) sur la significativité des secteurs de la construction et de la manufacture.

La dernière catégorie de variable est celle de «but du prêt». Elle englobe cinq familles : les prêts

de fonds de roulement, les prêts pour achat ou améliorations d’immobilisations, les prêts

relatifs à un changement de propriétaire et finalement les prêts de refinancement et autre.

Cette variable tient compte également des pratiques de la banque de par son caractère à traduire

le déficit de garantie par rapport au collatéral sur le prêt. Simard (2012) apporte plus de détails

quant aux proportions qui définissent les pratiques de la banque ainsi que les spécifications

propres à chaque famille.

Données

7. DONNÉES8

La base de données est celle élaborée par Simard (2012). Il s’agit d’un échantillon de prêts

octroyés par la banque durant les années 2007 et 2008. Plus précisément, les données recueillies

sont sur la période d’avril 2006 à mars 2007 et celle d’avril 2007 à mars 2008, mars étant la fin

d’année financière de la banque en étude. La majorité des emprunteurs dans cet échantillon sont

des PME et Simard (2012) le démontre dans son test de stabilité.

Les caractéristiques suivantes définissent les prêts qui sont déclarés en défaut :

1- Les prêts transférés aux comptes spéciaux suite à trois non-paiements consécutifs (ou

arrérages),

2- Les prêts pour lesquels le remboursement est improbable,

3- Les prêts inscrits en perte dans les livres de la Banque.

Le tableau 4 donne un résumé des statistiques descriptives des défauts par secteur. On peut voir

que les secteurs de « construction et agriculture» et «manufacture» enregistrent les plus grands

taux de défaut. Ce sont ces deux secteurs qui seront statistiquement significatifs dans nos

régressions pour expliquer le défaut. Il en de même pour les variables de la catégorie de but du

prêt, les prêts relatifs «au fonds de roulement» et «au changement de propriétaire», qui ont le

grand pourcentage de défaut, sont les variables qui seront retenues dans notre modèle final.

8 Simard, Adréanne 2012

Données

Tableau 4: Statistique descriptive des données de défaut

Année 2007 2008

Défauts 295 399

variables observations Défauts En pourcentage

But du prêt

Fonds de roulement

1472 293 19,90%

Immobilisation 3378 278 8,23%

Refinancement et autre

517 42 8,12%

Changement de propriétaire

728 81 11,13%

industries

Manufacture 1871 294 15, 71%

Agriculture et construction

1250 138 11,04%

Ventes en détails

1391 135 9,71%

Service 1366 112 8,20%

Autre 217 15 6,91%

Ayant fait l’hypothèse que les prêts sont contractés par des compagnies différentes sur toute la

période d’étude et ce, à la suite de son incapacité à établir le nombre de prêts octroyés à la même

entreprise sur les deux ans, Simard (2012) a traité les données en coupe transversale. Nous

traiterons les données en coupe transversale également. Notre échantillon est constitué à cet

effet, de 6095 observations, soit le nombre de prêts octroyés durant la période d’étude, dont 295

ont fait défaut en 2007 et 399 ont fait défaut en 2008.

Plusieurs ratios ont été calculés par Simard (2012) pour établir la base de données. Nous les

reproduisons en annexe ainsi que les définitions des termes.

Vous pouvez vous référer à Simard (2012) qui explique les pratiques de la banque par rapport aux

variables utilisées dans le présent travail et la méthodologie mis à contribution pour analyser les

prêts et les défauts, en l’occurrence les dates minimales supposées des défauts, d’autorisation et

Données

de vérification. Elle apporte également des précisions sur les raisons qui ont animé les hypothèses

que nous avons supposées également.

Résultats

8. RÉSULTATS :

8.1 Partie 1 : Réplication Simard (2012)

La première partie de ce travail consistera à répliquer le travail de Simard (2012) et d’en reporter

un résumé des résultats. Cet exercice nous servira de tremplin pour la suite de notre analyse et

permettra aux lecteurs de définir un fils conducteur de la suite des résultats. S’agissant d’un

résumé, il est à noter que les résultats seront commentés que brièvement, le lecteur pourra se

référer à Simard (2012) pour amples détails.

8.1.1 STATISTIQUES DESCRIPTIVES

Il apparaît comme dans Simard (2012) que les entreprises de notre échantillon sont en bon état

avec un ratio en croissance des ventes de l’ordre de 85% en moyenne et des ratios de couverture

de 1,4 en moyenne. La plupart des ratios vont dans ce sens (rendement sur actif, fonds de

roulement, etc…). Ce constat est d’autant plus marquant que la période d’étude s’étend sur deux

ans et au début d’une période de crise financière. Toutefois, il a été établi que la majorité des

crises financières sont précédées par des périodes de croissance et de bonne santé financière

(Kaminsky et Reinhard (1999)). Ainsi, bien que les entreprises de notre échantillon soient assez

endettées avec la majorité de leur dette contractée auprès d’autres institutions financières, cela

pourrait expliquer le niveau de croissance des ventes et de leurs santés financières.

8.1.2 MATRICE DE CORRÉLATION

La matrice de corrélation traduit les mêmes résultats que Simard (2012) et a été reproduite dans

l’annexe. Il apparaît ainsi que :

La variable, ratio de couverture est significativement et positivement corrélée avec

les variables Actif à court terme/Dette totale et Équité/Actifs totaux. Toutefois,

seule la variable ratio de couverture est retenue dans notre modèle final. Ces

relations n’affecteront pas alors la qualité de notre inférence finale.

Résultats

On remarque également que les variables qualitatives de la même classe sont

fortement corrélées. Ainsi, toutes les variables de la catégorie « but du prêt» sont

fortement et négativement corrélées entre elles. Il en est de même pour les

variables de la catégorie «industries», qui ont une relation linéaire négative et assez

importante. Toutefois, seules les variables «but du prêt-fonds de roulement »;

«but du prêt-changement de propriétaire» de la catégorie but du prêt et les

variables «industrie-manufacture» ; «industrie-agriculture et construction» de la

catégorie secteur d’activités seront retenues dans notre spécification finale.

D’une manière générale, les signes des coefficients de corrélation de nos variables explicatives

suivent pour la plupart les intuitions ainsi que les attentes. Nous avons porté notre attention sur

les variables qui sont corrélées avec celles de notre spécification finale, le lecteur pourra se référer

à Simard (2012) pour plus détails sur l’analyse de la matrice de corrélation.

8.1.3 RÉSULTATS DES RÉGRESSIONS

Toutes les régressions reproduites sont des régressions robustes qui corrigent pour

l’hétéroscédasticité des erreurs selon le test de White.

a. Spécification 1 : Régression probit avec les variables financières

La spécification ne prenant en compte que les variables explicatives a établi que les variables

croissance des ventes, ratios de couvertures sont significatives à un niveau de 5% et la variable

ROA l’est à 10%. Toutefois, seules les variables croissance des ventes et ratios de couvertures

seront retenues dans notre spécification finale. Il est à noter que la variable Équité/ Actifs totaux

bien que pas significative dans la présente régression ainsi que dans notre spécification finale,

sera significative dans des régressions ultérieures.

Résultats

b. Spécification 2 : Régression probit avec toutes les variables (22 variables).

Cette régression a été effectuée sur deux volets : dans un premier temps en retenant comme

proxy de la taille de firme les ventes et dans un second temps les actifs comme proxy de la taille.

Il en résulte que ni les ventes ni les actifs ne sont significatifs. Il paraît toutefois, au vu de la

littérature existante que les ventes aient une certaine prépondérance sur les actifs comme proxy

en général de la taille de la firme. Elle ne sera néanmoins pas retenue dans notre spécification

finale. En effet, l’objectif escompté étant d’avoir le modèle le plus parcimonieux avec le plus de

précision, cette variable n’étant pas significative, elle n’apporte aucun pouvoir explicatif au

modèle. Les variables «but du prêt – refinancement et autre» et «industrie-autre» sont des

variables de référence et ne seront pas incluses dans les régressions (voir Simard (2012) pour plus

de détails). Le reste de nos résultats s’alignent avec ceux de Simard (2012) et compte tenu de la

forte corrélation entre les variables qualitatives de la catégorie «but du prêt», seules les deux qui

sont significatives seront retenues pour la suite de la spécification. Pour les variables de la

catégorie «secteurs d’activités », bien que seule la variable «manufacture» est significative (voir

détail dans Simard (2012)), nous en retiendrons trois. Ce choix s’explique par le fait que les trois

variables retenues déterminent la probabilité de défaut dans les études antérieures ce qui laisse

supposer que la présence de multicolinéarité entre nos variables, biaise fortement notre

inférence. En effet, on observe des corrélations de l’ordre de 27% à 30% entre les variables de

cette catégorie. Par ailleurs, les résultats ultérieurs s’aligneront sur les études antérieures puisque

notre spécification finale prendra en compte les variables «secteur-agriculture et construction»

et «secteur-manufacture». Ainsi bien que seulement six variables se relèveront indicatives dans

notre régression globale, les 17 variables suivantes seront retenues pour la prochaine étape :

Année, taille-proxy-ventes, D/E, D Banque/Dtot, E/A tot, Fonds de roulement, A CT/ Dtot,

Croissance des ventes, ROA, Fonds disponibles, ratio de couverture, engagement total, «but du

prêt-fonds de roulement», «but du prêt-changement de propriétaire», «industrie-

manufacture», «industrie- agriculture et construction»,« industrie-vente au détail».

Résultats

c. Spécification3 : régressions probit avec 17 variables

Après avoir effectué notre régression probit avec les variables retenues à partir du modèle 2,

seules les variables Équité/Actifs totaux ; ratio de couverture sont significatives à 10% et les

variables croissance des ventes; «but du prêt-fonds de roulement» ; «but du prêt-changement

de propriétaire» ; «industrie-manufacture» ; «industrie-agriculture et construction» sont

significatives à 5%. Il est assez étonnant de constater que la variable Taille estimée par les ventes

ne soit pas significative dans le présent travail puisque Simard (2012) trouve qu’elle l’est et de

même que la plupart des études établissent l’importance de la taille d’une entreprise dans la

prédiction du défaut. Pour la prochaine étape, nous retiendrons les variables qui ont été

significatives ainsi que la proxy de la taille pour établir notre spécification finale puisque certaines

variables par construction sont fortement corrélées.

d. Spécification 4: régressions robust probit avec les variables explicatives significatives (8 variables)

Cette régression est effectuée avec les variables significatives et la proxy de la taille de la firme.

Toutes les variables retenues seront significatives et avec le signe obtenu précédemment sauf la

variable Équité/Actifs totaux et la variable les ventes comme proxy de la de taille.

Comme suggéré par Simard (2012), une régression a été effectuée en ajoutant les variables Actifs

totaux/Dette totale et ROA à la spécification de 8 variables. La variable ROA devient significative

à un niveau de 10% et la variable Actifs totaux/dette totale demeura non significative. Toutefois,

la variable ROA ne sera pas retenue dans notre modèle final, les tests de performance ayant établi

que son ajout n’apporte pas de précision supplémentaire à notre modèle.

Nous avons refait la régression en excluant les variables Équité/Actifs totaux et les ventes

comme proxy de la taille de la spécification à 8 variables. Toutes les variables explicatives

retenues alors sont restées significatives avec les mêmes signes observés qu’antérieurement.

Résultats

Ainsi notre modèle final ne prenant en compte que les variables significatives à la suite de nos

régressions antérieures, comptera deux variables financières et 4 variables qualitatives :

croissance des ventes; ratio de couverture, les variables «but du prêt-fonds de roulement »;

«but du prêt-changement de propriétaire» ; «industrie-manufacture» ; «industrie-agriculture

et construction». Ce résultant est d’autant plus frappant qu’il met en exergue la nécessité de tenir

compte des variables qualitatives dans la détermination du défaut telle qu’établit par Fidrmuc et

Hainz (2010) et McCann et McIndoe (2012). Notamment, la variable «agriculture et construction»

que les auteurs trouvent également pertinente dans l’explication du défaut (il faut souligner

toutefois que Fidrmuc et Hainz (2010) font la distinction entre les secteurs agriculture et

construction et ils trouvent que seule l’agriculture est significative dans la prédiction du défaut).

Nous avons effectué à cet effet une étude pour isoler les effets de ces variables sur le défaut d’une

entreprise et établir la pertinence de leurs utilisations dans notre modèle. Les résultats sont

reproduits dans les sections subséquentes.

e. Régressions logit

Les spécifications suivantes ont été testées pour valider notre modèle probit par rapport au logit :

Modèle 7: Logit avec les 17 variables explicatives

Modèle 8 : Logit avec les 10 variables explicatives

On trouve les mêmes résultats pour les spécifications respectives par rapport au probit (même

signe et même variables significatives). Le logit servant de benchmark dans la présente étude, il

corrobore ainsi la pertinence de la spécification choisie.

Résultats

Nous reproduisons un résumé des différentes spécifications dans ce qui va suivre qui sera plus

facile à utiliser dans la suite du travail.

Tableau 5 : Modèles correspondant aux différentes estimations

Modèles Spécification Nombres de

variables explicatives

Modèle 1 probit 9 variables

Modèle 7 logit 17 variables

Cette section qui visait à reproduire le travail de Simard(2012) se démarque toutefois des

conclusions et suggestions de son étude. En effet, contrairement à la suggestion d’une

spécification finale avec 10 variables explicatives, notre spécification finale prend en compte 6

variables explicatives. Cette différence s’explique par le fait que nous privilégions la spécification

finale la plus parcimonieuse possible ne prenant en compte que les variables explicatives

significatives. L’ajout de quatre variables supplémentaires n’apporte pas plus de précision à notre

modèle. Cette conclusion se traduira à travers nos différents tests de performance.

8.1.4 SIGNES DES COEFFICIENTS DES RÉGRESSIONS ET INTERPRÉTATION ÉCONOMIQUE DES VARIABLES EXPLICATIVES SIGNIFICATIVES

Les signes obtenus pour les variables explicatives de notre spécification finale sont ceux obtenus

par Simard(2012). Pour donner une dimension économique à nos variables explicatives, il nous

faut, dans un premier temps, les interpréter par rapport à leurs effets marginaux. Ses effets

tiennent compte de leurs vrais impacts sur la probabilité de défaut. En effet, les coefficients des

régressions probit et logit indiquent que des effets partiels de ces variables sur la probabilité de

défaut.

Résultats

Ainsi, contrairement au signe attendu, le coefficient de la variable croissance des ventes est

positif. Bien que contre-intuitif, ce résultat pourrait s’expliquer par le fait qu’une croissance non

soutenue pourrait entrainer une hausse de la probabilité de défaut. Ce constat est d’autant plus

marquant que la croissance moyenne des ventes des entreprises de notre échantillon est de 85%.

La variable ratio de couverture a le signe attendu, soit un effet négatif sur la probabilité de défaut.

En effet, ce ratio témoigne de la capacité de l’entreprise à soutenir une nouvelle dette tout en

continuant ces activités et en honorant ses engagements court terme. Ainsi, un ratio supérieur à

1 témoigne de la couverture suffisante de l’engagement. Ce signe négatif suppose alors que la

plupart des compagnies de notre échantillon sont capables de soutenir leurs dettes tout en

continuant leurs activités. Ce résultat est soutenu par l’observation du niveau moyen de ce ratio,

soit de l’ordre de 1,4, témoignant d’une couverture suffisante en moyenne pour les entreprises

de notre échantillon.

Les variables qualitatives ont toutes un effet positif sur la probabilité de défaut. Ce qui semble

indiquer que les secteurs répertoriés et les projets nécessitants les prêts octroyés seraient

quelque peu risqués. Les deux secteurs retenus dans notre spécification finale sont des secteurs

qui suivent le cycle conjoncturel. Les petites et les moyennes entreprises ont très peu de marge

de manœuvre par rapport aux grandes entreprises notamment en période de récession. Si on

ajoute à cela, la spécificité de ces secteurs à suivre le cycle économique, leurs effets positifs sur la

probabilité prennent tous leurs sens. Quant aux variables but du prêt, un changement de

propriétaire peut marquer un changement de culture de gestion qui est un facteur déterminant

dans la réussite des projets de l’entreprise. On prend la mesure de cette variable notamment dans

la politique d’étude de la banque pour l’octroi des prêts à travers la formation et le parcours

professionnel des gestionnaires de l’entreprise. Les prêts relatifs au fonds de roulement visent

généralement à injecter des liquidités à des fins de croissance et de développement de marché.

En particulier, les prêts de cette nature ont une propension à ne pas être garantis, soit générant

Résultats

un déficit en garantis de 100%9. Ainsi, le caractère fortement aléatoire de ces deux catégories

témoigne de la propension d’augmenter la probabilité de défaut des emprunteurs qui ont recours

à des prêts pour les raisons qui y sont classifiées.

8.1.5 TEST DE VALIDITÉ DU MODÈLE

Le test du ratio de vraisemblance que nous avons défini antérieurement, est mis à contribution

dans le présent travail pour valider notre spécification finale.

Comme dans Simard (2012), le premier test qui consiste à comparer le modèle 2 au modèle 3

nous confirme que le modèle 3 a une meilleure spécification. De même, le modèle 4 apparaît

comme une meilleure estimation du modèle 3. Enfin, le dernier test indique que notre

spécification finale est une meilleure estimation par rapport au modèle 5 au seuil de significativité

de 1%. Ainsi, l’ajout des variables Équité/Actifs totaux et les ventes comme proxy de la taille à

notre spécification finale n’apportent pas de précision supplémentaire au modèle.

Ces conclusions nous confortent dans le choix de notre spécification finale.

Le Tableau 6 résume les résultats sous-jacents à cette analyse où on désigne par H0 le modèle restreint

et H1 le modèle non restreint.

Tableau 6: Résultats des tests de vraisemblance respectifs 10

Modèles comparés Résultats tests

H0 = modèle 3 Versus H1 = Modèle 2 LR chi2(5) = 1.59

Prob > chi2 = 0.9028*/**/***

H0 = Modèle 4 versus H1 = Modèle 3

LR chi2(7) = 8.13 (Prob > chi2 = 0.3213*/**/***

LR chi2(2) = 5.47 Prob > chi2 = 0.0649*/**

LR chi2(1) = 4.95 Prob > chi2 = 0.0261*

9 Simard (2012)

10 * correspond à un seuil de rejet de 1%, ** correspond à un seuil de rejet de 5%, *** correspond à un seuil

de rejet de 10%.

Résultats

8.1.6 TEST DE STABILITÉ

Pour ce faire, selon la méthodologie adaptée par Simard (2012), nous avons effectué les

régressions des modèles 3 et 7 en éliminant de notre échantillon les percentiles extrêmes à 1% et

5% (voir Simard (2012) pour les détails) par rapport aux ventes. On en arrive aux mêmes

conclusions que Simard (2012), à savoir que :

- les résultats diffèrent d’un échantillon à un autre (échantillon avec 1% des percentiles

extrêmes éliminés versus échantillon avec 5% des percentiles extrêmes éliminés),

- Il n’y pas de changement significatif pour l’échantillon de premier percentile par rapport aux

résultats obtenus à partir de tout l’échantillon or mis pour la variable Fonds disponible (non

significative), qui devient négatif dans la régression du modèle3. Ceci traduit un résultat

satisfaisant d’un point de vue de stabilité du modèle.

- On note des changements notables dans la régression du modèle 3 avec le cinquième

percentile. En effet, certaines variables deviennent significatives notamment la variable

année «portant à croire que les prêts octroyés durant la deuxième année ont une plus faible

probabilité de défaut que ceux de 2007», Simard (2012).

Le lecteur peut se référer à Simard (2012) pour plus de détails par rapport aux différents

changements dans les résultats.

Résultats

8.2 Partie 2 : Régressions supplémentaires

Outre de rebondir sur le travail de Simard (2012), nous nous sommes beaucoup inspirées du

travail de McCann et McIndoe (2012), qui s’inscrit parfaitement dans ce contexte. À cet effet,

nous avons effectué diverses régressions qui suivent cette optique : une régression probit avec

toutes les variables qualitatives et des régressions probit avec chaque classe de variables

qualitatives respectivement.

8.2.1 RÉGRESSION AVEC LES VARIABLES BUT DU PRÊT

Toutes les variables explicatives de cette catégorie sont significatives à un seuil 10%

contrairement aux résultats de nos régressions antérieures. En effet, les variables «but du prêt-

immobilisation» et «but du prêt-Refinancement» n’étaient pas significatives lorsqu’on les a

mises à contribution avec les autres variables du modèle initial. Par ailleurs, il est assez intéressant

de voir que cette classe de variables à elle seule, a une mesure AUC de 0.6132. Ce résultat met

en exergue la nécessité de tenir compte des caractéristiques propres tant aux gestionnaires de

l’entreprise qu’à la gestion elle-même, puisque ces critères peuvent déterminer entre autres le

but du prêt.

8.2.2 RÉGRESSION AVEC LES VARIABLES SECTORIELLES

Les variables «industrie-service» et «industrie-vente en détail» ne sont pas significatives dans la

prédiction du défaut. La variable «construction-agriculture» que l’on trouve dans la spécification

de McCann et McIndoe (2012), expliquera quant à elle, plus précisément le défaut. Ainsi telle que

défini par ces deux auteurs, le secteur d’activité est prépondérant dans la détermination du

défaut d’une entreprise.

Résultats

8.2.3 RÉGRESSION AVEC TOUTES LES VARIABLES QUALITATIVES

Seules les variables« industrie-service» et «industries-vente en détail» ne sont pas significatives

à un seuil de 10% comme lorsqu’on a effectué la régression des variables de la catégorie-industrie.

On a une mesure AUC de l’ordre de 0.6476, assez révélateur quant à la pertinence de ces variables

dans la prédiction du défaut. En effet, d’une part, dans la régression ne prenant en compte que

les variables financières dans la prédiction du défaut, la mesure AUC est de l’ordre de 0.5579.

Cette mesure de performance qui traduit «la théorie d’un modèle dit naïf»11 (soit le modèle

aléatoire, qui n’est pas discriminant) marque une différence notable avec le modèle ne prenant

en compte que les variables qualitatives. D’autre part, la mesure AUC de la spécification finale est

de 0.6598 (probit), ce qui ne fait pas une différence notable par rapport au modèle ne prenant en

compte que les variables qualitatives. Il paraît clair que le secteur d’activité de l’emprunteur et

les raisons qui animent l’emprunt, déterminent fortement la probabilité de défaut (comme

souligné par les auteurs McCann et McIndoe(2012) et Fidrmuc et Hainz (2010)).

La section qui va suivre nous permettra de prendre la mesure de cette analyse préliminaire à

travers les différentes mesures de performance de notre modèle.

11 Dionne et al. , Estimation of Default Risk of Publicly Traded Companies : Evidence from Canada data

(2008)

Résultats

8.3 Partie 3 : validation et évaluation de la spécification finale

Cette section vise à valider notre spécification finale à travers diverses métriques et à mesurer sa

performance prédictive.

8.3.1 TEST DE SIGNIFICATIVITÉ

Le premier test de validité du modèle, soit le ratio de vraisemblance a été utilisé dans le travail de

Simard (2012). Le test de Wald vient consolider ces conclusions quant à la pertinence de notre

spécification finale.

Les résultats des différents tests individuels de Wald et du test joint sont regroupés dans le

tableau 7. Il apparait que ce test s’aligne parfaitement avec nos conclusions. En effet, les

coefficients des variables explicatives de notre spécification finale sont tous significatifs.

Notamment, le test joint rejette l’hypothèse nulle à un seuil de significativité de 1%.

Tableau 7: Résultats du test de Wald

Types de test Variables testées Statistique test et p-value

Test individuel

Croissance des ventes chi2(1) = 5.74

Prob > chi2 = 0.0166

Ratio de couverture chi2(1) = 4.47

Prob > chi2 = 0.0345

But du prêt-Fonds de roulement chi2(1) = 127.25

Prob > chi2 = 0.0000

But du prêt-Changement de propriétaire

chi2(1) = 5.76 Prob > chi2 = 0.0163

Industrie- Manufacture chi2(1) = 46.70

Prob > chi2 = 0.0000

Industrie- Agriculture et construction

chi2(1) = 6.97 Prob > chi2 = 0.0083

Test joint Toutes les variables explicatives chi2(6) = 185.28

Prob > chi2 = 0.0000

Résultats

8.3.2 LE CRITÈRE D’INFORMATION AKAIKE (AIC) ET LE CRITÈRE D’INFORMATION DE BAYES (BIC)

Les tableaux ci-dessous résument les mesures AIC et BIC obtenues pour nos différents modèles.

Tableau 8 : Mesures AIC et BIC pour les spécifications probit

Modèles- probit AIC BIC

Modèle 3 4145.031 4265.905

Modèle 4 4139.162 4213.029

Modèle 5 4140.632 4201.069

Modèle 6 4138.575 4185.582

Tableau 9 : Mesures AIC et BIC pour les spécifications logit

Modèles - Logit AIC BIC

Modèle 7 4145.281 4266.155

Modèle 8 4139.685 4213.553

Modèle 9 4141.34 4201.777

Modèle 10 4139.248 4186.255

Il paraît la mesure BIC est préférable pour analyser les résultats de la validation du modèle. En

effet, bien que cette mesure soit plus pénalisante quant à l’ajout de nouvelle variable, elle semble

plus consistante dans les résultats produits et permet une meilleure lecture de nos conclusions.

Ainsi, notre spécification finale à la plus petite mesure BIC, ce fait corrobore le choix de notre

spécification finale. La même logique apparaît avec notre modèle benchmark, le logit, où notre

spécification avec 6 variables explicatives a la plus petite mesure BIC respectivement. Ces résultats

nous permettent de conclure que l’ajout de nouvelles variables n’apporte pas plus de précision à

notre spécification finale.

Résultats

8.3.3 TEST DE PERFORMANCE: TEST D’HOSMER-LEMESHOW

Ce test qui vise à mesurer la performance prédictive de notre modèle conduit au non- rejet de

l’hypothèse nulle. Ainsi, on peut conclure que l’ajustement global du modèle aux données est

satisfaisant.

Résultat du test d’Hosmer-Lemeshow

number of observations = 6095

number of covariate patterns = 6027

Pearson chi2(6020) = 6057.53

Prob > chi2 = 0.3641

La prochaine section nous permettra de baliser cette performance à travers le pouvoir

discriminatoire du modèle.

8.3.4 ROC CURVE

Toujours en vue de mesurer la performance prédictive de notre modèle, nous avons dérivé la ROC

curve des modèles 2, 3, 4, 5, 6. On peut déjà constater que le degré de précision de nos modèles

est plus au moins acceptable et ce, malgré le fait que le test de performance et les tests de

spécification aient été concluants. En effet, la mesure AUC n’atteint les 70% dans aucun des

modèles. Ainsi, la mesure AUC du modèle 2, soit celui avec toutes les variables explicatives est de

l’ordre de 0.6639 comparativement celle du modèle 3 (prenant en compte 17 variables

explicatives) 0.6633, ce qui n’est pas une différence notable. Ce fait est autant plus marquant par

rapport au modèle 4 dont la mesure AUC est de l’ordre de 66,06%. Ainsi l’ajout de 7 variables

explicatives n’apporte pas plus de précision au modèle, ce qui nous conforte dans la comparaison

des modèles 3 et 4. Le modèle 6 a une mesure AUC de 65,98% comparativement à celle du

modèle 5 de l’ordre de 65,72%. Ainsi, comme établi dans notre test de spécification, le modèle 6

demeure une meilleure estimation que le modèle 5. L’idée étant de dériver le modèle le plus

parcimonieux possible avec le degré de précision le plus élevée et surtout compte tenu de l’écart

Résultats

très faible entre les mesures AUC, on peut déduire que notre spécification finale est alors

satisfaisante.

Tableau 10 : Mesures AUC pour les spécifications probit

Modèles probit Mesures AUC

Modèle 2 0.6639

Modèle 3 0.6633

Modèle 4 0.6606

Modèle 5 0.6572

Modèle 6 (spécification finale) 0.6598

La régression logit s’inscrit dans la même optique puisque les résultats restent cohérents avec

celui des modèles probit. Les mesures AUC respectives avec les régressions logit prenant en

compte les mêmes variables explicatives sont à peu près du même ordre que celles des

régressions probit correspondantes. Cette différence comme on l’a soulignée demeure

infinitésimale. La spécification finale demeure satisfaisante.

Tableau 11 : Mesures AUC pour les spécifications logit

Modèles logit Mesure AUC

Modèle 7 0.6632

Modèle 8 0.6604

Modèle 9 0.6568

Modèle 10 (spécification finale) 0.6599

Résultats

La figure 2 et la figure 3 correspondent aux roc-curves du modèle final avec la spécification probit

et la spécification logit respectivement.

Figure 2: Roc curve -modèle final probit)

Figure 3: Roc curve - modèle final (logit)

Résultats

8.3.5 PERFORMANCE DANS LA PRÉDICTION DU DÉFAUT: MATRICE DE CONFUSION (M-C)

Stata permet de dériver la proportion de bonnes classifications des défauts du modèle après

l’estimation d’un modèle. Elle produit une tabulation croisée des résultats observés et de ceux

prévus, où on prévoit un résultat positif si la probabilité est égale ou plus grande que 50%, soit le

seuil de conservatisme établi par défaut et, un résultat négatif sinon. On peut déduire de ces

classifications les informations requises pour la matrice de confusion. Toutefois, comme nous

l’avons souligné, le choix du seuil est établi de manière à générer la plus petite erreur de type I

possible et dégager le plus glus grand pouvoir prédictif des défauts. Aussi, notre analyse a été

faite en retenant des seuils plus conservateurs, soit un seuil de 20% et un seuil correspondant à

la fréquence des défauts dans la population, soit 11,34% (plus rigoureusement, en de ça de la

fréquence, qui est de 11,38%).

Tableau 12 : M-C avec un seuil de 20% (toute la population)

Modèle prédiction

Défauts actuels Non-défauts actuels

Défauts 475

68,44% 2560

47,40%

Non - Défauts 219

31,56% 2841

52,60%

Total 694 5401

Tableau 13: M-C avec un seuil de 11,34% (toute la population)

Modèle prédiction

Défauts 558

80.40% 3347

61,97%

Non - Défauts 136

19,60% 2054

38,03%

Total 694 5401

L’exercice qui consiste à faire varier le seuil de conservatisme pour réduire les coûts en perte

d’intérêt et de capital est des plus intéressants. En effet, il apparait comme nous l’avons souligné

Résultats

antérieurement, que plus le seuil de conservatisme est restrictif, plus la proportion d’erreurs de

type I est moindre et celle d’erreur de type II, au contraire augmente. Ainsi, le pourcentage

d’erreur de type I passe de 31,56% pour un seuil de conservatisme établi à 20%, à 19, 60% lorsque

le seuil est de l’ordre de 11,34%. Le pourcentage d’erreur de type II augmente plutôt de 47,40%

à 61,91% pour des seuils de conservatisme de 20% et 11,34% respectivement. Compte tenu de

l’importance pour les banques de réduire les coûts engendrés par des erreurs de type I, le seuil le

plus conservateur nous semble le mieux indiqué. Cette conclusion est d’autant pertinente que le

pourcentage de bonne classification en termes de sensibilité du modèle, soit les défauts classés

correctement comme des défauts, augmente lorsqu’on est plus conservateur. En effet, la

proportion de défauts correctement prédits passe de 68,44% à 80,40% pour les deux seuils de

conservatisme considérés respectivement.

Ces résultats sont assez satisfaisants et indiquent la capacité du modèle à prédire le défaut.

8.3.6 ROBUST TEST : ESTIMATION ANNÉE 2007 VERSUS ESTIMATION ANNÉE 2008

Nous utilisions dans la présente section notre spécification finale avec les sous-échantillons

résultants de la première année et de la deuxième année respectivement.

8.3.6.1 Échantillon 2007

Probit : Avec 2511 observations, notre spécification finale mise à contribution avec notre sous-

échantillon de 2007 nous indique que toutes les variables explicatives sont significatives à un seuil

de 5% et 10% sauf la variable «industrie-agriculture et construction».

Logit : En utilisant notre spécification finale dans une régression logit mettant à contribution le

sous-échantillon de la première année, il apparaît que les variables croissances des ventes, «but

du prêt- fond de roulement», «but du prêt- changement de propriétaire et industrie-

manufacture» sont significatives aux seuils de 5% et 10% respectivement, alors que la variable

ratio de couverture est significative seulement au seuil de 10%. La variable «industrie-agriculture

et construction» demeure non-significative.

Résultats

8.3.6.2 Échantillon 2008

Probit : Avec un ensemble de 3584 observations mises à contribution dans notre spécification

finale, les résultats des régressions nous indiquent que les variables ratio de couverture et «but

du prêt changement de propriétaire» ne sont pas significatives.

Logit : Lorsque le modèle final est mis à contribution avec les données de la deuxième année et

ce, en estimant un logit, les mêmes variables demeurent non significatives : le ratio de couverture

et «but du prêt changement de propriétaire».

Il apparaît ainsi à la vue de cet exercice que :

1- Toutes les variables explicatives significatives sur la période au complet ne le

demeurent pas sur les sous-échantillons formés.

2- Ce n’est pas les mêmes variables qui expliquent les défauts de la première année et

ceux de la deuxième.

Cette différence peut s’expliquer par le fait que le climat économique diffère fortement pour les

deux sous périodes en étude dans le présent travail. L’année 2008 marquant le début des défauts

durant la crise financière, a vu des secteurs tels que la construction procyclique, réagir fortement

aux effets de la crise. Ce constat est d’autant plus pertinent, que notre variable de contrôle

«agriculture et construction», qui n’explique pas le défaut en 2007, devient significative en 2008.

Résultats

8.3.7 POUVOIR PRÉDICTIF:« ESTMATION IN THE SAMPLE» - «PRÉDICTION OUT OF THE SAMPLE »

Cette section vise à déterminer le pouvoir prédictif du modèle. Pour ce faire, différentes

spécifications de sous-échantillonnage ont été utilisées avec plusieurs seuils de conservatisme. Ce

changement de seuil vise essentiellement à déterminer le seuil qui nous permettra d’avoir la

meilleure proportion de bonne classification. Le second volet de changement se caractérise par

le fait qu’il permettra de prendre la dimension de l’influence de ce seuil sur la performance

prédictive du modèle, notamment les proportions d’erreur de type I et d’erreur de type II

résultant de nos différentes classifications.

8.3.7.1 Tirage aléatoire des observations

a. Estimation In sample (35% des observations)- Prédiction out sample (65% des observations) pour tout l’échantillon

Comme nous l’avons spécifié, nous avons formé 10 sous échantillons aléatoires dont les sous-

échantillons de 35% respectifs ont été utilisés dans un premier temps pour notre estimation «in

the sample». Il apparait qu’un seul sous échantillon aléatoire est représentatif de l’échantillon

dans son ensemble. En effet, tous les estimés de l’estimation du modèle avec ce sous-échantillon

sont significatifs.

Les tableaux 14 et 15 résument les matrices de confusion pour les prédictions «out of the sample»

selon différents seuils de conservatismes : 20% et 11,34%. Il apparait une fois de plus, que la

précision prédictive du modèle est très sensible à ce seuil de conservatisme. En effet, bien que la

classification des vrais négatifs (non-défauts réalisés correspondants non-défauts prédits, soit la

mesure de spécificité du modèle) diminue avec le seuil, on observe une augmentation des vrais

positifs (défauts réalisés correspondants aux défauts prédits, soit la mesure de sensibilité du

modèle). Par ailleurs, une diminution du seuil a pour effet d’augmenter la proportion d’erreurs

de type II et de diminuer la proportion d’erreurs de type I. Ainsi, lorsque le seuil de conservatisme

est 20%, la proportion d’erreurs de type I est de 23,26% et celles de type II est de 51,93%. Lorsque

le seuil passe à 11,34%, la proportion d’erreurs de type I diminue à 15,11% et celle d’erreurs de

type II augmente à 66,02%. La mesure de sensibilité, soit le taux de bonne classification de vrais

Résultats

positifs augmentent lorsque le seuil diminue, passant de 76,74% à 89,84%. La mesure de

spécificité, quant à elle, elle diminue lorsque le seuil devient plus conservateur.

Cette analyse met en exergue le trade-off auquel on fait face quant au choix de perte de revenu

(erreur de type I) ou de manque à gagner (erreur de type II). Toutefois, les banques canadiennes

sont réputées assez conservatrices dans leur politique de gestion du risque. Aussi, bien que

l’augmentation du seuil nous assure d’avoir à peu près les mêmes fréquences de défaut dans la

population et les sous-échantillons aléatoires, nous restons sur la conclusion que le seuil le plus

conservateur demeure le mieux indiqué.

Cette conclusion vient mettre en perspective le gain d’efficacité en termes de prédiction du

défaut dépendamment du niveau de conservatisme. Ce gain se définit par rapport à la diminution

de l’erreur de type I et à l’augmentation de la mesure de sensibilité du modèle. Si parallèlement

l’erreur de type II augmente et la mesure de spécificité du modèle diminue, la minimisation des

coûts et la capacité à prédire le défaut nous semblent assez prépondérantes pour maintenir un

seuil de conservatisme restrictif. Par ailleurs, le choix d’être le plus conservateur s’aligne avec la

culture de gestion de risque des banques canadiennes, donc de celle à l’étude.

Tableau 14 : M-C avec un seuil de conservatisme de 20%( 65% population)

Modèle prédiction

Défauts 320

76,74% 1840

51,93%

Non - Défauts 97

23,26% 1783

48,07%

Total 417 3543

Tableau 15 : M-C avec un seuil de 11,34% (65% de la population)

Modèle prédiction

Défauts 354

84,89% 2339

66,02%

Non - Défauts 63

15,11% 1204

33,98%

Total 417 3543

Résultats

b. Estimation «In sample» (40% des observations)- Prédiction «out of the sample» (60% des observations)

Pour la spécification correspondant à 40% des observations utilisées en estimation «in the

sample», sur les 10 échantillons aléatoires formés, nous avons 3 qui maintiennent la significativité

de toutes les variables explicatives. Pour chacun de ces sous-échantillons, nous fournissons les

matrices de confusion associées aux prédictions «out of the sample» correspondantes et ce, pour

différents niveaux de conservatisme. On trouve les mêmes conclusions qu’avec la spécification

35% in the sample et 65% out the of the sample et ce, pour les trois sous échantillons. Ainsi, la

proportion d’erreurs de type I et la proportion de bonne classification de vrais négatifs également

diminuent lorsque le niveau du seuil de conservatisme baisse et celle d’erreurs de type II

augmente. Comme dans la section précédente, la mesure de sensibilité devient meilleure avec le

resserrement du seuil, ce qui dénote aussi la capacité du modèle a bien classer les défauts comme

étant des défauts, donc à mieux les prédire.

i. Échantillon 1

Tableau 16: M-C avec un seuil de 20% (60% de la population-échantilonn1)

Modèle prédiction

Défauts 310

71,26% 1555

48,26%

Non - Défauts 125

28,74% 1667

51,74%

Total 435 3222

Tableau 17: M-C avec un seuil de 11,34%(60% de la population-échantilonn1)

Modèle prédiction

Défauts 348

80,00% 1959

60,80%

Non - Défauts 87

20,00% 1263

39,20%

Total 435 3222

Résultats

ii. Échantillon 2

Tableau 18 : M-C avec un seuil de 20%(60% de la population-échantilonn2)

Modèle prédiction

Défauts 251

67,47% 1582

48,16%

Non - Défauts 121

32,53% 1703

52,84%

Total 372 3285

Tableau 19: M-C avec un seuil de 11,34% (60% de la population-échantilonn2)

Modèle prédiction

Défauts 301

80,91% 2031

61,83%

Non - Défauts 71

19,09% 1254

38,17%

Total 372 3285

iii. Échantillon 3 :

Tableau 20 : M-C avec un seuil de 20%(60% de la population-échantilonn3)

Modèle prédiction

Défauts 241

61,48% 1284

39,33%

Non - Défauts 151

38,52% 1981

60,67%

Total 392 3265

Résultats

Tableau 21 : M-C avec un seuil de 11,34%(60% de la population-échantilonn3)

Modèle prédiction

Défauts 285

72,70% 1727

52,89%

Non - Défauts 107

27,30% 1538

47,11%

Total 392 3265

c. Estimation «In the sample» (45% des observations)- Prédiction «out of the sample» (55% des observations) :

Comme avec la spécification 35% des observations pour l’estimation «in the sample», lorsque

l’on utilise 45% pour l’estimation «in the sample», sur les 10 échantillons aléatoires, il n’y a qu’un

seul qui permet d’avoir toutes les variables explicatives significatives. Les matrices de confusion

correspondantes aux différents seuils de conservatisme pour les prédictions «out of the sample»

traduisent les mêmes résultats établis antérieurement. Les taux respectifs d’erreur de type I sont

de 30,25% et 26,16% selon que les seuils de conservatisme soient de 20% et 11,34%

respectivement. La mesure de sensibilité est de 73,84% lorsque le seuil de conservatisme de

11,34%, soit une proportion de 73,84% de défauts correctement prédits, ce qui est assez

satisfaisant. On en déduit alors que le modèle prédit assez bien la dynamique des défauts.

Tableau 22: M-C avec un seuil de 20%(55% de la population)

Modèle prédiction

Défauts 256

69,75% 1620

54,25%

Non - Défauts 111

30,25% 1366

45,75%

Total 367 2986

Résultats

Tableau 23: M-C avec un seuil de 11,34%(55% de la population)

Modèle prédiction

Défauts 271

73,84% 1694

56,73%

Non - Défauts 96

26,16% 1292

43,27%

Total 367 2986

8.3.7.2 Three fold cross validation technique (technique de validation de trois groupes croisés)

Sur les trois spécifications résultantes de la méthode du Three fold cross validation technique, il

y en a deux qui gardent toutes les variables explicatives significatives : L’estimation «In the

sample» (échantillon1-échantillon2) - «prédiction «out of the sample» (échantillon3) et

l’estimation «In the sample» (échantillon2-échantillon3) - la prédiction «out of the sample»

(échantillon1). Nous reproduisons à cet effet, les matrices de confusions correspondantes à

différents seuils de conservatisme pour les prédictions «out of the sample» correspondantes à

ces deux spécifications. Les mêmes résultats sont établis : la précision prédictive du modèle est

très sensible au seuil de conservatisme. Ce seuil influe fortement les proportions de bonnes

classifications (sensibilité et spécificité) et les mauvaises classifications (erreur de type I et de type

II). L’erreur de type I et la spécificité du modèle (proportion de non-défauts correctement classés

comme des non défauts), diminuent lorsque le seuil devient plus conservateur au contraire de

l’erreur de type II et de la mesure sensibilité (défauts classés correctement comme défauts) du

modèle, qui augmentent

Résultats

a. Estimation In sample (échantillon1-échantillon2)- Prédiction out sample (échantillon3)

Tableau 24: M-C avec un seuil de 20%(échantillon3 de la spécification d’Hauser et Booth (2011))

Modèle prédiction

Défauts 58

25,11% 181

10,05%

Non - Défauts 173

74,89% 1620

89,95%

Total 231 1801

Tableau 25 : M-C avec un seuil de 11,34%(échantillon3 de la spécification d’Hauser et Bo oth (2011))

Modèle prédiction

Défauts 148

64,07% 812

45,09%

Non - Défauts 83

35,93% 989

54,91%

Total 231 1801

b. Estimation In sample (échantillon2-échantillon3)- Prédiction out sample (échantillon1)

Tableau 26 : M-C avec un seuil de 20%(échantillon1 de la spécification d’Hauser et Booth (2011))

Modèle prédiction

Défauts 166

71,55% 886

49,22%

Non - Défauts 66

28,45% 914

50,78%

Total 232 1800

Résultats

Tableau 27: M-C avec un seuil de 11,34%(échantillon1 de la spécification d’Hauser et Booth (2011))

Modèle prédiction

Défauts 191

82,33% 1202

66,78%

Non - Défauts 41

17,67% 598

33,22%

Total 232 1800

Ainsi il apparait à la vue de ces résultats que notre modèle final capte la dynamique des défauts.

Les résultats, allant dans le sens des études empiriques, sont assez révélateurs également quant

à l’influence du niveau de conservatisme sur la précision prédictive du modèle ainsi que sur

l’échantillon de la population considéré. Un seuil de conservatisme restrictif aura pour effet

d’augmenter l’erreur de type II, ce qui se traduira pour la banque en termes d’une augmentation

de son niveau de capital économique et une dégradation de la cote de crédit de ses clients. Un

seuil de conservatisme moins strict impliquera une augmentation d’erreur de type I ce qui se

traduira pour la banque en termes de perte de capital et d’intérêts. De même, il semble que la

mesure de sensibilité du modèle est inversement liée au seuil de conservatisme. L’objectif

escompté comme nous l’avons souligné, est d’avoir avec le plus grand pouvoir prédictif du défaut,

de fait une proportion d’erreurs de type I moindre pour minimiser les coûts en résultant. Aussi,

un seuil de conservatisme restrictif nous semble le mieux indiqué pour dégager la dynamique des

défauts et confère également au modèle un plus grand pouvoir prédictif.

Conclusion

9. CONCLUSION

Cette étude vise à valider un modèle parcimonieux avec le plus de pouvoir prédictif. Ce modèle

testera également les pratiques de la banque à l’étude par rapport à la pertinence des variables

utilisées dans sa prédiction du défaut. Il s’agit de l’estimation d’un modèle de probabilité de

défaut qui tient compte de variables financières et non financières. Les variables retenues dans le

modèle final sont celles qui expliquent le défaut et confèrent le plus grand pouvoir prédictif du

défaut.

Cette étude évalue le risque de défaut des prêts d’une banque canadienne en utilisant des

régressions non linéaires, probit et logit, et des données financières et non financières. Il apparait

que seules deux variables explicatives financières expliquent le défaut des prêts au sein de notre

échantillon : la croissance des ventes et le ratio de couverture. L’étude met en évidence

l’importance de tenir compte du secteur d’activité et des raisons qui animent la demande de prêt

dans l’explication et la prédiction du défaut. Ainsi, il apparait que les secteurs de l’agriculture, de

la construction et de la manufacture expliquent et prédisent significativement la probabilité de

défaut. Nos résultats nous indiquent que la probabilité de défaut est une fonction positive de ces

secteurs d’activités. Cela peut s’expliquer entre autres par le fait que ce sont des industries dont

les fluctuations suivent celles du cycle économique, réduisant leurs capacités de résorption des

chocs négatifs. Ce constat est d’autant plus marquant que notre échantillon est constitué que de

PME. Les mêmes constats s’appliquent aux variables qualitatives significatives « but du prêt» qui

sont également aux nombres de deux. En effet, la probabilité de défaut est une fonction positive

également des variables «but du prêt-Fond de roulement» et «but du prêt-changement de

propriétaire».

Il est assez surprenant de voir que les variables Dette/ Équité et fonds disponibles (bien que

reflété dans le ratio de couverture), une adaptation au BAIIA, ne sont à aucun moment

significatives dans nos estimations. Ces variables étant très utilisées dans la pratique, ces résultats

Conclusion

exhortent à une remise en question des ratios traditionnels utilisés dans l’explication et la

prédiction du défaut.

Nous avons utilisé différents tests et procédures pour valider et évaluer la précision de notre

spécification finale. Ces différents tests de validation nous confortent dans le choix de notre

spécification finale. Le test du ratio de vraisemblance établit que la spécification finale est la

meilleure estimation par rapport aux modèles contenant plus de variables explicatives. Le test de

Wald établit que les coefficients des variables explicatives de notre spécification finale sont tous

significatifs. La mesure BIC vient soutenir les conclusions du test du ratio de vraisemblance pour

le modèle final. Bien que la mesure AUC associée à la spécification finale n’atteigne pas 70%,

toutes les autres mesures de performance sont assez concluantes.

Les principaux apports de cette étude sont exprimés comme suit :

Elle a fourni un modèle économétrique parcimonieux avec un bon pouvoir prédictif pour

tester les pratiques de la banque à l’étude. Ce modèle est assez innovateur par rapport

aux pratiques de ladite banque.

Elle a mis en évidence l’importance des variables qualitatives dans la prédiction du défaut

pour la banque à l’étude.

Dans le processus de validation et d’évaluations de la spécification finale, elle établit

l’importance du seuil de conservatisme choisi par la banque à l’étude. Ce seuil

déterminera le niveau d’erreur de type I et d’erreur de type II acceptable pour la banque

et mettra en exergue la sensibilité du pouvoir prédictif des modèles à travers les mesures

de sensibilité et de spécificité respectivement.

Bien que notre principal objectif consiste essentiellement en la validation du modèle de

Simard(2012), notre travail se démarque toutefois du sien en raison de l’orientation que nous

avons donnée à la spécification finale. En effet, notre modèle final ne prend en compte que les

variables significatives pour expliquer le défaut contrairement à celle retenue par Simard(2012)

Conclusion

qui suggère une spécification finale avec 10 variables explicatives dont 4 sont non significatives et

ce, pour s’aligner au modèle sous-jacent à Riskcalc PlusTM de Moody12.

12 www.moodysanalytics.com

Limites et recommandations

10. LIMITES ET RECOMMANDATIONS

Comme l’a souligné Simard(2012), la période d’évaluation des prêts se fait sur une période de

crise économique. Cela a pu causer un nombre de défauts inhabituels au sein du portefeuille de

crédit de la banque. Cela est d’autant plus vrai que 51,12% des prêts ont été attribués à des

entreprises des secteurs de la construction, de l’agriculture et de la manufacture, secteurs que

nos résultats ont indiqués comme significatifs dans l’explication et la prédiction du défaut. Cette

période de crise financière pourrait fortement affecter les données utilisées dans le modèle, donc

les inférences en résultant. Ainsi, il serait porté à croire que la pertinence de nos résultats soit

réduite à cette période. Il aurait été intéressant de faire l’étude sur une période plus longue. On

aurait pu tenir compte alors de l’effet d’un changement conjoncturel, vérifier la stabilité de notre

spécification finale selon qu’elle soit évaluée sur une période de croissance ou qu’elle soit évaluée

sur une période de récession.

Notre estimation a été faite sur la base des données dont on dispose donc on peut se poser la

question de la transposition de nos résultats sur toute population (tout emprunteurs). En effet,

l’exercice de l’estimation «in the sample » et la prédiction «out of the sample» a établi la nécessité

de la représentativité d’un sous l’échantillon par rapport à notre échantillon au complet à travers

les tirages aléatoires effectués. Cette perspective peut être observée du point de vue de notre

échantillon par rapport à la population d’intérêt. Ainsi, pour que notre échantillon complet soit

représentatif de la population, il faudrait que l’on puisse inférer les caractéristiques de population

en utilisant ledit échantillon, or cette représentativité s’obtient qu’en effectuant un tirage

aléatoire comme l’a démontré l’exercice de l’estimation «in the sample» et la prédiction «out of

the sample». Étant limité par la disponibilité des données, il parait tout à fait légitime de se

demander si on obtiendra les mêmes estimations si on analyse un autre échantillon de la

population.

Par ailleurs, cette incapacité de produire un échantillon aléatoire de la population amène ce que

l’on appelle un biais sélection qui pourrait fortement affecter notre inférence. Ce biais pourrait

toutefois être corrigé en utilisant des modèles de sélections.

Nous avons pris la décision de traiter les données en coupe transversale pour une question de

simplicité du modèle. Toutefois, il aurait été intéressant de développer un modèle qui estimerait

le défaut en prenant les données en panel.

Il aurait été intéressant de faire une analyse des résidus après le test de bon ajustement du

modèle aux données. En effet, le test de Hosmer-Lemeshow étant basé sur un regroupement des

données en catégorie, certains « covariante patterns» très mal ajustés, peuvent avoir été

échappés13. Pour ce faire, on aurait pu dériver les résidus de Pearson. Des valeurs très élevées de

ces résidus nous auraient indiqué que le nombre de cas de positifs prédits est différent du nombre

réalisé et que le dominateur de l’expression de ces résidus est petit. Vous pouvez vous référer à

la littérature existante traitant de ces résidus14. Cela nous aurait permis de mieux d’entériner les

conclusions de notre test de performance

Simard(2012) a soulevé la pertinence d’un modèle qui aurait pris en compte la dimension

temporelle telle qu’utilisée par Bonfim (2009) afin de prévoir le défaut ainsi que le moment où il

survient. De même que, retenir les informations sur la marge de crédit (s’il y a) dans le modèle

des entreprises qui ont contracté un prêt, car c’est un signal de risque qui est envoyé à la banque

lorsqu’elle est utilisée à plus 50%. Elle suggère également que, puisque la variable fonds

disponibles qui est un indicateur de la capacité de paiement, n’est pas significative dans cette

étude, une proxy de cette capacité de paiement aurait pu être calculée autrement, soit ``en

déduisant les dépenses courantes mensuelles estimées d’une firme de son revenu mensuel, et

en y rajoutant les valeurs de ses actifs tangibles divisés par le terme du prêt’’.

Bibliographie

BIBLIOGRAPHIE

Altman, E.I., 1968, «Financial Ratios, Discriminant Analysis, and the Prediction of Corporate

Bankruptcy», Journal of Finance, Vol. 23, No. 4, p. 589-609.

Altman, E.I., Sabato, G., 2007, «Modelling Credit Risk for SMEs: Evidence from the US Market»,

Abacus, Vol. 43, No. 3, p. 332-357.

Bartels, J.C., 2002, «Basel II and the Survival of the SME: Are Lenders and Borrowers Ready to

Comply with Basel II ?», Business Credit,1-2.

Beaulieu, S., 2003, «Modèle d’évaluation des probabilités de défaut un an des firmes privées

canadiennes: approche probit non-structurelle», Mémoire en Sciences de la gestion, 68 p.

Beaver, W.H., 1967, «Financial Ratios as Predictors of Failure», Journal of Accounting Research,

Vol. 4, p. 71-111.

Behr, P., Gûttler, A., Plattner, D., 2004, «Credit Scoring and Relationship Lending: The Case of

German SME», JEL, Ver. 16, p. 1-31.

Benito et al., 2004, «A Synthethic Indicator of Financial Pressure for Spanish Firms», Banco de

España Working Paper,No.411.

Bonfim, D., 2009, «Credit Risk Drivers: Evaluating the Contribution of Firm Level Information and

Macroeconomic Dynamics», Journal of Banking and Finance, Vol. 33, No. 2.

Bibliographie

Bunn, P., Redwood, V., 2003, «Company Accounts Based Modelling of Business Failures and the

Implications for Financial Stability», Bank of England Working Paper, No. 210.

Carmines, E.G., Zeller, R.A., 1979, «Reliability and Validity Assessment», Sage Publications,

Californie.

Dainelli, F., Giunta, F., Cipollini, F., 2013, «Determinant of SME Credit Worthiness under Basel

Rules: the Value of Credit History Information», PSL Quarterly Review, Vol. 66, n. 264, p. 21-47.

Dionne, G., Artis, M., Guillen, M., 1996, «Count Data Models for a Credit Scoring System», Journal

of Empirical Finance, Vol. 3, p. 303-325.

Dionne, G., Laajimi, S., 2010, «On the Determinants of the Implied Default Barrier», Canada

Research Chair in Risk Management, HEC Montréal, 49 p.

Dionne, G., Laajimi, S., Mejri, S., Petrescu, M., 2008, «Estimation of the Default Risk of Publicly

Traded Companies: Evidence from Canadian Data», Canadian Journal of Administrative Sciences /

Revue Canadienne des Sciences de l’Administration, Vol. 25, No. 2, p. 134-152.

Edmister, R., 1972, «An Empirical Test of Financial Ratio Analysis for Small Business Failure

Prediction», Journal of Financial and Quantitative Analysis, Vol.7, No. 2, p.1477-1493.

Fidrmuc, J., Hainz, C., 2010, «Default Rates in the Loan Market for SMEs: Evidence from Slovakia»,

Economic Systems, Vol. 24, No. 2.

Bibliographie

Giesecke, K., Longstaff, F., Schaefer, S., Strebulaev, I., 2011, «Corporate Bond Default Risk: A 150-

Year Perspective», Journal of Financial Economics, Vol. 102, No. 2, p. 233-250.

Gunawidjaja, S., Hermanto, B., 2010, «Default Prediction Model for SME’s: Evidence from

Indonesian Market Using Financial Ratios», p. 1-20.

Hauser, R.P., Booth, D., 2011, «Predicting Bankruptcy with Robust Logistic Regression», Journal of

Data Science, vol. 9, p. 565-584.

Heckman, J.J., 1979, «Sample Selection Bias as a Specification Error», Econometrica, Vol. 47, No.

1, p. 53-161.

Kaminskiy, G.L., Reinhart, C.M., 1999, «The Twin Crises: The Causes of Banking and Balance-of-

Payments Problems», American Economic Review, Vol. 89, No. 3, p. 473-500.

Lehman, B., 2003, «Is it Worth the While? The Relevance of Qualitative Information in Credit

Rating», EFMA 2003 Helsinki Meetings, Helsinki, Finlande, p.1-25

Lopez, A.S., 2006, «Improving Access to Credit of SME’s in Puerto Rico: Exploring Variables to

Forecast Small Business Loan Events», Doctoral Program in Entrepreneurship and Small Business

Management. Autonomous University of Barcelona, Department of Business Economics.

McCann, F., McIndoe-Calder, T., 2012, «Determinant of SME Loan Default: The Importance of

Borrower-Level Heterogeneity», Research Technical paper, Central Bank of Ireland.

Merton, R., 1974, «On the pricing of corporate debt: the risk structure of interest rates», The

Journal of Finance, Vol. 29, No. 2, p. 449-470.

Bibliographie

Notes de cours de M. Georges Dionne pour le cours Gestion des risque et assurances, HEC

Montréal, hiver 2011.

Ohlson, J.S., 1980, «Financial Ratios and the Probabilistic Prediction of Bankruptcy», Journal of

Accounting Research, Vol. 18, No. 1, p. 109-131.

Parnes, D., 2012, «Approximating Default Probabilities with Soft Information», The Journal of

Credit risk, Vol. 8, n. 1, p. 3-28.

Shumway, T., 2001, «Forecasting Bankruptcy More Accurately: A Simple Hazard Model», The

Journal of Business, Vol. 74, No. 1, p. 101-124.

Simard, A., 2012, « Modèle de probabilité de défaut des prêts d’une banque canadienne», projet

supervisé, HEC Montréal.

Sirirattanaphonkun, W., Suluck, P., 2012, «Default Prediction for Small-Medium Enterprise in

Emerging Market: Evidence from Thailand», Seoul Journal of Business, Vol. 18, n. 2.

Stulz, R.M., 1996, «Rethinking Risk Management», Journal of Applied Corporate Finance, Vol. 9,

No. 3, p. 8-24.

White, H., 1982, «Maximum Likelihood Estimation of Misspecified Models», Econometrica, Vol.

50, p.1-25.

Woolridge, J.M., 2002, «Introductory Econometrics: A Modern Approach», South-Western Colelge

Pub, 2ndRevised édition.

Annexes

ANNEXES Annexe 1: Calcul des ratios

Calculs des Ratios financiers provenant de la base de données 15

1- Ratios de liquidité

Ratio de liquidité courante (ou fonds de roulement)

Actifs à court terme/ Passifs à court terme

Équité/Actifs totaux

Équités totaux/Actifs totaux

Actifs court terme/Dette totale

2- Ratios de profitabilité

Rendement sur Actif moyen (ROA)

Bénéfice net/Actifs totaux

Fonds disponibles

Bénéfice net + (amortissement+/-prêts des actionnaires + impôts reportés –

dividendes +/- fonds disponibles des cautions et compagnies garantes)

3- Ratios d’endettement

Dette/Équité

Dette totale/ Equité totale

15 Simard(2012)

Annexes

Dette de la banque / Dette totale

Dette contractée au sein de la banque en question/Dette totale

4- Ratios de couverture

Ratio de couverture

Fonds disponible / (PCDT existante + PDCT additionnelle + intérêts additionnels) au

moment de l’autorisation.

Retard (lag) ratio de couverture

Fonds disponible / (PCDT existante + PDCT additionnelle + intérêts additionnels) à

l’année précédente.

5- Ratios de croissance

Ratio de croissance des ventes

(Ventes nettes (t) - ventes nettes (t-1)) / Ventes nettes (t-1)

Ratio de croissance de la marge brute

(Marge brute (t) – Marge brute (t-1)) / Marge brute (t-1)

Ratio de croissance du bénéfice net

(Bénéfice net (t)- Bénéfice net (t-1)) / Bénéfice net (t-1)

Annexes

Annexe 2: statistiques descriptives, matrice de corrélation, test de multicolinéarité

Statistique descriptive

Variable | Obs Mean Std. Dev. Min Max

-------------+--------------------------------------------------------

Dfaut | 6095 .1138638 .3176719 0 1

Anne | 6095 .588023 .4922314 0 1

Tailleave~fs | 6095 2988825 9526862 116760 5.28e+08

DBDCDtot | 6095 .809997 .2350799 0 1

DE | 6095 1.8947 2.815961 0 150.0426

-------------+--------------------------------------------------------

EAtot | 6095 .4154528 .1599983 0 .9964

FR | 6095 2.680648 45.76916 0 3529.412

ACTDtot | 6095 1.337853 2.110748 0 43.82

CroissanceBN | 6095 3.961136 56.9475 -529.3873 3291.778

CroissanceMB | 6095 3.525136 55.11717 -404.1536 2358.448

-------------+--------------------------------------------------------

Croissance~s | 6095 .85337 39.61635 -1 3078.561

ROA | 6095 .4014182 1.349222 -6.7726 31.43

Fondsdispo~s | 6095 1344818 5666998 -1.36e+07 1.85e+08

lagratioco~e | 6095 1.100781 3.834738 -99.999 99.999

ratiocouve~e | 6095 1.456768 2.516684 -73.333 99.999

-------------+--------------------------------------------------------

Annexes

engagement~l | 6095 1144234 1371934 15000 1.00e+07

Fondderoul~t | 6095 .2415094 .4280335 0 1

Immo | 6095 .5542248 .4970918 0 1

Refinancem~e | 6095 .0848236 .2786419 0 1

changement~o | 6095 .1194422 .3243347 0 1

-------------+--------------------------------------------------------

Manufacture | 6095 .3069729 .4612759 0 1

Agricultur~n | 6095 .2050861 .4037977 0 1

Service | 6095 .2241181 .4170344 0 1

Venteaudtail | 6095 .2282199 .4197195 0 1

Autre | 6095 .035603 .1853133 0 1

-------------+--------------------------------------------------------

tailleprox~N | 6095 2965.38 1717.861 1 594

Annexes

Matrice de corrélation

| Dfaut Anne Taill~fs DE DBDCDtot EAtot FR ACTDtot Croiss~N

-------------+---------------------------------------------------------------------------------

Dfaut | 1.0000

Anne | -0.0095 1.0000

Tailleave~fs | -0.0097 0.0005 1.0000

DE | -0.0139 0.0179 -0.0180 1.0000

DBDCDtot | -0.0318 0.0255 -0.1679 -0.0293 1.0000

EAtot | 0.0075 -0.0433 0.0464 -0.4527 0.0794 1.0000

FR | -0.0067 0.0127 -0.0016 -0.0054 0.0193 0.0050 1.0000

ACTDtot | 0.0186 -0.0220 0.0094 -0.1651 0.0270 0.5150 -0.0090 1.0000

CroissanceBN | -0.0087 -0.0040 -0.0096 0.0007 0.0045 -0.0070 -0.0011 0.0018 1.0000

CroissanceMB | -0.0122 0.0013 -0.0103 -0.0039 0.0067 0.0066 0.0003 0.0009 0.8342

Croissance~s | 0.0401 0.0110 -0.0012 0.0008 -0.0101 -0.0083 -0.0007 -0.0017 0.0029

ROA | -0.0311 -0.0865 -0.0366 -0.0156 -0.0077 0.0256 -0.0016 0.0820 0.0155

Fondsdispo~s | -0.0259 -0.0543 0.2091 -0.0217 -0.1464 0.0406 -0.0032 0.0337 0.0015

lagratioco~e | -0.0092 -0.0103 0.0039 -0.0257 -0.0021 0.0832 -0.0022 0.0870 -0.0151

ratiocouve~e | -0.0304 0.0029 0.0147 -0.0713 0.0499 0.1930 -0.0053 0.1802 0.0144

engagement~l | -0.0205 0.0096 0.2936 0.0106 0.0088 -0.0874 0.0020 -0.0694 -0.0208

Fondderoul~t | 0.1513 -0.0028 -0.0216 -0.0579 -0.0718 0.1588 -0.0109 0.1753 0.0177

Immo | -0.1108 -0.0284 0.0314 0.0316 0.0443 -0.1019 -0.0119 -0.1118 -0.0092

Refinancem~e | -0.0313 0.0179 0.0200 0.0192 0.0048 -0.0057 -0.0060 -0.0284 -0.0112

changement~o | -0.0030 0.0318 -0.0368 0.0114 0.0227 -0.0485 0.0378 -0.0356 0.0003

Annexes

Manufacture | 0.0907 -0.0117 0.0616 -0.0546 -0.0609 0.0935 -0.0104 0.0377 -0.0114

Agricultur~n | -0.0055 0.0157 -0.0264 0.0330 0.0014 -0.0499 0.0195 -0.0977 0.0081

Venteaudtail | -0.0288 -0.0142 -0.0018 -0.0528 -0.0080 0.0857 -0.0057 0.1913 0.0159

Service | -0.0539 0.0078 -0.0302 0.0770 0.0595 -0.1297 -0.0015 -0.1091 -0.0091

Autre | -0.0271 0.0097 -0.0236 0.0102 0.0328 -0.0261 -0.0006 -0.0688 -0.0049

tailleprox~N | -0.0039 -0.0313 0.0142 -0.0017 -0.0247 0.0081 0.0058 0.0027 -0.0088

Annexes

| Croiss~B Croiss~s ROA Fondsd~s lagrat~e ratioc~e engage~l Fondde~t Immo

-------------+---------------------------------------------------------------------------------

CroissanceMB | 1.0000

Croissance~s | -0.0010 1.0000

ROA | 0.0135 0.0007 1.0000

Fondsdispo~s | 0.0004 -0.0014 0.2604 1.0000

lagratioco~e | -0.0133 -0.0071 0.0238 0.0244 1.0000

ratiocouve~e | 0.0140 0.0007 0.1129 0.0858 0.2340 1.0000

engagement~l | -0.0205 -0.0084 -0.0757 0.1692 0.0180 0.0003 1.0000

Fondderoul~t | 0.0212 -0.0045 -0.0077 -0.0382 0.0050 -0.0068 -0.1199 1.0000

Immo | -0.0112 0.0096 -0.0155 0.0424 -0.0070 -0.0031 0.1364 -0.6292 1.0000

Refinancem~e | -0.0114 -0.0045 -0.0245 0.0042 0.0242 0.0557 0.0210 -0.1718 -0.3395

changement~o | -0.0011 -0.0049 0.0549 -0.0182 -0.0167 -0.0341 -0.0690 -0.2078 -0.4107

Manufacture | -0.0167 -0.0100 -0.0403 0.0336 -0.0078 -0.0243 0.0948 0.0591 -0.0236

Agricultur~n | 0.0089 0.0282 -0.0051 -0.0107 0.0069 -0.0163 -0.0477 -0.0749 -0.0113

Venteaudtail | 0.0200 -0.0088 -0.0182 0.0222 0.0238 0.0205 0.0414 0.0457 -0.0125

Service | -0.0074 -0.0066 0.0725 -0.0373 0.0007 0.0174 -0.0839 -0.0165 0.0411

Autre | -0.0066 -0.0020 -0.0105 -0.0267 -0.0511 0.0104 -0.0370 -0.0505 0.0191

tailleprox~N | -0.0132 -0.0158 0.0370 0.0253 0.0081 -0.0288 0.0301 0.0002 0.0094

| Refina~e change~o Manufa~e Agricu~n Ventea~l Service Autre taille~N

-------------+------------------------------------------------------------------------

Refinancem~e | 1.0000

changement~o | -0.1121 1.0000

Annexes

Manufacture | -0.0111 -0.0323 1.0000

Agricultur~n | 0.0612 0.0635 -0.3381 1.0000

Venteaudtail | -0.0056 -0.0363 -0.3619 -0.2762 1.0000

Service | -0.0394 -0.0075 -0.3577 -0.2730 -0.2923 1.0000

Autre | -0.0045 0.0412 -0.1279 -0.0976 -0.1045 -0.1033 1.0000

tailleprox~N | 0.0125 -0.0253 -0.0002 0.0255 -0.0092 -0.0186 0.0074 1.0000

Annexes

Test de multicolinéarité

. vif, uncentered

Variable | VIF 1/VIF

-------------+----------------------

EAtot | 11.61 0.086099

DBDCDtot | 11.07 0.090324

Manufacture | 5.99 0.167001

Immo | 5.24 0.190730

Venteaudtail | 4.73 0.211234

Service | 4.54 0.220150

Agricultur~n | 4.19 0.238573

tailleprox~N | 3.82 0.262091

CroissanceBN | 3.31 0.302406

CroissanceMB | 3.31 0.302559

Fondderoul~t | 2.93 0.341508

Anne | 2.38 0.419504

ACTDtot | 2.00 0.499863

engagement~l | 1.86 0.537724

DE | 1.72 0.582989

Refinancem~e | 1.67 0.599859

ratiocouve~e | 1.51 0.662281

ROA | 1.22 0.818449

Annexes

Fondsdispo~s | 1.22 0.820193

lagratioco~e | 1.15 0.867532

FR | 1.01 0.994105

Croissance~s | 1.00 0.997948

-------------+----------------------

Mean VIF | 3.52

Annexes

Annexe 3: Résultats des régressions probit

Modèle2 : régression probit avec 22 Variables explicatives avec les ventes comme proxy de la taille

Probit regression Number of obs = 6095

Wald chi2(22) = 202.60

Prob > chi2 = 0.0000

Log pseudolikelihood = -2053.7219 Pseudo R2 = 0.0495

-------------------------------------------------------------------------------------------

| Robust

Dfaut | Coef. Std. Err. z P>|z| [95% Conf. Interval]

--------------------------+----------------------------------------------------------------

Anne | -.0511222 .0440393 -1.16 0.246 -.1374377 .0351933

tailleproxyventesN | -2.02e-06 .0000124 -0.16 0.871 -.0000264 .0000223

DE | -.0209566 .0187599 -1.12 0.264 -.0577254 .0158122

DBDCDtot | -.084193 .093791 -0.90 0.369 -.2680199 .0996338

EAtot | -.4127443.2221568 -1.86 0.063 -.8481637 .0226752

FR | -.0031039 .0062808 -0.49 0.621 -.0154141 .0092063

ACTDtot | .0081694 .0126927 0.64 0.520 -.0167079 .0330467

CroissanceBN | .0001736 .0015897 0.11 0.913 -.0029423 .0032894

CroissanceMB | -.0009026 .0014164 -0.64 0.524 -.0036786 .0018735

Croissanceventes | .0162991 .0069153 2.36 0.018 .0027455 .0298528

ROA | -.0398392 .0254539 -1.57 0.118 -.0897279 .0100496

Annexes

Fondsdisponibles | -6.47e-09 7.86e-09 -0.82 0.411 -2.19e-08 8.93e-09

lagratiocouverture | .0006549 .0070398 0.09 0.926 -.0131428 .0144527

ratiocouverture | -.0190317 .0114036 -1.67 0.095 -.0413823 .0033189

engagementtotal | -1.34e-08 1.69e-08 -0.79 0.427 -4.66e-08 1.97e-08

Fondderoulement | .3653651 .0735045 4.97 0.000 .2212989 .5094312

Immo | -.1662965 .0702419 -2.37 0.018 -.3039681 -.0286249

Refinancementetautre | -.1785828 .1027742 -1.74 0.082 -.3800164 .0228509

changementdeproprio | 0 (omitted)

Manufacture | .4063762 .1381865 2.94 0.003 .1355356 .6772169

Agricultureetconstruction | .2236505 .1414392 1.58 0.114 -.0535652 .5008662

Venteaudtail | .1060473 .1420684 0.75 0.455 -.1724017 .3844962

Service | .0348257 .1423739 0.24 0.807 -.244222 .3138733

_cons | -1.07063 .1998191 -5.36 0.000 -1.462268 -.6789914

------------------------------------------------------------------------------------------

Annexes

Modèle3 : régression probit avec 17 Variables explicatives

Wald chi2(17) = 199.25

Prob > chi2 = 0.0000

-------------------------------------------------------------------------------------------

| Robust

--------------------------+----------------------------------------------------------------

Anne | -.0512721 .044046 -1.16 0.244 -.1376007 .0350566

DE | -.0208813 .0187495 -1.11 0.265 -.0576297 .0158671

DBDCDtot | -.085576 .0940429 -0.91 0.363 -.2698967 .0987447

EAtot | -.4121841.2218057 -1.86 0.063 -.8469152 .0225471

FR | -.0031414 .0063535 -0.49 0.621 -.0155941 .0093113

ACTDtot | .0084432 .0126644 0.67 0.505 -.0163787 .033265

ROA | -.0401857 .0254392 -1.58 0.114 -.0900457 .0096744

changementdeproprio | .1671808 .0693555 2.41 0.016 .0312466 .3031151

Annexes

Manufacture | .3751263 .0599452 6.26 0.000 .2576358 .4926168

Agricultureetconstruction | .1916425 .0677807 2.83 0.005 .0587948 .3244902

Venteaudtail | .0740693 .0677691 1.09 0.274 -.0587557 .2068943

_cons | -1.208517 .1467207 -8.24 0.000 -1.496085 -.9209501

-------------------------------------------------------------------------------------------

Annexes

Effets maginaux

-------------------------------------------------------------------------------------------

| Delta-method

| dy/dx Std. Err. z P>|z| [95% Conf. Interval]

--------------------------+----------------------------------------------------------------

Anne | -.0094062 .0080815 -1.16 0.244 -.0252456 .0064333

DE | -.0038308 .0034391 -1.11 0.265 -.0105713 .0029097

DBDCDtot | -.0156994 .0172542 -0.91 0.363 -.0495171 .0181182

EAtot | -.0756177 .0406914 -1.86 0.063 -.1553714 .0041359

FR | -.0005763 .0011656 -0.49 0.621 -.0028608 .0017082

ACTDtot | .0015489 .0023233 0.67 0.505 -.0030045 .0061024

ROA | -.0073723 .0046678 -1.58 0.114 -.016521 .0017764

Manufacture | .0688192 .0109924 6.26 0.000 .0472744 .090364

Venteaudtail | .0135885 .0124323 1.09 0.274 -.0107783 .0379553

tailleproxyventesN | -3.53e-07 2.28e-06 -0.15 0.877 -4.83e-06 4.12e-06

Annexes

Wald chi2(10) = 192.49

Prob > chi2 = 0.0000

-------------------------------------------------------------------------------------------

| Robust

--------------------------+----------------------------------------------------------------

EAtot | -.2508132 .162492 -1.54 0.123 -.5692916 .0676653

Manufacture | .3360358 .0489177 6.87 0.000 .2401588 .4319128

ROA | -.0455979 .0240531 -1.90 0.058 -.0927412 .0015454

ACTDtot | .0093375 .0122356 0.76 0.445 -.0146438 .0333188

_cons | -1.404521 .0778657 -18.04 0.000 -1.557135 -1.251908

-------------------------------------------------------------------------------------------

Annexes

Wald chi2(8) = 188.85

Prob > chi2 = 0.0000

-------------------------------------------------------------------------------------------

| Robust

--------------------------+----------------------------------------------------------------

EAtot | -.1942793 .139982 -1.39 0.165 -.4686391 .0800804

ratiocouverture | -.0234493 .0117607 -1.99 0.046 -.0465 -.0003987

Manufacture | .3378377 .0488711 6.91 0.000 .2420521 .4336233

_cons | -1.425979 .0751711 -18.97 0.000 -1.573312 -1.278647

-------------------------------------------------------------------------------------------

Annexes

Modèle6 : régression probit avec 6 Variables explicatives (modèle final)

Wald chi2(6) = 185.28

Prob > chi2 = 0.0000

-------------------------------------------------------------------------------------------

| Robust

--------------------------+----------------------------------------------------------------

ratiocouverture | -.0258369 .0122214 -2.11 0.035 -.0497904 -.0018834

Manufacture | .3322322 .0486144 6.83 0.000 .2369497 .4275147

_cons | -1.506539 .0429897 -35.04 0.000 -1.590797 -1.42228

-------------------------------------------------------------------------------------------

Annexes

Annexe 4: résultats des régressions logit

Modèle7: régression logit avec 17 Variables explicatives

Logistic regression Number of obs = 6095

Wald chi2(17) = 205.03

Prob > chi2 = 0.0000

-------------------------------------------------------------------------------------------

| Robust

--------------------------+----------------------------------------------------------------

Anne | -.0970169 .0840889 -1.15 0.249 -.2618282 .0677943

DE | -.044703 .0427382 -1.05 0.296 -.1284684 .0390624

DBDCDtot | -.1543061 .1787505 -0.86 0.388 -.5046507 .1960385

EAtot | -.803408 .4539988 -1.77 0.077 -1.693229 .0864133

FR | -.0067198 .0144151 -0.47 0.641 -.0349728 .0215333

ACTDtot | .0166224 .0246605 0.67 0.500 -.0317113 .0649561

ROA | -.0756375 .0517396 -1.46 0.144 -.1770453 .0257702

Annexes

Fondderoulement | .9959942 .0910417 10.94 0.000 .8175558 1.174433

Manufacture | .715518 .1159783 6.17 0.000 .4882047 .9428312

Venteaudtail | .1516364 .1334102 1.14 0.256 -.1098427 .4131156

_cons | -2.070432 .2989746 -6.93 0.000 -2.656412 -1.484453

-------------------------------------------------------------------------------------------

Annexes

Modèle8: régression logit avec 10 Variables explicatives

Wald chi2(10) = 198.71

Prob > chi2 = 0.0000

-------------------------------------------------------------------------------------------

| Robust

--------------------------+----------------------------------------------------------------

EAtot | -.4719257 .3091091 -1.53 0.127 -1.077768 .1339171

Fondderoulement | 1.019794 .0894901 11.40 0.000 .8443965 1.195191

Manufacture | .6361571 .092572 6.87 0.000 .4547193 .8175949

ROA | -.0927367 .046086 -2.01 0.044 -.1830636 -.0024098

ACTDtot | .018131 .0235728 0.77 0.442 -.0280709 .0643329

_cons | -2.448644 .1494532 -16.38 0.000 -2.741567 -2.155721

Annexes

Modèle9 : régression logit avec 8 Variables explicatives

Wald chi2(8) = 193.93

Prob > chi2 = 0.0000

-------------------------------------------------------------------------------------------

| Robust

--------------------------+----------------------------------------------------------------

EAtot | -.3581 .2631242 -1.36 0.173 -.8738956 .1575324

Manufacture | .6410643 .0925501 6.93 0.000 .4596695 .8224591

_cons | -2.492612 .1439496 -17.32 0.000 -2.774748 -2.210475

Annexes

Modèle10 : régression logit avec 6 Variables explicatives (modèle final)

Wald chi2(6) = 189.44

Prob > chi2 = 0.0000

-------------------------------------------------------------------------------------------

| Robust

--------------------------+----------------------------------------------------------------

Manufacture | .6303478 .0920281 6.85 0.000 .4499761 .8107195

_cons | -2.648086 .0867792 -30.52 0.000 -2.81817 -2.478001

-------------------------------------------------------------------------------------------

Annexes

Annexe 5 : résultats régressions supplémentaires avec variables qualitatives

Régression probit avec les variables «industries» et «but du prêt»

Wald chi2(7) = 176.14

Prob > chi2 = 0.0000

-------------------------------------------------------------------------------------------

| Robust

--------------------------+----------------------------------------------------------------

Immo | -.1694843 .0693042 -2.45 0.014 -.305318 -.0336506

Manufacture | .3981221 .1368822 2.91 0.004 .1298378 .6664063

Venteaudtail | .098388 .1402477 0.70 0.483 -.1764924 .3732684

Service | .0335158 .1413105 0.24 0.813 -.2434477 .3104793

_cons | -1.429468 .1429 -10.00 0.000 -1.709547 -1.149389

Annexes

Régression probit avec les variables «but du prêt»

Wald chi2(3) = 133.72

Prob > chi2 = 0.0000

| Robust

---------------------+----------------------------------------------------------------

Immo | -.1699493 .0689151 -2.47 0.014 -.3050204 -.0348781

_cons | -1.219835 .0614805 -19.84 0.000 -1.340335 -1.099335

Annexes

Régression probit avec les variables «industries»

Wald chi2(4) = 55.50

Prob > chi2 = 0.0000

-------------------------------------------------------------------------------------------

| Robust

--------------------------+----------------------------------------------------------------

Manufacture | .476042 .1341548 3.55 0.000 .2131034 .7389806

Venteaudtail | .1838128 .1375149 1.34 0.181 -.0857114 .453337

Service | .0905419 .1384759 0.65 0.513 -.1808658 .3619497

_cons | -1.482344 .1295103 -11.45 0.000 -1.736179 -1.22850

Annexes

Annexe 6: résultats des estimations avec les échantillons de l'année 2007 et de l'année 2008

Régression probit Année 2007

Wald chi2(6) = 81.54

Prob > chi2 = 0.0000

--------------------------------------------------------------------------------

| Robust

---------------+----------------------------------------------------------------

Croissanceve~s | .0212771 .0093743 2.27 0.023 .0029037 .0396505

ratiocouvert~e | -.0440149 .0206064 -2.14 0.033 -.0844027 -.0036271

Fondderoulem~t | .4978242 .0746019 6.67 0.000 .3516072 .6440411

changementde~o | .4203095.1017603 4.13 0.000 .220863 .6197561

Manufacture | .363411 .0743286 4.89 0.000 .2177296 .5090925

Agriculturee~n | .080484 .0929493 0.87 0.387 -.1016932 .2626612

_cons | -1.478599 .0671151 -22.03 0.000 -1.610142 -1.347056

Annexes

Régression logit Année 2007

Wald chi2(6) = 81.03

Prob > chi2 = 0.0000

--------------------------------------------------------------------------------

| Robust

---------------+----------------------------------------------------------------

Croissanceve~s | .0333841 .0152012 2.20 0.028 .0035903 .0631778

ratiocouvert~e | -.0742305 .0401422 -1.85 0.064 -.1529077 .0044468

Fondderoulem~t | .9409203 .138763 6.78 0.000 .6689498 1.212891

changementde~o | .8092929.1871217 4.32 0.000 .442541 1.176045

Manufacture | .694696.1399076 4.97 0.000 .4204821 .9689098

Agriculturee~n | .158183.1800296 0.88 0.380 -.1946685 .5110346

_cons | -2.603449.1346183 -19.34 0.000 -2.867296 -2.339602

Annexes

Régression probit Année 2008

Wald chi2(6) = 127.30

Prob > chi2 = 0.0000

--------------------------------------------------------------------------------

| Robust

---------------+----------------------------------------------------------------

Croissanceve~s | .0107056 .0043313 2.47 0.013 .0022164 .0191949

ratiocouvert~e | -.0186824 .0123854 -1.51 0.131 -.0429573 .0055924

Fondderoulem~t | .5699816 .0622533 9.16 0.000 .4479674 .6919957

changementde~o | -.0374864 .0951086 -0.39 0.693 -.2238958 .148923

Manufacture | .3002724 .0646839 4.64 0.000 .1734944 .4270505

Agriculturee~n | .2010925 .0756779 2.66 0.008 .0527665 .3494186

_cons | -1.515926 .0544285 -27.85 0.000 -1.622604 -1.409248

Annexes

Régression logit Année 2008

Wald chi2(6) = 128.09

Prob > chi2 = 0.0000

--------------------------------------------------------------------------------

| Robust

---------------+----------------------------------------------------------------

Croissanceve~s | .0189629 .009369 2.02 0.043 .0006 .0373257

ratiocouvert~e | -.0289494 .0202598 -1.43 0.153 -.0686578 .0107591

Fondderoulem~t | 1.061413 .1152954 9.21 0.000 .8354385 1.287388

changementde~o | -.0734718 .1926506 -0.38 0.703 -.4510601 .3041166

Manufacture | .5677122 .1230811 4.61 0.000 .3264778 .8089467

Agriculturee~n | .3875481 .1462194 2.65 0.008 .1009634 .6741328

_cons | -2.663873 .1074157 -24.80 0.000 -2.874404 -2.453342

-------------------------------------------------------------------------------

Annexes

Annexe 7: résultats des estimations « in the sample»

Régression probit in the sample avec 35% des données

Wald chi2(6) = 60.02

Prob > chi2 = 0.0000

--------------------------------------------------------------------------------

| Robust

---------------+----------------------------------------------------------------

Croissanceve~s | .0259221 .0124574 2.08 0.037 .001506 .0503381

ratiocouvert~e | -.0577059 .0274289 -2.10 0.035 -.1114655 -.0039463

Fondderoulem~t | .4902576 .0891301 5.50 0.000 .3155657 .6649494

changementde~o | .256734 .0900839 2.85 0.004 .0801727 .4332952

Manufacture | .3271638 .0827492 3.95 0.000 .1649783 .4893493

Agriculturee~n | .2328331 .0881451 2.64 0.008 .0600719 .4055943

_cons | -1.351985 .0706158 -19.15 0.000 -1.49039 -1.213581

Annexes

Échantillon1

Wald chi2(6) = 61.55

Prob > chi2 = 0.0000

--------------------------------------------------------------------------------

| Robust

---------------+----------------------------------------------------------------

Croissanceve~s | .0177358 .0072464 2.45 0.014 .0035332 .0319384

ratiocouvert~e | -.0797093 .0303973 -2.62 0.009 -.1392868 -.0201318

Fondderoulem~t | .4274776 .0872467 4.90 0.000 .2564773 .598478

changementde~o | .1827348 .0894965 2.04 0.041 .0073249 .3581447

Manufacture | .3570378 .0811789 4.40 0.000 .19793 .5161456

Agriculturee~n | .2384615 .0880155 2.71 0.007 .0659543 .4109687

_cons | -1.437053 .0730431 -19.67 0.000 -1.580215 -1.293891

--------------------------------------------------------------------------------

Annexes

Échantillon2

Wald chi2(6) = 75.16

Prob > chi2 = 0.0000

--------------------------------------------------------------------------------

| Robust

---------------+----------------------------------------------------------------

Croissanceve~s | .0311844 .0159866 1.95 0.051 -.0001487 .0625175

ratiocouvert~e | -.0557348 .0251916 -2.21 0.027 -.1051094 -.0063602

Fondderoulem~t | .5223531 .0747222 6.99 0.000 .3759003 .6688059

changementde~o | .3487445 .0957614 3.64 0.000 .1610555 .5364335

Manufacture | .2897842 .0746692 3.88 0.000 .1434352 .4361331

Agriculturee~n | .1935264 .0864047 2.24 0.025 .0241763 .3628764

_cons | -1.383266 .0674458 -20.51 0.000 -1.515458 -1.251075

--------------------------------------------------------------------------------

Annexes

Échantillon3

Wald chi2(6) = 90.51

Prob > chi2 = 0.0000

--------------------------------------------------------------------------------

| Robust

---------------+----------------------------------------------------------------

Croissanceve~s | .0204089 .0083669 2.44 0.015 .0040101 .0368077

ratiocouvert~e | -.0705141 .0276223 -2.55 0.011 -.1246527 -.0163755

Fondderoulem~t | .6225733 .0762095 8.17 0.000 .4732055 .771941

changementde~o | .3165835 .0945537 3.35 0.001 .1312616 .5019054

Manufacture | .271138 .0768299 3.53 0.000 .1205542 .4217219

Agriculturee~n | .1548742 .0875233 1.77 0.077 -.0166683 .3264167

_cons | -1.415108 .0705247 -20.07 0.000 -1.553334 -1.276882

-------------------------------------------------------------------------------

Annexes

Wald chi2(6) = 108.77

Prob > chi2 = 0.0000

--------------------------------------------------------------------------------

| Robust

---------------+----------------------------------------------------------------

Croissanceve~s | .0150262 .0085902 1.75 0.080 -.0018103 .0318628

ratiocouvert~e | -.0477798 .0200407 -2.38 0.017 -.0870589 -.0085008

Fondderoulem~t | .5390185 .0703529 7.66 0.000 .4011294 .6769076

changementde~o | .3585417.1006773 3.56 0.000 .1612178 .5558656

Manufacture | .4486377 .0716081 6.27 0.000 .3082884 .588987

Agriculturee~n | .1409947 .0878556 1.60 0.109 -.0311991 .3131884

_cons | -1.513547 .0652863 -23.18 0.000 -1.641506 -1.385588

Annexes

Régression probit in the sample avec échantillon 1_échantillon2 de la spécification d’Hauser et Booth (2011)

Wald chi2(6) = 95.94

Prob > chi2 = 0.0000

--------------------------------------------------------------------------------

| Robust

---------------+----------------------------------------------------------------

Croissanceve~s | .0196655 .0117665 1.67 0.095 -.0033963 .0427273

ratiocouvert~e | -.0256042 .0145184 -1.76 0.078 -.0540597 .0028514

Fondderoulem~t | .520513 .0583349 8.92 0.000 .4061788 .6348473

changementde~o | .2012347 .0815103 2.47 0.014 .0414774 .360992

Manufacture | .1796982 .060136 2.99 0.003 .0618339 .2975626

Agriculturee~n | .142072 .0695029 2.04 0.041 .0058488 .2782952

_cons | -1.454671 .0523576 -27.78 0.000 -1.557289 -1.352052

Annexes

Régression probit in the sample avec échantillon 2_échantillon3 de la spécification d’Hauser et Booth (2011)

Wald chi2(6) = 118.55

Prob > chi2 = 0.0000

--------------------------------------------------------------------------------

| Robust

---------------+----------------------------------------------------------------

Croissanceve~s | .0219457 .0077967 2.81 0.005 .0066644 .037227

ratiocouvert~e | -.0195766 .0114826 -1.70 0.088 -.0420822 .0029289

Fondderoulem~t | .507824 .0594437 8.54 0.000 .3913164 .6243315

changementde~o | .1984155 .0794885 2.50 0.013 .0426209 .3542102

Manufacture | .3634922 .0597571 6.08 0.000 .2463705 .4806138

Agriculturee~n | .1955093 .0708531 2.76 0.006 .0566397 .3343788

_cons | -1.525159 .0510641 -29.87 0.000 -1.625243 -1.425075

modÈle de probabilitÉ de dÉfaut des...

Documents

atésie de l’œsophage (ao)...–savoi la diffée si...

pengaruh green product, green...

minsante / corruss · 2020. 6. 2. · la mobilisation...

current isue

pièce 1 du dossier papi des basses vallées angevines...

klaster - lsp pariwisata bhakti persada...presentasi...

reporter.al...ekstradimi nga shqipëria për në itali i...

vendime.al | arkiva kombëtare e vendimeve te keshillave...

dimensi pembinaan professionalisme dokter dan...

ertebat isue 666

politik jalanan & kaum muda: studi tentang...

kontabel...kontrate oeraje ne elbasan sot me date...

antibiorésistance : épidémiologie en 2017 et...

portal.kopertis3.or.idportal.kopertis3.or.id/bitstream/123456789/1600/1... ·...

cilegon · isue — isue penting pelaksanaan tugas dan...

lsue-isue profesi bimbingan dan konseling di indonesia

kastriot myftaraj, banues në qytetin e tiranës, rruga...

pusdatin.rri.co.id · web viewinteraktif dialog ekspose...

buku acara - · pdf filetertuang didalam makalah...

tenue professionnelle et equipements de protection ...les...