test von hypothesen: signifikanz des … · p es wird zwischen 2 arten von fehlern unterschieden:...
TRANSCRIPT
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 53
TestvonHypothesen:SignifikanzdesZusammenhangs(F-Test)
p DieSchätzungderRegressionsfunktionbasiertaufDateneinerStichprobe
p InwiefernkönnendieErgebnissedieserSchätzungaufdieGrundgesamtheit übertragenwerden?
p Eskönntesein,dassinderRealitätdieVeränderungderFunktionswertegarnichtaufdielineareVeränderungderunabhängigenModellvariablenzurückzuführenist.DerWertvonr2 kannsichaufgrundzufälligerEinflusseergebenhaben.
p DieFrageistnun,wiesignifikantdieAbhängigkeitdesRegressands vonRegressorenist?M.a.W.wie(un)wahrscheinlichistes,dasseskeinenZusammenhangzwischenderunabhängigenundabhängigenVariablengibt?
p DiePrüfungvonGültigkeitderRegressionsfunktionalsGanzer:F-Test
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 54
p DieEntscheidungeineHypothesezuverwerfen,kannfehlerhaftsein
p Eswirdzwischen2ArtenvonFehlernunterschieden:
p FehlerIArt(α)=Signifikanzniveau(1-α=Vertrauenswahrscheinlichkeit)- Statement:„Einflussbesteht“;inWirklichkeit: „keinEinfluss“
p FehlerIIArt(𝛽)=Teststärke- Statement:„keinEinfluss“;inWirklichkeit: „Einflussbesteht“
p SimultaneMinimierungbeiderFehlerartenistunmöglich.FalschePositivessind „wichtiger“,damehrSchaden.Daherwirdzunächstαminimiert.
H0 richtig H0 falschverwerfen Fehler I Art (α) kein Fehlerakzeptieren kein Fehler Fehler II Art
TestvonHypothesen: zweiFehlerarten
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 55
TestvonHypothesen: F-Test
p AblaufdesF-Tests:
1. Aufstellender„Nullhypothese“(H0):„Esbestehtkein ZusammenhangzwischenderabhängigenunddenunabhängigenVariablen!“– 𝛽j=0,fürj ϵ [ 0; J ]– RegressionsgleichungistunbrauchbarAlternativhypothese(H1):„DerZusammenhangbesteht!r2 istsignifikantvonnullverschieden!“
2. VerlässlichkeitdesTestergebnisses(Vertrauenswahrscheinlichkeit)wirdvorgegeben– üblicherweise0,95oder0,99– D.h.miteinerWahrscheinlichkeit von95%bzw.99%kannmansichdaraufverlassen,dassH0 nicht
zuunrechtabgelehntwird.– M.a.W.wirdH0 abgelehnt,soistmit95%- bzw.99%-igenWahrscheinlichkeitdieH1 richtig.
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 57
TestvonHypothesen: F-Test
3. BerechnungdesempirischenF-WertesaufgrundvonStichprobendatenbzw.- werte
)1(//
11
1)ˆ(
)ˆ(
2
2
2
2
−−=
−−−
=
−−
−
−
=∑
∑
JNStreuungerklärtenichtJStreuungerklärte
JNrJr
JNyy
Jyy
Femp
mit
N = Anzahl der Beobachtungswerte (Fälle)J = Anzahl von RegressorenN – J – 1 = Zahl der Freiheitsgrade der Regression
809,18)117(/)79,01(
1/79,0=
−−−=empF
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 58
TestvonHypothesen: F-Test
4. VergleichdesempirischenF-Wertes(Femp)miteinemtheoretischenF-Wert(Ftab)anhandeinerTabelle
Entscheidungskriterium:
Femp >Ftab →Ho verworfen,esgiltH1
Femp ≤ Ftab →Ho nichtverworfen
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 59
TestvonHypothesen: F-Test
F-Tabelle:95%Vertrauenswahrscheinlichkeit(Ausschnitt)
hierf1:J =ZahldererklärendenVariablenf2:N-J-1 =AnzahlFreiheitsgrade
(N =ZahlderBeobachtungswerte)
FürunserBeispiel:J =1;N =7; N-J-1 =5; Femp =18,809
18,809>6,61→Ho verworfen!
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 60
Test von Hypothesen: F-Test
F-Tabelle:99%Vertrauenswahrscheinlichkeit(Ausschnitt)
FürunserBeispiel:J =1;N =7;N-J-1 =5;Femp =18,809
18,809>16,26→Ho verworfen!
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 61
Test von Hypothesen: F-Test
F-Tabelle:99,9%Vertrauenswahrscheinlichkeit(Ausschnitt)
FürunserBeispiel:J =1;N =7;N-J-1 =5;Femp =18,809
18,809<47,04→Ho nicht verworfen!
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 62
DiegeschätzteFunktion
erklärt79%desZusammenhangsvony undxsignifikantaufdemNiveauvon0,01.
TestvonHypothesen: F-Test
Vertrauenswahrscheinlichkeit
95%(0,95)
99%(0,99)
99,9%(0,999)
H1 H1 H0
0,05 0,01 0,001
Signifikanzniveau
xy ⋅−= 057,1174,43
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 63
TestvonHypothesen:GültigkeitvonRegressionskoeffizienten fürdieGrundgesamtheit (T-Test)
p DieSchätzungderFunktionsparameterbasiertaufbekannten Daten
p Wiezuverlässigsinddiegeschätzten𝛽-WertefürPrognosen?
T-Test
p Geprüftwird,obtatsächlicherb-WertgleichNullist(Also𝛽j=0),d.h.Ho:„Faktorxj hatinderGrundgesamtheitkeinenEinflussaufy.DerermittelteWertvon𝛽jgiltnurfürdieStichprobe.“H1:„DerEinflussvomFaktorxj inderGrundgesamtheitistsignifikantgrößerNull“
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 64
TestvonHypothesen: T-Test
p ÄhnlichwiebeimF-TestwirdeinePrüfgrößeerrechnetundmitdemTabellenwertverglichen
jS
t jjemp
β
ββ −=ˆ
∑=
−⋅=
≠ N
ii xx
sSjj
1
2)(
10|β
jS
t jemp
β
β̂=getestetwird 𝛽j=0 →
=
=
=
=
jS
t
j
j
emp
β
β
β̂
Errechnetert-Wert
Regressionskoeffizientdesj-ten Regressor
WahrerRegressionskoeffizient(unbekannt)
StandardfehlerdesRegressionskoeffizientendesj-ten Regressors
∑=
−+⋅= N
ii xx
xN
sS
1
2
2
)(
10β
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 65
TestvonHypothesen: T-TestNr.i1 10 26 -8 642 16 28 -2 1003 18 19 0 14 23 24 5 365 30 15 12 96 33 6 15 1447 39 8 21 100
Summe 169 454,00Mittelwert 24,14 18,00
24,04541125,5
)(
1
1
20|
=⋅=−
⋅=
∑=
≠ N
ii xx
sSjjβ
743,445418
71125,5
)(
1 2
1
2
2
0=+⋅=
−+⋅=
∑=
N
ii xx
xN
sSβ
ixip xxi − 2)( xxi −
125,5)1(
1
2
=−−
=∑=
JN
us
N
ii
102,9743,4174,43ˆ
0
00
===β
βS
temp
404,424,0057,1ˆ
1
1
1 −=−
==β
βS
temp
xp ⋅−= 057,1174,43
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 66
TestvonHypothesen: T-Test
VergleichmitdemTabellenwert:
|temp| >ttab → Ho verworfen|temp| ≤ttab →Ho nichtverworfen
FürunserBeispiel:J =1;N =7;N-J-1 =5;temp =-4,404
α=0,95: 4,395>2,57→Ho verworfen!α=0,99: 4,395>4,03→Ho verworfen!α=0,999: 4,395<6,86→Ho nichtverworfen!
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 67
TestvonHypothesen:Konfidenzintervall desRegressionskoeffizienten
p DerEinflussvonVariablex1 kanninderGrundgesamtheitmit99%-igerWahrscheinlichkeit(=aufdemSignifikanzniveau von0,01)vermutetwerden.
p Wieweitkönnendiewahrenbj-WertevondeninderStichprobeermitteltenWertenabweichen?
ii xy ⋅+= 10ˆ ββ
VerlaufvonRegressionsgeradebeiVariationvon𝛽1VerlaufvonRegressionsgeradebeiVariationvon𝛽0und𝛽1
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 68
β̂
βαβ Stt
⋅=)(
β0
Wahrschinlichkeitsdichte
)(αβt
Ho akzeptieren(keinEinflussinderGrundgesamtheit)
Ho verwerfen(Einflussbesteht)
BeinormalverteiltenResiduensinddiegeschätzten𝛽 Koeffizientenauchnormalverteilt
)(ˆ
αββt
−
Ho akzeptieren(keinEinflussinderGrundgesamtheit)
)(ˆ
αββt
+
TestvonHypothesen: t-TestundKonfidenzintervall desRegressionskoeffizienten
Relationvomgeschätzten𝛽 zuseinemStandardfehleristkleineralskritischert-Wert
β
βS
t =
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 69
βαβ Stt
⋅=)(
β0
Wahrschinlichkeitsdichte
Ho akzeptieren(keinEinflussinderGrundgesamtheit)
Ho verwerfen(Einflussbesteht)
BeinormalverteiltenResiduensinddiegeschätzten𝛽 Koeffizientenauchnormalverteilt
Ho verwerfen(Einflussbesteht)
TestvonHypothesen: t-TestundKonfidenzintervall desRegressionskoeffizienten
KritischeRegion
β
βS
t =
𝛽=0𝛽 - tS 𝛽 + tSKritischert-Wert
KritischeRegion
Kritischert-Wert
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 70
TestvonHypothesen:Konfidenzintervall desRegressionskoeffizienten
jjStSt jjj ββ βββ ⋅+≤≤⋅− ˆˆ
p DerwahreWertdesRegressionskoeffizienten(fürdasvorgegebeneSignifikanzniveau )liegtimBereich
p DieserBereichnenntsichKonfidenzintervall vonbj
Fürα=0,01
Fürα=0,05
jStj ββ ⋅±ˆ
24,003,4057,124,003,4057,1 1 ⋅+−≤≤⋅−− β086,003,2 1 −≤≤− β
24,057,2057,124,057,2057,1 1 ⋅+−≤≤⋅−− β
44,067,1 1 −≤≤− β
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 71
TestvonHypothesen:Konfidenzintervall desRegressionskoeffizienten
086,003,2 1 −≤≤− β
xy ⋅−= 057,1174,43
xy ⋅−= 086,0174,43
xy ⋅−= 03,2174,43
236,62112,24 0 ≤≤ β
VerlaufvonRegressionsgerade beiVariationvon𝛽1
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 72
TestvonHypothesen:Konfidenzintervall desRegressionskoeffizienten
086,003,2 1 −≤≤− β
xy ⋅−= 057,1174,43
xy ⋅−= 086,0112,24
xy ⋅−= 03,2236,62
236,62112,24 0 ≤≤ β
VerlaufvonRegressionsgerade beiVariationvonb0undb1
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 73
0
5
10
15
20
25
30
35
40
45Pr
eis
(y)
Menge (x)0 5 10 15 20 25 30 35 40
TestvonHypothesen:Konfidenzintervall derRegressionsfunktion
_Y
α=0,01
α=0,05
Konfidenzintervall =RegionderAnnahmevonH1
VereinfachteAbbildung!
Konfidenzintervall gibtan,inwelchemBereichderwahreRegressionskoeffizientmiteinerbestimmtenfestgelegtenVertrauenswahrscheinlichkeitliegt
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 74
0
5
10
15
20
25
30
35
40
45Pr
eis
(y)
Menge (x)0 5 10 15 20 25 30 35 40
TestvonHypothesen:Konfidenzintervall derRegressionsfunktion
α=0,01
Jeweiterx vomMittelwert,destoungenaueristdieSchätzungvony(x)
ÜbertragenaufdieRegressionsgeradezeigtKonfidenzintervall an,inwelchemBereichdiewahrenWerteliegenkönnenbzw.wiestarksievondengeschätztenWertenabweichenkönnen(miteinerbestimmtenfestgelegtenVertrauenswahrscheinlichkeit)
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 75
Häufigkeitvony
Preis(y)
Konfidenzintervall derRegressionsfunktion
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 76
ErgebnissederRegressionsanalyse
ii xy ⋅−= 057,1174,43ˆ
Sbj = (4,743) (0,24) r2 = 0,795t = (9,102) (-4,404) df = 6a = (0,001) (0,01) F1,6 = 18,809
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 77
ErgebnissederRegressionsanalyse:SPSS
ModellQuadratsumme df
MittelderQuadrate F Signifikanz
1 Regression 507,489 1 507,489 19,316 ,007(a)Residuen 131,368 5 26,274Gesamt 638,857 6
ANOVA(b)aEinflußvariablen :(Konstante),AbsatzmengebAbhängigeVariable:Preis
Modell
NichtstandardisierteKoeffizienten
Standardisierte
Koeffizienten
T SignifikanzBStandardfehl
er Beta1 (Konstante) 43,174 4,744 9,101 ,000
Absatzmenge -1,057 ,241 -,891 -4,395 ,007
Koeffizienten(a)aAbhängigeVariable:Preis
Modell R R-QuadratKorrigiertesR-Quadrat
StandardfehlerdesSchätzers
1 ,891(a) ,794 ,753 5,12578
ModellzusammenfassungaEinflußvariablen :(Konstante),Absatzmenge
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 78
Methodologie vonÖkonometrie
1. FormulierungeinerTheorieoderHypothese2. SpezifizierungeinesmathematischenModellsderTheorie3. SpezifizierungdesstatistischenoderökonometrischenModells4. Datenerhebung5. SchätzungderParameterdesökonometrischenModells6. TestvonHypothesen
7. Prognosen/Vorhersagen8. NutzungvomModellzuKontroll- oderPolitischenZwecken
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 79
BestimmungderAbsatzmenge
füry=25 → x=17,19
xy ⋅−= 057,1174,43ˆ
0
5
10
15
20
25
30
35
40
45
Prei
s (y
)
Menge (x)0 5 10 15 20 25 30 35 40
α=0,05
x= 18,18
x= 13,6
ZurErinnerung:Konfidenzintervall gibtan,inwelchemBereichderwahreRegressionskoeffizientmiteinerbestimmtenfestgelegtenVertrauenswahrscheinlichkeitliegt
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 80
BestimmungdesPreises
fürx=25 → y=16,74
xy ⋅−= 057,1174,43ˆ
0
5
10
15
20
25
30
35
40
45
Prei
s (y
)
Menge (x)0 5 10 15 20 25 30 35 40
α=0,05
y= 19,98
y= 13,61
ZurErinnerung:Konfidenzintervall gibtan,inwelchemBereichderwahreRegressionskoeffizientmiteinerbestimmtenfestgelegtenVertrauenswahrscheinlichkeitliegt
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 81
OptimaleProduktionsmenge undPreis
Gewinnfunktionz.B.G = (y - k) xmitk = 4G = yx – 4x = (43,174 – x )x – 4x =
= 43,174 x – x2 – 4 x = 39,174 x – x2
Gmax istgegebenimPunkt,wo∂G/∂x = 0
39,174 – 2x = 0 →
xopt = 39,174 / 2 = 19,587 = 20yopt = 43,174 – 20 = 23,17
xy ⋅−= 057,1174,43ˆ
0
5
10
15
20
25
30
35
40
45
Prei
s (y
), G
ewin
n/10
Menge (x)0 5 10 15 20 25 30 35 40
G= 39,174x-x2
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 82
Methodologie vonÖkonometrie
1. FormulierungeinerTheorieoderHypothese2. SpezifizierungeinesmathematischenModellsderTheorie3. SpezifizierungdesstatistischenoderökonometrischenModells4. Datenerhebung5. SchätzungderParameterdesökonometrischenModells6. TestvonHypothesen7. Prognosen/Vorhersagen
8. NutzungvomModellzuKontroll- oderPolitischenZwecken
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 83
Preis-Absatz-Funktion imMonopol
AusunseremBeispielfolgt: RealeNachfrageistaberhöher:xopt = 20 yopt = 23,17Gopt = 383,4 G|x=24; p=19,17 = 364,08 < Gopt
DerMonopolisthatkeinenAnreiz,mehrzuproduzieren.EsentstehtDefizit.Bevölkerungistunzufrieden.
DerStaatkann/musseingreifen:*VerpflichtungzurMindestproduktion*SenkungderSteuerfürdenMonopolisten*SubventionierungvonProduzentenkomplementärerGüter*StimulierungdesWettbewerbes*…
Preis,€ Absatz,Stk.
23 24
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 84
LOGISCHERFEHLER!!!
p InderRealitäthängtderPreisnichtvonderAbsatzmengeab.VielmehrhängtderAbsatzvomPreisab.
p RegressionsanalysebestimmtlediglichdieStärkedesZusammenhangs,jedochnichtdieRichtung!
ImZweivariablen-Fallistesunproblematisch,dadieRichtungdesZusammenhangeseinfachumgekehrtwerdenkann.WennmehrVariablenregressiert wären,wäreunsereSchätzungkomplettfalschundirreführend.
p DielogischeBegründungbeimSpezifizierendesModellsistwichtigeralsKennzahlen!
p Übungsaufgabe: SpezifizierenSiedasModelrichtigundführenSieentsprechendeRegressionsanalysedurch.