matematik a - harremoes

26
Matematik A Højere handelseksamen Ny ordning Forberedelsesmateriale ny-hhx201-MAT/A-22042020 Udleveres onsdag den 22. april 2020

Upload: others

Post on 08-Jan-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Matematik A - Harremoes

Matematik AHøjere handelseksamen

Ny ordning

Forberedelsesmateriale

ny-hhx201-MAT/A-22042020

Udleveres onsdag den 22. april 2020

Page 2: Matematik A - Harremoes

Forberedelsesmateriale til hhx

Der skal afsættes 6 timer af holdets sædvanlige uddannelsestid til, at eleverne kan arbejde med

forberedelsesmaterialet forud for den skriftlige og mundtlige prøve. Oplægget indeholder teori,

eksempler og øvelser i tilknytning til et emne, der ligger umiddelbart i forlængelse af et

kernestofemne. Til dette forberedelsesmateriale hører flere datasæt. Disse er samlet i filen

forberedelsesmateriale2020

Forberedelse til den skriftlige 5-timers prøve:

Ved 5-timersprøven vil der være spørgsmål, der tager udgangspunkt i dette

forberedelsesmateriale. De øvrige spørgsmål omhandler emner fra kernestoffet.

Resultaterne af arbejdet med dette forberedelsesmateriale bør medbringes til den skriftlige prøve.

Forberedelse til den mundtlige prøve:

Emnet, behandlet i dette materiale, indgår som supplerende stof. Der vil derfor være spørgsmål

ved den mundtlige prøve i dette emne.

I forberedelsesperioden er alle hjælpemidler tilladt, og det er tilladt at modtage vejledning.

Indholdsfortegnelse Indledning 1

En observationsrække 2

Hypotesetest for middelværdien i én normalfordeling 2

To observationsrækker 4

Hypotesetest for ens varianser 4

Hypotesetest for to middelværdier i to uafhængige stikprøver – ens varians 6

Hypotesetest for to middelværdier i to uafhængige stikprøver – forskellig varians 8

Opgaver 10

Eksempler gennemregnet i Maple 13

Eksempler gennemregnet i NSpire 14

Eksempler gennemregnet i Geogebra 16

Eksempler gennemregnet i Excel 18

Page 3: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 1 af 24

Hypotesetest

Indledning

I undervisningen har I mødt hypotesetest for en andel i binomialfordelingen samt test for uafhængighed (chi-i-

anden-test), så derfor vil mange af disse begreber være velkendte. I dette materiale vil I møde andre hypotesetest.

Ved afgørelse af, om en hypotese skal forkastes eller ikke forkastes, er der 4 mulige beslutninger. Dette fremgår

af følgende beslutningsmatrix:

Beslutning

H0 forkastes H0 forkastes ikke

H0 er sand Type I-fejl Korrekt beslutning

H0 er falsk Korrekt beslutning Type II-fejl

Centrale begreber i hypotesetest er signifikansniveauet , som er defineret ved:

forkaste er sand (Type I-fejl)P

samt signifikanssandsynligheden p også bare kaldet

p-værdien

Signifikansniveauet sættes til et lavt niveau - normalt 5% - for at beskytte sig mod Type I-fejl.

Til at afgøre hypotesen/testresultatet anvendes en såkaldt testvariabel, som er en stokastisk variabel. I denne

variabel indgår parameteren, som testes, og en estimator for denne parameter.

p-værdien er sandsynligheden for at få noget, der er mere ekstremt end det, vi har observeret (givet er sand),

og beregnes som sandsynligheden for at få en ekstrem værdi af ovennævnte testvariabel.

For at afgøre om en hypotese skal forkastes eller ej, sammenlignes signifikanssandsynligheden p med

signifikansniveauet .

Reglen er

H0 forkastes, når p-værdien er mindre end

I dette materiale betragtes kun test, hvor det gælder, at konfidensintervaller kan anvendes til afgørelse af, om en

hypotese forkastes eller ej:

Ved test accepteres 0H , hvis parameteren er indeholdt i konfidensintervallet

Page 4: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 2 af 24

En observationsrække

Én observationsrække er det simpleste eksempel på en statistisk model. Med én observationsrække på n

observationer forstås n uafhængige observationer fra samme fordeling. Denne observationsrække kaldes

stikprøven, og n er stikprøvens størrelse.

Vi har altså følgende model:

Model: Observationerne er realisationer af de uafhængige og identisk fordelte stokastiske variable

Inden der opstilles hypoteser, bør der laves en modelkontrol. Modelkontrollen går ud på at kontrollere, om data

kan antages at følge en normalfordeling. Dette gøres ofte med fraktildiagrammer eller de såkaldte QQ-plot. I

dette materiale vil vi ikke bruge tid på at lave modelkontrol, men blot antage, at data er normalfordelte.

Konfidensintervaller for middelværdi foretaget i en stikprøve er kernestof på Matematik niveau A på HHX.

Næste afsnit handler om, hvorledes p-værdien anvendes til at teste en hypotese.

Hypotesetest for middelværdien i én normalfordeling

Fremgangsmåden ved et hypotesetest vil blive gennemgået for middelværdien i normalfordelingen ved hjælp

af en 5-trins algoritme. Eksempel 1 viser dette.

Eksempel 1

En bank har lavet en undersøgelse af det månedlige rådighedsbeløb blandt studerende i Aarhus. Banken har

kigget på indkomst som SU, studiejob og studielån. Desuden har banken kigget på faste udgifter samt udgifter til

husholdning. Rådighedsbeløbet er altså det, der er tilovers til uforudsete udgifter, gaver, rejser mm.

Stikprøven er på studerende, og gennemsnit og standardafvigelse er estimeret til:

Banken vil undersøge, om rådighedsbeløbet kan antages

at være 1600 kr.

5-trins algoritmen:

1. Opstilling af hypoteser

(middelværdien er lig med 1600)

(middelværdien er forskellig fra 1600)

2. Valg af signifikansniveau

Signifikansniveauet vælges til

3. Valg af teststørrelse

Teststørrelsen kaldes en T-variabel, da den er t-fordelt:

Page 5: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 3 af 24

hvor er antallet af frihedsgrader i t-fordelingen.

4. Beregning t-værdi og p-værdi

Ved indsættelse af værdierne (regn efter!) fås:

p-værdien kan beregnes som

5. Konklusion

Da p-værdien er større end , er der ingen grund til at forkaste . De studerende kan altså godt

antages at have et rådighedsbeløb på 1600 kr.

I trin 4 om beregning af t-værdi og p-værdi er det sådan, at de værdier af t, der vil være mere kritiske end den

observerede på -0,877, er værdier mindre end -0,877 og værdier større end 0,877. De to skraverede områder i

figuren nedenfor svarer til 0,3833.

-0,877 0,877

Heraf ses også grunden til, at der i beregningen af p-værdien skal ganges med 2, da både store og små værdier er

kritiske.

Konklusionen kunne også opnås ved hjælp af et konfidensinterval for , som er givet ved formlen

I dette tilfælde bliver intervallet (tjek selv efter):

Da 1600 er indeholdt i konfidensintervallet, accepteres .

De fleste IT -programmer som Maple, Nspire, Geogebra og Excel giver disse værdier automatisk.

Øvelse 1

Forklar, hvorfor p-værdien fra eksempel 1 også kan beregnes således

Page 6: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 4 af 24

To observationsrækker

I dette afsnit beskrives test i to stikprøver, hvor man sammenligner to populationer ved at tage en stikprøve i hver

sin population.

Eksempler på dette kunne være:

- Sammenligning af kundetilfredsheden for en bank opdelt mellem unge og ældre kunder.

- Sammenligning af andele for indførelse af cannabis opdelt i kategorierne unge og ældre personer.

- Sammenligning af salget i udvalgte butikker af et givet produkt før og efter en reklamekampagne.

Der ses på to normalfordelte observationsrækker, hvor modellen kan opskrives således:

Model:

I følgende tabel vises parametre og estimatorer i modellen for sammenligning af to uafhængige populationer:

Population 1:

Parameter Estimator Stikprøvestørrelse

Population 2:

Parameter Estimator Stikprøvestørrelse

Hypotesetest for ens varianser

Behandlingen af to observationsrækker består i først at undersøge, om varianserne kan antages at være ens. Det

vil sige teste hypotesen

Hypotesen om, at varianserne kan antages at være ens, afgøres ved et F-test.

Testvariablen er

dvs. en F-fordeling med et talpar af frihedsgrader .

Det ses, at testet afgøres af forholdet mellem de to varianser. Første del af frihedsgrader følger antallet af

frihedsgrader i tæller. Anden del følger antallet af frihedsgrader i nævner.

Page 7: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 5 af 24

Eksempel 2

Samme bank som i eksempel 1 har også undersøgt rådighedsbeløbet blandt studerende i Odense.

Her var stikprøvestørrelsen på 69 studerende.

Resultaterne blev:

Tabel 1 Beløb Aarhus Beløb Odense

Gennemsnit

Standardafvigelse

Stikprøvestørrelse

Parametrene er ukendte, men estimeres med estimatorerne i tabellen ovenover.

Igen følges en 5-trins algoritme:

F-test for om varianserne kan antages ens

1. Opstilling af hypoteser

2. Valg af signifikansniveau

3. Valg af teststørrelse

Stikprøven med størst varians sættes altså i tæller, og stikprøven med mindst varians sættes i nævner.

4. Beregning af teststørrelse og p–værdi

Ved indsættelse af og fra tabel 1 fås

Som før gælder det, at både store og små værdier er kritiske så, derfor bliver p-værdien

5. Konklusion

p-værdien er større end signifikansniveauet på .

Dermed accepteres .

Page 8: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 6 af 24

Afhængigt af om forkastes eller ikke forkastes, er der to forskellige muligheder for at lave hypotesetest for

middelværdien. Begge test er t-test, men antallet af frihedsgrader er forskellige, og det samme er estimatorerne

for varianserne

accepteres forkastes

Varianserne antages ens.

Hypotese om ens middelværdier

Der anvendes et fælles

variansestimat .

Frihedsgraderne

Varianserne antages ikke ens.

Hypotese om ens middelværdier

Der anvendes de enkelte

variansestimater og

Frihedsgraderne beregnes ud fra

en formel der indeholder

variansestimaterne

Hypotesetest for to middelværdier i to uafhængige stikprøver – ens varians

Forudsætningerne for testet er:

1. De to stikprøver er tilfældigt udvalgt og uafhængige af hinanden

2. De to varianser/standardafvigelser kan antages ens:

3. De to populationer er normalfordelte

Formlen for det fælles (pooled) variansestimat er

Det ses, at det er et vægtet gennemsnit af de to varianser og , hvor vægtene er antallet af

frihedsgrader i de to stikprøver.

Eksempel 2 fortsat

Ud fra stikprøverne ser det ud til, at rådighedsbeløbet er større i Odense end i Aarhus.

Men spørgsmålet er, om forskellen er signifikant, eller det bare er en tilfældighed.

Ved indsættelse af tallene fra tabel 1 fås

og dermed

Page 9: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 7 af 24

Estimatorerne er nu:

Tabel 2 Beløb Aarhus Beløb Odense

Gennemsnit

Standardafvigelse

Stikprøvestørrelse

Hvis der skal være signifikant forskel på rådighedsbeløbet for

studerende i Aarhus og studerende i Odense, skal middelværdien

for studerende fra Aarhus og middelværdien for studerende

fra Odense være forskellige, dvs. skal være signifikant

forskellig fra 0, hvilket afgøres ud fra p-værdien.

5-trins - algoritme til hypotesetestet anvendes:

1. Opstilling af hypoteser

(rådighedsbeløbet er ens i de to byer)

(rådighedsbeløbet er ikke ens i de to byer)

2. Valg af signifikansniveau

Til at teste nulhypotesen anvendes følgende testvariabel:

3. Valg af teststørrelse

t er netop t-fordelt med antallet af frihedsgrader på , da der er i

stikprøve 1 og i stikprøve 2. Det samlede antal af frihedsgrader fås ved at addere disse.

4. Beregning af teststørrelse og p-værdi

p-værdien beregnes som

5. Konklusion

Da p-værdien er 0,149 og dermed større end accepteres , dvs. rådighedsbeløbene for

studerende i Aarhus og Odense er ikke signifikant forskellige.

Øvelse 2

Gennemregn testet i eksempel 2, hvis stikprøvestørrelsen for studerende i Aarhus er 100 og for studerende i

Odense 50. Gennemsnittene og standardafvigelserne er de samme som i Tabel 2.

Page 10: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 8 af 24

Hypotesetest for to middelværdier i to uafhængige stikprøver – forskellig varians

Hvis varianserne ikke er ens, kan man anvende et tilnærmet t-test, hvor teststørrelsen er:

som er tilnærmelsesvis t-fordelt med et antal frihedsgrader, der bestemmes ud fra formlen

Det sidste test vil blive gennemgået i eksempel 3.

Eksempel 3

Et firma i USA har målt effektiviteten af to metoder A og B til træning af nye salgsmedarbejdere. De har udvalgt

40 medarbejdere til hver metode.

De målte det ugentlige salg gennem et helt år for hver metode. Resultatet blev:

Metode A Metode B

Gennemsnitligt salg pr. uge i USD

Standardafvigelse i USD

Stikprøvestørrelse

Lad være middelværdien for metode A og være middelværdien for metode B med tilhørende

standardafvigelser. Det kan vises med et F-test, at varianserne er forskellige. Se Øvelse 4.

Der testes, om de to metoder er lige effektive:

1. Opstilling af hypoteser

(de to metoder er lige effektive)

(de to metoder er ikke lige effektive)

2. Valg af signifikansniveau

Til at teste nulhypotesen anvendes følgende testvariabel

3. Valg af teststørrelse

T er altså tilnærmelsesvist t-fordelt med f frihedsgrader.

Page 11: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 9 af 24

4. Beregning af teststørrelse og p-værdi

Ved indsættelse af tallene fra tabellen fås

Her skal også frihedsgraderne beregnes og ved indsættelse i formlen fås hvilket afrundes til

(tjek selv efter)

Så fås p-værdien til

(Tjek efter i et IT -program)

forkastes for både små og store værdier af t.

5. Konklusion

Da p-værdien på 0,00032 er mindre end 0,05 , forkastes . Det er en stærk konklusion, da

p-værdien er meget lav. Der er altså forskel på metode A og metode B.

Øvelse 3

Gennemfør testet i eksempel 3, hvis begge stikprøver er på 100.

Øvelse 4

Opstil hypotesen om, at varianserne kan antages ens ,og gennemfør testet for ens varianser med tallene fra

eksempel 3. Passer konklusionen med, at varianserne er forskellige?

I næste afsnit vises, hvordan test beregnes ved hjælp af følgende 4 IT-programmer: Excel, Geogebra, Maple og

NSpire.

Page 12: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 10 af 24

Opgaver

Data til opgaverne findes i filen forberedelsesmateriale2020.

Opgave 1

En virksomhed producerer slik som sælges i

poser á 100 g.

Der foretages en stikprøve, hvor 36 poser

udvælges tilfældigt og vejes.

a) Tegn et diagram, der beskriver

fordelingen af vægten af slikposerne.

b) Bestem gennemsnittet og spredningen

for vægten af slikposerne i stikprøven.

c) Opstil nulhypotesen, som kan bruges til at teste om vægten af slikposerne i gennemsnit er 100 g.

Angiv også den alternative hypotese.

d) Test hypotesen på 5% signifikansniveau vha. et t-test. Hvad bliver konklusionen i stedet på 1%

signifikansniveau?

e) Angiv et 95% konfidensinterval for den gennemsnitlige vægt af slikposerne.

Opgave 2

En producent af tøj til spædbørn ønsker at undersøge fødselsvægten for nyfødte og at se på, om der er forskel på

drenge og piger.

Der er indhentet data for fødselsvægten hos drenge og piger.

a) Bestem gennemsnittet og variansen i begge stikprøver.

b) Opstil et test for, om varianserne kan antages at være ens, og udfør testet med et signifikansniveau på 5%.

Producenten vil undersøge, om der er signifikant forskel på drenge og pigers fødselsvægt.

c) Vurdér med et relevant test, om det kan antages, at drenge og pigers fødselsvægt er ens.

Page 13: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 11 af 24

Opgave 3

To større virksomheder er fusioneret, og der er fra ledelsens side blevet udarbejdet et fælles værdisæt. Ledelsen

ønsker efter en periode at vurdere, om tilegnelsen af de fælles værdier er sket i samme tempo.

Derfor har en række repræsentativt udvalgte medarbejdere fra hver af de to oprindelige virksomheder deltaget i

en undersøgelse. I virksomhed 1 er der udvalgt 37 medarbejdere, og i virksomhed 2 er der udvalgt 43

medarbejdere. I undersøgelsen kunne der opnås et pointtal mellem 0 og 200.

a) Bestem gennemsnittet og variansen i begge stikprøver.

b) Opstil en hypotese for, om varianserne kan antages at være ens, og test denne med et signifikansniveau

på 5%.

c) Vurder, ved et relevant test, om det kan antages, at medarbejderne fra de to virksomheder har opnået de

samme pointtal i undersøgelsen.

Opgave 4 - på baggrund af tidligere eksamensopgave til statistik på AU

Mange cykelhjelme lever ikke op til de sikkerhedsegenskaber som Cykelunionen opstiller.

Kombinationen af dårlig kvalitet og falsk tryghedsfornemmelse hos forbrugeren gør,

at hjelmene er direkte farlige.

Et institut har undersøgt, hvor mange timer 2 forskellige fabrikater A og B af cykelhjelme, kan holde til et tryk på

1 ton.

Instituttet anvender et signifikansniveau på 1%.

a) Opstil et test for, om varianserne er ens, og udfør testet.

Instituttet vil undersøge om, der er signifikant forskel på mærke A og mærke B.

b) Opstil hypotesen til denne undersøgelse.

c) Udfør testet i spørgsmål b). Hvad kan du konkludere?

Page 14: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 12 af 24

Opgave 5

Instituttet i opgave 4 vil være mere sikre i deres konklusion og har derfor foretaget flere forsøg.

Resultatet af dette ses i nedenstående skema. Trykket blev igen målt i antal timer.

Mærke A Mærke B

Gennemsnit 10,1 11,4

Varians 2,9 3,0

Stikprøve 40 40

a) Hvad er din anbefaling nu (hvis du anvender et signifikansniveau på 1%)?

b) Hvis instituttet anvender en , hvad er da din konklusion?

Opgave 6

I forbindelse med en oplysningskampagne overfor de unge vedrørende deres alkoholforbrug har

Sundhedsstyrelsen undersøgt, hvor mange genstande unge mennesker drikker pr. uge.

Tallene i filen viser to stikprøver. Én for de 15-19 årige og én for de 20-24 årige.

er signifikansniveauet.

a) Afgør, om varianserne er ens.

b) Afgør, om der er signifikant forskel på, hvor meget 20-24 årige og 15-19 årige drikker?

c) Hvad er din konklusion efter resultaterne i spørgsmålene a) og b)?

Page 15: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 13 af 24

Eksempler gennemregnet i Maple

Page 16: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 14 af 24

Eksempler gennemregnet i NSpire

Eksempel 1 Datasættet indlæses i et regneark

Gennemsnit og standardafvigelse beregnes vha. statistiske beregninger og statistik med én variabel:

Det ses, at gennemsnittet er 1540 og standardafvigelsen er 592,46.

Konfidensintervallet bestemmes som et t-interval for én middelværdi:

Konfidensintervallet er da [1403,69;1676,31]

T-teststørrelsen beregnes:

p-værdien i T-testet bestemmes med kommandoen tTest

Eller ud fra data:

P-værdien kan også beregnes ud fra kommandoen tcdf:

Begge metoder giver samme resultat nemlig en p-værdi på 38,33% og en accept af .

Page 17: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 15 af 24

Eksempel 2 Gennemsnit og varianser som eksempel 1

F-testet for ens varianser beregnes vha. kommandoen FTest_2Samp:

Dette kan også udregnes vha. af FCdf kommandoen ved først at udregnes f-teststørrelsen:

Uoverensstemmelse på 5’te decimal skyldes afrundinger.

Da p-værdien er større end 5%, accepteres om ens varianser.

T-testet for ens middelværdi bestemmes ud fra kommandoen tTest_2Samp:

Dette kan også bestemmes ved at udregne det samlede variansestimat og t-teststørrelsen:

t-værdien bliver da:

Og P-værdien bliver da:

Decimaluoverensstemmelse skyldes afrundinger.

Men da p-værdien er større end 5 %, accepteres hypotesen om ens middelværdier.

Eksempel 3 Gennemsnittene og varianserne:

T-testet for ens middelværdier bliver da:

Da p-værdien er mindre end 5%, bliver forkastet.

Page 18: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 16 af 24

Eksempler gennemregnet i Geogebra

Eksempel 1

Eksempel 2

Page 19: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 17 af 24

Eksempel 3

Page 20: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 18 af 24

Eksempler gennemregnet i Excel

Eksempel 1 Sørg for, at tilføjelsesprogrammet ”Dataanalyse” er aktiveret i Excel: Klik på ”Filer” -> ”Indstillinger” ->

”Tilføjelsesprogrammer” og vælg ”Analysis Toolpack” og klik på ”Udfør”.

Konfidensinterval for middelværdi

Man åbner Excel-filen og finder ”Dataanalyse” og vælger ”Beskrivende statistik”:

I ”Inputområde” markerer man cellerne med data fra stikprøven. Titlen kan tages med, hvis man sætter flueben

ud for ”Etiketter i første række”. Man skal desuden sørge for, at der er flueben i ”Resumestatistik” og

”Konfidensniveau for middelværdien” (som udgangspunkt bruges 95% konfidensniveau, men det kan ændres

efter behov). Under ”Outputindstillinger” kan man enten markere et outputområde i det aktive regneark eller

beholde ”Ny regnearksfane”, hvor resultaterne kommer til at stå.

Man klikker ”Ok” og får:

Page 21: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 19 af 24

Gennemsnittet i stikprøven og stikprøvespredningen aflæses under hhv. ”Middelværdi” og ”Standardafvigelse”

(markeret med rød).

For at bestemme grænserne i 95% konfidensintervallet, skal man addere/subtrahere tallet ud for

”Konfidensniveau” til tallet ud for ”Middelværdi”:

95%-konfidensintervallet for middelværdien bliver altså [1403,69; 1676,31]. Det ses, at 1600 ligger indenfor

konfidensintervallet, så vi kan altså ikke afvise hypotesen om, at middelværdien er 1600.

t-test for middelværdi

For at teste om middelværdien kan antages at være 1600, beregnes først t-værdien ved at trække 1600 fra

gennemsnittet i stikprøven og dividere med standardfejlen:

Page 22: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 20 af 24

Derefter kan p-værdien bestemmes ved at bruge kommandoen T.FORDELING.2T. Argumenterne er den

numeriske værdi af t-værdien og antallet af frihedsgrader. Dvs. vi her skal skrive:

=T.FORDELING.2T(ABS(B21);B15-1) som giver ca. 0,38, langt over 0,05:

Page 23: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 21 af 24

Eksempel 2 F-test

Efter at have åbnet Excel-filen, klikker man på ”Dataanalyse” og vælger ”F-test: Dobbelt stikprøve for varians”

I input-feltet ”Område for variabel 1” markerer man de celler, hvor man har observationer for den første variabel

”Beløb i kr. Aarhus”. På samme måde markerer man cellerne for ”Område for variabel 2” ved at markere cellerne

for ”Beløb i kr. Odense”. Man kan tage overskrifterne med, blot man husker at sætte flueben ud for ”Etiketter”.

Signifikansniveauet ”Alpha” er som udgangspunkt 0,05, men kan justeres efter behov.

Resultatet bliver:

Page 24: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 22 af 24

I tabellen ses gennemsnittet og variansen for de to stikprøver under hhv. ”Middelværdi” og ”Varians”.

For at finde p-værdien, ganges tallet ud for en-halet” (markeret med rød) med 2, så

signifikanssandsynligheden bliver ca. 0,59 – langt over 0,05. Vi kan altså ikke forkaste hypotesen om, at

varianserne er ens.

t-test for to middelværdier – ens varians

I Excel-arket med data klikker man på ”Data” og efterfølgende ”Dataanalyse”. Der vælger man ”t-test: To

stikprøver med ens varians”

Man markerer nu cellerne på samme måde som foroven og klikker ”Ok”:

Resultatet bliver:

Page 25: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 23 af 24

Værdien af teststørrelsen ses under ”t-stat” at være ca. -1,45. p-værdien aflæses ud for to halet”

(markeret med rød) til ca. 0,15. Dvs. vi kan ikke forkaste nulhypotesen, det er muligt, at middelværdierne er ens.

Eksempel 3 t-test for to middelværdier – forskellig varians

I Excel-arket med data klikker man på ”Data” og efterfølgende ”Dataanalyse”. Der vælger man ”t-test: To

stikprøver med forskellig varians”.

Man markerer nu cellerne på samme måde som foroven og klikker ”Ok”:

Page 26: Matematik A - Harremoes

HHX forberedelsesmaterialet – Matematik A april 2020 Side 24 af 24

Resultatet bliver:

Værdien af teststørrelsen ses under ”t-stat” at være ca. 3,78. p-værdien aflæses ud for ” to halet”

(markeret med rød) til ca. 0,0003. Dvs. vi må forkaste nulhypotesen og konkludere, at middelværdierne for

metode A og metode B ikke er ens.