indeling

26
HISPARC NAHSA Tellen van Random gebeurtenissen Indeling normaalverdeling Inleiding kansrekening Kansrekening bij detectie van kosmische stralen

Upload: lila-williams

Post on 02-Jan-2016

34 views

Category:

Documents


1 download

DESCRIPTION

Indeling. Inleiding kansrekening. Kansrekening bij detectie van kosmische stralen. normaalverdeling. Je hebt gemerkt dat gemeten waarden nogal eens fluctueren Geiger-Müller tellers tikken onregelmatig als je ze bij een bron houdt De aantallen die je meet bij een enkele HISPARC-detector. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Indeling

• normaalverdeling

•Inleiding kansrekening

•Kansrekening bij detectie van kosmische stralen

Page 2: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Je hebt gemerkt dat gemeten waarden nogal eens fluctueren

• Geiger-Müller tellers tikken onregelmatig als je ze bij een bron

houdt

•De aantallen die je meet bij een enkele HISPARC-detector

Page 3: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Kosmische straling vormt een constante achtergrond die de aarde

gelijkmatig treft vanuit alle richtingen

Gemeten waarden zijn NIET echt CONSTANT

Lange termijn gemiddelden geven de werkelijkheid redelijk goed weer

Page 4: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Uit metingen BLIJKT dat de gemeten waarde afhangt van:

•Tijdstip van de dag

•Hemelrichting

•Weersomstandigheden

Al deze invloeden kun je meten. Je kunt er zelfs correcties voor bepalen.

Maar: je meting zal meestal niet het echte

gemiddelde opleveren!

Gelukkig kom je met goede metingen dichtbij het echte gemiddelde.

Page 5: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Je zet een experiment op om een bepaald verschijnsel te onderzoeken

…en je laat het experiment een bepaalde tijd lopen.…

Maar je meet niets: Je telt NUL tikken.

Wat betekent dat?

Stel dat je in een meting van een uur één treffer (=gebeurtenis) waarneemt

Kun je dan concluderen dat dit verschijnseleen tempo heeft van een 1/uur?

Inleiding

Page 6: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Eerst even afspreken:Random gebeurtenissen:

•zijn onafhankelijk van elkaar•worden niet beïnvloed door voorgaande gebeurtenissen•zijn niet te voorspellen

0 sec tijd

Als het aantal treffers op 1 uitkomt kan dit het resultaat zijn van het toevallig vastleggen van een zeldzaam optredend verschijnsel dat beter weer-gegeven kan worden door een veel lager tempo

(~0?).Of de looptijd van de meting kan de gebeurtenis net gemist hebben(net te laat gestart of te vroeg beëindigd).

Page 7: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Een meting van 1 zou in werkelijkheid een gemiddelde kunnen zijn

van 0 of misschien zelfs

2?

1 ± 1Een meting van 2

2 ± 1? ± 2?Een meting van 37

37 ± minstens een paar?

Een meting van 1000

1000 ± ?

Page 8: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Dit histogram laat, minuut na minuut,

2-voudige coincidencies zien tussen 2 gestapelde CROP detectoren  

2-voudige coïncidenties

Gemeten per minuut

Gedurende 2 uur

Page 9: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

De meeste metingen liggen dichtbij het gemiddelde van 609.5 tikken/minuut

Merk op dat de 0 “onderdrukt” is! (de vertikale as begint bij 500, niet bij 0) 

500

In werkelijkheid zijn dit lichte fluctuatiesrondom een gemiddelde van ruim 600. 

Laagste waarde 562

562

657

Hoogste waarde 657

2-voudige coïncidenties

Gemeten per minuut

Gedurende 2 uur

Page 10: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Geen plotselinge pieken van 800; geen terugval tot 400. 

Zijn dit goede data?  Hoe kunnen we vaststellen of dit goede metingen

zijn of dat de verschillen te groot zijn?

2-voudige coïncidenties

Gemeten per minuut

Gedurende 2 uur

Page 11: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

De standaarddeviatie is een berekening van hoe ver, gemiddeld, iedere

meting verwijderd is van het gemiddelde . 

Als alle metingen identiek waren,dan was het gemiddelde duidelijk

en zou de standaarddeviatie simpelweg 0 zijn.  

Om de spreiding in de meetgegevens beter weer te geven hebben we als hulpmiddel: de standaardafwijking (of ook wel

de standaarddeviatie )

Page 12: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

De standaarddeviatie is een berekening van hoe ver, gemiddeld, iedere

meting verwijderd is van het gemiddelde . 

Als alle metingen identiek waren,dan was het gemiddelde duidelijk

en zou de standaarddeviatie simpelweg 0 zijn.   0

Om de spreiding in de meetgegevens beter weer te geven hebben we als hulpmiddel: de standaardafwijking (of ook wel

de standaarddeviatie )

Page 13: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Mijn hartslag bij het ontbijt gedurende 100 dagen61 64 67 70 70 71 75 72 72 69 68 70 65 67 62 59 62 66 66 6868 73 71 72 73 71 71 68 69 68 69 65 63 70 70 76 71 72 74 6056 74 75 79 72 72 69 68 68 68 62 66 66 66 61 77 75 74 63 7263 62 65 65 66 65 67 67 65 67 68 62 67 60 68 65 70 70 69 7068 73 64 71 71 68 70 69 73 72 70 69 67 64 67 58 66 69 76 73

Height in Inches for a Sample of 100 Adult Males

0

2

4

6

8

10

12

14

40 44 48 52 56 60 64 68 72 76 80 84 88 92 96 100

Frequentietabel van de verdeling van de hartslag

56 157 058 159 160 261 262 563 364 365 766 767 868 1269 870 1071 772 873 574 375 376 277 178 079 1

Hartslag gedurende 100 dagen

Page 14: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Height in Inches for a Sample of 100 Adult Males

0

2

4

6

8

10

12

14

40 44 48 52 56 60 64 68 72 76 80 84 88 92 96 100

Spreiding = xmax-xmin = 23

gemiddelde= =67.20

Modus = 68 (=meest voorkomend)

Mediaan = 68.52 (=middelste waarneming)

N

xxxx

N

xN

N

i i 3211

Hartslag gedurende 100 dagen

Page 15: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Het gemiddelde alleenlaat ons niet zien

hoe dicht op elkaargepakt de data zijn.

De spreiding kan misleidend zijnals de metingen buitensporige

gegevens bevatten:

Page 16: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Page 17: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

gemiddelde,

beschrijft de spreiding in de metingen op een andere manier: door een berekening van hoe groot de gemiddelde afstand van een meetpunt is tot het gemiddelde

(xi – )2

N

= i=1

N

σ

Page 18: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Height in Inches for a Sample of 100 Adult Males

0

2

4

6

8

10

12

14

40 44 48 52 56 60 64 68 72 76 80 84 88 92 96 100

Spreiding = xmax-xmin = 23

gemiddelde = =67.20

standaardafwijking = 4.357=

N

xxxx

N

xN

N

i i 3211

(xi – )2

N

Hartslag gedurende 100 dagen

Page 19: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

De nieuwe lijnen geven de afstand aan van een en twee keer de standaarddeviatie onder en

boven het gemiddelde

Voor deze gegevens gaf Excel een SD van 20.  Dus staan de lijnen op:

609.5 ± 20.0 = 589.5   and  609.5 ± 40.0 = 569.5 629.5 649.5

2-voudige coïncidenties

Gemeten per minuut

Gedurende 2 uur

Page 20: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Een gering aantal (hier 5) ligt op meer dan 2 SD van het gemiddelde. 

De meeste meetwaarden blijken binnen±1 SD van het gemiddelde te liggen. 

Een paar meetwaarden vallen binnen 1 à 2 SD. 

de SD beschrijft hoe dicht op elkaar gepakt de meetwaarden rond het gemiddelde zijn, en

geeft een grens aan over hoe ver ze mogen spreiden.

Hier zijn er geen meetpunten op meer dan 3 SD. 

2-voudige coïncidenties

Gemeten per minuut

Gedurende 2 uur

Page 21: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

*Verticale lijnen op ±1, 2, 3 SD van het gemiddelde.  *Je ziet dat de meeste metingen binnen ±1 SD van het gemiddelde liggen. *Heel af en toe worden er metingen gevonden met  >3 SD van het gemiddelde.

frequentie, opgenomen in intervallen van een minuut gedurende een periode van 1 week (zelfde opstelling)

•Metingen gegroepeerd rondom het gemiddelde(615).  •Nul onderdrukt; weinig data onder 550 (of boven 680).

Frequentieverdeling van 2-voudige coïncidenties

Tempo (aantallen per minuut)

Page 22: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Gausskromme:

Page 23: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Met andere woorden:

68% van de metingen valt binnen ±1 SD van het gemiddelde.

95% van de metingen binnen ±2 SD

99.7% van de metingen binnen ±3 SD

Karakteristiek voor deze vorm: het stuk tussen

µ en µ+ bevat 68%

Van het totale oppervlak onder de curve.

Page 24: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Je ziet dus dat een goede meting wel erg dicht bij de echte waarde kan zitten maar

nooit helemaal perfect zal zijn. (Zelfs als dat zo is weten we dat niet met zekerheid.)

Daarom geven we in de kansrekening een verschil aan tussen de echte waarden en de

gemeten waarden.

We hebben nu een aardig idee over hoe metingen verspreid kunnen liggen rondom een gemiddelde.

Omgekeerd kunnen we ook zeggen:

Als we een meting doen dan zal deze in 68% van de gevallen op minder dan een SD van het gemiddelde af liggen.

Maar we weten nog steeds niet nauwkeurig hoe groot dit gemiddelde werkelijk is!

Page 25: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Voorbeeld:het aantal jongeren in Nijmegen van 12 tot 18 jaar is 14.987.

*Gemiddelde lengte = 1.680 m (=µ)

*Gem. afwijking: 5,3 cm (= )

Steekproef: alle leerlingen van onze school: (1412)

Gemiddelde 1.685 m (= x)Gem. afw: 6,1 cm (=SD)

Je snapt dat hoe groter de steekproef is hoe beter je bij het echte gemiddelde uitkomt.

Page 26: Indeling

HISPARC NAHSA

Tellen van Random gebeurtenissen

Deze voorgaande beschrijving gaat op voor alle onafhankelijke gebeurtenissen. Dit zijn zowel allerlei soorten metingen als spellen met een dobbelsteen.

Bij een grafische voorstelling van de uitkomsten ontstaat dan de bekende Gausskromme.

Soms is het gemiddelde () niet eens bekend, zoals bij onze opstelling voor het meten van kosmische straling. Toch kun je dan met een beperkt aantal metingen een redelijke schatting maken van wat het gemiddelde moet zijn en hoe groot de spreiding daarin is.

Het zal je nu wel duidelijk zijn dat één meting geen bruikbaar gemiddelde oplevert.

Terug naar Indeling