sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se...

45
Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución normal, gaussiana o de Laplace- Gauss. Fue descubierta y publicada por primera vez en 1733 por De Moivre. A la misma llegaron, de forma independiente, Laplace (1812) y Gauss (1809), en relación con la 7. Distribución norma 1 Anatoli Timoféyevich Fomenko Gaussian Distributions I and II

Upload: fonsie-duenas

Post on 04-Feb-2015

6 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución normal, gaussiana o de Laplace-Gauss. Fue descubierta y publicada por primera vez en 1733 por De Moivre. A la misma llegaron, de forma independiente, Laplace (1812) y Gauss (1809), en relación con la teoría de los errores de observación astronómica y física .

7. Distribución normal

1Anatoli Timoféyevich FomenkoGaussian Distributions I and II

Page 2: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco.

Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie (tallas, pesos, diámetros, perímetros,...).

Caracteres sociológicos, por ejemplo: consumo de cierto producto por unmismo grupo de individuos, puntuaciones de examen,...

Errores cometidos al medir ciertas magnitudes. Valores estadísticos muestrales, por ejemplo: la media. Y en general cualquier característica que se obtenga como suma de muchos factores. 

Otras distribuciones como la binomial o la de Poisson se aproximan a la normal. Distribuciones binomiales con n grande (n >30) y p ‘ni pequeño’ (np > 5) ‘ni grande’ ( n (1-p) > 5 ). 2

Page 3: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Distribución normal o gaussiana

• Está caracterizada por dos parámetros: la media, μ y la desviación típica, σ.

• Su función de densidad es:

0) (σ π2σ

1)(σ)μ,(

2

2

σ2

μ)(

x

exPN

La curva normal adopta un número infinito de formas, determinadas por sus parámetros μ y σ.

3

Page 4: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

+

Características de la distribución Normal

, Mo, Mn

- +

Tiene forma de campana, es asintótica al eje de las abscisas (para x = )

Los puntos de inflexión tienen como abscisas los valores .

Simétrica con respecto a la media () donde coinciden la mediana (Mn) y la moda (Mo).

Puntos de

inflexión

4

Page 5: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Distribución normal con m=0 para varios valores s

0

0.4

0.8

1.2

1.6

-2.50 -1.50 -0.50 0.50 1.50 2.50

x

=0.25s

=0.5s

=1s

p(x)

5

Page 6: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

20 30 40 50 60 70 80 90 100 110 120

5 5

10

Curvas normales con distintas medias y desviaciones estándar.

0) (σ π2σ

1)(σ)μ,(

2

2

σ2

μ)(

x

exPN

6

Page 7: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

N(μ, σ): Interpretación geométrica

• Podemos interpretar la media como un factor de traslación.

• Y la desviación típica como un factor de escala, grado de dispersión,…

7

Page 8: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

N(μ, σ): Interpretación probabilista• Entre la media y una

desviación típica tenemos siempre la misma probabilidad: aproximadamente el 68%.

• Si tomamos intervalos centrados en μ, y cuyos extremos están…– a distancia σ, tenemos probabilidad 68%– a distancia 2 σ, tenemos probabilidad 95%– a distancia 2’5 σ tenemos probabilidad 99%

• Entre la media y dos desviaciones típicas aprox. 95%

8

Page 9: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Podemos obtener la función de distribución F(x) integrando la función de densidad de probabilidad:

π2σ

1)(

2

2

σ2

μ)(

dvexFx v

De modo que la probabilidad de una variable aleatoria normal X en un intervalo a x b es:

π2σ

1)()()(

2

2

σ2

μ)(

dveaFbFbXaPb

a

v

¡No podemos calcular analíticamente el valor de la integral!Tabularemos sus valores numéricos...

2

2

σ2

μ)(

π2σ

1)(σ)μ,(

x

exPN

1 π2σ

1 2

2

σ2

μ)(

dvev

En particular:

9

Page 10: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

¿Cómo calcular probabilidades asociadas a una curva normal específica?

Dado que tanto como pueden asumir infinitos valores, es impracticable tabular las probabilidades para todas las posibles distribuciones normales. Para solucionarlo, se utiliza la distribución normal reducida o tipificada.

Se define una variable z = x -

Es una traslación , y un cambio de escala de la variable original.

10

Page 11: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

La nueva variable z se distribuye como una

NORMAL con media = 0 y desviación típica = 1

-3 -2 -1 0 1 2 3

z

68%95%99%

Recordemos de nuevo que en cualquier distribución normal las probabilidades delimitadas entre :

68 % 2 95 % 3 99 %

68%

99%

95%

11

Page 12: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Tipificación• Dada una variable de media μ y desviación típica

σ, se denomina valor tipificado z, de una observación x, a la distancia (con signo) con respecto a la media, medido en desviaciones típicas, es decir:

x

z

• En el caso de variable X normal, la interpretación es clara: asigna a todo valor de N(μ, σ), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo.

• Nos permite así comparar entre dos valores de dos distribuciones normales diferentes, para saber cuál de los dos es más extremo. 12

Page 13: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

13

Page 14: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes y se asignará al que tenga mejor expediente académico:– El estudiante A tiene una calificación de 8 en un sistema donde la

calificación de los alumnos se comporta como N(6,1).– El estudiante B tiene una calificación de 80 en un sistema donde la

calificación de los alumnos se comporta como N(70,10).

110

7080

21

68

B

BBB

A

AAA

xz

xz

– No podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos tipificar y observar las puntuaciones sobre una distribución de referencia N(0,1).

– Como zA > zB, podemos decir que el

porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación al estudiante A es mayor que el que ha superado B. En principio A es mejor candidato para la beca.

14

Page 15: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Las probabilidades de la variable tipificada (z) están tabuladas para los diferentes valores de la variable.Para calcular probabilidades, una vez transformada, la variable a valores de z, se busca en una tabla el área correspondiente.

Apliquemos el cambio de variable tipificada a la función de distribución F(x):

duezZpzF

zezp

z

2

u

2

z

2

2

π2

1)()(

;π2

1)(

π2σ

1)(

2

2

σ2

μ)(

dvexFx v

dz σdv σ

- μ z

15

Page 16: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

duezZpzF

zezp

z

2

u

2

z

2

2

π2

1)()(

;π2

1)(

Característica de la distribución normal tipificada (reducida o estándar):

No depende de ningún parámetro.

Su media es 0, su varianza es 1 y su desviación típica es 1.

La curva  f(x)  es simétrica respecto al eje de ordenadas y tiene un máximo en este eje.

Tiene dos puntos de inflexión en  z =1 y  z = -1.

16

Page 17: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Hay varios tipos de tablas de la distribución normal

La que se explica aquí representa las áreas para los diferentes valores de z desde 0 hasta +.

0+

Los valores negativos de z NO están tabulados, ya que la distribución es simétrica

17

Page 18: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

18

Page 19: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

0.00.10.20.30.4

0.5

0.00.10.20.30.4

0.5

0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9

.0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359

.0398 .0438 .0478 .0517 .0557 .0596 .0363 .0675 .0675 .0754

.0793 .0832 .0871 .0910 .0948 .0987 .1026 .... ...... ......

.1179 ..... ...... ...... ......

.1554 .... ..... ....

.1915 ....

La tabla consta de: *Margen izquierdo : Los enteros de z y su primer decimal.* Margen superior: segundo decimal* Cuerpo de la tabla: áreas correspondientes,

acumuladas, desde 0 hasta 3.99

19

Page 20: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

EJEMPLOS:

1.-¿Cuál es la probabilidad de que un

valor de z esté entre 0 y -2.03?

2.-¿Cuál es la probabilidad de que un

valor de z esté entre -2.03 y +2.03?

3. Hallar P( z >1.25 ) 4. Hallar P ( -0.34 < z < )

5. Hallar P ( 0.34 < z < 2.30 )

20

Page 21: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

?

Ejemplo 1

¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?

z

Cómo la curva es simétrica

P (-2.03 < z < 0) = P (0 < z < 2.03)

-3 -2 -1 0 1 2 321

Page 22: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

0 1 2 3 4

1.8

1.9

2.0

2.1

47. 88%

Ejemplo 1

¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?

-3 -2 -1 0 1 2 3

z

Se busca en la tabla el área correspondiente a z = 2.03

0.47882

22

Page 23: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

?47.88% 47.88%

Ejemplo 2

¿Cuál es la probabilidad de que un valor de z esté entre -2.03 y 2.03 ?

-3 -2 -1 0 1 2 3

z

En el ejemplo 1, vimos que la probabilidad de que z estuviera entre 0 y 2.03 = 0.47882

La misma área hay entre 0 y -2.03 , por lo tanto

P ( -2.03< z< 2.03) = 0.95764

95.76%

23

Page 24: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Ejemplo 3

¿Cuál es la probabilidad de que un valor de z sea mayor a 1.25 ?

z -3 -2 -1 0 1 2 3

?

1.- La probabilidad de 0 < z < + = 0.5002.- La probabilidad de 0 < z < 1.25 = 0.39435

39.44%

3.- La probabilidad de z > 1.25 =

0.500 - 0.39435= 0.10565

10.56%

50%

24

Page 25: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Hallar P( -0.34 < z < )

z

P(0 < z <0.34) = 0.13307 = P(-0.34 < z < 0)

13.31% 50%

63.31%

P( -0.34 < z < ) =0.13307 + 0.50000 = 0.63307

-3 -2 -1 0 1 2 3

Ejemplo 4

P (0 < z < ) = 0.50000

25

Page 26: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Ejemplo 5

Hallar P( 0.34 < z < 2.30)

z

-3 -2 -1 0 1 2 3

P(0< z <0.34) = 0.13307P( 0 < z < 2.30) = 0.4893

P (0.34 < z < 2.30) = 0.48930 - 0.13307 = 0.35623

35.62%

26

Page 27: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

EJEMPLO

Sea una variable distribuida normalmente con media = 4 y desviación típica = 1.5.

¿Cuál es la probabilidad de encontrar un valor x 6 (P(x 6 ))?

27

Page 28: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

x

= 4 = 1.5 Hallar P ( x > 6 )

?6

1.- transformar x en un valor de z

0.40824

0.09176

z = (6 - 4)/1.5 = 1.33

2.- Hallar P ( 0 < z < 1.33) =

3.- 0.5000 - 0.40824 =

σμx

z

0.5

-0.5 1 2.5 4 5.5 7 8.5-3 -2 -1 0 1 1.33 2 3 z

28

Page 29: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

Hasta ahora vimos como dado un valor x de la variable, hallar probabilidades transformando (estandarización) la variable en valores de x -

¿Cómo hallar un valor de x, dada la probabilidad?

x = ?

38.20%

Ejemplo: Sea una variable distribuida normalmente con =4 y = 2. Hallar el valor de x que deja por encima de él un 38.20% (0.3820).

Se debe desestandarizar :

x = z + 0.5000 - 0.382 = 0.118 Se busca en la tabla el valor más aproximado:0.1179

corresponde a z =+ 0.30

4.60

Sustituyendo en la fórmula

0.30 ∙ 2 + 4 = 4.60

z =

29

Se busca en la tabla de acuerdo al área. Con su signo.

Page 30: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

30

Page 31: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

31

• Nota: Cuando n > 20, np 5, y n(1-p) 5 la distribución binomial puede aproximarse por una normal con

(1 )

np

np p

Page 32: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

32

Page 33: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

33

Page 34: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución
Page 35: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

35

Page 36: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

En una empresa se ha visto que en un 10% de sus facturas se cometen errores y se desea calcular la probabilidad que de 100 facturas, 12 de ellas los contengan:

1

2

100(.10) 10

(1 ) 3

12.5 10.00.83 0.2967

311.5 10

0.5 0.19153

(12) 0.2967 0.1915 0.1052

np p

z

z

P

z2

z1

Page 37: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución
Page 38: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución
Page 39: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución
Page 40: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución
Page 41: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución
Page 42: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

42

Calcular pcon la aguja de Buffon

Page 43: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

43

Page 44: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

44

Page 45: Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución

45