a5 y b5 estadistica - c2academia.files.wordpress.com
TRANSCRIPT
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 222 de 235 C2ACADEMIA.COM
A5 Y B5 ESTADISTICA
Funciรณn de probabilidad
La funciรณn de probabilidad de una variable que sigue una distribuciรณn binomial ๐ต(๐, ๐) es:
๐(๐รฉ๐ฅ๐๐ก๐๐ ) = ๐(๐ = ๐) = 2๐๐3 โ ๐! โ ๐"#!
Una moneda esta trucada de manera que la probabilidad de salir cara es de 0,4 se lanza seis veces. Halla la probabilidad de que:
โข Salgan exactamente cuatro caras โข Salgan seis cruces โข Salga, al menos, 4 caras โข Salgan, a lo sumo, dos caras โข Halla la media y la desviaciรณn.
Llamamos X a la variable que indica el numero de caras y observamos que sigue una distribuciรณn binomial ๐ต(6,0โฒ4), siendo ๐ = 6 lanzamientos ๐ = 0,4 la probabilidad de salir cara y ๐ = 1 โ๐ = 1 โ 0,4 = 0,6 la probabilidad de cruz.
๐(๐ = 4) = 2643 โ 0,4$ โ 0,6% =
6!4! โ 2!
โ 0,0256 โ 0,36 = 0,13824
๐(๐ = 0) = 2603 โ 0,4& โ 0,6' = 1 โ 1 โ 0,046656 = 0,046656
๐(๐ โฅ 4) = ๐(๐ = 4) + ๐(๐ = 5) + ๐(๐ = 6)
=2643 โ 0,4$ โ 0,6% + 2653 โ 0,4
( โ 0,6) + 2663 โ 0,4' โ 0,6& = 0,1792
๐(๐ โค 2) = ๐(๐ = 0) + ๐(๐ = 1) + ๐(๐ = 2) =
2603 โ 0,4& โ 0,6' + 2613 โ 0,4
) โ 0,6( + 2623 โ 0,4% โ 0,6$ = 0,54432
Parรกmetros de una distribuciรณn binomial
๐๐๐๐๐๐๐๐ ๐๐๐๐๐๐ง๐; ๐ = ๐ โ ๐
๐๐๐๐๐๐๐ง๐;๐% = ๐ โ ๐ โ ๐
๐ท๐๐ ๐ฃ๐๐๐๐รณ๐๐กรญ๐๐๐๐; ๐ = T๐ โ ๐ โ ๐
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 223 de 235 C2ACADEMIA.COM
DISTRIBUACIรN NORMAL
Una variable aleatoria continua X sigue una distribuciรณn normal de media ๐y desviaciรณn tรญpica ๐ , y se escribe, ๐(๐, ๐)si se cumple:
โข Toma valores en todo โ โข Su funciรณn de densidad es (Representar la campana de Gauss)
Algunas propiedades de esta grafica son:
โข En el intervalo (๐ โ ๐, ๐ + ๐) el รกrea encerrada es 0,6826. โข En el intervalo (๐ โ 2๐, ๐ + 2๐) el รกrea encerrada es 0,9544. โข En el intervalo (๐ โ 3๐, ๐ + 3๐) el รกrea encerrada es 0,9973.
La funciรณn depende de los valores de la media y de la desviaciรณn tรญpica. El valor de la media desplaza la grafica a izquierda o derecha, mientras que el calor de la desviaciรณn, modifica la altura y anchura de la campana.
DISTRIBUCIรN NORMAL ESTANDAR
Dada la complejidad de la funciรณn de densidad de la distribuciรณn normal, y teniendo en cuneta la dificultad que ello provoca en el calculo de probabilidades, es lรณgico pensar en encontrar los valores de ๐๐ฆ๐ que faciliten al mรกximo la tarea.
Se conoce como distribuciรณn normal estรกndar o tipificada a la distribuciรณn normal en la que ๐ =0๐ฆ๐ = 1, es decir, ๐(0,1) . la variable aleatoria ๐(0,1) se identifica con ๐.
Lo bueno de esta distribuciรณn es que nos permite encontrar la soluciรณn y por tanto las probabilidades necesarias, sin tener que realizar cรกlculos integrales.
A continuaciรณn, aprenderemos a utilizar la tabla:
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 224 de 235 C2ACADEMIA.COM
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 225 de 235 C2ACADEMIA.COM
USO DE LA TABLA
Como ya hemos dicho anteriormente, la tabla muestra la probabilidad de que la variable ๐ que sigue una distribuciรณn ๐(0,1) , tome valores menores o iguales que un cierto valor ๐:๐(๐ โค ๐).
Veamos como calcular las probabilidades.
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 226 de 235 C2ACADEMIA.COM
Observaciones
1. En caso de que se quiera calcular ๐(๐ โค ๐) siendo k un numero mayor que 3โฒ59, se puede decir que dicha probabilidad es igual a 1aproximadamente, puesto que en la tabla se observa que ๐(๐ โค 3โฒ59) = 0โฒ9999 y para valores mayores tiene que aumentar por ser acumulativa, siendo uno el รกrea total bajo la curva.
2. Observa que en todos los casos utilizamos indistintamente >, <, โค, โฅ ya que en las distribuciones continuas ๐(๐ = ๐) = 0.Es por eso que al utilizar el suceso contrario, escribimos ๐(๐ โค ๐) = 1 โ ๐(๐ > ๐) . Sin embargo, debemos ser cuidadosos si la distribuciรณn es binomial, pues lo cierto seria ๐(๐ โค ๐) = 1 โ ๐(๐ > ๐).
3. Es posible que la bรบsqueda se realice de manera indirecta, es decir, conocida ๐(๐ โค๐) = ๐, hallar el valor de ๐.
Una vez que hemos aprendido a trabajar con la tabla, nos planteamos como calcular probabilidades si la variable no es ๐(0,1), cosa prรกcticamente segura en un contexto real. Como seria tarea imposible tabular todas las posibles distribuciones normales, y para evitar el calculo integral, se ha buscado una estrategia que permite transformar una variable X de distribuciรณn ๐(๐, ๐) en otra variable Z de distribuciรณn ๐(0,1). Dicha estrategia se conoce como tipificaciรณn de la variable.
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 227 de 235 C2ACADEMIA.COM
TIPIFICACIรN DE LA VARIABLE
Tipificar una variable X que sigue una distribuciรณn normal ๐(๐, ๐), es ajustarla a otra variable Z normal ๐(0,1). Para ello, es necesario trasladar su centro desde ๐๐0 y reducir o ampliar su forma acampanada desde ๐๐1.
Ambas cosas se consiguen sin mas que hacer el cambio de variable ๐ = *#+,
De esta forma, si necesitamos calcula ๐(๐ โค ๐) solo tenemos que realizar dicho cambio de variable de la siguiente forma:
๐(๐ โค ๐) = ๐ ^๐ โ ๐๐
โค๐ โ ๐๐ _ = ๐ 2๐ โค
๐ โ ๐๐
3
Con lo que con esta situaciรณn estarรญamos en condiciones de hacer uso de la tabla.
Las tallas de los alumnos de 17๐รฑ๐๐ de un centro escolar siguen una distribuciรณn ๐(165,10).
โข Eligiendo un alumno al azar, ยฟCuรกl es la probabilidad de que mida menos de 170 centiemtros? ยฟY entre155๐ฆ170๐๐?
โข ยฟQuรฉ porcentaje de alumnos mide mas de 182๐๐? โข ยฟA partir de que talla se encuentra el 10% de los alumnos mas altos?
Sea X la variable normal ๐(165,10). Se pide:
โข ๐(๐ < 170) = ๐(๐ โค 170) = ๐ 2*#)'()&
โค )-&#)'()&
3 = ๐(๐ โค 0,5) = 0,6915
๐(155 โค ๐ โค 170) = ๐ ^155 โ 165
10โค๐ โ 16510
โค170 โ 165
10 _ = ๐(โ1 โค ๐ โค 0,5) =
๐(๐ โค 0,5) โ ๐(๐ โค โ1) = 0,6915 โ ๐(๐ โฅ 1) = 0,6915 โ [1 โ ๐(๐ โค 1)] =
0,6915 โ 1 + 0,8413 = 0,5328
โข ๐(๐ โฅ 182) = ๐ 2๐ โฅ ).%#)'()&
3 = ๐(๐ โฅ 1,7) = 1 โ ๐(๐ โค 1,7) = 1 โ 0,9554 =0,0446 Lo que significa que el 4,46% de los estudiantes miden mas de 182๐๐
โข ๐(๐ โฅ ๐) = ๐ 2*#)'()&
โฅ /#)'()&
3 = 0,1 โ ๐ 2๐ โฅ /#)'()&
3 = 0,1 โ
1 โ ๐ ^๐ โค๐ โ 16510 _ = 0,1 โ 1 โ 0,1 = ๐ ^๐ โค
๐ โ 16510 _ โ ๐ ^๐ โค
๐ โ 16510 _ = 0,9
y buscamos en la tabla el valor mas prรณximo al obtenido /#)'()&
= 1,28 โ ๐ = 177,8
Se deduce que el 10% de los alumnos mas altos miden mas de 177,8๐๐.
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 228 de 235 C2ACADEMIA.COM
Normalizar
APROXIMACIรN DE LA BINOMIAL POR LA NORMAL
Se demostrรณ que una variable X que sigue una distribuciรณn binomial ๐ต(๐, ๐) de media ๐ = ๐ โ๐๐ฆ๐๐๐ ๐ฃ๐๐๐๐๐๐๐ = T๐๐๐ , puede aproximarse por una variable Xโ normal ๐(๐, ๐) =
๐(๐๐,T๐๐๐), y que esta aproximaciรณn es buena siempre que ๐ โ ๐ โฅ 5๐ฆ๐ โ ๐ โฅ 5. El siguiente paso que tenemos que topar es tipificar la variable para poder trabajar con la tabla, tal y como lo hemos explicado anteriormente.
De esta manera, podremos resolver problemas relacionados con distribuciones binomiales donde el numero de repeticiones es elevado.
๐๐๐๐๐๐๐๐๐๐ต(๐, ๐)๐โฒ๐๐๐๐๐๐๐(๐๐,T๐๐๐)
Es necesario, sin embargo, realizar algunas correcciones para salvar las diferencias entre discretas y continuas, dado que en las primeras existe la probabilidad de que la variable tome un valor concreto, y en las segundas, este siempre es cero. Por esta razรณn, en la distribuciรณn binomial no es lo mismo
๐(๐ < ๐)๐๐ข๐๐(๐ โค ๐).
Tipificar
๐ =๐ โ ๐๐T๐๐๐
๐๐๐๐๐๐๐(0,1)
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 229 de 235 C2ACADEMIA.COM
Veamos con se compensan estas diferencias:
Se observa que el hecho de sumar o restar 0โฒ5 al valor de a, se produce dependiendo de si dicho valor a debe estar o no incluido en el calculo de la probabilidad.
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 230 de 235 C2ACADEMIA.COM
DISTRIBUCIรN MUESTRAL DE MEDIAS
TEOREMA CENTRAL DEL LIMITE
Dada una poblaciรณn de media ๐ y desviaciรณn ๐, consideramos todas las muestras aleatorias de tamaรฑo n y la variable aleatoria ๐j que a cada muestra le hace corresponder su media, es decir, ๐j = {๐ฅ)jjj, ๐ฅ%jjj, โฆ , ๐ฅ0jjj} entonces se cumple:
โข la media de las medias de las muestras es la misma que la de la poblaciรณn. โข La desviaciรณn tรญpica de las medias es ,
โ"
โข La variable ๐j que sigue una distribuciรณn normal siempre que la distribuciรณn inicial lo sea o, si no es asรญ, siempre que el tamaรฑo de las muestras sea igual o superior a treinta. (๐ โฅ 30).
Por tanto, si una poblaciรณn tiene media ๐ y desviaciรณn tรญpica ๐ , y consideramos todas las muestras aleatorias de tamaรฑo n (n cualquiera si la poblaciรณn es ``normalยดยด y ๐ โฅ 30 si no lo es), entonces las medias de esas muestras siguen aproximadamente una distribuciรณn normal de
media ๐ y desviaciรณn ,โ"
, es decir ๐jsigue una distribuciรณn normal ๐(๐, ,โ").
Se deduce que cuento mayor sea el tamaรฑo de las muestras mejor es la aproximaciรณn y mas pequeรฑa es la desviaciรณn.
DISTRIBUCIONES MUESTRALES DE PROPORCIONES
Supongamos que conocemos que el 40% de los alumnos de bachillerato del centro realiza alguna actividad solidaria en su tiempo libre. Si eligiรฉramos un alumno al azar, la probabilidad de que realizase actividades solidarias (รฉxito) Seria ๐ = 0,4 y estarรญamos ante una prueba binomial.
Seleccionamos una muestra de 50alumnos y nos preguntamos cual serรก la proporciรณn (๐!) de alumnos solidarios en dicha muestra.
Dado que hay ๐ = 50 alumnos, seguirรก una distribuciรณn binomial ๐ต(50, 0ยด4).
Teniendo en cuenta que:
๐๐ = 20 โฅ 5
๐๐ = 30 โฅ 5
podremos aproximar la variable por una distribuciรณn normal
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 231 de 235 C2ACADEMIA.COM
๐(๐๐,T๐๐๐), ๐๐ ๐๐๐๐๐๐(20,3ยด46)
Como la proporciรณn de alumnos solidarios en la muestra es ๐! =*(&
, la variable ๐! seguirรก una
distribuciรณn ๐2"2", โ"23
"3 = ๐ ^๐,o23
" _ en este caso ๐2%&(&, 4,$'(&3 = ๐(0โฒ4,0โฒ069).
Podemos generalizar entonces:
Si en una poblaciรณn aparece una caracterรญstica binomial determinada (el individuo la tiene o no) con una proporciรณn p, entonces la proporciรณn de individuos con dicha caracterรญstica (๐!) en las
muestras de tamaรฑo ๐, ๐ ๐๐๐๐๐๐ โฅ 30, sigue una distribuciรณn ๐^๐,o23" _.
A esta distribuciรณn se le llama distribuciรณn muestral de proporciones.
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 232 de 235 C2ACADEMIA.COM
INTERVALOS DE CONFIANZA
Dada una variable ๐๐๐๐๐๐๐๐๐๐ , llamamos intervalo caracterรญstico correspondiente a una probabilidad p, al intervalo centrado en ๐(๐ โ ๐, ๐ + ๐) tal que la probabilidad de p es la probabilidad de que X pertenezca a ese intervalo.
Como ejemplo, supongamos que la variable es ๐๐(0,1). Queremos hallar el intervalo simรฉtrico respecto a la media tal que la probabilidad de que ๐este dentro es 95%, es decir, ๐ = 0`95.
Por simetrรญa, si 0ยด95 es el รกrea dentro del intervalo, el 0ยด05 restante se reparte idรฉnticamente entre las dos colas : 0ยด025๐๐๐๐๐ข๐๐.
๐(โ๐ < ๐ < ๐) = 0ยด95 โ ๐(๐ < ๐) = 0ยด975 y buscando en las tablas el valor mas prรณximo obtendremos ๐ = 1ยด96.
Luego ๐(โ1ยด96 < ๐ < 1ยด96) = 0ยด95, es decir, hay un 95% de probabilidad de que ๐tome valores en ese intervalo.
Realizando el mismo proceso obtendrรญamos para el 90%๐ = 1ยด645๐ฆ๐๐๐๐99%๐ = 2ยด575.
Podemos afirmas que ๐ 2โ๐ง6%7< ๐ < ๐ง6
%73 = 1 โ ๐ผ
Los valores crรญticos mas utilizados son:
1 โ ๐ผ 0ยด9 0ยด95 0ยด99
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 233 de 235 C2ACADEMIA.COM
๐ง6%7
1ยด645 1,96 2ยด575
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 234 de 235 C2ACADEMIA.COM
INTERVALOS DE CONFIANZA PARA LA MEDIA DE LA POBLACIรN
Si deseamos estimar la media ๐ de una poblaciรณn de la que conocemos la desviaciรณn tรญpica ๐, extraemos una muestra de tamaรฑo ๐ de la que se obtiene una media muestral ๏ฟฝฬ ๏ฟฝ.
Si la poblaciรณn de una partida sigue una distribuciรณn normal o bien ๐ โฅ 30, entonces el intervalo de confianza de ๐ con un nivel de confianza de (1 โ ๐ผ)% es:
^๏ฟฝฬ ๏ฟฝ โ ๐ง6 %7โ๐โ๐
, ๏ฟฝฬ ๏ฟฝ + ๐ง6%7โ๐โ๐_
Si en algunos de los casos se desconociera la desviaciรณn de la poblaciรณn podrรญamos realizar el intervalo con la desviaciรณn de la muestra siempre y cuando la muestra sea lo suficientemente grande como para eludir el error que cometeremos.
^๏ฟฝฬ ๏ฟฝ โ ๐ง6 %7โ๐ โ๐
, ๏ฟฝฬ ๏ฟฝ + ๐ง6%7โ๐ โ๐_
Para definir el error admisible tendremos en cuenta el intervalo de confianza. Lรณgicamente, el error mรกximo serรก el radio del intervalo:
๐ธ = ๐ง6%7โ๐โ๐
Determinar el tamaรฑo de la muestra:
๐ = ^๐ง6
%7โ ๐
๐ธ _%
PROBABILIDAD Y ESTADISTICA TEORIA
Pรกgina 235 de 235 C2ACADEMIA.COM
INTERVALOS DE CONFIANZA PARA LA PROPORCIรN
Se tata ahora de encontrar un intervalo en el que afirmar, con un nivel de confianza determinada, que se encuentra la proporciรณn total de la poblaciรณn.
Sabemos que las proporciones de las muestras (siempre que ๐ โฅ 30) siguen una distribuciรณn
๐^๐,o23" _ y siguiendo un procedimiento totalmente anรกlogo al de las medias muรฉstrales,
podemos afirmar que el intervalo de confianza para la proporciรณn de individuos de una poblaciรณn que cumplen una determinada caracterรญstica:
u๐! โ ๐ง6 %7โ o๐๐๐,๐! + ๐ง6 %7
โ o๐๐๐v
El error mรกximo cometido serรก igualmente el radio del intervalo:
๐ธ = ๐ง6%7โ o๐๐๐
Determinar el tamaรฑo de la muestra:
๐ =๐ โ ๐
u ๐ธ๐ง6
%7v%
ALGO FUNDAMENTAL:
< ๐๐๐๐๐๐๐๐๐ โ ~๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐ > ๐๐๐๐๐๐๐๐๐ โ ~
๐๐๐๐๐๐๐๐๐๐๐๐๐๐
โค ๐๐๐๐๐๐๐๐๐ โ๏ฟฝ
๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐
โฅ ๐๐๐๐๐๐๐๐๐ โ ๏ฟฝ
๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐
๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐, ๐๐๐๐๐๐๐๐๐๐
๐ต๐ฐ๐ฝ๐ฌ๐ณ๐บ๐ฐ๐ฎ๐ต๐ฐ๐ญ๐ฐ๐ช๐จ๐ช๐ฐ๐ถ๐ต% = ๐๐๐%โ๐ต๐ฐ๐ฝ๐ฌ๐ณ๐ซ๐ฌ๐ช๐ถ๐ต๐ญ๐ฐ๐จ๐ต๐๐จ%
๐ณ๐ถ๐ต๐ฎ๐ฐ๐ป๐ผ๐ซ = ๐ โ ๐ฌ๐น๐น๐ถ๐น