distribuição introdução à bioestatística – turma nutrição...
TRANSCRIPT
Distribuição Gaussiana
Universidade Federal de Minas GeraisInstituto de Ciências ExatasDepartamento de Estatística
Introdução à Bioestatística – Turma NutriçãoGaussiana
Aula 7 :
Distribuição Normal (Gaussiana)
Introdução à Bioestatística – Turma Nutrição
Distribuição de frequência dos valores de peso de ao nascer de 500 bebês
Para amostra com tamanho n = 500
Distribuição de frequência dos valores de peso de todos os bebês de toda a população
Distribuição de Probabilidade do peso de recém-nascidos
Distribuição de Frequências do Peso (gramas) de 100 00 recém -nascidos
frequência relativadensidade
tamanho da classe=
Histograma de DensidadeD
ensi
dade
4e-0
46e
-04
8e-0
4
área da barra =densidade x largura da barra
área da barra =probabilidade de Xestar entre os limites da barra
Peso ao nascer
1000 2000 3000 4000 5000
0e+0
02e
-04
P[2500 < X < 3500] = soma das áreas das barras entre 2500 e 3500 g.
estar entre os limites da barra
Histograma de Densidade
Den
sida
de
4e-0
46e
-04
8e-0
4
àrea da barra =probabilidade de Xestar entre os limites da barra
Peso ao nascer
1000 2000 3000 4000 5000
0e+0
02e
-04
estar entre os limites da barra
soma das àreas das barras entre 1000 e 2125P[X < 2125] =
Como calcular probabilidades usando f(x) ?
P[a < X < b ]
a b
P[a < X < b ] é a áreaabaixo da curvaf(x) entrea eb
Propriedades de f(x)
1) f(x) ≥ 0
2) A área abaixo de toda a curva f(x) é igual a 1.
P[X=b] = 0 � P[X < b] = P[X ≤ b]
Como X é uma variável aleatória contínua, então
Algumas variáveis contínuas exibem um comportamento muitoparticular quando visualizamos a distribuição de frequênciasde seus valores.
Fre
quên
cia
Modelo Probabilístico Normal (ou Gaussiano)
• Concentração de valores em torno de um valor central;
• Simetria em torno do valor central;
• Frequência pequena de valores muito extremos.
Fre
quên
cia
Valores
O Modelo Probabilístico Gaussiano
O matemático alemão Karl Gausspopularizou um modelo proposto para adistribuição de probabilidades de variáveisdo tipo descrito anteriormente.
A curva descrita por este modelo éA curva descrita por este modelo éconhecida como Curva de Gauss (outambém como Curva Normal )
O Modelo Probabilístico Gaussiano
2121
( ) , 2
x
f x xeµ
σπσ
−−= − ∞ < < ∞
A função de densidade de X só depende de dois valores:
a média µ e o desvio-padrão σ
π e e são constantes conhecidas (π ≈ 3,14159… e e≈ 2.71828…)
A média µ de uma variável aleatória X que siga o modeloGaussiano pode assumir qualquer valor na reta real
O Modelo Probabilístico Gaussiano
µ−∞ < < ∞
O desvio-padrão σ de qualquer variável aleatória X sóO desvio-padrão σ de qualquer variável aleatória X sópode assumir valores maiores do que zero
0σ >
µ e σ são os parâmetros do Modelo Gaussiano
Dizemos que X ~ Normal (µ,σ)
A curva gaussiana (ou curva Normal) é definida pela média µµµµ e pelo desvio-padrão σ.σ.σ.σ.
O Modelo Probabilístico Gaussiano
A curva gaussiana tem a forma de um sino e é simétrica em torno da média µ;
Simetria
a a
P(X < 3000-a ) = P(X > 3000+a )
3000 + a3000 - a
Probabilidade de X estar entre x1 e x2: P( x1 < X < x2 )
Cálculo de Probabilidade na Curva Normal
Considere uma variável aleatória X com distribuição
Normal (µ,σ). Ou seja, X ~ Normal(µ,σ)
P( x1 < X < x2 )P( x1 < X < x2 )P( x1 < X < x2 )P( x1 < X < x2 )
Área sob a curva
Normal entre x1 e x2.
Cálculo de Probabilidade na Curva Normal
P( x1 < X < x2 )
curvas Normais diferentes � áreas diferentes
Exemplo :Suponha que X é o peso de bebês ao nascer e que, em certa população, X tem distribuição de probabilidade que pode ser aproximada pela Normal com µ = 3000g e σ = 1000g.
Se existisse uma tabela da N(3000,1000) com as probabilidades abaixo de muitos valores, tipo:
x P(X < x)1000 0.022750131050 0.025588061100 0.02871656
…
... o problema estaria resolvido.
…1500 0.0668072
…4000 0.8413447
…6000 0.9986501
A Distribuição Normal Padrão
Como existem infinitas combinações dos valores para µ
e σ, seria inviável tabelar as probabilidades de todas as
As probabilidades na curva Normal são calculadas com oauxílio de uma tabela.
Z ~ Normal (µ=0 ; σ=1)
e σ, seria inviável tabelar as probabilidades de todas asdistribuições Normais possíveis.
Uma única variável Normal possui suas probabilidadestabeladas: a variável Z com média igual a 0 e desvio-padrão igual a 1.
Z ~ N(0,1) a variável aleatória Z
tem distribuição de probabilidade
Normal com média=0 ed.p.=1
Variável Normal Padrão
P( Z < z )
d.p.=1
Exemplo : Seja Z uma v.a. normal padronizada. Calcule:
P( Z < -1.97) = ? P( Z > 1.84) = ?
P( Z < -1.97 ) = 0.0244,
obtida direto da tabela.
P( Z >1.84) = P( Z < -1.84) = 0.0329, obtida direto da tabela
e por simetria.
Cálculo de percentis na curva Normal
Percentil de ordem 2.5
Que valor de Z na tabela Normal Padrão deixa uma área de 0.0250 abaixo dele ?
0.0250
a=-1.96
Ou seja, quem é a tal que P[Z < a ]=0.0250 ?
a é o percentil 2.5 da curva Normal Padrão
Cálculo de percentis na curva Normal
Percentil de ordem 97.5
Que valor de Z na tabela Normal Padrão deixa uma área de 0.9750 abaixo dele ?
Ou seja, quem é b tal que P[Z < b ]=0.9750 ?
b é o percentil 97.5 da curva Normal Padrão
0.9750
b=1.96
0.0250b é o simétrico de a em relação à média da curva Normal
Cálculo de percentis na curva Normal
P[Z < b ]=0.9500
b é o percentil 95 da curva Normal Padrão b=1.645
Percentil de ordem 95
Normal Padrão
Na tabela Z:
z= 1.65 � área abaixo = 0.9505
z= 1.64 � área abaixo = 0.9495
Escolher o valor mais próximo da probabilidade desejada.
Cálculo de percentis na curva Normal
P[-b < Z < b ]=0.9800
Percentil de ordem 1
P[Z < b ]=0.0100
b é o percentil 1 da curva Normal Padrão
0.9800P[-b < Z < b ]=0.9800
P[Z< -b ] =0.0100
-b = ?
Na tabela Z:
z= -2.33 � área abaixo = 0.0099
z= -2.32 � área abaixo = 0.0102
b=2.33-b=2.33
0.0100 0.0100
Usar o valor de z que forneça a área mais próxima
do desejada (-2.33)
Como usar a tabela Normal Padrão para calcular probabilidades em uma curva Normal qualquer?
Z ~ Normal (0,1) Distribuição de
X ~ Normal (µ=10 ; σ=2) Distribuição de
Podemos transformar uma variável aleatória
X ~ Normal ( µ , σ ) em uma variável aleatória
Z ~ Normal ( 0, 1) usando a expressão:
Padronização de uma variável aleatória Normal
XZ
µσ−=
Calculando probabilidades de X~N( µ=10; σ=2) na tabela Z
[ 9]P X < =10 9 10
2 2
XP
− − < [ 0.5] 0.3085P Z= < − =
[ 13]P X > =10 13 10
[ ]2 2
XP
− −> = [ 1.5]P Z >
[ 1.5] 0.0668P Z= < − =[ 1.5] 0.0668P Z= < − =
Exemplo 1 : Se X tem distribuição Normal com µ = 40 e σ = 6,encontre o valor de x tal que P[X < x] =0.45.
então P( Z < (x-40)/6 ) = 0.45.
Mas P( Z < -0.13 ) = 0.45 (da tabela);
Se P[X < x] =0.45.
Logo (x-40)/6 = -0.13 Logo (x-40)/6 = -0.13
� x = 40 + (-0.13)6 = 40 - 0.78= 39.22.
Ou seja, 39.22 é o percentil 45 da distribuição de X.
então P( Z < (x-40)/6 ) = 0.86.
Mas P( Z < 1.08) = 0.86 (da tabela);
Se P[X < x] = 0.86
x
Exemplo 2 : Se X tem distribuição Normal com µ = 40 e σ = 6,encontre o valor de x tal que P[X > x] =0.14.
Logo (x-40)/6 = 1.08
� x = 40 + (1.08)6 = 46.48
Ou seja, 46.48 é o percentil 86 da distribuição de X.
Exemplo Inicial :
Suponha que X é o peso de bebês ao nascer e que, em certa população, X tem distribuição que pode ser aproximada pela Normal comµ = 3000g e σ = 1000g.
Qual é a porcentagem de bebês que nascem com peso abaixo de 1500g ?
6.68% dos bebês têm peso inferior
a 1500g.
Qual é a porcentagem de bebês que nascem com peso acima de 4000g ?
[ ] [ ]
4000 3000[ 4000]
1000
1.0 1.0 0.1587
P X P Z
P Z P Z
− > = >
= > = < − =
Qual é a porcentagem debebês que nascem compeso entre 2500 e 3500g ?
38.30% dos bebês
[2500 3500] [ 3500] [ 2500]P X P X P X< < = < − <
3500 3000 2500 3000
1000 1000P Z P Z
− − = < − <
[ ] [ ] 0.5 0.5P Z P Z= < − < −
0.6915 0.3085 0.3830= − =
Qual valor de peso dos bebês separa os 10% mais leves?
0.10
x 3000X
Zz
Achar x tal que P(X < x) = 0.10.
Na tabela Z, tem-se P(Z < -1.28) = 0.1003 ≈≈≈≈ 0.10.
z = (x–3000)/1000 = -1.28 ⇒ x = 3000–1.28(1000) = 1720.
Assim, 1720 gramas é o percentil de ordem 10 dos pesos.
Z0z
Qual valor de peso dos bebês separa os 10% mais pesados?
0.10
x3000Z
z
X
Achar x tal que P(X > x) = 0.10 ⇒ P(X < x) = 0.90.
Na tabela Z, tem-se P(Z < 1.28) ≈≈≈≈ 0.90.
z = (x–3000)/1000 = 1.28 ⇒ x = 3000+1.28(1000) = 4280.
Assim, 4280 gramas é o percentil de ordem 90 dos pesos.
Z0 z
Construa uma Faixa de Referência de 90% para o peso dos bebês.
Queremos um intervalo de valores [ x1 ; x2 ] (simétrico em torno da média 3000) tal que 90% dos bebês tenham peso dentro deste inte rvalo .