métodos computacionais em estatísticabessegato.com.br/ufmg/distribuicoes.pdf2 distribuições de...
TRANSCRIPT
1
Distribuições de Probabilidade
Frases
“Uma probabilidade razoável é a única certeza”Samuel Howe
“A experiência não permite nunca atingir a certeza absoluta. Não devemos procurar obter mais que uma probabilidade .”
Bertrand Russel
Roteiro
1. Distribuições de Probabilidade2. Aproximação da Binomial3. Geração de Números Aleatórios4. Ajuste de Distribuições5. Referências
2
Distribuições de Probabilidade
Funcionalidades
Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições de probabilidade:√ Probabilidade no ponto (distribuição discreta)√ Densidade de probabilidade no ponto (distribuição
contínua)√ Função de distribuição acumulada no ponto√ Quantil correspondente a uma probabilidade
Calc > Probability Distributions è
3
Distribuições Discretas
Minitab:• Binomial• Hipergeométrica• Discreta• Inteira• Poisson
Outras:• Binomial Negativa• Geométrica• Bernoulli
Probabilidade no ponto(s)
Probabilidade acumulada
Quantil referente a uma probabilidade
{ }kXP =
{ }kXP ≤
{ } paXP =≤
Valores de entrada
Distribuições Discretas – Comandos
Distribuição Binomial
• Notação:
• Função de probabilidade:
• Esperança:
• Variância:
),(~ pnbinomialX
np
)1( pnp −
{ } knk pppn
kXP −−
== )1(
4
Distribuição Binomial – Exemplo
Montar tabela com os valores de distribuição binomial com parâmetros n = 30 e p = 0,4
• Para gerar os valores dos pontos (k):
Calc > Make Patterned Data > Simple Set of Numbersè
Valores de k
Binomial – Probabilidades no Ponto
Parâmetros
Valores de entrada
Valores de saída
Binomial – Probabilidades Acumuladas
Parâmetros
Valores de entrada
Valores de saída
5
Binomial (30; 0,4) – Tabelak P(X=k) P(X<=k)0 0,000 0,0001 0,000 0,0002 0,000 0,0003 0,000 0,0004 0,001 0,0025 0,004 0,0066 0,012 0,0177 0,026 0,0448 0,050 0,0949 0,082 0,17610 0,115 0,29111 0,140 0,43112 0,147 0,57813 0,136 0,71514 0,110 0,82515 0,078 0,90316 0,049 0,95217 0,027 0,97918 0,013 0,99219 0,005 0,99720 0,002 0,99921 0,001 1,00022 0,000 1,00023 0,000 1,000
Gráfico da Função de Probabilidade
Graph > Scatter Plot > Single è
Binomial (30; 0,4) – Gráfico Função de Probabilidade
k
P(X
=k)
302520151050
0,16
0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
Função de Probabilidade - Binomial (30, 0,4)
6
Quantis da binomial(30; 0,4) para 0,056; 0,058; 0,060; ... ; 0,0672
• Para gerar os valores das probabilidades
Quantis
Calc > Make Patterned Data > Simple Set of Numbersè
Valores de probabilidade
• Cálculo dos quantis
Parâmetros
Valores de entrada
Valores de saída
Binomial (30; 0,4) – Tabela de Quantisp quantil
0,056 80,058 80,060 80,062 80,064 80,066 80,068 80,070 80,072 80,074 80,076 80,078 80,080 80,082 80,084 80,086 80,088 80,090 80,092 80,094 80,096 90,098 90,100 90,102 9
{ } paXP =≤
7
Distribuições Contínuas
• Qui-quadrado• Normal• F• t de Student• Uniforme
• Beta• Exponencial• Gama• Valor extremo• Lognormal• Logística• Weibull• outras
Probabilidade no ponto(s)
Probabilidade acumulada
Quantil referente a uma probabilidade
{ }kXP =
{ }kXP ≤
{ } paXP =≤
Valores de entrada
Distribuições Discretas – Comandos
Distribuição Normal
• Notação: X ~ N(µ, s 2)
• Função de densidade:
• Esperança: µ
• Variância: s 2
−
−=2
21
exp21
)(σ
µσπ
xxf
8
Cálculo de Probabilidades
• Para valores únicos, são mais fáceis de serem obtidos através da janela Session:√ Editor > Enable Commands
• Para cálculo de densidade:PDF valor do quantil;nome distribuição parâmetro 1 parâmetro 2.
• Para cálculo da função de distribuição acumuladaCDF valor do quantil;nome distribuição parâmetro 1 parâmetro 2.
• Para cálculo de quantil:InvCDF valor da probabilidade;nome distribuição parâmetro 1 parâmetro 2.
Normal Padrão MTB > PDF -1; SUBC> Normal 0,0 1,0. Probability Density Function Normal with mean = 0 and standard deviation = 1 x f( x ) -1 0,241971
MTB > CDF -1; SUBC> Normal 0,0 1,0. Cumulative Distribution Function Normal with mean = 0 and standard deviation = 1 x P( X <= x ) -1 0,158655
MTB > InvCDF 0,05; SUBC> Normal 0,0 1,0. Inverse Cumulative Distribution Function Normal with mean = 0 and standard deviation = 1 P( X <= x ) x 0,05 -1,64485
)1(−f
{ }1−≤XP
{ } 05,0=≤ aXP
X ~ N (100,100)
{ }11090 << XP
{ }95>XP
{ }95<XP
MTB > cdf 95; SUBC> normal 100 10. Cumulative Distribution Function Normal with mean = 100 and standard deviation = 10 x P( X <= x ) 95 0,308538
Cumulative Distribution Function Normal with mean = 100 and standard deviation = 10 x P( X <= x ) 90 0,158655 110 0,841345
= 0,841345 – 0,158655 = 0,682690
= 1 – 0,158655 = 0,841345
9
Gráficos Densidade Normal
• Sobrepor gráficos das funções de densidade N (100, 100), N (100, 25) e N(90, 25).
• Criar coluna das abcissas X:
Calc > Make Patterned Data > Simple Set of Numbersè
Valores de X
• Calcular as probabilidades da coluna N(100,100):Calc > Probability Distributions > Normal è
Parâmetros
Valores de entrada
Valores de saída
• Repetir o procedimento de cálculo de probabilidades para N(100, 25) e N(90, 25).
• Fazer gráfico sobreposto:Graph > Scatterplot > Simple è
10
X
De
nsid
ade
de
Pro
bab
ilid
ad
e
130120110100908070
0,09
0,08
0,07
0,06
0,05
0,04
0,03
0,02
0,01
0,00
VariableN(100, 100)N(100, 25)N(90, 25)
Funções de Densidade Normal
Parâmetro de locação: µParâmetro de escala: s 2
Gráfico Função de Distribuição Acumulada
• Sobrepor gráficos das funções de distribuição acumulada N (100, 100), N (100, 25) e N(90, 25).
• Usar coluna das abcissas X montada para as densidades;
• Calcular as probabilidades acumuladas da coluna Ac N(100,100):Calc > Probability Distributions > Normal è
Parâmetros
Valores de entrada
Valores de saída
11
• Repetir o procedimento de cálculo de probabilidades para Ac N(100, 25) e Ac N(90, 25).
• Fazer gráfico sobreposto:Graph > Scatterplot > Simple è
X
Pro
bab
ilida
de A
cum
ula
da
130120110100908070
1,0
0,8
0,6
0,4
0,2
0,0
VariableAc N(100, 100)Ac N(100, 25)Ac N(90, 25)
Função de Distribuição Acumulada Normal
Distribuição Exponencial
• Notação: X ~ exponencial (?)
• Função de densidade:
• Esperança:
• Variância:
≥
=−
..00
)(cc
xexf
xλλ
λ1
2
1λ
12
Distribuição Exponencial
• Notação: X ~ exponencial (ß)
• Função de densidade:
• Esperança:
• Variância:
≥=−
..0
01
)(cc
xexf
xβ
β
β
2β
Cálculos de Probabilidade
• O parâmetro da exponencial utilizado pelo Minitab é a média da distribuição
• Podem ser obtidos através da janela Session:√ Editor > Enable Commands
• Para cálculo de densidade (ou probabilidade acumulada ou quantil):
PDF(ou CDF ou InvCDF) valor;exponencial média.
MTB > CDF 2; SUBC> exponencial 0,5. Cumulative Distribution Function Exponential with mean = 0,5 x P( X <= x ) 2 0,981684
{ }2>XP
{ }5,02,0 << XP
{ } 50,0=≤ aXP
Cumulative Distribution Function Exponential with mean = 0,5 x P( X <= x ) 0,2 0,329680 0,5 0,632121
MTB > InvCDF 0,5; SUBC> exponencial 0,5. Inverse Cumulative Distribution Function Exponential with mean = 0,5 P( X <= x ) x 0,5 0,346574
= 0,632121 – 0,329680 = 0,302441
= 1 – 0,981684= 0,018316
X ~ exponencial média 0,5
13
Variáveis Discretas – Probabilidade
• No caso de variáveis discretas, o comando PDF fornece a probabilidade em um ponto;
• A função de distribuição acumulada F(x) permite o cálculo de probabilidades em subconjuntos de pontos:
P{a = X = b} = F(b) – F(a)
= P{X =b} – P{ X = a}
MTB > pdf 7; SUBC> binomial 10 0,35. Probability Density Function Binomial with n = 10 and p = 0,35 x P( X = x ) 7 0,0212030
MTB > CDF 7; SUBC> binomial 10 0,35. Cumulative Distribution Function Binomial with n = 10 and p = 0,35 x P( X <= x ) 7 0,995179
Cumulative Distribution Function Binomial with n = 10 and p = 0,35 x P( X <= x ) 3 0,513827 6 0,973976
{ }7=XP
{ }8<XP
{ }74 <≤ XP
X ~ binomial (10; 0,35)
{ }7≤= XP
{ }63 ≤<= XP= 0,513827 –0,973976= 0,460149
Função Gama
• Dada por:
• Se r é inteiro positivo, então:
∫∞ −−=Γ
0
1)( dxexr xr
)!1()( −=Γ rr
14
Exemplo Função Gama
• Pode ser obtidos através da janela Session:√ Editor > Enable Commands
Let K nº = gamma(valor)Print K nº
• Calcular G(2,3)
MTB > Let K1 = gamma(2,3) MTB > print k1 Data Display K1 1,16671
Distribuição de Weibull
• Notação: X ~ Weibull (ß, d)
• Função de densidade:
• Esperança:
• Variância:
• Parâmetro de forma: ß
• Parâmetro de escala: d
≥
=
−−
..0
0)(
1
cc
xex
xf
x β
δβ
δδβ
( )βδ 11+Γ
( ) ( )[ ]{ }2122 11 ββδ +Γ−+Γ
Gráficos Densidade de Weibull
• Sobrepor gráficos das funções de densidade Weibull com parâmetros de forma e de escala iguais a: 1 e 1; 3,4 e 2; 4,5 e 6,2.
• Criar coluna das abcissas X_w:Calc > Make Patterned Data > Simple Set of Numbersè
First value: 0Last value: 15In steps of: 0,1
15
• Calcular as probabilidades das colunas W(1, 1), W(3,4; 2) e W(4,5; 6,2):
Calc > Probability Distributions > Weibull è
Parâmetros
Valores de entrada
Valores de saída
• Fazer gráfico sobreposto:
Graph > Scatterplot > Simple è
Parâmetro de forma: ßParâmetro de escala: d
X_w
De
nsi
dade
de
Pro
ba
bilid
ade
1614121086420
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
VariableW(1; 1)W(3,4; 2)W(4,5; 6,2)
Densidade de W(1; 1), W(3,4; 2) e W(4,5; 6,2)
W(ß, d)
16
Distribuição Gama
• Notação: X ~ Gama (r, ?)
• Função de densidade:
• Esperança:
• Variância:
• Parâmetro de forma: r
• Parâmetro de escala: ?
>Γ=
−−
..0
0)()(
1
cc
xrex
xf
xrr λλ
λr
2λr
Distribuição Gama – Minitab
• Notação: X ~ Gama (r, ß)
• Função de densidade:
• Esperança:
• Variância:
• Parâmetro de forma: r
• Parâmetro de escala: ß
>Γ=
−−
..0
0)()(
1
cc
xr
exxf r
r x
β
β
βr
2βr
Gráficos Densidade Gama
• Sobrepor gráficos das funções de densidade gama com parâmetros de forma e de escala iguais a: 1 e 1; 2 e 0,5; 2 e 1.
• Criar coluna das abcissas X_g:Calc > Make Patterned Data > Simple Set of Numbersè
First value: 0Last value: 6In steps of: 0,1
17
• Calcular as probabilidades das colunas G(1, 1), G(2; 0,5) e G(2; 1):
Calc > Probability Distributions > Weibull è
Parâmetros
Valores de entrada
Valores de saída
• Fazer gráfico sobreposto:
Graph > Scatterplot > Simple è
X_g
De
nsi
dade
de
Pro
ba
bilid
ade
6543210
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
VariableG(1, 1)G(2; 0,5)G(2, 1)
Densidades Gama
Parâmetro de forma: rParâmetro de escala: ß
G(r, ß)
18
Aproximação da Binomial
Aproximação pela Poisson
• Se n ? 8 e p ? 0, com np ? ? então a variável aleatória XB ~ Binomial (n, p) pode ser aproximada por XP ~ Poisson (?), neste caso ? ˜ np.
Exemplo
• Calcule os valores de P{X = x} e P{X = x} para X ~ Binomial (70; 0,01)
• Calcule as mesmas probabilidades usando a Poisson (XP)
• Verifique a aproximação comparando os gráficos das funções de distribuição acumulada das duas variáveis
19
• Gerar coluna das abcissas X_b:
• Calcular as probabilidade binomiais
Calc > Make Patterned Data > Simple Set of Numbersè
First value: 0Last value: 70In steps of: 1
• Calcular as probabilidades Poisson
• Gráficos de distribuição acumulada.
Graph > Scatter Plot > Singleè
20
x_b
Y-D
ata
1086420
1,0
0,9
0,8
0,7
0,6
0,5
Distribuição Acumulada Exata e Aproximada
Abcissas entre 0 e 10
x_b
Y-D
ata
543210
0,5
0,4
0,3
0,2
0,1
0,0
VariableP(X_b=x)P(X_p=x)
Função de Probabilidade Exata e Aproximada
Abcissas entre 0 e 3
• Não é a representação correta da função de distribuição de uma variável discreta
• Se o valor de p se aproxima de , deve-se fazer uma transformação para assegurar a qualidade da aproximação da binomial pela Poisson:XB ~ binomial (n, p)YB ~ binomial (n, 1-p)
• Desta maneira:
P{XB = k} = P{YB = n – k }• Assim pode-se aproximar YB pela Poisson,
com o mesmo procedimento anterior
Exemplo
• Seja XB ~ binomial (70; 0,98)• Calcular as seguintes probabilidades exatas,
comparando-as com sua aproximação pela Poisson
• P{XB = 68}• P{XB =65}• P{65 < XB =68}
21
MTB > cdf 68; SUBC> binomial 70 0,98. Cumulative Distribution Function Binomial with n = 70 and p = 0,98 x P( X <= x ) 68 0,409559
MTB > CDF 65; SUBC> binomial 70 0,98. Cumulative Distribution Function Binomial with n = 70 and p = 0,98 x P( X <= x ) 65 0,0132298
MTB > pdf 68; SUBC> binomial 70 0,98. Probability Density Function Binomial with n = 70 and p = 0,98 x P( X = x ) 68 0,244540
{ }68=BXP
XB ~ binomial (70; 0,98)
{ }65≤BXP
{ }6865 ≤< BXP= 0,409559 –0,0132298= 0,396329
MTB > pdf 2; SUBC> poisson 1,4. Probability Density Function Poisson with mean = 1,4 x P( X = x ) 2 0,241665
Cumulative Distribution Function Poisson with mean = 1,4 x P( X <= x ) 4 0,985747 1 0,591833
{ }68=BXP
YB ~ binomial (70; 0,02) ˜ YP ~ Poisson (1,4)
{ }65≤BXP
{ }6865 ≤< BXP= 0,985747 – 0,591833= 0,393914
{ }6870 −=≈ PYP
{ } }4{15 ≤−=≥≈ PP YPYP
= 1 – 0,985747
= 0,014253
{ } }41{52 ≤<=<≤≈ PP YPYP
Comparação
0,39390,3963P{65 < XB =68}
0,01430,0132P{XB =65}
0,24170,2445P{XB = 68}
Aproximação PoissonExataProbabilidades
22
Aproximação pela Normal
• Há situações em que a variável aleatória XB ~ Binomial (n, p) pode ser aproximada por XN ~ Normal (np, np(1-p)).
• Em geral a aproximação é aceitável quando np = 5 e np(1-p) = 5, sendo melhor quanto maior for o valor de n.
Correção de Continuidade
P{XB = k} ˜ P{ k – 0,5 = XB =k + 0,5}
Cumulative Distribution Function Normal with mean = 50 and standard deviation = 5 x P( X <= x ) 68,5 0,999892 67,5 0,999767 60,5 0,982136
{ }68=BXP
XB ~ binomial (100; 0,5) ˜ XN ~ normal (50,25)
{ }60≤BXP{ }6860 ≤< BXP
= 0,999892 – 0,982136= 0,017756
{ }5,685,67 ≤≤≈ NXP
{ }5,60≤≈ NXP
= 0,999892 – 0,999767
= 0,000053
{ }5,685,60 ≤<≈ NXP
= 0,982136
23
Comparação
0,01780,0175P{60 < XB =68}
0,98210,9824P{XB =60}
0,00000,0001P{XB = 68}
Aproximação PoissonExataProbabilidades
Comparação da Aproximação e Exata
• Criar coluna X_bn de 0 a 100
• Criar coluna X_corr = X_bn +0,5
Calc > Make Patterned Data > Simple Set of Numbersè
First value: 0Last value: 100In steps of: 1
Calc > Calculator è
• Calcular na coluna XB(100; 0,5) as probabilidades acumuladas binomiais (exatas)
• Calcular na coluna XN(50; 25) as probabilidades acumuladas aproximadas pela normal (com correção de continuidade)
24
• Construir gráfico das distribuições acumuladas sobrepostas XB(100, 0,5) e XN(50, 25)
Valores de X
Pro
bab
ilid
ade
Acu
mu
lad
a
6055504540
1,0
0,8
0,6
0,4
0,2
0,0
VariableXB(100,0,5) * X_bXN(50,25) * X_co
Distribuição Acumulada de XB(100,0,5) e XN(50,25)
Abcissas entre 40 e 60
Comparação entre Aproximações (1)
• Distribuição exata: XB ~ (70; 0,01)√ Aproximação normal: coluna XN(50; 25)√ Aproximação de Poisson: calculada a coluna
YP(50) para uma variável YP ~ Poisson(50)
• Comparação gráfica entre as 3 distribuições
X-Data
Y-D
ata
1086420
1,0
0,8
0,6
0,4
0,2
0,0
VariableP(X_b<=k) * x_bP(X_p<=x) * x_bXN(7;0,693) * x_b
Aproximação Poisson e Normal de Binomial (70, 0,01)
Abcissas entre 0 e 10
25
Comparação entre Aproximações (2)
• Distribuição exata: XB ~ (100; 0,5)√ Aproximação normal: coluna XN(50; 25)√ Aproximação de Poisson: calculada a coluna
YP(50) para uma variável YP ~ Poisson(50)
• Comparação gráfica entre as 3 distribuições
Abcissas entre 30 e 70
X-Data
Y-D
ata
7060504030
1,0
0,8
0,6
0,4
0,2
0,0
VariableXB(100; 0,5) * x_bXP(50) * x_bnXN(50,25) * x_cor
Aproximações Normal e Poisson da Binomial (100, 0,5)
Aproximações – Comentários
Mantidas as condições de qualidade de cada aproximação, temos:
• A aproximação de Poisson é melhor que a aproximação normal para valores de p nas proximidades de 0 e 1.
• A aproximação Normal é melhor que a aproximação de Poisson para valores intermediários de p.
26
Geração de Números Aleatórios
Gerador de Números Aleatórios
• São usados para simular modelos, estudar estimadores, etc.
• O Minitab executa sua geração de acordo a várias distribuições de probabilidade:
Discretas• Binomial• Hipergeométrica• Discreta• Poisson• outras
Contínuas• Uniforme• Normal• Exponencial• Lognormal• outras
Calc > Random Data è
27
Exemplo 1 – Geração de Normais
• Gerar 2 amostras de uma N(86,6; 4,62) de tamanho 29 e armazenar nas colunas N1 e N2√ Calcular a média e o desvio padrão amostral√ Construir o histograma das amostras em painéis
separados√ Comparar os histogramas com a função de
densidade exata
Geração de Amostras Normais
Calc > Random Data è
Os resultados serão exclusivos a cada procedimento
Média e Desvio Padrão Amostrais
MTB > Describe 'N1' 'N2'; SUBC> Mean; SUBC> StDeviation. Descriptive Statistics: N1; N2 Variable Mean StDev N1 86,869 4,235 N2 86,160 4,783
Valores exatos:Média: 86,6Desvio padrão: 4,6
28
Construção HistogramasD
ensi
da
de
de
Pro
ba
bili
da
de
0,08
0,06
0,04
0,02
0,00
9996939087848178
0,08
0,06
0,04
0,02
0,00
N1
N2
Histogramas de N1 e N2
Usar densidade no eixo Y
Edit Panels > Arrangement >Rows: 2/ Columns: 1
Comparação com Distribuição Exata
Add > Distribution Fit è
• Clicando com o botão direito do mouse no gráfico:
29
De
nsi
da
de
de
Pro
ba
bili
da
de
0,08
0,06
0,04
0,02
0,00
9996939087848178
0,08
0,06
0,04
0,02
0,00
N1
N2
Normal Histogramas de N1 e N2
Exemplo 2 – Geração de Exponenciais
• Gerar 3 amostras de tamanho 34 de uma exponencial com média 128 e armazenar nas colunas E1, E2 e E3.√ Calcular a média e o desvio padrão amostral√ Construir o histograma das amostras em painéis
separados√ Comparar os histogramas com a função de
densidade exata
Geração de Amostras Exponenciais
• Repetir os procedimentos de geração de números aleatórios para amostra exponencial
30
Média e Desvio Padrão Amostrais
Valores exatos:Média: 128Desvio padrão: 128
MTB > describe 'E1'-'E3'; SUBC> mean; SUBC> StDev. Descriptive Statistics: E1; E2; E3 Variable Mean StDev E1 116,3 137,0 E2 119,4 121,4 E3 124,1 134,4
De
nsi
ty
560480400320240160800
0,0048
0,0036
0,0024
0,0012
0,0000
560480400320240160800
0,0048
0,0036
0,0024
0,0012
0,0000
E1 E2
E3
Histogramas de E1, E2 e E3
Usar densidade no eixo Y
Comparação com Distribuição Exata
Add > Distribution Fit è
• Clicando com o botão direito do mouse no gráfico:
31
De
nsi
ty560480400320240160800
0,008
0,006
0,004
0,002
0,000
560480400320240160800
0,008
0,006
0,004
0,002
0,000
E1 E2
E3
Exponential Histogramas de E1, E2 e E3
Exemplo 3 – Geração de Weibull
• Gerar 2 amostras de tamanho 43 de uma Weibull com parâmetro de forma 2,3 e parâmetro de escala 148 e armazenar nas colunas W1 e W2.√ Calcular a média e o desvio padrão amostral√ Construir o histograma das amostras em painéis
separados√ Comparar os histogramas com a função de
densidade exata
Geração de Amostras Exponenciais
• Repetir os procedimentos de geração de números aleatórios para amostra exponencial
32
Média e Desvio Padrão Amostrais
Valores exatos:
MTB > describe 'W1' 'W2'; SUBC> mean; SUBC> StDev. Descriptive Statistics: W1; W2 Variable Mean StDev W1 134,88 63,81 W2 144,47 56,17
MTB > let k1 = 2,3 MTB > let k2 = 148 MTB > let k3 = k2*gamma(1+1/k1) MTB > print k3 Data Display K3 131,115
Média
Desvio padrão
MTB > let k4=k2**2*(gamma(1+2/k1)-(gamma(1+1/k1))**2) MTB > let k5 = sqrt(k4) MTB > print k5 Data Display K5 60,4552
Usar densidade no eixo Y
De
nsit
y
0,008
0,006
0,004
0,002
0,000
240180120600
0,008
0,006
0,004
0,002
0,000
W1
W2
Histogramas de W1 e W2
Edit Panels > Arrangement >Rows: 2/ Columns: 1
Comparação com Distribuição Exata
Add > Distribution Fit è
• Clicando com o botão direito do mouse no gráfico:
33
De
nsi
ty
0,008
0,006
0,004
0,002
0,000
240180120600
0,008
0,006
0,004
0,002
0,000
W1
W2
Weibull Histogramas de W1 e W2
Ajuste de Distribuições
Verificação de Normalidade
• Muitos procedimentos estatístico adotam a hipótese de normalidade dos dados
• Assim, é freqüente a necessidade de verificação de normalidade dos dados
• No Minitab, uma das maneiras de verificar a adequação do modelo (normal e outros) éatravés do Probability Plot
34
• Teste de normalidade da coluna N1:
Graph > Probability Plot > Single è
• Se os pontos estiverem próximos à reta, háindicação de normalidade
• Os outliers aparecem como pontos distantes do padrão geral
N1
Pe
rce
nt
1009590858075
99
95
90
80
70
60504030
20
10
5
1
Mean
0,959
86,87StDev 4,235N 29AD 0,149P-Value
Probability Plot of N1Normal - 95% CI Parâmetros estimados
Estatísticade teste
P-valor p/ o teste:H0: dados normaisH1: Dados não-normais
• Repetição do procedimento para coluna E1:
E1
Perc
ent
6004002000-200-400
99
95
90
80
70
60504030
20
10
5
1
Mean
<0,005
116,3StDev 137,0N 34AD 2,879P-Value
Probability Plot of E1Normal - 95% CI Parâmetros estimados
P-valor p/ o teste:H0: dados normaisH1: Dados não-normais
H0 Rejeitada
• Pontos afastam-se da reta• Teste rejeita a hipótese de normalidade
35
Exemplo 4 – Ajuste de Modelo
• Repetir o teste de normalidade para as colunas E2, E3, W1 e W2Graph > Probability Plot > Single è
• O histograma de W2 apresenta uma maior simetria comparado com o de W1
Pe
rce
nt
4002000-200
99
90
50
10
16004002000-200
99
90
50
10
1
3002001000-100
99
90
50
10
13002001000
99
90
50
10
1
E2 E3
W1 W2
E2
P-Value <0,005
E3Mean 124,1StDev 134,4N 34AD
Mean
2,014P-Value <0,005
W1Mean 134,9StDev 63,81N 43
119,4
AD 1,281P-Value <0,005
W2Mean 144,5StDev 56,17N
StDev
43AD 0,543P-Value 0,154
121,4N 34AD 2,130
Probability Plot of E2; E3; W1; W2Normal - 95% CI
H0 Rejeitada
Sem evidência pra rejeitar H0
• Verificar o ajuste à exponencial das colunas E1, E2 e E3Graph > Probability Plot > Single è
36
• Apesar de haver pontos fora da banda de confiança do gráfico, as estatísticas de teste não permitem rejeitar a hipótese de modelo exponencial
Pe
rce
nt
1000100101
90
50
10
11000,00100,0010,001,000,100,01
90
50
10
1
1000100101
90
50
10
1
E1 E2
E3
E1
E2Mean 119,4N 34AD 1,253P-Value 0,057
E3
Mean
Mean 124,1N 34AD 0,935P-Value 0,136
116,3N 34AD 0,621P-Value 0,341
Probability Plot of E1; E2; E3Exponential - 95% CI
Não há evidências para rejeitar H0
H0: modelo exponencialH1: outro modelo
• Verificar o ajuste ao modelo Weibull das colunas W1 e W2Graph > Probability Plot > Single è
Pe
rce
nt
100010010
99
90807060504030
20
10
5
3
2
1
100010010
99
90807060504030
20
10
5
3
2
1
W1 W2 W1
P-Value <0,010
W2Shape 2,786Scale 161,1N 43AD
Shape
0,678P-Value 0,074
2,263Scale 151,8N 43AD 1,521
Probability Plot of W1; W2Weibull - 95% CI
• No caso de W1, a quantidade de pontos fora da banda de confiança do gráfico, pode ter influenciado a estatística de teste a rejeitar a hipótese de modelo Weibull.
Não há evidências para rejeitar H0
H0: modelo WeibullH1: outro modelo
Há evidências para rejeitar H0
37
Exemplo 5 – Amostra Binomial
• Gere 3 amostras de tamanho 25 de uma distribuição binomial com parâmetros n = 70 e p = 0,4 e as armazene nas colunas B1, B2 e B3
• Verifique a normalidade dos elementos padronizados de cada amostra
• Geração das amostras binomiais
Calc > Random Data > Binomial è
Padronização
• No caso da binomial a padronização exata édada por:
• No exemplo a média e o desvio padrão são:
)1( pnpnpx
z ii −
−=
MTB > let k1 = 70*0,4 MTB > let k2 = sqrt(70*0,4*0,60) MTB > print k1 k2 Data Display K1 28,0000 K2 4,09878
38
• No Minitab, a padronização é obtida por:Calc > Standardize è
Média Desvio padrão
• Gráfico de probabilidade normal para as colunas Bp1, Bp2 e Bp3
Graph > Probability Plot > Single è
• Há evidências de que os dados padronizados são normais.
• Os pontos do gráfico encontram-se dentro da região de confiança
Não há evidências para rejeitar H0
H0: Normalidade dadosH1: outro modelo
Pe
rce
nt
420-2-4
99
90
50
10
1420-2
99
90
50
10
1
420-2-4
99
90
50
10
1
Bp1 Bp2
Bp3
Bp1
P-Value 0,154
Bp2Mean 0,3123StDev 1,065N 25AD
Mean
0,492P-Value 0,199
Bp3Mean 0,02928StDev 1,237N 25
0,4001
AD 0,235P-Value 0,768
StDev 1,271N 25AD 0,535
Probability Plot of Bp1; Bp2; Bp3Normal - 95% CI
39
Referências
Bibliografia Recomendada
• Bussab, W. O. e Morettin, P. A. (Saraiva)Estatística básica
• Montgomery, D. C. e Runger, G. C. (LTC) Estatística aplicada e probabilidade para engenheiros