engenharia de produção É o grau de associação entre ... · prof. lorí viali, dr. – pucrs...
TRANSCRIPT
11
Engenharia de Produção
Prof. Lorí Viali, [email protected]
http://www.pucrs.br/famat/viali/Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
É o grau de associação entre duas ou mais variáveis. Pode ser:
correlacional
ou
experimental.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Numa relação experimental os valores de uma das variáveis são controlados.
No relacionamento correlacional, por outro lado, não se tem nenhum controle sobre as variáveis sendo estudadas.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Um engenheiro químico está
investigando o efeito da temperatura
de operação do processo no rendimento do produto. O estudo
resultou nos dados da tabela
seguinte:Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
85851801808989190190
78781701707474160160707015015066661401406161130130545412012051511101104545100100
Rendimento (Y)Temperatura, C0 (X)
22
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O primeiro passo para
determinar se existe relacionamento
entre as duas variáveis é obter o diagrama de dispersão (scatter
diagram).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
0
25
50
75
100
100 120 140 160 180 200
Temperatura (X)
Rendimento (Y)
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O diagrama de dispersão
fornece uma idéia do tipo de
relacionamento entre as duas variáveis. Neste caso, percebe-se que
existe um relacionamento linear.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Quando o relacionamento
entre duas variáveis
quantitativas for do tipo linear,
ele pode ser medido através do:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Observado um relacionamento
linear entre as duas variáveis é possível
determinar a intensidade deste
relacionamento. O coeficiente que mede
este relacionamento é denominado de
Coeficiente de Correlação (linear).
33
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Quando se está trabalhando com
amostras o coeficiente de correlação é
indicado pela letra “r” e é uma estimativa do coeficiente de correlação
populacional que é representado por
“ρ” (rho). Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Para determinar o coeficiente de
correlação (grau de relacionamento
linear entre duas variáveis) vamos determinar inicialmente a variação
conjunta entre elas, isto é, a
covariância. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A covariância entre duas
variáveis X e Y, é representada
por “Cov(X; Y)” e calculada por:
1n)YY)(XX(
)Y,X(Cov ii−
∑ −−=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Mas
∑ −=
=+∑ −−=
=∑+∑ ∑−∑−=
=∑+∑ ∑−∑−=
=+∑ −−=
=∑ −−
YXnYX
YXnYXnYXnYX
YXXYYXYX
YXYXYXYX
]YXYXYXYX[
)YY)(XX(
ii
ii
iiii
iiii
iiii
ii
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Então:
1nYXnYX
1n)YY)(XX(
)Y,X(Cov
ii
ii
−∑ −
=
=−
∑ −−=
44
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A covariância poderia ser utilizada
para medir o grau e o sinal do
relacionamento entre as duas variáveis,
mas ela é difícil de interpretar por variar
de -∞ a +∞. Assim vamos utilizar o coeficiente de correlação linear de
Pearson.Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O coeficiente de correlação
linear (de Pearson) é definido por:
SS)Y,X(Cov
rYX
=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Onde:
1nYnY
S
1nXnX
S
1nYXnYX )Y,X(Cov
22i
Y
22i
X
ii
−∑ −
=
−∑ −
=
−∑ −
=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Esta expressão não é muito
prática para calcular manualmente o coeficiente de correlação. Pode-se obter
uma expressão mais conveniente para
o cálculo manual e o cálculo de outras medidas necessárias mais tarde.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Tem-se:
( )( )∑ −∑ −
∑ −=
=
−∑ −
−∑ −
−∑ −
=
==
YnYXnX
YXnYX
1nYnY
1nXnX
1nYXnYX
SS)Y,X(Cov
r
22i
22i
ii
22i
22i
ii
YX
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Fazendo:
S.SS
r :seTem
YnYS
XnXS
YXnYXS
YYXX
XY
22iYY
22iXX
iiXY
=−
∑ −=
∑ −=
∑ −=FFaazzeennddoo
55
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A vantagem do coeficiente de
correlação (de Pearson) é ser
adimensional e variar de – 1 a + 1,
que o torna de fácil interpretação.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Assim se r = -1, temos uma
relacionamento linear negativo
perfeito, isto é, os pontos estão todos alinhados e quando X aumenta Y
decresce e vice-versa.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
0
10
20
30
40
50
10 15 20 25 30
1r −=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Se r = +1, temos uma
relacionamento linear positivo
perfeito, isto é, os pontos estão todos alinhados e quando X aumenta Y
também aumenta.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
0
10
20
30
40
50
10 15 20 25 30
1r +=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Assim se r = 0, temos uma
ausência de relacionamento linear,
isto é, os pontos não mostram “alinhamento”.
66
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
0r =
0
10
20
30
40
50
10 15 20 25 30
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Assim se –1 < r < 0, temos uma relacionamento linear negativo, isto é,
os pontos estão mais ou menos
alinhados e quando X aumenta Y decresce e vice-versa.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
0r1 <<−
0
10
20
30
40
50
10 15 20 25 30
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Assim se 0 < r < 1, temos uma
relacionamento linear positivo, isto é, os pontos estão mais ou menos
alinhados e quando X aumenta Y
também aumenta.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
0
10
20
30
40
50
10 15 20 25 30
1r0 <<
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Uma correlação amostral não significa necessariamente uma correlação populacional e vice-versa. É necessário testar o coeficiente de correlação para verificar se a correlação amostral étambém populacional.
77
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Observada uma amostra de seis pares, pode-se perceber que a correlação équase um, isto é, r ≅ 1. No entanto, observe o que ocorre quando mais pontos são acrescentados, isto é, quando se observa a população!
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
0
10
20
30
40
50
10 15 20 25 30
r ≅ 1
ρ ≅ 0
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Determinar o “grau de
relacionamento linear” entre as
variáveis X = temperatura de operação do processo versus Y =
rendimento do produto, conforme
tabela.
7921361001691089190673
857874706661545145Y
101570
1530013260118401050092407930648056104500XY
218500
324002890025600225001960016900144001210010000
X2
7225180
472251450
60841705476160490015043561403721130291612026011102025100Y2X
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Vamos calcular “r”
utilizando a expressão em destaque vista anteriormente,
isto é, através das quantidades, SxY, SXX e SYY.
88
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Tem-se:
47225Y 218500X
101570 XY 67,3Y 145X
673 Y 1450X 10n
22 =∑=∑
∑ ===
∑ =∑ ==
Então:
3985
3,67.145.10101570
YXnYXS iiXY
=
=−=
=∑ −=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
8250
145.10218500
XnXS
2
22iXX
=
=−=
=∑ −=
10,1932
3,67.1047225
YnYS
2
22iYY
=
=−=
=∑ −=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
9981,0
10,1932.82503985
S.SS
r YYXX
XY
=
==
==
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Apesar de “r” ser um
valor adimensional, ele não éuma taxa. Assim o resultado
não deve ser expresso em percentagem.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O valor de “r” é obtido
com base em uma amostra. Ele éportanto, uma estimativa do
verdadeiro valor da correlação
populacional (ρ).
99
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A teoria dos testes de
hipóteses pode ser utilizada para
verificar se com base na estimativa “r” é possível concluir se existe ou
não correlação populacional, isto é,
desejamos testar :Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
H0: ρ = 0
H1: ρ > 0(teste unilateral/unicaudal à direita)
ρ < 0
(teste unilateral/unicaudal à esquerda)
ρ ≠ 0
(teste bilateral/bicaudal) .
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O teste para a existência de correlação linear entre duas variáveis érealizado por:
r12n
r
2nr1
0rˆ
rt
2
2r
r2n
−−
=
=
−−
−=
σ
µ−=−
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
tn-2 > tc(teste unilateral/unicaudal à direita)
tn-2 < tc
(teste unilateral/unicaudal à esquerda)
|tn-2| > tc
(teste bilateral/bicaudal) .
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
P(t < tc ) = 1− α(teste unilateral/unicaudal à direita)
P(t < tc ) = α(teste unilateral/unicaudal à esquerda)
P(t < tc ) = α/2 ou P(t > tc ) = α/2
(teste bilateral/bicaudal) .
Onde Onde ttcc éé tal que:tal que:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
1010
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Suponha que uma amostra de n = 12, alunos forneceu um coeficiente de correlação amostral de r = 0,66, entre X = “nota em cálculo” e Y = “nota em Probabilidade e Estatística”. Verifique se é possível afirmar que uma nota boa em Cálculo está relacionada com uma nota boa em Probabilidade e Estatística a 1% de significância.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Trata-se de um teste unilateral àdireita para o coeficiente de correlação.
Hipóteses:H0: ρ = 0H1: ρ > 0
Dados:n = 12r = 0 ,66α = 1%
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Então:Então:
778,20661
21266,0
r12n
rt 2210 =−
−=
−−
=
A variA variáável teste vel teste éé: :
r12n
rt 22n −−
=−
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O valor crO valor críítico tico ttcc éé tal que: P(T > tal que: P(T > ttcc)) = 1- αEntão tc = 2,764. Assim RC = [2,764; ∞)
DECISÃO e CONCLUSÃO:DECISÃO e CONCLUSÃO:Como tComo t1010 = 2,778 = 2,778 ∈∈ RC ou RC ou
2,778 > 2,764, Rejeito H2,778 > 2,764, Rejeito H00, isto , isto éé, a 1% de , a 1% de significância, podesignificância, pode--se afirmar que a nota se afirmar que a nota de Cde Cáálculo estlculo estáá relacionada com a de relacionada com a de Probabilidade e EstatProbabilidade e Estatíística.stica.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Região de Não RejeiRegião de Não Rejeiççãoão
778,2
%1=α
);764,2[RC +∞=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
OPOPÇÇÃO:ÃO:
Trabalhar com a significância do resultado obtido (2,778), isto é, o valor-p. Para isto, deve-se calcular P(T10 > 2,778). Utilizando o Excel, tem-se:
1111
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Como a significância do resultado Como a significância do resultado ((0,98%0,98%) ) éé menormenor que a significância do teste que a significância do teste ((1%1%) ) éé posspossíível rejeitar a hipvel rejeitar a hipóótese nula.tese nula.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O procedimento realizado para testar o coeficiente de correlação só é válido para testar a hipótese nula de que não existe correlação, isto é, ρ = 0. Outros tipos de testes só podem ser realizados através da transformada “zeta” de Fisher.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A transformada “ζ” é dada por:
⎟⎠⎞
⎜⎝⎛
−+
=ζr1r1
ln21
O que equivale a considerar “r”
como a tangente hiperbólica de “ζ”
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A vantagem desta transformação é que os valores de “ζ” estão distribuídos aproximadamente de acordo com uma normal de média:
⎟⎟⎠
⎞⎜⎜⎝
⎛ρ−ρ+
=µζ 11
ln21
E desvio:3n
1−
=σζ
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Esta transformação permite,
realizar, testes de hipóteses e
construir intervalos de confiança para o coeficiente de correlação,
através de ζ e da distribuição normal.
1212
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
H0: ρ = ρ0
H1: ρ > ρ0
(teste unilateral/unicaudal à direita)
ρ < ρ0
(teste unilateral/unicaudal à esquerda)
ρ ≠ ρ0
(teste bilateral/bicaudal) .
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O teste para a existência de correlação linear populacional entre duas variáveis X e Y é realizado por:
3n1
11
ln21
z
−
⎟⎟⎠
⎞⎜⎜⎝
⎛ρ−ρ+
−ζ=
σ
µ−ζ=
ζ
ζ
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
z > zc(teste unilateral/unicaudal à direita)
z < zc
(teste unilateral/unicaudal à esquerda)
|z| > zc
(teste bilateral/bicaudal) . Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Φ(zc ) = 1− α(teste unilateral/unicaudal à direita)
Φ(zc ) = α(teste unilateral/unicaudal à esquerda)
Φ(zc ) = α/2 ou Φ(zc ) = 1− α/2 (teste bilateral/bicaudal) .
Onde zc é tal que:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Suponha que uma amostra de n = 35, alunos forneceu um coeficiente de correlação amostral de r = 0,75, entre X = “número de horas de estudo” e Y = “nota em Probabilidade e Estatística”. Verifique se é possível afirmar que o “o número de horas de estudo” apresenta uma correlação de pelo menos 0,5 na população com a “nota em Probabilidade e Estatística”, a 1% de significância.
1313
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Trata-se de um teste unilateral àdireita para o coeficiente de correlação.
Hipóteses:H0: ρ = 0,5H1: ρ > 0,5
Dados:n = 35r = 0 ,75α = 1%
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Então:Então:
9730,075,0175,01ln
21 =⎟
⎠
⎞⎜⎝
⎛−+=ζ
A variA variáável teste vel teste éé: :
3n1
11
ln21
z
−
⎟⎟⎠
⎞⎜⎜⎝
⎛ρ−ρ+
−ζ=
σ
µ−ζ=
ζ
ζ
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
E o desvio padrão vale:E o desvio padrão vale:
A mA méédia vale: dia vale:
5493,05,015,01
ln21
11
ln21
=⎟⎠
⎞⎜⎝
⎛−+
=⎟⎟⎠
⎞⎜⎜⎝
⎛ρ−ρ+
=µζ
1768,0321
3351
3n1
==−
=−
=σζ
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Padronizando, temPadronizando, tem--se: se:
40,21768,0
5493,09730,0
3n1
11
ln21
z
=−
=
=
−
⎟⎟⎠
⎞⎜⎜⎝
⎛ρ−ρ+
−ζ=
σ
µ−ζ=
ζ
ζ
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O valor crítico zc é tal que:
P(Z > zc) = α = 1%.Ou Φ(zc) = 99%. Então zc = 2,33.
Assim RC = [2,33; ∞)
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
DECISÃO e CONCLUSÃO:Como z = 2,40 ∈ RC ou
2,40 > 2,33, Rejeito H0, isto é, a 1% de significância, pode-se afirmar que “o número de horas de estudo”apresenta pelo menos 0,50 de correlação com a “nota em Probabilidade e Estatística”.
1414
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Região de Não RejeiRegião de Não Rejeiççãoão
40,2
%1=α
);33,2[RC +∞=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
OPOPÇÇÃO:ÃO:
Trabalhar com a significância do
resultado obtido (2,40), isto é, o valor-
p. Para isto, deve-se calcular
P(Z > 2,40), isto é, Φ(-2,40) = 0,82%.
Como p = 0,82% < α = 1%. Rejeito H0.