ea-01 introdução à avaliação operacionalhelcio/ge-814 revisao de estatistica.pdf ·...
TRANSCRIPT
Mentiras, mentiras
deslavadas … e estatísticas
O título acima é uma
referência a uma
frase comumente
atribuída a um ex
primeiro-ministro
britânico chamado
Benjamin Disraeli.
.
Mentiras estatísticas
33% do acidentes de trânsito
envolvem pessoas embriagadas.
Portanto 67% estão completamente
sóbrias, a conclusão é que devemos
dirigir totalmente bêbados.
Mentiras estatísticas
Surpreendente! Finalmente a solução para os seus problemas capilares: de todos os compradores do tónico capilar JUBA DE LEÃO, apenas 3% ficaram insatisfeitos e pediram o reembolso do dinheiro.
Objetivo
Que a audiência revise os principais
tópicos de estatística concernentes à
Avaliação Operacional
8/47
Definições
Um experimento é qualquer processo que permite ao pesquisador fazer observações
Um evento é uma coleção de resultados de um experimento
O espaço amostral de um experimento consiste de todos os eventos possíveis
9/47
Exemplo
experimento: lançamento de dois dados
evento: soma dos valores é par
espaço amostral:
S = { (1,1), (1,3), (1,5), (2,2), (2,4), (2,6), (3,1), (3,3), (3,5), (4,2), (4,4), (4,6), (5,1), (5,3), (5,5), (6,2), (6,4), (6,6) }
10/47
Definição clássica
Suponha que um experimento tenha n eventos
simples diferentes, cada um dos quais com a
mesma chance de ocorrer. Se o evento A pode
ocorrer em s dentre as n maneiras, então:
P(A) = = nº de maneiras como A pode ocorrer s
nº de eventos simples n
11/47
Aproximação da probabilidade
pela freqüência relativa
Realize (ou observe) um experimento um grande número de vezes e conte quantas vezes o evento A ocorre efetivamente. Então P(A) é estimada como segue:
P(A) = nº de ocorrências de A
nº de repetições do experimento
12/47
Lei dos grandes números
Se se repete um experimento um
grande número de vezes a
probabilidade pela freqüência relativa de
um evento tende para a probabilidade
teórica.
Estatística
A Estatística é uma coleção de métodos
para planejar experimentos, obter dados
e organizá-los, resumi-los, analisá-los,
interpretá-los e deles extrair conclusões.
Um aspecto importante da Estatística é
sua aplicabilidade óbvia a situações
reais e relevantes.
Problemas da AVAOP
relacionados com estatística O sistema novo é significativamente melhor
que o velho?
Quais sistemas competidores são significativamente melhores que os demais?
O teste foi bom? Existiu tendência nos dados?
Houve muita variabilidade nos dados?
Os dados foram suficientes?
Quão seguro você está nas suas conclusões sobre os dados?
Descritiva x Inferência
Estatística Descritiva: são os métodos que envolvem a coleta, a apresentação e caracterização de um conjunto de dados de modo a descrever apropriadamente as várias características deste conjunto.
Inferência Estatística ou Estimação: são métodos que tornam possível a estimativa de uma característica de uma população ou a tomada de uma decisão referente à população com base somente em resultados amostrais.
Definições
POPULAÇÃO (UNIVERSO) - é uma coleção completa de todos os elementos (valores, pessoas, medidas etc.) a serem estudados.
CENSO – é uma coleção de dados relativos a todos os elementos da população.
AMOSTRA – é uma subcoleção de elementos extraídos da população.
PARÂMETRO – é uma medida numérica que descreve uma característica da população.
ESTATÍSTICA – uma medida numérica que descreve uma característica de uma amostra.
Medidas de Tendência Central Média aritmética
valor obtido somando-se todos eles e dividindo-se o total pelo número de valores. Essa medida particular de tendência central será utilizada freqüentemente designada simplesmente como média.
Mediana valor do meio desse conjunto, quando os valores estão dispostos em
ordem crescente (ou decrescente). A mediana é representada geralmente por x.
Moda valor que ocorre com maior freqüência. Quando dois valores ocorrem
com a mesma freqüência máxima, cada um deles é uma moda, e o conjunto de diz bimodal. Se mais de dois valores ocorrem com a mesma freqüência máxima, cada um deles é uma moda e o conjunto é multimodal. Costuma-se denotar a moda por M.
Ponto médio valor que está a meio caminho entre o maior valor e o menor valor.
Para obtê-lo, somamos esses valores extremos e dividimos o resultado por 2.
~
Distribuição Normal
A distribuição normal ocorre naturalmente:
Altura das pessoas
Peso das pessoas
Performance de atiradores
Miss distances
Através de amostragem de qualquer outra
distribuição!
Notações
s denota o desvio-padrão (SD) de
um conjunto de dados amostrais
denota o desvio-padrão de um
conjunto de dados populacionais
s2 é a variância (Var) de um conjunto
de dados amostrais
2 é a variância de um conjunto de
dados populacionais
Desvio-Padrão
Desvio-padrão de um conjunto de dados
populacionais
Desvio-padrão de uma amostra
2( )x
N
222( )
1 ( 1)
in x xx x
sn n n
Teorema do Limite Central
Se uma variável randômica X tem uma
média populacional µ e um desvio padrão
σ, então a distribuição das médias das
amostras tende a ser normalmente
distribuída com média µ e um desvio
padrão , quando n se torna grande.
INDEPENDENTEMENTE DA
DISTRIBUIÇÃO DA POPULAÇÃO
n
9990 números
aleatórios entre 10
e 15 divididos em
333 grupos de 30
Exemplo do TLC
Histogram (Spreadsheet1 10v*9990c)
9,5 10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 14,0 14,5 15,0 15,5
Var2
0
200
400
600
800
1000
1200
No
of
ob
s
Histograma dos 9990 números
Exemplo do TLC
Histogram (Design: 1 factors, 1 Blocks, 5000 Runs (Spreadsheet1) 6v*168c)
Var2 = 168*0,1186*normal(x; 12,4827; 0,267)
11,8439
11,9626
12,0812
12,1998
12,3185
12,4371
12,5558
12,6744
12,7930
12,9117
13,0303
13,1490
Var2
0
5
10
15
20
25
30
35
No
of
ob
s
Histogram (Spreadsheet1 10v*9990c)
9,5 10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 14,0 14,5 15,0 15,5
Var2
0
200
400
600
800
1000
1200
No
of
ob
s
Histograma das médias dos 333 grupos de 30 números
Outras distribuições
t de Student
n< 30
Aproxima distribuição normal com n próximo de
30. Usada para garantia da performance e testes
de comparações quando n é pequeno.
F
Razão entre duas variâncias. Usada pela ANOVA
Binomial
Usada em testes seqüenciais e confiabilidade
Distribuição Normal
2 testes de normalidade
Histograma
Medida de percentil cumulativo (gráfico de
probabilidade normal)
Objetivo
Que a audiência revise os principais
tópicos de estatística concernentes à
Avaliação Operacional