estatÍstica ii. inferÊncia: população e amostra como selecionar uma amostra amostragem...
Post on 22-Apr-2015
180 Views
Preview:
TRANSCRIPT
ESTATÍSTICA IIESTATÍSTICA II
• INFERÊNCIA: população e amostra como selecionar uma amostra amostragem aleatória simples distribuições amostrais: da média da proporção do n. de ocorrência ESTIMAÇÃO: Intervalo de Confiança
TESTE DE HIPÓTESE: da média da proporção
INFERÊNCIA ESTATÍSTICA
• Operação que consiste em, tomando por base amostras estatísticas, efetuar generalizações.
• Fazer afirmações sobre características de uma população, baseando-se em resultados de uma amostra
PRINCIPAIS TIPOS DE PESQUISAS: • CENSOS• Coletam informações sobre TODAS as unidades da
população.• PESQUISAS AMOSTRAIS• Coletam informações sobre uma PARTE
(AMOSTRA) da população.• ↓• Inferência
• Inferência estatística ; incerteza sempre presente. Se o experimento foi feito de acordo com certos princípios, essa incerteza pode ser medida.
• Uma função da estatística é fornecer um
conjunto de técnicas para fazer inferências e medir o grau de incerteza destas inferências.
• A incerteza é medida em termos de
probabilidades!
AMOSTRA – O CONCEITO• . . . Fatos no cotidiano:• -Você não precisa comer o bolo todo para saber se
está gostoso• O cozinheiro verifica o tempero de um prato que
está reparando;• Testar temperatura de um prato de sopa;• Médico detecta as condições de um paciente
através de exames de sangue, etc.
• TEORIA DA AMOSTRAGEM
Determina a relação entre a amostra e a população
São consideradas duas dimensões:
Tamanho e Composição da amostra
EstatEstatíística IIstica II
COMO OBTER GRANDEZAS DESCONHECIDAS?• A partir da análise de dados • Média; Variância; Etc.
COMO DIZER SE AS DIFERENÇAS AMOSTRAIS SÃO CASUAIS OU VERDADEIRAS?
• Testes de significância• Testes de Hipóteses
COMO OBTER AS RESPOSTAS: • A partir da estatística amostral ou Inferência
EstatEstatíística IIstica II
a) Métodos Probabilísticos – Exige que cada elemento da população possua
determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade.
– Somente com base em amostragens probabilísticas é que se podem realizar inferências ou induções sobre população a partir do conhecimento da amostra.
ComposiComposiçção da Amostraão da Amostra
Aleatória Simples
Sistemática
Estratificada
Conglomerados ou Agrupamento
Tipos de AmostragemTipos de Amostragem
AMOSTRAGEM ALEATÓRIA SIMPLES• É um tipo de amostragem que utiliza uma técnica
probabilística. • A característica principal é que todos os elementos da
população têm igual probabilidade de pertencer á amostra.
• Na prática a amostragem aleatória simples pode ser realizada numerando-se a população de 1 a N e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quais corresponderão aos elementos pertencentes a amostra.
Exemplo:• Vamos obter uma amostra representativa, de 10 %
dos valores, para obtermos a estatura média de noventa alunos de uma escola:
• - Numeramos os alunos de 01 a 90• - Escrevemos os números, de 01 a 90, em
pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, nove números que formarão a amostra.
AMOSTRAGEM SISTEMÁTICA
• Quando os elementos da população já estão ordenados, não há necessidade de construirmos um sistema de referência, para selecionarmos a amostra. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, uma linha de produção, os nomes em uma telefônica, etc.
• Nestes casos a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador.Consideremos uma população, com elementos ordenados, de tamanho N e dela tiramos uma amostra de tamanho n, através de uma amostragem sistemática, da seguinte maneira:
• - Definimos FS como fator de sistematização, dado por : FS = N/n.
• - Sorteamos um número entre 1 e FS. Esse número, m, que será o primeiro elemento da amostra.
• - O segundo elemento da amostra é o de número • FS + m.• - O terceiro elemento da amostra é o de número • 2FS + m.• - O k-ésimo elemento da amostra é o número• (k – 1)FS+m
• Uma rua contém 1000 prédios, dos quais desejamos obter uma amostra sistemática formada por 100 deles.
• FS = 1000/100 = 10• m será um número entre 1 e 10. Vamos supor que
m=7. Então temos:• 1º elemento da amostra = (1 – 1) 10 + 7 = 7 >>> 7º
elemento da população.• 100º elemento da amostra = (100 – 1) 10 + 7 = 997
>>> 997º elemento da população.• Vamos criar uma outra situação onde o método
sistemático seja eficiente?
AMOSTRAGEM PROPORCIONAL ESTRATIFICADA
• Muitas vezes a população se divide em subpopulações >> estratos.
• Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos.,
EXEMPLO• Dada a população de 50.000 operários da
indústria automobilística, selecionar uma amostra proporcional estratificada de 5% de operários para estimar seu salário médio. Usando a variável critério “cargo” para estratificar essa população, e considerando amostras de 5% de cada estrato obtido, chegamos ao seguinte quadro:
•
CARGO POPULAÇÃO 5% AMOSTRA
Chefes de seção 5.000 5(5.000)/100 = 250 250
Operários especializados 15.000 5(15.000)/100 = 750 750
Operários não especializados 30.000 5(30.000)/100 = 1.500 1.500
TOTAL 50.000 5(50.000)/100 = 2.500 2.500
AMOSTRAGEM POR CONGLOMERADOS
• Neste tipo de amostragem a população total é subdividida em várias partes relativamente pequenas (normalmente homogêneas), e algumas dessas subdivisões, ou conglomerados, são selecionadas ao acaso, para integrarem a amostra global.
EXEMPLO• • Suponhamos que o reitor de uma
universidade deseja saber o que os membros dos centros acadêmicos acham de um novo regulamento. Ele pode obter uma amostra por conglomerado entrevistando alguns ou todos os membros de alguns centros acadêmicos escolhidos ao acaso.
b) Métodos Não Probabilísticos – São amostragens em que há uma escolha deliberada dos
elementos da amostra. Não é possível generalizar os resultados das pesquisas para a população, pois as amostras não-probabilísticas não garantem a representatividade da população.
– Tipos de Amostragem :» Aleatória Acidental» Intencional» Por Quotas
ComposiComposiçção da amostraão da amostra
Com Reposição– Cada elemento pode ser escolhido mais de uma vez (comprador -
passageiro)
Sem reposição– Cada elemento só pode ser escolhido uma vez
(eleitor - renda per capita)
Amostras com ou sem Amostras com ou sem reposireposiççãoão
– Finita• Número reduzido• Amostra sem reposição (bolas de uma urna no bingo)
– Infinita• Número muito grande ou ilimitado• Amostra com reposição• Amostra finita muito grande (cara/coroa com uma moeda)
PopulaPopulaççãoão
– Considerar todas as amostras de tamanho n indivíduos que podem ser retiradas da população (com ou sem reposição).
– Para cada amostra calcular um parâmetro estatístico (média, desvio padrão etc.)
DistribuiDistribuiçção Amostralão Amostral
• Obtém-se uma distribuição dos parâmetros das amostras (distribuição amostral da média etc.)
• Para cada distribuição podem ser calculados– Média– Desvio padrão– Etc.– Parâmetros da Distribuição Amostral
DistribuiDistribuiçção Amostralão Amostral
• Distribuição amostral das médias – Todas as amostras de tamanho n
• (sendo n < N População = N )
Sendo a média e o desvio padrão
(da população)
Sendo x a média e x o desvio
padrão (da distribuição amostral)
DistribuiDistribuiçção Amostralão Amostral
• Distribuição amostral das médias Sem reposição / População finita
1.
Np
NNp
Nx
DistribuiDistribuiçção Amostralão Amostral
• Distribuição amostral das medias com reposição / População infinita
DistribuiDistribuiçção Amostralão Amostral
Nx
• Distribuição amostral das médias observação :
• Se n é grande ( n>=30)– Dist. amost. é normal para qualquer população
• Se n é pequeno ( n<30)– Dist. amost. é normal se a população é normal
DistribuiDistribuiçção Amostralão Amostral
• Distribuição amostral das proporçõesobservação :
Todas as amostras de tamanho n (N População = )
• Sendo P a proporção de eventos de sucesso• Sendo Q a proporção de eventos de não sucesso (na
população)
Exemplo: cara ou coroa P = ½ Q = ( 1 - ½ ) = ½ (na população)
DistribuiDistribuiçção Amostralão Amostral
DistribuiDistribuiçção Amostralão Amostral
Fórmula:
N
PP
N
QPp
)1(.
Obs: se n é grande (n>=30) a distribuição amostral das proporções é normal
Distribuição amostral da diferença ou somaSe temos duas populações
Pop1 e Pop2
Se temos amostras independentes
N1 retirada de Pop1 não depende de N2
N2 retirada de Pop2 não depende de N1
DistribuiDistribuiçção Amostralão Amostral
Distribuição amostral da diferença ou soma
Se temos muitas amostras de tamanho n1 retiradas de Pop1
Se temos muitas amostras de tamanho n2 retiradas de Pop2
Se calculamos uma grandeza estatística S1 a partir de cada
amostra n1
Se calculamos uma grandeza estatística S2 a partir de cada
amostra n2
DistribuiDistribuiçção Amostralão Amostral
Distribuição amostral da diferença ou soma
Produzimos uma distribuição amostral de S1 com S1 e S1
Produzimos uma distribuição amostral de S2 com S2 e S2
DistribuiDistribuiçção Amostralão Amostral
Distribuição amostral da diferença ou soma
Se consideramos S1 - S2
teremos uma distribuição amostral da diferença
Com (S1 - S2) = S1 - S2
e (S1 - S2) = S12 + S2
2
Se consideramos S1 + S2
teremos uma distribuição amostral da soma
Com (S1 + S2) = S1 + S2
e (S1 + S2) = S12 + S2
2
DistribuiDistribuiçção Amostralão Amostral
Valem para as médias, proporções e outras grandezas estatísticas
Se n1 >= 30 e n2 >= 30
A distribuição amostral da + ou da - é Normal
DistribuiDistribuiçção Amostralão Amostral
O último tópico da teoria da amostragem mostra que:
- Conhecida a população - Podemos informar a amostra
Interessa o Inverso :
- A partir da amostra
-inferir a população
- Inferência estatística
- Estimação de parâmetros populacionais (a partir da estatísticas das amostras)
(média, variância, desvio padrão etc.)
Teoria EstatTeoria Estatíística da Estimastica da Estimaççãoão
SE
Média da distribuição Amostral de uma estatística =
Parâmetro populacional correspondente.
ENTÃO
A estatística considerada é chamada de ESTIMADOR IMPARCIAL (estimativa imparcial) do parâmetro populacional
Estimativas ImparciaisEstimativas Imparciais
Caso em Contrário
A estatística considerada é chamada de ESTIMADOR PARCIAL (estimativa parcial) do parâmetro populacional
O estimador parcial é dependente de algum parâmetro que deve ser considerado para garantir nossas afirmações.
Estimativas ImparciaisEstimativas Imparciais
Estimativas ImparciaisEstimativas Imparciais
• Se - duas distribuições amostrais de duas estatísticas tem a mesma média (ou esperança matemática) a estatística de menor variância é chamada de estimador eficiente ( estimativa eficiente)
• A outra – é chamada de estimador ineficiente( estimativa ineficiente)
Estimativa por ponto e por Estimativa por ponto e por intervalointervalo
– A estimativa de um parâmetro populacional dada por um número único é chamada de estimativa por ponto ex: a média é 5,28
– Quando dada por dois números entre os quais pode-se considerar que ela esteja, é chamada de estimativa por intervalo ex: a média esta entre 5,24 e 5,32 ou 5,28 + ou – 0,04 onde o erro 0,04 é chamado de fidedignidade.
Questões Comuns em Negócios
• Como estimar os parâmetros de um novo mercado com base numa simples amostra?
• Qual a confiança neste resultado?
• Como se amostrar?
Inferência Estatística
• Estimação da média• Estimação da proporção• Tamanho da amostra
Conteúdo
• Estimação da média• Estimação da proporção• Tamanho da amostra• Amostragem
População x Amostra
: média
: desvio-padrão
1.padrãodesvio:s
1amostra.média:x
1
1
2.padrãodesvio:s
2amostra.média:x
2
2
3.padrãodesvio:s
3amostra.média:x
3
3
1
2
3
Exemplo• Uma pesquisa nos bancos de dados de um call-center mostrou que,
em 121 chamadas amostradas, a venda média foi de R$ 700, com desvio padrão de R$ 100. Como estimar a venda média deste negócio?
Resp: intervalo de confiança da média
Intervalo de confiança da média
nzxIC
)(
2,5899%
1,9695%
1,6590%
ZGRAU DE CONFIANÇA
Solução do exemplo
Repetir para confiança de 90% e 99%
%)95:(
8,17$700$:
121
10096,1700:
confiança
RRvenda
venda
Comentários• Interpretação da confiança• Confiança x tamanho do intervalo• Validade da fórmula:
– População normal– Amostra grande (n>=30) ou desvio padrão
populacional conhecido para amostras pequenas (n<30)
– Amostragem representativa
Amostras Pequenas (n<30) – Desvio Padrão Populacional desconhecido
Exemplo
• Testes de uma nova droga em 10 pacientes revelou um aumento médio de pressão sangüínea de 2,25, com desvio-padrão de 0,95. Qual deve ser o intervalo de confiança para 95%?
Resp: distribuição t ao invés da normal (z)
Solução do exemploValor de t = 2,262; (n-1=9, /2=2,5%)
68,025,2:
10
95,0262,225,2:
pressão
pressão
Conteúdo
• Estimação da média• Estimação da proporção• Tamanho da amostra• Amostragem
Estimação de proporçãoCasos mais comuns• Market-share• Índice de audiência• Índice de reclamações • Eleitores de certo partido
Exemplo
• Uma pesquisa de mercado com 90 consumidores mostrou que o market-share de sua empresa é de 25%. Como estimar o market-share do mercado, com 95% de confiança?
Fórmula aplicada
n
ppzppIC
)1()(
^^^
Solução do exemplo
09,025,0p90
)25,01(25,096,125,0p
Repetir p/outros níveis de confiança
Comentários
Validade da fórmula –Tamanho da amostra suficiente para o
intervalo (p + 3) não conter 0 ou 1.–Amostragem representativa
Conteúdo
• Estimação da média• Estimação da proporção• Tamanho da amostra• Amostragem
Tamanho da Amostra (n)para Estimativa da Média
• E: Erro de Estimação (semi-amplitude); • vide cálculo do intervalo de confiança
(x-E)___________(x)___________(x+E)
nzE
2)(
Ezn
Exemplo de Tamanho da Amostra (n)para Estimativa da Média
• Volta ao exemplo do call-center (média R$700, devio-padrão R$100, 95% confiança)
• E: R$ 10 Erro de Estimação (semi-amplitude); (690)___________(700)___________(710)
nE
10096,1 2)
10
10096,1(n
385n
Tamanho da Amostra (n)para Estimativa da Proporção
• E: Erro de Estimação (semi-amplitude); • vide cálculo do intervalo de confiança
(p-E)___________(p)___________(p+E)
n
ppzE
)1( )1()( 2 pp
E
zn
Exemplo de Tamanho da Amostra (n)para Estimativa da Proporção
• Volta ao exemplo do market-share (p=0,25, 95% confiança)• E: 2% Erro de Estimação (semi-amplitude);
(23%)___________(25%)___________(27%)
1801n )75,0(25,0)02,0
96,1(n 2
Conteúdo
• Estimação da média• Estimação da proporção• Tamanho da amostra
TESTE DE HIPÓTESES
• É uma técnica para fazer inferência– A partir de uma amostra fazemos inferência sobre a população
• Objetivos:– Formular hipótese quanto ao valor de um parâmetro
POPULACIONAL– Fazer um teste que indicará a aceitação ou rejeição da hipótese
CONCEITOS• Hipótese Estatística
– Suposição quanto ao valor de um parâmetro populacional• Testes de Hipótese
– Regras de decisão• Tipos de Hipóteses
– Ho: hipótese a ser testada – chamada hipótese nula– H1: hipótese alternativa
CONCEITOS (cont...)
• Tipos de Erros– Tipo I – Rejeição de uma hipótese Ho verdadeira– Tipo II – Aceitação de uma hipótese Ho falsa
• OBS:
)(Pr
)(Pr
IItipoerroob
Itipoerroob
Exemplos de tipos de hipóteses:
)(65,1:1
65,1:
)(65,1:1
65,1:
)(65,1:1
65,1:
direitaàunilateraltesteumgeraH
Ho
esquerdaàunilateraltesteumgeraH
Ho
bilateraltesteumgeraH
Ho
Gráficos correspondentes aos exemplos anteriores:
Bilateral Unilateral à esquerda
Unilateral à direita
RAHo RAHo
RAHo
RRHoRRHo
RRHo
Onde...
• RAHo: Região de Aceitação de Ho• RRHo: Região de Rejeição de Ho
Testes
• Teste de Médias• Teste de Proporções• Teste de Igualdade de Médias• Teste de Igualdade de Proporções
Como proceder nos testes???
• Formular as hipóteses Ho e H1• Fixar o nível de significância • Usar as tabelas estatísticas• Calcular a fórmula do teste• Aceitar ou rejeitar as hipóteses
Teste de Médias• Usar a tabela t-Student (n-1 graus de liberdade)• Fórmula do teste:
amostradatamanhon
amostradapadrãodesvios
nulahipótesedavalor
amostradamédiax
onden
sx
tcal
0
0
:
Exemplo1 (teste de média...)
• Historicamente temos um registro médio de 115 pontos em um teste vocacional para alunos de uma escola. Este ano foi feito teste para uma nova turma e numa amostra de 25 alunos observou-se uma média igual a 118 com desvio-padrão igual a 20. Podemos afirmar com 5% de significância que a média da população é a mesma dos anos anteriores?
Solução....
75,0
2520
115118
)(%5
115:1
115:
calt
problemadodado
H
Ho
Solução (cont...)
• Achar os valores tabelados (t-Student)• n-1 graus de liberdade (25-1=24)..... 1,711• Fazer o gráfico correspondente• Concluir....
UAU....UAU....
Exemplo 2: • Para uma amostra de 51 firmas tomadas de uma particular indústria,
o número médio de empregados por firma é de 420,4 com um desvio-padrão amostral de 55,7. Antes que os dados fossem coletados, foi feita a hipótese de que o número médio de empregados por firma, nesta indústria, era no máximo de 408. Testar esta hipótese com 5% e 1% de significância.
Exemplo 3:
• Uma agência publicitária afirma que as propagandas feitas por ela nos últimos meses têm rendido em média R$9.000,00 mensais de lucro. Um dos gerentes desta agência extraiu uma amostra encontrando um rendimento médio de R$8.000,00, com desvio padrão amostral de R$1.000,00, com base em 51 propagandas feitas. Faça o teste de hipóteses adequado com 5% e 1% de significância.
TESTE DE PROPORÇÕES
• Usar a tabela normal reduzida Z• Fórmula do teste:
amostradatamanhon
hipótesedavalorp
amostradaproporçãof
onden
pp
pfZ cal
0
00
0
:
)1(
OBSERVAÇÕES...
• O procedimento para resolução de problemas de testes de hipóteses é sempre o mesmo para qualquer tipo de teste.
• As únicas coisas que mudam são: fórmula do teste e tabela a utilizar.
Exemplo (teste Proporção)
• Numa cidade a taxa de mortalidade indica que 60% dos nascidos vivem até os 65 anos. Numa amostra com 1000 nascidos verificou-se que 530 sobreviveram até 65 anos. Podemos afirmar que a proporção de sobreviventes até 65 anos é igual a 60%, com 5% de significância? E com 1%?
Resolução...
52,4
1000
)6,01(6,0
60,053,0
60,0:1
60,0:0
calZ
pH
pH
Resolução (Cont...)
• Encontrar os valores tabelados• Fazer os gráficos • Tirar conclusões...
Exemplo 2 (proporção)
• Uma pesquisa conclui que 90% dos médicos recomendam aspirina a pacientes que têm filhos. Teste a afirmação, com 5% e 1% de significância, contra a alternativa de que a percentagem é inferior a 90% se, numa amostra aleatória de 100 médicos, 80 recomendam aspirina.
Exemplo 3 (proporção)
Uma agência publicitária afirma que 40% das pessoas que passam por umdeterminado local observam uma campanha publicitária estampada num outdoor (neste mesmo local). Foram entrevistadas 80 pessoas que passavam por esse local e, 25 pessoas responderam que observavam o outdoor.
a) Teste a afirmação da agência, com 5% de significância.b) Teste a afirmação da agência, com 5% de significância, contra a alternativa
de que a percentagem é inferior a 40%.
TESTE DE IGUALDADE DE MÉDIAS
• Usar a tabela normal reduzida Z• Fórmula do teste:
2
22
1
21
21
n
s
n
s
xxZ cal
Exemplo (igualdade de Médias)• Um fabricante de pneus fabrica dois tipos (A e B) onde o desvio-
padrão de A é de 2500km e o de B é 3000km de vida útil. Foram testados 50 pneus do tipo A apresentando vida útil média de 24000km, e testados 40 pneus do tipo B apresentando vida útil média de 26000km. Podemos afirmar com 4% de significância que a vida útil média dos pneus A e B é a mesma?
TESTE DE IGUALDADE DE PROPORÇÕES
• Usar a tabela normal reduzida Z• Fórmula do teste:
absolutafrequênciax
amostradaproporçãof
nn
xxp
onde
nnpp
ffZ cal
21
21
21
21
:
11)1(
Exemplo (igualdade de proporções)
• Uma revista foi lida por 200 homens e 70 deles se lembraram de uma certa propaganda. Essa mesma revista foi lida por 180 mulheres e 50 delas se lembraram dessa propaganda. Será que podemos dizer com 10% de significância que as proporções de homens e mulheres que se lembraram da propaganda são iguais?
• Um fabricante deseja saber se um revestimento especial aplicado as placa de licenciamento de veículos lhes aumenta a resistência à ferrugem. Distribui-se 20.000 placas tratadas juntamente com 20.000 placas não tratadas. Uma amostra aleatória das placas tratadas, extraídas um ano depois, indica que, de 400, 360 estão em estado perfeito, enquanto que de uma amostra de 225 placas não tratadas, 195 estão em ótimas condições. Pode-se concluir que as placas tratadas são superiores as não tratadas?
• Um fabricante de doces afirma que o percentual de sacos de pastilhas mal cheios é inferior a 3%. Uma pesquisa acusa 4 sacos mal cheios em 50. A amostra foi extraída de uma remessa de 400 sacos. A evidencia amostral refuta a alegação do fabricante?
Regressão Linear SimplesRegressão Linear Simples
Revisão: A R E T A
a maior que zero
y
mesmo "a "
a maior que zero
b a=0
a menor que zero
x
b
X=1 X=2
Equação da reta: y = a x + b
Equação da reta: y = a x + b
• Equação da reta:
y = a x + b
a : coeficiente angular Mostra a variação de Y para cada unidade de variação de X É a tangente do angulo da retaQuanto maior “a” mais inclinada é a retaSe “a “ é positivo ---> reta crescenteSe “a ” é negativo --> reta decrescenteSe “a” é zero.........Y não depende de X -->.reta é paralela ao eixo X ...na altura do valor b !!
b : coeficiente de intersecção ou intercepto
Revisão : A retaRevisão : A reta
• Como estimar o faturamento de um negócio com base em seu investimento em publicidade?
SituaSituaççãoão
0204060
0 20 40 60
X
Y
Regressão Linear SimplesRegressão Linear Simples
• Modelos Probabilísticos
Ajuste do Modelo
• Hipóteses do Modelo
Análise de Validade do Modelo
Regressão Linear SimplesRegressão Linear Simples
• Devido aleatoriedade de várias fontes, pode-se assumir que o valor da grandeza de interesse será composta de uma parte determinística e de um erro.
• No exemplo do faturamento, teremos:
Receita = a + b.(Investimento) + erro
Modelos ProbabilModelos Probabilíísticossticos
Vendas
0
1
2
3
4
5
0 2 4 6
Publicidade ($100)
Ven
das
($10
00) Linha de
Regressão
Erro aleatório
Modelos ProbabilModelos Probabilíísticossticos
y
0
10
20
30
0 2 4 6 8 10 12 14
Variavel Conhecida (Independente ) X
Var
iáve
l P
rocu
rad
a (D
epen
den
te )
Y
Erro 1
Erro 2
Erro 3 Erro 4(x
1,y
1)
(x2,y
2
)
(x3,y
3)
(x4,y
4
)
• Forma geral para regressão linear simples
iii XY 10
intercepto
Inclinação
Erro
Variável Dependente (Resposta)
Variável Independente (Explicativa)
Modelos ProbabilModelos Probabilíísticossticos
• Intercepto: valor de y para x=0
• Inclinação: acréscimo em y para cada unidade de x
• Curva ajustada (mínimos quadrados)
• Validade apenas no range dos dados
InterpretaInterpretaçção de cada parcelaão de cada parcela
1. A distribuição do erro possui média zero
2. A variância do erro é constante.3. A distribuição do erro é normal4. Os valores do erro são
independentes dos y observados
HipHipóóteses do Modeloteses do Modelo
X1
X2
X
Y
f(e)
Linha de Regressão
Distribuição de probabilidade do erro
VisualizaVisualizaçção das hipão das hipóótesesteses
r2 = 1,Y
X
r = +1 r2 = 1,Y
X
r = -1
r2 = .8,Y
X
r = +0.9 r2 = 0,Y
X
r = 0
Coeficientes de CorrelaCoeficientes de Correlaçção ( r) e de ão ( r) e de DeterminaDeterminaçção (r2) ão (r2)
• Indica o poder de explicação do modelo em %.
• Em outras palavras, o modelo de regressão capturou 100.(r2)% da variação da variável de interesse.
Coeficientes de DeterminaCoeficientes de Determinaçção (r2) ão (r2)
• O modelo linear vale?
• Há chance da inclinação ser zero?Duas formas de se verificar:
• Valor de t (ou sua p); ou• Intervalo de confiança p/ inclinação
AnAnáálise de Validade do Modelolise de Validade do Modelo
• Suponha que uma farmácia (ou supermercado,
ou disk-qualquer coisa) tenha um site para
entregas a domicílo, e fez um levantamento de
quanto gastaram 32 de seus clientes durante certo
período. Ela deseja saber se este gasto depende
da distância do domicílio ao ponto de venda e se
obedece uma relação linear:
ExercExercííciocio
Distância do domicílio ao Ponto de Vendas
(Km)
Consumo médio semanal
(R$)
2,3 23,13,1 27,53.8 26.12.1 24.03,4 26,24,6 31,32.8 26.12,6 19.64.8 36.41,8 17,84.3 31.35,5 360,7 14,13 22,3
1.1 17.3
Buscamos saber se existe uma relação y = ax + b +
onde Y = consumo médio mensal (R$) (variável dependente)X= distância do cliente ao pto de venda (variável independente) = Erro aleatório
ExercExercííciocio
O Conselho de Administração está preparando o Planejamento Estratégico para o ano seguinte e precisa de uma previsão de demanda. Sabendo que você tem acesso ao banco de dados da empresa com as vendas dos anos anteriores, como proceder ?
SituaSituaççãoão
São utilizados quando a única informação disponível são as observações ao longo do tempo.Tipos de modelos de série de tempo:
– Modelos de Média Móvel– Modelos de Exponencial Atenuadora– Modelos de Regressão– Modelos com Sazonalidade
Modelos de SModelos de Sééries Temporaisries Temporais
Período Vendas_TV01/1995 3002/1995 3203/1995 3004/1995 3901/1996 3302/1996 3403/1996 3404/1996 3801/1997 3602/1997 3903/1997 3004/1997 3601/1998 3802/1998 3003/1998 3504/1998 3001/1999 3402/1999 4003/1999 3604/1999 3201/2000 4002/2000 3603/2000 4004/2000 34
3
VendasVendasVendasevisãoPr 321
4
3
VendasVendasVendasevisãoPr 432
5
Previsão
30,6733,6734,0035,3333,6735,3336,0037,6735,0035,0034,6734,6734,3331,6733,0034,6736,6736,0036,0036,0038,67
25
27
29
31
33
35
37
39
41
01/1
995
03/1
995
01/1
996
03/1
996
01/1
997
03/1
997
01/1
998
03/1
998
01/1
999
03/1
999
01/2
000
03/2
000
Período
Ven
das
Vendas_TV Previsão
67,363
344036evisãoPr 2001/1
Modelos de Média MóvelModelos de Média Móvel
PRODUÇÃOSOJA_MA(ton)
1991 8.0371992 24.0291993 87.3701994 140.3701995 162.3751996 137.2831997 221.5351998 290.4381999 409.012
ANO
R2 = 0,9101
-50.000
50.000
150.000
250.000
350.000
450.000
1991 1993 1995 1997 1999 2001
ANO
PRO
DU
ÇÃ
O (
ton)
Produção de Soja= -88.558.808,17 + 44.472,83*ANO 2001 431.331
Modelos de Extrapolação de Modelos de Extrapolação de tendênciastendências
•Usado normalmente para previsão
•Valor observado na série temporal é o produto dos componentes
•Dados anuais:
•Dados mensais ou trimestrais:
iiii ICTY
iiiii ICSTY
Ti = Tendência
Ci = Cíclico
Ii = Irregular
Si = Sazonal
Modelo de SModelo de Séérie Temporal Multiplicativorie Temporal Multiplicativo
• Y= T x S x I• Y/T = (T x S x I)/T• Y/T = S x I onde T = a + bx ( regressão )
Modelo de SModelo de Séérie Temporal Multiplicativorie Temporal Multiplicativo
T = Tendência de Longo PrazoS = Componente SazonalI = Componente Irregular
Determinar a componente sazonal de uma série
t yt t yt t yt t yt
jan/97 5200 jan/98 5450 jan/99 5850 jan/00 6280fev/97 5370 fev/98 5730 fev/99 6200 fev/00 6456mar/97 5440 mar/98 5820 mar/99 6180 mar/00 6700abr/97 5436 abr/98 5800 abr/99 6156 abr/00 6520mai/97 5200 mai/98 5750 mai/99 6040 mai/00 6400jun/97 5150 jun/98 5510 jun/99 6100 jun/00 6230jul/97 5050 jul/98 5400 jul/99 5700 jul/00 6000
ago/97 4800 ago/98 5200 ago/99 5500 ago/00 6000set/97 4840 set/98 5230 set/99 5560 set/00 5920out/97 4950 out/98 5220 out/99 5700 out/00 6010nov/97 5200 nov/98 5460 nov/99 6000 nov/00 6180dez/97 5330 dez/98 5690 dez/99 6050 dez/00 6480
Demanda Mensal (peças)Y = T x S x I
Modelo de Extrapolação de TendênciasModelo de Extrapolação de Tendências
4500
5000
5500
6000
6500
7000
Dez/96 Jun/97 Dez/97 Jun/98 Dez/98 Jun/99 Dez/99 Jun/00 Dez/00
Modelo de Extrapolação de TendênciasModelo de Extrapolação de Tendências
12
..... yyy 97/Dez97/Jan
97/Jun
12
..... yyy 00/Dez00/Jan
00/Jun
1) Cálculo da Tendência de Longo Prazo (T)
Passos para REMOVER a Tendência de Longo Prazo L:Y = T x S x I
t t t t Jan/97 Jan/98 5382 Jan/99 5752 Jan/00 6116Fev/97 Fev/98 5415 Fev/99 5777 Fev/00 6158Mar/97 Mar/98 5448 Mar/99 5805 Mar/00 6188Abr/97 Abr/98 5470 Abr/99 5845 Abr/00 6214Mai/97 Mai/98 5492 Mai/99 5890 Mai/00 6229Jun/97 5164 Jun/98 5522 Jun/99 5920 Jun/00 6265Jul/97 5185 Jul/98 5555 Jul/99 5956 Jul/00
Ago/97 5215 Ago/98 5594 Ago/99 5977 Ago/00Set/97 5246 Set/98 5624 Set/99 6020 Set/00Out/97 5277 Out/98 5654 Out/99 6051 Out/00Nov/97 5322 Nov/98 5678 Nov/99 6081 Nov/00Dez/97 5353 Dez/98 5727 Dez/99 6091 Dez/00
t
_
yt
_
y t
_
yt
_
y
Modelo de Extrapolação de TendênciasModelo de Extrapolação de Tendências
Tendência de Longo Prazo (L)
5100
5300
5500
5700
5900
6100
6300
Jun/97 Dez/97 Jun/98 Dez/98 Jun/99 Dez/99 Jun/00
Modelo de Extrapolação de TendênciasModelo de Extrapolação de Tendências
t
t
tx
xxz
y
yIS
L
ISL
2) Remoção da Tendência a Longo Prazo (L)
t zt t zt t zt t zt
Jan/97 Jan/98 1,013 Jan/99 1,017 Jan/00 1,027Fev/97 Fev/98 1,058 Fev/99 1,073 Fev/00 1,048Mar/97 Mar/98 1,068 Mar/99 1,065 Mar/00 1,083Abr/97 Abr/98 1,060 Abr/99 1,053 Abr/00 1,049Mai/97 Mai/98 1,047 Mai/99 1,026 Mai/00 1,027Jun/97 0,997 Jun/98 0,998 Jun/99 1,030 Jun/00 0,994Jul/97 0,974 Jul/98 0,972 Jul/99 0,957 Jul/00
Ago/97 0,920 Ago/98 0,930 Ago/99 0,920 Ago/00Set/97 0,923 Set/98 0,930 Set/99 0,924 Set/00Out/97 0,938 Out/98 0,923 Out/99 0,942 Out/00Nov/97 0,977 Nov/98 0,962 Nov/99 0,987 Nov/00Dez/97 0,996 Dez/98 0,994 Dez/99 0,993 Dez/00
Modelo de Extrapolação de TendênciasModelo de Extrapolação de Tendências
019,13
zzzz 00/Jan99/Jan98/JanJan
Remoção efeito da irregularidade ( I )
SI
ISZ
x
060,13
zzzz 00/Fev99/Fev98/FevFev
072,13
zzzz 00/Mar99/Mar98/MarMar
054,13
zzzz 00/Abr99/Abr98/AbrAbr
033,13
zzzz 00/Mai99/Mai98/MaiMai
009,13
zzzz 99/Jun98/Jun97/JunJun
Y = T x S x I Zt = S x I
968,03
zzzz 99/Jul98/Jul97/JulJul
923,03
zzzz
99/Ago98/Ago97/Ago
Ago
925,03
zzzz 99/Set98/Set97/SetSet
934,03
zzzz 99/Out98/Out97/OutOut
975,03
zzzz 99/Nov98/Nov97/NovNov
994,03
zzzz 99/Dez98/Dez97/DezDez
Modelo de Extrapolação de TendênciasModelo de Extrapolação de Tendências
Fator de Sazonalidade (S):
)...(
12
Dezjantt ZZSOMA
ZS x
0,900
0,950
1,000
1,050
1,100
1 2 3 4 5 6 7 8 9 10 11 12
Mês
Fato
r de
Saz
onal
idad
e (S
)
Mês SJan 1,022Fev 1,063Mar 1,075Abr 1,057Mai 1,036Jun 1,011Jul 0,970
Ago 0,926Set 0,928Out 0,937Nov 0,978Dez 0,997
Efeito Mensal da Sazonalidade:
Modelo de Extrapolação de TendênciasModelo de Extrapolação de Tendências
Números Índices
Definição
• Os números índices são medidas estatísticas
freqüentemente usadas por administradores, economistas
e engenheiros, para comparar grupos de variáveis
relacionadas entre si e obter um quadro simples e
resumido das mudanças em áreas relacionadas como
preços de matérias primas, preços de produtos acabados,
volume físico de produção etc.
Números Índices
• Com a utilização de números índices é possível estabelecer comparações entre:
• Variações ocorridas ao longo de tempo;
• Diferenças entre lugares;
• Diferenças entre categorias semelhantes, tais como produtos, pessoas, etc.
Números Índices
• Os números índices são usados para indicar variações relativas em quantidades, preços ou valores de um artigo, durante um dado período de tempo.
• Um número índice é uma razão usada para avaliar a variação entre dois períodos de tempo.
Números Índices
• Um número índice simples avalia a variação
relativa de um único item ou variável econômica entre dois
períodos de tempo.
• Calcula-se como a razão do preço, quantidade ou
valor em um dado período para o correspondente preço,
quantidade ou valor num período base.
Preços Relativos
• Relaciona o preço de um produto numa
época t (chamada época atual ou época dada) com
o de uma época 0 (chamada base)
Preços Relativos
• pt – preço numa época atual (ou dada)
• p0 – preço na época base
0,0 p
pp t
t
Exemplo
• O preço de determinado artigo em 1998 foi R$ 1,20 e em 1999 subiu para R$ 1,38. Tomando-se por base o ano 1998, determinar o preço relativo em 1999.
15,120,1
38,1
1998
19991999,1998
p
pp
Relativo - Quantidade
• qt – quantidade de um produto numa época atual (ou dada)
• q0 – quantidade de um produto numa época base
0,0 q
qq t
t
Exemplo
• Uma empresa produziu 45 toneladas de aço em 1979 e 68 toneladas em 1980. A quantidade relativa será, tomando-se o ano de 1979 como base:
51,145
68
79
8080,79
q
Relativos de Valor
• Se p for o preço de determinado artigo em certa época e q a quantidade produzida ou consumida desse mesmo artigo na mesma época, então pxq será denominado valor total de produção ou de consumo.
ttttt
t qpqp
qp
v
vv ,0,0
000,0 .
.
.
Exemplo
• Uma empresa vendeu, em 1990, 1000 unidades de um artigo ao preço unitário de R$50,00. Em 1991 vendeu 2000 unidades do mesmo artigo ao preço unitário de R$60,00. O valor relativo da venda em 1991 foi:
%)240(4,21000.50
2000.6091,90 v
Exercícios
•Os preços médio no varejo, de uma
produção, por unidade, durante os anos de 1993 a 1998, estão apresentados na tabela abaixo:
Anos 1993 1994 1995 1996 1997 1998Preços 14,95 14,94 15,1 15,65 16,28 16,53
Exercícios
• a) Adotando o ano de 1993 como base, determinar os preços relativos correspondentes a todos os anos dados.
Anos 1993 1994 1995 1996 1997 1998Preços 14,95 14,94 15,1 15,65 16,28 16,53
Anos 1993 1994 1995 1996 1997 1998preço relativo 100,0 99,9 101,0 104,7 108,9 110,6
Exercícios
• b) Adotando o ano de 1996 como base, determinar os preços relativos correspondentes a todos os anos dados.
Anos 1993 1994 1995 1996 1997 1998Preços 14,95 14,94 15,1 15,65 16,28 16,53
Anos 1993 1994 1995 1996 1997 1998anos base - 1996 95,53% 95,46% 96,49% 100,00% 104,03% 105,62%
Aplicação
• Aplicações de todos os conceitos estudados em exercícios práticos.....
top related