jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1...

100
ESTATÍSTICA Prof. Msc. Jeferson Gomes Moriel Junior Tecnologia em Construção de Edifícios 2º semestre - Noturno 2012/1 INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DE MATO GROSSO IFMT / campus Cuiabá

Upload: others

Post on 24-Nov-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

ESTATÍSTICA

Prof. Msc. Jeferson Gomes Moriel Junior

Tecnologia em Construção de Edifícios 2º semestre - Noturno

2012/1

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DE MATO GROSSO

IFMT / campus Cuiabá

Page 2: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

1

Estatística

Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

Tecnologia em Construção de EdifíciosTecnologia em Construção de Edifícios2º semestre 2º semestre -- NoturnoNoturno

Todos os direitos reservados. 

Quem sou eu?

Quem são vocês?

O que é esta disciplina?

Quem sou eu?Quem sou eu?

MirassolMirassolSão José do Rio PretoSão José do Rio PretoUnespUnesp: : LicLic. Matemática. Matemática

LondrinaLondrinaUelUel: Mestrado: Mestrado

UelUel: Depto. de Estatística: Depto. de EstatísticaUelUel: Depto. de Matemática : Depto. de Matemática 

ParanavaíParanavaíFafipaFafipa: Depto. de Matemática: Depto. de Matemática

São Vicente São Vicente  CuiabáCuiabáIFMTIFMT

Doutorando em Educação em Doutorando em Educação em Ciências e Matemática Ciências e Matemática ––

UFMT/REAMECUFMT/REAMEC

JefersonMorielJunior.pbworks.comInformações e arquivos das disciplinassitesite

jeferson moriel@cba ifmt edu [email protected] institucional

facebook.com/ProfMorielJuniorCurtir a página para obter informações rápidas da disciplina

Quem são vocês?Quem são vocês?

Page 3: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

2

O que é esta disciplina?O que é esta disciplina?

• Carga horária, ementa, objetivos e avaliação• Procedimentos de ensino/aprendizagem e bibliografia 

• Carga horária67 horas / 80 aulas

Terça‐feira: 2 primeiras aulas (sala ?)Quinta‐feira: 2 últimas aulas (sala ?)Quinta feira: 2 últimas aulas (sala ?)

• Ementa

‐ Natureza e Fundamentos do Método Estatístico. ‐ Técnicas de Amostragem. ‐ Distribuição de Frequência. ‐ Medidas de PosiçãoMedidas de Posição. ‐ Medidas de Dispersão, Assimetria e Curtose.‐ Análise de Correlação e Regressão Linear Simples.‐ Conceitos Básicos sobre Análise de Variância. ‐ Melhoria da Qualidade no Contexto da Empresa Moderna. 

• Objetivo

‐ Aplicar a metodologia estatística de resumosde dados, tomada de decisões, diagnósticos,análise de variância, análise de experimentos,análise de regressão e ferramentas degqualidade.

• Avaliação

Nota1 = 8 pts de trabalhos/apresentações/provasNota1 = 8 pts de trabalhos/apresentações/provas + 2 pts de conceito (conforme Estatudo do IFMT)

Nota2 = 5 pts do Trabalho de Pesquisa + 3 pts de trabalhos/apresentações/provas + 2 pts de conceito 

Bibliografia• MONTGOMERY, D.C. Introdução ao controle de qualidade. Rio de Janeiro, LTC, 2004.

• MONTGOMERY, D.C.; RUNGER, G. C. Estatística aplicada e probabilidade para engenheiros. Rio de Janeiro, LTC, 2003.

• LEVINE; STEPHAN; KREHBIEL; BERENSON. Estatística: teoria e aplicações. Rio de Janeiro, LTC, 2000.

• MARTINS, G.A. Estatística geral e aplicada. Ed. Atlas, 2001.• SOARES, J.F.; FARIAS, A.A. Introdução à Estatística. Ed. Guanabara, 1995.

• COSTA NETO, P. Estatística para Engenheiros. São Paulo, 1984.

Page 4: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

3

Uma dica interessanteAPRENDEMOS RETEMOS

•1% por meio do gosto•1,5% por meio do tato•3,5% por meio do olfato•11% por meio do ouvido

•10% do que lemos•20% do que escutamos•30% do que vemos•50% do que vemos e escutamos•11% por meio do ouvido

•83% por meio da visão•50% do que vemos e escutamos•70% do que ouvimos e logo discutimos•90% do que ouvimos e logo realizamos

Extraído de Ensino‐aprendizagem com modelagem matemática de  Rodney Bassanezzi, p. 179.

Algumas noções introdutórias • Dados são observações que tenham sido coletadas(por exemplo, medidas realizadas, respostas depesquisas, etc)

• População (ou Universo) é a coleção de todos osobjetos, indivíduos ou informações que apresentampelo menos uma característica em comum, cujocomportamento interessa‐nos analisarcomportamento interessa‐nos analisar.

• Exemplos: Em uma dada comunidade o conjunto deTODAS as estaturas constitui uma população deestaturas; o conjunto de TODOS os carros constitui umapopulação de carros. Logo, população não implicanecessariamente gente, pessoas. O que importa é avariável estudada.

• Mas, se uma população for muito grande o pesquisadorpoderá ter um trabalho astronômico para estudá‐la. Alémdisso, o processo de pesquisa pode ser destrutivo: porexemplo, se tivermos uma população de fósforos e quisermosavaliar a porcentagem de falhas.

• Nestes casos, recorre‐se a uma amostra que basicamenteconstitui uma redução da população a dimensões menoresconstitui uma redução da população a dimensões menores,sem perda das características essenciais. Ela é umsubconjunto finito que supomos ser representativo dapopulação. Em outras palavras, uma amostra deve conter emproporção tudo o que a população possui qualitativa equantitativamente (isto é, ser representativa). E para serconsiderada representativa tem de ser selecionada de modoaleatório, isto é, todos os elementos da população devem terigual oportunidade de fazer parte da amostra.

• Censo é o conjunto de dados obtidos de todos osmembros da população.

• Estatística é uma coleção de métodos para oplanejamento de experimentos, obtenção de dados

ü t i ã t ãe, conseqüente organização, resumo, apresentação,análise, interpretação e elaboração de conclusõesbaseadas nos dados.

• ESTATÍSTICA DESCRITIVA E INFERÊNCIA ESTATÍSTICA

Page 5: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

4

• Teste com 6 carros

• Ao descrever tais características deste conjunto dedados estamos trabalhando com a EstatísticaDescritiva.

• O que não aconteceria se concluíssemos que todosi t d l d i los carros importados naquele ano poderiam acelerar

de 0 a 100 km/h em menos de 17,0 s; poisestaríamos generalizando, ou seja, usando dadosamostrais para fazer inferências sobre umapopulação. Esta última parte é a Inferência Estatísticaque é a parte da estatística que tem por objetivoobter e generalizar conclusões para o todo a partir daanálise de uma parcela.

• Alguns exemplos do uso da inferência estatística:

– Prever a duração da vida útil de uma calculadora manual (com base no desempenho de muitas dessas calculadoras);

– Prever o fluxo de tráfego em uma rodovia ainda emconstrução (com base no tráfego observado emrodovias alternativas).

• Na transferência das conclusões (da amostra para apopulação), um instrumento torna‐se muitoimportante, a Teoria das Probabilidades. Essapermite analisar o tamanho do erro que se cometeao fazer inferências. A Inferência Estatística nãopoderia ter‐se desenvolvido sem as noçõesf d dfundamentais desta teoria.

O QUE É MAIS FÁCIL?

Ser atacado por um tubarão?

Ganhar na mega sena?

Ser atingido por um raio?

O QUE É MAIS FÁCIL?

1º RAIO

2º MEGA SENA

3º TUBARÃO

• É mais provável ganhar na Mega‐Sena do que ser Atacado por um tubarão. 

• Segundo dados de ataques mundiais em 2003 compilados pelo International Shark Attack File do Florida Museum of Natural History e comparados com a população mundial no mesmo ano, as chances são de 1/60.000.000

• No entanto, é mais fácil ser atingido por um raio do que acertar as seis dezenas da Caixa.

• Segundo a National Oceanic and AtmosfericAdministration, a chance de um raio cair em vocês ao longo da sua vida é de 1/6250. (Probabilidade estimada para moradores dos Estados Unidos baseada no Censo 2008).

Page 6: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

5

• No quadro a seguir há notas de uma prova de uma turma com 80 alunos em determinada universidade. 

0 80 59 61 2 98 60 1463 36 85 6 52 63 27 6762 84 92 14 15 10 35 5190 1 81 54 25 9 57 5576 20 96 48 45 54 84 2894 22 88 92 7 32 14 8714 58 90 67 98 85 84 91

• Você pode enxergar algum padrão nestas notas? • Pode descrevê‐las em poucas palavras? Em poucas frases? • Pode dizer se são particularmente altas ou baixas como um 

todo?

81 30 35 31 49 75 95 4995 29 44 90 11 55 39 79

24 64 74 90 96 74 12 25

Page 7: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

6

Page 8: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

7

Page 9: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

1

Dados e variáveis

Prof. Msc. Jeferson Gomes Moriel Junior

Tecnologia em Construção de Edifícios2º semestre - Noturno

Assuntos da aula

• DadosTipos e fontes

• VariáveisTipos e mensuração

• Questionários

Situações que exigem dados• Um analista de pesquisas de mercado precisa avaliar

a eficácia de uma nova propaganda de TV;• Um farmacêutico precisa determinar se uma nova

droga é mais eficaz do que aquelas atualmente emuso;uso;

• Um auditor deseja analisar as transações financeirasde determinada empresa para verificar se ela estácumprindo princípios contábeis adequados;

• Um gerente de operações deseja monitorar umprocesso de produção com o objetivo de descobrir sea qualidade do produto fabricado está conforme ospadrões da empresa.

Tipos de dadosDados primários e Dados Secundários

• Dados Primários: quando os dados sãoobtidos diretamente com os elementos daobtidos diretamente com os elementos dapopulação investigada;

• Dados Secundários: quando não se precisair até os elementos da população para seobter os dados necessários, pois eles jáexistem em uma ou mais publicações ouarquivos.

Fontes de dadosSão quatro as fontes de dados:

• Dados distribuídos por uma organização ou indivíduo Exemplo: Relatórios do governo

• Experimento projetadoExemplo: Testes de laboratório

• Pesquisa de levantamento ou surveyExemplo: Pesquisas de opinião com entrevista ou questionário

• Estudo baseado em observaçõesExemplo: Análise de comportamento para pesquisas de mercado

Dados

Dados Brutos

São observações que tenham sido coletadas(por exemplo medidas realizadas respostas(por exemplo, medidas realizadas, respostasde pesquisas, etc) e que ainda não foramnumericamente organizadas.

O conjunto dessas informações compõe o quese denomina de Banco de Dados.

Page 10: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

2

N Estado Civil

Grau de Instrução

No de filhos

Salário(x s.mínimo) idade Região de

Procedência1 solteiro fundamental - 2,00 26 interior2 casado fundamental 0 2,56 32 capital3 casado fundamental 2 3,25 36 capital4 solteiro médio - 3,73 20 outra5 solteiro fundamental - 2,26 40 outra6 casado fundamental 1 4,66 28 interior7 solteiro fundamental - 2,86 41 interior8 solteiro fundamental - 2,39 43 capital9 casado médio 1 4,59 34 capital

Perfil dos trabalhadores na construção do Ed. XXX, Cuiabá, em Set./2011

10 solteiro médio - 4,44 23 outra11 casado médio 2 4,12 33 interior12 solteiro fundamental - 2,46 27 capital13 solteiro médio - 5,74 37 outra14 casado fundamental 3 2,95 44 outra15 casado médio 0 4,13 30 interior16 solteiro médio - 5,35 38 outra17 casado médio 1 6,77 31 capital18 casado fundamental 2 3,8 39 outra19 solteiro superior - 10,53 25 interior20 solteiro médio - 6,76 37 interior21 casado médio 1 5,06 30 outra22 solteiro médio - 4,59 34 capital

ROL

•Rol é o arranjo dos dados brutos numéricosem ordem crescente ou decrescente, se osdados forem qualitativos o rol é construído emordem alfabéticaordem alfabética.

•Pode-se, pelo rol, verificar de maneira maisclara e rápida o comportamento dos dadosdo conjunto identificando o maior e o menorvalor, além de alguns elementos que podem serepetir várias vezes.

ROL

Idades de funcionários em uma empresa (emforma de rol).

20 23 25 26 26 27 28 29 3030 31 31 32 32 33 33 34 3435 35 36 36 37 37 38 39 4040 41 41 43 43 44 46 46 48

Variáveis

• Variáveis são características que podem serobservadas (ou medidas) em cada elementoda população, sob as mesmas condições.

Tipos de Variáveis

Variável Tipos Descrição Exemplos

QualitativaNominal Sem ordenação. Cor dos olhos, sexo, etc.

Qualitativa(Categórica) Ordinal Com ordenação. Grau de instrução, classe

social, etc.

Quantitativa

(Numérica)

Discretas Por contagem.Número de funcionários;número acidentes de trabalhoocorrido durante um mês, etc.

Contínuas Por medição. Medidas de altura e peso,tempo, etc.

Variáveis• Qualitativas: quando resulta de uma classificação por

tipos, atributos ou qualidade (profissão, nacionalidade, grau de instrução, etc).

• Quantitativas: quando seus valores indicam quantidade, que pode ser:que pode ser:

• – discreta (os valores possíveis formam um conjunto enumerável, finito ou infinito, isto é, assumem valores inteiros, como número de peças defeituosas por lote, número de acidentes de trabalho por mês, etc);

• – contínua (assume qualquer valor dentro de um certointervalo de valores sem vazios, interrupções ou saltos, como peso, altura, pressão, volume, tempo, etc).

Page 11: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

3

Mensuração para variável Qualitativa Nominal

• Trabalhar na sua área de estudo( ) Sim ( ) Não

• Principal característica pessoal( ) Inteligência ( ) Beleza ( ) Modéstia ( ) Outros

Mensuração para variável Qualitativa Ordinal

• Satisfação com o produto( ) Muito satisfeito( ) Relativamente satisfeito( ) Neutro( ) Relativamente insatisfeito( ) Muito insatisfeito( ) Muito insatisfeito

• Nível de escolaridade completo( ) Pós-graduação ( ) Graduação ( ) Ensino médio( ) Ensino fundamental( ) Nenhum

Mensuração para variável Quantitativa discreta

• Dias de atraso da obra______ dias.

• Ano de formatura• Ano de formatura______

• Quantidade de sacos de cimento_____ sacos

Mensuração para variável Quantitativa contínua

• Custo de matéria-primaR$ __________.

• Tempo para construir um muro• Tempo para construir um muro______ hora(s) _______ minutos

Exercício 1. Para cada pergunta do questionário acima escreva qual é a variável abordada e classifique-a.

Page 12: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

4

Exercício 2. Classifique cada uma das variáveis a seguir:

a. Bebidas vendidas numa lanchonete (refrigerante, chá, café e água)b. Tamanho de refrigerantes vendidos numa lanchonete (pequeno, médio

e grande)c. Tempo necessário para baixar um arquivo da internetd. Quantidade de livros comprados no mês

Exercício 3. Uma das variáveis mais incluídas em pesquisas é a renda.Algumas vezes a pergunta é assim formulada “Qual é sua renda (em

i )? R$ ” E t i li it t i t dreais)? R$ _______”. Em outras pesquisas, solicita-se ao entrevistadoque “Marque um X no seu nível de renda” e é fornecida várias faixasde renda para escolha.

a. No primeiro formato, explique a razão pela qual a renda pode ser considerada tanto discreta quanto contínua

b. Qual desses dois formatos você preferiria utilizar em uma pesquisa? Por quê?

c. Qual desses dois formatos iria possivelmente trazer a você uma maior taxa de resposta? Por quê?

Cuidados na elaboração de Questionário

• Não incluir jamais uma pergunta sem ter uma ideia clara da forma de utilizar a sua informação e quanto contribuirá aos objetivos da pesquisa.

• Utilizar vocabulário preciso para perguntar o que realmente se deseja saber Evitar palavras confusas erealmente se deseja saber. Evitar palavras confusas e termos técnicos que não sejam do conhecimento da população a ser entrevistada.

• Evitar duas perguntas em uma.• Facilitar a memória. Limitar as perguntas a um passo

próximo e ajudar o entrevistado a retroceder no tempo passo a passo, até recordar a informação que nos interessa.

• Não obrigar a fazer cálculos. Por exemplo: Quantos pares de meias você compra no ano?

• Não fazer perguntas embaraçosas. Por exemplo: De quantos em quantos dias você toma banho?

• Não fazer uma pergunta que já contenha em si a resposta. Por exemplo: Vai ao parque pelo menos uma vez?

• As perguntas não devem estar direcionadas, nem refletir a posição do pesquisador em relação a determinado assunto. Devem ser formuladas de tal forma que o entrevistado não se considere pressionado a dar uma resposta que acredita ser a opinião do pesquisador.

• Ver mais orientações em (Barbetta, 2008, p. 34-36).

Pré-teste (Questionário piloto) • Refere-se à aplicação prévia do questionário a um

grupo que apresente as mesmas características da população incluída na pesquisa. Serve para:

• Revisar e direcionar aspectos da investigação • Treinar os entrevistadores e analisar os problemas

apresentados durante sua consecução. • Detectar as dificuldades práticas do questionário• Situações em que pouco se conhece sobre o

assunto• Analisar as categorias OUTROS e NÃO SABE

Que programas de televisão o Sr.(a) prefere?

Evidentemente, devem ser acrescentadas novascategorias, tais como novelas, filmes etc. Noquestionário definitivo, a categoria OUTROS deveestar reduzida a uma frequência mínima.

Pré-testePode ser aplicado mais de uma vez, tendo emvista o seu aprimoramento, serve também paraverificar se o questionário apresenta trêsimportantes elementos:

• Fidedignidade: qualquer pessoa que o aplique obterá sempre os mesmos resultados;• Validade: os dados recolhidos são necessários à pesquisa;• Operatividade: vocabulário acessível e significado claro.

Page 13: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

5

1. Quantos dias transcorreram entre a encomenda da mercadoria e seu recebimento? _________ dias.

2. Essa foi sua primeira compra na JEFX? ( ) Sim ( ) Não

3. Você está propensa a adquirir novos produtos da JEFX, durante os próximos 12 meses? ( ) Sim ( ) Não

Perguntas

próximos 12 meses? ( ) Sim ( ) Não

4. Como você classifica o serviço prestado pela JEFX com relação à sua compra recente?( ) Excelente ( ) Muito bom ( ) Regular ( ) Precário

5. Como você classifica a qualidade dos itens que você adquiriu recentemente da JEFX?( ) Excelente ( ) Muito bom ( ) Regular ( ) Precário

EXEMPLO DE PROJETO DE PESQUISA

• Objetivo geral: Conhecer a relação entre o aluno e oseu curso (de Ciências da Computação da UFSC), paraservir de subsídio nas políticas de melhoria do curso.

• Objetivos específicos:

1) Avaliar o nível de satisfação do aluno com o curso que está realizando.

2) Verificar se existe associação entre o nível de satisfação do aluno com o seu desempenho no curso.

3) Levantar os aspectos positivos e negativos do curso, na visão do aluno.

EXEMPLO DE PROJETO DE PESQUISA

• População: Estudantes que estavam cursando as trêsúltimas fases do curso de Ciências da Computação daUFSC, semestre 2011/1.

• Amostra: Optou-se por um processo rápido e fácil paraa seleção da amostra. Foram tomadas três disciplinasç pobrigatórias das três últimas fases e aplicou-se oquestionário em sala de aula. A amostra foi, então,formada pelos alunos presentes nos dias de aplicaçãodos questionários.

Exercício 4. Suponha que o diretor de pesquisa de mercado de uma grandecadeia de lojas de departamentos desejasse conduzir uma pesquisa em umaárea metropolitana para determinar a quantidade de tempo que mulheres quetrabalham fora gastam comprando roupas, em um mês típico.a. Descreva a população e a amostra de interesse, e indique o tipo de

dados que o diretor desejaria coletar.b. Desenvolva um primeiro esboço de questionário necessário em (a),

redigindo três perguntas categóricas e três perguntas numéricas que você acredita apropriadas para essa pesquisa.

E í i 5 U i i t l li d j t 53 000 (NExercício 5. Uma pesquisa virtual realizada junto a quase 53.000 pessoas (N.Hellmich, “Americans go for the quick fix for dinner”, USA Today, 14 fev2005, p. B1) indicou que 37% decidem no último minuto o que fazer parao jantar em casa e que o montante de tempo necessário para preparar ojantar gira em torno de 12 minutos, enquanto o montante de temponecessário para cozinhar o jantar é em média 28 minutos.

a. Qual dentre as quatro categorias de fontes de dados foi utilizada neste estudo?

b. Apresente uma variável categórica discutida neste artigo.c. Apresente uma variável numérica discutida neste artigo.

Exercício 6 (Pesquisa). O Instituto Gallup apresenta os resultados depesquisas recentes em seu endereço http://galluppoll.com. Vá a esseendereço e leia a principal análise feita no dia de sua leitura.a. De um exemplo de variável categórica encontrada na pesquisa.b. De um exemplo de variável numérica encontrada na pesquisa.

Respostas dos exercícios1. 1) qualitativa nominal, 2) quantitativa discreta, 3) quantitativa contínua, 4) qualitativa

nominal, 5) quantitativa contínua, 6) qualitativa nominal, 7) quantitativa contínua, 9) qualitativa ordinal 10) quantitativa discreta 11) quantitativa discreta 12) quantitativaqualitativa ordinal, 10) quantitativa discreta, 11) quantitativa discreta, 12) quantitativa discreta, 13) quantitativa discreta, 14) quantitativa contínua.

2. a) categórica nominal, b) categórica ordinal, c) numérica contínua, d) numérica discreta

3. a) Pois podem haver valores tanto na forma R$ 1200 (aproximados e sem centavos), quanto R$ 985,67 (exatos e com centavos). b) O primeiro se o questionário fosse anônimo (possibilitando respostas mais precisas) e a segunda se houvesse identificação do respondente (usando faixas por salários mínimos). c) O primeiro formato, pois a quantidade de respostas é infinita.

5. a) Pesquisa de levantamento ou survey, b) Decidir fazer o jantar no último minuto. c) A quantidade de tempo necessária para preparar o jantar.

Referência: Cap. 1 de Levine, Stephan, Krehbiel, Berenson. Estatística: usando o Microsoft Excel em português. 5 ed., p. 8-15, LTC.

Page 14: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

AMOSTRAGEM Amostragem é o processo de se obter uma amostra. A pesquisa eleitoral é um caso típico de levantamento por amostragem.

Fonte: Barbetta (2009) • Por que realizar amostragem em levantamentos de grandes populações? • Economia. Em geral, torna-se bem mais

econômico o levantamento de somente uma parte da população.

• Tempo. Numa pesquisa eleitoral, a três dias de uma eleição presidencial, não haveria tempo suficiente para pesquisar toda a população de eleitores do país, mesmo que houvesse recursos financeiros em abundância.

• Confiabilidade dos dados. Quando se pesquisa um número reduzido de elementos, pode-se dar mais atenção aos casos individuais, evitando erros nas respostas.

• Operacionalidade. É mais fácil realizar operações de pequena escala. Um dos problemas típicos nos grandes censos é o controle dos entrevistadores.

• Quando o uso de amostragem não é interessante? • População pequena. Se a população for

pequena (digamos, de 50 elementos) para termos uma amostra capaz de gerar resultados precisos para os parâmetros da população, necessitamos de uma amostra relativamente grande (em torno de 80% da população).

• Característica de fácil mensuração. Talvez a população não seja tão pequena, mas a variável que se quer observar é de tão fácil acesso que não compensa investir num plano de amostragem. Por exemplo, para verificar a porcentagem de funcionários favoráveis à mudança no horário de um turno de trabalho,

podemos entrevistar toda população no próprio local de trabalho.

• Necessidade de alta precisão. A cada dez anos o IBGE realiza um censo demográfico para estudar diversas características da população brasileira. Dentre estas, tem-se o parâmetro número de habitantes residentes no país, que é fundamental para o planejamento por parte do governo. Desta forma, este parâmetro precisa ser avaliado com grande precisão e, por isso, se pesquisa toda população.

TIPOS DE AMOSTRAGEM

Existem dois tipos de amostragem, a probabilística e a não probabilística.

AMOSTRAGEM PROBABILÍSTICA

A – Amostragem Aleatória Simples (AAS) ou Casual

No início deste processo todos os elementos da população têm a mesma probabilidade de fazer parte da amostra.

É equivalente a um sorteio lotérico. Pode ser feita mediante sorteio manual, uso de tabela de números aleatórios ou com o auxílio de programa computacional que gere números aleatórios. B – Amostragem Estratificada

Existem casos em que a população pode ser dividida em grupos que são homogêneos internamente e heterogêneos entre si. Estes grupos bem definidos são denominados de estratos. O sorteio das unidades que farão parte da amostra é efetuado em cada um dos estratos com o uso da amostragem aleatória simples (sorteio).

Situação exemplar: Pesquisa com o público do IFMT/Cuiabá: existem os seguintes estratos bem definidos: Docentes, Técnicos e Estudantes. Caso 1: Amostragem estratificada proporcional

Neste caso, a proporcionalidade do tamanho de cada estrato da população é mantida na amostra. Por exemplo, se um estrato corresponde a 30% da população, ele deve corresponder também a 30% da amostra.

Uma amostragem estratificada proporcional tende a favorecer resultados mais precisos do que uma amostragem aleatória simples quando os subgrupos forem mais homogêneos do que a população como um todo.

Page 15: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

Caso 2: Amostragem estratificada uniforme

Nesta, seleciona-se a mesma quantidade de elementos em cada estrato. No exemplo anterior, para selecionar uma amostra estratificada uniforme de, por exemplo, n = 15 indivíduos do IFMT/Cuiabá, devemos ter 5 Docentes, 5 Técnicos e 5 Estudantes.

A amostragem estratificada uniforme costuma ser usada em situações em que o maior interesse é obter estimativas separadas para cada estrato, ou ainda, quando se deseja comparar os diversos estratos. Assim, os cálculos de médias e proporções devem ser feitos em cada estrato. Caso queira uma média ou proporção global, deve-se agregar os resultados de cada estrato por uma média aritmética ponderada, levando-se em consideração a proporcionalidade de cada estrato na população. C – Amostragem por conglomerados

Consiste em definir uma subpopulação (parte da população que possui suas características gerais) e analisar todas as unidades ali presentes. Por exemplo, numa população de domicílios residenciais de uma cidade, os quarteirões formam conglomerados de domicílios. Então, são selecionados alguns conglomerados e depois investigam todos os elementos do conglomerado.

Ela pode ser feita em vários estágios, em pesquisas de larga escala. Exemplo: “para selecionar uma amostra de domicílios de Santa Catarina, podemos selecionar municípios (primeiro estágio); dos municípios escolhidos, selecionar setores censitários (segundo estágio); e dos setores censitários escolhidos, selecionar domicílios (terceiro estágio)” (Barbetta, 2009).

Ao contrário da amostragem estratificada, esta tende a produzir uma amostra que gera resultados menos precisos quando comparada com uma amostra aleatória simples de mesmo tamanho. Contudo, seu custo benefício tende a ser bem menor. D – Amostragem Sistemática

É uma variação da AAS, usada quando a população está naturalmente ordenada (exemplo: lista telefônica, lista de chamada, banco de dados, disposição das casas em uma rua, etc). O processo consiste em: 1) Calcular o intervalo de amostragem (salto): S = N

n , aproximando para o número inteiro mais próximo. 2) Sortear um número X entre 1 e S. 3) Formar a amostra com os elementos:

x; x + a; x + 2a; x + 3a; x + 4a; ...

AMOSTRAGEM NÃO PROBABILÍSTICA A – Amostragem Acidental

A amostra é formada por elementos que vão aparecendo no local da coleta de dados. Geralmente utilizada em pesquisas de opinião. Exemplo: pesquisar a opinião das pessoas que passam em uma determinada praça sobre o uso de cosmético para rugas. B – Amostragem por quotas

Semelhante à amostragem estratificada proporcional, mas não faz sorteio. C – Amostragem por Julgamento ou por Conveniência

Consistem em selecionar a amostra com elementos julgados como típicos da população que se deseja estudar. Exemplo: pesquisar a opinião sobre o uso de cosmético para rugas abordando somente mulheres que aparentam ter idade superior a 40 anos.

ATIVIDADE: Analise o(s) tipo(s) de amostragem utilizada em cada situação a seguir. 1) Para coletar dados sobre a saúde de um rebanho de vacas, seleciona-se por sorteio 2 por cento das vacas. 2) Para saber a opinião dos alunos do curso de Ciências Contábeis da UEL, um pesquisador sorteia uma turma e entrevista todos os alunos da mesma. 3) Para identificar a situação do mercado de cimento de determinada cidade, se obtém a lista de todas as lojas de construção da mesma e se escolhe a oitava de cada vinte lojas, ordenadas alfabeticamente. 4) Desejo saber como vai a popularidade de meu oponente político. Para isso, envio o questionário a vinte de meus amigos. 5) Quando escreveu Woman in Love: A Cultural Revolution, a autora Shere Hite baseou suas conclusões em 4.500 respostas de 100.000 questionários distribuídos a mulheres, segundo sua percepção de respostas melhores. 6) Uma psicóloga da Universidade de Nova York faz uma pesquisa sobre alguns alunos selecionados aleatoriamente de todas as 20 turmas que participaram desta pesquisa. 7) Um sociólogo da Universidade Federal do Paraná sorteia 12 homens e 12 mulheres de cada uma de quatro turmas de inglês. 8) A empresa Sony seleciona cada 200º. CD de sua linha de produção e faz um teste de qualidade rigoroso. 9) Um cabo eleitoral escreve o nome de cada senador dos EUA em cartões separados, mistura-os e extrai 10 nomes aleatoriamente. 10) Gerente comercial da America OnLine testa uma nova estratégia de vendas selecionando aleatoriamente 250

Page 16: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

consumidores com renda inferior a US$50.000,00 e 250 consumidores com renda de ao menos de US$50.000,00. 11) O programa Planejamento Familiar sorteia e pesquisa 500 homens e 500 mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais. 12) Um repórter da revista Business Week entrevista todo o 50.º gerente geral constante da relação das 1.000 empresas com maior cotação de suas ações. 13) Um repórter da revista Business Week obtém uma relação numerada das 1.000 empresas com maior cotação de ações na bolsa, utiliza um computador para gerar 25 números aleatórios e então entrevista gerentes gerais das empresas correspondentes aos números extraídos. 14) Um pesquisador precisa saber o estado de saúde bucal dos habitantes de uma cidade. Para isso, divide-a em regiões com características homogêneas internamente e heterogêneas entre si, e entrevista 5% dos habitantes de cada região, selecionados aleatoriamente dentro de cada região. 15) Um repórter de noticiário da rede Globo analisa a reação a uma história impressionante entrevistando pessoas que passam em frente ao seu estúdio. 16) O comissário de jurados do Condado de Dutches obtém uma lista de 42.763 proprietários de carros e obtém um conjunto de jurados selecionando cada centésimo nome da lista. 17) Em uma pesquisa do Gallup de 1059 adultos, os sujeitos da entrevista foram selecionados usando-se um computador para gerar aleatoriamente números de telefones, que eram então discados. 18) Uma pesquisadora da General Motors dividiu todos os carros registrados em categorias de subcompacto, compacto, médio, intermediário e grande. Ele está sorteando e pesquisando 200 proprietários de carro de cada categoria. 19) Motivado pelo fato de um estudante ter morrido por excesso de bebida, uma faculdade fez um estudo do hábito de bebida dos estudantes, selecionando aleatoriamente 10 classes diferentes e entrevistando todos os estudantes em cada uma dessas classes. 20) Em um ponto de checagem de sobriedade da polícia, cada quinto chofer era parado e entrevistado. 21) Um economista está estudando o efeito da educação sobre o salário e realiza uma pesquisa com 150 trabalhadores selecionados aleatoriamente de cada uma das seguintes categorias: menos do que Ensino Médio; Ensino Médio; mais do que Ensino Médio. 22) Uma rede de notícias está planejando uma pesquisa na qual 100 seções eleitorais serão selecionadas aleatoriamente e todos os eleitores serão entrevistados ao deixarem o local. 23) Um estudante de estatística obtém dados sobre altura/peso entrevistando membros da família. 24) Um pesquisador da UEL examina todos os pacientes cardíacos de cada um dos 30 hospitais selecionados aleatoriamente.

25) Um especialista em Marketing para a MTV está planejando uma pesquisa na qual 500 pessoas serão selecionadas aleatoriamente de cada faixa etária de 10-19, 20-29, e assim por diante. 26) Um farmacêutico mistura bem um recipiente com 1000 comprimidos de Bufferin e retira, então, 50 que devem ser testados para verificar o conteúdo exato de aspirina. 27) Um repórter de notícias se coloca em uma esquina e obtém uma amostra de residentes da cidade selecionando cinco adultos que passam e perguntando sobre seus hábitos de fumo. 28) Um engenheiro de controle da qualidade seleciona cada centésima fonte de computador que passa em uma esteira transportadora. 29) O shopping do Vale planeja realizar uma pesquisa de mercado com 100 homens e 100 mulheres em Cachoeirinha, a qual possui um número aproximadamente igual de homens e mulheres. 30) Uma loja de construção classificou toda sua carteira de clientes como compradores de pequeno, médio e grande porte, contabilizando 450, 750 e 300 clientes, respectivamente. Em seguida, sorteou e pesquisou 30, 50 e 20 clientes de cada categoria, respectivamente.

Uma fórmula para calcular o tamanho mínimo da amostra Sejam : N o tamanho (número de elementos) da população; n o tamanho (número de elementos) da amostra; n0 uma primeira aproximação para o tamanho da amostra E0 o erro amostral tolerável. Um primeiro cálculo do tamanho da amostra pode ser feito, mesmo sem conhecer o tamanho da população, através da seguinte expressão:

20

01

En =

Conhecendo o tamanho N da população, podemos

corrigir o cálculo anterior, por:

0

0.nN

nNn+

=

Interpretação do Erro Amostral Na divulgação de pesquisas eleitorais, é comum encontrarmos no relatório: “a presente pesquisa tolera um erro de 2%”. Isto quer dizer que quando a pesquisa aponta determinado candidato com 30% de preferência do eleitorado, está afirmando que a preferência por este candidato em toda população é um valor do intervalo de 28% a 32% (isto é, 30% ± 2%).

Page 17: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

Respostas: 1) AAS 2) Conglomerado 3) Sistemática 4) Julgamento 5) Julgamento 6) AAS 7) Estratificada unif. 8) Sistemática 9) AAS 10) Estratificada unif. 11) Estratificada unif. 12) Sistemática 13) AAS 14) Estratificada unif. 15) Acidental 16) Sistemática 17) AAS 18) Estratificada unif. 19) Conglomerado 20) Sistemática 21) Estratificada unif. 22) Conglomerado 23) Julgamento 24) Conglomerado 25) Estratificada unif. 26) AAS 27) Julgamento 28) Sistemática 29) Cotas 30) Estratificada proporcional.

Atenção:

“O cálculo do tamanho da amostra é um problema complexo e [...] ficaremos restritos ao caso da amostragem aleatória simples. Também não abordaremos aspectos financeiros, mesmo sabendo que muitas vezes o tamanho da amostra fica restrito aos recursos disponíveis. A heterogeneidade da população e os tipos de parâmetros que se quer estimar (proporções, médias, etc) são pontos importantes na determinação do tamanho da amostra. Esses pontos entrarão em fórmulas mais refinadas [posteriormente nesta disciplina]. Ficaremos restritos a uma formulação bastante genérica, usada em pesquisas em que queremos usar a amostra para estimar diversas proporções (ou porcentagens)” (Barbetta, 2008, p. 57). Conceito de erro amostral Parâmetro é uma medida que descreve certa característica da população. Estatística (ou estimador) é uma medida que descreve certa característica da amostra. Uma estatística é usada para avaliar ou estimar um parâmetro. Exemplo: Na população de trabalhadores em uma obra, a porcentagem de trabalhadores com graduação é o parâmetro π. Numa amostra de trabalhadores de uma obra, a porcentagem de trabalhadores com graduação é a estatística P Assim, P é um estimador do parâmetro π. Erro amostral é a diferença entre a estatística e o parâmetro que se quer estimar. “Para a determinação do tamanho da amostra, o pesquisador precisa definir o erro amostral tolerável, ou seja, quanto ele admite errar na avaliação do(s) parâmetro(s) de interesse. Por exemplo, na divulgação de pesquisas eleitorais, é comum encontrarmos no relatório: “a presente pesquisa tolera um erro de 2%”. Isto quer dizer que quando a pesquisa aponta determinado candidato com 30% de preferência do eleitorado, está afirmando que a preferência por este candidato em toda população é um valor do intervalo de 28% a 32% (isto é, 30% ± 2%). A especificação do erro amostral tolerável deve ser feita sob um enfoque probabilístico, pois, por maior que seja a amostra, existe o risco de o sorteio gerar uma amostra com características bem diferentes das características da população de onde ela está sendo extraída. Consideraremos o nível de confiança de 95%. Assim, se fixarmos o erro amostral em 2% estaremos afirmando que uma estatística, calculada com base na amostra a ser selecionada, não deve diferir do parâmetro em mais do que 2%, com 95% de probabilidade.” (Barbetta, 2008, p. 57-58).

Page 18: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

Exemplo 01: Deseja-se fazer um levantamento por amostragem para avaliar certas características da população das N = 15.000 alunos do IFMT. Qual deve ser o tamanho mínimo de uma amostra aleatória simples, de maneira que possamos admitir com alta confiança, que os erros amostrais não ultrapassem 2% (E0 = 0,02)? RESOLUÇÃO

– Uma primeira aproximação: n0 = 2) 0,02 (1 =

0004,01 = 2.500 alunos.

– Fazendo a correção, em função do tamanho da população, teremos:

n = 2.143 2.500 15.0002.500 x 000.15

=+

alunos .

– Para manter o erro amostral, foi necessária uma amostra abrangendo 14,3% da população (2.143 elementos extraídos de 15.000).

OBSERVAÇÃO: De uma maneira geral, se a população for muito grande, podemos usar o n0 como o tamanho da amostra. Então, o cálculo do tamanho da amostra pode ser feito pela expressão:

n = n0 = 20

1E

sem levar em consideração o tamanho da população. Exercício: Complete a tabela abaixo calculando o tamanho mínimo da amostra.

Tabela. Tamanho mínimo de amostra calculado para uma margem de erro de 3% e 5%.

POPULAÇÃO (N)

TAMANHO MÍNIMO DA AMOSTRA (n)

MARGEM DE ERRO

3%

MARGEM DE ERRO

5%

100 1.000 5.000 20.000 100.000 500.000

1.000.000 Resposta: 3%: 92, 527, 910, 1053, 1099, 1109, 1110, ; 5%: 80, 286, 371, 393, 399, 400, 400

Page 19: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

1

Distribuição de frequências e Tabelas

Prof. Msc. Jeferson Gomes Moriel Junior

Tecnologia em Construção de Edifícios2º semestre - Noturno

N Estado Civil

Grau de Instrução

No de filhos

Salário(x s.mínimo) idade Região de

Procedência1 solteiro fundamental - 2,00 26 interior2 casado fundamental 0 2,56 32 capital3 casado fundamental 2 3,25 36 capital4 solteiro médio - 3,73 20 outra5 solteiro fundamental - 2,26 40 outra6 casado fundamental 1 4,66 28 interior7 solteiro fundamental - 2,86 41 interior8 solteiro fundamental - 2,39 43 capital9 casado médio 1 4,59 34 capital

Perfil dos trabalhadores na construção do Ed. XXX, Cuiabá, em Set./2011

10 solteiro médio - 4,44 23 outra11 casado médio 2 4,12 33 interior12 solteiro fundamental - 2,46 27 capital13 solteiro médio - 5,74 37 outra14 casado fundamental 3 2,95 44 outra15 casado médio 0 4,13 30 interior16 solteiro médio - 5,35 38 outra17 casado médio 1 6,77 31 capital18 casado fundamental 2 3,8 39 outra19 solteiro superior - 10,53 25 interior20 solteiro médio - 6,76 37 interior21 casado médio 1 5,06 30 outra22 solteiro médio - 4,59 34 capital

Como pesquisadores procedem para transformar essa massa de dados em uma forma resumida e de maior facilidade de

compreensão?compreensão?

O primeiro passo é construir uma distribuição de frequências, ou seja, tabelas.

Etapas da construção de distribuição de frequências

1º – Definir as classes disjuntas (intervalos ou categorias) em que os dados serão agrupados; 2º – Enquadramento dos dados nessas classes; 3º – Contagem do número de elementos em cada classe.

Exercício:

Vamos construir Distribuições de frequências

para cada variável dopara cada variável do Banco de Dados a seguir.

1º para variáveis qualitativas2º para variáveis quantitativas

N Estado Civil

Grau de Instrução

No de filhos

Salário(x s.mínimo) idade Região de

Procedência1 solteiro fundamental - 2,00 26 interior2 casado fundamental 0 2,56 32 capital3 casado fundamental 2 3,25 36 capital4 solteiro médio - 3,73 20 outra5 solteiro fundamental - 2,26 40 outra6 casado fundamental 1 4,66 28 interior7 solteiro fundamental - 2,86 41 interior8 solteiro fundamental - 2,39 43 capital9 casado médio 1 4,59 34 capital

10 solteiro médio - 4,44 23 outra11 casado médio 2 4 12 33 interior

Perfil dos trabalhadores na construção do Ed. XXX, Cuiabá, em Set./2011

11 casado médio 2 4,12 33 interior12 solteiro fundamental - 2,46 27 capital13 solteiro médio - 5,74 37 outra14 casado fundamental 3 2,95 44 outra15 casado médio 0 4,13 30 interior16 solteiro médio - 5,35 38 outra17 casado médio 1 6,77 31 capital18 casado fundamental 2 3,8 39 outra19 solteiro superior - 10,53 25 interior20 solteiro médio - 6,76 37 interior21 casado médio 1 5,06 30 outra22 solteiro médio - 4,59 34 capital23 solteiro médio - 5,74 37 outra24 casado fundamental 3 2,95 44 outra25 casado médio 0 4,13 30 interior

Page 20: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

2

Distribuição de Variáveis contínuas

Analisando a variável Salário

As classes não são dadas, então temos que calcular :

(n < 30)

(n > 30)

Exercício 1: Construa uma distribuição de frequenciapara o consumo de argamassa (em toneladas) de 50construções em Cuiabá:

Resposta: Distribuição de frequência completaResposta: Distribuição de frequência completa

20 23 25 26 26 27 28 29 30 3030 31 31 32 32 33 33 34 34 3435 35 36 36 40

Exercício 2: Construa uma distribuição de frequênciacom os dados das idades dos trabalhadores de umaobra:

Exercício 3: A construção de um edifício no Centro deCuiabá tem ocasionado transtorno no trânsito, pois bloqueiaparte da rua para o descarregamento de um caminhão. Emcada dia que isto ocorria, era anotado o número de horas deobstrução da rua:

2 1 3 2 3 5 3 1 2 61 4 3 1 3 1 5 3 4 42 1 3 1 2 2 1 2 2 1

a) Construa uma distribuição de frequência com 6 classes. b) Em quantos dias houve mais de 4 horas de obstrução?c) Em quantos dias houve exatamente 2 horas de obstrução?d) Em quantos dias houve mais de 2 e menos de 6 horas de

obstrução?

2 1 3 1 2 2 1 2 2 11 1 1 2 4 5 3 4 3 43 3 5 2 1 6 1 2 4 6

Exercício 4: Os valores a seguir representam as alturas(em m) de 40 prédios em certa cidade.

62 63 48 66 69 54 70 66 64 6559 75 55 63 71 72 70 57 76 5757 65 58 58 60 58 63 65 64 7850 68 66 69 52 70 72 65 62 64

Utilize o símbolo “|⎯” que significa que o intervalo é fechadono extremo inferior e aberto no superior.a) Construir uma distribuição de frequência adequada.b) Encontrar a frequência acumulada crescente e o ponto

médio para todas as classes.

Exercício 5: No rol abaixo estão as receitas brutas 50construtoras (em milhões de reais).

1,2 1,8 3,3 3,3 3,4 3,6 3,7 3,7 3,9 4,24,3 4,8 4,9 5,4 5,4 5,5 5,5 5,6 5,8 6,06,3 6,5 6,6 6,3 6,3 6,9 6,1 6,4 8,5 8,58,9 9,4 9,5 9,7 10,0 10,2 10,5 11,0 11,5 11,6

Construa a distribuição de frequência completa para os dadosacima. Utilize o símbolo “|⎯” que significa que o intervalo éfechado no extremo inferior e aberto no superior.

12,6 12,8 13,4 13,9 14,1 16,6 17,0 17,2 19,8 22,9

Page 21: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

3

Tabelas (ou Séries)

Tabelas

Elementos essenciais

• Título – indica a natureza do fato estudado(o quê?), o local (onde?) e a época( q ) ( ) p(quando?).• Corpo – é o conjunto de linhas e colunas quecontém as informações.• Cabeçalho – designa a natureza doconteúdo de cada coluna.• Coluna indicadora – mostra a natureza doconteúdo de cada linha.

Tabelas TabelasSinais Convencionais

- (hífen), quando o valor numérico é nulo;

... (reticência), quando não se dispõe do dado;... (reticência), quando não se dispõe do dado;

0; 0,0; 0,00 (zero), quando o valor numérico é muito pequeno para ser expresso pela unidade utilizada, respeitando o número de casas decimais adotado;

Nenhuma casela da tabela deve ficar em branco,apresentando sempre um número ou sinal.

Tabelas

RODAPÉ

• Fonte – é o indicativo da entidade responsável pela sua organização ouresponsável pela sua organização ou fornecedora dos dados primários.• Notas – são colocadas para esclarecimentos de ordem geral.• Chamadas – servem para esclarecer minúcias em relação às “caselas”, colunas ou linhas.

EXCESSO!

Page 22: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

4

Tipos de Tabelas (ou Séries)

CronológicaGeográficaCategórica

Dupla entrada

CRONOLÓGICA

Ano Produção(mil t)

2006 41 89

Produção de cimento no Brasil nos últimos cinco anos

2006 41.8952007 46.5512008 51.9702009 51.7472010 59.117Total 251.280

Fonte: Sindicato Nacional da Indústria de Cimento-SNIC.http://www.cbicdados.com.br/files/tabela069.xls

GEOGRÁFICA

Estado Consumo total(em toneladas)

G

Consumo mensal de cimento em 2010 por estados brasileiros

Mato Grosso 1.099.340Mato Grosso do Sul 813.149

Goiás 2.657.527Distrito Federal 1.167.604

Fonte: Sindicato Nacional da Indústria de Cimento-SNIC.http://www.cbicdados.com.br/files/tabela070.xls

GEOGRÁFICA

Fonte: Instituto Nacional de Estatística – INE/IP. Estatísticas da Construção e Habitação. 2009.

CATEGÓRICA

EMPRESA Receita Bruta em 2010 (R$ x 1.000)

1 Norberto Odebrecht 6.111.7442 Camargo Corrêa 5 258 235

Dez maiores construtoras do Brasil - 2011

2 Camargo Corrêa 5.258.2353 Andrade Gutierrez 4.484.1684 Queiroz Galvão 3.908.0845 OAS 3.242.1446 Delta Construções 3.023.3207 Galvão Engenharia 2.422.9088 MRV 1.839.2369 Construcap 1.602.60110 Mendes Júnior 1.565.246

Fonte: Revista "O Empreiteiro" - Julho de 2011.Elaboração: Banco de Dados-CBIC.

TABELA DE DUPLA ENTRADA

Page 23: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

5

TABELA DE DUPLA ENTRADA

Fonte: Instituto Nacional de Estatística – INE/IP. Estatísticas da Construção e Habitação. 2009.

Exercício

Classifique cada uma das tabelas a seguirem cronológica, geográfica, categórica oudupla entradadupla entrada.

Tabela 1 Tabela 2

Geração de vagas formais na

Tabela 3 Tabela 4

Page 24: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

6

Tabela 5

Taxa de homicídios (2005)

Estado Consumo total(em toneladas)

G

Consumo mensal de cimento em 2010 por estados brasileiros

Tabela 6

Minas Gerais 4.087.925Espírito Santo 746.891Rio de Janeiro 2.492.694

São Paulo 8.468.957Fonte: Sindicato Nacional da Indústria de Cimento-SNIC.http://www.cbicdados.com.br/files/tabela070.xls

Tabela 7 Tabela 8

Base de informações sobre a construção civil brasileirahttp://www.cbicdados.com.br

Page 25: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

1

Gráficos estatísticos

Prof. Msc. Jeferson Gomes Moriel Junior

Tecnologia em Construção de Edifícios2º semestre - Noturno

Gráficos

• Além da apresentação de sériesestatísticas na forma tabular (tabelas),podemos representá-las graficamente.

• O gráfico constitui um elemento básico naanálise e apresentação dos trabalhosestatísticos, trabalhos estes queencontramos nas mais diversas áreas.

1. Elementos de um gráfico2. O que não fazer num gráfico!3. Principais tipos de gráfico4. Qual gráfico usar?5. Construindo gráficos (manualmente)

1. Elementos de um gráficog

• O gráfico deverá possuir:

- Título geral indicando “o que”, “quando” e“onde” da situação estudada;

- as escalas e as respectivas unidades dedidmedida;

- fonte de informação de onde foram retiradosos valores;

- legendas e notas, quando necessário.

Umidade do ar de Natal/RN (2001 a 2003)

(%)

Page 26: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

2

• Os gráficos são úteis para apresentarinformações com:

Simplicidade Conter somente o essencial

ClarezaPossibilitar “boa” compreensão e ser autoexplicativo

VeracidadeCorresponder à realidade pesquisada

2. O que não fazer num gráficoq g

Quatro mandamentos

Não poluirásNão poluirás.Não distorcerás.

Não perspectivarás.Não ocultarás.

Quatro mandamentos

Não poluirásNão poluirás.Não distorcerás.

Não perspectivarás.Não ocultarás.

Quatro mandamentos

Não poluirásNão poluirás.Não distorcerás.

Não perspectivarás.Não ocultarás.

Jeferson
Typewritten Text
>>>>>>
Jeferson
Typewritten Text
>>>>>>
Page 27: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

3

Umidade do ar de Natal/RN (2001 a 2003)

As variações mensais da umidade do ar nos três anosparecem acontecer de forma bem suave (lenta)...Uma escala inadequada para o gráfico pode confundiro leitor.

Umidade do ar de Natal/RN (2001 a 2003)

• Recomenda-se que o gráfico possua um formatoaproximadamente quadrado.

REFRIGERANTES PREFERIDOS DE 950CRIANÇAS DA ESTÔNIA (2001)

500

Qtde de

FONTE: Dados fictícios.

250

0

e crianças

Marca de refrigerante

Quatro mandamentos

Não poluirásNão poluirás.Não distorcerás.

Não perspectivarás.Não ocultarás.

QUANTIDADE DE USUÁRIOS DO ORKUT EM 2008

110

120

130

140

150

Índices da Indústria.

1975

1976

1977

1978

1979

1980

1981

1982

1983

1984

90

100

Emprego Produção

FONTE: Braule, R. 2001.

Jeferson
Typewritten Text
>>>>>>
Page 28: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

4

Quatro mandamentos

Não poluirásNão poluirás.Não distorcerás.

Não perspectivarás.Não ocultarás.

Quantidade de açúcar nos cereais para crianças (Mercado brasileiro - 2000).

Errado! Pode induzir a uma interpretação distorcida

Quantidade de açúcar nos cereais para crianças (Mercado brasileiro - 2000).

Um gráfico, construído para mostrar grandezas absolutas,deverá ter uma linha zero claramente definida e uma escala dequantidades ininterrupta.

Consumo de cimento no Sudeste do Brasil (1992)

MG

? ? ?MGESRJSP

?

Quatro mandamentos

Não poluirás.Não distorcerás.

Não perspectivarás.ão pe spec a ásNão ocultarás.

Para ver mais usos indevidos de gráficos e questões éticas consultar Seção 2.6 (p.56) de Levine, Stephan, Krehbiel, Berenson. Estatística: usando o Microsoft Excel em português. 5 ed. LTC.

3. Principais tipos de gráficop p g

Jeferson
Typewritten Text
>>>>>>
Page 29: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

5

• Podemos dividir os gráficos em grupos:

• os cartogramas;g ;• os pictogramas;• os estereogramas e• os diagramas.

• Cartograma - Mapa ou quadro em que, pormeio de pontos, figuras e linhas,previamente convencionados sepreviamente convencionados, serepresenta um fenômeno quanto à sua áreade ocorrência, importância, movimentaçãoe evolução.

Censo 2010 sobre população brasileira

• Pictograma – constitui um dos processosgráficos que melhor fala ao público, pelasua forma ao mesmo tempo atraente esua forma ao mesmo tempo atraente esugestiva. A representação gráfica constade figuras.

REFRIGERANTES PREFERIDOS DE 950CRIANÇAS DA ESTÔNIA (2001)

500

Qtde de

FONTE: Dados fictícios.

250

0

e crianças

Marca de refrigerante

Page 30: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

6

• Estereograma - representa volumes e éapresentado em três dimensões sendo,portanto necessário algum conhecimentoportanto, necessário algum conhecimentode perspectiva.

• Diagrama é um gráfico geométrico disposto emduas dimensões.

• São os gráficos mais usados.• Apresentam uma grande variedade de tipos,

dentre os quais estudaremos:

Gráfico de curvas;Gráfico de curvas; Gráfico de barras;

Gráfico de colunas;Gráfico de setores;

Histogramas;Polígono de frequência e Box plot (posteriormente).

Gráfico de curvas

Evidencia como o fenômeno está crescendo oudecrescendo em um período de tempo.

600 000

800.000

1.000.000

1.200.000

m to

nela

das)

Consumo de cimento no MatoGrosso (1980-2010)

0

200.000

400.000

600.000

1.975 1.980 1.985 1.990 1.995 2.000 2.005 2.010 2.015

Con

sum

o (e

m

AnoFonte: Sindicato Nacional da Indústria do Cimento-SNIC.Elaboração: Banco de Dados-CBIC

Page 31: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

7

MATO GROSSO

Ano Toneladas

1.980 395.7901.981 442.5821.982 201.3461.983 216.2881.984 208.4701.985 267.1671.986 286.6321.987 299.0621.988 348.9171.989 370.5711.990 340.6241.991 315.2521.992 300.1811.993 337.269

600.000

800.000

1.000.000

1.200.000

(em

tone

lada

s)

Consumo de cimento no Mato Grosso(1980-2010)

1.994 417.3011.995 370.8691.996 440.2631.997 480.3421.998 498.6381.999 540.0862.000 572.8742.001 639.8922.002 718.8832.003 668.5752.004 716.6822.005 737.6342.006 701.5482.007 840.9012.008 994.9572.009 998.4652.010 1.095.492

0

200.000

400.000

1.970 1.980 1.990 2.000 2.010 2.020

Con

sum

o

Ano

“A evolução do parque habitacional do país caracterizou-se por uma taxade crescimento acima de 1% de 1998 a 2002, ano em que se atingiu umataxa máxima de crescimento de 1,4% (Figura 2), mas nos anos seguintestem-se vindo a registrar taxas decrescentes, com um mínimo de 0,75% noano de 2009.”

Fonte: Instituto Nacional de Estatística – INE/IP. Estatísticas da Construção e Habitação. 2009.

Gráfico de Barras/Colunas

• Tem por finalidade comparar grandezas,por meio de retângulos de igual largura,porém de alturas proporcionais aos dadosporém de alturas proporcionais aos dados.

Barras (vertical)Colunas (horizontal)

Ônibus

Outros

rans

port

e

Modo como os empregados de uma Construtorade Cuiabá vão ao trabalho – Jun/2000

0% 20% 40% 60% 80% 100%

Bicicleta

Divide carro

Percentual

Mei

o de

tr

superior

nsin

o

Escolaridade dos trabalhadores da ConstrutoraJEFX, Cuiabá, em Set./2011

0% 10% 20% 30% 40% 50% 60%

fundamental

médio

Nív

elde

e

Page 32: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

8

Cursos Superiores em Tecnologia com as melhores bolsas-auxílio no Brasil em 2011

800

1000

1200

1400

0

200

400

600

Secretariado Construção Civil

Mecânica Comércio Exterior

Processos Gerais

Informática Sistemas de informação

Gestão de Qualidade

Marketing Design

Fonte: Núcleo Brasileiro de Estágios ‐ Nube. "Valores pagos aos estagiários do Brasil". 2011.

Avaliação do proprietário em relação ao apartamento recém-entregue pela construtora BMV (Cuiabá, 2011)

25%

30%

35%

40%

45%

entu

al

Fonte: Dados fictícios.

0%

5%

10%

15%

20%

Muito Satisfeito

Pouco Satisfeito

Regular Pouco insatisfeito

Muito insatisfeito

Perc

e

Nível de satisfação

Pra que três gráficos se podemos fazer só um?

139

181

115

166

100

120

140

160

180

200

sde

USD

$

Balança comercial do Brasil (2009-2010)

23 15

-

20

40

60

80

2009 2010

Bilh

ões

Exportações Importações Diferença

300.000

400.000

500.000

600.000

População de cidades de Mato Grosso, 2011

0

100.000

200.000

Cuiabá Várzea Grande

Rondonópolis Sinop Cáceres

População em 2010 População em 2000Fonte: Dados fictícios.

Page 33: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

9

40%50%60%70%80%90%

100%

Médio

Nível de instrução por estrato social (SC/2000)

0%10%20%30%

0%

(Nível B) (Nível C) (Nível E)

Res. Monte Verde Parque da Figueira Encosta do Morro

Localidade

FundamentalNenhum

Figura 6. Edifícios construídos por Tipo de obrade acordo com a Finalidade (Portugal – 2009)

Fonte: Instituto Nacional de Estatística – INE/IP. Estatísticas da Construção e Habitação. 2009.

Fonte: Instituto Nacional de Estatística – INE/IP. Estatísticas da Construção e Habitação. 2009.

Gráfico de Setores

• Usado para evidenciar quanto cada parterepresenta no todo, através do uso deum círculoum círculo.

Nível de escolaridade de funcionários da Construtora JEFX, 2011

Nenhum 5% Ensino

fundamental 10%

Especialização

Mestrado 5%

Doutorado 5%

Pós-doutorado 0%

Outros 5%

Fonte: Dados fictícios.

Ensino Médio 40%

Superior 20%

10%

Nenhum 5%

Ensino fundamental 10%

Especialização 10%

Mestrado 5%

Doutorado 5%

Pós-doutorado 0%

Outros 5%

Nível de escolaridade de funcionários da Construtora JEFX, 2011

Ensino Médio 40%

Superior 20%

Fonte: Dados fictícios.

Page 34: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

10

Fonte: Instituto Nacional de Estatística – INE/IP. Estatísticas da Construção e Habitação. 2009.

Histograma

• É usado para construir um gráfico a partirde uma distribuição de frequência, ondetemos os intervalos de classe.

• As colunas ficam justapostas (aocontrário do gráfico de colunas) porqueonde termina o primeiro intervalo declasse começa o segundo e assimsucessivamente (variável contínua).

iEstaturas

(cm)fi

12

150 |-- 154154 | 158

49

Tabela. Estaturas de 40 alunos do IFMT/2011

6789

101112

ênci

as

Estaturas de 40 alunos do IFMT/2011

23456

154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174

911853

Dados: Fictícios.

0123456

142 146 150 154 158 162 166 170 174 178 182

Estaturas (cm)

Freq

üê

Page 35: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

1

Representação Gráfica de uma Distribuição de Freqüências

• Podemos representargraficamente a distri-buição de freqüências,ao lado por 3 modos

iEstaturas

(cm)fi

Tabela 5.6 Estaturas de 40 alunos do IFMT/2011

ao lado, por 3 modosdiferentes:

123456

150 |-- 154154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174

4911853

Dados: Fictícios.

• Histograma• Polígono de Freqüência• Polígono de Freqüência Acumulada

iEstaturas

(cm)fi

12

150 |-- 154154 | 158

49

Tabela 5.6 Estaturas de 40 alunos do IFMT/2011

6789

101112

ênci

as

Histograma

23456

154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174

911853

Dados: Fictícios.

0123456

142 146 150 154 158 162 166 170 174 178 182

Estaturas (cm)

Freq

üêi

Estaturas(cm)

fi

12

150 |-- 154154 | 158

49

Tabela 5.6 Estaturas de 40 alunos do IFMT/2011

6789

101112

ênci

as

23456

154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174

911853

Dados: Fictícios.

0123456

142 146 150 154 158 162 166 170 174 178 182

Estaturas (cm)

Freq

üê

Encontremos o Ponto médio de cada intervalo (Xi)

152 156 160 164 168 172

iEstaturas

(cm)fi

12

150 |-- 154154 | 158

49

Tabela 5.6 Estaturas de 40 alunos do IFMT/2011

6789

101112

ênci

as

148 176

23456

154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174

911853

Dados: Fictícios.

0123456

142 146 150 154 158 162 166 170 174 178 182

Estaturas (cm)

Freq

üê

Encontremos o Ponto médio de cada intervalo (Xi)

152 156 160 164 168 172

iEstaturas

(cm)fi

12

150 |-- 154154 | 158

49

Tabela 5.6 Estaturas de 40 alunos do IFMT/2011

6789

101112

ênci

as

148 176

23456

154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174

911853

Dados: Fictícios.

0123456

142 146 150 154 158 162 166 170 174 178 182

Estaturas (cm)

Freq

üê

152 156 160 164 168 172

iEstaturas

(cm)fi

12

150 |-- 154154 | 158

49

Tabela 5.6 Estaturas de 40 alunos do IFMT/2011

6789

101112

ênci

as

Polígono de Freqüência

148 176

23456

154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174

911853

Dados: Fictícios.

0123456

142 146 150 154 158 162 166 170 174 178 182

Estaturas (cm)

Freq

üê

152 156 160 164 168 172

Page 36: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

2

iEstaturas

(cm)fi Fac

12

150 |-- 154154 | 158

49

413

Tabela 5.6 Estaturas de 40 alunos do IFMT/2011

Polígono de Freqüência Acumulada

202428323640

Acu

mul

ada

23456

154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174

911853

1324323740

Dados: Fictícios.

Calculemos a Freqüência Acumulada de cada intervalo (Fac)

048

121620

142 146 150 154 158 162 166 170 174 178 182

Estaturas (cm)

Freq

üênc

ia 20

2428323640

Acu

mul

ada

iEstaturas

(cm)fi Fac

12

150 |-- 154154 | 158

49

413

Tabela 5.6 Estaturas de 40 alunos do IFMT/2011

Polígono de Freqüência Acumulada

048

121620

142 146 150 154 158 162 166 170 174 178 182

Estaturas (cm)

Freq

üênc

ia 2

3456

154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174

911853

1324323740

Dados: Fictícios.

202428323640

Acu

mul

ada

iEstaturas

(cm)fi Fac

12

150 |-- 154154 | 158

49

413

Tabela 5.6 Estaturas de 40 alunos do IFMT/2011

Polígono de Freqüência Acumulada

048

121620

142 146 150 154 158 162 166 170 174 178 182

Estaturas (cm)

Freq

üênc

ia 2

3456

154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174

911853

1324323740

Dados: Fictícios.

Exercício. Construa um Gráfico de polígonode frequência e outro de Polígono defrequência acumulada para cada conjuntoq p jde dados a seguir (utilize a frequenciarelativa).

(Observação: se você fez os exercícios da aula de“Distribuição de Frequência e Tabelas” você já fez ametade deste exercício)

E1: Dados sobre Consumo de argamassa (emtoneladas) de 50 construções em Cuiabá:

Resposta: Distribuição de frequência usada para construir o HistogramaResposta: Distribuição de frequência usada para construir o Histograma

20 23 25 26 26 27 28 29 30 3030 31 31 32 32 33 33 34 34 3435 35 36 36 40

E2: Dados das idades dos trabalhadores de uma obra:

E3: A construção de um edifício no Centro de Cuiabá temocasionado transtorno no trânsito, pois bloqueia parte da ruapara o descarregamento de um caminhão. Em cada dia quepara o descarregamento de um caminhão. Em cada dia queisto ocorria, era anotado o número de horas de obstrução darua:

2 1 3 2 3 5 3 1 2 61 4 3 1 3 1 5 3 4 42 1 3 1 2 2 1 2 2 11 1 1 2 4 5 3 4 3 43 3 5 2 1 6 1 2 4 6

Page 37: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

3

E4:Alturas (em m) de 40 prédios em certa cidade.

62 63 48 66 69 54 70 66 64 6559 75 55 63 71 72 70 57 76 5757 65 58 58 60 58 63 65 64 7850 68 66 69 52 70 72 65 62 64

E5: Dados sobre as receitas brutas 50 construtoras (emmilhões de reais)milhões de reais).

1,2 1,8 3,3 3,3 3,4 3,6 3,7 3,7 3,9 4,24,3 4,8 4,9 5,4 5,4 5,5 5,5 5,6 5,8 6,06,3 6,5 6,6 6,3 6,3 6,9 6,1 6,4 8,5 8,58,9 9,4 9,5 9,7 10,0 10,2 10,5 11,0 11,5 11,612,6 12,8 13,4 13,9 14,1 16,6 17,0 17,2 19,8 22,9

Page 38: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

1

4. Que tipo de gráfico usar?p g

• Variável mudando ao longo do tempo:

Gráfico de curvas

• Qualitativa nominal (com poucas categorias)

Gráfico de setores

sim

não

• Qualitativa nominal: (com muitas categorias):

Gráfico Barras/colunas

Os campeões da poluição (volume de dióxido de carbono lançado na atmosfera

desde 1950, em bilhões de toneladas).

050

100150

200

Estados U

nidos

China

Brasil

Gráfico de setores

NÚMERO DE VEÍCULOS MOTORIZADOS REGISTRADOSNO ESTADO DO PARANÁ NO ANO DE 2000.

Barco a Motor, 2,1 %

Moto, 12,9 %

Caminhão multieixos, 2,8 %

Caminhão de 2 eixos, 9,8 %

Minivan, 14,5 %

Carro de passageiro, 57,9 %

• Qualitativa ordinal:(Muitas categorias / Manter a ordem das categorias)

Gráfico Barras/Colunas

0

5

10

15

20

25

30

Muito satisfeito

Pouco satisfeito

Sem opinião Pouco insatisfeito

Muito insatisfeito

• Quantitativa contínua:

Histograma

5. Construindo gráficos (manualmente)(manualmente)

ExercíciosExercício 1. O gráfico abaixo trata de ganhos profissionaisde tempo integral de trabalho, mas apresenta problemas.Construa um gráfico mais adequado e justifique sua opçãodecisão.

Page 39: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

2

Uma resposta:

Fonte: Desconhecida.

Exercício 2. Um artigo (R. Richmond, “Anatomy of a threat”, The WallStreet Journal, 13 fev 2006, pp. R5-6) discutiu sobre os custos dasempresas ao defender suas redes informatizadas de ataquesexternos. A tabela a seguir apresenta a discriminação dos custos:

Custo PercentagemConsultoria 7,6

Ferramentas de hardware 8,2Mão-de-obra 25,9

a. Que tipo de gráfico é melhor para retratar estes dados? Construa-o.b. b. que conclusões pode-se tirar com relação aos custos das

empresas para defender suas redes informatizadas de ataquesexternos?

Mão de obra 25,9Negócios perdidos/receita bruta 23,6

Tempo não-produtivo de empregados 15,5Ferramentas de software 14,2

Outros 5,0

Exercício 3. Construa um Histograma paracada conjunto de dados a seguir (utilize afrequencia relativa).q )

(Observação: se você fez os exercícios da aula de“Distribuição de Frequência e Tabelas” você já fez ametade deste exercício)

E1: Dados sobre Consumo de argamassa (emtoneladas) de 50 construções em Cuiabá:

Resposta: Distribuição de frequência usada para construir o HistogramaResposta: Distribuição de frequência usada para construir o Histograma

20 23 25 26 26 27 28 29 30 3030 31 31 32 32 33 33 34 34 3435 35 36 36 40

E2: Dados das idades dos trabalhadores de uma obra:

E3: A construção de um edifício no Centro de Cuiabá temocasionado transtorno no trânsito, pois bloqueia parte da ruapara o descarregamento de um caminhão. Em cada dia quepara o descarregamento de um caminhão. Em cada dia queisto ocorria, era anotado o número de horas de obstrução darua:

2 1 3 2 3 5 3 1 2 61 4 3 1 3 1 5 3 4 42 1 3 1 2 2 1 2 2 11 1 1 2 4 5 3 4 3 43 3 5 2 1 6 1 2 4 6

E4:Alturas (em m) de 40 prédios em certa cidade.

62 63 48 66 69 54 70 66 64 6559 75 55 63 71 72 70 57 76 5757 65 58 58 60 58 63 65 64 7850 68 66 69 52 70 72 65 62 64

E5: Dados sobre as receitas brutas 50 construtoras (emmilhões de reais)milhões de reais).

1,2 1,8 3,3 3,3 3,4 3,6 3,7 3,7 3,9 4,24,3 4,8 4,9 5,4 5,4 5,5 5,5 5,6 5,8 6,06,3 6,5 6,6 6,3 6,3 6,9 6,1 6,4 8,5 8,58,9 9,4 9,5 9,7 10,0 10,2 10,5 11,0 11,5 11,612,6 12,8 13,4 13,9 14,1 16,6 17,0 17,2 19,8 22,9

Page 40: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

INTERPRETAÇÃO DE TABELAS E GRÁFICOS

Exemplo de Relatório

A amostra investigada contém 120 chefes de família de três localidades diferentes de Florianópolis,

distribuídos de modo mais ou menos equitativo (40 de Nivel B, 43 de Nível C e 37 de Nível E),

conforme se vê na tabela a seguir.

Tabela 1. Distribuição de frequência do Nível de instrução do chefe do imóvel,

divida por localidades de Florianópolis/SC, 1988

Nível de

instrução

Localidade

Res. Monte Verde

(Nível B)

Parque da Figueira

(Nível C)

Encosta do Morro

(Nível E)

Nenhum 6 (15%) 14 (32,6%) 18 (48,7%)

Fundamental 11 (27,5%) 14 (32,6%) 13 (35,1%)

Médio 23 (57,5%) 15 (34,8%) 6 (16,2%)

Total 40 (100%) 43(100%) 37 (100%)

A grande maioria dos pesquisados que moram num local “melhor” possuem um nível de instrução

mais elevado (57,5% do Residencial Monte Verde) e praticamente metade dos moradores da “pior”

localidade possuem o menor nível de instrução (48,7% da Encosta do Morro). Assim, o nível da

localidade da moradia diminui na medida em que também diminui o nível de escolaridade do chefe

da casa, conforme Gráfico 1. Portanto, a pesquisa realizada evidenciou a existência de associação

entre essas duas variáveis (nível de instrução do chefe da casa e localidade da moradia).

Gráfico 1. Distribuição de frequência do Nível de instrução do chefe do imóvel,

divida por localidades de Florianópolis/SC, 1988

0%10%20%30%40%50%60%70%80%90%

100%

(Nível B) (Nível C) (Nível E)

Res. Monte Verde Parque da Figueira Encosta do Morro

Localidade

Médio

Fundamental

Nenhum

Page 41: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

Atividade avaliativa – Interpretação de Tabelas e Gráficos

Entrega dia _________.

1. A tabela de dupla entrada a seguir indica se os entrevistados moram de aluguel ou possuem casa

própria, por classe social, para uma amostra de 240 residências de Cuiabá em 2005:

Classe social Status da residência

Alugada Própria Total

Baixa 62 18 80

Média 47 63 110

Alta 11 39 50

Total 120 120 240

a) Reconstrua a tabela calculando as porcentagens por linha para a tabela.

b) Construa um gráfico a partir da tabela construída no item a.

c) Que porcentagem da amostra possui casa própria?

d) Que porcentagem da amostra paga aluguel?

e) Qual a porcentagem de proprietários entre os entrevistados da classe mais baixa?

f) Que porcentagem dos entrevistados de classe média paga aluguel?

g) Qual a classe social que tem maior tendência a pagar aluguel?

h) Qual a classe social que tem maior tendência a ser proprietária?

i) Faça um relatório dizendo o que se pode concluir quanto à relação entre classe social e status

de moradia? Incorpore dados e um gráfico ao seu relatório.

Page 42: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

[01] [ENEM-adaptada] Imagine uma eleição envolvendo 3 candidatos A, B, C e 33 eleitores (votantes). Cada eleitor vota fazendo uma ordenação dos três candidatos. Os resultados são os seguintes:

A primeira linha do quadro descreve que 10 eleitores escolheram A em 1º lugar, B em 2º lugar, C em 3º lugar e assim por diante.

Ordenação No de votantes

A B C 10

A C B 04

B A C 02

B C A 07

C A B 03

C B A 07

Total de votantes

33

Considere o sistema de eleição no qual cada candidato ganha 3 pontos quando é escolhido em 1º lugar, 2 pontos quando é escolhido em 2º lugar e 1 ponto se é escolhido em 3º lugar. O candidato que acumular mais pontos é eleito. Nesse caso, diga qual é o candidato eleito e com quantos pontos ele se elegeu?

[02] [UFMT] Com base na figura abaixo, julgue os itens.

Muitos doentes, pouco tratamento No Brasil são 9 milhões de diabéticos.

Deles, 50% não sabem que estão doentes.

Dos que sabem, 23% não se tratam.

Cresce o número de óbitos por causa do diabetes.

14 000

1985

18 000

1990

24 000

1995

Fontes: Federação Nacional de Associações de Diabéticos e Ministério da

Saúde. Revista VEJA -22/07/98. ( ) A metade dos diabéticos no Brasil não sabe que está doente. ( ) Dos que sabem que estão doentes 1,035 milhões não se tratam. ( ) O número de óbitos por causa do diabetes, de 1985 para 1990, aumentou em 40%. ( ) O número de óbitos por causa do diabetes em 1995 foi 4/3 do número de óbitos em 1990. [03] [FUVEST-SP] Considere os seguintes dados, obtidos em 1996 pelo censo do IBGE: 1. A distribuição da população por grupos de idade é:

Idade No de pessoas

de 4 a 14 anos 37 049 723

de 15 a 17 anos 10 368 618

de 18 a 49 anos 73 644 508

50 anos ou mais 23 110 079

2. As porcentagens de pessoas maiores de 18 anos filiadas ou não a sindicatos, órgãos comunitários, órgãos de classe são:

3. As porcentagens de pessoas maiores de 18 anos filiadas a sindicatos, órgãos comunitários e órgãos de classe são:

A partir dos dados acima, pode-se afirmar que o número de pessoas, maiores de 18 anos, filiadas a órgãos comunitários é, aproximadamente, em milhões:

a) 2 b) 6 c) 12 d) 21 e) 31 [04] [FUVEST] Uma prova continha cinco questões, cada uma valendo 2 pontos. Em sua correção, foram atribuídas a cada questão apenas as notas 0 ou 2, caso a resposta estivesse respectivamente, errada ou certa. A soma dos pontos obtidos em cada questão forneceu a nota da prova de cada aluno. Ao final da correção, produziu-se a seguinte tabela, contendo a porcentagem de acertos em cada questão:

QUESTÃO 1 2 3 4 5

% DE ACERTO 30 10 60 80 40 Logo, a média das notas da prova foi:

a) 3,8 b) 4,0 c) 4,2 d) 4,4 e) 4,6 [05] [ENEM] Um sistema de radar é programado para registrar automaticamente a velocidade de todos os veículos trafegando por uma avenida, onde passam em média 300 veículos por hora, sendo 55 km/h a máxima velocidade permitida. Um levantamento estatístico dos registros do radar permitiu a elaboração da distribuição percentual de veículos de acordo com sua velocidade aproximada.

A velocidade média, em km/h, dos veículos que trafegam nessa avenida é de:

a) 85 b) 76 c) 55 d) 44 e) 35

53%

39%

8%

69% 31%

Page 43: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

[06] [ENEM] Boa parte da água utilizada nas mais diversas atividades humanas não retorna ao ambiente com qualidade para ser novamente consumida. O gráfico mostra alguns dados sobre esse fato, em termos dos setores de consumo.

Total Com base nesses dados, é possível afirmar que: a) mais da metade da água restituída sem qualidade para o consumo contém algum teor de agrotóxico ou adubo. b) as atividades industriais são as maiores poluidoras de água. c) mais da metade da água usada não é devolvida ao ciclo hidrológico. d) cerca de um terço do total de água restituída sem qualidade é proveniente de atividades energéticas. e) o consumo doméstico, dentre as atividades humanas, é o que mais consome e repõe água com qualidade. [07] A tabela abaixo se refere a uma pesquisa, realizada com 200 alunos de uma escola, a respeito do esporte preferido:

Esporte Freqüência Absoluta

Freqüência Relativa

Porcentagem

Futebol 108

Vôlei 0,21

Basquete

Natação 12

Outros 8,5%

Total 200 1,00 100% Complete os espaços da tabela. [08] Os “pesos” (em kg) de 16 atletas estão indicados a seguir: 78, 75, 79, 83, 81, 72, 68, 79, 72, 85, 76, 80, 78, 71, 69 e 70. a) Encontre o valor da média, da mediana e da moda dos “pesos” dos atletas. b) Qual a porcentagem do total de atletas que têm “peso” inferior a 80 kg?

Page 44: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

v

PROJETO SIMULTÂNEO NA CONSTRUÇÃO DE EDIFÍCIOS (Tese de doutorado apresentada à Escola Politécnica da USP)

Márcio Minto Fabricio São Paulo, 2002

RESUMO

O trabalho apresenta uma reflexão sobre a gestão de projetos na construção de

edifícios, desenvolve o conceito de Projeto Simultâneo e propõe diretrizes para sua

aplicação.

Para desenvolver a pesquisa foram realizados estudos bibliográficos sobre a

realidade contemporânea da construção de edifícios brasileira e sobre a 'Engenharia

Simultânea' no desenvolvimento de produtos nas indústrias tecnologicamente de

ponta. Também foram feitos estudos de caso, envolvendo diversas empresas de

construção com atuação em diferentes mercados (incorporação-construção,

promoção pública, obras sob encomenda), visando caracterizar o processo de projeto

de edifícios.

Como resultado são apresentados: uma análise da pertinência e das dificuldades para

introdução de práticas baseadas na Engenharia Simultânea na gestão de projetos de

edifícios; a formulação do conceito de Projeto Simultâneo como uma adaptação ao

setor de metodologias mais evoluídas para a gestão de projetos; são feitas análises

das tendências de modernização na gestão dos projetos em diferentes estudos de caso

e das dificuldades para caracterização de um Projeto Simultâneo nos diferentes tipos

de empreendimento considerados. Por fim, são desenvolvidas e apresentadas

diretrizes para aplicação do Projeto Simultâneo como forma de melhorar o

desempenho do processo de projeto e a qualidade ao longo do ciclo de vida dos

edifícios.

Palavras-chaves: projeto simultâneo, engenharia simultânea, processo de projeto,

gestão da qualidade, construção de edifícios.

Page 45: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

273

O coordenador também deve sobrepor os vários projetos e verificar a

compatibilidade entre eles. Essa análise é feita por um sistema reticulado de

quadrantes que obriga o coordenador a dar um parecer sobre a compatibilidade dos

projetos em cada quadrante.

8.2.1.3 Caso “A3”

Como contraponto, o caso A3 ilustra um escritório de projetos especializados no

detalhamento de projetos e na realização de projetos para produção que tem como

objetivo subsidiar as obras com informações mais desenvolvidas sobre as

características do produto e as formas de execução. A empresa oferece, ainda, às

empresas construtoras, serviços de acompanhamento e coordenação dos projetos.

Tal escritório atua no mercado há cerca de sete anos, é de propriedade de dois

arquitetos e contava, durante as visitas realizadas, com sete profissionais -

engenheiros, arquitetos e estagiários, caracterizando uma estrutura funcional

reduzida típica dos escritórios brasileiros de projeto.

Os principais clientes do escritório são empresas de construção e incorporação de

edifícios residenciais que atuam na região da Grande São Paulo onde os mesmos se

situam. Como a maior parte dos clientes desta empresa (embora não todos) são

construtoras-incorporadoras optou-se por enquadrar este caso na modalidade de

construção-incorporação e conduzir a pesquisa focando a experiência da empresa

relacionada a este tipo de empreendimento.

Os principais serviços oferecidos pela empresa se destinam ao aprimoramento dos

projetos do produto em relação à sua construtibilidade e ao desenvolvimento, por

meio de projetos para produção, das soluções construtivas que serão empregadas nas

obras. O escritório dá ênfase ao fornecimento de serviços orientados para o

incremento da articulação projeto-obra (i3), tentando, assim, atenuar a desarticulação

entre o desenvolvimento de projetos e as características produtivas e das empresas

construtoras.

Page 46: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

274

Uma característica importante da empresa e que ela mantém um rígido

acompanhamento de seus projetos e acompanha a evolução deste nas obras dos

clientes.

Com base nesses acompanhamentos, referentes a um universo de mais de 200

projetos realizados junto a 58 clientes diferentes, pode-se observar alguns dados

importantes sobre a contratação e o aproveitamento dos projetos para produção,

segundo a experiência do escritório em questão (ver tabelas 8, 9,10) 55.

Responsável pela contratação do projeto Participação relativa (%)

• Engenheiros de obra 16% • Coordenador de Projetos da Construtora/Promotora 45% • Coordenação Terceirizada 8% • Área Comercial 31%

Tabela 8. Tipos de contratantes dos serviços empresa A3

Momento de contratação do projeto Participação relativa (%)

• antes do início da obra 26% • a obra iniciada, mas o projeto é contratado antes da produção do sistema

14%

• subsistema em execução quando o projeto para produção é contratado

44%

• o projeto contratado não é utilizado na obra 16%

Tabela 9. Momento do empreendimento em que são contratados os serviços da empresa A3

Aproveitamento do projeto em obra (segundo juízo da empresa estudada)

Participação relativa (%)

• baixíssimo aproveitamento 33% • baixo aproveitamento 16% • médio aproveitamento 19% • bom aproveitoamento 19% • excelente aproveitamento 7%

Tabela 10. Aproveitamento da compatibilização e do projeto para produção pelas construtoras

55 Dados apresentados pela arquiteta titular da empresa A3, durante a mesa de debate sobre coordenação de projetos, realizada no Workshop Nacional: Gestão do Processo de Projeto na Construção Civil (Workshop,2001).

Page 47: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

AS PERDAS NA CONSTRUÇÃO CIVIL:CONCEITOS, CLASSIFICAÇÕES E SEU PAPEL NA MELHORIA DO SETOR

Carlos T. Formoso, Engo Civil, Ph.D., Professor e Pesquisador do NORIE/UFRGS

Cláudia M. De Cesare, Enga Civil, M.Sc., Doutoranda pela Universidade de Salford, Grã Bretanha

Elvira M. V. Lantelme, Enga Civil, M.Sc., Pesquisadora do NORIE/UFRGS

Lucio Soibelman, Engo Civil, M.Sc., Doutorando pelo MIT, Estados Unidos

Núcleo Orientado para a Inovação da Edificação (NORIE)Universidade Federal do Rio Grande do Sul (UFRGS)Av. Osvaldo Aranha 99, 3o andarCEP 90035-190 Porto Alegre - RSTel. (051) 228 1633 R. 3518 Fax (051) 227 1807E-mail: [email protected]

RESUMOMuito se discute sobre as perdas de materiais na construção civil. Os poucos estudos aprofundados sobre otema realizados no Brasil até o momento indicam percentuais de perdas de alguns materiais bastanteelevados. A divulgação de tais resultados tem provocado a reação de alguns segmentos da indústriapreocupados em preservar a imagem do setor.

O presente artigo tem como objetivo discutir dois pontos fundamentais relacionados ao tema. Em primeirolugar, questiona-se o conceito de perdas tradicionalmente adotado na construção civil, fortemente focadonas chamadas atividades de conversão. Embora os desperdícios de materiais sejam a expressão maisconcreta das perdas do setor, é importante encará-las segundo um enfoque mais amplo, a exemplo do queocorre há bastante tempo na Engenharia de Produção.

Em segundo lugar, discute-se a necessidade de conscientização por parte do setor sobre o papel dosindicadores de perdas no seu desenvolvimento. O esforço de medição do desempenho dos processosprodutivos de forma clara, associada à identificação das causas reais dos problemas, constitui-se num dospontos essenciais para a melhoria da qualidade e produtividade segundo as modernas filosofias gerenciais.

Os conceitos e dados apresentados neste artigo foram extraídos de vários estudos desenvolvidos porpesquisadores do NORIE/UFRGS ao longo dos últimos quatro anos.

1. CONCEITO DE PERDASO conceito de perdas na construção civil é, com freqüência, associado unicamente aos desperdícios demateriais. No entanto, as perdas estendem-se além deste conceito e devem ser entendidas como qualquerineficiência que se reflita no uso de equipamentos, materiais, mão de obra e capital em quantidadessuperiores àquelas necessárias à produção da edificação. Neste caso, as perdas englobam tanto a ocorrênciade desperdícios de materiais quanto a execução de tarefas desnecessárias que geram custos adicionais enão agregam valor.Tais perdas são conseqüência de um processo de baixa qualidade, que traz como resultado não só umaelevação de custos, mas também um produto final de qualidade deficiente.

Para a melhor compreensão deste conceito, deve-se conhecer a natureza das atividades que compõem oprocesso de produção. Um processo pode ser entendido como um fluxo de materiais e informações desdea matéria prima até o produto final. Neste fluxo, os materiais são processados, inspecionados,movimentados ou estão em espera. Assim, as atividades componentes de um processo podem serclassificadas em duas principais categorias (Figura 1.1):

(a) Atividades de conversão: envolvem o processamento dos materiais em produtos acabados.

(b)Atividades de fluxo: relacionam-se às tarefas de inspeção, movimento e espera dos materiais.

Page 48: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

São as atividades de conversão que normalmente agregam valor ao produto, ou seja, transformam asmatérias primas ou componentes nos produtos requeridos pelos clientes. Entretanto, nem toda a atividadede conversão agrega valor ao produto. Por exemplo, a necessidade de retrabalho indica que se executouuma atividade de conversão sem agregar valor.

As novas filosofias de produção indicam que a eficiência dos processos pode ser melhorada e as suasperdas reduzidas não só através da melhoria da eficiência das atividades de conversão e de fluxo, mastambém pela eliminação de algumas das atividades de fluxo (Koskela, 1992). Por exemplo, quando sedesenvolve uma inovação tecnológica na construção deve-se eliminar ao máximo a necessidade deatividades de transporte, espera e inspeção de materiais.

É óbvio que o princípio da eliminação de atividades de fluxo não deve ser levado ao extremo. Existemdiversas atividades que não agregam valor as quais são essenciais à eficiência global dos processos, como,por exemplo, controle dimensional, treinamento da mão de obra, instalação de dispositivos de segurança.

Na construção civil, a literatura internacional indica que as atividades que agregam valor correspondem, emmédia, a um terço do tempo total gasto pela mão de obra, podendo atingir valores da ordem de 55 a 60%apenas para algumas atividades específicas, como a execução de alvenaria. Mesmo na indústria datransformação, valores da ordem de 60% dos tempos gastos em atividades que agregam valor sãoconsiderados excepcionalmente altos.Em que pese a sua importância, as atividades de fluxo são freqüentemente negligenciadas no processo deprodução de edificações. Em geral. não são devidamente analisadas nas tarefas de orçamento eplanejamento e nas iniciativas de melhorias de processo. O esforço para melhoria do desempenho naconstrução civil deve considerar o conceito mais amplo de perdas, isto é, visar à minimização do dispêndiode quaisquer recursos que não agregam valor ao produto, sejam eles vinculados às atividades de conversãoou fluxo.

movimento espera processa-mento

inspeção movimento

rejeitos

FIGURA 1.1 - Etapas do processo de produção (Koskela, 1992)

2. CLASSIFICAÇÃO DAS PERDAS

Para reduzir as perdas na construção de edificações é necessário conhecer sua natureza e identificar suasprincipais causas. Com este objetivo, as perdas foram classificadas no presente trabalho de acordo com apossibilidade de serem controladas, sua natureza e sua origem. Os critérios de classificação adotados foramadaptados dos estudos de Shingo (1981) e Skoyles (1987) para a construção civil brasileira.

2.1. As perdas segundo seu controle

A Figura 2.1 compara duas situações de um mesmo processo. Na primeira, a perda total, que engloba asatividades que não agregam valor, é elevada. Na situação desejada, melhora-se a eficiência das atividadesque agregam valor, elimina-se uma parcela das atividades que não agregam valor, e reduz-se as demaisperdas. Contudo, pode-se admitir que existe um nível aceitável de perdas (perda inevitável) que só podeser reduzido através de uma mudança significativa no patamar de desenvolvimento tecnológico e gerencialda empresa. Considerando este pressuposto, as perdas podem ser classificadas da seguinte forma:

Page 49: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

(a) Perdas inevitáveis (ou perda natural): correspondem a um nível aceitável de perdas, que é identificadoquando o investimento necessário para sua redução é maior que a economia gerada. O nível de perdasconsiderado inevitável pode variar de empresa para empresa e mesmo de obra para obra, dentro de umamesma empresa, dependendo do patamar de desenvolvimento da mesma.(b)Perdas evitáveis: ocorrem quando os custos de ocorrência são substancialmente maiores que os custosde prevenção. São conseqüência de um processo de baixa qualidade, no qual os recursos são empregadosinadequadamente.Não se pode afirmar que existe, para cada material, um percentual único de perdas que pode serconsiderado inevitável para todo o setor. Existem diversos valores, os quais dependem do nível dedesenvolvimento gerencial e tecnológico da empresa. A competitividade da empresa é alcançada na medidaque a organização persegue a redução de perdas continuamente.

SITUAÇÃO ATUAL

SITUAÇÃODESEJADA

Ativ idades queagregam va lor

Perda (inev i tável)

Outras perdas,inclusivedesperdício demateria i s

At iv idades quenão agregam va lor

Perda tota l(ev i tável e inev i tável)

At iv idades queagregam va lor

FIGURA 2.1 - As perdas segundo seu controle

2.2. As perdas segundo sua natureza

A classificação adotada neste trabalho partiu do conceito das sete perdas de Shingo (1981), adaptando-opara a construção civil. Nove categorias de perdas são identificadas:

(a) Perdas por superprodução: refere-se às perdas que ocorrem devido à produção em quantidadessuperiores às necessárias, como, por exemplo: produção de argamassa em quantidade superior à necessáriapara um dia de trabalho, excesso de espessura de lajes de concreto armado.

(b) Perdas por substituição: decorrem da utilização de um material de valor ou características dedesempenho superiores ao especificado, tais como: utilização de argamassa com traços de maior resistênciaque a especificada, utilização de tijolos maciços no lugar de blocos cerâmicos furados.

(c) Perdas por espera: relacionadas com a sincronização e o nivelamento do fluxos de materiais e asatividades dos trabalhadores. Podem envolver tanto perdas de mão de obra quanto de equipamentos,como, por exemplo, paradas nos serviços originadas por falta de disponibilidade de equipamentos ou demateriais.

(d) Perdas por transporte: as perdas por transporte estão associadas ao manuseio excessivo ouinadequado dos materiais e componentes em função de uma má programação das atividades ou de umlayout ineficiente, como, por exemplo: tempo excessivo despendido em transporte devido a grandesdistâncias entre estoques e o guincho, quebra de materiais devido ao seu duplo manuseio ou ao uso deequipamento de transporte inadequado.

Page 50: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

(e) Perdas no processamento em si: têm origem na própria natureza das atividades do processo ou naexecução inadequada dos mesmos. Decorrem da falta de procedimentos padronizados e ineficiências nosmétodos de trabalho, da falta de treinamento da mão de obra ou de deficiências no detalhamento econstrutividade dos projetos. São exemplos deste tipo de perdas: quebra de paredes rebocadas paraviabilizar a execução das instalações; quebra manual de blocos devido à falta de meios-blocos.

(f) Perdas nos estoques: estão associadas à existência de estoques excessivos, em função da programaçãoinadequada na entrega dos materiais ou de erros na orçamentação, podendo gerar situações de falta delocais adequados para a deposição dos mesmos. Também decorrem da falta de cuidados noarmazenamento dos materiais. Podem resultar tanto em perdas de materiais quanto de capital, como porexemplo: custo financeiro dos estoques, deterioração do cimento devido ao armazenamento em contatocom o solo e ou em pilhas muito altas.

(g) Perdas no movimento: decorrem da realização de movimentos desnecessários por parte dostrabalhadores, durante a execução das suas atividades e podem ser geradas por frentes de trabalhoafastadas e de difícil acesso, falta de estudo de layout do canteiro e do posto de trabalho, falta deequipamentos adequados, etc. São exemplos deste tipo de perda: tempo excessivo de movimentaçãoentre postos de trabalho devido à falta de programação de uma seqüência adequada de atividades; esforçoexcessivo do trabalhador em função de condições ergonômicas desfavoráveis.

(h) Perdas pela elaboração de produtos defeituosos: ocorrem quando são fabricados produtos que nãoatendem aos requisitos de qualidade especificados. Geralmente, originam-se da ausência de integraçãoentre o projeto e a execução, das deficiências do planejamento e controle do processo produtivo; dautilização de materiais defeituosos e da falta de treinamento dos operários. Resultam em retrabalhos ou emredução do desempenho do produto final, como, por exemplo: falhas nas impermeabilizações e pinturas,descolamento de azulejos.

(i) Outras: existem ainda tipos de perdas de natureza diferente dos anteriores, tais como roubo,vandalismo, acidentes, etc.

2.3. As perdas segundo sua origemAs perdas mencionadas em geral ocorrem e podem ser identificadas durante a etapa de produção.Contudo, sua origem pode estar tanto no próprio processo de produção quanto nos processos que oantecedem como fabricação de materiais, preparação dos recursos humanos, projeto, suprimentos eplanejamento (Figura 2.2). O Quadro 2.1 apresenta um conjunto de exemplos de perdas, indicando a suanatureza, origem e momento de incidência.

Recebimento Estocagem Transporteinterno

Produção

PROJETO

SUPRIMENTOS

FABRICAÇÃO DE MATERIAIS

PLANEJAMENTO

RECURSOSHUMANOS

FIGURA 2.2 - As perdas segundo seu momento de incidência e sua origem

Page 51: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

QUADRO 2.1 - Exemplos de perdas segundo sua natureza, momento de incidência e origem.

NATUREZA EXEMPLOMOMENTO DE

INCIDÊNCIA ORIGEM

Superprodução Produção de argamassa emquantidade superior à necessáriapara um dia de trabalho

Produção Planejamento: falta deprocedimentos de controle

Substituição Utilização de tijolos à vista emparedes a serem rebocadas

Produção Suprimentos: falta domaterial em canteiro porfalha na programação decompras

Espera Parada na execução dos serviçospor falta de material

Produção Suprimentos: falha naprogramação de compras

Transporte Duplo manuseio Recebimento,Transporte, Produção

Gerência da obra: falha noplanejamento de locais deestocagem

Processamento Necessidade de refazer umaparede por não atender aosrequisitos de controle (nível eprumo)

Produção Planejamento: falhas nosistemas de controleRecursos Humanos: falta detreinamento dos operários

Estoques Deterioração do cimentoestocado

Armazenamento Planejamento: falta deprocedimentos referentes àscondições adequadas dearmazenamento

Movimentos Tempo excessivo dedeslocamento devido às grandesdistâncias de entre postos detrabalho no andar

Produção Gerência da obra: falta deplanejamento das seqüênciade atividades

Elaboração deprodutosdefeituosos

Desníveis na estrutura Produção,Inspeção

Projeto: falhas no sistema defôrmas utilizado

Page 52: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

3. O PAPEL DOS ÍNDICES DE PERDASOs índices de perdas cumprem um importante papel de indicadores de desempenho dos processosprodutivos e, como tal, podem ser empregados para diferentes finalidades. A utilização mais comum dadaaos índices de perdas de materiais na construção civil tem sido apenas chamar a atenção para o baixodesempenho global do setor construção em termos de qualidade e produtividade.

Entretanto, esta não é a principal função dos indicadores de desempenho. Existem outras finalidades, maisconstrutivas, que possibilitam aos mesmos contribuir de forma efetiva para o desenvolvimento do setor.

Em primeiro lugar, um indicador pode ter a função de visibilidade, ou seja, demonstrar o desempenho atualde uma organização, indicando seus pontos fortes ou fracos ou chamando a atenção para suas disfunções.Este tipo de avaliação permite estabelecer prioridades em programas de melhoria da qualidade, indicandoos setores da empresa nos quais intervenções são mais importantes ou viáveis.

A segunda função de um indicador é o controle de um processo em relação a um padrão estabelecido. Apartir da elaboração de um planejamento, o monitoramento de um indicador ao longo do tempo permiteavaliar o desempenho do processo, identificando desvios e corrigindo a tempo as causas dos mesmos.

Em terceiro lugar, um indicador é um instrumento indispensável para o estabelecimento de metas ao longode um processo de melhoria contínua, componente indispensável de um programa para melhoria daqualidade. Este tipo de medição visa a identificar as oportunidades de melhorias e verificar o impacto deintervenções no processo.

Finalmente, os indicadores de desempenho cumprem um papel de fundamental na motivação das pessoasenvolvidas no processo. Sempre que uma melhoria está sendo implantada é importante que um ou maisindicadores de desempenho associados à mesma sejam monitorados e sua evolução amplamente divulgadana organização. Neste sentido, um projeto de melhoria visando à redução de perdas de materiais poderiainclusive ser empregado como um instrumento de marketing interno para um programa da qualidade.

Assim, a incidência de perdas deve ser monitorada através de diversos indicadores, os quais podem ou nãoser relacionados ao desperdícios de materiais. Entre os diversos indicadores de perdas na construção civil,podem ser citados como exemplos os seguintes: (a) percentual de material adquirido em relação àquantidade teoricamente necessária, (b) espessura média de revestimentos de argamassa, (c) tempo derotação de estoques, (d) percentual de tempos improdutivos em relação ao tempo total, (e) horas-homemgastas em retrabalho em relação ao consumo total, etc. Cada processo, em geral, necessita de um ou maisindicadores para ter o seu desempenho avaliado.

Quando se mede um indicador de perdas é necessário ter valores de referência ou benchmarks paraavaliar o desempenho em relação a outras empresas. Neste sentido, ao se divulgar um indicador de perdas,deve-se explicitar claramente o seu significado, isto é, o conceito adotado e o método de cálculo e oscritérios de medição uitilizados.

É também necessário identificar as causas reais (não as aparentes) dos problemas que resultam em perdas,de forma a atuar de forma corretiva. No próximo item são apresentados, de forma resumida, alguns dosestudos desenvolvidos pelo NORIE que procuraram desenvolver métodos para coletar indicadores,estabelecer valores de referência, identificar as causas das perdas no setor e orientar a sua prevenção.

4. ESTUDOS SOBRE PERDAS DESENVOLVIDOS NO NORIE4.1. Perdas de materiais em cinco canteiros de obras em Porto AlegreO primeiro estudo realizado pelo NORIE referente às perdas na construção civil iniciou em abril de 1992,através de um convênio promovido pelo Programa de Qualidade e Produtividade da Construção Civil doRio Grande do Sul (PQPCC/RS), envolvendo, além da UFRGS, o SINDUSCON-RS, o SEBRAE-RS e aCIENTEC. Os principais objetivos desta pesquisa foram levantar a incidência de perdas de materiais naconstrução de edificações, analisar as principais causas destas ocorrências e propor diretrizes para aimplementação de procedimentos de controle de perdas de materiais em empresas de construção. Umadescrição mais detalhada do mesmo pode ser encontrado no trabalho de Soibelman (1993).

Como se desejava desenvolver um estudo profundo sobre as causas das perdas, optou-se por limitar apesquisa a um pequeno número de obras e a um conjunto limitado de materiais e de tipologias

Page 53: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

construtivas. Foram selecionadas cinco obras para o levantamento dos dados, todas localizadas em PortoAlegre - RS. Utilizou-se como critério de escolha das mesmas o emprego de tecnologias tradicionais(estrutura de concreto armado, paredes com tijolos cerâmicos e revestimentos de argamassa) e anecessidade de que as mesmas se encontrassem em estágios semelhantes.

É óbvio que o reduzido tamanho da amostra impede que os resultados do estudo possam sergeneralizados para todo o setor. A pesquisa, portanto, não teve como objetivo esgotar o assunto, maspretendia constituir-se em um primeiro estudo mais aprofundado do problema, procurando tambémincentivar o desenvolvimento de outras pesquisas que pudessem contribuir na composição de dados sobreas perdas de materiais.

Tendo como objetivo identificar os insumos mais representativos em termos de custo na construção,analizou-se a curva ABC dos insumos utilizados nos projetos de padrão normal, de quatro, oito e dozepavimentos da NBR-12721 (ABNT, 1992). Foram eliminados os itens referentes a mão-de-obra, bemcomo os materiais que possuem uma baixa probabilidade de ocorrência de perdas, apesar da sua granderepresentatividade em termos de custo, tais como elevadores, janelas, portas, fechaduras e outros. Combase nestes critérios, foram escolhidos os seguintes insumos para serem observados: madeiras, aços,concreto pré-misturado, cimento, areia, cal ou argamassa pré-misturada e tijolos cerâmicos, os quaissomados representam aproximadamente 20% do custo total de obras construídas por processosconstrutivos tradicionais.

O Quadro 4.1 apresenta uma síntese dos resultados obtidos nos cinco empreendimentos pesquisados. Sãotambém apresentados os resultados de trabalhos congêneres, bem como as perdas comumente adotadaspelas composições de custo (perda teórica). Os índices de perdas estão expressos pela diferença, emtermos percentuais, entre a quantidade de material adquirida e a quantidade teoricamente necessária,medida no projeto.

Os dados apresentados confirmaram uma das hipóteses principais do estudo, ou seja, que as perdas demateriais na construção de edificações são efetivamente maiores do que as normalmente aceitas pelaindústria da construção em suas estimativas de custo. Verificou-se que as perdas reais médias dos insumospossuem um grande intervalo de variação e situam-se entre 0.85 e 8 vezes as perdas usuais admitidas. Osíndices de perdas encontrados no estudo são também bastante superiores aos valores apontados porSkoyles (1987) na Grã Bretanha.

O estudo comprovou também que existe uma grande variação nos índices de perdas em diferentes obras.Levando em conta que canteiros similares apresentaram diferentes níveis de perdas para os mesmosmateriais, pode-se concluir que uma parcela considerável destas perdas é possível de ser evitada.

O fato de que não foram tomadas medidas relativamente simples de prevenção nas obras pesquisadasindica que existe uma falta de preocupação com as perdas de materiais. Nenhuma das obras pesquisadaspossuía uma política definida de administração de materiais, tanto em relação ao seu gerenciamento, comona aplicação de um controle sistemático para a sua utilização.

QUADRO 4.1 - Índices de perdas totais nas diferentes obras (%)

Material Obra A Obra B Obra C Obra D Obra E MédiaPINTO(1989)

SKOYLES(1987)

Perdateórica

Aço 18.80 27.30 23.01 7.91 18.31 19.07 26.19 5.00 12.00

Cimento 76.60 45.20 34.31 151.86 112.70 84.13 33.11 - 15.00

Concreto 10.80 11.77 17.44 0.75 25.16 13.18 1.34 2.00 5.00

Areia 27.09 29.73 21.05 109.81 42.19 45.76 39.02 - 15.00

Argamassa 103.05 87.50 40.38 152.10 73.24 91.25 101.94 5.00 15.00

Bl. cerâmico 39.90 8.20 35.96 26.50 - 27.64 - 8.00 10.00

Tij. maciço 45.25 15.23 20.02 27.28 - 26.94 12.73 12.00 10.00

Ficou evidente também que melhorias podem ser obtidas sem a introdução de equipamentos caros ouavançadas técnicas gerenciais, mas simplesmente através de cuidados elementares no recebimento, naestocagem, no manuseio, na utilização e na proteção dos materiais. Este fato indica que a redução de

Page 54: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

perdas poderia ser facilmente utilizada como ponto focal em programas de melhoria da qualidade emempresas de construção.

Concluiu-se também que a falta de interesse em controlar os materiais é uma importante causa deocorrência de perdas. A magnitude das perdas de materiais não era conhecida pelas próprias empresas,antes da realização do estudo, devido à completa ausência de métodos de levantamento e contabilizaçãode seu uso. A pesquisa mostrou que a mudança na atitude dos envolvidos no processo construtivo é muitomais importante do que mudanças em tecnologias de construção para a obtenção de melhor desempenhodas empresas no que se refere à administração de materiais. É fundamental que os envolvidosconscientizem-se do alto valor dos materiais e da necessidade de aplicar medidas de prevenção comrelação às perdas.

O estudo comprovou que a gerência tem mais responsabilidade pelas perdas que os operários. Estes são,normalmente, considerados pelos empresários da construção como os principais responsáveis pela baixaprodutividade, má qualidade e pelo elevado índice de perdas de materiais. Entretanto, observou-se que asdeficiências no gerenciamento da obra tinham grande relação com a elevada incidência de perdas demateriais. De uma forma geral, as perdas eram resultado de uma combinação de fatores, e não deincidentes isolados.

Muitas perdas originaram-se fora dos canteiros de obras, nas etapas que antecedem a produção,principalmente devido a projetos inadequados ou compras mal efetuadas. Através do estudo dos projetosdas cinco obras pesquisadas foi possível concluir que deficiências nas especificações e no detalhamento e,principalmente, a falta de coordenação entre os mesmos são causas de elevadas perdas de materiais. Asquebras de tijolos causadas pela falta de meios-tijolos é um exemplo de problema gerado no setor desuprimentos.

Da mesma forma que no estudo de Skoyles (1987), houve indicações de que a ocorrência de perdas nocanteiro ocorre com mais intensidade durante a armazenagem e o manuseio dos materiais do que durantea produção propriamente dita.

Para a determinação do custo das perdas dos materiais pesquisados, utilizou-se a Curva ABC da NBR12721 (ABNT, 1992) formulada para prédios de 12 pavimentos, três quartos e padrão normal deacabamento. As perdas dos materiais pesquisados representaram, até o momento de encerramento dacoleta, um acréscimo de 5,06% (Obra C) a 11,62% (Obra E) em relação aos custos orçados das obrasestudadas. O acréscimo médio de 7,98% na expectativa de custo total dos empreendimentos, verificado napesquisa, é do mesmo nível de grandeza do valor de 6% estimado por Pinto (1989).

4.2. Sistema de indicadores de qualidade e produtividade para a construção civilEm continuidade ao estudo de perdas de materiais, o NORIE criou em 1993 o Sistema de Indicadores deQualidade e Produtividade para a Construção Civil. A necessidade de criação do Sistema de Indicadoressurgiu a partir da carência existente na indústria da construção não somente em relação a índices deperdas, mas também em termos de outros indicadores de desempenho. Poucas empresas mantém umsistema interno de indicadores e mesmo aquelas que o fazem têm dificuldade em avaliar o seu própriodesempenho em relação ao setor, em função da inexistência de valores de referência. Tais problemasforam constatados no próprio estudo de perdas de materiais e também numa pesquisa de opinião relativaàs principais dificuldades enfrentadas pelos gerentes técnicos de empresas de construção de pequeno porte(Fruet & Formoso, 1993).

O objetivo do trabalho é orientar as empresas a introduzir procedimentos de coleta de indicadores, assimcomo estabelecer valores de referência setorial que permitam às mesmas comparar o seu desempenhocom outras empresas e estabelecer metas para melhoria contínua. Os indicadores que compõem o sistemaforam selecionados a partir de uma pesquisa sobre indicadores empregados em outros setores industriais,na indústria da construção de outros países e em função de problemas considerados críticos para o setorno Brasil. Esta seleção foi realizada pela equipe de pesquisadores envolvida no projeto com a participaçãode um grupo de empresas de construção.

O Sistema está descrito num manual (Oliveira et al., 1995), o qual se encontra em sua segunda edição. Omanual apresenta um conjunto de 28 indicadores, seus objetivos, critérios e planilhas de coleta, assim comovalores de referência.

Page 55: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

Mais de 50 empresas de todo país aderiram ao Sistema e enviam alguns de seus indicadores para o bancode dados que é gerenciado pelo NORIE. Periodicamente são emitidos relatórios com os valores dereferência do Sistema, incluindo benchmarks.

Alguns dos indicadores do Sistema estão relacionados à ocorrência de perdas. São eles:

(a) Perdas de materiais (aço, concreto e blocos cerâmicos): relação entre o material adquirido e omaterial teoricamente necessário;

(b) Espessura média de revestimentos de argamassa internos e externos

(c) Percentual de tempos produtivos, improdutivos e auxiliares, medidos através da técnica deamostragem do trabalho;

(d) Índice de retrabalho: número de horas-homem dispendidas em retrabalhos em relação ao total dehoras gastas, para um determinado período.

O Quadro 4.2 apresenta alguns valores de referência do Sistema, resultante de dados de mais de vinteempresas de construção, a maior parte delas do Rio Grande do Sul. Pode-se constatar que as médias e avariabilidade encontradas para os índices de perdas até o momento têm sido do mesmo nível de grandezados valores encontrados no estudo das cinco obras em Porto Alegre, apresentado no item 4.1, e tambémno trabalhos desenvolvidos por Pinto (1989) e Picchi (1993).

QUADRO 4.2 - Valores de referência do sistema de indicadores

Indicador Valormínimo

Valormédio

Valormáximo

Bench-marks

Perda de aço para concreto armado (%) 7.9 19.1 27.3 5.0

Perda de concreto pré-misturado (%) 0.8 13.2 25.2 2.0

Perda de blocos cerâmicos furados (%) 5.4 20.6 39.8 5.0

Espessura de revestimento de argamassa interno (mm) 19.8 24.5 30.0 15.0

Espessura de revestimento de argamassa externo (mm) 28.1 35.7 41.3 20.0

Tempos produtivos na execução de alvenaria (%) 15.0 27.7 38.0 -

Tempos produtivos na execução de formas (%) 21.0 31.5 47.0 55.0

4.3. Método de intervenção para redução de perdas de materiaisO trabalho mais recente do NORIE na área de perdas na construção civil refere-se ao desenvolvimento deum método de intervenção para a redução de perdas e de tempos improdutivos em canteiros de obras.Este estudo iniciou em 1994, através de uma parceria envolvendo o NORIE e uma empresa de construçãode porte médio de Porto Alegre - RS. Em 1995, foi assinado um novo convênio com o SEBRAE/RS com oobjetivo de aplicar o método em um grupo de empresas de pequeno porte e elaborar um manual paraorientar as empresas na sua utilização. A publicação deste manual está prevista para meados de 1996(Santos et al., 1996).O método de intervenção proposto tem como foco o sistema de movimentação e armazenamento demateriais, cujas deficiências estão fortemente relacionadas à incidência de perdas. Existe também umavinculação das ações de melhoria propostas através da aplicação do método com a postura estratégica daempresa, de forma que a intervenção seja coerente com os princípios e objetivos da organização.

Page 56: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

A necessidade de desenvolver o método surgiu a partir da constatação de que as empresas de construção,particularmente as de pequeno porte, enfrentam dificuldades na consolidação de programas da qualidade.Em primeiro lugar, existe uma carência de métodos e técnicas suficientemente testados e adaptáveis àspeculiaridades do setor que permitam colocar em prática os conceitos relativos às modernas filosofiasgerenciais. Muitas empresas passaram pelos estágios iniciais de treinamento para a gestão da qualidade, masencontram dificuldades em definir e implementar as ações necessárias para iniciar o processo de mudança.Outra dificuldade enfrentada pelas empresas refere-se à necessidade de recursos financeiros que viabilizemos investimentos em gestão e inovação tecnológica requeridos pelo processo de mudança.Levando em conta esta situação, o método de intervenção foi desenvolvido com o objetivo viabilizar aimplantação de melhorias incrementais, de baixo custo e com reduzido investimento. Parte-se dopressuposto que existe um grande potencial para redução de perdas através da utilização de indicadores dequalidade e produtividade e da aplicação dos princípios do total quality control (TQC).As principais etapas do método são: (a) formulação da estratégia de produção; (b) diagnóstico de umcanteiro de obras da empresa; (c) elaboração e implantação de um plano de ação; e (d) realização dodiagnóstico pós-intervenção. A realização dos diagnósticos pré e pós-intervenção envolvem a coleta deindicadores de qualidade e produtividade, que fazem parte do Sistema de Indicadores descrito no item 4.2.O manual a ser publicado descreve o conjunto de conceitos e técnicas relativas à elaboração de estratégiade produção, diagnóstico de canteiros de obras e formulação de planos de ação, que compõem o métodode intervenção, assim como apresenta procedimentos recomendados para a prevenção da ocorrência deperdas.

5. Considerações finaisOs diversos trabalhos de pesquisa realizados pelo NORIE, relacionados às perdas na construção, apontamalgumas conclusões importantes, sendo que as mesmas têm uma forte coerência com outros importantestrabalhos de pesquisa desenvolvidos no Brasil, como os estudos de Pinto (1989) e Picchi (1993).

Em primeiro lugar, o número de trabalhos realizados no país é ainda insuficiente, não podendo serapontadas médias nacionais com validade estatística. Neste sentido, é importante que o setor amplie oesforço de coleta de indicadores de qualidade e produtividade, apoiados pelos trabalhos que vêm sendorealizados por universidades, institutos de pesquisa e empresas de consultoria.

Entretanto, os dados sobre perdas de materiais disponíveis indicam que as mesmas são bastante elevadas,existindo uma grande variabilidade nos indicadores de perdas de diferentes obras. Considerando que umagrande parcela das perdas são previsíveis e evitáveis através de medidas de prevenção relativamentesimples, é importante que o setor mobilize-se também no sentido de reduzir as perdas existentes, atravésda introdução de novos métodos e filosofias de gestão.O próprio conceito de perda necessita ser revisto no setor. A exemplo de outros setores industriais quetêm se beneficiado intensamente dos avanços da engenharia de produção, é importante que a construçãocivil passe a encarar as perdas sob um enfoque mais amplo, ao invés de simplesmente se preocupar com asperdas de materiais. O esforço para melhoria de processos deve visar à minimização do dispêndio dequaisquer recursos que não agregam valor ao produto, sejam eles vinculados às atividades de conversão oude fluxo.Fica claro também que não existe um único valor de perdas inevitáveis para cada material. O percentual deperdas inevitáveis é definido pela relação entre o custo da prevenção e o custo da perda e depende dopatamar de desenvolvimento tecnológico e gerencial de cada empresa ou obra. A competitividade daempresa é alcançada na medida que a organização persegue a redução de perdas continuamente.

Page 57: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

6. Referências bibliográficasABNT - Associação Brasileira de Normas Técnicas. Avaliação de custos unitários e preparo de orçamentos

de construção para incorporação de edifício em condomínio: NBR 12721. Rio de Janeiro, 1992.

FRUET, G.M. & FORMOSO, C.T. Diagnóstico das dificuldades enfrentadas por gerentes técnicos deempresas de construção civil de pequeno porte. In: SEMINÁRIO QUALIDADE NA CONSTRUÇÃOCIVIL - GESTÃO E TECNOLOGIA, 2º, Porto Alegre, 8 e 9 junho 1993. Anais. Porto Alegre, UFRGS,1993. pp. 1-51

KOSKELA, L. Application of the new production philosophy to construction. Stanford, EUA, CIFE, 1992.Technical Report 72

OLIVEIRA, M.; LANTELME, E. & FORMOSO, C.T. Sistema de indicadores de qualidade e produtividade daconstrução civil. Manual de utilização. 2a ed. Porto Alegre, SEBRAE-RS, 1995.

PICCHI, F.A. Sistemas de qualidade: uso em empresas de construção. São Paulo, USP, Escola Politécnica,1993. Tese de doutorado

PINTO, T.P. Perda de materiais em processos construtivos tradicionais. São Carlos, UFSCAR,Departamento de Engenharia Civil, 1989. 33p.

SANTOS, A. et al. Método de intervenção para redução de perdas na construção civil. Porto Alegre,SEBRAE/RS, 1996. (a ser publicado)

SHINGO, S. A study of Toyota production system from an industrial engineering viewpoint. Toquio, JapanManagement Association, 1981.

SKOYLES, E.F. & SKOYLES, J.R. Waste prevention on site. London, Mitchell, 1987.

SOIBELMAN, L. As perdas de materiais na construção de edificações: sua incidência e seu controle. PortoAlegre, UFRGS, Curso de Pós-graduação em Engenharia Civil, 1993. Dissertação de mestrado

Page 58: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

1

O que fazer depois de aplicar os questionários

(ou fazer as entrevistas)?

Tabular os dados!

Um exemplo de questionário:

Como tabular os dados obtidos por meio de questionários?

• Os questionários respondidos devem ser enumerados.

• Em seguida passamos a tabular as informações (ou seja, inserir em uma planilha eletrônica).

Como tabular os dados obtidos por meio de questionários?

•Para o questionário do Sujeito 1 obtivemos as seguintes respostas.

ComputaçãoComputaçãoÚltimaÚltima

Como tabular os dados obtidos por meio de questionários?

•Para o questionário do Sujeito 1 obtivemos as seguintes respostas.

ComputaçãoComputaçãoÚltimaÚltima

Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 3

Como tabular os dados obtidos por meio de questionários?Como tabular os dados obtidos por meio de questionários?

O questionário abaixo foi respondido pelo Sujeito 2.Vamos inserir as informações na planilha!

MatemáticaMatemáticaComumComum

Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 3

Page 59: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

2

Como tabular os dados obtidos por meio de questionários?Como tabular os dados obtidos por meio de questionários?

O questionário abaixo foi respondido pelo Sujeito 2.Vamos inserir as informações na planilha!

MatemáticaMatemáticaComumComum

Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 32 Matemática 4 3 3 2 4 3 3

Como tabular os dados obtidos por meio de questionários?Como tabular os dados obtidos por meio de questionários?

O questionário abaixo foi respondido pelo Sujeito 3.Vamos inserir as informações na planilha!

MatemáticaMatemáticaEspecíficaEspecífica

Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 32 Matemática 4 3 3 2 4 3 3

Como tabular os dados obtidos por meio de questionários?Como tabular os dados obtidos por meio de questionários?

O questionário abaixo foi respondido pelo Sujeito 3.Vamos inserir as informações na planilha!

MatemáticaMatemáticaEspecíficaEspecífica

Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 32 Matemática 4 3 3 2 4 3 33 Matemática 3 3 3 2 3 3 4

Como tabular os dados obtidos por meio de questionários?Como tabular os dados obtidos por meio de questionários?

O questionário abaixo foi respondido pelo Sujeito 4.Vamos inserir as informações na planilha!

C SociaisC Sociais2º ano2º ano

Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 32 Matemática 4 3 3 2 4 3 33 Matemática 3 3 3 2 3 3 4

Como tabular os dados obtidos por meio de questionários?Como tabular os dados obtidos por meio de questionários?

No final teremos:

Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 32 Matemática 4 3 3 2 4 3 33 Matemática 3 3 3 2 3 3 44 C. Sociais 2 2 4 4 2 3 55 Matemática 1 4 4 2 3 5 36 C. Sociais 1 1 5 1 3 4 37 Matemática 5 4 2 4 1 4 58 C S 1 2 1 28 C. Sociais 4 1 2 1 5 4 29 Computação 1 4 3 4 4 4 3

10 Matemática 1 5 5 4 3 4 411 Matemática 5 2 2 1 3 2 212 C. Sociais 1 2 4 5 4 3 113 Matemática 4 3 1 5 5 1 414 Matemática 1 2 5 2 4 5 315 C. Sociais 3 4 3 4 3 1 116 Computação 5 2 2 2 5 5 317 Matemática 5 3 4 2 2 2 518 C. Sociais 3 2 4 5 5 1 3

Page 60: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

Questionário Local Residência Instrução Tam. da fam. Renda1 Monte Verde Própria médio 4 10,32 Monte Verde Alugada médio 4 15,43 Monte Verde Própria fundamental 4 9,64 Monte Verde Alugada fundamental 5 5,5 Construir tabelas e gráficos usando o Banco de dados5 Monte Verde Própria médio 4 96 Monte Verde Própria nenhum 1 2,4 Passos:7 Monte Verde Alugada médio 2 4,18 Monte Verde Própria médio 3 8,4 > Inserir9 Monte Verde Própria médio 6 10,3 > Tabela Dinâmica10 Monte Verde Própria fundamental 4 4,6 .. Selecionar os dados (incluindo os Rótulos na 1ª linha)11 Monte Verde Alugada fundamental 6 18,6 .. Marcar "Nova planilha"12 Monte Verde Própria nenhum 4 7,1 .. Clicar em OK13 Monte Verde Alugada fundamental 4 12,914 Monte Verde Alugada fundamental 6 8,415 Monte Verde Alugada médio 3 19,316 Monte Verde Alugada fundamental 5 10,417 Monte Verde Própria médio 3 8,918 Monte Verde Alugada médio 4 12,919 Monte Verde Alugada médio 4 5,120 Monte Verde Própria médio 4 12,221 Monte Verde Própria médio 5 5,822 Monte Verde Própria médio 5 12,923 Monte Verde Alugada médio 5 7,724 Monte Verde Alugada fundamental 4 1,125 Monte Verde Alugada fundamental 8 7,526 Monte Verde Própria médio 4 5,827 Monte Verde Própria nenhum 5 7,228 Monte Verde Alugada médio 3 8,629 Monte Verde Própria fundamental 4 5,130 Monte Verde Alugada médio 5 2,631 Monte Verde Própria médio 5 7,732 Monte Verde Própria fundamental 2 2,433 Monte Verde Própria médio 5 4,834 Monte Verde Própria nenhum 2 2,135 Monte Verde Própria nenhum 6 436 Monte Verde Própria nenhum 8 12,537 Monte Verde Própria médio 3 6,838 Monte Verde Própria médio 5 3,939 Monte Verde Alugada médio 5 940 Monte Verde Alugada médio 3 10,941 Pq. Da Figueira Própria fundamental 5 5,442 Pq. Da Figueira Própria nenhum 3 6,443 Pq. Da Figueira Própria nenhum 6 4,444 Pq. Da Figueira Própria nenhum 5 2,545 Pq. Da Figueira Alugada nenhum 6 5,546 Pq. Da Figueira Própria nenhum 8 647 Pq. Da Figueira Própria médio 4 1448 Pq. Da Figueira Própria fundamental 4 8,549 Pq. Da Figueira Própria nenhum 5 7,750 Pq. Da Figueira Alugada fundamental 3 5,851 Pq. Da Figueira Própria médio 5 552 Pq. Da Figueira Alugada nenhum 3 4,853 Pq. Da Figueira Própria fundamental 2 2,854 Pq. Da Figueira Própria fundamental 4 4,255 Pq. Da Figueira Própria médio 3 10,256 Pq. Da Figueira Própria fundamental 4 7,457 Pq. Da Figueira Própria fundamental 5 558 Pq. Da Figueira Alugada médio 2 6,459 Pq. Da Figueira Alugada médio 4 5,760 Pq. Da Figueira Própria fundamental 4 10,861 Pq. Da Figueira Alugada médio 1 2,362 Pq. Da Figueira Própria nenhum 7 6,163 Pq. Da Figueira Própria nenhum 3 5,564 Pq. Da Figueira Própria nenhum 7 3,565 Pq. Da Figueira Própria médio 3 966 Pq. Da Figueira Própria médio 6 5,867 Pq. Da Figueira Alugada nenhum 6 4,268 Pq. Da Figueira Própria médio 3 6,869 Pq. Da Figueira Própria fundamental 5 4,870 Pq. Da Figueira Própria médio 5 671 Pq. Da Figueira Própria fundamental 7 972 Pq. Da Figueira Própria nenhum 4 5,373 Pq. Da Figueira Própria médio 4 3,174 Pq. Da Figueira Alugada médio 1 6,475 Pq. Da Figueira Própria nenhum 3 3,976 Pq. Da Figueira Própria fundamental 3 6,477 Pq. Da Figueira Própria médio 4 2,778 Pq. Da Figueira Alugada fundamental 4 2,479 Pq. Da Figueira Alugada fundamental 4 3,6

Page 61: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

Tam. da fam. Renda4 10,34 15,4 Função Estatística Descritiva4 9,65 5,5 Passos:4 91 2,4 > Dados2 4,1 > Análise de dados3 8,4 > Estatística Descritiva

Para habilitar esta função:

Vá em Botão Office > Opções do Excel > Suplementos > 3 8,4 > Estatística Descritiva

6 10,3 .. Selecionar os dados (atenção para Rótulos na 1ª linha)4 4,6 .. Marcar "Resumo estatístico"6 18,6 .. Marcar "Nova planilha"4 7,1 .. Clicar em OK4 12,96 8,43 19,35 10,43 8,94 12 9

Resultado! A tabela a seguir será apresentada:

Para habilitar esta função:

Vá em Botão Office > Opções do Excel > Suplementos > Ir...Marque Ferramentas de análise.Clique em OK!

4 12,94 5,14 12,2 Média5 5,8 Erro padrão5 12,9 Mediana5 7,7 Modo4 1,1 Desvio padrão8 7,5 Variância da amostra4 5,8 Curtose5 7,2 Assimetria5 7,2 Assimetria3 8,6 Intervalo4 5,1 Mínimo5 2,6 Máximo5 7,7 Soma2 2,4 Contagem5 4,82 2,16 48 12,53 6 83 6,85 3,95 93 10,95 5,43 6,46 4,45 2,56 5,58 68 64 144 8,55 7,73 5,85 53 4,82 2,84 4,23 10,24 7 44 7,45 52 6,44 5,74 10,81 2,37 6,13 5,57 3,53 93 96 5,86 4,23 6,85 4,85 67 9

Page 62: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

Tam. da fam. Renda4 10,34 15,44 9,6 Função Correlação linear5 5,54 9 Passos:1 2,42 4,1 > Dados

Para habilitar esta função:

Vá em Botão Office > Opções do Excel > 3 8,4 > Análise de dados

6 10,3 > Correlação4 4,6 .. Selecionar os dados (atenção para Rótulos na 1ª linha)6 18,6 .. Marcar "Nova planilha"4 7,1 .. Clicar em OK4 12,96 8,43 19,35 10,4 Como resultado será apresentado em outra planilha

Para habilitar esta função:

Vá em Botão Office > Opções do Excel > Suplementos > Ir...Marque Ferramentas de análise.Clique em OK!

p p3 8,9 o valor do Coeficiente de correlação r-Pearson .4 12,94 5,14 12,25 5,85 12,95 7,74 1,18 7,54 5,85 7,23 8,64 5,15 2,65 7,72 2,45 4,82 2,1,6 48 12,53 6,85 3,95 93 10,95 5,43 6,46 4,4,5 2,56 5,58 64 144 8,55 7,73 5,85 53 4,83 ,82 2,84 4,23 10,24 7,45 52 6,44 5,74 10,81 2,31 2,37 6,13 5,57 3,53 96 5,8

Page 63: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

ESTATÍSTICA

TEC. CONSTRUÇÃO DE EDIFÍCIOS

PROF. MSC. JEFERSON GOMES MORIEL JUNIOR

1

MEDIDAS DE TENDÊNCIA CENTRAL

3.1- Introdução.

Como na representação tabular e gráfica dos dados a Estatística

Descritiva consiste num conjunto de métodos que ensinam a reduzir uma quantidade de

dados bastante numerosa por um número pequeno de medidas, substitutas e representantes

daquela massa de dados. Agora passaremos a estudar as principais medidas da Estatística

Descritiva, agrupadas em medidas de tendência central (ou de posição ou de localização),

medidas de dispersão (ou de variabilidade) e medidas de assimetria e curtose. Estas últimas

serão vistas na aula 4.

Um valor para representar a todos. Algumas medidas sugerem uma

concentração em torno delas, sendo por isso denominadas de MEDIDAS DE

TENDÊNCIA CENTRAL. Para uma amostra, as três medidas mais conhecidas são a

MÉDIA ARITMÉTICA, a MEDIANA e a MODA.

3.2- Média aritmética.

Podemos pensar na média aritmética como o valor “típico” do conjunto

de dados e é considerada a principal medida de tendência central. Algumas das razões que

fazem com que seja a medida de posição mais recomendada são:

É definida rigorosamente e pode ser interpretada facilmente;

Considera todas as observações efetuadas; e

Calcula-se com facilidade.

Entretanto, esta medida apresenta alguns inconvenientes como o fato de

ser muito sensível a valores extremos, isto é, a valores excessivamente pequenos ou

excessivamente grandes, em relação às demais observações do conjunto de dados.

Exemplo: Estamos interessados em conhecer o salário médio mensal de certa empresa com

cinco funcionários. Temos o seguinte conjunto de salários mensais, em reais: 123 - 145 -

210 - 225 - 2.500. Podemos observar que quatro dos cinco salários apresentam valores

entre 123 e 225 reais, porém a média salarial de 640,6 reais é bastante distinta desse

conjunto pela influência do salário de 2.500 que puxou o valor médio para cima.

A média aritmética pode ser calculada de duas formas: média aritmética

simples e média aritmética ponderada.

3.2.1- Média aritmética simples.

Sejam n21 x,...,x,x , n valores que a variável X pode assumir. A média

aritmética simples é definida como:

1

n

i

i

x

Xn

ou, de forma mais simplificada, por

x

Xn

.

Page 64: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

ESTATÍSTICA

TEC. CONSTRUÇÃO DE EDIFÍCIOS

PROF. MSC. JEFERSON GOMES MORIEL JUNIOR

2

0 10 20

0

100

200

300

400

Valore de X

Fre

ên

cia

0 5 10 15

0

100

200

300

400

Valores de X

Fre

ên

cia

3.2.2- Média aritmética ponderada.

A média aritmética ponderada é utilizada quando atribuímos um peso (ou

ponderação) aos valores possíveis da variável. Quando os dados aparecem na forma de

uma distribuição de freqüências, os ponderadores (wi) serão as freqüências absolutas (fi).

Sejam k21 x,...,x,x , k valores que a variável X assume e w1, w2, ..., wk

os respectivos pesos (ou ponderadores). A média aritmética ponderada é definida como:

1

1

k

i i

i

k

i

i

w x

x

w

ou, de forma mais simplificada, por

wxx

w

.

Quando os dados estão agrupados numa distribuição de freqüência as

fórmulas acima podem ser escritas como:

1

1

k

i i

i

k

i

i

f x

X

f

ou, de forma mais simplificada, por

fxX

f

.

3.2.3- Algumas propriedades da média aritmética.

1ª) Somando-se (ou subtraindo-se) um valor

constante e arbitrário a cada um dos

elementos de um conjunto de dados, a média

aritmética fica adicionada (ou subtraída)

dessa constante. Exemplo: A cada elemento

de um conjunto de 1000 dados adicionamos

o valor 10. Ao lado, podemos perceber que a

média dos valores da variável X que era 5

passou a ser 15 e o histograma não

apresentou nenhuma alteração na sua forma.

2ª) Multiplicando-se (ou dividindo-se) um

valor constante e arbitrário a cada um dos

elementos de um conjunto de dados, a média

aritmética fica multiplicada (ou dividida) por

essa constante. Exemplo: Neste caso, para o

mesmo conjunto de 1000 dados, cada valor foi

multiplicado por 2. Como resultado, a média

ficou multiplicada por 2 e passou de 5 para 10

como podemos observar ao lado. Além da

alteração na média ocorreu também alteração

na forma. Veremos o por quê mais adiante.

3.3- Moda

Page 65: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

ESTATÍSTICA

TEC. CONSTRUÇÃO DE EDIFÍCIOS

PROF. MSC. JEFERSON GOMES MORIEL JUNIOR

3

A moda é outra medida de tendência central, mas, diferentemente da média, não utilizam

em seu cálculo todos os valores do conjunto de dados analisado.

Definição: A moda é o valor que ocorre com maior freqüência na distribuição.

Exemplos:

a) X = {2, 3, 3, 5, 5, 5, 6, 7} Mo = 5

b) Y = {10, 12, 17, 21, 32} Mo = não existe, a distribuição é amodal.

c) Z = {2, 2, 5, 5, 7, 7} Mo = não existe, a distribuição é amodal.

d) W = {10, 12, 12, 12, 13, 13, 15, 18, 18, 18, 21} A distribuição apresenta dois valores

modais: 12 e 18 (distribuição bimodal).

Quando a distribuição apresenta mais de uma moda damos o nome de

distribuição plurimodal.

Quando a distribuição de freqüências está organizada por classes de

valores, devemos identificar a classe modal (classe em que observamos a maior

freqüência). O ponto médio da classe modal será o valor estimado para a moda e será

denominado Moda bruta = MoB.

Identifique o valor da moda bruta no gráfico a seguir.

3.4- Separatrizes.

As separatrizes são medidas de posição que permitem calcularmos

valores da variável que dividem ou separam a distribuição em partes iguais. Temos quatro

tipos de separatrizes: i) a mediana, que é também uma medida de tendência central; ii) os

quartis; iii) os decis; e iv) os percentis.

3.4.1- Mediana.

Definição: Chamamos de mediana o elemento do conjunto que ocupa a posição central na

distribuição ordenada (crescente ou decrescentemente). Isto é, divide a distribuição em

Expected

Normal

PROD_B: Produto B

Upper Boundaries (x <= boundary)

No o

f obs

0

2

4

6

8

10

12

14

16

-1 0 1 2 3 4 5

Page 66: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

ESTATÍSTICA

TEC. CONSTRUÇÃO DE EDIFÍCIOS

PROF. MSC. JEFERSON GOMES MORIEL JUNIOR

4

duas partes iguais de modo que 50% dos valores observados ficam à sua esquerda e 50% à

sua direita. Assim, a mediana será: o valor do elemento do meio se n é ímpar, ou a média

dos dois valores do meio se n é par.

Exemplos:

a) Comparação entre a média aritmética e a mediana para os conjuntos de salários (em

reais) dados.

X = { 200, 250, 250, 300, 450, 460, 510} x = 345,7; Md = 300

Y = { 200, 250, 250, 300, 450, 460, 2.300} y = 601,0; Md = 300

Podemos observar que no caso do conjunto Y a média não sintetiza

adequadamente o conjunto de dados, pois apenas um valor é superior a ela.

b) Em algumas áreas, as pessoas autuadas por certas infrações leves de tráfego podem

freqüentar um curso de direção defensiva em lugar de pagar uma multa. Se 12 desses

cursos foram freqüentados por

40, 32, 37, 30, 24, 40, 38, 35, 40, 28, 32 e 37

indivíduos determine a mediana.

24 28 30 32 32 35 37 37 38 40 40 40

Md = 36

3.4.2- Quartis.

Estes elementos dividem a distribuição em quatro partes iguais.

25% 25% 25% 25%

_________Q1_________Q2_________Q3_________

OBS: Q2 = Md

O chamado intervalo interquartil ou interquartílico, é definido por

(Q1; Q3), contém 50% do total de observações localizadas mais ao cento da distribuição.

3.4.3- Decis.

Estes elementos dividem a distribuição em dez partes iguais.

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

___D1___D2___D3___D4___D5___D6___D7___D8___D9___

3.4.4- Percentis.

Estes elementos dividem a distribuição em cem partes iguais.

1% 1% 1% 1% ...................... 1% 1% 1% 1%

___P1___P2___P3___.……………...___P97___P98___P99___

OBS: Q2 = Md = D5 = P50 , D4 = P40 , Q3 = P75 , você consegue entender porque?

Page 67: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

ESTATÍSTICA

TEC. CONSTRUÇÃO DE EDIFÍCIOS

PROF. MSC. JEFERSON GOMES MORIEL JUNIOR

5

Notações: Qi = quartil de ordem i;

Di = decil de ordem i;

Pi = percentil de ordem i.

3.5- Relação entre a média aritmética, a moda e a mediana.

Podemos observar três tipos de relações entre as três principais medidas

de tendência central:

1ª) Quando a distribuição é simétrica,

a média aritmética, a mediana e a moda são iguais:

xMdMo .

2ª) Quando a distribuição tem assimetria positiva

(assimétrica à direita), temos a seguinte relação:

xMdMo .

3ª) Quando a distribuição tem assimetria

negativa (assimétrica à esquerda), temos

a seguinte relação:

xMdMo

3.8- Indicações para utilização das medidas de tendência central

A escolha entre uma das medidas de tendência central nem sempre é de

fácil realização, depende da natureza do problema a ser estudado e de outros fatores,

muitos dos quais não podem abordar-se a nível elementar.

Page 68: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

ESTATÍSTICA

TEC. CONSTRUÇÃO DE EDIFÍCIOS

PROF. MSC. JEFERSON GOMES MORIEL JUNIOR

6

EXERCÍCIOS

1. Calcule a média, a mediana e a moda para cada variável da tabela a seguir.

2. Dez estudantes foram interrogados quanto a sua posição sobre a satisfação com seu

curso de graduação por meio de uma questão que utilizava uma escala de nível intervalar

de 5 pontos. A resposta deles variou dentre de uma escala de 1 a 5 (1 - Fortemente

insatisfeito, 2 – Parcialmente insatisfeito, 3 – Neutra, 4 – Parcialmente satisfeito, 5 –

Fortemente satisfeito) e foram as seguintes: 5, 5, 3, 4, 5, 4, 2, 1, 4 e 4.

Calcule a moda, mediana e média dos dados e avalie, de modo geral, quão satisfeitos estão

os estudantes.

3. O total de empregados das 50 maiores construtoras do Brasil em 2011 está descrito

abaixo (extraído da Base de informações sobre a construção civil brasileira -

cbicdados.com.br).

292 300 578 664 671 693 885 1.022 1.094 1.205

1.250 1.347 1.380 1.382 1.482 1.511 1.587 1.961 1.992 2.134

2.439 2.498 2.678 2.971 3.048 3.211 4.012 4.118 4.290 5.095

5.095 5.824 6.300 6.925 9.000 10.022 10.950 12.974 14.304 14.835

16.862 32.825 43.053 115.205 NI NI NI NI NI NI

(NI : Não informado)

Com base nestes dados:

a) Construa um histograma.

b) Calcule a mediana, a moda e a média e explique como estas três medidas de localização

central descrevem diferentes características dos dados.

c) Encontre os quartis Q1, Q2 e Q3 e faça uma avaliação sobre o número de empregados das

50 maiores construtoras do Brasil.

Page 69: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

ESTATÍSTICA

TEC. CONSTRUÇÃO DE EDIFÍCIOS

PROF. MSC. JEFERSON GOMES MORIEL JUNIOR

7

4. [Adaptado de TRIOLA] As alturas de homens e mulheres são normalmente distribuídas,

com uma média de 175,3 cm para os homens (desvio padrão de 7,1 cm) e de 161,5 cm para

as mulheres (desvio padrão de 6,4 cm). Abaixo estão duas amostras de alturas (em cm)

escolhidas aleatoriamente.

Homens 151 167 170 172 175 175 176 176 176 176

177 178 180 181 181 181 183 184 191 199

Mulheres 152 154 154 156 158 159 159 160 160 160

162 162 162 164 164 165 166 166 166 170

Com base nos dados amostrais e considerando a altura padrão de uma porta como sendo 2

metros, responda:

a) Qual a porcentagem dos homens que não passam por uma porta padrão sem se

curvarem? Qual porcentagem para mulheres? Por que estes resultados não condizem com a

realidade?

b) Se um estatístico projeta uma casa de modo que todas as portas tenham altura suficiente

para todos os homens, exceto os 10% mais altos, qual seria a altura da porta usada?

5. Os seguintes dados indicam resistência à compressão (em psi) de 80 corpos-de-prova de

liga de alumínio-lítio.

76 120 135 149 157 163 171 178 190 207

87 121 141 150 158 163 171 180 193 208

97 123 142 150 158 165 172 180 194 218

101 131 143 151 158 167 174 181 196 221

105 133 145 153 158 167 174 181 199 228

110 133 146 154 160 168 175 183 199 229

115 134 148 154 160 169 176 184 200 237

118 135 149 156 160 170 176 186 201 245

a) Construa um histograma para esses dados.

b) Calcule a média, a moda e mediana e os quartis desses dados.

c) Você acha que o corpo-de-prova “sobreviverá” a uma compressão maior do que

220 psi? Justifique.

6. Na Companhia A, olhando todos os salários de funcionários concluiu-se que: a média

dos salários é de R$10.000,00 e o 3o quartil é R$5.000,00. Se você se apresentasse como

candidato a funcionário e se o seu salário fosse escolhido ao acaso entre todos os possíveis

salários, o que seria mais provável: ganhar mais ou menos que R$5.000,00?

7. Um professor considera que sua última avaliação deve ter peso maior por se tratar de um

conteúdo mais importante. Assim os pesos para as quatro avaliações são 2, 2, 2 e 3. Se um

indivíduo tirou 5,7 - 8,9 - 7,8 - 8,0, qual é sua média final?

8. O consumo de argamassa (em toneladas) em 50 construções em Cuiabá é fornecido na

tabela a seguir.

Consumo Qtde. de

construções Percentual

Page 70: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

ESTATÍSTICA

TEC. CONSTRUÇÃO DE EDIFÍCIOS

PROF. MSC. JEFERSON GOMES MORIEL JUNIOR

8

Fonte: Dados fictícios

Calcule a média, a moda e a mediana destes dados.

9. Numa pesquisa realizada com 100 famílias, levantaram-se as seguintes informações:

Número de filhos 0 1 2 3 4 5 6 ou mais Total

Qtde. de famílias 17 20 28 19 7 4 5 100

a) Qual a mediana do número de filhos?

b) E a moda?

c) Que problemas você enfrentaria para calcular a média? Faça alguma suposição e

encontre-a.

10. Para se estudar o desempenho de duas construtoras investigou-se o número de

reclamações de clientes nos últimos anos, para cada construtora. Os dados estão a seguir.

Construtora Dados sobre a quantidade de reclamações

A 45 62 38 55 54 65 60 55 48 56 59 55 54 70 64 55 48 60

B 57 50 59 61 57 55 59 55 52 55 52 57 58 51 58 59 56 53 50 54 56

Que informações revelam esses dados?

Respostas

1.

Produção (mil t)

Consumo aparente (mil t)

Consumo Per-Capita (Kg/hab)

Exportação (mil t)

Importação (mil t)

MEDIANA 39901 39710 224 431 223

MÉDIA 43579 43213 235 476 285

MODA NE NE NE NE 223

2. Mediana = 4 (parcialmente satisfeito); Média = 3,7 (entre neutro e pouco satisfeito);

Moda = 4 (parcialmente satisfeito). Com base nestes indicadores, pode-se dizer que os

estudantes estão satisfeitos, porém não completamente. Analisando os decis, constata-se

que apenas 20% dos estudantes estão de, algum modo, insatisfeitos com o curso.

3. a) N. de Funcionários Qtde.

292 |-- 16709 40

Page 71: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

ESTATÍSTICA

TEC. CONSTRUÇÃO DE EDIFÍCIOS

PROF. MSC. JEFERSON GOMES MORIEL JUNIOR

9

16709 |-- 33126 2

33126 |-- 49543 1

49543 |-- 65960 0

65960 |-- 82377 0

82377 |-- 98794 0

98794 |-- 115211 1

Total 44

b) Média = 8227 funcionários; mediana = 2588 funcionários; não existe moda. A primeira

medida descreve o número médio de funcionários por construtora e este número é

altamente influenciado pelos valores extremos e discrepantes (como é o caso da empresa

com mais de 115 mil funcionários). A mediana, por dividir os dados em duas partes iguais,

é pouco influenciada por valores discrepantes e, neste caso, indica melhor a concentração

dos dados.

c) q1 = 1299 funcionários; q2 = 2588 funcionários; q3 = 6613 funcionários. Os quartis

indicam que 75% das construtoras tem até 6613 funcionários, e as mais empregadoras

empregam entre 6,6 e 115 mil funcionários, aproximadamente.

4. a) 0% e 0%. Porque a amostra é muito pequena para representar a população de alturas

de homens e mulheres, ainda que seja em um único país.

b) No máximo 190,9 cm

5. a) Resistência à compressão (em psi) Qtde.

76 |-- 98 3 98 |-- 120 5

120 |-- 142 10 142 |-- 164 24 164 |-- 186 21 186 |-- 208 10 208 |-- 230 5 230 |-- 252 2

Total 80

b) Média = 162,7 psi; Mediana = 161,5 psi; Moda = 158 psi.

c) Pela amostra, a chance é 5 em 80, ou seja, 6,3%, aproximadamente.

6. Embora a média salarial seja considerada alta (10 mil reais), é mais provável (com 75%

de chance) que o salário escolhido aleatoriamente seja menor que 5 mil reais (terceiro

quartil).

7. Nota 7,64, aproximadamente.

8. Moda = 4,35; Mediana = 7,05; Média = 7,27.

9. a) Dois filhos. b) Dois filhos. c) Encontrar o valor numérico da categoria “6 ou mais”

para fazer a média ponderada. Isto pode ser superado considerando o menor valor (6).

Assim, a média ficará igual a 2,1 filhos.

10. Construtora A Construtora B Os dados indicam que as duas construtoras

Média 55,7 Média 55,4

Page 72: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

ESTATÍSTICA

TEC. CONSTRUÇÃO DE EDIFÍCIOS

PROF. MSC. JEFERSON GOMES MORIEL JUNIOR

10

Mediana 55 Mediana 56 tem desempenhos muito semelhantes

(𝑥 𝐴=55,7 e 𝑥 𝐵=55,4 reclamações), mas as

reclamações ao longo dos anos tem

variado mais na construtora A do que na B

(AA = 32 e AB = 11 reclamações).

Moda 55 Moda 57 Desvio padrão 7,7 Desvio padrão 3,2 Amplitude 32 Amplitude 11 Mínimo 38 Mínimo 50 Máximo 70 Máximo 61 Contagem 18 Contagem 21

Lista de Exercícios adicional – AULA: MEDIDAS DE TENDÊNCIA CENTRAL

1. Nos 12 meses de 1990, uma delegacia registrou 4, 3, 5, 5, 10, 8, 9, 6, 3, 4, 8 e 7 assaltos

à mão armada. Calcule a média, isto é, o número médio de assaltos por mês.

2. Numa excursão, de um grupo de pessoas que freqüentam a mesma academia, as idades

são: 18, 17, 21, 19, 21, 18, 18, 54, 20. Determine a média das idades e verifique porque

esta média pode ser mal interpretada. Poderíamos determinar outra medida de tendência

central? Por quê?

3. Em um posto de controle rodoviário (onde o limite de velocidade é de 120 km/h), doze

motoristas multados por excesso de velocidade estavam dirigindo a: 128, 130, 160, 135,

125, 140, 140, 139, 148, 136, 138 e 145 km/h.

a) Em média em quantos km/h esses motoristas estavam excedendo o limite?

b) Se os motoristas que excediam o limite em até 20 km/h foram multados em R$

150,00 e os que excediam em mais de 20 km/h foram multados em R$ 250, 00,

qual o valor médio das multas?

4. Ao testarem um novo sistema de freio, engenheiros da indústria automobilística

constataram que 21 motoristas, correndo a 120 km/h conseguiram parar dentro das

seguintes distâncias de frenagem (em metros):

58 70 80 46 61 65 75 55 67 56 70 72 75 61 66 58 68 70 68 58 70

a) Determine a mediana, a média e a moda. (67 65,1905 70)

Page 73: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

1

MEDIDAS DE DISPERSÃO

Prof. Ms. Jeferson Gomes Moriel Junior

CONSIDERAÇÕES PRELIMINARESA esta altura do curso os estudantes já tiveram contato com as Medidas de Tendência Central (média, moda, mediana) de um conjunto de dados. Eles devem ter percebido que estas medidas podem ser usadas para sintetizar, em um único número, o que é “médio” ou “típico” em uma distribuição, ou seja, podem ser usadas para representar um conjunto de dados por meio de um único número em termos de uma posição central ou valor típico.

Analisar um conjunto de dados com base em uma única medida de tendência central nos fornece informações suficientes para compreender as

características deste conjunto?

CONSIDERAÇÕES PRELIMINARES

Tabela 1. Média final de estudantes de três turmas.Turma Média

A 6,0B 6,0C 6,0

Quando empregada isoladamente, qualquer medida de tendência central dá apenas um quadro incompleto de um conjunto de dados, podendo assim, tanto esclarecer quanto confundir ou distorcer.

CONSIDERAÇÕES PRELIMINARESTabela 2. Notas finais de estudantes de três turmas e respectivas médias.

E b édi d t j i i (6 0)

Turma Notas dos alunos MédiaA 4 5 5 6 6 7 7 8 6,0B 1 2 4 6 6 9 10 10 6,0C 0 6 7 7 7 7,5 7,5 6,0

Embora as médias das turmas sejam iguais (6,0) percebemos que as notas variam em cada turma de modo diferente, ou seja, as notas estão dispersas de modos distintos. Logo, é necessário ter uma Medida de Dispersão que diga algo sobre a variabilidade dos valores. As principais medidas de dispersão que discutiremos são: Amplitude, Variância, Desvio padrão e Coeficiente de variação.

AMPLITUDEDefinição: Amplitude total de um conjunto de dados é a

diferença entre seu maior e seu menor valor.

At = max – min

Exemplo:

Tabela 3. Notas finais de estudantes de três turmas e respectivas amplitudes.

Turma Notas dos alunos AmplitudeA 4 5 5 6 6 7 7 8 8 – 4 = 4B 1 2 4 6 6 9 10 10 10 – 1 = 9C 0 6 7 7 7 7,5 7,5 7,5 – 0 = 7,5

AMPLITUDETabela 3. Notas finais de estudantes de três turmas e respectivas amplitudes.

Turma Notas dos alunos AmplitudeA 4 5 5 6 6 7 7 8 8 – 4 = 4B 1 2 4 6 6 9 10 10 10 – 1 = 9C 0 6 7 7 7 7,5 7,5 7,5 – 0 = 7,5

Se compararmos a amplitude dos dados da Turma A (At = 4) e da Turma C (At = 7,5) veremos que a segunda é quase o dobro da primeira, ou seja, as notas da Turma A variam muito menos do que as notas da Turma C. Entretanto, com exceção de uma única nota (zero), as notas da Turma C parecem mais “próximas” do que as da Turma A, além de todas estarem iguais ou acima da média, diferente da Turma A.

Page 74: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

2

AMPLITUDE

At = 4

At = 7,5

AMPLITUDE

Conclusão: A amplitude total é influenciada, ou mesmo distorcida, por um valor "atípico" na distribuição (um valor muito elevado ou muito baixo em relação ao conjunto). Uma medida que seja tão afetada por um único caso pode não dar uma ideia precisa da variabilidade e, para a maioria dos objetivos, deve ser considerada um índice preliminar ou muito grosseiro.muito grosseiro.

Existe alguma medida de variabilidade que leve em conta todos os dados de uma distribuição, ao invés de

apenas dois valores?

AMPLITUDE

Conclusão: A amplitude total é influenciada, ou mesmo distorcida, por um valor "atípico" na distribuição (um valor muito elevado ou muito baixo em relação ao conjunto). Uma medida que seja tão afetada por um único caso pode não dar uma idéia precisa da variabilidade e, para a maioria dos objetivos, deve ser considerada um índice preliminar ou muito grosseiro.muito grosseiro.

Existe alguma medida de variabilidade que leve em conta todos os dados de uma distribuição, ao invés de

apenas dois valores?

A variância e o desvio padrão avaliam a dispersão de um conjunto de dados em relação à média.

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Para calcular estas medidas é preciso considerar os desvios de cada valor em relação à média.

E depois calcular “uma espécie” de média destes desvios.

Definição: Desvio é a distância de um valor arbitrário do conjunto de dados à média da distribuição.conjunto de dados à média da distribuição.

Para ilustrar esta idéia vamos calcular a variância e o desvio padrão das notas da Turma A.

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Para calcular estas medidas é preciso considerar os desvios de cada valor em relação à média.

E depois calcular “uma espécie” de média destes desvios.

Definição: Desvio é a distância de um valor arbitrário do conjunto de dados à média da distribuição.conjunto de dados à média da distribuição.

Para ilustrar esta idéia vamos calcular a variância e o desvio padrão das notas da Turma A.

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Para calcular estas medidas é preciso considerar os desvios de cada valor em relação à média.

E depois calcular “uma espécie” de média destes desvios.

Definição: Desvio é a distância de um valor arbitrário do conjunto de dados à média da distribuição.conjunto de dados à média da distribuição.

Para ilustrar esta idéia vamos calcular a variância e o desvio padrão das notas da Turma A.

Page 75: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

3

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Para calcular estas medidas é preciso considerar os desvios de cada valor em relação à média.

E depois calcular “uma espécie” de média destes desvios.

Definição: Desvio é a distância de um valor arbitrário do conjunto de dados à média da distribuição.conjunto de dados à média da distribuição.

Para ilustrar esta idéia vamos calcular a variância e o desvio padrão das notas da Turma A.

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Para calcular estas medidas é preciso considerar os desvios de cada valor em relação à média.

E depois calcular “uma espécie” de média destes desvios.

Definição: Desvio é a distância de um valor arbitrário do conjunto de dados à média da distribuição.conjunto de dados à média da distribuição.

Para ilustrar esta idéia vamos calcular a variância e o desvio padrão das notas da Turma A.

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Para calcular estas medidas é preciso considerar os desvios de cada valor em relação à média.

E depois calcular “uma espécie” de média destes desvios.

Definição: Desvio é a distância de um valor arbitrário do conjunto de dados à média da distribuição.conjunto de dados à média da distribuição.

Para ilustrar esta idéia vamos calcular a variância e o desvio padrão das notas da Turma A.

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Para calcular estas medidas é preciso considerar os desvios de cada valor em relação à média.

E depois calcular “uma espécie” de média destes desvios.

Seria bom se pudéssemos combinar, de alguma forma, todos esses valores em um único valor que os representasse. A simples soma não serve, porque essa soma é sempre zero. Módulo: criaria dificuldades algébricas nos métodos de inferência estatística, pois esta operação não satisfaz propriedades algébricas usadas nos métodos. Para evitar o problema dos desvios negativos, vamos trabalhar com os desvios quadráticos, ( X – )2.X

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Para calcular estas medidas é preciso considerar os desvios de cada valor em relação à média.

E depois calcular “uma espécie” de média destes desvios.

A variância populacional é definida como a média aritmética dos desvios quadráticos.

Variância populacional:( )

NX∑=

22 -μ

σ

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Para calcular estas medidas é preciso considerar os desvios de cada valor em relação à média.

E depois calcular “uma espécie” de média destes desvios.

Todavia, em geral, trabalha-se com uma amostra, ao invés da população inteira. Assim, a variância amostral deverá ser calculada usando como denominador n – 1 no lugar de N, sendo expressa da seguinte forma:

( )1-

2

2

−= ∑

nXX

s

Page 76: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

4

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Para calcular estas medidas é preciso considerar os desvios de cada valor em relação à média.

E depois calcular “uma espécie” de média destes desvios.

Variância amostral:

Em relação ao conjunto de notas da Turma A, a variância é

( )1-

2

2

−= ∑

nXX

s

.71,118

411001142 =−

+++++++=s

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Conforme construímos o conceito, a variância é uma “boa” medida de dispersão. Entretanto, tem o inconveniente de não ser expressa nas mesmas unidades que os dados. Por exemplo, se ao invés de notas fossem quantidade de dias que funcionários de uma empresa faltam ao trabalho (durante um ano), os dados seriam expressos em dias, os desvios também seriam expressos em dias os quadrados dos desvios em dias2 e por conseqüência em dias, os quadrados dos desvios em dias2 e por conseqüência a variância também.

( )1-

2

2

−= ∑

nXX

s

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Para fazer uma avaliação da dispersão por meio de um índice que tenha a mesma dimensão que os dados usa se a raiz que tenha a mesma dimensão que os dados, usa-se a raiz quadrada positiva da variância, chamada de desvio padrão.Assim, o desvio padrão (expresso na mesma unidade de medida dos dados em análise) pode ser calculado por

Desvio padrão amostral:

Desvio padrão populacional:

( )1-

2

−= ∑

nXX

s

( )N

X∑=2-μ

σ

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

.71,12 =s

Desvio padrão amostral:

Em termos do conjunto de notas da Turma A, temos o seguinte desvio padrão: .

( )1-

2

−= ∑

nXX

s

31,171,1 ==s

,

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Outra fórmula para calcular a variância e o desvio padrão amostrais:

1).(

22

−= ∑

nXnX

s1

).(22

2

−−

= ∑n

XnXs

Vantagens:

“Mais simplificada” (exige um menor número de operações aritméticas se os cálculos forem feitos à mão)Evita os erros de arredondamento

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Tabela 4. Medidas descritivas das notas finais dos alunos de três turmas.

Turma Média Desvio padrãoA 6,0 1,31B 6,0 3,51C 6,0 2,69

Uma análise da Tabela 4. Verificamos, por meio das médias, que os alunos das três turmas tenderam a ter as notas em torno de seis, mas pelos desvios padrão, concluímos que os alunos da Turma A obtiveram notas relativamente próximas umas das outras, quando comparados aos alunos das outras turmas. Por outro lado, as notas dos alunos da Turma B foram as que se apresentaram de forma mais heterogênea.

Page 77: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

5

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO

Conclusões:

(i) Tanto a variância quanto o desvio padrão são medidas que fornecem informações complementares à fornecida pela média aritmética.

(ii) O desvio padrão é útil para avaliar o grau de variabilidade de uma distribuição (será sempre não negativo e quanto mais dispersos forem os valores observados, maior será o desvio padrão).

(iii) O desvio padrão é útil para comparar a variabilidade de diferentes distribuições (ao comparar os desvios padrão de vários conjuntos de dados, podemos avaliar quais se distribuem de forma mais, ou menos, dispersa).

(iv) É um padrão contra o qual avalia-se a colocação de um dado dentro de toda a distribuição.

CONSTRUINDO CONCEITOS: VARIÂNCIA EDESVIO PADRÃO EXERCÍCIO: ANÁLISE DE CONCRETO

A resistência do concreto à compressão (em psi)foi avaliada por dois grupos de estudantes emlaboratório. Cada grupo utilizou 5 corpos-de-prova.Grupo Resistência à compressão (psi) Média

1° 2° 3° 4° 5°

Que conclusão pode-se chegar?

1° 2° 3° 4° 5°A 2070 2071 2069 2070 2070 2070B 2060 2080 2070 2062 2083 2071

COEFICIENTE DE VARIAÇÃO

Esta medida de dispersão permite comparar a variabilidade de duas ou mais distribuições, mesmo quando essas se refiram a diferentes fenômenos e sejam expressas em unidades de medida distintas.Em geral, são expressas em porcentagem e são elaboradas a partir da relação entre uma medida de dispersão absoluta e

did d t dê i t l O j l i tuma medida de tendência central. Ou seja, pelo quociente:

%100CV ⎟⎟⎠

⎞⎜⎜⎝

⎛μσ

= %100xsCV ⎟

⎠⎞

⎜⎝⎛=

COEFICIENTE DE VARIAÇÃOExemplo: A tabela a seguir nos fornece a tendência central e a dispersão dos pesos e alturas de 40 homens de certa amostra.

Estatística Estatura Peso

Média (X) 173,6 cm 77,6 kg

Desvio-padrão (s) 7,7 cm 11,8 kg

%44,46,173

7,7%100 ==⎟⎠⎞

⎜⎝⎛=

xsCV %21,15

6,778,11%100 ==⎟

⎠⎞

⎜⎝⎛=

xsCV

Page 78: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

6

COEFICIENTE DE VARIAÇÃOExemplo: A tabela a seguir nos fornece a tendência central e a dispersão dos pesos e alturas de 40 homens de certa amostra.

Estatística Estatura Peso

Média (X) 173,6 cm 77,6 kg

Desvio-padrão (s) 7,7 cm 11,8 kg

Coeficiente de Variação (CV) 4 44 % 15 21 %

Embora a diferença entre unidades torne impossível comparar o desvio padrão de 7,7 cm com o desvio padrão de 11,8 kg, podemos comparar o coeficiente de variação, que não tem unidades. Observa-se então, que as estaturas (CVe= 4,44%) têm consideravelmente menos variação do que pesos (CVp = 15,21%). Isso faz sentido intuitivamente, porque vemos rotineiramente que os pesos entre homens variam muito mais do que as alturas.

Coeficiente de Variação (CV) 4,44 % 15,21 %

COEFICIENTE DE VARIAÇÃOExemplo: A tabela a seguir nos fornece a tendência central e a dispersão dos pesos e alturas de 40 homens de certa amostra.

Estatística Estatura Peso

Média (X) 173,6 cm 77,6 kg

Desvio-padrão (s) 7,7 cm 11,8 kg

Coeficiente de Variação (CV) 4 44 % 15 21 %

O coeficiente de variação serve também para nos indicar o grau de representatividade da média dentro de um conjunto de dados, além de comparar o comportamento de dois conjuntos com unidades diferentes. Quanto menor o coeficiente de variação maior a representatividade da média.

Coeficiente de Variação (CV) 4,44 % 15,21 %

Uma empresa de transporte de cimento precisa escolher dentreduas marcas de pneus (A e B) para suprir a necessidade de suafrota de veículos. O manual do fabricante das duas marcasafirma que o desgaste dos pneus a cada 10.000 km é de 1milímetro. O gerente de suprimentos da empresa comprou 10pneus de cada marca e submeteu-os a um teste de desgaste de10.000 km. O resultado (em número de milímetros gastos)obtido para cada pneu foi o seguinte:

PROBLEMA SÍNTESE

obtido para cada pneu foi o seguinte:

Qual marca lhe parece recomendável? Justifique sua resposta.

A: 0,5 1,0 0,7 1,5 1,6 1,2 0,4 0,8 1,0 1,3

B: 1,0 1,1 0,9 1,0 1,0 0,9 1,1 1,2 0,8 1,0

nPneu A Pneu B

X X2 X X2

1 0,5 0,25 1,0 1,002 1,0 1,00 1,1 1,213 0,7 0,49 0,9 0,814 1,5 2,25 1,0 1,00

1 6 2 56 1 0 1 00

1).(

22

−= ∑

nXnX

s

41,0164,09

)1.(1048,11 2

==−

=As

PROBLEMA SÍNTESE

5 1,6 2,56 1,0 1,006 1,2 1,44 0,9 0,817 0,4 0,16 1,1 1,218 0,8 0,64 1,2 1,449 1,0 1,00 0,8 0,6410 1,3 1,69 1,0 1,00

Soma 10 11,48 10 10,12Média 1 1

9

12,0013,09

)1.(1012,10 2

==−

=Bs

Estatística Pneu A Pneu B

Amplitude (At) 1,2 mm 0,4 mm

PROBLEMA SÍNTESE

Média (X) 1 mm 1 mm

Variância (s2) 0,164 mm2 0,013 mm2

Desvio-padrão (s) 0,41 mm 0,12 mm

Coeficiente de Variação (CV) 41 % 12 %

Calcule a Amplitude, a Média, a Variância e o Desvio padrão de cada uma das duas amostras abaixo e, a seguir, responda: o que se pode concluir a partir desses resultados?

Tempo de espera de clientes do Jefferson Valley BankTempo de espera de clientes do Jefferson Valley Bank(onde todos os clientes esperam em fila única):

6,3 6,5 6,6 7,3 7,4 7,7 7,7 7,7

Tempo de espera de clientes do Bank of Providence(onde todos os clientes esperam em filas individuais para cada guichê de atendimento):

4,2 5,4 6,2 6,7 7,7 7,7 9,3 10,0

Page 79: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

7

Page 80: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

1

REVISANDO...

Com o objetivo de contratar um digitador, determinada empresa submeteu aos candidatos a digitarem 5 textos de tamanhos variados, onde foram anotados os tempos de execução (em minutos). Destacaram-se dois candidatos, cujos tempos estão descritos na tabela abaixo:

Candidatos Provas

1ª 2ª 3ª 4ª 5ª A 6 8 8 9 9 B 5 7 8 8 12

Pergunta: Qual é o melhor candidato?

Uma maneira de classificá-los seria pela média, porém verifica-se que os dois candidatos têm médias iguais, ou seja, de 8 minutos, ocasionando assim um impasse. Se optar pela mediana ou pela moda o valor também será de 8 minutos. Assim, percebemos que as medidas de tendência central nem sempre são suficientes para descrever plenamente um conjunto de dados. As medidas que complementam essa descrição são as chamadas medidas de dispersão, pois medem o grau de concentração dos dados. Estas estatísticas – Amplitude total, Variância, Desvio-padrão e Coeficiente de Variação – foram estudadas em aulas anteriores.

No caso em questão, o melhor candidato é o que apresentou maior homogeneidade, ou menor dispersão nos tempos de execução.

VISUALIZAÇÃO DE DISTRIBUIÇÕES POR MEIO DE DIAGRAMAS DE

CAIXA (BOX PLOT) Quando procuramos descrever a aparência de uma pessoa conhecida, tendemos a enfocar características como altura, peso, idade e comprimento do cabelo. Da mesma maneira, ao descrever distribuições de dados, os pesquisadores sociais tendem a citar sua tendência central, dispersão, assimetria e outras características. Uma figura, porém, pode valer mais do que mil palavras. Uma foto de uma pessoa é muito mais útil para descrever sua aparência do que uma lista de atributos. Do mesmo modo, uma representação gráfica de uma distribuição é muito mais útil do que toda uma lista de estatísticas.

Recentemente, o diagrama de caixas (box plot) tornou-se uma representação gráfica popular para exibir vários aspectos de uma distribuição. Consideremos, por exemplo, o seguinte rol de tempos de espera (em minutos) em resposta a um experimento realizado com o intuito de medir a paciência. Neste estudo, as pessoas ligam para um número gratuito dado em um anúncio de jornal sobre a promoção do tipo “bom demais para ser verdade” de um novo aparelho de televisão de alta definição. Os sujeitos que fazem perguntas sobre a suposta “liquidação” são deixados esperando indefinidamente pela telefonista, até que resolvem desligar, por frustração.

1 2 3 3 3 3 4 4 4 5 5 5 5 6 6 7 7 7 8 9

Page 81: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

2

Aplicando as técnicas e as fórmulas aprendidas até aqui, podemos calcular em 4,85 minutos o tempo médio de espera, ao passo que a mediana é de 5,0 minutos. A proximidade destas duas medidas de tendência central pode sugerir uma distribuição razoavelmente simétrica.

Em termos de variabilidade, os tempos de espera variam desde um mínimo de 1 minuto até o máximo de 9 minutos. O desvio padrão é 2,03 minutos, o que indica que aproximadamente dois terços dos que fazem chamadas ficam retidos por 2 minutos a contar da média (ou 2,82 a 6,88). O primeiro quartil (Q1) é 3 minutos e o terceiro quartil (Q3) é 6,5 minutos.

Todos esses detalhes podem ser exibidos em um diagrama de caixas.

O gráfico ao lado apresenta a amplitude como um segmento retilíneo prolongando-se do mínimo até o máximo. A caixa retangular dentro do gráfico representa o intervalo ou distância inter-quartílica (DQ = Q3 – Q1). A reta horizontal através da caixa representa a mediana e o círculo preto no meio dela é a representação da média.

Observação: Outras medidas também podem ser usadas para formar a caixa em lugar de utilizar os quartis. Por exemplo, ao invés do Q1 poderia ser utilizado o valor da média menos um desvio padrão (4,85 – 2,03 = 2,82) e ao invés do Q3 poderia ser usado o valor da média mais um desvio padrão (4,85 + 2,03 = 6,88).

Quando discutimos gráficos pela primeira vez, concordamos que eles podem ser utilizados para comparar duas distribuições, por exemplo, no caso do gráfico de barras a seguir.

Page 82: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

3

Isso é válido para uma variável ordinal como o uso de cinto de segurança, mas como uma medida intervalar (tempos de espera) podemos fazer melhor! Assim como comparamos as fotos de duas pessoas lado a lado, podemos apresentar os diagramas de caixa de dois grupos lado a lado, para melhor compreender as diferenças entre grupos.

A figura a seguir mostra o seguinte desdobramento de tempos de espera para homens e mulheres: Homens 5 2 7 9 3 4 3 1 3 8 Mulheres 3 5 7 4 5 6 7 6 5 4

Análisando o gráfico...

Vemos que, em média, as mulheres se revelaram mais pacientes, tanto em termos de tempo médio como de tempo mediano. Os homens, entretanto, acusaram níveis bem mais diversos de paciência. Isto é, a caixa para os homens, representando o intervalo entre o primeiro quartil e o terceiro quartil, é muito mais longa do que a das mulheres. Além disso, a amplitude dos tempos de espera para os homens é maior do que para as mulheres.

Pode-se também ver, com base nas posições relativas da média e da mediana, que a distribuição de tempos de espera para homens é um tanto assimétrica, o que não ocorre no caso das mulheres.

Pode-se construir um boxplot seguindo os seguintes passos:

1. Numa reta são marcados 5 pontos: o valor mínimo, o 1o quartil (Q1), a mediana (Q2), o 3o quartil

(Q3) e o valor máximo.

2. Sobre essa reta constrói-se um retângulo com limites iguais às posições do primeiro e terceiro

quartis, cortado por um segmento de reta na posição relativa à mediana.

3. A partir de Q3 (e de Q1) traça-se uma linha paralela ao eixo até o ponto mais afastado da série, que pode ser o limite crítico superior (e inferior) ou até o maior (e menor) valor observado. E a posição dos limites críticos ou dos extremos é marcada com traços verticais.

Sendo que o limite crítico inferior é igual ao valor Q1 – 1,5.DQ e o limite crítico superior é igual ao valor Q3 + 1,5.DQ.;

4. Os valores da série que se localizarem além (ou aquém) do limite crítico superior (ou inferior) são chamados “outliers”.

Page 83: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4

Exemplo. Vamos construir um Box plot para representar a seguinte amostra:

3 15 17 18 21 21 22 25 27 30 38 49 68

min = Q1 = Md = Q3 = max =

DQ =

Observações atípicas ou discrepantes (outliers) É muito comum aparecer entre os dados coletados, observações atípicas (outliers), isto é, valor muito grande ou muito pequeno em relação aos demais. Um conjunto de dados pode apresentar apenas um ou vários outliers.

Observações atípicas alteram enormemente as médias e variabilidade dos grupos a que pertencem e podem distorcer as conclusões obtidas por meio de uma análise estatística padrão. Portanto, é de fundamental importância detectar e dar um tratamento adequado a elas. Recomenda-se fazer uma inspeção dos dados no início da análise estatística, quando da descrição dos dados.

Dentre as possíveis causas do aparecimento de outliers, pode-se citar as seguintes: • Leitura, anotação ou transição incorreta dos dados. • Erro na execução do experimento ou na tomada da medida. • Mudanças não controláveis nas condições experimentais ou dos elementos. • Característica inerente à variável estudada (por exemplo, grande instabilidade do que está

sendo medido). Quando um outlier é detectado, duas medidas podem ser tomadas: abandoná-lo ou conservá-lo. Existem justificativas para cada uma dessas medidas e o tipo de análise pode variar, assim como os resultados, caso o outlier seja eliminado ou não.

Um outlier deve ser eliminado da análise quando houver uma justificativa convincente para isto, por exemplo quando a observação é incorreta ou houve erro na execução do experimento ou na medida tomada. Após a eliminação do outlier pode-se (re)fazer a análise estatística usando-se apenas as observações restantes.

Como já foi destacado anteriormente, os dados que se localizarem além (ou aquém) do limite crítico superior (ou inferior) serão chamados “outliers”.

Page 84: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

5

LISTA DE EXERCÍCIOS – AULA SOBRE BOX PLOT 1) O rol abaixo apresenta as idades de uma amostra de executivos bem sucedidos da cidade de Cuiabá em agosto de 2007. Com base nestes dados: (a) Construa um diagrama de caixa (Box plot) para representar todos os dados.

18 31 32 35 36 36 36 38 39 39 40 40 40 41 42 42 42 42 42 43 44 44 45 47 47 47 48 48 48 49 49 49 49 50 50 51 51 51 54 54 54 55 56 56 57 57 60 61 61 86

(b) Sabendo que há executivos do sexo masculino e feminino, construa diagramas de caixa lado a lado para comparar e melhor compreender as diferenças entre os dois grupos.

MASCULINO: 18 31 32 35 36 38 40 40 41 42 42 42 44 47 48 49 49 50 51 51 54 54 60 61 61

FEMININO: 36 36 39 39 40 42 42 43 44 45 47 47 48 48 49 49 50 51 54 55 56 56 57 57 86 2) Uma empresa está planejando diminuir o tempo de entrega de um produto que comercializa. Para tal, fez um levantamento das últimas 50 entregas obtendo a informação sobre o número de dias que o produto levou para ser entregue. Os dados, já ordenados, são apresentados a seguir:

1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6, 7, 7, 8 e 15.

(a) Descreva estatisticamente o rol acima utilizando as medidas estatísticas estudadas até aqui na disciplina (como exemplo: média, moda, mediana, quartis, amplitude, desvio padrão, variância e coeficiente de variação). (b) Construa um Box plot (diagrama de caixa) para os dados apresentados. (c) Você identifica algum valor discrepante dentre os dados que foram coletados? Se sim, remova-o(s), corrija as medidas encontradas no item (a) e comente as diferenças encontradas. Sobre exercício 1:

masc     fem               Média  44,64  Média  48,64Mediana  44,00  Mediana  48,00Moda  42,00  Moda  36,00Desvio padrão  10,12  Desvio padrão  10,13Variância  102,32  Variância  102,57Amplitude  43,00  Amplitude  50,00CV  23%  CV  21%Q1  39,00  Q1  42,00Q2  44,00  Q2  48,00Q3  51  Q3  54,5

Page 85: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

1

Coeficiente de correlação de Pearson (r-Pearson)

Prof. Jeferson Gomes Moriel Junior

• Na aula de hoje estamos interessados em avaliar o grau de associação dos dados de duas variáveis quantitativas.

• Exemplos

Variável X Variável Y

Expectativa de vida Taxa de analfabetismo

Tempo de prática de Nível de colesterolesportes

Tempo de estudo Rendimento acadêmico

Nível de estresse Desempenho escolar

Taxa de desemprego Taxa de criminalidade

Valor de imóveis Idade de imóveis

• Associações deste tipo nós chamaremos de CORRELAÇÕES.

ATENÇÃO:

• Correlação NÃO implica relação de CAUSA-E-EFEITO.

Possibilidades

• As variáveis X e Y estão positivamente correlacionadas se elas caminham num mesmo sentido;

• As variáveis X e Y estão negativamente correlacionadas se elas caminham em sentidos opostos.

Positivamente correlacionadas

• Elementos com valores pequenos de X tendem a ter valores pequenos de Y e elementos com valores grandes de X tendem a ter valores grandes de Ytendem a ter valores grandes de Y.

• Exemplo: as variáveis PESO e ALTURA. De modo geral, indivíduos altos tendem a ser mais pesados, enquanto a maioria dos indivíduos baixos é leve.

Page 86: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

2

Dados de 2006 sobre 12 municípios brasileiros

Fonte: Barbetta (2006)

• Elementos com valores pequenos de X tendem a ter valores grandes de Y e elementos com valores grandes de X tendem a ter valores pequenos de Y

Negativamente correlacionadas

tendem a ter valores pequenos de Y.

• Exemplo: as variáveis RENDA FAMILIAR e TAMANHO FAMILIAR. De modo geral, famílias de baixa renda tendem a ter mais filhos do que as de alta renda.

Dados de 2006 sobre 12 municípios brasileiros

Fonte: Barbetta (2006)

Diagrama de dispersão

a. b.

Podemos afirmar que não há correlação linear em a.E praticamente não há correlação linear nos itens b e c.

c.

• Dados de 2000 sobre 45 municípios brasileiros.

Há correlação entre as variáveis abaixo?

Fonte: Dados fictícios.

Page 87: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

3

Um caso!

• Um pesquisador, interessado em estudara associação entre grau de instrução e ograu de preconceito (de modo geral),entrevista uma amostra de 10 pessoasentrevista uma amostra de 10 pessoaspara saber qual é o número de anoscompletos de instrução (variável X) e onível de preconceito (variável Y), obtendoassim os dados a seguir.

Entrevistado

Anos de instrução

(X)

Preconceito (Y)

A 10 1B 3 7C 12 2D 11 3E 6 5F 8 4G 14 1H 9 2I 10 3J 2 10

6

8

10

12

conc

eito

(Y)

X Y

10 13 712 211 36 58 4

0

2

4

0 2 4 6 8 10 12 14 16

Anos de instrução (X)

Prec8 4

14 19 210 32 10

• O que você pode dizer sobre o grau de associação entre as variáveis?

E tã l i d iti t ?• Estão correlacionadas positivamente? Negativamente? Praticamente não há correlação?

• Em que medida? Ou seja, QUANTO?

Solução!

Coeficiente de correlação de Pearson (r-Pearson)

• Descreve em um único número o grau de associação dos dados de duas variáveis quantitativas.

r de Pearson

0,6

0 30,3

-0,3

-0,6

Page 88: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

4

• Cálculo de r de Pearson

Voltando ao Caso em estudo.X Y

10 1

3 7

12 2

11 311 3

6 5

8 4

14 1

9 2

10 3

2 10

X Y X2 Y2 X.Y

10 1 100 1 10

3 7 9 49 21

12 2 144 4 24

11 3 121 9 33

6 5 36 25 30

8 4 64 16 32

14 1 196 1 14

9 2 81 4 18

10 3 100 9 30

2 10 4 100 2085 38 855 218 232Soma

• r = - 0,9215

• Isto significa que as variáveis Anos de instrução (X) e Nível de preconceito (Y)estão fortemente correlacionadas negativamente Em palavras significanegativamente. Em palavras, significa que neste conjunto de dados as pessoas com menor grau de escolaridade tendem a ser mais preconceituosas e que as pessoas mais instruídas tendem a apresentar um menor grau de preconceito.

• Todavia, é preciso destacar que NÃOpodemos afirmar que a causa do preconceito nas pessoas deste estudo seja o nível de escolaridade Até porqueseja o nível de escolaridade. Até porque existem outros fatores que interferem no nível de preconceito das pessoas.

Exercício 1:

Analise a possibilidade de haver correlação entre as variáveis em questão..

EmpresaN. de contratos

públicos

Receita brutaem 2010

(bilhões de R$)Norberto

Odebrecht 53 6,1Camargo Corrêa 30 5,2

Andrade Gutierrez 74 4,4

Queiroz Galvão 100 3,9OAS 48 3,2Delta

Construções 99 3,0Galvão

Engenharia 63 2,4MRV 0 1,8

Page 89: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

5

Número de acidentes em obras e número de trabalhadores mortos no Mato Grosso (2001-2007)

Exercício 2:

Analise a possibilidade de haver correlação entre as variáveis

Ano Nº de acidentes

Nº de mortos

2001 178 5

Fonte: Dados Fictícios.

em questão.. 2002 212 72003 206 92004 225 112005 249 82006 309 42007 257 6

Exercício 3:

Analise a possibilidade de haver correlação entre as variáveis em questão..

EmpresaTotal de

EmpregadosPessoal

GraduadoNorberto

Odebrecht 115.205 9.573Camargo

Corrêa 32.825 1.717Andrade Gutierrez 10.022 1.402Q iQueiroz Galvão 16.862 843

OAS 43.053 1.483Delta

Construções 14.835 736Galvão

Engenharia 6.925 751

Construcap 9.000 610

Satisfação Geral

Desempenho acadêmico

2 1,95

3 1,72

3 2,39

3 2,57

2 2,51

3 2,04

5 3,90

Exercício 4:

Avalie se o nível de satisfação com o curso de 15 estudantes da UFSC está correlacionadocom seu desempenho

3 2,69

4 2,57

4 2,10

3 3,61

4 2,37

4 1,62

3 1,87

3 2,47

acadêmico.

Page 90: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

4/18/2012

1

Regressão linear

Prof. Jeferson Gomes Moriel Junior

Exercício 1:

Um pesquisador, coletou dados de 10 empresas para estudar a associaçãoentre o gasto com controle de qualidade (X) e o percentual de produtos com defeito das empresas, obtendo assim os dados a seguir. Com base nos dados apresentados

X (em milhares de reais)

Y (% da produção

diária)

11 25 7

13 210 38 5Com base nos dados apresentados,

determine: (a) a equação da reta de regressão linear e (b) responda qual seria o percentual estimado de defeitos na produção diária de uma empresa que investisse 9 mil reais em controle de qualidade.

R: (a) y = - 0,669x + 9,757 ; (b) 3,7%

8 58 4

13 17 211 33 9

Page 91: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

INTRODUÇÃO À PROBABILIDADE

Quais são as chances das vendas aumentarem se diminuirmos os preços? Qual é a plausibilidade de um novo método de montagem aumentar a produtividade? Qual é a probabilidade de o projeto ser executado no prazo determinado? Quais são as chances de um novo investimento ser lucrativo?

Estas perguntas envolvem a ideia de probabilidade que pode ser entendida como uma medida numérica da plausibilidade de um evento ocorrer.

0 0,5 1,0

Plausibilidade crescente de ocorrência

A ocorrência do evento é tão provável

quanto improvável. Conceitos Importantes.

Experimento: refere-se a qualquer processo de observação ou medida, no qual denotaremos por E. Exemplos: Medir o teor de açúcar no sangue; Medir a altura de prédios; Verificar se uma lâmpada esta ligada ou desligada. Espaço Amostral: é o conjunto de todos os resultados possíveis de um experimento, que denotaremos por Ω. Evento: é um conjunto de resultados do experimento com determinados atributos e sempre é um subconjunto do espaço amostral. Por exemplo, no lançamento de um dado o espaço amostral seria Ω = {1, 2, 3, 4, 5, 6} tendo como alguns eventos: A: sair número maior do que 4: A = {5, 6} B: sair um número primo e par: B = {2} C: sair um número ímpar: C = {1, 3, 5}

Diversos exemplos de experimentos e seus resultados associados são apresentados a seguir:

Experimento Espaço amostral

Jogar uma moeda Cara, coroa

Selecionar uma peça para inspeção Defeituosa, não defeituosa

Lançar um dado 1,2,3,4,5,6

Jogar futebol Ganhar, perder, empatar

Suponha que um evento A possa acontecer de s maneiras diferentes, em um total de n modos possíveis, igualmente prováveis. Por exemplo, no caso de naipes do baralho, há quatro resultados possíveis e igualmente prováveis, resultando que a probabilidade de ocorrência de um deles será igual a ¼ (ou 25%). A probabilidade de ocorrência de certo evento A é dada por:

𝑃 𝐴 =𝑞𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠 𝑎𝑜 𝑒𝑣𝑒𝑛𝑡𝑜 𝐴

𝑞𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑡𝑜𝑡𝑎𝑙 𝑐𝑎𝑠𝑜𝑠 𝑑𝑜 𝑒𝑠𝑝𝑎ç𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙=

𝑛(𝐴)

𝑛(𝛀)

Propriedades P1: A probabilidade do evento impossível é nula.1 P2: A probabilidade do evento certo é igual à unidade.2 P3: A soma das probabilidades de um evento e do seu evento complementar é igual à unidade.3

1 Sendo o evento impossível o conjunto vazio (Ø), teremos: P(Ø) = n(Ø)/n(Ω) = 0/n(Ω) = 0. Por exemplo, se numa urna só existem bolas brancas, a probabilidade de se retirar uma bola verde (evento impossível, neste caso) é nula. 2 Com efeito, P(A) = n(Ω)/n(Ω) = 1. Por exemplo, se numa urna só existem bolas vermelhas, a probabilidade de se retirar uma bola vermelha (evento certo, neste caso) é igual a 1.

Page 92: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

P4: A probabilidade de um evento qualquer é um número real situado no intervalo real [0, 1]. P5: A soma das probabilidades para todos os resultados experimentais precisa ser igual a 1. Exemplo. No lançamento de um dado, os resultados possíveis são igualmente prováveis e, portanto, a cada resultado é

atribuída uma probabilidade de 1/6. Se P(A1) denota a probabilidade de que um ponto apareça na face voltada para

cima do dado, então, P(A1)=1/6. Analogamente P(A2)=1/6, P(A3)=1/6, P(A4)=1/6, P(A5)=1/6 e P(A6)=1/6. Note que as duas

exigências acima são ambas satisfeitas porque cada uma das probabilidades é maior ou igual a zero e elas somam 1.

Exercício 1. Represente o espaço amostral para cada um dos seguintes experimentos aleatórios: a) Lançamento de um dado. b) Numa linha de produção analisa-se a qualidade das peças. c) De um grupo de três estudantes (E1, E2, E3) sorteia-se dois, um após o outro, com reposição. d) Idem ao anterior, mas sem reposição. Exercício 2. Uma caixa contém 15 bolas numeradas de 1 a 15. Extraindo-se uma bola ao acaso, qual a probabilidade que seu número seja: a) par = 7/15; b) ímpar = 8/15; c) par e maior que 10 = {12, 14} P = 2/15; d) primo e maior que 3 = {5, 7, 11, 13} P =4/15; e) múltiplo de 3 e 5 = {15} P = 1/15. Exercício 3: Considerando o lançamento de dois dados, qual a probabilidade de ocorrer o evento A: “soma igual a 8”? Neste caso, o espaço amostral Ω é constituído pelos pares ordenados (i, j), onde i = número no dado 1 e j = número no dado 2. É evidente que teremos 36 pares ordenados possíveis do tipo (i, j) onde i = 1, 2, 3, 4, 5, ou 6, o mesmo ocorrendo com j. As somas iguais a 8, ocorrerão nos casos: (2,6), (3,5), (4,4), (5,3) e (6,2). Portanto, o evento "soma igual a 8" possui 5 elementos. Logo, a probabilidade procurada será igual a P(A) = 5/36. Um espaço amostral é discreto quando podemos listar os possíveis resultados. É contínuo quando temos uma infinidade de resultados possíveis dentro de um intervalo de números reais. Veja exemplos a seguir.

Espaço amostral discreto

Investigar numa certa empresa se os funcionários utilizam equipamentos de segurança. Um possível espaço amostral seria Ω = {sim, não, sem resposta}.

Espaço amostral contínuo

Investigar a altura de funcionários de uma empresa. Um possível espaço amostral seria Ω = {um número real x, tal que 0 < x < 2,00 m}.

Exercícios 1. Represente o espaço amostral para cada um dos seguintes experimentos aleatórios: a) Lançamento de um dado, duas vezes uma após a outra. b) Numa obra conta-se o número de acidentes por dia. c) De um grupo de cinco operários (A, B, C, D, E) sorteia-se dois operários, um após o outro, com reposição. d) Idem ao anterior, mas sem reposição. 2) Na linha de produção de certo produto, são retiradas três unidades, cada uma classificada como: boa (B) ou defeituosa (D). a) Descreva o espaço amostral. (Ω = {DDD, BDD, DBD, DDB, BBD, BDB, DBB, BBB}) b) Qual a probabilidade de tirar dois artigos bons e um defeituoso? (R: 3/8) 3. Uma caixa contém 25 bolas numeradas de 1 a 25. Extraindo-se uma bola ao acaso, qual a probabilidade que seu número seja: a) par; b) ímpar; c) par e maior que 15; d) primo e maior que 20; e) múltiplo de 4 e 5. Observação: descreva cada um dos eventos e, então, calcule a respectiva probabilidade. (R: a. 12/25; b. 13/25; c. 5/25; d. 1/25; e. 1/25)

3 Seja o evento A e o seu complementar A'. Sabemos que A U A' = Ω. n(A U A') = n(Ω) e, portanto, n(A) + n(A') = n(Ω). Dividindo ambos os membros por n(Ω), obtemos: n(A)/n(Ω) + n(A')/n(Ω) = n(Ω)/n(Ω), de onde conclui-se que P(A) + P(A') = 1.

Page 93: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

COMPLEMENTO DE PROBABILIDADE

Regra Geral da Adição (ou Lei da Adição). Tal lei é útil quando se está interessado em saber qual é a probabilidade de pelo menos um de dois eventos ocorrer, ou seja, de ocorrer um evento ou outro.

P(A B) = P(A) + P(B) – P(A B)

Vale destacar que na Figura 3 (abaixo) temos eventos disjuntos (ou mutuamente exclusivos), ou seja, eles não podem

ocorrer simultaneamente, logo A B = . Neste caso, P(A B) = 0 e a Lei da Adição equivale à P(A B) = P(A) + P(B).

Figura 1 Figura 2

Exemplo: Qual a probabilidade de obtermos face com número par ou maior que 3 ao lançarmos um dado? Sejam os seguintes eventos A: “obter face com número par” e B: “obter face com número maior que 3”. A probabilidade de obtermos face com número par ou maior que 3 é dado por

P(A B)

P(“número par” “número maior que 3”) = P(“número par”) + P(“número maior que 3”) – P(“número par” “número maior que 3”) =

P({2, 4, 6}) + P({4, 5, 6}) – P({2, 4, 6} {4, 5, 6}) = P({2, 4, 6}) + P({4, 5, 6}) – P({ 4, 6}) =

3/6 + 3/6 – 2/6 = 4/6 = 2/3 ≈ 66,7%.

Exemplo: Qual a probabilidade de obtermos face com número par ou ímpar ao lançarmos um dado? Sejam os seguintes eventos A: “obter face com número par” e B: “obter face ímpar”. A probabilidade de obtermos face com número par ou ímpar é dado por

P(A B)

P(“número par” “número ímpar”) = P(“número par”) + P(“número ímpar”) – P(“número par” “número ímpar”) =

P({2, 4, 6}) + P({1, 3, 5}) – P({2, 4, 6} {1, 3, 5}) =

P({2, 4, 6}) + P({4, 5, 6}) – P( ) = 3/6 + 3/6 – 0 = 1

= 100%.

Probabilidade Condicional

Muitas vezes, há interesse em calcular a probabilidade de ocorrência de um evento A, dada a ocorrência de um evento B. Por exemplo: Qual a probabilidade de chover amanhã em Florianópolis, sabendo que choveu hoje? Em outras palavras, queremos calcular a probabilidade de ocorrência de A condicionada à ocorrência prévia de B. Essa probabilidade é representada por P(A|B) e lê-se probabilidade de A dado B. Os dados, a seguir, representam o sumário de um dia de observação em um posto de qualidade, em que se avalia o peso dos sacos de cimento produzidos.

A B A B

Page 94: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

Condição do peso Marca do cimento

B C D Total

Dentro das especificações 500 4500 1500 6500 Fora das especificações 30 270 50 350

Total 530 4770 1550 6850

Retira-se, ao acaso, um saco de cimento da amostra de 6850 unidades. Qual a probabilidade de o pacote retirado estar fora das especificações, sabendo-se que é do D? Neste caso, o espaço amostral ficou restrito às 1550 unidades de cimento D. Destas, 50 satisfazem o evento. Então:

P(“estar fora das especificações”|”D”) = 50/1550 = 0,032.

Note que se o numerador e o denominador forem divididos pelo número total de unidades temos:

𝑃 𝐹 𝐷 =50

1550=

506850

15506850

=𝑃 𝐹 ∩ 𝐷

𝑃 𝐷

que é a relação usada na definição formal de probabilidade condicional. Definição. Sejam A e B eventos quaisquer, sendo P(B) > 0. Definimos a probabilidade condicional de A dado B por:

𝑃 𝐴 𝐵 =𝑃 𝐴 ∩ 𝐵

𝑃 𝐵

Exemplo: A distribuição abaixo descreve um grupo de alunos do IFMT. Se um aluno for escolhido ao acaso, qual a probabilidade de que esteja cursando: a) Controle de Obras, dado que é mulher? b) Eventos, dado que é homem?

Sexo Cursos

Total Eventos Controle de obras

Homem 40 60 100 Mulher 70 80 150

Total 110 140 250

Solução:

a)15

8

150

80

250/150

250/80

)(

)()/(

MP

MCPMCP

b) %40100

40

250/100

250/40

)(

)()/(

HP

HEPHEP

Exemplo: O prêmio de uma rifa (enumerada de 1 a 100) saiu para uma pessoa que comprou um número com apenas um algarismo. Qual a probabilidade desse número ser par? Solução: Precisamos calcular a probabilidade de o número sorteado ser par (evento A) dado que tem apenas um dígito (evento B), ou seja, P (“número ser par” / “só tem um algarismo”) = P (A|B). Assim, temos que Ω = {1, 2, 3, ..., 100}; A: “número sorteado é par” A = {2, 4, 6, 8, 10, 12, 14, ..., 100}; B: “número sorteado tem apenas um algarismo” B = {1, 2, 3, 4, 5, 6, 7, 8, 9} P(B) = 9/100; A B: “número sorteado é par E tem apenas um algarismo” A B = {2, 4, 6, 8} P(A B) = 4/100.

9

4

100/9

100/4

)(

)()/(

BP

BAPBAP

Regra do produto (ou lei de multiplicação)

P(A B) = P(B) . P(A|B)

Page 95: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

EXERCÍCIOS

1) Numa empresa há 10 homens e 20 mulheres. Metade dos homens e metade das mulheres são casados. Ao escolher ao acaso uma pessoa, qual a probabilidade de ser homem ou ser casado? (R: 2/3) 2) A tabela abaixo relata a frequencia com que 2000 trabalhadores sofreram acidente.

Homens Mulheres

Sofreu acidente 100 150

Não sofreu acidente 900 850

Total 1000 1000

Qual a probabilidade de que um trabalhador tenha sofrido acidente dado que ela seja mulher? (R: 150/1000) 3) Num grupo de 15 pessoas temos:

homens mulheres Total

empregados 5 3 8

desempregados 5 2 7

Total 10 5 15

Qual a probabilidade de que um indivíduo escolhido aleatoriamente esteja: a) Desempregado. b) Empregado. c) Desempregado, mas mulher? (R: a. 7/15; b) 8/15; c. 2/5) 4) A tabela abaixo mostra a promoção de funcionários em uma grande Construtora.

M F

Promovidos 288 36

Não-promovidos 672 204

a) Complete a tabela com os totais. b) Qual a probabilidade de um funcionário ser promovido dado que é homem?

5) Em um levantamento com estudantes de MBA, os seguintes dados foram obtidos sobre a razão principal de ter se ligado à universidade que eles se matricularam.

Qualidade Custo/Conveniência Outras Totais

Tempo Integral 421 393 76 890

Tempo Parcial 400 593 46 1039

Totais 821 986 122

a) Dado que um estudante é de tempo integral, qual a probabilidade de que a qualidade tenha sido a razão de sua escolha? (0,4730)

b) Dado que um estudante é de tempo parcial, qual a probabilidade de que a qualidade tenha sido a razão de sua escolha? (0,3849)

6) A tabela abaixo mostra a idade e o estado civil de 140 clientes de certa empresa.

Idade Solteiro Casado

Menos de 30 anos 77 14

Mais de 30 anos 28 21

a) Complete a tabela com os totais. b) Qual a probabilidade de se encontrar um cliente solteiro com menos de 30 anos? (0,55) a) Se o cliente tem menos de 30 anos, qual é a probabilidade de que ela ou ele seja solteiro? (0,8462)

Page 96: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

VARIÁVEL ALEATÓRIA

Uma variável aleatória é a função que associa um valor numérico aos resultados de um experimento.

VARIÁVEIS ALEATÓRIAS DISCRETAS Uma variável que pode assumir tanto um número finito de valores como infinita seqüência de valores tais como 0,1,2,3,4,... é chamada de variável aleatória discreta.

Experimentos Var. Aleatórias Discretas Possíveis valores da variável

Atender cinco clientes No de clientes que compram 0,1,2,3,4,5

Verificar as refeições servidas num restaurante durante um dia

No de refeições servidas 0,1,2,3,4,5,...

Na linha de produção de certo produto, são retiradas três unidades, cada uma classificada como: boa (B) ou

defeituosa (D). Se considerarmos o “número de peças Boas” como sendo nossa variável discreta, podemos representar graficamente o a distribuição de probabilidade da seguinte forma:

VARIÁVEL ALEATÓRIA CONTÍNUA

Uma variável aleatória que pode assumir qualquer valor numérico em um intervalo ou uma coleção de intervalos é chamada de variável aleatória contínua. Como exemplo, podemos considerar os resultados experimentais baseados em medição, ou seja: tempo, peso, distância, temperatura etc.

Experimentos V. A . Contínuas Possíveis valores da v. a .c.

Anotar o tempo gasto no atendimento de clientes. Tempo x 0

Anotar os pesos de sacos de cimento. Peso 0 x 50 kg

Anotar o tempo gasto nas ligações telefônicas. Tempo x 0

DISTRIBUIÇÃO NORMAL É a mais importante distribuição de probabilidade, sendo aplicada em inúmeros fenômenos e utilizada para o desenvolvimento teórico da estatística. É também conhecida como distribuição de Gauss, Laplace ou Laplace-Gauss. A distribuição normal é um exemplo de distribuição de variável aleatória contínua. Na verdade há muitas distribuições normais diferentes. Pode-se identificar uma distribuição normal especificando-se dois números: a média e a variância (ou desvio-padrão). A média está localizada no pico da distribuição. A variância define a forma da distribuição, isto é, se ela é muito dispersa ou se a maior parte da área se concentra na proximidade do pico. Sua função de densidade de probabilidade é dada por:

μ

x

para .e2πσ.

1 = f(x)

2

σ

μx

2

1

onde é a média e o seu desvio padrão.

Page 97: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

O gráfico determinado pela função da distribuição normal assemelha-se muito a um sino, com o pico localizado

na média () conforme figura abaixo:

A distribuição normal é especificada pela média e o desvio padrão. A variância (2 ) determina a forma da curva; um valor maior da variância significa maior dispersão na curva. Sua probabilidade é determinada pela área sob a curva, através da integral no intervalo associado aos valores da variável. As principais características dessa função são:

o ponto de máximo de f(x) é o ponto X=

os pontos de inflexão da função são: X = + e X = -

a curva é simétrica em relação a DISTRIBUIÇÃO NORMAL PADRONIZADA

Na maioria das vezes em que necessitamos da área sob a curva normal, devemos recorrer a uma tabela. Seria impossível elaborar uma tabela para cada distribuição normal com todos os valores possíveis da média e da variância. Felizmente, podemos achar os resultados para qualquer distribuição normal apelando para uma tabela de distribuição

normal com média = 0 e variância 2 = 1. Essa distribuição normal especial é chamada distribuição normal padronizada.

Na prática, a distribuição normal apresenta um número muito grande de combinações entre a média e o desvio-padrão. No entanto, através da mudança de variável, contornamos esse problema, fazendo com que todas as inúmeras distribuições normais reduzam-se a apenas uma, ou seja, à distribuição z. Além da variável z ser desprovida da unidade de medida (isto é, constitui um número puro), ela serve para qualquer tipo de variável, independentemente de sua unidade usando a seguinte fórmula:

x z

onde z tem distribuição normal reduzida com a seguinte função densidade de probabilidade:

2

2

.2

1z

ezf

Suponha que em certa universidade, a altura dos estudantes do sexo masculino tenha distribuição normal com média 170 cm e desvio padrão 10 cm. A figura a seguir mostra a relação entre a escala dos valores das alturas de universitários homens (x) e seus correspondentes valores padronizados (z). Por exemplo, para um estudante de altura x = 180 cm, temos o valor padronizado:

Page 98: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

110

170180

z

Exemplos 1.Usando a tabela da normal reduzida, calcule as seguintes probabilidades. a) P (0 < z < 2,34) b) P (0 < z < 1,48) c) P (0,86 < z < 2,89) d) P (-1,02 < z < 1,97) e) P (z > 1,47) f) P (z < 2,05) g) P (-1,02 < z < -1,97) h) P (z > -2,63)

Page 99: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

h) P (z < -0,44) 2. Seja x a variável aleatória contínua com distribuição normal com um tempo médio de atendimento de 2 minutos por cliente e desvio padrão 0,04 min. Determine a probabilidade de um cliente ser atendido entre 2 e 2,05 min. 3. [Adaptado de TRIOLA] As alturas de homens e mulheres são normalmente distribuídas, com uma média de 175,3 cm para os homens (desvio padrão de 7,1 cm) e de 161,5 cm para as mulheres (desvio padrão de 6,4 cm). Abaixo estão duas amostras de alturas (em cm) escolhidas aleatoriamente. Considerando a altura padrão de uma porta como sendo 2 metros, responda: a) Qual a porcentagem dos homens que não passam por uma porta padrão sem se curvarem? Qual porcentagem para mulheres? Por que estes resultados não condizem com a realidade? b) Se um estatístico projeta uma casa de modo que todas as portas tenham altura suficiente para todos os homens, exceto os 10% mais altos, qual seria a altura da porta usada?

Exercícios

1) Encontre a área para cada uma das situações, sendo z uma normal padrão. a) à direita de 0,44 b) entre –1,57 e 0,49 c) à esquerda de 1,20 d) entre 0,52 e 1,22 e) à direita de –0,23 f) entre –1,74 e –1,04 2) Dado que z é uma variável aleatória normal padronizada, encontre z para cada uma das situações. a) a área à direita de z é 69,15% d ) a área entre –z e z é 90,30% b) a área à esquerda de z é 21,19% e) a área entre 0 e z é 47,50% c) a área à esquerda de z é 99,48% f) a área entre –z e z é 20,52% 3) O tempo médio que um assinante gasta lendo o jornal A Notícia é de 49 minutos, com desvio padrão de 16 minutos e que os tempos sejam distribuídos normalmente. a)qual é a probabilidade de que um assinante gastará menos que 30 minutos lendo o jornal? b)qual o tempo máximo gasto pelos 24% dos que gastam menos tempo na leitura? 4) Os depósitos efetuados no Banco da Ribeira durante o mês de janeiro são distribuídos normalmente, com média de $ 10.000,00 e desvio padrão de $ 1.500. Um depósito é selecionado aleatoriamente. Encontre a probabilidade de que o depósito seja : a) um valor entre $ 12.000 a 15000; b) maior do que $ 20.000; c) qual o valor do depósito que possa separar os 20% do menores depósito. 5) As sardinhas processadas por uma indústria de enlatados têm comprimento médio de 4,54 polegadas, com desvio-padrão de 0,25 polegadas. Se a distribuição dos comprimentos das sardinhas pode ser aproximada satisfatoriamente por uma distribuição normal, qual a porcentagem das sardinhas com comprimento: a) inferior a 4,00 polegadas? b) entre 4,40 e 4,60 polegadas? 6) Em qualquer distribuição normal, qual a porcentagem da área total que cai: a) entre -1 e +1 b) entre -2 a +2 c) entre -3 a +3 . 7) Suponha que a renda média de uma grande comunidade possa ser aproximadamente normal com média de R$ 1500,00 e desvio padrão de R$ 300,00. a)que porcentagem da população terá renda superior a R$ 1860,00; b)numa amostra de 50 assalariados, quantos terão menos de R$ 1050,00 de renda?

Respostas 1)a) 0,33 b) 0,6297 c) 0,9849 d) 0,1973 e) 0,591 f) 0,1083 2) a) -0,5 b)-0,8 c) 2,56 d)1,66 e)1,96 f) 0,26 3) a) 0,117 b)x= 69,48 c) x=37,64 4) a) 0,00908 b) 0,001 c) x=8740 5) a) 0,0154 b) 0,3071 6) a) 0,6826 b) 0,9544 c) 0,9974 7) a) 0,1151 b) x=3,34

Page 100: jefersonmorieljunior.pbworks.comjefersonmorieljunior.pbworks.com/w/file/fetch/52895394...4/18/2012 1 Estatística Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior

ÁREAS DE UMA DISTRIBUIÇÃO NORMAL PADRÃO

Cada casa na tabela dá a proporção sob a curva entre Z = 0 e um valor positivo Z. As áreas para os valores de Z negativos são obtidas por simetria.

Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517

0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879

0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852

0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857

2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890

2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916

2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936

2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952

2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964

2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974

2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981

2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986

3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990

3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993

3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995

3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997

3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998

3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998

3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999