Download - ATPS estatistica
Introdução
ETAPA 1
Passo 1
CONCEITOS INTRODUTÓRIOS
Definição de Estatística
Ciência que fornece métodos para a coleta de dados consiste em informações que vêm de
observações, contagens, medições ou respostas que organizados, analisados e interpretados
os dados, serão utilizados na tomada de decisões.
Divisão da Estatística:
Estatística Descritiva:
Preocupa-se com os procedimentos relacionados com a coleta, organização, apresentação e
descrição dos dados de observação visando facilitar a sua interpretação. Ex: Rol, tabelas,
gráficos, medidas descritivas.
Estatística Indutiva ou Inferencial:
Visa tirar conclusões sobre a população a partir de amostras. Ex: Intervalo de
confiança/testes estatísticos.
Conjuntos de Dados:
Os dois tipos de conjunto de dados usados na estatística são amostra e população.
População é uma coleta de todos os resultados, respostas, medições ou contagens que são de
interesse.
Amostra é um subgrupo de uma população.
Ex. para fazer uma pesquisa entre os alunos das escolas da educação básica precisamos
definir quais são os alunos que formam o universo: os que atualmente estão no colégio ou
devemos incluir os que já passaram pela escola? A solução do problema depende de cada
caso em particular. Na maioria das vezes, por impossibilidade ou inviabilidade econômica
ou temporal, limitamos a pesquisa a apenas uma parte da população. A essa parte
proveniente da população em estudo denominamos amostra.
Definimos então como amostra um subconjunto da população, compatível com ela.
Uma amostra é extraída de uma população por meio de métodos adequados que constituem
uma especialidade da estatística chamada amostragem.
Em geral, o levantamento da população é muito oneroso ou pode até ser impossível, porém
uma amostra é sempre possível de ser obtida e, a partir desta, podemos inferir resultados
acerca da população.
Aplicações da Estatística
A estatística é uma ciência de múltiplas aplicações e de fundamental importância no campo
da investigação científica, sendo de utilização cada vez mais acentuada em qualquer
atividade profissional. Sua aplicação é voltada para pesquisas, organização de
relatórios/palestras e tomadas de decisão.
Parâmetros
São medidas estatísticas obtidas com base na população. Média aritmética, desvio padrão,
variância, proporção.
Estatísticas
São medidas estatísticas obtidas com base na amostra. Média aritmética, desvio padrão,
variância, proporção.
Variáveis estatísticas:
É cada um dos resultados provenientes da observação do fenômeno em estudo. As variáveis
estatísticas podem ser classificadas em:
a)Qualitativas: Indicam uma qualidade ou propriedade do fenômeno em observação. São
representados por palavras. Também chamados de atributos.
Ex: raça, estado civil, nível sócio-econômico, sexo, classe social.
Nominal: Os indivíduos são classificados em categorias segundo uma característica.
Ex: sexo (masculino, feminino), hábito de fumar (fumante, não fumante), cargo na empresa
(diretor, vice, financeiro).
Não existe ordem entre as categorias e suas representações, se numéricas, são destituídas de
significado numérico.
Ex: sexo masculino = 1, sexo feminino = 2. Os valores 1 e 2 são apenas rótulos.
Ordinal: Os indivíduos são classificados em categorias que possuem algum tipo inerente de
ordem.
Neste caso, uma categoria pode ser "maior" ou "menor" do que outra.
Ex: nível sócio-econômico (A, B, C e D; onde A representa maior poder aquisitivo); nível de
retinol sérico (alto, aceitável, baixo, deficiente) onde alto: maior ou igual a 50,0 µg/dl;
aceitável: 20,0 a 49,9 µg/dl, baixo: 10,0 a 19,9 µg/dl e deficiente: menor ou igual a 10,0
µg/dl; grau de instrução.
b)Quantitativas: São resultantes de uma contagem ou mensuração. Representadas por
números.
Ex: estatura de uma pessoa, peso, número de filhos de cada família.
Discretas: Quando assumem somente valores inteiros.
Ex: número de refeições em um dia (nenhuma, uma, duas, três, quatro, ...), freqüência de
consumo semanal de determinado alimento (1 vez, 2 vezes, 3 vezes, 4 vezes, 5 vezes, 6
vezes, 7 vezes), número de filhos de cada família, número diário de clientes que chegam em
uma loja.
Contínuas: podem assumir qualquer valor do intervalo. Ex: estatura, salário.
Passo 2
Considerar o seguinte caso:
“A empresa “Vendomundo” importou 10 contêineres de lâmpadas especiais de duas marcas
distintas (marca A e B). Um controle de qualidade é realizado antes que cada lote de
lâmpada importada saia dos países de origem. Para tanto, os dois fabricantes coletam uma
amostra de 40 lâmpadas de 100 watts e medem o tempo de vida útil (em horas) de cada
lâmpada. Abaixo, vemos os resultados obtidos pelos fabricantes da lâmpada A e lâmpada B:
Tabela 1 – Tempo de vida útil de duas marcas de lâmpadas de 100 watts (em horas).
Lâmpada da marca A
684 697 720 773 821
831 835 848 852 852
859 860 868 870 876
893 899 905 909 911
922 924 326 926 938
939 943 946 954 971
972 977 984 1005 1014
1016 1041 1052 1080 1093
Lâmpada da marca B
819 836 888 897 903
907 312 918 942 943
952 959 962 986 992
994 1004 1005 1007 1015
1016 1018 1020 1022 1034
1038 1072 1077 1077 1082
1096 1100 1113 1113 1116
1153 1154 1174 1188 1230
Fonte: Importadora “Vendomundo
Passo 3
Desafio A - Diagrama de Caule e Folha.
MARCA A MARCA B32 6 31 2 68 4 81 9 69 7 83 6 72 0 88 877 3 89 782 1 90 3 783 1 5 91 8 84 8 94 2 385 2 2 9 95 2 986 0 8 96 287 0 6 98 689 3 9 99 2 490 5 9 100 4 5 791 1 101 5 6 892 2 4 6 102 0 2 93 8 9 103 4 894 3 6 107 2 7 7 95 4 108 297 1 2 7 109 6 98 4 110 0 100 5 111 3 3 6101 4 6 115 3 4104 1 117 4105 2 118 8108 0 123 0109 3
Desafio B - Considerar as seguintes informações para a montagem das distribuições de
frequência:
Lâmpada A
Utilizar a Regra de Sturges para obter o número de classes da distribuição de frequência.
Limite de classe inferior da 1ª classe igual a 680 horas.
Amplitude do intervalo de classe igual a 70 horas.
Intervalos de classe fechados à esquerda e abertos à direita.
Lâmpada A:
Intervalo de classes
Frequência (f)
P. Médio (x)
Freq.Acumulat (fa)
Freq. Relativ (fr)
680 |--------- 750 3 715 3 0,08
750 |--------- 820 1 785 4 0,03
820 |--------- 890 11 855 15 0,28
890 |--------- 960 13 925 28 0,33
960 |-------- 1030 7 995 35 0,18
1030|-------- 1100 4 1065 39 0,10
39 ---------- 1,00
HISTOGRAMA
Lâmpada AIntervalo de classes Frequênci
a (f)P. Médio
(x)Freq. Relativ
(fr%)680 |------------ 750 3 715 0,08%
750 |------------ 820 1 785 0,03%
820 |------------ 890 11 855 0,28%
890 |------------ 960 13 925 0,33%
960 |----------- 1030 7 995 0,18%
1030|----------- 1100 4 1065 0,10%
39 ---------- 1,00%
715 785 855 925 995 10650.00%
0.05%
0.10%
0.15%
0.20%
0.25%
0.30%
0.35%LÂMPADA A - TEMPO DE VIDA ÚTIL
MÉDIA EM HORAS
FREQ
UÊN
CIA
RELA
TIVA
POLIGONO DE FREQUÊNCIA
Frequência (f)
P. Médio (x)
0 645
3 715
1 785
11 855
13 925
7 995
4 1065
0 1135
645 715 785 855 925 995 1065 11350
2
4
6
8
10
12
14
LÂMPADA A - TEMPO DE VIDA ÚTIL
MÉDIA EM HORAS
FREQUÊNCIA
OGIVA
Intervalo de classes
Frequência (f)
Freq.Acumulat (fa)
680 |--------- 750 3 3
750 |--------- 820 1 4
820 |--------- 890 11 15
890 |--------- 960 13 28
960 |-------- 1030
7 35
1030|-------- 1100
4 39
fa
39
35
28
15
4
3
0 680 750 820 890 960 1030 1100 ic
Lâmpada B
Utilizar a Regra de Sturges para obter o número de classes da distribuição de frequência.
Limite de classe inferior da 1ª classe igual a 815 horas.
Amplitude do intervalo de classe igual a 70 horas.
Intervalos de classe fechados à esquerda e abertos à direita.
Lâmpada B
Intervalo de classes
Frequência (f)
P. Médio (x)
Freq.Acumulat (fa)
Freq. Relativ (fr%)
815 |--------- 885 2 850 2 0,05%
885 |--------- 955 8 920 10 0,21%
955 |-------- 1025 13 990 23 0,33%
1025 |-------- 1095 6 1060 29 0,15%
1095 |-------- 1165 7 1130 36 0,18%
1165 |-------- 1235 3 1200 39 0,08%
39 ---------- 1,00%
HISTOGRAMA
Intervalo de classes
Frequência (f)
P. Médio (x)
Freq. Relativ (fr%)
815 |--------- 885 2 850 0,05%
885 |--------- 955 8 920 0,21%
955 |-------- 1025 13 990 0,33%
1025 |-------- 1095 6 1060 0,15%
1095 |-------- 1165 7 1130 0,18%
1165 |-------- 1235 3 1200 0,08%
39 ---------- 1,00%
850 920 990 1060 1130 12000.00%
0.05%
0.10%
0.15%
0.20%
0.25%
0.30%
0.35%
LÂMPADA B - TEMPO DE VIDA ÚTIL
MÉDIA EM HORAS
FR
EQ
UÊ
NC
IA R
EL
AT
IVA
POLÍGONO DE FREQUÊNCIA
Frequência (f)
P. Médio (x)
0 7803 850
1 92011 99013 10607 11304 1200
0 1270
780 850 920 990 1060 1130 1200 12700
2
4
6
8
10
12
14LÂMPADA B - TEMPO DE VIDA ÚTIL
MÉDIA EM HORAS
FRENQUÊNCIA
OGIVA
Intervalo de classes
Frequência (f)
Freq.Acumulativa (fa)
815 |-------- 885 2 2
885 |-------- 955 8 10
955 |------- 1025 13 23
1025 |------- 1095 6 29
1095 |------- 1165 7 36
1165 |------- 1235 3 39
fa
39
36
29
23
10
2
0 815 885 955 1025 1095 1165 1235 ic
ETAPA 2
Passo 1
Medidas de Posição
Fornece medidas que podem caracterizar o comportamento dos elementos de uma série;
possibilitando determinar se um valor está entre o maior e menor valor da série, ou se esta
localizado no centro do conjunto de dados por exemplo.
Medidas de Tendência Central
São valores estabelecidos num ponto central em torno do qual os dados se distribuem. As
medidas de tendência central que iremos estudar são: média aritmética, mediana e moda.
Média Aritmética:
É a soma de todos os elementos em nosso conjunto de dados dividido pelo total de
elementos. Isto é,
Onde n é o total de elementos no conjunto de dados.
A média aritmética é um valor que pode substituir todos os valores da variável, isto é, é o
valor que a variável teria se em vez de “variável” ela fosse “constante”.
Mediana (Md)
É o valor que ocupa a posição central de um conjunto de dados ordenados. Ou seja, é o valor
que tiver o mesmo número de elementos no seu lado esquerdo e direito.
Sejam os números a seguir, as cinco observações de uma variável qualquer:
5 6 7 8 8
A mediana para este conjunto é 7, correspondente à 3a observação que ocupa a posição
central.
Assim, se o número de elementos for ímpar, a mediana é o elemento cuja a ordem da
posição central é:
Onde n é o número de elementos no conjunto de dados.
Sejam as seguintes observações: 5,0 5,5 7,0 8,0 8,5 10,0
Como o número de elementos é par, a mediana é a média aritmética dos dois elementos
centrais, cuja ordem:
e
Neste exemplo: T1 = 6/2 = 3 (3O termo) e T2 = (6+2)/2 = 4 (4O termo), logo a mediana é:
Md =
Observe que este é um valor teórico, pois não figura entre os dados originais.
Moda (Mo)
É o valor que ocorre com maior freqüência em um conjunto de dados.
Exemplo: Conjunto de dados: 7 8 5 7 7 7 5 8 9 7
Moda = Mo = 7
Em um conjunto de dados podemos ter duas modas ou nenhuma; a distribuição que possui
duas modas chamamos de distribuição bimodal.
Comparação entre média aritmética, mediana e moda.
1. A moda é uma medida que requer apenas o conhecimento da freqüência absoluta e pode ser
utilizada para qualquer tipo de variáveis, tanto qualitativas, quanto quantitativas.
2. A mediana é uma medida que exige uma ordenação de categorias, da mais alta a mais baixa,
assim ela só pode ser obtida para variáveis qualitativas ordinais ou para as quantitativas,
jamais para variáveis qualitativas nominais. Além disso, a mediana não é influenciada por
valores extremos.
3. A média aritmética trabalha com todos os elementos do conjunto de dados, enquanto a
mediana utiliza apenas um ou dois valores. No entanto a média sofre influência de valores
extremos (muito alto ou baixo).
4. A média é uma medida que pode ser calculada apenas para variáveis quantitativas. E embora
a média seja um valor mais fácil de entender, tem o defeito de nos induzir em erro se a nossa
amostra tiver valores muito extremos.
Quando a distribuição dos dados é considerada "normal", então a melhor medida de
localização do centro, é a média.
Medidas de Dispersão ou Medidas de Variabilidade
Medidas de dispersão ou de variabilidade são “estatísticas” que medem as oscilações ou as
variações de uma variável.
Para calcularmos esta dispersão em relação à média, utilizaremos algumas medidas:
Variância: (para população)
(para amostras)
Desvio Padrão: (para população)
(para amostras)
Desvio Médio: DV =
Coeficiente de Variação
O coeficiente de variação mede a homogeneidade dos dados em conjunto, em relação a
média, sua fórmula é expressa por:
O valor obtido será dado em porcentagem. E acima de 30% o conjunto de dados é
considerado heterogêneo e abaixo de 30% o conjunto é considerado homogêneo.
Passo 2
As medidas de posição têm o objetivo de resumir o conjunto de dados em alguns valores que
possam representar a variável em estudo. As medidas de dispersão ajudam a medir o quanto
a média aritmética realmente representa os dados em estudo. Quanto maior a dispersão,
menor a representatividade da média e quanto menor a dispersão, mais confiável é a média.
A respeito do estudo da vida útil das lâmpadas da marca A e B, podemos afirmar que:
I – o tempo médio de vida útil das lâmpadas A e B são respectivamente: 894,65 horas e
1003,35 horas. Resp: (afirmativa incorreta).
Lâmpada A Lâmpada B
X.F X.F
715 x 3 = 2.145 850 x 3 = 2.550
785 x 1 = 785 920 x 1 = 920
855 x 11 = 9.405 + 990 x 11 = 10.890 +
925 x 13 = 12.025 1060 x 13 = 13.780
995 x 7 = 6.965 1130 x 7 = 7.910
1065 x 4 = 4.260 1200 x 4 = 4.800
35.585/39 = 912,44 40.850/39 = 1.047,44
II – comumente, as lâmpadas da marca A duram 852 horas e da as marca B 1.077 horas;
(afirmativa incorreta, conforme graficos).
III – o tempo mediano de vida útil para a lâmpada da marca A é 910 horas e para a lâmpada
B é 1.015,5 horas;
(o tempo mediano das lâmpadas A e B estão incorretos).
Lampada A – localização da posição do termo Calculo da mediana
P= n+1/2 P= 39+1/2 P= 20 Me= 911
Lampada B – localização da posição do termo Calculo da mediana
P= n+1/2 P= 39+1/2 P= 20 Me= 1015
IV – de todas as medidas de tendência central obtidas no estudo de caso em questão, a média
é a que melhor representa o tempo de vida útil da lâmpada da marca B;
(afirmativa incorreta). A mediana representa melhor o tempo de vida útil.
V – a moda é a melhor medida representativa para a sequência de dados referentes à
lâmpada da marca B;
(afirmativa correta) 1077 e 1113
VI – a sequência de dados referentes à lâmpada da marca A apresenta uma forte
concentração de dados em sua área central; Resp:
(firmativa correta).
VII – a lâmpada da marca B possui uma distribuição assimétrica positiva; Resp: (afirmativa
incorreta), conforme mostra o grafico.
VIII – 75% dos valores apresentados na tabela 1, para a lâmpada da marca A, possuem um
tempo de vida útil menor do que 971 horas;
(afirmativa correta).
IX – 25% dos valores apresentados na tabela 1, para a lâmpada da marca B, possuem um
tempo de vida útil maior do que 1.000 horas;
(afirmativa incorreta).
X – os gráficos Box-Plot para os dados amostrais da lâmpada da marca A e marca B são:(a afirmativa esta incorreta).
Box-Plont Vida útil das lâmpadas das marcas A e B Horas
1312
1112
912
712 512
312 . .
Lâmpada A Lâmpada B
REFERENCIAS BIBLIOGRAFICAS:
LARSON, Ron.; FABER, Betsy. Estatística Aplicada - PLT – Livro texto. Nova edição.
http://www.unifra.br/professores/9011/Conceitos%20Introdut%C3%B3rios1.pdf
http://www.ebah.com.br/content/ABAAAAYZ8AD/material-06-medidas-posicao-dispersao