introduÇÃo a estatistica prof. ranildo lopes · séries geográficas (territoriais) cidades...

54
INTRODUÇÃO A ESTATISTICA PROF. RANILDO LOPES

Upload: docong

Post on 15-Nov-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

INTRODUÇÃO A ESTATISTICA

PROF. RANILDO LOPES

ESTATÍSTICA

Trazem informações que expressam a tendência central e adispersão dos dados.

Tendência Central: Média ( x ), Mediana ( Md ), Moda ( Mo )

Medidas de Dispersão: Desvio Padrão, Variância, Amplitude,

Coeficiente de Variação,

Valor Máximo, Valor Mínimo

DESCRIÇÃO DOS DADOS CONTÍNUOS

ESTATÍSTICA

EXERCÍCIO No 2

Em uma pesquisa sobre infrações de trânsito foram coletados as seguintes quantidades de multas/dia em uma determinada rodovia: 65 66 62 66 63 61 67 63 64 62 68 67 65 64 65 66 63 64 65 66 64 63 64 66 65 63 64 65 64 63 64 63 64 68 69 70

a) Qual foi o tamanho da amostra (n)?

b) Qual é o maior e o menor volume de multas/dia?

c) Faça o agrupamento de dados por valores distintos.

d) Faça o agrupamento em 3 classes.

Disciplina de Estatística

Retornar

Medidas de tendência central

ESTATÍSTICA

3) Cálculo para agrupamentos em classes

Classes f x fx

39 50 4 44,5 178

50 61 5 55,5 277,5

61 72 5 66,5 332,5

72 83 6 77,5 465

83 94 5 88,5 442,5

Total 25 - 1695,5

MÉDIA

x = S fx / n

S fx = Soma dos produtos

dos valores distintos

com a frequência

n = tamanho da amostra

x = 1695,5 x = 67,8225

EXERCÍCIO No 1

Determine a média, a mediana e a moda para o seguinte conjunto de dados

ESTATÍSTICA

6 5 8 4 7 6 9 7 3

EXERCÍCIO No 2

Determine o menor valor, o maior valor, a média, a mediana e a moda para o seguinte conjunto de dados

ESTATÍSTICA

12 32 54 17 82 99 51 11 44 22

22 33 44 52 76 41 37 10 5 87

EXERCÍCIO No 3

Dado o seguinte agrupamento em classes determine:

ESTATÍSTICA

Classes f

1,60 1,65 10

1,65 1,70 15

1,70 1,75 22

1,75 1,80 18

1,80 1,85 3

Total 68

a) os pontos médios de cada classe

b) a classe modal

c) a moda bruta

d) a classe mediana

e) a mediana por agrupamento de classes

f) a média por agrupamento de classes

ESTATÍSTICA

1) Dado o conjunto de dados:

a) apresente a disposição em rol;

b) o Percentil 50,

c) o Primeiro Quartil,

d) a Média,

e) a Moda e

f) a Mediana

EXERCíCIOS

10 13 24

45 66 77 11

14 26 33 65

21 57

ESTATÍSTICA

2) Em uma amostra com 2789 valores qual é a posição do oitavo decil, da mediana, do segundo decil, do terceiro quartil e do segundo quartil?

Medidas de dispersão

ESTATÍSTICA

É frequentemente chamada de variabilidade.Medidas mais comuns: Variância, Desvio Padrão, Amplitude

e Coeficiente de Variação

DISPERSÃO DOS DADOS

f

x

Dispersão dos dados

na população

Dispersão dos dados

na amostra

ESTATÍSTICA

É uma forma de se ver o quanto os dados se afastam da média.Exemplo: Vilarejo com apenas 11 pessoas

135cm 152cm136cm 152cm138cm 157cm141cm 163cm143cm 170cm

152cm

Dispersão na População

Média = 149cm

Mediana e Moda = 152cm

Valor Máximo = 170cm

Valor Mínimo = 135cm

Amplitude = 35cm

Alturas de 11 pessoas

ESTATÍSTICA

Alturas (N=11) x - x (x - x)2

135cm 135-149 -14 196136cm 136-149 -13 169138cm 138-149 -11 121141cm 141-149 -8 64143cm 143-149 -6 36152cm 152-149 3 9152cm 152-149 3 9152cm 152-149 3 9157cm 157-149 8 64163cm 163-149 14 196170cm 170-149 21 441Total 1314

Dispersão na População

s2 Variância

= 1314 / 11

= 119,454 cm2

s Desvio Padrão

= 119,454

= 10,92 cm

Soma dos desvios quadráticos

s2 = S ( x - x )2 / N

ESTATÍSTICA

VARIÂNCIA E DESVIO PADRÃO NA POPULAÇÃO

Variância da população

Desvio Padrão da população = Raiz quadrada da variância

s s2

Como a dispersão nas amostras é menor do que na população, se faz um ajuste matemático.

ESTATÍSTICA

Variância da Amostra ( s2 ou v )

s2 = S ( x - x )2 / ( n -1 )

Desvio Padrão da amostra ( s ou DP ) = Raiz quadrada da variância

s s2

A dispersão nas amostras é menor do que na população, por isso é que se faz este ajuste matemático

VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA

Definição: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim,

para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e

obtemos o desvio padrão. Assim, o desvio padrão de uma variável X cujos valores são x1, x2, ..., xn, é dada por

O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for seu valor maior será a dispersão dos dados

da amostra.Exemplo:

2 2 21 2( ) ( ) ... ( )nx MA x MA x MA

DP Vn

Desvio-padrão

ESTATÍSTICA

SIGNIFICADO:

É um modo de representar a dispersão dos dados ao redor da média.

DESVIO PADRÃO

f

xMédia

ESTATÍSTICA

A curva A mostra uma dispersão dos dados maior do que a curva B, logo o desvio padrão de A é maior do que o de B.

DESVIO PADRÃO

f

xMédia

Curva A Curva B

x

f

Média

ESTATÍSTICA

COEFICIENTE DE VARIAÇÃO

O desvio padrão depende da unidade de medida usada,assim um desvio medido em dias será maior do que um medidoem meses.

O coeficiente de variação expressa o desvio-padrão comoporcentagem do valor da média.

COEF. VARIAÇÃO = 100 . DESVIO PADRÃO

MÉDIA

Quanto menor for este coeficiente mais homogênea é a amostra.

Variância

Definição: Define-se a variância(V) como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra. Assim, se as n observações de uma variável X são x1, x2, ..., xn, a variância é

22 2 2

1 1 2

( )( ) ( ) ... ( )

n

ii n

x MAx MA x MA x MA

Vn n

1 2 ... nx x xM A

n

onde é a média aritmética das

observações

Observação: A variância de uma amostra é mais comumente definida como acima, mas substituindo o denominador por n-1 (isto é feito para que ela seja um estimador não enviesado da verdadeira variância da população). Para amostras grandes, ambas as expressões dão praticamente o mesmo resultado.

Desvio-padrão

Definição: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão. Assim, o desvio padrão de uma variável X cujos valores são x1, x2, ..., xn, é dada por

2 2 21 2( ) ( ) ... ( )nx MA x MA x MA

DP Vn

O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for seu valor maior será a dispersão dos dados da amostra.Exemplo:

ESTATÍSTICA

COEFICIENTE DE VARIAÇÃO

Classificação da proporção que o desvio padrão apresenta sobre a média.

GRAU DE HOMOGENEIDADE DOS DADOS

até 10% ÓTIMO

de 10% a 20% BOM

de 20% a 30% REGULAR

acima de 30% RUIM

ESTATÍSTICA

EXERCÍCIOS

1) Determine a média, a amplitude, a variância, o desvio padrão e o coeficiente de variação da seguinte amostra de dados:

4 5 5 6

6 7 7 8

ESTATÍSTICA

Pesquisa Mercadológica (Índice de satisfação na população)Pesquisa Epidemiológica (Prevalência de uma doença na população)Pesquisa Eleitoral (Percentagem de votos para cada candidato)Perfil Socioeconômico da População (Grau de escolaridade, Renda)

APLICAÇÕES DE AMOSTRAGEM

População

Amostra

Na População Parâmetros

Na Amostra Estatísticas

Inferência Estatística

ESTATÍSTICA

Economia (É mais barato levantar dados de uma parcela da população)

Tempo (É mais rápido)

Quando a população for pequena (n > 0,8.N)

Quando a característica for de fácil mensuração (Sim ou Não)

Quando houver a necessidade de alta precisão (Censo IBGE)

POR QUE USAR A AMOSTRAGEM?

QUANDO NÃO USAR A AMOSTRAGEM?

ESTATÍSTICA

AMOSTRAGEM ALEATÓRIA SIMPLES

(Tem que obedecer a propriedade de qualquer elemento da populaçãoter a mesma chance de pertencer à amostra. Pode-se utilizar uma tabelade números aleatórios ou sorteios)

AMOSTRAGEM ALEATÓRIA SISTEMÁTICA

(Após obter-se a lista dos elementos da população, sorteia-se a entrada esegue-se a relação N/n.)

AMOSTRAGEM ALEATÓRIA ESTRATIFICADA

(Elabora-se a amostra através do perfil conhecido da população.Exemplo: Se na UFSC 70% são alunos e 30% Funcionários, a amostra éconfeccionada obedecendo-se estes parâmetros.)

TIPOS DE AMOSTRAGEM

ESTATÍSTICA

AMOSTRAGEM NÃO ALEATÓRIA

(De fácil obtenção.)

AMOSTRAGEM PARA ESTUDOS COMPARATIVOS

(Não visa a descrição de uma população, mas a comparação entregrupos diferentes. Exemplos: Comparar as taxas de tabagismo emindivíduos com câncer de pulmão e sadios.)

OUTROS TIPOS DE AMOSTRAGEM

Procure respeitar o Plano de Amostragem para que seja alcançada uma amostra representativa da população.

ESTATÍSTICA

Fórmula Genérica

Sejam: n0 = Primeira aproximação para o tamanho da amostrae = Erro Amostral Tolerável (exemplo: 0,05)

n = Tamanho da AmostraN = Tamanho da População

DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)

n0 = 1 / e2 n = (N . n0) / (N + no)

ESTATÍSTICA

Fórmula para variável quantitativa, desvio conhecido e população infinita

Sejam: n = Tamanho da Amostraz = Nível de confiança expresso em desvio padrão (95%) = 1,96s = Desvio padrão da populaçãoe = Erro do estudo expresso na mesma unidade do desvio padrão

DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)

n = (z . s /e)2

ESTATÍSTICA

Fórmula para variável quantitativa, desvio desconhecido e população infinita

Sejam: n = Tamanho da Amostraz = Nível de confiança expresso em desvio padrão (95%) = 1,96s = Desvio padrão de uma amostra previamente selecionadae = Erro do estudo expresso na mesma unidade do desvio padrão

DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)

n = (z . s/e)2

ESTATÍSTICA

Fórmula para variável quantitativa, desvio conhecido e população finita

Sejam: n = Tamanho da Amostraz = Nível de confiança expresso em desvio padrão (95%) = 1,96s = Desvio padrão populaçãoe = Erro do estudo expresso na mesma unidade do desvio padrãoN = Tamanho da População

DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)

n = z2 . s 2 . N

z2 . s 2 + e2 . (N-1)

ESTATÍSTICA

Fórmula para variável quantitativa, desvio desconhecido e população finita

Sejam: n = Tamanho da Amostraz = Nível de confiança expresso em desvio padrão (95%) = 1,96s = Desvio padrão uma amostra previamente selecionadae = Erro do estudo expresso na mesma unidade do desvio padrãoN = Tamanho da população

DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)

n = z2 . s2 . N

z2 . s2 + e2 . (N-1)

ESTATÍSTICA

Populações infinitas com proporção conhecida

DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)

z2 . p . (1-p))

e2

Onde: n= Tamanho da Amostra

z = Nível de confiança expresso em desvio padrão (95%) = 1,96

e = Erro Amostral Tolerável expresso em proporção (exemplo: 0,05)

p = Proporção do evento na População (prevalência de um evento)

n =

ESTATÍSTICA

Populações finitas com proporção conhecida

DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)

(N . z2 . p . (1-p))

(e2 . (N-1) + z2 . p . (1-p))

Onde: n = Tamanho da amostraN = Tamanho da População

z = Nível de confiança expresso em desvio padrão (95%) = 1,96

e = Erro Amostral Tolerável expresso em proporção (exemplo: 0,05)

p = Proporção do evento na População (prevalência de um evento)

n =

ESTATÍSTICA

Relação entre o tamanho da população e o tamanho da amostra

RELAÇÃO ENTRE (n) E (N)

n

N

600

500

400

300

200

100

0

0 500 1000 1500 2000 2500 3000 3500

ESTATÍSTICA

EXERCÍCIOS

1) Determine o tamanho da amostra para uma pesquisa eleitoralem uma cidade com 200.000 eleitores, adotando uma margem deerro de 2 pontos percentuais. Utilize a fórmula genérica.

ESTATÍSTICA

Tabela é a forma não discursiva de apresentar informações, das

quais o dado numérico se destaca como informação central.

Uma tabela estatística conterá necessariamente uma série ou

uma distribuição de frequência.

Vantagens:- Permitem a síntese dos resultados;

- Auxiliam o pesquisador na análise dos dados e

- Facilitam a compreensão das conclusões do autor.

TABELAS

ESTATÍSTICA

NORMAS PARA A CONFECÇÃO DE TABELAS

São numeradas consecutivamente com algarismos arábicos;

Os números são precedidos da palavra “Tabela”;

No topo deve estar o título que indica a natureza e as abrangênciasgeográficas e temporal dos dados numéricos;

O centro da tabela é representado por uma série de colunas esubcolunas onde são alocados os dados;

No rodapé deve-se colocar a fonte (o responsável pelos dados) eopcionalmente uma nota geral ou uma nota específica;

A moldura deve conter no mínimo 3 traços horizontais;

Não se deve fechar uma tabela com traços verticais em suasextremidades.

ESTATÍSTICA

CLASSIFICAÇÃO DAS TABELAS

Distribuição de Frequência

ESTATÍSTICA

Séries Cronológicas (Temporais ou Históricas)

Anos Percentual (%)

1999 25,74

2000 26,85

2001 27,94

2002 32,45

Fonte: Hipotética

Tabela 1: Prevalência da Doença X na Cidade Y

ESTATÍSTICA

Séries Geográficas (Territoriais)

Cidades Percentual

Itajaí 10,44

Lages 29,45

Florianópolis 8,66

Blumenau 9,82

Fonte: Hipotética

Tabela 2: Prevalência da Doença X no Ano de 2003

ESTATÍSTICA

Séries Especificativas

Segmento populacional Percentual

Crianças 60,25

Jovens 20,72

Adulto 2,75

3a Idade 5,82

Fonte: Hipotética

Tabela 3: Prevalência da Doença X no Ano de 2003 em Florianópolis

ESTATÍSTICA

Séries Mistas (Ex: Especificativa-Cronológica-Geográfica)

Produtos 2001 2002

Fpolis Lages Fpolis Lages

Cosméticos 24,24 9,34 25,95 9.98

Vestuário 112,72 27,45 111,75 29,48

Audio 86,75 18,45 79,37 19,57

Video 1,95 0,85 2,01 0,84

Fonte: Hipotética

Tabela 4: Vendas de alguns produtos por ano e cidade (milhares)

ESTATÍSTICA

Distribuições de Frequência

Pesos Frequência Frequência Acumulada

64 51 51

65 100 151

66 22 173

67 14 187

Total 187 -

Fonte: Hipotética

Tabela 5: Distribuição de frequência dos pesos corporais de uma amostra (valores em quilogramas)

ESTATÍSTICA

Gráfico é a forma geométrica de apresentação dos dados e

respectivos resultados de sua análise.

A escolha do modelo ideal de representação gráfica depende das

preferências e do senso estético do elaborador.

Vantagens:- Permitem a síntese dos resultados;

- Auxiliam o pesquisador na análise dos dados e

- Facilitam a compreensão das conclusões do autor.

GRÁFICOS

ESTATÍSTICA

NORMAS PARA A CONFECÇÃO DE GRÁFICOS

Deve facilitar a interpretação dos dados para um leigo;

Não há a necessidade de se colocar título se estiver na mesma páginada tabela correspondente;

Há a necessidade de se colocar o título se a tabela correspondentenão estiver na mesma página.

O senso estético individual determina o espaço do gráfico (L x A);

As colunas, barras, linhas e áreas gráficas devem ser ordenadas demodo crescente ou decrescente, mas a ordem cronológica prevalece;

ESTATÍSTICA

ORIGEM DOS GRÁFICOS

O diagrama cartesiano é a figura geométrica que deu origem à

técnica de construção de gráficos estatísticos.

Utiliza-se o primeiro quadrante do sistema de eixos coordenados

cartesianos ortogonais.

1o QuadranteAbscissas (eixo x)

Ordenadas (eixo y)

Eixo y Frequências

Eixo x Valores da Variável