parte ii - administração · dados primários são aqueles que foram prospectados sem que não...

82
PARTE II

Upload: truongkien

Post on 11-Nov-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

PARTE II

2

APRENDENDO ESTATÍSTICA

4. Coleta de Dados

Toda e qualquer ação estatística deve estar centrada em objetivos claros. O

primeiro passo para um procedimento estatístico é o trabalho que envolve os dados de

um estudo.

Estando estes objetivos definidos, buscam-se os dados que os satisfaçam, sejam

eles primários ou secundários. Dados primários são aqueles que foram prospectados

sem que não tenha havido um estudo preliminar acerca da amostra em específico, ou

seja, são dados originais. Dados secundários são aqueles que estão a nossa disposição

oriunda de outros estudos. São fontes de dados secundários; Internet, bancos de dados,

cadastros, jornais, revistas, filmes, entre muitas outras fontes.

A coleta de dados pode ser dividida em contínuas, periódicas ou ocasionais.

* Coleta de dados contínua: quando os eventos que acontecem durante

determinado estudo, são registrados à medida que ocorrem;

* Coleta de dados periódica: acontecem de ciclo em ciclo, como exemplo o censo do

Brasil;

* Coleta de dados ocasional: são aqueles realizados sem a preocupação de

continuidade ou periodicidade.

Nos estudos que são realizadas coletas de dados contínuas ou periódicas o interesse é a

enumeração total. A estatística participa apenas no seu aspecto descritivo de

apresentação de dados.

Os dados são obtidos pelo próprio pesquisador, utilizando dados já existentes (dados

secundários) ou através de levantamentos (dados primários) e experimentos.

O pesquisador pode querer descrever o conjunto, mas o mais comum é ele querer fazer

inferências a partir de amostras do total. Dessa forma a estatística participa no

processo de fazer a inferência e planejar como a mesma será realizada. Nos

levantamentos, como os utilizados nas pesquisas de saúde pública, a estatística indica

a forma de amostragem que permite uma inferência sobre o todo. Nos experimentos

ela fornece o delineamento mais adequado em cada estudo.

Qualquer que seja a forma de obtenção de dados eles estarão no final do trabalho,

desorganizados. Para que esses dados tenham um valor informativo (sobre o assunto

investigado), deverão ser apresentados de forma concisa e compreensível, satisfazendo

a dúvida.

3

5. Tabelas de frequências e agrupamento de dados

Os estudos estatísticos são responsáveis pela análise de informações através de tabelas

informativas e representações gráficas, no intuito de fornecer clareza nos resultados

obtidos. Os dados coletados são organizados em tabelas que detalham as frequências

absoluta e relativa. Em algumas situações, a quantidade de informações diferenciadas

torna inviável a construção de uma tabela com uma linha para cada representação de

valor. Nesses casos optamos por agrupar os dados em intervalos de classes.

6. Representações Gráficas dos dados estatísticos.

Os gráficos encontram-se presentes em quase todos os meios de divulgação de

informação, como jornais e revistas, nos manuais escolares, nas apresentações

públicas e até os nossos relatórios individuais já não passam sem eles.

Contudo, fazer um gráfico ou um mapa que de fato informe e seja

simultaneamente, apelativo, legível e coerente com os dados não é tarefa fácil.

A grande vantagem dos gráficos reside na sua capacidade de contar uma história

de forma interessante e atrativa permitindo compreender rapidamente fenômenos que

dificilmente seriam percebidos de outra forma.

Contudo, não implica que este processo seja feito de forma simples, sendo

necessário muito trabalho e cuidado. Existem muitas formas de apresentar

figurativamente a informação estatística e no caso particular dos gráficos são tantas as

possibilidades que houve necessidade de restringir o objeto deste material aos gráficos

mais usuais e não proceder a uma abordagem mais exaustiva.

7. Recursos Computacionais

Você pode exibir graficamente os dados coletados utilizando o Microsoft Excel. Os

gráficos são vinculados aos dados da planilha na qual foram criados e atualizados

quando você altera os dados da planilha. Detalhes serão vistos em aula.

8. Medidas de Tendência Central (de Posição)

Com o intuito de medir a tendência da amostra vamos estudar, inicialmente, a

média aritmética, ponderada, moda e mediana.

4

8.1 Média aritmética:

A média aritmética simples é a mais utilizada no nosso dia-a-dia. É obtida

dividindo-se a soma das observações pelo número delas. É um quociente geralmente

representado pelo símbolo . Neste curso, iremos rotular cada tipo de média com um

índice apropriado, neste caso chamaremos a média aritmética de .

Se tivermos uma série de n valores de uma variável x, a média aritmética simples

será determinada pela expressão:

Exemplo 13: Média aritmética, , a conhecidos “xi” e “n”.

Calcule a média aritmética do número de alunos.

número de alunos

40

85

75

50

30

120

5

Exemplo 14: Média aritmética, , conhecidos “xi” e “n”.

Calcule a média aritmética na pontuação dos alunos das classes A, B e C.

nota - Classe A nota - Classe B nota - Classe C

2 1 0

3 1 0

5 1 0

6 1 0

7 -1 1

= = =

Exemplo 15: Média aritmética - Sistema de Equações

A média das idades de um grupo de estudantes é de 25 anos. Excluindo-se o mais

novo deles, que tem 16 anos, a média do novo grupo formada passa a ser 28 anos.

Quantos estudantes havia no primeiro grupo?

Resolução:

Exemplo 16: Média aritmética - Sistema de Equações

A média das idades de um grupo de estudante é de 20 anos. Excluindo-se dois deles, o

de 10 e o de 12 anos, a média do novo grupo formada aumenta de 30%. Quantos

estudantes havia no primeiro grupo?

Resposta: 5 estudantes.

Anotações

Anotações

6

8.2 Média Ponderada:

Consideremos uma coleção formada por n números: , de forma que

cada um esteja sujeito a um peso [Nota: "peso" é sinônimo de "ponderação"],

respectivamente, indicado por: . A média aritmética ponderada desses n

números é a soma dos produtos de cada um multiplicados por seus respectivos pesos,

dividida pela soma dos pesos, isto é:

Exemplo 17: Média aritmética ponderada.

Um professor no início do curso informou que no critério de avaliação das provas

seriam adotados os seguintes pesos:

Bimestre1 Bimestre2 Bimestre3 Bimestre4

1 2 3 3

Considerando que dois alunos, Juliana e Rafael, terminaram o curso com as seguintes

notas bimestrais das provas P1 a P4:

NOTAS P1 P2 P3 P4

Juliana 10 5 8 7

Rafael 7 8 5 10

Calcule: a) A média ponderada de cada aluno

b) A média aritmética de cada aluno.

7

Exemplo 18: Média aritmética ponderada – Determinação de custos.

Uma fábrica possui quatro grupos de funcionários, com 18 operadores (OP) e 15

técnicos (TEC) cada, que trabalham em turno de revezamento. A empresa deseja

contratar um corpo de técnicos em informática para trabalhar no horário

administrativo. Considerando a tabela de salários abaixo, calcular quantos técnicos

em informática (TI) a empresa poderá contratar para que a média ponderada com

salários seja R$ 1.725,00.

Resolução:

Cargo R$ nº

OP 2000,00 18

TEC 1500,00 15

TI 1500,00 n

8

8.3 Moda, Mo:

Seja uma amostra com n valores xi (i = 1,..., n) definimos moda como o valor que

aparece com maior frequência.

Em estatística descritiva, a moda é o valor que detém o maior número de observações,

ou seja, o valor ou valores mais frequentes. A moda não é necessariamente única, ao

contrário da média ou da mediana. É especialmente útil quando os valores ou

observações não são numéricos, uma vez que a média e a mediana podem não ser bem

definidas. A moda é uma medida não afetada por valores extremos.

A moda de {maçã, banana, laranja, laranja, laranja, pêssego} é laranja.

A série {1, 3, 5, 5, 6, 6} apresenta duas modas (bimodal): 5 e 6.

A série {1, 3, 2, 5, 8, 7, 9} não apresenta moda.

Exemplo 19: Moda – (elemento que aparece com maior freqüência).

As idades dos jogadores de dois times de futebol se encontram assim distribuídas:

TIME A: 17;15;16;16;18;16;17;16;15;19;16

TIME B: 17;15;16;20;18;21;22;14;23;24;25

Calcule a moda de cada amostra.

Resolução:

9

8.4 Mediana, Md:

A mediana é uma medida de tendência central, um número que caracteriza as

observações de uma determinada variável de tal forma que este número (a mediana) de

um grupo de dados ordenados separa a metade inferior da amostra, população ou

distribuição de probabilidade, da metade superior. Mais concretamente, 1/2 da

população terá valores inferiores ou iguais à mediana e 1/2 da população terá valores

superiores ou iguais à mediana.

Seja uma amostra com n valores xi (i = 1,..., n) ordenados em rol vamos definir as

expressões da mediana conforme n, frequência, seja ímpar ou par.

a) n ímpar: a mediana será o termo central desse rol. Ela é obtida por meio da

seguinte expressão:

b) n par: a mediana será a média aritmética entre os termos centrais desse rol. Ela é

obtida por meio da seguinte expressão:

Exemplo 20: Calcule a mediana para as tabelas 1 e 2 abaixo.

TABELA 1 – Volumes encontrados em refrigerantes de 600 mL.

n Volume (mL) Volume (mL) -

Rol

1 605 598

2 604 600

3 598 602

4 600 604

5 602 605

10

Resposta: Mediana:

TABELA 2 – Notas bimestrais de um aluno

Bim. 1 Bim. 2 Bim. 3 Bim. 4

Nota 6,0 4,0 5,0 8,0

Nota (Rol)

Resposta: Mediana:

EXERCÍCIOS PROPOSTOS:

28. Uma amostra com 10 latas de uma marca de cerveja foi analisada. Foram

registrados os volumes, em mL, dessas latas e abaixo registrados:

N Volume (mL) Volume (mL) -

Rol

1 305

2 304

3 298

4 300

5 302

6 301

7

8 303

9 299

10 302

a) Escrever os volumes dados em rol (do menor para o maior).

b) Calcular a média aritmética, , da amostra.

c) Calcular a moda, MO da amostra.

d) Calcular a mediana, Md da amostra.

11

29. Numa sala de aula 40 alunos foram avaliados e medidos seus desempenhos.

Foram atribuídos os conceitos A, B, C e D. A freqüência para cada conceito se

encontra representada na tabela abaixo:

Conceito número de alunos, fi f%

A 25

B 35

C 28

D 12

a) Calcule a freqüência absoluta da letra D;

b) Calcule a freqüência relativa, f%, de cada conceito;

c) Faça um histograma ilustrando as porcentagens e um gráfico por setores

(pizza) com espaçamento de 7% entre os setores.

30. Uma urna contém 5 bolas numeradas de 1 a 5. O sorteio de uma bola dessa urna

foi realizado 50 vezes. Sabendo-se que a freqüência percentual da bola de número 3

foi 12,5%, calcular a freqüência dessa bola, f3.

31. Numa sala de aula de uma escola foram anotadas as idades dos alunos. A relação

da idade com o número de alunos se encontra no histograma abaixo.

Com base no histograma calcule:

a) O número de alunos da sala de aula;

b) A porcentagem dos alunos nesta sala com mais de 18 anos.

12

32. Para votar, cinco eleitores demoraram, respectivamente, 3min38s, 3min18s,

2min46s, 2min57s e 3min26s. Qual a média aritmética do tempo de votação (em

minutos e segundos) desses eleitores?

33. A média aritmética dos elementos de um conjunto de 28 números é 27.

Determine a nova média aritmética que obteremos se retirarmos desse conjunto três

números, de valores 25, 28 e 30.

34. Qual dos três jogadores abaixo teve maior média aritmética de gols?

Paulinho 7 8 3 10

Toninho 5 5 0 4

Pedrinho 9 8 10 5

35. Numa amostra de cinco alunos de uma classe foram constatadas as seguintes

notas:

aluno idade idade (rol)

1 8,5

2 6,5

3 7,0

4 8,0

5 5,0

a) Escrever os volumes dados em rol (do menor para o maior).

b) Calcular a média aritmética, , da amostra.

c) Calcular a moda, MO da amostra.

d) Calcular a mediana, Md da amostra.

13

36. Quatro grupo de estudantes, divididos em grupos de 18, 20, 10 e 15 alunos, têm

pesos de 70, 74, 77, e 81 kg, respectivamente. Usando a expressão da média

ponderada calcule o peso médio de todos os estudantes conforme tabela abaixo.

nº estudantes peso

18 70

20 74

10 77

15 81

37. Calcule a moda das tabelas 1 e 2 abaixo.

TABELA 1: MO =

TABELA 2: MO =

38. Numa visita a diversas empresas foram catalogados o número de veículos que as

mesmas possuíam. Constatou-se que 4 empresas possuíam 3 veículos e 6 empresas

possuíam 5 veículos. O resultado se encontra na tabela abaixo:

nº veículos nº de empresas

3 4

5 6

7 x

Com base na tabela acima, calcule o número de empresas que devem possuir 7

veículos para que a média ponderada seja 35.

TABELA 2

102

90

60

102

60

90

27

27

TABELA 1

102

90

60

48

90

48

27

14

39. Usando a tabela abaixo de Crescimento diário das raízes em áreas de florestas:

Dia 1 2 3 4 5

Crescimento (mm) 0,45 0,46 0,47 0,44 0,48

a) Calcular a moda, MO da amostra.

b) Calcular a mediana, Md da amostra.

40. Cálculo da inflação. Quando a utilização da média é indevida porque é

influenciada pelos valores extremos, ou ainda, valores discrepantes, temos outro

modo de representar a tendência central, utilizando uma medida que não use em seu

cálculo todos os valores. Calcule a média dos números abaixo desprezando o valor

discrepante.

8.5 Somatório, :

Antes de darmos continuidade ao importante capítulo envolvendo as medidas de

dispersão, entre outros temas, vamos iniciar o estudo do cálculo envolvendo o

somatório, ou seja, a chamada notação sigma, . Esta técnica permite resumir termos

de uma soma e expressá-los de uma forma mais compactada.

TABELA INFLAÇÃO

6,02

0,90

0,60

0,48

0,90

0,48

0,24

15

Vimos que se tivermos uma série de n valores de uma variável x, a média

aritmética simples é determinada pela expressão:

Dessa forma, expressamos a soma de vários termos por meio de um somatório:

O número 1 embaixo representa um “índice”, neste caso, o primeiro termo. Temos na expressão

acima n termos. O índice i assume os valores 1 até n. Vejamos alguns exemplos.

Exemplo 21: Escreva na forma de somatório as expressões abaixo:

Resposta:

2.(1 + 2 + 3 + 4 + 5) = =

Resposta:

EXERCÍCIOS:

41. Expandir os somatórios abaixo:

a) =

b) =

c)

d)

16

e)

f)

g)

h)

i)

j)

PROPRIEDADES DO SOMATÓRIO:

EXERCÍCIOS PROPOSTOS:

42. Escreve cada parcela para os somatórios abaixo:

a)

b)

c)

d)

e)

17

43. Complete a coluna dos xi representados pelos dados brutos

X: 3, 2, 8, 5

colocando-os em rol e ainda as duas últimas colunas conforme se pede.

i xi fi xi.fi 1

2

3

4

= = =

Construa o histograma.

44. Usando os resultados do exercício anterior complete as expressões abaixo

indicado como verdadeiras (V) ou falsas (F) as igualdades:

a) ( )

b) ( )

18

c) ( )

d) ( )

9. Medidas Separatrizes.

São valores que dividem uma série ordenada de dados ou uma distribuição de

freqüência em um dado número de partes.

DECIL (Di) : divide a série ou a distribuição em dez partes iguais.

PERCENTIL (Pi) ou CENTIL (Ci) : divide a série ou a distribuição em cem partes

iguais.

9.1 Quartil:

QUARTIL (Qi) : divide a série ou a distribuição em quatro partes iguais. Dessa forma,

se dividirmos a série (em rol) em quatro partes, cada parte ficará com 25% de seus

elementos.

O primeiro Quartil vamos denotar por Q1; este separa a sequência ordenada

deixando 25% de seus valores à esquerda e os demais, 75%, à direita. Neste caso, Q2

representa a mediana da série.

Podemos calcular qual elemento da série (em rol) representa Q1. Temos que

identificar o elemento desejado com o percentil correspondente, Pi. O primeiro

19

Quartil tem i = 25. Calculamos i% do número de elementos da sequência dada para

localizarmos a posição do percentil i no rol. Portanto, Q1 será dado pelo número que

estiver nesta posição.

Exemplo 22: Calcule o primeiro Quartil, Q1, da sequência:

X: 8, 4, 9, 1, 2, 2, 5, 5, 8, 7, 6, 6.

Resolução:

Primeiro ordenamos a sequência.

X(rol): 1, 2, 2, 4, 5, 5, 6, 6, 7, 8, 8, 9

A seguir calculamos i% de n, em que i = 25 (lembre-se Q1 separa a sequência

ordenada deixando 25% de seus valores à esquerda) e n = 10 (número de elementos da

sequência). Assim, teremos:

Este número indica a posição do P25 no rol. Logo, P25 é o 3º. elemento da sequência

em rol, ou seja, 2. Portanto, Q1 = P25 = 2.

Este resultado ilustra que 25% dos valores desta sequência são menores ou iguais a 2 e

75% são maiores ou iguais a 2.

Relação Visual entre Mediana e o Quartil

!-------------------!-------------------!

Md

!---------!---------!---------!---------!

Q1 Q2 Q3

20

9.2 Quintil: divide a série ou a distribuição em cinco partes iguais. Dessa forma, se

dividirmos a série (em rol) em cinco partes, cada parte ficará com 20% de seus elementos.

Relação Visual do Quintil

!---------!---------!---------!---------!---------!

K1 K2 K3 K4

Exemplo 23: Calcule o terceiro Quintil, K3, da sequência:

X: 8, 4, 9, 1, 2, 2, 5, 5.

Resolução:

Primeiro ordenamos a sequência.

X(rol): 1, 2, 2, 4, 5, 5, 8,9.

Sabemos que K3 = P60. A seguir calculamos i% de n, em que i = 60 (lembre-se K3

separa a sequência ordenada deixando 60% de seus valores à esquerda) e n = 10

(número de elementos da sequência). Assim, teremos:

Este número não é inteiro e indica a posição do P60 no rol é um valor situado entre o

4º. e o 5º. elemento da sequência. Logo, K3 = P60 é a média aritmética entre o 4º. e o

5º. elemento da sequência em rol, ou seja, entre 4 e 5. Portanto, Q1 = P25 = (4+5)/2 =

4,5.

21

Este resultado ilustra que alguns percentis podem coincidir em valores tornando as

interpretações não totalmente verdadeiras.

Exemplo 24: A tabela abaixo representa a venda de veículos de uma concessionária

autorizada.

Classe Interv Classe fi 1 20.000 | 25.000 10

2 25.000 | 30.000 12

3 30.000 | 35.000 8

4 35.000 | 40.000 5

5 40.000 | 45.000 3

6 45.000 | 50.000 4

7 50.000 | 55.000 1

Determine o terceiro quartil, Q3 = P75.

Resolução:

Vamos escrever a tabela dada incluindo a freqüência acumulada.

Classe Interv Classe fi Fi 1 20.000 | 25.000 10 10

2 25.000 | 30.000 12 22

3 30.000 | 35.000 8 30

4 35.000 | 40.000 5 35

5 40.000 | 45.000 3 38

6 45.000 | 50.000 4 42

7 50.000 | 55.000 1 43

= 43

O número de elementos da série é dado por n = fi = 43.

i representa o índice do percentil, P, ou seja, i = 75.

Vamos agora introduzir a fórmula para o cálculo de qualquer percentil:

22

Alguns componentes da fórmula acima já foram descritos, no entanto, os demais

(para este exercício) são:

Pi = P75 =Q3 = ?

Ii = I75 =limite inferior da classe que contém o percentil i = 75.

Para o cálculo de I75 devemos fazer o conhecido cálculo:

Este resultado nos dá a posição de P75 na série.

Observando agora a tabela, a classe que contém o elemento que ocupa a posição

32,25 na série é a quarta classe. Na 4ª. classe temos Fi = F4 = 35, ou seja, engloba o

32,25 e contém o P75; temos ainda que fi = f4 = 5.

Estamos em condições agora de escrever o valor de Fant. Ele pode ser obtido tomando

a freqüência acumulada da classe anterior, neste caso, F3 = 30.

Temos ainda que I75 = 35.000; ele é o limite inferior da 4ª. classe.

E por último o intervalo de classe, h = 5.000 (vide a respectiva coluna, ou seja, a

coluna do meio).

Inserindo estes resultados na fórmula teremos:

=35.000 + 2.250 = 37.250.

23

Portanto, Q3 = P75 = 37.250, ou seja 75% dos valores da série são menores ou iguais

a 37.250 e 25% dos valores da série são maiores ou iguais a 37.250.

EXERCÍCIOS PROPOSTOS: 43. Seja a série X: 4, 16, 6, 10, 4, 13, 16, 18, 21, 20, calcule o primeiro quartil e o

primeiro quintil.

44. Seja a série X: 9, 4, 7, 1, 3, 3, 5, 2, 8, 7, 6, 6, calcule o segundo quartil e o

segundo quintil.

24

45. (Continuação do exercício 6.) - As alturas (em centímetros) de um pelotão de

soldados se encontra distribuída na tabela abaixo:

165 170 168 172 175

168 178 180 185 188

190 182 185 180 168

170 175 175 182 165

Após agrupar por freqüência contínua estas informações completando a tabela Xi por

fi , bem como, a coluna de freqüência acumulada, Fi, determine Q3.

[ Obs.: Usar o intervalo de classe igual a 10 centímetros e a fórmula abaixo.]

Q3 = P75 = ?

Lembre-se:

o número de elementos da série é dado por n = fi.

i representa o índice do percentil, P, ou seja, i = 75.

Ii = I75 =limite inferior da classe que contém o percentil i = 75.

Classe Interv Classe fi Fi

25

46. (Continuação do exercício 14.) - Uma empresa cafeteria lançando um novo tipo

de capuccino anotou em uma planilha a venda deste novo produto. Em determinado

mês o número de unidades vendidas foi colocado em uma planilha conforme abaixo.

10 15 25 21 6 23 15 21 26 32

9 14 19 20 32 18 16 26 24 20

7 18 17 28 35 22 19 39 18 21

Usando o critério da raiz determine a frequência relativa percentual de cada classe.

Calcule Q3 completando a tabela abaixo.

Classe Interv Classe fi Fi

26

47. A distribuição de salários de uma empresa é dada conforme tabela abaixo.

Calcule Q1 e Q3.

Classe Salários, R$ Núm. Func., fi Freq. Acum.,Fi

1 1.500 |------ 2.000 15

2 2.000 |------ 2.500 10

3 2.500 |------ 3.000 8

4 3.000 |------ 3.500 6

10. Medidas de Dispersão.

Vimos que as medidas de tendência central, como a média, por exemplo, não

são suficientes para caracterizar totalmente uma dada sequência numérica.

A média pode representar muito bem certa sequência, no entanto, pode não ser

boa para representar outra. Vejamos as três sequências abaixo:

27

X: 1, 2, 3, 4, 5, 6, 7, 8, 9.

Y: 4, 5, 5, 5, 5, 5, 5, 6

Z: 5, 5, 5, 5, 5, 5, 5, 5

Na primeira sequência, X, a média é igual a 5. Ela não representa bem a

sequência, pois, existem elementos muito diferentes, ou seja, uma grande discrepância

nos valores. Se esta sequência representasse os salários dos trabalhadores, em

unidades de mil, nós teríamos pessoas ganhando 1 mil reais e outras 9 mil reais. A

média de 5 mil reais poderia não refletir corretamente o nível de vida, social, familiar

que o trabalhador de 1 mil reais possui. Numa entrevista com o gerente da empresa,

certamente ele diria:

------ Nossos funcionários ganham em média 5 mil reais!

No entanto, poderia haver funcionários passando por adversidades em sua

estrutura financeira.

Nas sequências Y e Z, contudo, há uma melhor representatividade da média.

Nossa meta é, portanto, encontrar medidas que avaliem a representatividade da média

usando as medidas de dispersão. Na sequência Z, por exemplo, os dados estão todos

concentrados sobre a média 5. Não há dispersão de dados. Na sequência X há fraca

concentração de dados em torno da média e forte dispersão de dados em relação à

media 5.

As medidas de dispersão que veremos aqui são: amplitude total, desvio médio

simples, variância e desvio padrão.

10.1 Amplitude Total:

Vimos na seção 3.3.2 a definição da Amplitude Total. Vamos agora aplicá-la

aos casos de variável discreta, bem como de variável contínua

28

Como no caso da variável discreta colocamos em rol os valores dos dados Xi a

amplitude total é a diferença entre o último (maior) e o primeiro (menor) elemento da

série.

Na situação de variável contínua não conhecemos o maior e o menor valor da

série, assim, devemos fazer um cálculo aproximado da amplitude total. Devemos

tomar a média da primeira e da última classe.

A amplitude total depende apenas de dois valores da série e pode não fornecer

uma boa informação sobre a mesma. Veremos como calcular a amplitude total por

meio de alguns exemplos.

Exemplo 25: Caso 1: Variável Discreta. - Calcule a amplitude total da série:

X: 72, 3, 2, 8, 4, 9, 18, 32

Resolução:

Colocando a sequência em rol temos:

X: 2, 3, 4, 8, 9, 18, 32, 72

Dessa forma a amplitude total será:

At = xmax - xmin = 72 – 2 = 70 Resposta: At = 70.

Exemplo 26: Caso 1: Variável Discreta. - Calcule a amplitude total da série:

Classe Núm. de acidentes/dia, xi Núm. de dias, fi

1 1 30

2 1 5

3 2 3

4 3 1

5 5 1

29

Resolução:

A amplitude total será:

At = xmax - xmin = 5 – 1 = 4 Resposta: At = 4.

Exemplo 27: Caso 2: Variável Contínua. - Calcule a amplitude total da série:

Classe Salários, US$ Núm. Func., fi

1 0 |------ 10.000 5

2 10.000 |------ 20.000 10

3 20.000 |------ 30.000 8

4 30.000 |------ 40.000 2

Resolução:

O ponto médio da última classe (classe 4) é 35.000 e o da primeira classe é 5.000.

Portanto, a amplitude total será:

At = xmax - xmin = 35.000 – 5.000 = 30.000

Resposta: At = 35.000.

10.2 Desvio Médio Simples

O conceito de desvio corresponde ao conceito de distância.

Vamos calcular a dispersão dos dados em relação média de uma sequência

através dos desvios de cada elemento em relação à média aritmética, .

O desvio médio simples, DMS, é a média aritmética dos desvidos de cada

elemento da série para a média da série, Como o desvio em relação à media

aritmética pode ser negativo, o cálculo do DMS envolve o módulo do número.

30

10.2.1 Dados Brutos ou Rol

Quando tivermos dados brutos, ou mesmo em rol, devemos primeiramente

calcular a média aritmética, , dos mesmos. A seguir calculamos o módulo da

diferença de cada elemento em relação à média aritmética. Somamos então esses

valores e dividimos por n o número de elementos da série, ou seja, calculamos a média

dessas distâncias. A expressão que permite esse cálculo pode ser escrita como:

Exemplo 28: Caso 1:Dados Brutos – Calcule o desvio médio simples da série:

X: 2, 3, 2, 8, 5.

Resolução:

Calculando a média aritmética dos dados brutos acima, temos:

Calculamos agora o módulo da distância de cada elemento da série, ou seja:

A seguir somamos os resultados obtidos e dividimos pelo número de elementos n = 5

da série dada:

Com esse resultado temos que, em média, cada elemento da sequência está afastado

do valor 4 por 2 unidades.

31

10.2.2 Variável Discreta

Se a apresentação dos dados abranger variáveis discretas a frequência simples

de cada elemento representa o número de vezes que este valor aparece na série. Neste

caso haverá repetições de distâncias iguais de cada elemento distinto da série para a

média da série. Desse modo, devemos usar a média ponderada em vez da média

aritmética conforme o exemplo anterior. A expressão que permite esse cálculo pode

ser escrita como:

Exemplo 29: Caso 2:Variável Discreta – Calcule o desvio médio simples das

variáveis discretas, xi, descritas conforme tabela:

Classe Xi fi 1 2 1

2 3 4

3 4 2

4 7 4

Resolução:

O número de elementos da série dada é

A média da distribuição acima é:

Assim devemos calcular o numerador da expressão acima inserindo uma nova coluna

para a tabela dada, ou seja,

32

Classe Xi fi Xi.fi 1 1 2 2

2 2 3 6

3 4 2 8

4 8 1 8

Dividindo o resultado da tabela acima podemos calcular a média aritmética:

Para calcularmos o desvio médio simples, DMS, das variáveis discretas, xi ,

precisamos construir nova tabela, qual seja:

Classe Xi fi Xi.fi Xi- fi

1 1 2 2 2.2 = 4

2 2 3 6 1.3 = 3

3 4 2 8 1.2 = 2

4 8 1 8 5.5 = 5

Portanto, o desvio médio simples das variáveis discretas, xi,é:

Dessa forma, em média, cada elemento da série está afastado de 3 por 1,75 unidades.

Ele é empregado em sala de aula, por algumas escolas, para que o professor tenha

uma noção dos alunos que estão se afastando (para mais ou para menos) dos alunos

com nota dada pela média da classe.

33

10.2.3 Variável Contínua

Se, no entanto, a apresentação dos dados abranger variáveis contínuas cada

elemento de classe representa a média entre o intervalo superior e o inferior em cada

classe. A expressão que permite esse cálculo pode ser escrita como:

em que, Xi,é o ponto médio da classe i.

Exemplo 30: Caso 3:Variável Contínua – Calcule o desvio médio simples para a

série (variáveis contínuas) abaixo.

Classe Interv Classe fi

1 2 |------ 4 10

2 4 |------ 6 20

3 6 |------ 8 8

4 8 |------ 10 2

5 10 |------ 12 20

Resolução: O número de elementos da série dada é

Para determinarmos a média da série devemos inserir nova tabela, agora com os xi

como os pontos médios entre os intervalos de classe, bem como com o respectivo

produto xi.fi .

34

Classe Interv Classe fi xi xi.fi .

1 2 |------ 4 10 3 30

2 4 |------ 6 20 5 100

3 6 |------ 8 8 7 56

4 8 |------ 10 2 9 18

5 10 |------ 12 20 11 220

Agora estamos em condições de calcular a média da distribuição contínua:

Neste caso, optamos pelo valor aproximado 7.

Para o cálculo do DMS devemos inserir uma nova coluna para a tabela acima,

ou seja,

Portanto, o desvio médio simples das variáveis contínuas é:

Classe Interv Classe Fi Xi xi.fi . Xi- fi

1 2 |------ 4 10 3 30 |3-7|.10 = 40

2 4 |------ 6 20 5 100 |5-7|.10 = 20

3 6 |------ 8 8 7 56 |7-7|.10 = 0

4 8 |------ 10 2 9 18 |9-7|.10 = 20

5 10 |------ 12 20 11 220 |11-7|.10 = 40

35

Esse resultado mostra que, em média, cada elemento da série está afastado de 7 de 2

unidades.

EXERCÍCIOS PROPOSTOS: 48. Seja a série X: 4, 16, 6, 10, 4, 13, 16, 18, 21, 20, calcule a moda e a amplitude total. Resolução:

Colocando a sequência em rol temos:

X:

Temos que a moda é: Mo:

E, portanto, a amplitude total será:

At = xmax - xmin = Resposta: At = 49. Seja a série X: 2, 10, 6, 8, 4, calcule a média aritmética e a amplitude total.

Resolução:

Colocando a sequência em rol temos:

X:

A expressão que calcula a média aritmética é:

que para este caso será:

36

E, portanto, a amplitude total será:

At = xmax - xmin = Resposta: At =

50. Seja a série X: 5, 5, 5, 5, 5, calcule a, moda, a média aritmética e a amplitude total. Resolução:

Colocando a sequência em rol temos:

X:

Temos que a média aritmética é:

e a moda é: Mo =

E, portanto, a amplitude total será:

At = xmax - xmin = Resposta: At = 51. Seja a série X: 6, 8, 5, 9, calcule a moda, a média aritmética e a amplitude total. Resolução:

Colocando a sequência em rol temos:

X:

Temos que a média aritmética é:

e a moda é: Mo =

E, portanto, a amplitude total será:

At = xmax - xmin = Resposta: At =

37

52. Calcule a moda, a média aritmética, a amplitude total e o DMS para a série abaixo.

Classe Núm. de acidentes/dia, xi Núm. de dias, fi Xi.fi

1 2 30

2 2 5

3 4 3

4 6 1

5 10 1

Resolução:

Temos que a Moda é: Mo =

A média aritmética é:

A amplitude total será:

At = xmax - xmin = Resposta: At =

Usando o resultado da tabela acima podemos calcular a média aritmética:

Para calcularmos o desvio médio simples, DMS, das variáveis discretas, xi ,

precisamos construir nova tabela, qual seja:

38

Classe Núm. de acidentes/dia, xi Núm. de dias, fi Xi.fi Xi- fi

1 2 30

2 2 5

3 4 3

4 6 1

5 10 1

Portanto, o desvio médio simples das variáveis discretas, xi,é:

Dessa forma, em média, cada elemento da série está afastado de

por ................. unidades.

53. Calcule a moda, a média aritmética, a amplitude total e o DMS para a série discreta abaixo.

Classe Xi fi 1 0 13

2 1 5

3 2 4

4 3 2

5 4 1

Resolução:

Temos que a Moda é: Mo =

A média aritmética é:

39

A amplitude total será:

At = xmax - xmin = Resposta: At =

Dividindo o resultado da tabela acima podemos calcular a média aritmética:

Para calcularmos o desvio médio simples, DMS, das variáveis discretas, xi ,

precisamos construir nova tabela:

Classe Xi fi Xi- fi

1 0 13

2 1 5

3 2 4

4 3 2

5 4 1

Portanto, o desvio médio simples das variáveis discretas, xi,é:

Dessa forma, em média, cada elemento da série está afastado de

por ................. unidades.

40

54. Calcule o DMS para a série abaixo (Variável Contínua)

Classe Interv Classe fi

1 5 |------ 10 10

2 10 |------ 15 5

3 15 |------ 20 10

4 20 |------ 25 5

5 25 |------ 30 10

Resolução:O número de elementos da série dada é

Para determinarmos a média da série devemos inserir nova tabela, agora com os xi

como os pontos médios entre os intervalos de classe, bem como com o respectivo

produto xi.fi .

Classe Interv Classe fi xi xi.fi .

1 5 |------ 10 10

2 10 |------ 15 5

3 15 |------ 20 10

4 20 |------ 25 5

5 25 |------ 30 10

Agora estamos em condições de calcular a média da distribuição contínua:

Para o cálculo do DMS devemos inserir uma nova coluna para a tabela acima, ou seja,

41

Classe Interv Classe fi xi xi.fi . Xi- fi

1 5 |------ 10 10

2 10 |------ 15 5

3 15 |------ 20 10

4 20 |------ 25 5

5 25 |------ 30 10

Portanto, o desvio médio simples das variáveis contínuas é:

Esse resultado mostra que, em média, cada elemento da série está afastado de ........

de ........ unidades.

EXERCÍCIOS PROPOSTOS: 55. Seja a série X: 2, 4, 6, 8, 20, 22, 24, 28, 29, 30. Calcule a moda e a amplitude total.

42

56. Seja a série X: 1, 3, 5, 7, 19, 17, 25, 13. Calcule a média aritmética e a amplitude total. 57. Seja a série X: 7, 7, 7, 5, 5, 17. Calcule a, moda, a média aritmética e a amplitude total. 58. Seja a série X: 1, 1, 1, 1, 6, 8, 2, 20. Calcule a moda, a média aritmética e a amplitude total.

43

59. Tema: Dados Brutos - Calcule o desvio médio simples da série:

X: 4, 6, 4, 16, 10.

60. Tema: Dados Brutos - Calcule o desvio médio simples da série:

X: 5, 5, 5, 7, 8.

61. Tema: Variável Discreta - Calcule o desvio médio simples, DMS, da série e

construa o histograma:

Classe Idade (anos), xi Núm. de alunos, fi

1 17 3

2 18 18

3 19 17

4 20 8

5 21 4

44

62. Tema: Variável Contínua – Calcule: a) A amplitude total, a moda e o DMS (variáveis contínuas) para a série abaixo.

b) Qual o número de classes, K ?

c) Qual a amplitude do intervalo de classe h ?

Classe Interv Classe fi 1 2 |------ 6 5

2 6 |------ 10 10

3 10 |------ 16 4

4 16 |------ 20 1

5 20 |------ 24 10

45

63. Tema: Variável Discreta - Como já foi visto, as variáveis discretas geralmente

assumem valores inteiros. Exemplo: Número de filhos de um casal, número de livros

da biblioteca da Faculdade.

Seja X: Número de erros por páginas encontrados na Monografia de um aluno em sua

tese de mestrado.

Número de erros por página da monografia

Número de Erros (Xi) Nº de páginas (fi)

1 20

2 15

3 17

4 13

5 11

6 9

Total 85

Xi: identifica as classes em que o evento se subdivide;

fi: freqüência absoluta, isto é, corresponde ao número de vezes que cada classe ocorre;

n: soma de todas fi = total de elementos observados na população.

a) Calcule a amplitude total, a moda e o DMS (variáveis discretas) para a série

acima.

b) Construa o respectivo histograma.

c) Interprete (afastamento de cada elemento da série com respeito à media.

46

10.3 Variância e Desvio Padrão.

Outro dado importante em estatística é obtido pela soma dos desvios ao quadrado. Em

cada classe o desvio é elevado ao quadrado e, em seguida, somado. A soma dos

quadrados dos desvios dividida pelo número de ocorrências é chamada de variância.

O desvio em relação à média aritmética possui o inconveniente do módulo no

cálculo. A média aritmética possui a propriedade: “A soma dos quadrados dos

desvios tomados em relação à média aritmética é um mínimo”. Com esta

propriedade resolvemos o problema de usar o módulo no cálculo.

Vamos mostrar que a soma algébrica dos desvios em relação à média é nula por

meio de um exemplo.

Exemplo 31: Uma propriedade da média – Supondo que as notas de um aluno

durante o ano foram:

X: 5, 7, 8, 8

Mostre que a soma dos desvios, em relação à média aritmética, é nula.

Resolução:

A média aritmética, como sabemos, é

Chamando de di = xi - , temos:

Classe Notas, xi Desvio:

1 5 5 – 7 = – 2

2 7 7 – 7 = 0

3 8 8 – 7 = 1

4 8 8 – 7 = 1

Temos portanto que:

47

Temos duas expressões para calcularmos a variância; dependendo do que os

dados representarem, se uma população ou uma amostra.

Se os dados representarem uma população a variância será denotada por:

em que n representa a média populacional.

Se os dados representarem uma amostra a variância será denotada por:

Neste caso a modificação se encontra no denominador onde n é trocado por n – 1.

Para amostras com n > 30 praticamente não há diferença entre uma e outra

equação. Vamos iniciar nossos cálculos de variância por meio de um exemplo

envolvendo dados que representam uma população (vide Exemplo 31). O motivo de

dividirmos por n-1 está relacionado ao fato de já termos usado a amostra para calcular

a média.

Exemplo 31: Variância de População – Supondo o seguinte conjunto de dados:

X: 5, 7, 8, 9, 6

Mostre que a soma dos desvios, em relação à média aritmética, é nula.

Resolução:

A média aritmética, como sabemos, é Vamos calcular os quadrados dos

desvios numa tabela:

48

A variância (população) será denotada por:

Portanto, a variância pedida é 2.

Exemplo 31: Variância de População – Supondo o seguinte conjunto de dados:

X: 5, 7, 8, 9, 6

Mostre que a soma dos desvios, em relação à média aritmética, é nula.

Resolução:A média aritmética, como sabemos, é Vamos calcular os quadrados

dos desvios numa tabela:

A variância (população) será denotada por:

Portanto, a variância pedida é 2.

Em geral, é usado ainda outra forma para o cálculo da variância. Dependendo de

como os dados são apresentados podemos usar esta nova expressão. Desenvolvendo

sua expressão chega-se a uma forma alternativa muito prática.

O exemplo a seguir ilustra uma aplicação da equação acima (cálculo simplificado).

Classe Notas, xi 1 5 4

2 7 0

3 8 1

4 9 4

5 6 1

Classe Notas, xi 1 5 4

2 7 0

3 8 1

4 9 4

5 6 1

49

Exemplo 32: (AFRF) – Os dados seguintes, ordenados do menor para o maior, foram

obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomada numa bolsa de

valores internacional. A unidade monetária é o dólar americano.

4,5,5,6,6,6,6,7,7,7,7,7,7,8,8,8,8,8,8,8,8,8,9,9,9,9,9,9,10,10,10,10,10,10,10,10,11,11,12,

12,13,14,15,15,15,16,16,18,23.

Os valores seguintes foram calculados para amostra:

e

Assinale a opção que corresponde à variância amostral, com aproximação de uma

cada decimal.

a) 14,0 b) 14,5 c) 13,6 d) 13,0 e) 15,0

Resolução:

Temos uma distribuição de dados, em rol, em que o tamanho da amostra é 50, ou

seja, n = 50.

A variância (S2) pode ser calculada pelo processo simplificado, devidos aos dados

fornecidos

50

Substituindo na equação acima os valores dados, teremos:

Portanto, S2 é aproximadamente 13, resposta c)

EXERCÍCIOS PROPOSTOS: 64. Calcule a variância do conjunto de dados:

Resposta:

65. Seis homens foram pesados, e os resultados em kg se encontram, em rol, na

coluna, Xi, da tabela abaixo:

Classe Xi di 1 56

2 62

3 63

4 64

5 66

6 67

Classe

Núm. de

acidentes/dia,

xi Desvio,

di 1 9 3,8

2 7 1,8

3 5 -0,2

4 3 -2,2

5 2 -3,2

51

Calcule a variância do conjunto de dados, Xi.

EXERCÍCIOS PROPOSTOS: 66. (ICMS) A variância do conjunto de dados:

A = {6, 10, 4, 8, 7} é igual a:

a) 1,25 b) 1,5 c) 2,0 d) 3,0 e) 4,0

Resolução:

A média aritmética dos Xi é

Calculando os quadrados dos desvios numa tabela:

A variância (população) será denotada por:

Portanto, a variância pedida é ................ Resposta:e)

Como a variância calculada a partir dos quadrados dos desvios, ela é um número

em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista

prático, é um inconveniente.

Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação

práticas, denominada desvio padrão, definida como a raiz quadrada da variância.

Do mesmo modo, temos, para o caso do desvio padrão, duas expressões

dependendo do que os dados representam, se uma população ou uma amostra.

Classe Ai=Xi 1 4

2 6

3 7

4 8

5 10

52

Se os dados representarem uma população o desvio padrão será denotada por:

em que n representa a média populacional.

Se os dados representarem uma amostra ele será denotada por:

Exemplo 33: (Desvio Padrão para dados brutos ou rol - População) –

Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma

população

Calcule o desvio padrão.

Resolução:

Calculando a média aritmética para os dados Xi apresentados temos o valor 6, em que

o número de elementos Xi é n = 5.

Inserindo uma nova tabela podemos calcular os desvios ao quadrado:

Classe xi

1 4

2 5

3 6

4 6

5 9

53

Classe xi di

1 4 4-6=-2

2 5 5-6=-1

3 6 6-6= 0

4 6 6-6= 0

5 9 9-6= 3

Usando a expressão

Quando se trata de dados tabelados devemos introduzir a freqüência nas

fórmulas. Vamos introduzir novas expressões para variável discreta, bem como, para

variável contínua.

Para o caso de variável discreta a variância e o desvio padrão, de uma

população, são calculados por

Para o caso ainda de variável discreta, a variância e o desvio padrão, de uma

amostra, são calculados por

54

e

Exemplo 34: (Variância e Desvio Padrão para variável discreta -

População) – Os dados seguintes, ordenados do menor para o maior, foram obtidos

de uma população

Classe xi fi

1 2 4

2 4 2

3 6 3

4 8 4

5 10 2

Calcule a variância e o desvio padrão da série acima.

Resolução:

A média da série é calculada por:

Para o cálculo da variância de uma população devemos usar a seguinte expressão:

Classe xi fi Xi .fi

1 2 4

2 4 2

3 6 3

4 8 4

5 10 2

55

Dessa forma devemos acrescentar na tabela acima outra coluna envolvendo o

numerador da expressão acima.

Classe xi fi Xi .fi

1 2 4

2 4 2

3 6 3

4 8 4

5 10 2

Agora estamos em condições de usar a expressão da variância para uma população

no caso de freqüência discreta:

O desvio padrão, , é a raiz quadrada da variância. Usando o resultado acima

temos:

________________________________________________________

Para o caso de variável contínua a variância de uma população, é calculado

por

em é o ponto médio da classe i. O desvio padrão, ainda para variável contínua de

população é

56

Para o caso de uma amostra de variável contínua, a variância e o desvio

padrão são calculados por

e o desvio padrão calculado como a raiz quadrada da variância

Algumas observações são necessárias. A variância será sempre dada no

quadrado da unidade de medida da série. Em alguns casos a unidade de variância nem

faz sentido, pois, podemos ter litros ao quadrado, entre outras. Isto nos impede de

compararmos o resultado da variância com os dados da série. Para resolver esta

dificuldade é que é introduzido o desvio padrão. Sendo ele a raiz quadrada da

variância, ele sempre será dado na mesma unidade de medida dos dados da série.

Exemplo 35: (Variância e Desvio Padrão para variável discreta -

Amostra) – Os dados seguintes, ordenados do menor para o maior, foram obtidos de

uma amostra:

Classe xi fi

1 1 26

2 2 9

3 5 2

4 6 5

57

Calcule a variância e o desvio padrão da série que representa uma amostra.

Resolução:

A média da série é calculada por:

Para o cálculo da variância de uma população devemos usar a seguinte expressão:

Logo, devemos acrescentar na tabela acima uma outra coluna envolvendo o

numerador da expressão acima.

Classe xi fi

1 1 26

2 2 9

3 5 2

4 6 5

Com isto estamos em condições de calcular a variância da amostra:

Classe xi fi Xi .fi

1 1 26

2 2 9

3 5 2

4 6 5

58

EXERCÍCIOS PROPOSTOS: 67. (Processo Simplificado) Usando a expressão abaixo

escolha a opção que representa o resultado da variância para os dados referentes a

uma amostra

X: 3, 4, 6, 8, 9, 10

a) 7,8 b) 8,8 c) 5,8 d) 7,0 e) 6,0

(obs.: Para facilitar use a tabela a seguir)

Classe xi 1

2

3

4

5

6

68. (Dados Tabelados de População) Considerando os dados tabelados de uma

população, escolha a opção que represente o resultado do desvio padrão.

Classe xi fi Xi .fi 0 3

1 5

2 11

3 8

4 3

Use a expressão

59

a) 2,2 b) 1,1 c) 2,5 d) 1,5 e) 3

69. (Distribuição contínua) Considerando os dados tabelados de uma população,

escolha a opção que represente o resultado do desvio médio e desvio padrão,

respectivamente.

Classe Interv Classe fi xi xi.fi . Xi- fi 1 2 |------ 4 5 3

2 4 |------ 6 9 5

3 6 |------ 8 5 7

4 8 |------ 10 1 9

Obs.: Usar as expressões:

(Para o cálculo da média)

O desvio médio simples para variáveis contínuas é dado por:

E para o cálculo do desvio padrão:

a) 1,25 e 1,76 b) 1,5 e 1,96 c) 2,0 e 1,66 d) 1,28 e 1,96 e) 1,28 e 1,66

60

70. Um educador realizou o levantamento das notas dos alunos em CIENCIAS, e

observou que o GRAU MÍNIMO ERA UM e o GRAU MÁXIMO OITO, conforme os

dados em rol:

X: 1,2,3,4,5,6,7,8.

Pelo exposto escolha a opção mais coerente para as seguintes medidas do DESVIO

PADRÃO e VARIÂNCIA ABSOLUTA, respectivamente é:

a) 5 e 20 b) 3 e 9 c) 0,8 e 16 d) 4 e 8 e) n.d.a.

71. Os tempos despendidos por 12 alunos (N = 12), em segundos, para percorrer

certo trajeto, sem barreira, foram 16, 17, 16, 20, 18, 16, 17, 19, 21, 22, 16, 23.

Determine o valor, sem agrupar os dados: da moda, mediana e média;

obs.: use a tabela abaixo para os cálculos.

Classe Dados Brutos xi (rol)

1 16

2 17

3 16

4 20

5 18

6 16

7 17

8 19

9 21

10 22

11 16

12 23

72. Os tempos despendidos por 12 alunos (N = 12), em segundos, para percorrer

certo trajeto, sem barreira, foram 16, 17, 16, 20, 18, 16, 17, 19, 21, 22, 16, 23.

Determine o valor da variância.

a) 6,75 b) 7,75 c) 8,75 d) 9,75 e) 5,75

Sugestão para o cálculo:

1) Calcule a média aritmética para os dados Xi apresentados. Lembre-se: n = 12.

2) Com nova tabela calcule os desvios ao quadrado;

61

3) Usar a expressão da variância

para dados brutos ou rol:

73. Considere uma população de 40 profissionais liberais que foram, questionados

sobre o número de revistas e/ou jornais que os mesmos são assinantes, obteve-se a

seguinte tabela:

Nº de Publicações Nº de Profissionais

0 6

1 8

2 12

3 10

4 4

∑ 40

O desvio padrão para o caso acima é:

a) 1,6 b) 1,4 c) 1,2 d) 1,0 e) 1,8

74. Em certo dia foi realizado um levantamento a respeito das idades dos alunos de um curso noturno, obtendo-se a tabela abaixo:

Classe Dados Brutos xi (rol) 1 16

2 17

3 16

4 20

5 18

6 16

7 17

8 19

9 21

10 22

11 16

12 23

62

Idades (anos) Nº de Alunos

16 |- 20 8

20 |- 24 16

24 |- 28 12

28 |- 32 4

∑ 40

Considerando esta turma como uma população, determine a variância absoluta:

a) 12,96 b) 11,46 c) 12,26 d) 11,36 e) 13,48

O desvio padrão é um valor positivo, e, portanto, indica uma distância entre os

valores medidos e a média.

Pelo menos 75% dos valores em uma população estão dentro do intervalo [μ - 2σ,

μ + 2σ], onde μ denota a média e σ denota o desvio padrão;

Em uma distribuição normal, cerca de 95% dos valores da população estão dentro

do intervalo acima.

Concluindo esta parte, vimos que o desvio-padrão mede a variação entre valores.

Assim, se os valores estiverem próximos uns dos outros, então o desvio-padrão será

pequeno, e conseqüentemente os dados serão homogêneos. Se, no entanto, os valores

estiverem distantes uns dos outros, então o desvio-padrão será grande, e,

conseqüentemente, os dados serão heterogêneos.

A desvantagem do uso da variância perante o uso do desvio-padrão é que a unidade

de medida utilizada é igual ao quadrado da unidade de medida dos dados.

O desvio-padrão é, sem dúvida, a mais importante das medidas de dispersão e é

vital que o pesquisador consiga relacionar o valor obtido através da fórmula, com os

dados da série.

63

Quando uma curva de freqüência representativa de uma série é perfeitamente

simétrica o significado do erro padrão da média de um dado conjunto de n medidas é

que o valor médio tem 68% de chance de estar dentro do intervalo em torno do

valor verdadeiro ; 95% de estar no intervalo , etc.

O desvio padrão é o correspondente à incerteza estatística de uma única medida

realizada. Cada medida, além da incerteza instrumental, possui uma incerteza

estatística dada pelo desvio padrão.

11. Probabilidades.

A história da teoria das probabilidades, teve início com os jogos de cartas, dados

e de roleta. Esse é o motivo da grande existência de exemplos de jogos de azar no

estudo da probabilidade. A teoria da probabilidade permite que se calcule a chance de

ocorrência de um número em um experimento aleatório.

11.1 Conceitos Básicos:

O estudo da probabilidade envolve conceitos como o de espaço-amostral,

evento, lei binomial entre outros. Veremos os principais conceitos, bem como, as

experiências de caráter aleatório.

11.2 Experimento aleatório

É aquele experimento que quando repetido em iguais condições, podem fornecer

resultados diferentes, ou seja, são resultados explicados ao acaso. Quando se fala de

tempo e possibilidades de ganho na loteria, por exemplo, a abordagem envolve cálculo

64

de experimento aleatório. Os experimentos aleatórios têm resultados imprevisíveis.

Exemplos:

O sorteio de uma carta de um baralho;

O sorteio de um certo número da loteria federal;

O resultado do lançamento de um dado ou moeda, etc.

11.3 Espaço Amostral e Evento

É o conjunto de todos os resultados possíveis de um experimento aleatório. A

letra que representa o espaço amostral, é S e o número de seus elementos n(E).

Dessa forma, no espaço amostral E escrevemos todas as possibilidades e após

contarmos o número dessas possibilidades teremos o valor de n(E). Vejamos alguns

exemplos:

Exemplo 36: (Espaço Amostral e número de seus elementos) – Os

exemplos seguintes se referem a escrever na forma de um conjunto o Espaço

Amostral e a respectiva quantidade que representa o número de seus elementos, n(E).

Escreva o espaço amostral e o número de seus elementos, n(E) nos seguintes casos:

a) Lançamento de um dado:

E = {1,2,3,4,5,6} n(E) = 6

b) Lançamento de uma moeda:

E = { , } n(E) =

c) No lançamento de uma moeda duas vezes em seguida, representado por k a

ocorrência cara e por c a ocorrência coroa:

E = { } n(E) = 4

65

Exemplo 37: (Espaço Amostral) – Considere o experimento: “Registrar as faces

voltadas para cima em 3 lançamentos de uma moeda” . Escrever na forma de um

conjunto o Espaço Amostral e a respectiva quantidade que representa o número de

seus elementos, n(E).

Resolução:

E = {(k,k,k); (k,k,c); (k,k,k); (k,c,k); ... }

n(E) = 8

Exemplo 38: (Espaço Amostral) – Considere o experimento: “Anotar o sexo dos

filhos de um casal conforme a sequência de nascimento” . Escrever na forma de um

conjunto, E, o Espaço Amostral e a respectiva quantidade que representa o número

de seus elementos, n(E), considerando que o casal tenha, utilizando H para filho e M

para filha:

a) 1 filho:

Resposta: E = {(H,M)} n(E) = 1

b) 2 filhos:

Resposta: E = {(H,H); (H,M); (M,H); (M,M)} n(E) = 4

c) 3 filhos:

Resposta: E = {(H,H,H); (H,H,M); (H,M,H); ... }

n(E) = 8

Exemplo 39: (Espaço Amostral) – Dada uma urna com 4 bolas numeradas de 1 a 4.

Considere:

a) A retirada de 1 bola;

66

Resolução:

Ao retirarmos 1 bola teremos 4 possibilidades, ou seja, pode sair qualquer uma das 4

bolas, e o espaço amostral será:

E = {1,2,3,4} n(E) = 4.

b) A retirada de 2 bolas e sem repetição;

Resolução:

Ao retirarmos 2 bolas (sem reposição) podemos ter que a bola de número 1 saia

primeiro e, a seguir, a bola 2, 3, ou 4, pois não temos repetição. No caso de sair

primeiro a bola de número 2 teremos que a seguinte será a bola de número 1, 3 ou 4.

Fazendo este procedimento teremos o espaço amostral

E = {(1,2);(1,3);(1,4);(2,1);(2,2);(2,3);(2,4); ... }

n(E) = 12.

EXERCÍCIOS PROPOSTOS: 75. (Evento) Descreva o evento “lançamento de uma moeda 3 vezes seguidas ocorreu

duas vezes cara”.

67

76. (Evento) Dada uma urna com 100 dezenas de 00 até 99, considere o experimento

“sortear dezenas de algarismos iguais”. Descreva o espaço amostral e o número n(E).

11.4 Probabilidade

Estudaremos a expressão que permitirá o cálculo da probabilidade de um evento

ocorrer.

Dado um espaço amostral E, com n(E) elementos, e um evento A de E, com

n(A) elementos denomina-se probabilidade de ocorrência do evento A ao número

P(A) dado por:

Como A E e 0 n(A) n(E) é fácil mostrar que:

Exemplo 40: (Probabilidade) – Vamos calcular a probabilidade de, jogando um

dado ideal, obter um número maior que 4.

Resolução:

espaço amostral: E = {1,2,3,4,5,6}

68

O espaço amostral mostra todas as possibilidades do resultado quando jogamos um

único dado.

Para obtermos um número maior que 4 temos que este evento chamaremos de A:

Evento A = {5,6}

Assim, temos duas possibilidades, n(E) = 2 para os números serem maiores que 4.

Usando a fórmula que nos dá o cálculo da probabilidade para este evento A ocorrer:

Exemplo 41: (Probabilidade) – Dispondo amos calcular a probabilidade de, jogando

um dado ideal, obter um número menor que 4.

Resolução:

espaço amostral: E = {1,2,3,4,5,6}

Evento A = { }

n(E) =

n(A) =

EXERCÍCIOS PROPOSTOS:

77. (Probabilidade) Numa urna há 20 bolas numeradas de 1 a 20. Uma bola é retirada

ao acaso. Calcule a probabilidade de ela ser ímpar.

69

78. (Probabilidade) Numa urna há 20 bolas numeradas de 1 a 20. Uma bola é retirada

ao acaso. Calcule a probabilidade de ela ser um número múltiplo de 3.

11.5 Combinação e Arranjo

Vamos estabelecer algumas diferenças entre arranjos e combinações. Os

arranjos são caracterizados pela natureza e pela ordem dos elementos escolhidos. Já as

combinações são caracterizadas pela natureza dos elementos.

Combinação: A ordem não é importante

Arranjos: A ordem é importante

Em problemas envolvendo doces, por exemplo, um pacote com tortas de

chocolate, morango e limão será o mesmo caso troquemos a ordem. Tais casos se

constituem num problema de Combinação. No entanto, se tivermos conjuntos de

centenas sabemos que a ordem é importante, pois, o número 321 é diferente de 123 ou

231.

Para o cálculo envolvendo arranjos e combinação devemos entender primeiro a

noção de fatorial.

70

Fatorial:

O produto n.(n – 1).(n – 2)....3.2.1 é chamado de n!

Vejamos alguns exemplos simples:

Temos ainda a seguinte definição:

A expressão da combinação de n elementos tomados p a p é:

Exemplo 42: (Combinação) – Calcule o valor da expressão .

Resolução:

201.2.3.1.2.3

1.2.3.4.5.6

)!36(!3

!66

3

C

Resolva: Calcule os itens abaixo:

a)

b)

71

Exemplo 43: (Combinação) – Calcule o valor da expressão .

Resolução:

Exemplo 44: (Combinação) – Calcule o valor da expressão .

Resolução:

A expressão para o cálculo do arranjo simples de n elementos tomados p a p é:

Exemplo 45: (Arranjo) – Calcule o valor da expressão .

Resolução:

1201.2.3

1.2.3.4.5.6

)!36(

!66

3

A

Exemplo 46: (Arranjo) – Calcule o valor da expressão .

Resolução:

Exemplo 47: (Arranjo) – Calcule o valor da expressão .

Resolução:

72

EXERCÍCIOS PROPOSTOS: 79. (Arranjo e Combinação) Nas situações envolvendo problemas de contagem

podemos utilizar o PFC (Princípio Fundamental da Contagem). Mas em algumas

situações os cálculos tendem a se tornar complexos e trabalhosos. Visando facilitar o

desenvolvimento de tais cálculos, alguns métodos e técnicas foram desenvolvidos no

intuito de determinar agrupamentos nos problemas de contagem, consistindo nos

Arranjos e nas Combinações.

Vamos estabelecer algumas diferenças entre arranjos e combinações. Os arranjos são

caracterizados pela natureza e pela ordem dos elementos escolhidos. Já as

combinações são caracterizadas pela natureza dos elementos.

Usando as fórmulas:

)!(

!

)!(!

!

kn

n

knk

n

A

C

n

k

n

k

Para os valores das expressões abaixo, casos a) e b),

a)

b)

73

80. (Arranjo) Quantos números de 3 algarismos podemos formar com os algarismos

1,2,3,4,5 e 7, sem repeti-los?

81. (Combinação) Quantas comissões constituídas de 3 pessoas podem ser formadas

com 5 pessoas ?

82. (Arranjo e Combinação) Calcule a soma:

74

EXERCÍCIOS PROPOSTOS:

83. (TRF) Considere a seguinte distribuição das freqüências absolutas dos salários

mensais, em R$, referentes a 200 trabalhadores de uma indústria (os intervalos são

fechados à esquerda e abertos à direita).

Classes de Salários : Freqüências Absolutas de

R$ 400 até R$ 500 : 50

de R$ 500 até R$ 600: 70

de R$ 600 até R$ 700 :40

de R$ 700 até R$ 800 : 30

de R$ 800 até R$ 900: 10

Sobre essa distribuição de salários é correto afirmar que:

a) O salário modal encontra-se na classe de R$ 800 até R$ 900.

b) O salário mediano encontra-se na classe de R$ 600 até R$ 700.

c) O salário modal encontra-se na classe de R$ 600 até R$ 700.

d) O salário modal encontra-se na classe de R$ 700 até R$ 800.

e) O salário mediano encontra-se na classe de R$ 500 até R$ 600.

Dica do Professor: Complete a tabela integralmente e use a fórmula da média para este tipo de distribuição.

Classe Interv Classe fi xi xi.fi .

1 400|------ 500

2 |------ 70

3 |------ 750

4 700|------ 800

5 |------

75

84. (TRF) Sobre a moda de uma variável, é correto afirmar que:

a) para toda variável existe uma e apenas uma moda.

b) a moda é uma medida de dispersão relativa.

c) a moda é uma medida não afetada por valores extremos.

d) em distribuições assimétricas, o valor da moda encontra-se entre o valor da média

e o da mediana.

e) sendo o valor mais provável da distribuição, a moda, tal como a probabilidade,

pode assumir valores somente no intervalo entre zero e a unidade.

85. (Auditor FGV) - Numa sala estão reunidos quatro auditores e seis fiscais. Se três

dessas pessoas forem aleatoriamente sorteadas para formar uma comissão, a

probabilidade de que a comissão seja composta por dois auditores e um fiscal é igual

a:

a) 0,1

b) 0,2

c) 0,3

d) 0,4

e) 0,5

Gabarito: c

Resolução:

A probabilidade corresponde ao produto de duas combinações (a ordem não é

importante) dividido pela combinação de 10 classe 3. Mostre que o resultado é:

P = C(4;2).C(6;1)/C(10;3) = 36/120 = 0,3

76

86. (Unicamp 96) Para um conjunto X = {x1, x2, x3, x4} a média aritmética de X é definida por:

e a variância de X é definida por:

Dado o conjunto X = {2, 5, 8, 9}, pede-se:

a) Calcular o média aritmética de X.

b) Calcular a variância de X.

c) Represente a expressão para a média e para a variância acima na forma de

somatório.

77

87. (Fiscal de Tributos Estaduais - 2002) “Uma empresa do ramo de construção civil

contratou 200 operários para executar uma obra de 100.000 m2 em 12 meses. A

tabela abaixo apresenta a distribuição dos salários semanais brutos – S – dos 200

operários.”

função Salário semanal bruto (S) Número de operários

F1 R$100,00 < S < R$140,00 50

F2 R$140,00 < S < R$160,00 80

F3 R$160,00 < S < R$240,00 40

F4 R$240,00 < S < R$360,00 30

Total 200

Para cada função, essa empresa apresenta ainda as seguintes estatísticas sobre o

salário semanal bruto por função.

função Média Mediana

F1 R$ 130,00 R$ 120,00

F2 R$ 150,00 R$ 145,00

F3 R$ 170,00 R$ 200,00

F4 R$ 290,00 R$ 280,00

Considerando os dados fornecidos acima, julgue com (V) ou (F) os itens abaixo:

1) O salário médio semanal bruto dos operários dessa empresa é igual a R$175,00.

( )

2) O primeiro quartil da distribuição dos salários é igual a R$140,00.

( )

3) A mediana da distribuição dos salários é igual a R$152,50.

( )

78

88. (CESPE-UnB) Alda tem 2/5 mais livros que Beatriz e esta, 2/3 , mais que Carla que,

por sua vez, tem 8 livros a menos que Alda. Com base nessas informações, julgue as

afirmativas seguintes.

1) As três juntas, têm 30 livros

2) Carla tem 6 livros

3) Beatriz tem 14 livros.

4) Alda tem 10 livros.

5) O número de livros que Alda tem a mais que Beatriz é igual ao número de livros

que Beatriz tem a mais que Carla.

GABARITO: 1), 2) e 5) CERTAS

3) e 4) ERRADAS

89. Num quartel, constatou-se que o peso médio de 40 soldados era de 69 Kilos.

Posteriormente, verificou-se que a balança estava desregulada, ocasionando um

peso indicado superior em 15 gramas ao peso verdadeiro. Qual era a média

verdadeira dos pesos dos soldados?

79

90. Os dados abaixo se referem ao salário (em salários mínimos) de 20 funcionários administrativos em uma indústria.

10,1 7,3 8,5 5 4,2

3,1 2,2 9,0 9,4 6,1

3,3 10,7 1,5 8,2 10,0

4,7 3,5 6,5 8,9 6,1

a) construa uma tabela de frequência agrupando os dados em intervalos de

amplitude 2 a partir de 1;

b) construa o histograma. c) Usando o critério da raiz determine a frequência relativa percentual de cada classe. Use a tabela a seguir.

Classe Interv Classe fi

80

91. Uma pesquisa com usuários de transporte coletivo na cidade de São Paulo

indagou sobre os diferentes tipos usados nas suas locomoções diárias. Dentre

ônibus, metro e trem, o número de diferentes meios de transporte utilizados

foi o seguinte: X: 2, 3, 2, 1, 2, 1, 2, 1, 2, 3, 1, 1, 1, 2, 2, 3, 1, 1, 1, 1, 2, 1, 1, 2, 2, 1, 2, 1, 2, 3. a) organize uma tabela de frequência;

Classe Num. de transp., xi fi

1

2

3

b) faça uma representação gráfica (histograma fi versus xi);

c) admitindo que essa amostra represente bem o comportamento do usuário paulistano,

você acha que a porcentagem dos usuários que utilizam mais de um tipo de transporte é

grande?

Classe Interv Classe fi

81

92. TABELA I

Classe Interv Classe fi xi xi.fi . Fi 1 0 |------ 6 39

2 6 |------ 12 41

3 12 |------ 18 38

4 18 |------ 24 40

5 24 |------ 30 42

TABELA II

De acordo com os dados das tabelas I e II acima responda:

1) Qual a amplitude do intervalo, h, da tabela I?

2) Qual a amplitude do intervalo, h, da tabela I?

3) Qual o tipo de distribuição das Tabelas I e II ?

4) Calcule a soma das freqüências em cada tabela.

5) Calcule a soma do produto Xi . fi em cada tabela.

6) Calcule a média aritmética em cada tabela.

7) Complete as colunas Fi em cada tabela.

8) Qual o nome deste tipo de freqüência, Fi ?

9) Qual o valor da soma dos Fi em cada tabela ?

10) Calcule o DMS.

11) Supondo que estes dados representem uma população calcule a variância e o

desvio padrão em cada tabela.

Classe Interv Classe fi xi xi.fi . Fi 1 0 |------ 10 22

2 10 |------ 20 40

3 20 |------ 30 71

4 30 |------ 40 44

5 40 |------ 50 23

82

Alfabeto Grego e o correspondente Alfabeto Latino

Minúsculas:

a b c d e f g h i j k l m n o p q r s t u v x y w z

Maiúsculas:

a b c d e f g h i j k l m n o p q r s t u v x y w z

Neste curso usamos a letra grega sigma, para representar o somatório.

Um somatório é um operador matemático que nos permite representar

facilmente somas muito grandes ou até infinitas É representado com a letra

grega sigma ( Σ ), e é definido por:

O alfabeto latino ou romano, é o sistema de escrita alfabética mais

utilizado no mundo.

________________________________________________________