probabilidade e estatÍstica - marcelosucena.com.br probabilidade e estatistica... · 1.6...
Post on 03-Dec-2018
218 Views
Preview:
TRANSCRIPT
PROBABILIDADE E
ESTATÍSTICA
Gráfico 4.1. Produção de Arroz do Município X - 1984-1994
0
500
1000
1500
2000
2500
84 85 86 87 88 89 90 91 92 93 94
(1000 ton)
Luiz Roberto M. Bastos 2005
Probabilidade e Estatística Luiz Roberto
SUMÁRIO
1 TEORIA DOS CONJUNTOS NUMÉRICOS ..................... 5
5
5
6
7
8
11
12
12
13
14
17
17
18
19
23
23
25
27
28
33
34
34
35
1.1 Introdução .......................................
1.2 Símbolos .........................................
1.3 Noções sobre Conjuntos ...........................
1.4 Conjunto dos Números Naturais (N) ................
1.5 Conjunto dos Números Inteiros (Z) ................
1.6 Representação decimal das frações ................
1.7 Conjunto dos Números Irracionais .................
1.8 Conjunto dos Números Reais (R) ...................
1.9 Intervalos .......................................
1.10 Problemas com número finito de elementos .........
2 ANÁLISE COMBINATÓRIA ...............................
2.1 Introdução .......................................
2.2 Fatorial de um número natural ....................
2.3 Princípio fundamental da contagem - PFC ..........
2.4 Arranjos simples .................................
2.5 Cálculo do número de arranjos ....................
2.6 Permutações simples ..............................
2.7 Permutações com elementos repetidos ..............
2.8 Combinações simples ..............................
2.9 Exercícios .......................................
3 PROBABILIDADE .......................................
3.1 Experimento aleatório ............................
3.2 Espaço amostral ..................................
2
Probabilidade e Estatística Luiz Roberto
36
36
38
38
43
45
46
48
48
49
50
52
52
52
53
54
55
56
56
57
58
58
59
59
60
61
3.3 Evento ...........................................
3.4 Probabilidade de um Evento .......................
3.5 Evento complementar ..............................
3.6 Probabilidades em espaços amostrais equiprováveis
3.7 Probabilidade da união de dois eventos ...........
3.8 Experiência Composta .............................
3.9 Probabilidade condicional ........................
4 ESTATÍSTICA BÁSICA ..................................
4.1 Conceitos fundamentais ...........................
4.2 Divisão da estatística ...........................
4.3 População ........................................
4.4 Amostragem .......................................
4.5 Amostra ..........................................
4.6 Censo ............................................
4.7 Tipos de variáveis ...............................
4.8 Definição do problema ............................
4.9 Definição dos objetivos (geral e específico) .....
4.10 Planejamento ......................................
4.11 Coleta dos dados ..................................
4.12 Crítica dos dados .................................
4.13 Apuração (armazenamento) dos dados ................
4.14 Exposição ou apresentação dos dados ...............
4.15 Análise e interpretação dos dados .................
4.16 Regras de arredondamento ..........................
4.17 Série temporal, histórica ou cronológica ..........
4.18 Gráficos estatísticos .............................
3
Probabilidade e Estatística Luiz Roberto
62
62
63
65
66
67
68
69
74
75
76
79
79
81
82
83
84
88
88
88
91
4.19 Principais tipos de gráficos ......................
4.19.1 Gráficos em curvas ou em linhas ...................
4.19.2 Gráficos em colunas ...............................
4.19.3 Gráficos em barras ...............................
4.19.4 Gráfico em colunas múltiplas (agrupadas) .........
4.19.5 Gráfico em barras múltiplas (agrupadas) ..........
4.19.6 Gráfico em setores ...............................
4.20 Distribuição de freqüências ......................
4.21 Distribuições cumulativas ........................
4.22 Medidas de posição (ou de tendência central) .....
4.22.1 Média aritmética .................................
4.22.2 Esperança matemática ............................
4.22.3 Moda (mo) .......................................
4.22.4 Mediana (md) ....................................
4.22.5 Medidas de dispersão (medidas de variabilidade) .
4.22.6 Variância .......................................
4.22.7 Desvio-padrão ...................................
4.23 Distribuições discretas de probabilidade ........
4.23.1 Distribuição de “bernoulli” .....................
4.23.2 Distribuição binomial ...........................
BIBLIOGRAFIA ...........................................
4
Probabilidade e Estatística Luiz Roberto
1 TEORIA DOS CONJUNTOS NUMÉRICOS 1.1 Introdução
Conjuntos numéricos são certos conjuntos cujos elementos são números que guardam entre si alguma característica comum. Tais conjuntos possuem elementos perfeitamente caracterizados e, dentre eles, o conjunto dos números naturais, dos inteiros, dos racionais, dos irracionais e, por fim, o dos números reais. O conjunto dos números naturais surgiu da necessidade de se contarem os objetos; os outros foram surgindo com ampliações do conjunto dos números naturais. Para se trabalhar com conjuntos, são adotados símbolos que representam os relacionamentos entre eles. 1.2 Símbolos
: pertence : existe
: não pertence : não existe
: está contido : para todo (ou qualquer que seja)
: não está contido : conjunto vazio N
: contém N: conjunto dos números naturais
: não contém Z : conjunto dos números inteiros
I : tal que Q: conjunto dos números racionais
: implica que Q'= I: conjunto dos números irracionais
: se, e somente se R: conjunto dos números reais
: pertence : existe
∨ : ou : e ∧
Símbolos sobre Operações
: A intersecção B a > b: a maior que b
: A união B : a maior ou igual a b
a - b: diferença de a com b : a e b
a < b: a menor que b : a ou b
: a menor ou igual a b ≠ : Diferente
5
Probabilidade e Estatística Luiz Roberto
1.3 Noções sobre Conjuntos
Conjunto vazio: é um conjunto que não possui elementos. O conjunto
vazio é representado por ou .
Subconjuntos: quando todos os elementos de um conjunto A qualquer
pertencem a um outro conjunto B, diz-se, então, que A é um subconjunto de B,
ou seja A B.
Obs.: Todo o conjunto A é subconjunto dele próprio, ou seja ;
- O conjunto vazio, por convenção, é subconjunto de qualquer conjunto,
ou seja
União de Conjuntos: dados os conjuntos A e B, define-se como união dos
conjuntos A e B ao conjunto representado por , formado por todos os
elementos pertencentes a A ou B, ou seja: .
Intersecção de Conjuntos: dados os conjuntos A e B, define-se como
intersecção dos conjuntos A e B ao conjunto representado por , formado
por todos os elementos pertencentes a A e B, simultaneamente, ou seja:
Diferença de Conjuntos: dados os conjuntos A e B, define-se como
diferença entre A e B (nesta ordem) ao conjunto representado por A-B, formado
por todos os elementos pertencentes a A, mas que não pertencem a B, ou seja
6
Probabilidade e Estatística Luiz Roberto
1.4 Conjunto dos Números Naturais (N)
N é o conjunto dos números naturais:
N = 0, 1, 2, 3, 4, 5, ..., n, ...
Onde n representa o elemento genérico do conjunto.
Sempre que possível, procuraremos destacar o elemento genérico do
conjunto em questão.
Quando houver “...” ao final dos elementos de um conjunto, trata-se de
um conjunto de infinitos elementos, como acontece com N.
O conjunto N pode ser representado geometricamente por meio de uma reta
numerada; escolhemos sobre essa reta um ponto de origem (correspondente ao
número zero), uma medida unitária e uma orientação (geralmente para a
direita).
unidade
O conjunto dos números naturais possui alguns subconjuntos importantes:
1° O conjunto dos números naturais não nulos
N* =1, 2, 3, 4, 5, ..., n, ...
N* = N - 0 Utilizamos o * (asterisco) à direita do nome do conjunto do qual se
quer suprimir o elemento zero.
2° O conjunto dos números naturais pares:
Np=0, 2, 4, 6, ..., 2n, ... n ∈ N
3° O conjunto dos números naturais ímpares:
Ni=1, 3, 5, 7, ..., 2n+1, ... n ∈ N
7
Probabilidade e Estatística Luiz Roberto
4° O conjunto dos números primos:
Pi=2, 3, 5, 7, 11, 13 ...
No conjunto dos números naturais estão definidas duas operações: adição
e multiplicação. Note que adicionando ou multiplicando dois elementos
quaisquer de N, a soma ou o produto pertence igualmente a N. Em símbolos,
temos:
m,n N, m + n N e m * n N Essa característica pode ser sintetizada na frase:
“N é fechado em relação à adição e à multiplicação”.
1.5 Conjunto dos Números Inteiros (Z)
Z=..., -3, -2, -1, 0, 1, 2, 3,...
Todos os elementos de N pertencem também a Z, o que vale dizer que N é
subconjunto de Z:
N Z ou Z N
Temos também outros subconjuntos de Z:
Z* = Z - 0 Z* = ..., -4, -3, -2, -1, 1, 2, 3, 4, ...
Z+ = 0,1,2,3,4,5,... conjunto dos inteiros não negativos
Z *+ = 1,2,3,4,5,... conjunto dos inteiros positivos
Z_ = ..., -4, -3, -2, -1, 0 conjunto dos inteiros não positivos
Z * = ..., -4, -3, -2, -1 conjunto dos inteiros negativos __
Observe que Z+ = N.
8
Probabilidade e Estatística Luiz Roberto
Números Opostos
Dois números inteiros são ditos opostos um do outro quando apresentam
soma zero; assim, os pontos que os representam distam igualmente da origem
(zero).
Considerando os números inteiros ordenados sobre uma reta, podemos
tomar como exemplo o número 2.
O oposto de 2 é –2, e o oposto de –2 é 2, pois:
2 + (-2) = -2 + 2 = 0
2 unidades 2 unidades
No geral, dizemos que o oposto (ou simétrico) de a é -a., e vice-versa;
particularmente, o oposto de zero é o próprio zero.
Módulo de um número inteiro
Damos o nome de módulo, ou valor absoluto de a, à distância da origem
ao ponto que representa o número a.
Conjunto dos Números Racionais (Q)
O conjunto Z é fechado em relação às operações adição, multiplicação e
subtração, mas o mesmo não acontece à divisão: embora
(-12):(+4) = -3 Z,
não existe número inteiro x para o qual se tenha x = (+4) : (-12). Por esse
motivo, fez-se uma ampliação do conjunto Z, da qual surgiu o conjunto dos
números racionais.
O conjunto dos números racionais é inicialmente descrito como o
conjunto dos quocientes entre dois números inteiros.
Os números racionais são todos aqueles que podem ser colocados na forma
de fração (com o numerador e denominador Z), ou seja, o conjunto dos
números racionais é a união do conjunto dos números inteiros com as frações
positivas e negativas.
9
Probabilidade e Estatística Luiz Roberto
,...,...,52,
32,2,....
31 ,
21,1 0, Q
qp
±±±±±±±= I p e q inteiros e q ≠ 0
Utilizando o elemento genérico, podemos dizer que:
qp Q = I p Z e q Z*
Desta forma, podemos definir Q como o conjunto das frações qp; assim,
um número é racional quando pode ser escrito como uma fração qp, com p e q
inteiros e q ≠ 0.
Quando q = 1, temos qp =
1p = p Z, de onde se conclui que Z é
subconjunto de Q.
Assim, podemos construir o diagrama:
N Z Q
No conjunto Q destacamos os seguintes sub-conjuntos:
Q * : conjunto dos racionais não nulos
Q+ : conjunto dos racionais não negativos
Q * : conjunto dos racionais positivos +
Q : conjunto dos racionais não positivos _
Q * : conjunto dos racionais negativos _
O conjunto Q é fechado para as operações adição, subtração,
multiplicação e divisão.
10
Probabilidade e Estatística Luiz Roberto
Exemplos:
33
22
111 )
39
26
133)
===
−=
−=
−=−
b
a
Assim, podemos escrever:
p
1.6
Para
denom
1°) O
algar
21
Tais
2°) O
todos
31=
221=
0 e , com , | ≠∈∈== qZqZpq
xxQ
Representação decimal das frações
qpTome um número racional , tal que p não é múltiplo de q.
escrevê-lo na forma decimal, basta efetuar a divisão do numerador pelo
inador. Nessa divisão podem ocorrer dois casos:
número decimal obtido possui, após a vírgula, um número finito de
ismos (não nulos):
75,32075 25,1
45 5,0 =−=−=
números racionais são chamados decimais exatos.
número decimal obtido possui, após a vírgula, infinitos algarismos (nem
nulos), que se repetem periodicamente:
0,333... = 0,3 79= 0,777... = 0,7
0,0454545... = 0,045 66
167= 2,5303030... = 0,530
11
Probabilidade e Estatística Luiz Roberto
Toda decimal exata ou periódica pode ser representada na forma de
número racional.
1.7 Conjunto dos Números Irracionais (I)
Os números irracionais são decimais infinitas não periódicas, ou seja,
os números que não podem ser escritos na forma de fração (divisão de dois
inteiros).
Vejamos alguns exemplos:
1. O número 0,212112111... não é dízima periódica, pois os algarismos
após a vírgula não se repetem periodicamente.
2. O número 0,203040... também não comporta representação
fracionária, pois não é dízima periódica.
3. Os números
= 1,7320508… 3 = 1,4142136… e 2 π=3,1415926535... ,
por não apresentarem representação infinita periódica, também não são números
racionais.
1.8 Conjunto dos Números Reais (R)
Dados os conjuntos dos números racionais (Q) e dos irracionais (I),
definimos o conjunto dos números reais como:
R = Q ∪ I = x | x é racional ou x é irracional
O diagrama abaixo mostra a relação entre os conjuntos numéricos:
R
I
12
Probabilidade e Estatística Luiz Roberto
Além desses (N, Z, Q, I), o conjunto dos números reais apresenta
noutros subconjuntos importantes:
R* = x R I x ≠ 0 conjunto dos números reais não nulos
R+ = x R I x ≥ 0 conjunto dos números reais não negativos
R = x *+ R I x > 0 conjunto dos números reais positivos
R- = x R I x ≤ 0 conjunto dos números reais não positivos
R = x *− R I x < 0 conjunto dos números reais negativos
Portanto, os números naturais, inteiros, racionais e irracionais
são todos números reais. Como subconjuntos importantes de “I” temos: I* = I - 0
I+ = conjunto dos números reais não negativos
I_ = conjunto dos números reais não positivos
Entre dois números inteiros existem infinitos números reais. Ex:
Entre os números 1 e 2 existem infinitos números reais:
1,01 ; 1,001 ; 1,0001 ; 1,1 ; 1,2 ; 1,5 ; 1,99 ; 1,999 ; 1,9999 ...
Entre os números 5 e 6 existem infinitos números reais:
5,01 ; 5,02 ; 5,05 ; 5,1 ; 5,2 ; 5,5 ; 5,99 ; 5,999 ; 5,9999 ...
1.9 Intervalos
a) Intervalo Aberto:
]a,b[ = x R I a < x < b 3 5
b) Intervalo Fechado:
[a,b] = x R I a ≤ x ≤ b 3 5
c) Intervalo aberto à direita:
[a,b[ = x R I a ≤ x < b 3 5
d) Intervalo aberto à esquerda:
]a,b] = x R I a < x ≤ b 3 5
13
Probabilidade e Estatística Luiz Roberto
Existem ainda os intervalos infinitos:
e) ]-∞,a] = x R I x ≤ a
3
3
3
f) ]-∞,a[ = x R I x < a
g) [a, +∞[ = x R I x ≥ a
h) ]a, +∞[ = x R I x > a 3
1.10 Problemas com número finito de elementos
Exemplo 1
O Instituto de Meteorologia de Curitiba quis fazer um estudo de variação da
temperatura à sombra e mediu-a de hora em hora, conforme a tabela abaixo:
Hora 0 1 2 3 4 5 6 7 8 9 10 11
Temperatura 7° 6° 5° 4° 3° 2° 2° 3° 5° 7° 12° 15°
Hora 12 13 14 15 16 17 18 19 20 21 22 23
Temperatura 18° 18° 20° 20° 20° 18° 15° 13° 11° 9° 8° 7°
Nesse exemplo, são medidas duas grandezas: a hora do dia e a correspondente
temperatura. A cada hora corresponde uma única temperatura. Dizemos, por
isso, que a temperatura é função da hora. Como à mesma temperatura podem
corresponder várias horas, a hora não é função da temperatura.
Exemplo 2
Uma barraca na praia da Barra da Tijuca vende cocos e exibe a seguinte
tabela:
Números de cocos 1 2 3 4 5 6 7 8 9 10
Preço (R$) 1,20 2,40 3,60 4,80 6,00 7,20 8,40 9,60 10,80 12,00
14
Probabilidade e Estatística Luiz Roberto
Nesse exemplo estão sendo medidas duas grandezas: o número de cocos e o
respectivo preço. A cada quantidade de cocos corresponde um único preço.
Dizemos, por isso, que o preço é função do número de cocos comprados. Aqui é
possível até achar a fórmula que estabelece a relação de interdependência
entre o preço (y) e o número de cocos (x): y = 1,20 x.
Exemplo 3
Um pedreiro vai ladrilhar uma sala de 3 x 3 metros. Com ladrilhos quadrados,
todos iguais entre si. Se ele pode escolher ladrilhos com lados 10 cm, 12 cm,
15 cm, 20 cm, 25 cm e 30 cm, qual é o número de ladrilhos que usará em cada
caso?
Para achar o número de ladrilhos (y), basta dividir a área da sala (9m2) pela
área do ladrilho (em m2). Se o lado mede x m2, então a fórmula que relaciona y
com x é: y = 9/x2.
Medida do lado do ladrilho (x) 0,10 0,12 0,15 0,20 0,25 0,30
Número de ladrilhos (y) 900 625 400 225 144 100
Exercícios
1. A tabela abaixo indica o deslocamento de um móvel num dado intervalo
de tempo:
Intervalo de tempo (s) 0 1 2 3 4 5 6 7 8 9 10
Deslocamento (cm) 0 3 6 9 12 15 18 21 24 27 30
a) Qual é o deslocamento do móvel num intervalo de 4 segundos?
b) Qual é o intervalo de tempo correspondente a um deslocamento de 21 cm?
c) O deslocamento é função do intervalo de tempo?
d) Qual é o deslocamento d num intervalo de tempo t? (supor velocidade do
móvel constante).
2. A tabela abaixo indica o custo de produção de certo número de peças de
automóvel:
Número de peças 1 2 3 4 5 6
Custo (R$) 1 4 9 16 25 36
15
Probabilidade e Estatística Luiz Roberto
a) Qual é o custo da produção de três peças?
b) Qual é o número de peças produzidas com R$25,00?
c) Qual é o custo c da produção de n peças?
d) Com relação ao item anterior, qual é o numero máximo de peças
produzidas com R$1.000,00?
3. O preço do serviço executado por um pintor consiste em uma taxa fixa,
que é de R$250,00, e mais uma quantia que depende da área pintada. A
tabela seguinte mostra alguns orçamentos apresentados pelo pintor:
Área pintada (m2) 5 10 15 20 30 40 80
Total a pagar (R$) 350 550 700 850 1.150 1.450 2.050
a) Como se exprime, matematicamente, o total a pagar (y) pela pintura de x
m2?
b) Qual é o preço cobrado pela pintura de uma área de 150 m2?
c) Qual é a área máxima que pode ser pintada dispondo-se de R$6.250,00?
4. O num erro de y pessoas (em milhares) que tomam conhecimento do
resultado de um jogo de futebol, após x horas de sua realização é dado
por xy 10= . Responda:
a) Quantas pessoas sabem o resultado do jogo após 4 horas?
b) Quantas pessoas sabem o resultado do jogo após um dia?
c) Após quantas horas de sua realização, 30 mil pessoas tomam
conhecimento do resultado do jogo?
5. A velocidade média de um automóvel em uma estrada é de 90 Km/h.
Responda:
a) Qual é a distância percorrida pelo automóvel em uma hora?
b) Em quanto tempo o automóvel percorre a distância de 360 Km?
c) Qual é a expressão matemática que relaciona a distância
percorrida (d) em função do tempo (t)?
6. Um professor propõe a sua turma um exercício-desafio, comprometendo-se
a dividir um prêmio de R$120,00 entre os acertadores. Seja x o número
de acertadores (x = 1, 2, ..., 40) e y a quantia recebida por cada
acertador (R$). Responda:
a) y é função de x? Por quê?
b) Quais os valores de y para x=2, x=8, x=20 e x=25?
c) Qual é o valor máximo que y assume?
d) Qual é a lei de correspondência entre x e y?
16
Probabilidade e Estatística Luiz Roberto
2 ANÁLISE COMBINATÓRIA
2.1 Introdução:
A necessidade de calcular o número de possibilidades existentes nos
chamados jogos de azar levou ao desenvolvimento da Análise Combinatória.
Trata-se de uma parte da Matemática que estuda os métodos de contagem. Esses
estudos foram iniciados já no século XVI, pelo matemático italiano Niccollo
Fontana (1500-1557), conhecido como Tartaglia. Depois dele vieram os
franceses Pierre de Fermat (1601-1665) e Blaise Pascal (1623-1662).
Pascal
Fermat
Tartaglia
A Análise Combinatória visa desenvolver métodos que permitam contar - de uma forma indireta - o número de elementos de um conjunto, estando esses
elementos agrupados sob certas condições.
Consideremos o seguinte problema:
Uma lanchonete oferece a seus clientes apenas dois tipos de sanduíches:
hot dog e hambúrger. Como sobremesa, há três opções: sorvete, torta ou salada
de frutas.
Pergunta-se: quantas são as possibilidades de uma pessoa fazer uma refeição
incluindo um sanduíche e uma sobremesa?
Podemos ter as seguintes refeições:
a) hot dog e sorvete
b) hot dog e torta
17
Probabilidade e Estatística Luiz Roberto
c) hot dog e salada de frutas
d) hambúrger e sorvete
e) hambúrger e torta
f) hambúrger e salada de frutas
A determinação de tais possibilidades pode ser simplificada através de um
diagrama, em que, na 1ª coluna, representaremos as possibilidades de escolha
do sanduíche e, na 2ª coluna, as possibilidades de escolha da sobremesa.
1ª coluna 2ª coluna
sorvete Refeição 1
hot dog torta Refeição 2
salada de frutas Refeição 3
sorvete Refeição 4
hambúrger torta Refeição 5
salada de frutas Refeição 6
Este esquema é conhecido como diagrama de árvore. Fazendo a leitura de todas
as “ramificações” da árvore, obtemos as possíveis refeições.
Notemos que fazer uma refeição completa representa uma ação constituída de
duas etapas sucessivas:
1ª escolha do tipo de sanduíche: há duas possibilidades de fazer tal
escolha.
2ª escolha da sobremesa: para cada uma das possibilidades anteriores, há
três maneiras de escolher a sobremesa.
Assim, a realização da ação (duas etapas sucessivas) pode ser feita de 2 x 3
= 6 maneiras distintas que foram anteriormente indicadas.
2.2 Fatorial de um número natural
Para resolver problemas de Análise Combinatória precisamos utilizar uma
ferramenta matemática chamada Fatorial.
Seja n um número inteiro não negativo. Definimos o fatorial de n (indicado
pelo símbolo n!) como sendo:
n! = n . (n-1) . (n-2) . ... . 4 . 3 . 2 . 1 para n ≥ 2.
Se n = 1, então 1! = 1.
Se n = 0, então 0! = 1.
18
Probabilidade e Estatística Luiz Roberto
Exemplos:
a) 6! = 6 . 5! = 6 . 5 . 4 . 3 . 2 . 1 = 720
b) 4! = 4. 3! = 4 . 3 . 2 . 1 = 24
c) 7! = 7 . 6! = 7 . 6 . 5 . 4 . 3 . 2 . 1 = 5040
d) 10! = 10 . 9 . 8 . 7 . 6 . 5 . 4 . 3 . 2 . 1
e) 3! = 3 . 2 . 1 = 6
Perceba que 7! = 7 . 6 . 5 . 4!, ou que
6! = 6 . 5 . 4 . 3!, e assim sucessivamente.
Relação de correspondência: N! = n . (n – 1)! , n N* e n ≥ 2 Exercícios:
1) efetuar: !6!8
2) efetuar: !6
)!7!8( +
3) efetuar: )!1()!1(
−+nn
4) efetuar: )!3()!4(
−−nn
5) efetuar: !5
)!5!6( − + 0!
6) efetuar: )!1()!2(
++nn
7) efetuar: !11
)!9!10( +
8) efetuar: !6!7 +
!7!6 +
!6!8
9) efetuar: 6! - 20
10) Resolva a equação: (n+2)! = 6n!
11) Resolva a equação: )!22(
)!2(−nn
= 12
2.3 Princípio fundamental da contagem - PFC
Suponhamos que uma ação seja constituída de duas etapas sucessivas. A
primeira etapa pode ser realizada de p maneiras distintas. Para cada uma
19
Probabilidade e Estatística Luiz Roberto
dessas possibilidades, a 2ª etapa pode ser realizada de q maneiras distintas.
Então, o número de possibilidades de se efetuar a ação completa é dado por
p x q.
Esse princípio pode ser generalizado para ações constituídas de mais de
duas etapas sucessivas.
Se determinado acontecimento ocorre em etapas independentes, e se a
primeira etapa pode ocorrer de k1 maneiras diferentes, a segunda de k2
maneiras diferentes, e assim sucessivamente, então o número total T de
maneiras de ocorrer o acontecimento, composto por n etapas, é dado por:
T = k1. k2 . k3 . ... . kn
Exemplo 1
No Brasil as placas dos veículos são confeccionadas usando-se 3 letras do
alfabeto e 4 algarismos. Qual o número máximo de veículos que poderá ser
licenciado?
Imaginemos a seguinte situação: Placa ACD – 2172.
Como o alfabeto possui 26 letras e nosso sistema numérico possui 10
algarismos (de 0 a 9), podemos concluir que: para a 1ª posição, temos 26
alternativas, e como pode haver repetição, para a 2ª, e 3ª também teremos 26
alternativas. Com relação aos algarismos, concluímos facilmente que temos 10
alternativas para cada um dos 4 lugares. Podemos então afirmar que o número
total de veículos que podem ser licenciados será igual a:
26 . 26 . 26 . 10 . 10 . 10 . 10 = 175.760.000.
Exemplo 2
No Brasil, antes da alteração do sistema de emplacamento de automóveis, as
placas dos veículos eram confeccionadas usando-se 2 letras do alfabeto e 4
algarismos. Qual o número máximo de veículos que podia ser licenciado neste
sistema?
Imaginemos a seguinte situação: Placa AC – 2172.
Como o alfabeto possui 26 letras e nosso sistema numérico possui 10
algarismos (de 0 a 9), podemos concluir que: para a 1ª posição, temos 26
alternativas, e como pode haver repetição, para a 2ª, também teremos 26
alternativas. Com relação aos algarismos, concluímos facilmente que temos 10
alternativas para cada um dos 4 lugares. Podemos então afirmar que o número
total de veículos que podem ser licenciados será igual a:
26 . 26 . 10 . 10 . 10 . 10 = 6.760.000.
20
Probabilidade e Estatística Luiz Roberto
Percebe-se que a inclusão de apenas uma letra faz com que sejam licenciados,
aproximadamente, mais 170.000.000 de veículos.
Exemplo 3
Há quatro estradas ligando as cidades e A e B, e três estradas ligando as
cidades B e C. De quantas maneiras distintas pode-se ir de A a C, passando
por B?
Fazer a viagem de A a C pode ser considerado uma ação constituída de duas
etapas sucessivas:
1ª ir de A até B: teremos quatro possibilidades
2ª ir de B a C: para cada uma das possibilidades anteriores, há três
maneiras de chegar a C, a partir de B.
Assim, o resultado procurado é 4 x 3 =12.
Exemplo 4
Com os algarismos 1, 2, 3, 4, 5 e 6, quantos números de três algarismos
distintos podemos formar?
Formar um número de três algarismos pode ser considerado uma ação constituída
de três etapas sucessivas:
1ª escolha do algarismo das centenas: são seis possibilidades.
2ª escolha do algarismo das dezenas: como não pode haver repetição de
algarismo, devemos ter um algarismo diferente do algarismo escolhido para a
centena. Assim, há cinco possibilidades.
3ª escolha do algarismo das unidades: devemos ter um algarismo diferente dos
dois algarismos escolhidos para a centena e para a dezena. Assim, há quatro
possibilidades.
Pelo PFC, o resultado é: 6 x 5 x 6 = 120 números.
Exemplo 5
Uma prova consta de 10 questões do tipo V ou F. De quantas maneiras distintas
ela pode ser resolvida?
Resolver a prova representa uma ação constituída de 10 etapas sucessivas, que
correspondem à resolução das 10 questões propostas.
Para cada questão, há duas possibilidades de escolha de resposta: V ou F.
Logo, pelo PFC, o resultado é: 2 x 2 x 2 ... x 2 = 210 = 1.024
possibilidades. 10 vezes
21
Probabilidade e Estatística Luiz Roberto
Exemplo 6
Quantos números de três algarismos podemos formar com os algarismos 0, 1, 2,
3, 4, 5, 6 e 7?
Algarismo das centenas: com exceção do zero, qualquer um dos algarismos dados
pode ser escolhido, havendo, portanto, sete possibilidades.
Algarismo das dezenas: não há restrição alguma, pois pode haver repetição de
algarismos. Assim, há oito possibilidades.
Algarismo das unidades: analogamente ao anterior, há oito possibilidades.
Logo, pelo PFC: 7 x 8 x 8 = 448.
Exemplo 7
Quantos números ímpares de três algarismos distintos podemos formar com os
algarismos 0, 1, 2, 3, 4, 5, 6 e 7?
Algarismo das unidades: há quatro possibilidades (1, 3, 5 e 7).
Algarismo das centenas: há seis possibilidades – devemos excluir o zero e o
algarismo escolhido para a unidade.
Algarismo das dezenas: há seis possibilidades – devemos escolher algarismos
diferentes dos algarismos escolhidos para a centena e unidade.
Assim, pelo PFC, temos: 6 x 6 x 4 = 144 números.
Todo problema de contagem pode, pelo menos teoricamente, ser resolvido pelo
PFC. Porém, na prática, a resolução de alguns desses problemas pode se tornar
muito complicada.
Dessa forma, estudaremos técnicas de contagem de determinados agrupamentos –
baseados no PFC – as quais simplificarão a resolução de muitos problemas.
Consideraremos sempre os agrupamentos simples: arranjos, permutações e
combinações.
Exemplo 8
Determine o número de anagramas da palavra MATEMÁTICA.(não considere o
acento).
Solução:
Temos 10 elementos, com repetição. Observe que a letra M está repetida duas
vezes, a letra A três , a letra T, duas vezes. Na fórmula anterior, teremos:
n=10, a=2, b=3 e c=2. Sendo k o número procurado, podemos escrever: k= 10! / (2!.3!.2!) = 151.200 anagramas
22
Probabilidade e Estatística Luiz Roberto
2.4 Arranjos simples
Dado um conjunto com n elementos distintos, chama-se arranjo dos n elementos,
tomados k a k, a qualquer seqüência ordenada de k elementos distintos
escolhidos entre os n existentes.
Temos um Arranjo quando os agrupamentos conseguidos ficam diferentes ao se
inverter a posição dos seus elementos.
Perceba que para formar centenas com algarismos distintos, utilizando apenas
os 5 primeiros algarismos ímpares (1; 3; 5; 7; 9) teremos as seguintes
centenas: 135; 137; 139; 153, 157, e assim sucessivamente.
Se invertermos a posição dos elementos de qualquer uma destas centenas
conseguiremos outra centena diferente: 135 • 351.
Temos então um ARRANJO de cinco elementos tomados de três em três.
Exemplo 1
Dado o conjunto A = (1, 2, 3, 4), vamos escrever todos os arranjos desses
quatro elementos tomados dois a dois.
(1, 2); (1, 3); (1, 4); (2, 1); (2, 3); (2, 4); (3, 1); (3, 2); (3, 4); (4,
1); (4, 2); (4, 3)
Notamos que (2, 3) (3, 2), isto é, a troca na ordem dos elementos de um
possível agrupamento gera um agrupamento diferente.
≠
Exemplo 2
Um cofre possui um disco marcado com os dígitos 0,1,2,...,9. O segredo do
cofre é marcado por uma seqüência de 3 dígitos distintos. Se uma pessoa
tentar abrir o cofre, quantas tentativas deverá fazer(no máximo) para
conseguir abri-lo?
As seqüências serão do tipo xyz. Para a primeira posição teremos 10
alternativas, para a segunda, 9 e para a terceira, 8. Aplicando a fórmula de
arranjos pelo PFC, chegaremos ao mesmo resultado: 10.9.8 = 720.
Observe que 720 = A10,3
2.5 Cálculo do número de arranjos
Seja um conjunto de n elementos distintos. Vamos encontrar uma expressão para
o número de arranjos dos n elementos tomados k a k (An,k).
Escrever um arranjo de n elementos formados k a k significa escrever uma
seqüência ordenada de k elementos distintos (k n), escolhidos entre os n ≤
23
Probabilidade e Estatística Luiz Roberto
disponíveis. Assim, pelo PFC, a ação pedida consta de k etapas sucessivas,
que correspondem às escolhas dos k elementos.
1ª etapa 2ª etapa 3ª etapa ... k-ésima etapa (há n elementos (como os elementos para serem escolhidos) devem ser distintos, há n-1 possibilidades)
n n – 1 n – 2 n – (k – 1)
Desta forma, o número total de arranjos dos n elementos tomados k a k é:
An,k = n . (n – 1) . (n – 2) ... (n - k +1)
Multiplicando e dividindo a expressão acima por
(n – k)! = (n – k) (n – k – 1) ... 3 . 2 . 1 vem:
An,k = n (n – 1) (n – 2) ... (n - k +1) . 1.2.3)...1)((1.2.3)...1)((
−−−−−−knknknkn
,
Isto é:
)!(!knn−
≥An,k = n k
Exemplo 3
Obter o valor de A4,2 + A7,3.
Temos A4,2 = )!24(
!4−
= !2!4 =
!2!2.3.4 = 12
A7,3 = )!37(
!7−
= !4!7 =
!4!4.5.6.7 = 210
Exemplo 4
O quadrangular de um torneio mundial de basquete é disputado por quatro
seleções: Brasil, China, Holanda e Itália. De quantas maneiras distintas
podemos ter os três primeiros colocados?
Um possível resultado do torneio é Holanda (campeã), Brasil (2°) e Itália
(3°). Se trocarmos a ordem desses elementos, obtemos, entre outras, Brasil
24
Probabilidade e Estatística Luiz Roberto
(campeão), Itália (2°) e Holanda (3°), que é um resultado diferente do
anterior. Dessa forma, cada resultado do torneio é um arranjo das quatro
equipes tomadas três a três.
Assim, o número de possibilidades é :
An,k = )!(
!knn−
A4,3 = )!34(
!4−
= !1!4 = 24
Exemplo 5
A senha de um cartão de banco é formada por duas letras distintas seguidas
por uma seqüência de três algarismos distintos. Quantas senhas poderiam ser
confeccionadas?
Como importa a ordem que são escolhidas as letras, o número de maneiras de
escolhê-las é dado por A26,2.
Analogamente, a seqüência de três algarismos distintos pode ser escolhida de
A10,3.
Pelo PFC, o número de senhas que podem ser confeccionas é:
A26,2 x A10,3 = 650 x 720 = 468.000.
Exemplo 6
Usando-se as 26 letras do alfabeto (A,B,C,D,...,Z), quantos arranjos
distintos com 3 letras podem ser montados?
An,k = )!(
!knn−
, n=26, k=3
Resposta: A = !23!26 =
!2323! . 24 . 25 . 26
= 26.25.24 = 15600
2.6 Permutações simples
Permutações simples de n elementos distintos são os agrupamentos formados com
todos os n elementos e que diferem uns dos outros pela ordem de seus
elementos.
De outro modo, podemos entender permutação simples como um caso especial de
arranjo, onde n = k, ou seja:
An,k = )!(
!knn−
= !0!n =
1!n = n!
Chega-se então à relação: Pn = n!
25
Probabilidade e Estatística Luiz Roberto
Notemos que a permutação é um caso particular de arranjo, pois, dado um
conjunto de n elementos distintos, selecionamos exatamente n elementos para
forma a seqüência ordenada.
Exemplo 1
Escrever todos os anagramas da palavra SOL.
Um anagrama da palavra SOL é qualquer permutação das letras S, O, L de modo
que se forme uma palavra com ou sem sentido.
Assim, temos: SOL, SLO, OSL, OLS, LOS, LSO.
Exemplo 2
De quantas maneiras cinco pessoas, A, B, C, D e E podem ser dispostas em
fila indiana?
Cada maneira de compor a fila é uma permutação das cinco pessoas, pois
qualquer fila obtida é uma seqüência ordenada na qual comparecem sempre as
cinco pessoas.
Assim, o resultado esperado é: P5 = 5! = 120
Exemplo 3
Baseado no exemplo anterior, quantas filas podem ser compostas começando por
A ou B?
A 1ª posição da fila pode ser escolhidas de duas maneiras (pois tanto A como
B pode iniciá-la).
Definido o início da fila, restarão sempre quatro lugares para serem
preenchidos pelas quatro pessoas restantes, num total de P4 = 4! = 24
possibilidades.
Pelo PFC, o resultado é: 2 x 24 = 48.
Exemplo 4
Oito pessoas, entre elas, Antonio e Pedro, vão posar para uma foto. De
quantas maneiras elas podem ser dispostas se Antonio e Pedro se recusarem-se
a ficar lado a lado?
Caso não houvesse a restrição mencionada, o número total de possibilidades
seria:
P8 = 8! = 40.320.
Para determinar o número de possibilidades em que Antonio e Pedro aparecem
juntos, vamos considerá-los uma só pessoa, que irá permutar com as seis
restantes, num total de:
26
Probabilidade e Estatística Luiz Roberto
P7 = 7! = 5.040 maneiras.
Porém, para cada uma das possibilidades acima, Antonio e Pedro podem trocar
de lugar entre si, num total de:
P2 = 2! = 2.
Desta forma, o número de possibilidades em que Antonio e Pedro aparecem
juntos é: 2x 5.040 = 10.080.
A diferença 40.320 – 10.080 = 30.240 fornece o número de situações em que
Antonio e Pedro não aparecem lado a lado.
Exemplo 5
Quantas possibilidades de agrupamentos há com os elementos A,B,C?
São possíveis as seguintes permutações: ABC, ACB, BAC, BCA, CAB e CBA.
De forma matemática: P3 = 3! = 3 . 2 . 1 = 6
Exemplo 6
Calcule o número de formas distintas de 5 pessoas ocuparem os lugares de um
banco retangular de cinco lugares.
P5 = 5! = 5 . 4 . 3 . 2 . 1 = 120
Exemplo 7
Denomina-se ANAGRAMA o agrupamento formado pelas letras de uma palavra, que
podem ter ou não significado na linguagem comum. Os possíveis anagramas da
palavra REI são: REI, RIE, ERI, EIR, IRE e IER. Calcule o número de anagramas
da palavra MUNDIAL.
P7 = 7! = 7 . 6 . 5 . 4 . 3 . 2 . 1 = 5040
2.7 Permutações com elementos repetidos
Se entre os n elementos de um conjunto, existem a elementos repetidos, b
elementos repetidos, c elementos repetidos e assim sucessivamente, o número
total de permutações que podemos formar é dado por:
Pn (a,b,c) = !!!
!cba
n
Exemplo 1
Determine o número de anagramas da palavra MATEMÁTICA.(não considere o
acento)
Temos 10 elementos, com repetições. A letra M está repetida duas vezes, a
27
Probabilidade e Estatística Luiz Roberto
letra A três, a letra T, duas vezes. Na fórmula anterior, teremos: n=10, a=2,
b=3 e c=2.
P = 10! / (2!.3!.2!) = 151200
Exemplo 2
Quantos anagramas podem ser formados com as letras da palavra MARIA?
Neste problema temos n = 5 (cinco letras) e a = 2 (a letra A se repete duas
vezes)
P = 5!/2! = 5.4.3 = 60
Exemplo 3
Quantos anagramas podem ser formados com as letras da palavra ARARA?
Neste problema temos n = 5 (cinco letras), a = 2 (a letra R se repete duas
vezes) e b = 3 (a letra A se repete três vezes).
P = 5!/(3!.2!) = 5.4.3!/(3!.2) = 10
2.8 Combinações simples
Dado um conjunto A com n elementos distintos, chama-se combinação dos n
elementos de A, tomados k a k, a qualquer subconjunto formado por k
elementos, isto é, temos uma combinação quando os agrupamentos conseguidos
permanecem iguais ao se inverter a posição dos seus elementos.
Perceba que se houver cinco pessoas entre as quais desejamos formar grupos de
três, o grupo formado por João, Pedro e Luís é o mesmo grupo formado por
Luís, Pedro e João. Temos, então, uma COMBINAÇÃO de cinco elementos em grupos
de três.
Cálculo do número de combinações
Considere o seguinte problema:
Uma turma é formada por 10 alunos. Deseja-se formar uma comissão de três
alunos para representação discente na universidade. De quantas maneiras
podemos fazer tal escolha?
Calculemos inicialmente o número de triplas ordenadas de alunos:
A10,3 = !7!10 = 720 seqüências ordenadas.
Suponhamos que A, B, C estejam entre os 10 alunos da turma. Essas 720
possibilidades incluem, entre outras, os seguintes arranjos:
28
Probabilidade e Estatística Luiz Roberto
(A,B,C), (A,C,B), (B,A,C), (B,C,A), (C,A,B) e (C,B,,A)
Em cada um desses casos – que diferem entre si apenas pela ordem – os alunos
A, B e C farão parte da comissão. Assim, os seis arranjos acima passam a ser
equivalentes entre si, correspondendo a uma única combinação , pois
determinam sempre a mesma comissão.
CBA ,,
Desta forma, aos seis arranjos corresponde uma combinação; então, para os 720
arranjos, teremos x combinações:
Logo, x = 6
720 = 120 comissões
Número de permutações da tripla (A,B,C)
Número de arranjos dos 10 alunos tomados três a três
6 arranjos 1 combinação 720 arranjos x combinações
De modo geral, qualquer permutação de uma determinada seqüência ordenada dá
origem e uma única combinação.
Representando por Cn,k o número total de combinações de n elementos tomados k a k (taxa k), temos:
)!(!
!knk
n−
k
k n,
PA ≥ou , n k Cn,k = Cn,k =
Exemplo 1
Escrever todas as combinações dos cinco elementos do conjunto
M = tomados dois a dois.
uoiea ,,,,Devemos determinar todos os subconjuntos de M formados por dois elementos.
Lembremos que não importa a ordem dos elementos escolhidos: = , por
exemplo.
ea, ae,
Assim, as combinações pedidas são:
ea, , , , , , , , , , ia, oa, ua, ie, oe, ue, oi, ui, uo,
29
Probabilidade e Estatística Luiz Roberto
Exemplo 2
Cinco alunos – Pedro, Luís, José, Abel e Márcio – participam de um concurso
que serão sorteadas três bicicletas. Quais os possíveis resultados do
concurso?
Sortear é o mesmo que sortear , pois nas duas situações, esses alunos ganharão as bicicletas.
MárcioJoséPedro ,, PedroMárcioJosé ,,
Desta forma, cada resultado do sorteio é uma combinação dos cinco alunos
tomados três a três.
Os possíveis resultados do concurso são:
MJP ,,
MAJ ,,
, , , , , , , ,
,
AJP ,,
MAL ,,
AMP ,, JLP ,, MLP ,, ALP ,, AJL ,, MJL ,,
Exemplo 3
Uma prova consta de 15 questões das quais o aluno deve resolver 10. De
quantas formas ele poderá escolher as 10 questões?
Observe que a ordem das questões não muda o teste. Logo, podemos concluir que
trata-se de um problema de combinação de 15 elementos com taxa 10.
Aplicando simplesmente a fórmula chegaremos a:
C15,10 = 15! / [(15-10)! . 10!] = 15! / (5! . 10!) = 15.14.13.12.11.10! /
5.4.3.2.1.10! = 3003
Tanto arranjo como combinação são agrupamentos de k elementosescolhidos a partir de um conjunto de n elementos. A diferença é que,no arranjo, se mudarmos a ordem dos elementos de certo agrupamento,obteremos um novo agrupamento; na combinação, mudando a ordem doselementos de certo agrupamento, obtemos o mesmo agrupamento.
Exemplo 3
Uma prova consta de 15 questões das quais o aluno deve resolver 10. De
quantas formas ele poderá escolher as 10 questões?
Observe que a ordem das questões não muda o teste. Logo, podemos concluir que
trata-se de um problema de combinação de 15 elementos com taxa 10.
C15,10 = !10)!.1015(
15!−
= !10!.5
15! =
10!5.4.3.2.1. 2.11.10!15.14.13.1 = 3003
30
Probabilidade e Estatística Luiz Roberto
Exemplo 4
Um coquetel é preparado com três bebidas distintas. Se existem 7 bebidas
distintas, quantos coquetéis diferentes podem ser preparados?
C7,3 = !3)!.37(
7!−
= !3!.4
7! =
1.2.3!.4 7.6.5.4! = 35
Exemplo 5
Sobre uma circunferência são marcados 9 pontos, dois a dois distintos.
Quantas retas podem ser construídas passando por estes 9 pontos?
C9,2 = !2)!.29(
9!−
= !2!.7
9! =
1.2!.7 9.8.7! = 36
Exemplo 6
Uma pizzaria oferece 15 sabores de pizzas diferentes.
a) De quantas maneiras se pode escolher três desses sabores?
b) Suponha que uma família sempre opte por mussarela. Como poderão ser
escolhidos os outros dois sabores?
Resp. a)
Escolher as pizzas é o mesmo que escolher as pizzas . Assim, cada possível escolha é uma combinação das 15 pizzas tomadas três a
três:
3,2,1 PPP 1,2,3 PPP
C15,3 = !12!3
15! =
3.2.1.12! 2!15.14.13.1 = 455
Resp. b)
Como um dos sabores já foi definido, os outros dois sabores serão escolhidos
entre os 14 restantes.
C14,2 = !2!
14!12
= 12!.2.1
14.13.12! = 91
Exemplo 7
Uma turma tem 15 alunos, sendo 9 meninos e 6 meninas.
a) Quantas comissões de dois meninos e duas meninas podem ser formadas?
O número de escolher os meninos é C9,2.
O número de escolher as meninas é C6,2.
Pelo PFC, temos: C9,2 x C6,2 = 36 x 15 = 540
31
Probabilidade e Estatística Luiz Roberto
b) Quantas comissões de quatro pessoas têm pelo menos um menino?
O número total de comissões de quatro pessoas, sem nenhuma restrição, é
C15,4.
O número de comissões onde não aparecem meninos é C6,4, pois as vagas serão
preenchidas pelas meninas.
Assim, o número de comissões onde há pelo menos um menino é:
C15,4 – C6,4 = 1.365 – 15 = 1.350
Exemplo 8
Marcam-se cinco pontos sobre uma reta r. Sobre outra reta s, paralela a r,
marcam-se quatro pontos. Quantos triângulos podem ser formados com vértices
em três quaisquer desses pontos?
Observando a figura, vemos que para construir um triângulo não importa a
ordem dos pontos escolhidos, pois, por exemplo, e determinam
o mesmo triângulo.
CBA ,, ACB ,,
C
B
A
Por outro lado, podemos construir um triângulo se escolhermos:
1° caso: dois pontos de r e um ponto de s
Pelo PFC, há 10 x 4 = 40 possibilidades.
2° caso: um ponto de r e dois pontos de s
C4,1 = 4 possibilidades C5,2 = 10 possibilidades
C5,1 = 5 possibilidades C4,2 = 6 possibilidades
Pelo PFC, há 5 x 6 = 430 possibilidades.
Dessa forma, o número total de triângulos que podem ser construídos é:
40 + 30 = 70.
32
Probabilidade e Estatística Luiz Roberto
Exemplo 9
Um salão tem 6 portas. De quantos modos distintos esse salão pode estar
aberto?
Para a primeira porta temos duas opções: aberta ou fechada
Para a segunda porta temos também, duas opções, e assim sucessivamente.
Para as seis portas, teremos então, pelo PFC:
N = 2.2.2.2.2.2 = 64
Lembrando que uma dessas opções corresponde a todas as duas portas fechadas,
teremos então que o número procurado é igual a 64 - 1 = 63.
Resposta: o salão pode estar aberto de 63 modos possíveis.
2.9 Exercícios
01 - Um coquetel é preparado com duas ou mais bebidas distintas. Se existem 7
bebidas distintas, quantos coquetéis diferentes podem ser preparados?
Resp: 120
02 - Sobre uma circunferência são marcados 9 pontos distintos. Quantos
triângulos podem ser construídos com vértices nos 9 pontos marcados?
Resp: 84
03 - Uma família com 5 pessoas possui um automóvel de 5 lugares. Sabendo que
somente 2 pessoas sabem dirigir, de quantos modos poderão se acomodar para
uma viagem?
Resp: 48
33
Probabilidade e Estatística Luiz Roberto
3 PROBABILIDADE
Todas as vezes que se estudam fenômenos de observação, cumpre-se
distinguir o próprio fenômeno e o modelo matemático que melhor o explique.
Os fenômenos estudados pela Estatística são fenômenos cujos resultados,
mesmo em condições normais de experimentação variam de uma observação para
outra.
Para a explicação desses fenômenos – fenômenos aleatórios –
adota-se um modelo matemático probabilístico. Nesse caso, o modelo
utilizado será o CÁLCULO DAS PROBABILIDADES.
3.1 Experimento aleatório
Todo experimento que, repetido em condições idênticas, pode apresentar
diferentes resultados, recebe o nome de experimento aleatório. A
variabilidade de resultados deve-se ao acaso.
A fim de se entender melhor a caracterização desses experimentos,
convém observar o que há de comum nos seguintes experimentos:
E1: Retirar uma carta de um baralho com 52 cartas e observar seu naipe.
E2: Jogar uma moeda 10 vezes e observar o número de coroas obtidas.
E3: Retirar com ou sem reposição, bolas de uma urna que contém 5 bolas
brancas e seis pretas.
E4: Jogar um dado e observar o número mostrado na face de cima.
E5: Contar o número de peças defeituosas da produção diária da máquina A.
A análise desses experimentos revela:
a) Cada experimento poderá ser repetido indefinidamente sob as mesmas
condições.
b) Não se conhece um particular valor do experimento “a priori” , porém
pode-se descrever todos os possíveis resultados – as possibilidades.
34
Probabilidade e Estatística Luiz Roberto
c) Quando o experimento for repetido um grande número de vezes surgirá uma
regularidade, isto é, haverá uma estabilidade da fração f = r/n
(freqüência relativa), onde n é o número de repetições e r o número de
sucessos.
3.2 Espaço amostral
Para cada experimento aleatório E, define-se espaço amostral o conjunto
de todos os resultados possíveis desse experimento.
Consideremos um experimento aleatório. O conjunto de todos os possíveis
resultados desse experimento é chamado espaço amostral e indicado por Ω (letra grega que se lê: “omega”).
Indicaremos o número de elementos de um espaço amostral por n(Ω).
Exemplo 1
a) E = Jogar um dado e observar o número mostrado na face de cima
Ω = 1, 2, 3, 4, 5, 6 b) E = jogar duas moedas e observar os resultados.
Ω = (C,C), (C,K), (K,C), (K,K) onde C = cara e K = coroa.
Exemplo 2
Lançamos uma moeda honesta e observamos a face voltada para cima:
Temos:
Ω = K,C, onde K: cara; e C: coroa; n(Ω) = 2. Chamamos cada um dos resultados possíveis de ponto amostral.
Exemplo 3
Uma urna contém cinco bolas vermelhas e quatro brancas. Duas bolas são
extraídas, ao acaso, sucessivamente e sem reposição. Observamos a seqüência
de cores das bolas sorteadas.
Para determinar Ω , vamos construir um diagrama de árvore:
1ª extração 2ª extração
vermelha vermelha
branca
Vermelha
branca branca
35
Probabilidade e Estatística Luiz Roberto
Indicando vermelha por V e branca por B, temos:
Ω = n(Ω) = 4. ),(),,(),,(),,( BBVBBVVV Cada par acima é um dos pontos amostrais de Ω. 3.3 Evento
Evento é um conjunto de resultados do experimento, em termos de
conjuntos, é um subconjunto de Ω. Em particular, Ω e Ø (conjunto vazio) são
eventos. Ω é dito o evento certo e Ø o evento impossível.
Usando as operações em conjunto, podemos formar novos eventos:
A U B é o evento que ocorre se A ocorre ou B ocorre ou ambos ocorrem. A I B é o evento que ocorre se A e B ocorrem. Ā é o evento que ocorre se A não ocorre. Exemplo 1
a) Seja o experimento E: jogar três moedas e observar os resultados: Ω = (c,c,c), (c,c,k), (c,k,c), (k,c,c), (k,k,k), (k,k,c), (k,c,k), (c,k,k) Seja E1 o evento: ocorrer pelo menos duas caras. Então, E1 = (c,c,c),(c,c,k), (c,k,c), (k,c,c) b) Seja o evento E2: lançar um dado e observar o número de cima.
Então,
E2 = Ω = 1, 2, 3, 4, 5, 6 é um evento certo.
E3: ocorrência de número maior que 8.
E3 = Ø é um evento impossível.
Seja E4: ocorrer múltiplo de 2.
Então E4 = 2, 4, 6; observe que E4 Ω. ⊂Seja E5: ocorrer número ímpar.
Então E5 = 1, 3, 5; observe que E5 Ω. ⊂
3.4 Probabilidade de um Evento
Agora podemos quantificar o grau de confiança de qualquer evento.
36
Probabilidade e Estatística Luiz Roberto
Atribuímos a cada evento um número obtido da soma das imagens de cada
um de seus elementos na relação de freqüência. Este número chama-se
probabilidade do evento. Observe como se resolve o seguinte caso.
Exemplo:
O experimento consiste em extrair uma bola do interior de uma caixa e
observar sua cor. Há um total de nove bolas na caixa: duas brancas, três
vermelhas e quatro pretas.
Qual será a probabilidade de tirar uma bola que não seja preta?
Para solucionar esta questão, preparamos o esquema da figura acima:
O espaço amostral da figura acima é:
Elemento Imagem
(B) branca 2/9
(V) vermelha 3/9
(P) preta 4/9
= branca, vermelha, preta
O evento “tirar uma bola de cor diferente do preto”, A = B,V, consta
de dois elementos.
Como foi dito na definição de probabilidade, atribuímos a cada evento
um número obtido da soma das imagens de cada elemento na relação de
freqüência.
Portanto, se somarmos as imagens da bola branca, 2/9, e da vermelha,
3/9, que aparecem na relação de freqüência deste exemplo, vamos conhecer o
valor da probabilidade do evento A, indicado por P(A).
Assim,
p(A) = 92 +
93 =
95
Em alguns experimentos aleatórios, cada um dos resultados (eventos
elementares) tem a mesma freqüência relativa esperada.
37
Probabilidade e Estatística Luiz Roberto
Este é o caso de lançar uma moeda ou um dado e comprovar o resultado.
Dizemos, então, que o espaço amostral é equiprovável, e que sua
probabilidade é uniforme.
3.5 Evento complementar
Consideremos um evento E relativo a um espaço amostral Ω. Chamamos
evento complementar de – indicado por E – ao evento que ocorre quando se,
e somente se, E não ocorre.
Observe o seguinte diagrama: Ω
Notemos que E I E = Ø e E U E = Ω Exemplo 1
Uma urna contém 10 bolas numeradas de 1 a 10. Retira-se da urna, ao acaso,
uma bola. Se E é o evento “ocorre múltiplo de 3”, então E será:
Temos: Ω = 1, 2, 3, ..., 10 e E = 3, 6, 9; logo:
E = 1, 2, 4, 5, 7, 8, 10 é o evento “não ocorre múltiplo de 3”.
Notemos que E U E = Ω.
3.6 Probabilidades em espaços amostrais equiprováveis
Consideremos o espaço amostral Ω formado por k pontos amostrais (ou eventos
elementares): Ω = a1, a2, a3, ..., ak
Vamos associar cada um desses pontos amostrais um número real, pai, ou
simplesmente pi, chamado probabilidade do evento ai, ou seja, probabilidade
de ocorrência do ponto amostral ai, tal que:
(I) 0 ≤ pi ≤ 1
(II) = 1 , isto é, p∑=
k
1
i
ip 1 + p2 + ... + pk = 1
38
Probabilidade e Estatística Luiz Roberto
Consideremos aqui os espaços amostrais equiprováveis, isto é, aqueles cujos
pontos amostrais têm a mesma probabilidade de ocorrer. Assim, se denotarmos
por p a probabilidade de ocorrência de cada um dos pontos amostrais de Ω,
temos, em (II):
p + p + p + ... + p = 1 k . p = 1 p = k1
K vezes
A probabilidade de ocorrência de um evento E, formado por r pontos amostrais
E = a1, a2, a3, ..., ar , com r k, é dada por: ≤
P (E) = p1 + p2 + ... + pr p(E) = k1 +
k1 +
k1 + …
k1
p(E) = kr = = Número de elementos de E n(E)
Número de elementos de Ω n(Ω) Como E Ω, temos que n(E) ≤ n(Ω). Assim: ⊂
n(E) ≤ ≤ tal que 0 p(E) 1
n(Ω)
P(E) =
Essa definição de probabilidade é intuitiva, isto é, a probabilidade de
ocorrer determinado evento é dada pala razão entre o número de casos
favoráveis (ou número de caos que nos interessam) e o número de casos
possíveis (ou número total de casos).
Assim:
= Número de casos favoráveis
Número de casos possíveis n(Ω)
n(E) p(E) =
Uma vez que o número de casos favoráveis coincide com o número de
elementos do evento, e o número de casos possíveis corresponde ao número de
elementos do espaço amostral, podemos escrever:
p(A) = kf , onde o evento A tem f elementos e k o número possível de
elementos. Para ocorrer o evento A, o resultado deve ser algum desses f
elementos, que são os casos favoráveis.
Assim, no exemplo do lançamento de um dado, se o evento A consiste em
obter um “5”, o número de casos favoráveis será 1, pois num dado não-viciado
39
Probabilidade e Estatística Luiz Roberto
só existe um “5”, e o número de casos possíveis é 6, portanto o espaço
amostral é: = 1,2,3,4,5,6
Assim, a probabilidade do evento A será: P (A) = 1/6
Quando dizemos que a probabilidade do evento A é 1/6, isto não
significa que, se jogarmos o dado seis vezes, em uma delas sairá, com toda a
certeza, o número “5”. Pode ser que o número “5” não saia nenhuma vez, ou ele
pode sair mais de uma vez.
A probabilidade 1/6 indica apenas que, se repetirmos esse experimento
um número muito grande de vezes, o evento A vai ocorrer em aproximadamente
1/6 do total de jogadas.
Exemplo 1
Uma urna contém 15 bolas numeradas de 1 a 15. Uma bola é extraída ao acaso.
Qual a probabilidade de ser sorteada uma bola com número maior ou igual a 11?
Temos: Ω = 1, 2, 3, ..., 15 Seja o evento E: “o número da bola sorteada é maior ou igual a 11”. Logo: E = 11, 12, 13, 14, 15.
Assim, p(E) = = 15
= 5
31 = 33,3%
n(E)
n(Ω)
Exemplo 2
Um dado é lançado e observa-se o número da face voltada para cima. Qual a
probabilidade desse número ser:
a) menor que 3? b) Maior ou igual a 3?
a) Temos Ω = 1, 2, 3, 4, 5, 6
E = 1, 2. Então, p(E) = 62 =
31
b) basta considerar o evento complementar: Ec = 3, 4, 5, 6.
Assim, p(Ec) = = 64 =
32.
n(Ec)
n(Ω)
p(E) + p(Ec) = 1 Note que
Exemplo 3
Uma moeda é lançada três vezes, sucessivamente. Qual a probabilidade de
observarmos: a) exatamente uma cara?; b) No máximo duas caras?
40
Probabilidade e Estatística Luiz Roberto
Vamos construir um diagrama de árvore onde na 1ª, 2ª e 3ª colunas,
respectivamente, representaremos os possíveis resultados para o 1°, 2° e 3°
lançamentos.
K (K,K,K) K C (K,K,C) K K (K,C,K) C C (K,C,C) K (C,K,K) K C (C,K,C) C K (C,C,K) C C (C,C,C)
K: cara C: coroa
O espaço amostral é formado pelas oito seqüências indicadas.
a) O evento E1 = (K,C,C), (C,C,K), (C,K,C)
Assim, p(E1) = = 83 = 37,5%
n(E1)
n(Ω) b) As seqüências que nos interessam são aquelas que apresentam nenhuma,
uma ou duas caras. Assim, o evento pedido é:
E2 = (C,C,C),(K,C,C),(C,K,C),(C,C,K),(K,K,C),(K,C,K),(C,K,K)
Logo, p(e2) = 87 = 87,5%.
Exemplo 4
Uma turma tem 20 homens e 25 mulheres. Deseja-se formar uma comissão de cinco
alunos para representantes de turma. Qual a probabilidade de essa comissão
vir a ser formada exclusivamente por meninos?
O número de elementos de Ω é igual ao número de maneiras de se escolher uma
comissão qualquer de cinco pessoas, a partir dos 45 alunos. Como vimos, n(Ω)
= C45,5 .
O evento que interessa é aquele em que “todos os alunos da comissão são
meninos”. O número de comissões assim existentes é C20,5 .
Assim, a probabilidade pedida é:
P(E) = = 0,0126 = 1,26% C20,5
C45,5
41
Probabilidade e Estatística Luiz Roberto
Exemplo 5
Escolhe-se, ao acaso, um dos anagramas da palavra XADREZ. Qual a
probabilidade da palavra escolhida começar por XA?
O número de elementos de Ω é o número de permutações da palavra XADREZ.
Então, n(Ω) = P6 = 6! = 720.
O evento E = “palavra começa por XA”:
X A __ __ __ __ Definidas as duas primeiras letras, há P = 4! 4
maneiras de se preencherem as lacunas restantes. Assim, n(E) = 4! = 24.
Logo, a probabilidade pedida é p(E) = = 72024
= 3,33% n(E)
n(Ω) Exemplo 6
Numa comunidade residem 100 pessoas. Uma pesquisa sobre os hábitos
alimentares dessa comunidade revelou que:
• 25 pessoas consomem carnes e verduras
• 83 pessoas consomem verduras
• 39 pessoas consomem carnes
Uma pessoa da comunidade é escolhida ao acaso. Qual é a probabilidade de ela:
a) consumir exclusivamente carne?
b) Ter o hábito alimentar de não comer nem carne nem verdura?
Vamos construir um diagrama representando carne por C e verdura por V.
comunidade
V 25
C
58 14 3
1°) Há 25 pessoas na integração de C e V.
2°) Pessoas que consomem exclusivamente verduras: 83 – 25 = 58
3°) Pessoas que consomem exclusivamente carnes: 39 – 25 = 14
4°) Como 25 + 58 + 14 = 97, há 3 pessoas que não comem carnes nem verduras.
Assim, as probabilidades pedidas são:
a) 10014
= 0,14 = 14% b) 100
3 = 0,03 = 3%
42
Probabilidade e Estatística Luiz Roberto
3.7 Probabilidade da união de dois eventos
Sejam A e B eventos de um mesmo espaço amostral Ω. Vamos encontrar uma
expressão para a probabilidade de ocorrer o evento A ou o evento B, isto é, a
probabilidade da ocorrência do evento A U B.
Consideremos dois casos:
1°) eventos mutuamente exclusivos A I B = Ø
≠
Temos: n(A U B) = n(A) + n(B) Como n(Ω) 0, podemos escrever: n(A U B) n(A) n(B)
n(Ω) n(Ω) n(Ω) +
=
Ω
BA
Da definição de probabilidade, segue:
P(A U B) = p(A) + p(B) Nesse caso, A e B são chamados eventos mutuamente exclusivos. 2°) eventos com ocorrências simultâneas: A I B Ø ≠
A B
A I B
O evento A I B representa a ocorrê Exemplo 1
Uma urna contém 25 bolas numerada
dessa urna.
a) Qual é a probabilidade de o
ou de 3?
Consideremos os eventos A, “o n
múltiplo de 3”. Queremos encontrar
Da teoria dos conjuntos, temos:
n(A U B) = n(A) + n(B) – n(A I B) De modo análogo ao primeiro caso:
p(A U B) = p(A) + p(B) – p(A I B)
ncia simultânea dos eventos A e B.
s de 1 a 25. Uma bola é extraída ao acaso
número da bola sorteada ser múltiplo de 2
úmero é múltiplo de 2” e B, “o número é
p(A U B). Temos:
43
Probabilidade e Estatística Luiz Roberto
A = 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24 p(A) = = 2512
n(A)
n(Ω)
B = 3, 6, 9, 12, 15, 18, 21, 24 p(B) = = 258
n(B)
n(Ω)
A I B = 6, 12, 18, 24: é o evento formado pelos múltiplos de 2 e 3 ao mesmo
tempo, isto é, pelos múltiplos de 6. Temos: p(A I B) = 254
.
Como p(A U B) = p(A) + p(B) – p(A I B)
Temos: p(A U B) = 2512
+ 258
– 254
= 2516
= 0,64 = 64%.
b) Qual é a probabilidade de o número da bola sorteada ser múltiplo de 5
ou de 7?
A = 5, 10, 15, 20, 25 p(A) = 255
B = 7, 14, 21 p(B) = 253
Como A I B = Ø, temos:
p(A U B) = p(A) + p(B) p(A U B) = 255
+ 253
= 258
= 0,32 = 32%.
Exemplo 2
A probabilidade de um guarda rodoviário aplicar quatro ou mais multas em um
dia é de 63%; a probabilidade de ele aplicar quatro ou menos multas em um dia
é de 56%. Qual é a probabilidade de o guarda aplicar exatamente quatro
multas?
Consideremos os eventos:
A: “quatro ou mais multas”; p(A) = 0,63
B: “quatro ou menos multas”; p(B) = 0,56
Temos:
1°) A B é o evento “guarda aplica exatamente quatro multas”. Queremos
determinar p(A I B).
I
2°) A B = (em um dia o guarda aplica menos de quatro multas, ou quatro
multas, ou mais de quatro multas).
U
44
Probabilidade e Estatística Luiz Roberto
Assim, p(A U B) = p(Ω) = 1 (pois A U B é o evento certo). Daí:
P(A U B) = p(A) + p(B) – p(A I B)
1 = 0,63 + 0,56 - p(A I B) p(A I B) = 0,19 = 19%
Exemplo 3
Observe a roleta da figura abaixo e pense na probabilidade existente de saída
para cada número.
a) Qual a probabilidade de cada evento elementar?
P(1) = P(2) = P(4) = P(5) = P(6) = P(7) = 1/8 P(3) = 2/8
b) Qual a probabilidade de o número ser par? P(2,4,6) = 3/8
c) Qual a probabilidade de dar o número 3? P(3) = 2/8 = 1/4
3.8 Experiência Composta
Também pode nos interessar o cálculo da probabilidade de uma
experiência composta, ou seja, a realização de dois ou mais experimentos
aleatórios simples.
Nesses casos, a freqüência relativa esperada para cada resultado
possível do experimento é obtida a partir do produto das freqüências
relativas esperadas de cada elemento que compõe o referido resultado.
Exemplo:
Temos uma moeda e duas caixas cheias de bolas coloridas. Na caixa A
temos duas bolas vermelhas e cinco pretas, enquanto na B há quatro bolas
vermelhas e uma bola azul.
Imagine a seguinte experiência composta: lançamos uma moeda; se der
"cara", extraímos uma bola da caixa A; e se der "coroa", uma bola da caixa B.
Em seguida, vamos representar por um diagrama em árvore os resultados
possíveis da experiência composta.
Vamos Indicar também as freqüências relativas esperadas para cada
experiência parcial.
Como observamos no esquema da figura anterior, o espaço amostral é:
= (cara, vermelha), (cara, preta), (coroa, vermelha), (coroa, azul)
45
Probabilidade e Estatística Luiz Roberto
cara
coroa
51
54
75
72 vermelha
21
21
preta
vermelha
azul
O objetivo é definir uma probabilidade para o conjunto , que
representa os resultados possíveis da experiência composta.
A relação de freqüência é obtida atribuindo-se a cada resultado o
produto das freqüências relativas esperadas, que aparecem em cada ramo
completo do diagrama em árvore da figura.
Desta maneira, comprovamos que a relação de freqüência, neste caso, é a
seguinte:
Elemento Imagem
cara, vermelha 1/2 x 2/7 = 2/14
cara, preta 1/2 x 5/7 = 5/14
coroa, vermelha 1/2 x 4/7 = 4/14
coroa, azul 1/2 x 1/7 = 1/10
Agora podemos calcular a probabilidade de qualquer evento dessa
experiência composta.
3.9 Probabilidade condicional
Seja E: lançar um dado e o evento A = sair o n° 3. Então, P(A) = 61
Considere agora o evento B = sair um número ímpar = 1, 3, 6.
É de grande importância para o cálculo das probabilidades se calcular
a probabilidade condicional. No exemplo, pode-se querer avaliar a
probabilidade do evento A condicionada à ocorrência do evento B. Em símbolos,
46
Probabilidade e Estatística Luiz Roberto
designa-se por P(A/B) e lê-se: “probabilidade do evento A condicionada à
ocorrência de B”, ou melhor, “probabilidade de A dado B”.
Assim: P(A/B) = 1/3.
Obs: dada a ocorrência de um evento, teremos a redução do espaço-amostra; no
caso, = 1, 2, 3, 4, 5, 6 foi reduzido para `= 1, 3, 5 e é neste
espaço-amostra reduzido que se avalia a probabilidade do vento.
Definição: Dados dois eventos, A e B, denota-se P(A/B) a probabilidade
condicionada do evento A, quando B tiver ocorrido, por:
com P(B) 0, pois B já ocorreu
≠P(A B) IP(B)
P(A/B) =
Vamos encontrar uma fórmula para o cálculo da probabilidade condicional:
P(A I B)
I
I
NCF (B)
NCF(A B) =
NTC
NCF(B) =
NCF(A B)
NTC
P(B)
NTC = Número total de casos
P(A/B) =
Desta maneira, para calcular a probabilidade de A dado B, basta contar o
número de casos favoráveis ao evento A I B: [NCF(A I B)] e dividir pela
quantidade de casos favoráveis ao evento B: [NCF(B)].
Exemplo: Dois dados são lançados. Consideremos os eventos:
A = (X1, X2)/ X1 + X2 = 10 e B = (X1, X2)/ X1 > X2
Onde X1 é o resultado do dado 1 e X2 é o resultado do dado 2.
Calcular P(A); P(B); P(A/B); P(B/A)
Solução
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
Ω =
NCF ao evento A
363
121= P(A) = =
NTC
Obs: apenas o par (6,4) é favorável
ao evento (A B). I
1
3
NCF a (A I B) P(A/B) = =
NTC a B
47
Probabilidade e Estatística Luiz Roberto
4 ESTATÍSTICA BÁSICA
4.4 CONCEITOS FUNDAMENTAIS
A Estatística pode ser encarada como uma ciência ou como um método de
estudo. Duas concepções para a palavra ESTATÍSTICA:
a) no plural (estatísticas), indica qualquer coleção consistente de dados
numéricos, reunidos com a finalidade de fornecer informações acerca de uma
atividade qualquer. Por exemplo, as estatísticas demográficas referem-se
aos dados numéricos sobre nascimentos, falecimentos, matrimônios,
desquites, etc.
b) no singular (estatística), indica um corpo de técnicas, ou ainda uma
metodologia técnica desenvolvida para a coleta, a classificação, a
apresentação, a análise e a interpretação de dados quantitativos e a
utilização desses dados para a tomada de decisões.
Qualquer ciência experimental não pode prescindir das técnicas proporcionadas
pela Estatística, como por exemplo, a Física, a Biologia, a Administração, a
Economia, etc. Todos esses ramos de atividade profissional tem necessidade de
um instrumental que se preocupa com o tratamento quantitativo dos fenômenos
de massa ou coletivos, cuja mensuração e análise requerem um conjunto de
observações de fenômeno ou particulares.
DEFINIÇÃO DE ESTATÍSTICA
Estatística é a ciência que se preocupa com a coleta, a organização,
descrição (apresentação), análise e interpretação de dados experimentais e
tem como objetivo fundamental o estudo de uma população.
Este estudo pode ser feito de duas maneiras:
• Investigando todos os elementos da população ou
• Por amostragem, ou seja, selecionando alguns elementos da população.
48
Probabilidade e Estatística Luiz Roberto
Modelagem
Planejamento
Experimentação
ex
Exp
e
r
P
C
Conclusão 4.5 DIV Estatísti
classific
fenômeno
descrever
Estatísti
uma amost
origem e
A estatís
O
margem de
obter par
caracterí
Formulação e análise do Problema
lanejamento do
projeto
Formulação do modelo
conceitual
oleta de macro informações
ISÃO DA ESTATÍSTICA
EstatíDescr
ca Descritiva: é aq
ação,apresentação,
através de gráficos
o fenômeno.
ca Indutiva (Amostr
ra, estabelece hi
que formula previsõ
tica indutiva cuida
processo de gener
incerteza. Isto se
a o conjunto de tod
sticas comuns basei
Coleta de dados
Tradução do
modelo
Verificação e validação do modelo
stica itiva
MétodosEstatístic
uela que se preoc
interpretação e a
e tabelas além d
al ou Inferencial)
póteses, tira con
es fundamentando-se
da análise e inter
alização do método
deve ao fato de q
os os indivíduos an
a-se em uma parcela
49
Projeto perimental
erimentação
Análise statística
dos esultados
EstatístiInferenci
os
upa com a coleta
nalise de dados
e calcular medid
: é a aquela q
clusões sobre a
na teoria das
pretação dos dad
indutivo está a
ue a conclusão q
alisados quanto
do total de obs
Comparação e identificação das melhores
soluções
Documentação Apresentação
dos resultados Implementação
ca al
, organização,
referentes ao
as que permita
ue partindo de
população de
probabilidades.
os.
ssociado a uma
ue se pretende
a determinadas
ervações.
Probabilidade e Estatística Luiz Roberto
PPooppuullaaççããoo?? Envolve: • Estimação • Teste de Hipótese
Propósito:
• Tomar Decisões sobre as características da População
PPooppuullaaççããoo
AAmmoossttrraa
EEssttaattííssttiiccaa AAmmoossttrraall
(( XX ))
EEssttiimmaattiivvaass && tteesstteess
4.6 POPULAÇÃO
É o conjunto, finito ou infinito, de indivíduos ou objetos que
apresentam em comum determinadas características definidas, cujo
comportamento interessa analisar.
A população é estudada em termos de observações de características nos
indivíduos (animados ou inanimados) que sejam relevantes para o estudo, e não
em termos de pessoas ou objetos em si. O objetivo é tirar conclusões sobre o
fenômeno em estudo, a partir dos dados observados.
Como em qualquer estudo estatístico temos em mente estudar uma ou mais
características dos elementos de uma população, é importante definir bem
essas características de interesse para que seja delimitado os elementos que
pertencem à população e quais os que não pertencem.
50
Probabilidade e Estatística Luiz Roberto
Exemplos:
1. Estudar os filhos tidos, tipo de moradia, condições de trabalho, tipo de
sanitário. Números de quartos para dormir, estado civil, uso da terra, tempo
de trabalho, local de nascimento, tipo de cultivo, etc., dos agricultores do
Estado do Amazonas.
População: Todos os agricultores (proprietários de terra ou não) plantadores
das culturas existentes no Estado do Amazonas.
2. Estudar a precipitação pluviométrica anual (em mm) na cidade de Manaus.
População: Conjunto das informações coletadas pela Estação Pluviométrica,
durante o ano.
4. As alturas dos cidadãos do Amazonas constituem uma população ou a
população dos pesos desses cidadãos.
EEssttaattííssttiiccaa IInnffeerreenncciiaall ((PPrroobbaabbiilliiddaaddee))
EEssttaattííssttiiccaa DDeessccrriittiivvaa
AAmmoossttrraaggeemm
Dados População
Divisão Da População
- População Finita: apresenta um número limitado de elementos. É possível
enumerar todos os elementos componentes.
Exemplos:
1. Idade dos universitários do Estado do Pará.
População: Todos os universitários do Estado do Pará.
- População Infinita: apresenta um número ilimitado de elementos. Não é
possível enumerar todos os elementos componentes.
Entretanto, tal definição existe apenas no campo teórico, uma vez que,
na prática, nunca encontraremos populações com infinitos elementos, mas sim,
51
Probabilidade e Estatística Luiz Roberto
populações com grande número de componentes; e nessas circunstâncias, tais
populações são tratadas como se fossem infinitas.
Exemplos:
1. Tipos de bactérias no corpo humano
População: Todas as bactérias existentes no corpo humano.
2. Comportamento das formigas de certa área
População: Todas as formigas da área em estudo.
4.4 AMOSTRAGEM
É a coleta das informações de parte da população, chamada
amostra (representada por pela letra “n”), mediante métodos adequados de
seleção destas unidades.
4.5 AMOSTRA
É uma parte (um subconjunto finito) representativa de uma
população selecionada segundo métodos adequados.
O objetivo é fazer inferências, tirar conclusões sobre populações
com base nos resultados da amostra, para isso é necessário garantir que
amostra seja representativa, ou seja, a amostra deve conter as mesmas
características básicas da população, no que diz respeito ao fenômeno que
desejamos pesquisar.
O termo indução é um processo de raciocínio em que, partindo-se do
conhecimento de uma parte, procura-se tirar conclusões sobre a realidade no
todo.
Ao induzir estamos sujeitos a erros. Entretanto, a Estatística
Indutiva, que obtém resultados sobre populações a partir das amostras, diz
qual a precisão dos resultados e com que probabilidade se pode confiar nas
conclusões obtidas.
4.6 CENSO
É o exame completo de toda população.
Quanto maior a amostra, mais precisas e confiáveis deverão ser as
induções feitas sobre a população. Logo, os resultados mais perfeitos são
obtidos pelo Censo. Na prática, esta conclusão muitas vezes não acontece: o
emprego de amostras, com certo rigor técnico, pode levar a resultados mais
52
Probabilidade e Estatística Luiz Roberto
confiáveis ou até mesmo melhores do que os que seriam obtidos através de um
Censo.
As razões de se recorrer a amostras são: menor custo e tempo para
levantar dados; melhor investigação dos elementos observados.
4.7 TIPOS DE VARIÁVEIS
Variável Qualitativa
Quando seus valores são expressos por atributos ou qualidade.
Exemplos:
1) População: Estudantes universitários do Estado do Pará.
Variáveis: sexo, profissão, escolaridade, religião, meio onde vivem (rural,
urbano).
2) População: População dos bairros periféricos do município de Belém.
Variáveis: tipo de casa, existência de água encanada (sim, não), bairro de
origem.
Variáveis qualitativas que não são ordenáveis recebem o nome de nominais.
Exemplo: religião, sexo, raça, cor.
Raça do AM - 2005
Raça Freqüência
Branca Negra Parda Outra Total
F onte: Fictícia
Variáveis qualitativas que são ordenáveis recebem o nome de ordinais.
Exemplo: nível de instrução, classe social.
Classe social do AM - 2005 Classe social Freqüência
Classe A Classe B Classe C Classe D Total
Fonte: Fictícia
53
Probabilidade e Estatística Luiz Roberto
Variável Quantitativa
Quando seus valores são expressos por números. Esses números podem ser
obtidos por um processo de contagem ou medição.
Exemplos:
1) População: Todos os agricultores do Estado do Pará.
Variáveis: número de filhos tidos, extensão da área plantada, altura, idade.
2) População: População dos bairros periféricos do município de Belém
Variáveis: número de quartos, área da casa em m2, número de moradores.
A VARIÁVEL QUANTITATIVA DIVIDE-SE EM:
a. Variável Discreta: são aquelas que podem assumir apenas valores inteiros
em pontos da reta real. É possível enumerar todos os possíveis valores da
variável.
Exemplos:
. População: Universitários do Estado do Pará.
Variáveis: número de filhos, número de quartos da casa, número de moradores,
número de irmãos.
b. Variável Contínua: são aquelas que podem assumir qualquer valor num certo
intervalo (contínuo) da reta real. Não é possível enumerar todos os possíveis
valores.
. População: Todos os agricultores do Estado do Pará.
Variáveis: idade, renda familiar; extensão da área plantada (em m2 ) , peso e
altura das crianças agricultoras.
4.8 DEFINIÇÃO DO PROBLEMA
A primeira fase do trabalho estatístico consiste em uma definição ou
formulação correta do problema a ser estudado e a seguir escolher a natureza
dos dados. Além de considerar detidamente o problema objeto de estudo o
54
Probabilidade e Estatística Luiz Roberto
analista deverá examinar outros levantamentos realizados no mesmo campo e
análogos, uma vez que parte da informação de que necessita pode, muitas
vezes, ser encontrada nesses últimos. Saber exatamente aquilo que pretende
pesquisar é o mesmo que definir de maneira correta o problema.
Por exemplo:
- os preços dos produtos agrícolas produzidos no Estado do Pará são menores
do que àqueles originados de outros Estados?
- qual a natureza e o grau de relação que existe entre a distribuição da
pluviosidade e a colheita do produto x?
- estudar uma população por sexo: dividi-se os dois grupos em masculino e
feminino;
- estudar a idade dos universitários, por grupos de idade: distribui-se o
total de casos conhecidos pelos diversos grupos etários pré-estabelecidos;
- Analisar a capacidade de germinação de certo tipo de cereal:
• Calcular a média, a mediana e a moda do número de sementes germinadas, ou
seja, descrever com alguns valores resultados obtidos.
• Representar graficamente os resultados.
• Calcular a proporção de vasos com mais de três sementes germinadas.
4.9 DEFINIÇÃO DOS OBJETIVOS (GERAL E ESPECÍFICO)
É definir com exatidão o que será pesquisado.
É recomendável ter em vista um objetivo para o estudo, em lugar de
coletar o material e definí-lo no decorrer do trabalho ou só no fim deste.
Objetivos mais comuns em uma pesquisa:
. Dados pessoais: grau de instrução, religião, nacionalidade, dados
profissionais, familiares, econômicos, etc.
. Dados sobre comportamento: como se comportam segundo certas circunstâncias.
Ex: possível remanejamento da área habitada.
. Opiniões, expectativas, níveis de informação, angústias, esperanças,
aspirações sobre certos assuntos.
. Dados sobre as condições habitacionais e de saneamento que avalie as
condições em que vivem e a qualidade de vida de certo grupo.
55
Probabilidade e Estatística Luiz Roberto
4.10 PLANEJAMENTO
Resultados / Conclusões
Metodologia de
estudo
Metodologia
Estatística
Análise e interpretação dos dados
Apresentação dos dados
Coleta e crítica e apuração dos dados
Planejamento da pesquisa
Definição do Problema / Objetivos
O problema está definido. Como resolvê-lo? Se através de amostra, esta
deve ser significativa para que represente a população.
O planejamento consiste em se determinar o procedimento necessário para
resolver o problema e, em especial, como levantar informações sobre o assunto
objeto de estudo. Que dados deverão ser coletados? Como se deve obtê-los? É
preciso planejar o trabalho a ser realizado tendo em vista o objetivo que se
pretende atingir.
É nesta fase que será escolhido o tipo de levantamento a ser utilizado,
que podem ser:
a) levantamento censitário, quando a contagem for completa, abrangendo todo o
universo;
b) levantamento por amostragem, quando a contagem for parcial.
Outros elementos importantes que devem ser tratados nessa fase são o
cronograma das atividades, através do qual são fixados os prazos para as
várias fases, os custos envolvidos, o exame das informações disponíveis, o
delineamento da amostra, a forma como serão coletados os dados, os setores ou
áreas de investigação, o grau de precisão exigido e outros.
4.11 COLETA DOS DADOS
Refere-se a obtenção, reunião e registro sistemático de dados, com o
objetivo determinado.
56
Probabilidade e Estatística Luiz Roberto
A escolha da fonte de obtenção dos dados está diretamente relacionada
ao tipo do problema, objetivos do trabalho, escala de atuação e
disponibilidade de tempo e recursos.
a) Fontes primárias: é o levantamento direto no campo através de mensurações
diretas ou de entrevistas ou questionários aplicados a sujeitos de interesse
para a pesquisa.
Vantagens: grau de detalhamento com respeito ao interesse dos quesitos
levantados; maior precisão das informações obtidas.
b) Fontes secundárias: quando são publicados ou registrados por outra
organização.
A coleta de dados secundários se realiza através de documentos
cartográficos (mapas, cartas, imagens e fotografias obtidas por sensor remoto
ou por fotogrametria e imagens de radar). Estas fontes de informação são de
extrema importância.
Das fotografias aéreas em escalas reduzidas ou mais detalhadas, das
imagens de radares ou satélite e de cartas obtêm-se informações quanto ao uso
do solo, drenagem, estruturas viárias e urbanas, povoamento rural, recursos
florísticos, minerais e pedológicos, estrutura fundiária e de serviços, dados
altimétricos, etc.
Vantagens: inclui um processo de redução e agregação de informações.
A coleta dos dados pode ser feita de forma direta ou indireta.
4.12 CRÍTICA DOS DADOS
A crítica dos dados deve ser feita com cuidado através de um trabalho
de revisão e correção, ao qual chamamos de crítica (consistência), a fim de
não de incorrer em erros que possam afetar de maneira sensível os resultados.
As perguntas dos questionários uniformemente mal compreendidas, os
enganos evidentes, tais como somas erradas, omissões, trocas de respostas e
etc, são fáceis de corrigir. É necessário, entretanto, que o crítico não faça
a correção por simples suposição sua, mas sim que tenha chegado a conclusão
absoluta do engano.
Quelet dividiu a crítica em: externa e interna.
A crítica externa refere-se as imperfeições porventura existentes na
coleta dos dados, por deficiência do observador, por imperfeição do
instrumento de trabalho, por erro de registro nas fichas, imprecisão nas
respostas aos quesitos propostos e outros fatores de erro que justificam um
57
Probabilidade e Estatística Luiz Roberto
verificação minuciosa dos dados coletados antes de iniciar a elaboração do
trabalho de análise.
A crítica interna diz respeito a verificação da exatidão das
informações obtidas. É mister examinar as respostas dadas, sanando
imperfeições e omissões, de forma que os dados respondam com precisão aos
quesitos formulados.
As informações relativas a profissão não devem ser vagas como, por
exemplo: operário, mas sim, oleiro, pedreiro, carpinteiro, etc., conforme o
caso.
O estado civil será declarado: solteiro, casado, viúvo ou desquitado.
Em resumo, os dados devem sofrer uma crítica criteriosa com o objetivo
de afastar os erros tão comuns nessa natureza de trabalho. As informações
inexatas ou omissas devem ser corrigidas. Os questionários devem voltar a
fonte de origem sempre que se fizerem necessário sua correção ou
complementação.
4.13 APURAÇÃO (ARMAZENAMENTO) DOS DADOS
É um processo de apuração ou sumarização que consiste em resumir os
dados através de sua contagem ou agrupamento. É um trabalho de condensação e
de tabulação dos dados, que chegam ao analista de forma desorganizada.
Através da apuração, se tem a oportunidade de condensar os dados de
modo a obter um conjunto compacto de números, o qual possibilita distinguir
melhor o comportamento do fenômeno na sua totalidade.
Os dados de fenômenos geográficos podem ser organizados em mapas,
tabelas, matrizes, disquetes ou fitas.
4.14 EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS
Há duas formas de apresentação que não se excluem mutuamente:
Apresentação Tabular
É uma apresentação numérica dos dados. Consiste em dispor os dados em
linhas e colunas distribuídos de modo ordenado, segundo algumas regras
práticas adotadas pelo Conselho Nacional de Estatística. As tabelas têm a
vantagem de conseguir expor, sistematicamente em um só local, os resultados
58
Probabilidade e Estatística Luiz Roberto
sobre determinado assunto, de modo a se obter uma visão global mais rápida
daquilo que se pretende analisar.
Apresentação Gráfica
Constitui uma apresentação geométrica dos dados. Permite ao analista
obter uma visão rápida e clara do fenômeno e sua variação.
4.15 ANÁLISE E INTERPRETAÇÃO DOS DADOS
Nessa etapa, o interesse maior consiste em tirar conclusões que
auxiliem o pesquisador a resolver seu problema. A análise dos dados
estatísticos está ligada essencialmente ao cálculo de medidas, cuja
finalidade principal é descrever o fenômeno. Assim, o conjunto de dados a ser
analisado pode ser expresso por número-resumo, as estatísticas, que
evidenciam características particulares desse conjunto.
4.16 REGRAS DE ARREDONDAMENTO
De acordo com as Normas de Apresentação Tabular - 3ª edição/1993 - da
Fundação IBGE, o arredondamento é feito da seguinte maneira:
1. Se o número que vai ser arredondado for seguido de 0, 1, 2, 3 ou 4 ele
deve ficar inalterado.
Número a arredondar Arredondamento para Número arredondado 6,197 Inteiro 6 12,489 Inteiro 12 20,733 Décimos 20,7 35,992 Centésimos 35,99
2. Se o número que vai ser arredondado for seguido de 5, 6, 7, 8 ou 9 ele
deve ser acrescido de uma unidade.
Número a arredondar Arredondamento para Número arredondado 15,504 Inteiro 16 21,671 Inteiro 22 16,571 Décimos 16,6 17,578 Centésimos 17,58 215,500 Inteiros 216 216,500 inteiros 217 216,750 décimos 216,8 216,705 centésimos 216,71
59
Probabilidade e Estatística Luiz Roberto
OBS: Não faça arredondamento sucessivos
Ex.: 17,3452 passa a 17,3 e não para 17,35 , para 17,4.
Se houver necessidade de um novo arredondamento, voltar aos dados originais.
Tabela 3.1: Produção de Café
Brasil - 1978-1983
Anos Quantidade (1000 ton)
1978 (1) 2535 1979 2666 1980 2122 1981 3760 1982 2007 1983 2500
Fonte: Fictícia Nota: Produção destinada para o consumo interno. (1) Parte exportada para a Argentina.
Denomina-se SÉRIE ESTATÍSTICA toda tabela que apresenta a distribuição
de um conjunto de dados estatísticos em função da ÉPOCA, do LOCAL, ou da
ESPÉCIE (fenômeno).
Numa série estatística observa-se a existência de três elementos ou
fatores: o TEMPO, o ESPAÇO e a ESPÉCIE.
Conforme varie um desses elementos, a série estatística classifica-se
em TEMPORAL, GEOGRÁFICA e ESPECÍFICA.
4.17 SÉRIE TEMPORAL, HISTÓRICA OU CRONOLÓGICA
É a série cujos dados estão em correspondência com o tempo, ou seja,
variam com o tempo.
Tabela 3.2: Produção Brasileira de Trigo 1988-1993
Anos Quantidade (1000 ton)
1988 (1) 2345 1989 2451 1990 2501 1991 2204 1992 2306 1993 2560
Fonte: IBGE Nota: Produção voltada para o consumo interno.
(1) Parte da produção exportada.
. Elemento variável: tempo (fator cronológico)
. Elemento fixo: local (fator geográfico) e o fenômeno (espécie)
60
Probabilidade e Estatística Luiz Roberto
4.18 GRÁFICOS ESTATÍSTICOS
A Estatística Descritiva pode descrever os dados através de gráficos.
A apresentação gráfica é um complemento importante da apresentação
tabular. A vantagem de um gráfico sobre a tabela está em possibilitar uma
rápida impressão visual da distribuição dos valores ou das freqüências
observadas. Os gráficos propiciam uma idéia inicial mais satisfatória da
concentração e dispersão dos valores, uma vez que através deles os dados
estatísticos se apresentam em termos de grandezas visualmente interpretáveis.
REQUISITOS FUNDAMENTAIS EM UM GRÁFICO:
a. Simplicidade: possibilitar a análise rápida do fenômeno observado. Deve
conter apenas o essencial.
b. Clareza: possibilitar a leitura e interpretações correta dos valores do
fenômeno.
c. Veracidade: deve expressar a verdade sobre o fenômeno observado.
TIPOS DE GRÁFICOS QUANTO A FORMA:
a. Diagramas: gráficos geométricos dispostos em duas dimensões. São mais
usados na representação de séries estatísticas.
b. Cartogramas: é a representação sobre uma carta geográfica, sendo muito
usado na Geografia, História e Demografia.
c. Estereogramas: representam volumes e são apresentados em três dimensões.
d. Pictogramas: a representação gráfica consta de figuras representativas do
fenômeno. Desperta logo a atenção do público.
CLASSIFICAÇÃO DOS GRÁFICOS QUANTO AO OBJETIVO
Gráficos de informação
O objetivo é proporcionar uma visualização rápida e clara da
intensidade das categorias ou dos valores relativos ao fenômeno. São gráficos
tipicamente expositivos, devendo ser o mais completo possível, dispensando
comentários explicativos.
61
Probabilidade e Estatística Luiz Roberto
Características:
- deve conter título em letra de forma;
- as legendas podem ser omitidas, desde que as informações presentes
possibilitem a interpretação do gráfico.
Gráficos de análise
Estes gráficos fornecem informações importantes na fase de análise dos
dados, sendo também informativos.
Os gráficos de análise, geralmente, vêm acompanhado de uma tabela e um
texto onde se destacam os pontos principais revelados pelo gráfico ou pela
tabela.
4.19 PRINCIPAIS TIPOS DE GRÁFICOS
4.19.1 GRÁFICOS EM CURVAS OU EM LINHAS
São usados para representar séries temporais, principalmente quando a
série cobrir um grande número de períodos de tempo.
Considere a série temporal:
Tabela 4.1 Produção de Arroz do Município X - 1984-1994
Anos Quantidade (1000 ton)
1984 816 1985 904 1986 1.203 1987 1.147 1988 1.239 1989 1.565 1990 1.620 1991 1.833 1992 1.910 1993 1.890 1994 1.903
Fonte: Fictícia
62
Probabilidade e Estatística Luiz Roberto
Gráfico 4.1. Produção de Arroz do Município X - 1984-1994
0
500
1000
1500
2000
2500
84 85 86 87 88 89 90 91 92 93 94
(1000 ton)
4.19.2 GRÁFICOS EM COLUNAS
É a representação de uma série estatística através de retângulos,
dispostos em colunas (na vertical) ou em retângulos (na horizontal). Este
tipo de gráfico representa praticamente qualquer série estatística.
As regras para a construção são as mesmas do gráfico em curvas.
As bases das colunas são iguais e as alturas são proporcionais aos
respectivos dados.
Exemplo: Tabela 4.2 Produção de Soja do Município X - 1991-1995
Anos Quantidade (ton.)
1991 117.579 1992 148.550 1993 175.384 1994 220.272 1995 265.626
Fonte: Secretaria Municipal de Agricultura
Para cada ano é construída uma coluna, variando a altura (proporcional
a cada quantidade). As colunas são separadas uma das outras.
Observação: O espaço entre as colunas pode variar de 1/3 a 2/3 do tamanho da
base da coluna.
63
Probabilidade e Estatística Luiz Roberto
0
50000
100000
150000
200000
250000
300000
Tone
lada
s
1991 1992 1993 1994 1995
Gráfico 4.2. Produção de Soja do Município X - 1991-1995
Uso do gráfico em colunas para representar outras séries estatísticas
Tabela 4.3 Áreas (Km2) das Regiões Fisiográficas - Brasil - 1966
Regiões Fisiográficas Área (Km2)
Norte 3.581.180 Nordeste 965.652 Sudeste 1.260.057 Sul 825.621 Centro-oeste 1.879.965
Brasil 8.511.965 Fonte: IBGE.
0
500.000
1.000.000
1.500.000
2.000.000
2.500.000
3.000.000
3.500.000
4.000.000Km2
Norte Nordeste Sudeste Sul Centro-Oeste
Grafico 4.3. Áreas (Km2) das Regiões Fisiográficas - Brasil - 1966.
Obs: Na tabela as regiões são apresentadas em ordem geográficas. No gráfico
as colunas são ordenadas pela altura, da maior para a menor, da esquerda para
a direita.
64
Probabilidade e Estatística Luiz Roberto
4.19.7 GRÁFICOS EM BARRAS
As alturas dos retângulos são iguais e arbitrárias e os comprimentos
são proporcionais aos respectivos dados.
As barras devem ser separadas uma das outras pelo mesmo espaço de forma
que as inscrições identifiquem as diferentes barras. O espaço entre as barras
pode ser a metade (½) ou dois terços(2/3) de suas larguras.
As barras devem ser colocadas em ordem de grandeza de forma decrescente
para facilitar a comparação dos valores. A categoria “outros” (quando
existir) são representadas na barra inferior, mesmo que o seu comprimento
exceda o de alguma outra.
Outra representação gráfica da Tabela 4.3:
0
500.000
1.000.000
1.500.000
2.000.000
2.500.000
3.000.000
3.500.000
4.000.000
Km2
Norte
Centro-Oeste
Sudeste
Nordeste
Sul
Grafico 4.4. Áreas (Km2) das Regiões Fisiográficas - Brasil - 1966.
Tabela 4.4 Matrícula no Ensino Superior, segundo os ramos de ensino -Brasil - 1995 Ramos de ensino Matrículas
Filosofia, Ciências e Letras 44.802 Direito 36.363
Engenharia 26.603 Administração e Economia 24.027
Medicina 17.152 Odontologia 6.794 Agricultura 4.852
Serviço Social 3.121 Arquitetura e Urbanismo 2.774
Farmácia 2.619 Demais ramos 11.002
Total 180.109
65
Probabilidade e Estatística Luiz Roberto
05000
1000015000
2000025000
3000035000
4000045000
Matrículas
Filosofia, Ciências e Letras
Direito
Engenharia
Administração e Econômia
Medicina
Odontologia
Agricultura
Serviço Social
Arquitetura e Urbanismo
Farmácia
Demais ramos
Grafico 4.5. Matrícula efetiva no Ensino Superior, segundo os ramos de ensino - Brasil - 1999.
OBS: Quando a variável em estudo for qualitativa e os nomes das categorias
for extenso ou as séries forem geográficas ou específicas é preferível o
gráfico em barras, devido a dificuldade em se escrever a legenda em baixo da
coluna.
4.19.8 GRÁFICO EM COLUNAS MÚLTIPLAS (AGRUPADAS)
É um tipo de gráfico útil para estabelecer comparações entre as
grandezas de cada categoria dos fenômenos estudados.
A modalidade de apresentação das colunas é chamado de Gráfico de
Colunas Remontadas. Ele proporciona economia de espaços sendo mais indicado
quando a série apresenta um número significativo de categorias.
Exemplo: Tabela 4.5 Entrada de migrantes em três Estados do Brasil - 1992-1994
Número de migrantes
Anos Total Estados
Amapá São Paulo Paraná 1992 4.526 2.291 1.626 609 1993 4.633 2.456 1.585 592 1994 4.450 2.353 1.389 708
Fonte: Fictícia
66
Probabilidade e Estatística Luiz Roberto
0
500
1000
1500
2000
2500
Qua
ntid
ade
1992 1993 1994
Gráfico 4.6. Entrada de migrantes em três Estados do Brasil1992-1994.
Amapá São Paulo Paraná
4.19.9 GRÁFICO EM BARRAS MÚLTIPLAS (AGRUPADAS)
Útil quando a variável for qualitativa ou os dizeres das categorias a
serem escritos são extensos.
Exemplo:
Tabela 4.6
Importação de vinho e champanhe (BR) proveniente de várias origens - 1994 Países
Importação (1.000 dólares)
Vinho Champanhe Portugal 220 15 Itália 175 25 França 230 90 Argentina 50 5 Chile 75 20 Espanha 110 16
0 50 100 150 200 250
1000 dólares
França
Portugal
Itália
Espanha
Chile
Argentina
Gráfico 4.7. Importação Brasileira de vinho e champanhe proveniente de várias origens - 1994.
Vinho Champanhe
67
Probabilidade e Estatística Luiz Roberto
4.19.10 GRÁFICO EM SETORES
É a representação gráfica de uma série estatística em um círculo de
raio qualquer, por meio de setores com ângulos centrais proporcionais às
ocorrências.
É utilizado quando se pretende comparar cada valor da série com o
total.
O total da série corresponde a 360° (total de graus de um arco de
circunferência).
O gráfico em setores representam valores absolutos ou porcentagens
complementares.
As séries geográficas, específicas e as categorias em nível nominal são
mais representadas em gráficos de setores, desde que não apresentem muitas
parcelas (no máximo sete).
Cada parcela componente do total será expressa em graus, calculada
através de uma regra de três:
Total - 360° Parte - x°
Exemplo: Tabela 4.7 Produção Agrícola do Estado A - 1995
Produtos Quantidade (t) Café 400.000 Açúcar 200.000 Milho 100.000 Feijão 20.000 Total 720.000
Fonte: Fictícia
Gráfico 4.8. Produção Agrícola do Estado A - 1995.
Café55%Açucar
28%
Milho14%
Feijão3%
Outras maneiras de representar graficamente a Tabela 4.7:
68
Probabilidade e Estatística Luiz Roberto
050.000
100.000150.000200.000250.000300.000350.000400.000
Quantidade (t)
Café Açucar Milho Feijão
Gráfico 4.9. Produção Agrícola do Estado A - 1995.
050.000
100.000
150.000
200.000
250.000
300.000
350.000
400.000Quantidade (t)
Café
Açucar
Milho
Feijão
Gráfico 4.10. Produção Agrícola do Estado A - 1995.
4.20 DISTRIBUIÇÃO DE FREQÜÊNCIAS
As tabelas estatísticas, geralmente, condensam informações de fenômenos
que necessitam da coleta de grande quantidade de dados numéricos. No caso das
distribuições de freqüências que é um tipo de série estatística, os dados
referentes ao fenômeno objeto de estudo se repetem na maioria das vezes
sugerindo a apresentação em tabela onde apareçam valores distintos um dos
outros.
DISTRIBUIÇÃO DE FREQÜÊNCIA PARA DADOS AGRUPADOS
É a série estatística que condensa um conjunto de dados conforme as
freqüências ou repetições de seus valores. Os dados encontram-se dispostos em
classes ou categorias junto com as freqüências correspondentes. Os elementos
69
Probabilidade e Estatística Luiz Roberto
época, local e fenômeno são fixos. O fenômeno apresenta-se através de
gradações, ou seja, os dados estão agrupados de acordo com a intensidade ou
variação quantitativa gradual do fenômeno.
REPRESENTAÇÃO DOS DADOS AMOSTRAIS OU POPULACIONAIS
a. Dados brutos: são aqueles que não foram numericamente organizados, ou
seja, estão na forma com que foram coletados.
Tabela 4.1 - Número de filhos de um grupo de 50 casais 2 3 0 2 1 1 1 3 2 5 6 1 1 4 0 5 6 0 2 1 4 1 3 1 7 6 2 0 1 3 1 3 5 7 1 3 1 1 0 3 0 4 1 2 2 1 2 3 2
1
b. Rol: é a organização dos dados brutos em ordem de grandeza crescente ou decrescente. Tabela 4.2 - Número de filhos de um grupo de 50 casais 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7
A simples observação dos dados brutos apresentados na Tabela 4.1 não
nos permite explicar o comportamento das variáveis em estudo.
Um primeiro passo a ser dado, na obtenção de informações mais resumidas
e precisas a respeito do comportamento das variáveis, é a construção de
tabelas de freqüência.
Para cada variável estudada, contamos o número de vezes que ocorre cada
uma das suas realizações (ou valores). O número obtido é chamado freqüência
absoluta e indicado por ni (cada realização de uma variável apresenta um
valor para n).
Considerando as realizações da variável “número de filhos”, temos os
seguintes valores de ni (conforme Tabela 4.2):
O filhos: 6 4 filhos: 3
1 filho: 16 5 filhos: 3
2 filhos: 9 6 filhos: 3
3 filhos: 8 7 filhos: 2
70
Probabilidade e Estatística Luiz Roberto
c. Distribuição de freqüências: é a disposição dos valores com as respectivas
freqüências. O número de observações ou repetições de um valor, em um
levantamento qualquer, é chamado freqüência desse valor. Uma tabela de
freqüências é aquela onde se procura fazer corresponder os valores observados
da variável em estudo e as respectivas freqüências.
Freqüência absoluta (Fi): a freqüência absoluta não é uma medida muito
eficiente para a análise dos dados, especialmente nos caso em que se deseja
comparar a distribuição de uma mesma variável ao longo de populações
diferentes (poderíamos estar interessados em comparar o número de filhos em
vários países africanos). Assim, precisamos definir uma medida que leve em,
consideração o número total de observações colhidas.
Freqüência relativa (fi): Para isso, definimos a freqüência relativa (fi)
como a razão entre a freqüência absoluta (Fi) e o número total de observações
n, isto é:
fi = nFi
Como Fi ≤ n, segue que 0 f≤ i 1. Por esse motivo, é comum
expressar f
≤i em porcentagem.
Para expressar o resultado em termos percentuais, multiplica-se o
quociente obtido por 100.
Em % = fi = nFi
. 100
Obs 1: a soma das freqüências relativas de uma tabela de freqüência é sempre
igual a 1,00 : ∑fi = 1,00.
Obs 2: a soma das freqüências relativas percentuais de uma tabela de
freqüência é sempre igual a 100%.
c.1. Distribuição de freqüências para variável discreta
Os dados não são agrupados em classes:
Tabela 4.4 - Número de filhos de um grupo de 50 casais
71
Probabilidade e Estatística Luiz Roberto
Variável N° filhos (xi)
Freqüência absoluta: Numero de casais (Fi)
Freqüência relativa (fi) Porcentagem
0 6 6/50 = 0,12 12% 1 16 16/50 = 0,32 32% 2 9 9/50 = 0,18 18% 3 8 8/50 = 0,16 16% 4 3 3/50 = 0,06 6% 5 3 3/50 = 0,06 6% 6 3 3/50 = 0,06 6% 7 2 2/50 = 0,04 4%
Total (∑) 50 1,00 100%
Obs:
1. X: representa a variável Número de filhos.
2. xi: representa os valores que a variável assume.
3. Fi: é o número de vezes que cada valor aparece no conjunto de dados
(freqüência absoluta).
4. fi: representa a freqüência relativa
5. ∑ni = n = 50 : tamanho da amostra (ou nº de elementos observados).
c.2. Distribuição de freqüências para variável contínua
Os dados da variável são agrupados em classe (grupo de valores).
1. Dados brutos
Tabela 4.5 - Taxas municipais de urbanização (em %) no Estado de AL - 2000 8 24 46 13 38 54 44 20 17 14 18 15 30 24 20 8 24 18 9 10 38 79 15 62 23 13 62 18 8 22 11 17 9 35 23 22 37 36 8 13 10 6 92 16 15 23 37 36 8 13 44 17 9 30 26 18 37 43 14 9 28 41 42 35 35 42 71 50 52 17 19 7 28 23 29 29 58 77 72 34 12 40 25 7 32 34 22 7 44 15 9 16 31 30 2. Rol Tabela 4.6 - Rol das taxas municipais de urbanização, em AL (em %) - 2000. 6 6 7 7 7 8 8 8 8 9 9 9 9 9 10 10 11 12 13 13 13 13 14 14 14 15 15 15 15 16 16 17 17 17 17 18 18 18 18 19 20 20 22 22 22 23 23 23 23 24 24 24 25 26 28 28 29 29 30 30 30 31 32 34 34 34 35 35 35 36 37 37 38 38 40 41 42 42 43 44 44 44 46 50 52 54 58 62 62 71 72 77 79 92
72
Probabilidade e Estatística Luiz Roberto
3. Distribuição de freqüências para dados agrupados em classes Tabela 4.7 - Taxas municipais de urbanização, no Estado de AL (em %) - 2000.
Taxas (em %)
Freqüência absoluta: Número de municípios(Fi)
6 --- 16 29 16 --- 26 24 26 --- 36 16 36 --- 46 13 46 --- 56 4 56 --- 66 3 66 --- 76 2 76 --- 86 2 86 --- 96 1 Total (∑) 94
Obs: recomenda-se agrupar os valores observados em classes, tanto para
variáveis contínuas quanto para discretas. Assim, evita-se grande extensão da
tabela e a não interpretação dos valores de fenômeno.
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA
a. Amplitude total (AT): é a diferença entre o maior e o menor valor
observado no experimento.
No exemplo, tabela 4.6, AT = 92 - 6 = 86
b. Amplitude da classe (Ac): é a diferença entre o maior e o menor valor da
classe.
No exemplo, tabela 4.7, Ac = 16 - 6 = 10 ou 36 – 26 = 10.
Devemos procurar construir classes de mesma amplitude para que não haja
comprometimento na análise.
c. Classe: é cada um dos grupos de valores do conjunto de valores observados,
ou seja, são os intervalos de variação da variável.
Identifica-se uma classe pelos seus extremos ou pela ordem em que se
encontra na tabela.
6 --- 16 (1ª classe); 86 --- 96 (7ª classe)
Formas de expressar os limites das classes
20 -- 23: compreende todos os valores entre 20 e 23, inclusive os extremos.
20 ---- 23: compreende todos os valores entre 20 e 23, excluindo o 23.
20 ---- 23: compreende todos os valores entre 20 e 23, excluindo o 20.
20 ----- 23: compreende todos os valores entre 20 e 23, excluindo os extremos.
73
Probabilidade e Estatística Luiz Roberto
4.21 DISTRIBUIÇÕES CUMULATIVAS
Freqüência absoluta acumulada (Fac)
É a soma das freqüências de valores inferiores ou iguais ao valor dado.
Exemplo:
xi Fi Fac
0 5 5
1 7 12
2 2 14
∑ 14
Se quisermos incluir a freqüência relativa (fi= nFi
) nesta tabela:
xi Fi Fac fi
0 5 5 5/14
1 7 12 7/14 = 1/2
2 2 14 2/14 = 1/7
∑ 14 1
Pontos médios das classes
È a média aritmética entre o limite superior e o limite inferior da classe.
Assim, se a classe for 10-12, teremos:
Xi = 2
1210 + = 11
Histograma É a representação gráfica de uma distribuição de freqüência por meio de retângulos justapostos. Polígono de freqüência É a representação gráfica de uma distribuição de freqüência por meio de um polígono.
74
Probabilidade e Estatística Luiz Roberto
Fi Exemplo:
1 2 3 4 5 6 7 8 9 10 11 12
10 9 8 7 6 5 4 3 2 1
Idade Fi
2-4 3
4-6 5
6-8 10
8-10 6
10-12 2
∑ 26
limite das classes 4.22 MEDIDAS DE POSIÇAO (ou DE TENDÊNCIA CENTRAL)
As distribuições de freqüências para variáveis discretas e contínuas
descrevem os grupos que uma variável pode assumir. É possível visualizar a
concentração de valores de uma distribuição de freqüências. Se se localizam
no início, no meio ou no final, ou se distribuem de forma igual.
As medidas de posição são chamadas de medidas de tendência central,
devido à tendência dos dados observados se concentrarem em torno desses
valores centrais que se localizam em torno do centro de uma distribuição.
As medidas (número-resumo) mais usadas para representar um conjunto de
dados são a média, a moda e a mediana.
75
Probabilidade e Estatística Luiz Roberto
4.22.1 Média Aritmética
Histograma
X ־1,0 1,5 2,0 2,5 3,0 3,5 4,0
.3 .2 .1 .0
1ª 2ª Obs. Obs 1 2 3 4
1 1,0 1,5 2,0 2,5 2 1,5 2,0 2,5 3,0 3 2,0 2,5 3,0 3,5 4 2,5 3,0 3,5 4,0
1166 MMééddiiaass aammoossttrraaiiss DDiissttrriibbuuiiççããoo aammoossttrraall
Média aritmética – para dados não-agrupados (ou dados simples)
Seja X uma variável que assume os valores x1, x2, x3 ,..., xn. A média
aritmética simples de X, representada por x, é definida por:
∑ ++++=
n xn ... x3 x2 x1xi =
n
xin
i∑=1
ou simplesmente X = n
x∑
xi : são os valores que a variável X assume n: número de elementos da amostra observada Exemplo: A produção leiteira diária da vaca V, durante uma semana, foi de 10, 15, 14, 13, 16, 19, e 18 litros. Determinar a produção média da semana (a média aritmética).
∑ ++++=
n xn ... x3 x2 x1xi =
718 19 16 13 14 15 10 ++++++
= 15 litros
Média aritmética – para dados agrupados
Se os valores da variável forem agrupados em uma distribuição de
freqüências será usada a média aritmética dos valores x1, x2, x3 ,..., xn
ponderadas pelas respectivas freqüências absolutas: F1, F2, F3 ,..., Fn.
76
Probabilidade e Estatística Luiz Roberto
X = n
xiN
I∑
=1Fi
ou
X =n
∑ iixF
A fórmula acima será usada para as distribuições de freqüências sem classes e
com classes.
Média aritmética para dados agrupados sem classes (Média aritmética
ponderada)
Tabela 4.4 - Número de filhos de um grupo de 50 casais Número de filhos (xi)
Numero de casais
(Fi)
Fi . xi
0 6 1 16 2 9 3 8 4 3 5 3 6 3 7 2
Total (∑) 50
X = n
∑ iixF =
50117
= 2,34
X = 2,3 filhos
Os 50 casais possuem, em média 2,3 filhos.
Média aritmética para dados agrupados com classes intervalares (Dados com classes): Determinar a média aritmética da Tabela 4.7 Tabela 4.7 - Taxas municipais de urbanização, no Estado AL (em %) 1970.
Taxas (em %)
Número de Municípios
(Fi)
xi
xi . Fi
6 --- 16 29 16 --- 26 24 26 --- 36 16 36 --- 46 13 46 --- 56 4 56 --- 66 3 66 --- 76 2 76 --- 86 2 86 --- 96 1 Total (∑) 94
X = n
∑ iixF = __________ → X =
77
Probabilidade e Estatística Luiz Roberto
Propriedades da média aritmética 1ª propriedade A soma algébrica dos desvios em relação à média é zero (nula). ∑ di = ∑ (xi - x) = 0 ; onde: di são as distâncias ou afastamentos da média. Em uma distribuição simétrica, a soma algébrica dos desvios em relação à
média será igual a zero; e tenderá a zero se a distribuição for assimétrica.
Idades (xi) di = xi - x
2 d1 = 2 – 6 = -4 4 d2 = 4 – 6 = -2 6 d3 = 6 – 6 = 0 8 d4 = 8 – 6 = +2 10 d = 10 – 6 = +4 5
∑ 0
X = 5
10 8 6 4 2 ++++ = 6
2ª propriedade
Somando-se ou subtraindo-se uma constante (c) a todos os valores de uma
variável, a média do conjunto fica aumentada ou diminuída dessa constante.
Somar o valor 2 aos dados da tabela e calcular a nova média
Idades (xi) xi + 2 2 2 + 2 = 4 4 4 + 2 = 6 6 6 + 2 = 8 8 8 + 2 = 10 10 10 + 2 = 12
∑ 40
A nova média será: X = 540
= 8.
N o caso, a média aritmética anterior ficou aumentada de 2.
3ª propriedade
Multiplicando-se ou dividindo-se todos os valores de uma variável por
uma constante (c), a média do conjunto fica multiplicada ou dividida por essa
constante:
Multiplicar o valor 2 aos dados da tabela e calcular a nova média
Idades (xi) xi x 2
2 2 x 2 = 4 4 4 x 2 = 8 6 6 x 2 = 12 8 8 x 2 = 16 10 10 x 2 = 20
∑ 60
78
Probabilidade e Estatística Luiz Roberto
A nova média é: X = 560
= 12. A média aritmética ficou multiplicada por 2.
4.22.2 Esperança matemática E sperança Matemática ou Média de uma variável aleatória discreta é definida:
E[X] = µ x = = P(xµ ∑ix i)
Exemplo: E = lançamento de um dado
X = ponto obtido: 1, 2, 3, 4, 5, 6
P(X) = 6 ,
161 ,
61 ,
61 ,
61 ,
61
E(X) = 1 . 61 + 2 .
61 + 3 .
61 4 .
61 + 5 .
61 + 6 .
61 = 3,5
4.22.3 Moda (Mo)
Também chamada de norma, valor dominante ou valor típico.
Define-se a moda como o valor que ocorre com maior freqüência em
conjunto de dados.
Exemplo: Se o salário modal dos empregados de uma empresa é igual a mil
reais, este é o salário recebido pela maioria dos empregados dessa empresa.
A moda é utilizada quando os dados estão na escala nominal.
Exemplo: Sexo dos alunos – Turma A – Escola Z
Sexo Freqüência Masculino 40 Feminino 60 Total 100
A moda é sexo feminino porque tem maior freqüência. Moda – para dados não agrupados Primeiramente os dados devem ser ordenados para , em seguida,
observar o valor que tem maior freqüência.
Exemplo: Calcular a moda dos seguintes conjuntos de dados:
79
Probabilidade e Estatística Luiz Roberto
1. X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) → Mo = 6 (o valor mais freqüente)
Esse conjunto é unimodal, pois apresenta apenas uma moda. 2. Y = (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) → Mo = 2 e Mo = 4 (valores mais freqüentes) Esse conjunto é bimodal, pois apresenta duas modas. 3. Z = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) → Mo = 2, Mo = 3 e Mo = 4 (valores
mais freqüentes)
Esse conjunto é plurimodal, pois apresenta mais de duas modas.
4. W = (1, 2, 3, 4, 5, 6) → Esse conjunto é amodal porque não apresenta um
valor predominante.
Moda – para dados agrupados sem classes
Basta observar, na tabela, o valor que apresenta maior freqüência.
1º) Cálculo da moda pelo ROL
Na Tabela 4.2, o resultado 1 aparece mais vezes → Mo =1.
Tabela 4.2 - Número de filhos de um grupo de 50 casais
0 0 0 0 0 0 1 1 1 1
1 1 1 1 1 1 1 1 1 1
1 1 2 2 2 2 2 2 2 2
2 3 3 3 3 3 3 3 3 4
4 4 5 5 5 6 6 6 7 7
2º) Cálculo da moda pela distribuição de freqüências sem classes Tabela 4.4 - Número de filhos de um grupo de 50 casais Número de filhos (xi)
Numero de casais (fi)
0 6 1 16 2 9 3 8 4 3 5 3 6 3 7 2
Total (∑) 50
O valor 1 apresenta a maior freqüência. Mo = 1 Esse resultado indica que casais com um filho foi o resultado mais observado.
80
Probabilidade e Estatística Luiz Roberto
Moda – para dados agrupados com classes Tabela 4.7 – Taxas municipais de urbanização (em %) – Alagoas, 1970. Taxas(%) Número de
Municípios (fi)
6 --- 16 16 --- 26 26 --- 36 36 --- 46 46 --- 56 56 --- 66 66 --- 76 76 --- 86 86 --- 96
29 24 16 13 4 3 2 2 1
Total (∑) 94
1º passo: Identifica-se a classe de maior freqüência:
A maior freqüência é 29 (1ª classe): 6 --- 16
2º passo: Aplica-se a fórmula: Mo = 2
LsLi +
Li: limite inferior da classe modal = 6 Ls: limite superior da classe modal = 16
Mo = 2
166 + = 11
4.22.4 Mediana (Md) É uma medida de posição cujo número divide um conjunto de dados em duas
partes iguais. Por esse motivo, a mediana é considerada uma medida
separatriz. Portanto, a mediana se localiza no centro de um conjunto de
números ordenados segundo uma ordem de grandeza.
Mediana - para dados não agrupados a) O número de valores observados é impar Exemplo: Considere o conjunto de dados: X = (5, 2, 7, 10, 3, 4, 1) 1º) Colocar os valores em ordem crescente ou decrescente: X = (1, 2, 3, 4, 5, 7, 10) 2º) Determinar a ordem ou posição (P) da Mediana por P =
21n + ,
P = 2
17 + = 4 ==> 4ª posição.
4ª posição é o número 4. Md = 4
b) O número de valores observados é par Exemplo: Considere o conjunto de dados: X = (4, 3, 9, 8, 7, 2, 10, 6) 1º) Colocar os valores em ordem crescente ou decrescente: X = (2, 3, 4, 6, 7, 8, 9, 10) 2º) Determinar a ordem ou posição (P) da
Mediana: P = 2n e P =
2n + 1 ,
P = 28 = 4ª posição e P =
28 + 1 = 5ª
posição Os números são 6 (4ª posição) e 7 (5ª posição). Tira-se a média aritmética entre os dois números.
Md = 2
76 + = 6,5
81
Probabilidade e Estatística Luiz Roberto
4.22.5 Medidas de dispersão (Medidas de variabilidade)
São medidas utilizadas para medir o grau de variabilidade, ou dispersão
dos valores observados em torno da média aritmética. Servem para medir a
representatividade da média e proporcionam conhecer o nível de homogeneidade
ou heterogeneidade dentro de cada grupo analisado.
Considere a seguinte situação:
Um empresário deseja comparar a performance de dois empregados, com
base na produção diária de determinada peça, durante cinco dias:
Empregado A : 70, 71, 69, 70, 70 → x = 70
Empregado B : 60, 80, 70, 62, 83 → x = 71
A performance média do empregado A é de 70 peças produzidas
diariamente, enquanto que a do empregado B é de 71 peças. Com base na média
aritmética, verifica-se que a performance de B é melhor do que a de A. Porém,
observando bem os dados, percebe-se que a produção de A varia apenas de 69 a
71 peças, ao passo que a de B varia de 60 a 83 peças, o que revela que a
performance de A é bem mais uniforme do que de B.
Qual o melhor empregado?
Amplitude total (AT)
É é a diferença entre o maior e o menor valor observado.
AT = xmax − xmin
Empregado A = 71 − 69 = 2 Empregado B = 83 − 60 = 23
Desvio médio (DM) Analisa todos os desvios ou distâncias em relação a média aritmética. O cálculo dos desvios feito por:
di = (xi − X ) xi = valores observados
X = média aritmética
A soma de todos os desvios em relação a média aritmética é igual a zero:
∑ di = ∑ (xi – X ) = 0
82
Probabilidade e Estatística Luiz Roberto
Cálculo dos di: Para eliminar a soma zero, coloca-se os
desvios em módulo: Empregado A d1 = 70 – 70 = 0 d2 = 71 – 70 = +1 d3 = 69 – 70 = − 1 d4 = 70 – 70 = 0 d5 = 70 – 70 = 0 ∑ di = 0
Empregado B d1 = 60 – 71 = − 11 d2 = 80 – 71 = +9 d3 = 70 – 71 = − 1 d4 = 62 – 71 = − 9 d5 = 83 – 71 = +12 ∑ di = 0
Empregado A
d1 = | 0 | = 0 d2 = |+1| = 1 d3 = |−1|= 1 d4 = | 0 | = 0 d5 = | 0 | = 0
Empregado B
d1 = |–11| = 11 d2 = |+9 | = 9 d3 = |–1 | = 1 d4 = |–9 | = 9 d5 = |+12 | = 12
∑ | di | = 2 ∑ | di | = 42
D essa forma, é possível calcular a média dos desvios por:
DM = ndi∑ ||
= nXxi∑ − ||
Empregado A
DM = 52 = 0,4
Empregado B
DM = 542
= 8,4
Com freqüência absoluta (Fi):
DM = nFidi∑ .||
= n
Fi.|Xxi|∑ −
4.22.6 Variância
Considera-se o quadrado de cada desvio, (xi – X )2, evitando que Σ di = 0.
Assim, a definição da variância populacional é dada por:
σ2= nFi∑ .(di)2
= ..)-(xi 2
nFiX∑
Trata-se da média aritmética dos quadrados
dos desvios. 2σ indica a variância populacional e lê-se sigma ao quadrado.
X indica a média da população.
Empregado A d1 = (0)2 = 0 d2 = (+1)2 = 1 d3 = (−1)2 = 1 d4 = (0)2 = 0 d5 = (0)2 = 0
∑ (di)2 = 2
Empregado B d1 = (–11)2 = 121 d2 = (+9)2 = 81 d3 = (−1)2 = 1 d4 = (–9)2 = 81 d5 = (+12)2 = 144
∑ (di)2 = 428
Empregado A
σ2 = 52 = 0,4
Empregado B
σ2 = 5
428 = 85,6
83
Probabilidade e Estatística Luiz Roberto
Para o caso do cálculo da variância amostral, é conveniente o uso da
seguinte fórmula:
S2 = .1n
Fi.)X-(xi 2
−∑
As diferenças entre as fórmulas são: para o caso da variância
populacional ( ), utiliza-se a média populacional (2σ X ) tendo como
denominador o tamanho da população (n). Para o cálculo da variância amostral
(S2), utiliza-se a média amostral ( X ), tendo como denominador o tamanho da
mostra menos um (n-1). Assim, podemos usar as fórmulas práticas para os
cálculos das variâncias:
2σ = ( )
− ∑∑ n
)xiFi(Fix
n1 2
2i S2 =
( )
−
−∑∑ n
)xiFi(Fix
1n1
22
i
que foram obtidas por transformação nas respectivas fórmulas originais.
4.22.7 Desvio-padrão
É a raiz quadrada da variância.
Na fórmula original para o cálculo da variância, observa-se que é uma soma
de quadrados. Por exemplo, se a unidade original for metro (m) o resultado
será metro ao quadrado (m2). Para retornar a unidade de medida original,
extrai-se a raiz quadrada da variância, passando a chamar-se de desvio-
padrão.
Desvio-padrão populacional
σ =
Desvio-padrão amostral
s = 2 Exemplo 1: Calcular o desvio-médio, a variância e o desvio padrão da seguinte distribuição amostral:
xi 5 7 8 9 11 Fi 2 3 5 4 2
sσ2
1°) Cálculo do desvio médio:
DM = nFi.|Xxi|∑ −
ou nFidi∑ .||
84
Probabilidade e Estatística Luiz Roberto
Primeiramente, precisa-se do valor da média:
xi Fi xi . Fi 5 2 10 7 3 21 8 5 40 9 4 36 11 2 22 ∑ 16 129
X = n
∑ iixF =
16129
= 8,06
Para o cálculo do DM , são abertas novas colunas, assim:
xi Fi xi . Fi | Xxi| − |di| Fi
5 2 10 | 5 - 8,06 | 6,12 7 3 21 | 7 - 8,06 | 3,18 8 5 40 | 8 - 8,06 | 0,30 9 4 36 | 9 - 8,06 | 3,76 11 2 22 | 11 - 8,06 | 5,88
∑ 16 129 19,24
Portanto, DM = nFidi∑ .||
= 16
24,19 = 1,20
2°) Cálculo da variância amostral:
S2 = ( )
−
−∑∑ n
)xiFi(Fix
1n1
22
i
Observe que o cálculo será facilitado, pois n = 16 e ∑ xi Fi = 129. Falta encontrar ∑ xi2 Fi. Para isso, uma nova coluna é considerada na tabela.
xi Fi xi . Fi xi2 Fi 5 2 10 10 7 3 21 147 8 5 40 320 9 4 36 324 11 2 22 242 ∑ 16 129 1.083
Logo: S2 = ( )
−
− 161291083
1161 2
= 2,86
Então, a variância amostral é S2 = 2,86.
85
Probabilidade e Estatística Luiz Roberto
3°) Cálculo do desvio padrão amostral:
Como S = 2S S = 86,2 = 1,69.
Resumindo: a distribuição possui uma média 8,06. Isto é, seus valores estão
em torno de 8,06 a seu grau de concentração é de 1,2, medido pelo Desvio
Médio, e de 1,69, medido pelo Desvio-Padrão.
Exemplo 2: Dada a distribuição amostral abaixo, calcular a média, o desvio
médio e o desvio padrão.
Classes
2 ---- 4
4 ---- 6
6 ---- 8
8 ---- 10
10 ---- 12
Fi 2 4 7 4 3
A construção da tabela auxiliar para os cálculos deve ser construída à
medida que você for necessitando dos resultados parciais; a ordem das colunas
não é importante. Eis a tabela auxiliar:
Classes xi Fi xi . Fi | Xxi| − |di| Fi X2 Fi
2 ---- 4
5
2
6
|3 - 7,2|= 4,2
8,4 18
4 ---- 6
7
4
20
|7 - 7,2|= 2,2
8,8
100
6 ---- 8
8
7
49
|8 - 7,2|= 0,2
1,4
343
8 ---- 10
9
4
36
|9 - 7,2|= 1,8
7,2
324
10 ---- 12
11
3
33
|11 - 7,2|= 3,8
11,4
363
∑ ∑ 16 129 37,2 1.148
X = 20
144 = 7,2 DM =
202,37 = 1,86
Logo: S2 = ( )
−
− 201441148
1201 2
= 5,86
σ = 5,86 = 2,42
86
Probabilidade e Estatística Luiz Roberto
Exemplo 3: Cálculo da variância populacional. Determinar a variância para a série:
xi 2 3 5 6 7
Fi 1 4 5 3 2
Solução: A fórmula prática para calcular a variância popu8lacional é:
2σ = ( )
− ∑∑ n
)xiFi(Fix
n1 2
2i
Será conveniente construir a seguinte tabela:
xi Fi xi . Fi X2 Fi
2
1
2
4
3
4
12
36
5
5
25
125
6
3
18
108
7
2
14
98
∑ 15 71 371
2σ = ( )
−
15713711 2
15 = 2,33
Desvio-padrão populacional:
σ = 2,33 = 1,53
Exemplo 4: Cálculo da variância e do desvio-padrão para a Tabela 4.4
Tabela 4.4 - Número de filhos de um grupo de 50 casais
N° filhos (xi)
N° casais (Fi)
xi . Fi
xi2
xi2. Fi
0 6 1 16 2 9 3 8 4 3 5 3 6 3 7 2 ∑ 50 117
Variância amostral:
S2 = ( )
−
−∑∑ n
)xiFi(Fix
1n1
22
i
Desvio-padrão:
s = s2
87
Probabilidade e Estatística Luiz Roberto
4.23 DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE 4.23.1 DISTRIBUIÇÃO DE “BERNOULLI”
Suponhamos a realização de um experimento E, cujo resultado pode ser um
sucesso (se acontecer o evento que nos interessa) ou um fracasso (o evento
não se realiza).
Seja x a variável aleatória: sucesso ou fracasso. X x1 = 1 (sucesso) ou x2 = 0 (fracasso) P(X) p (x1) = p p (x2) = 1 – p = q Diz-se que esta variável, assim definida, tem uma distribuição de
“Bernoulli”. Suas principais características são:
Média: µ (X) = ∑ x1
0i P(Xi) = 0 . p + 1 . p = p
Variância: σ = E[(X2)(X 1 - )µ 2] = E(X i ) - 2 µ 2
)(X
E[X i ] = x P(X2 ∑1
0
2i i) = 02 q + 12 p = p
σ = p – p2)(X
2 = p(1-p) = pq
4.23.2 DISTRIBUIÇÃO BINOMIAL Trata-se de uma distribuição de probabilidade adequada aos experimentos que
apresentam apenas dois resultados (sucesso ou fracasso). Esse modelo
fundamenta-se nas seguintes hipóteses:
H1: n provas independentes e do mesmo tipo são realizadas.
H2: cada prova admite dois resultados – sucesso ou fracasso.
H3: a probabilidade de sucesso em cada prova é p e de fracasso 1-p = q
Define-se a variável Y como o número de sucessos das n provas.
Logo, Y pode tomar os valores 0, 1, 2, 3, ..., n.
Fazendo sucesso corresponder a 1 e fracasso a 0, ou seja, provas de
Bernoulli, tem-se:
Para Y = 0, uma seqüência de n zeros: 0000 ... 0. Logo:
P (Y=0) = q . q . q . q ... q = qn
Para Y = 1, uma seqüência do tipo: 1000 ... 0; 0100 ... 0; 001000 ... 0;
88
Probabilidade e Estatística Luiz Roberto
Serão n seqüências, cada uma com um único sucesso e n-1 fracassos:
P (Y-1) = n . p . qn-1
Para Y = y, tem-se y sucessos e (n-y) fracassos, correspondendo às seqüências
com y algarismos 1 e n – y zeros. Cada seqüência terá probabilidade pyqn-y e
como há seqüências distintas, tem-se: P (Y=y) = p
yn
yn
yqn-y
Que é a expressão geral da distribuição Binomial. Para Y = n, tem-se uma seqüência de n uns: 1111 ... 1, logo: P(Y=n) = pn
O nome Binomial é porque p
yn
yqn-y nada mais é que o termo de grau y em p no
desenvolvimento do Binômio de Newton (p + q)n. Média: De acordo com as hipóteses, vê-se que y é a soma de n variáveis do tipo “Bernoulli”, daí: µ = nµ (X) = n . p ou seja µ (Y) = np Variância: Baseado no que foi feito acima, temos:
σ = n σ = n . p . p ou seja σ = npq 2)(Y
2)(X
2)(Y
Exemplo: Uma moeda não viciada é lançada oito vezes. Encontre a
probabilidade:
a) dar cinco caras
b) pelo menos uma cara
c) no máximo duas caras.
d) Calcular a média e a variância da distribuição.
Solução: Sabe-se que: n = 8, p = 21 e q =
21; Y número de caras
(sucessos).
a) P(Y=5) =
58 5
21
58
21 −
=
327
= 0,22 = 22%
b) P(Y≥ 1) = 1 – P(Y=0) = 1 -
8
21
=
256255
= 0,996 = 99,6%
89
Probabilidade e Estatística Luiz Roberto
c) P(Y≤ 2) = P(Y=0) + P(Y=1) + P(Y=2) =
8
21
+ 8
21 7
21
+
28 2
21
6
21
=
2561
+ 2568
+ 25628
+ 25637
= 0,14 = 14%
A média será: 9(Y) = n . p = 8 .21 = 4
A variância será: σ ( = n . p . q = 8 . 2)Y 2
1 .
21 = 2
90
Probabilidade e Estatística Luiz Roberto
BIBLIOGRAFIA FONSECA, Jairo Simon; MARTINS, G. A. Curso de Estatística. São Paulo: Atlas, 1996. MARTINS, G. A. DONAIRE, D. Princípios de estatística. São Paulo: Atlas, 1990. TOLEDO, G. L; OVALLE, I(. I. Estatística básica. 2ª ed. São Paulo: Atlas, 1995. IEZZI, G; DOLCE, O; DEGENSZAJN, D. M; PÉRIGO, R. Matemática volume único. São Paulo: Atual Editora, 1999.
91
top related