nilo antonio de souza sampaio - probabilidade/estatística
TRANSCRIPT
![Page 1: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/1.jpg)
UERJ - 2013
Prof.Dr. Nilo Sampaio
![Page 2: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/2.jpg)
Medidas de tendência central e dispersão
Variáveis contínuas: distribuição normal
Amostra
Variabilidade amostral
![Page 3: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/3.jpg)
Categóricas(ou qualitativas)
Numéricas(ou quantitativas)
Dicotômicas
Politômicas
Nominais(ordem não importa)
Ordinais(tem uma ordem lógica)
Discretas(números inteiros)
Contínuas(aceitam decimais)
Sexo, raça, estado civil, religião...
NSE, IMC categ, avaliação
qualitativa...
“CONTAGENS” Nº filhos, anos
de estudo...
“MEDIDAS”Peso, altura,
pressão. Renda
familiar (R$)
![Page 4: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/4.jpg)
Categórica(ou qualitativa)
Numérica(ou quantitativa)
Medidas de ocorrênciaFREQUÊNCIA ou PORCENTAGEM Incidência Prevalência OddsMedida de precisãoINTERVALO DE CONFIANÇA
Medidas tendência centralMODAMÉDIAMEDIANA
Medidas de dispersãoAMPLITUDEVARIÂNCIADESVIO PADRÃOERRO PADRÃO
![Page 5: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/5.jpg)
Descrição de uma variável qualitativas ou categóricas
Dicotômicas ou binárias
Politômicas
Cálculo de proporções
Divisão de um número por outro, onde onumerador está contido (é subconjunto) nodenominador
Exemplo: Desnutrição: sim /não
Em 100 crianças, 20 estão desnutridas (20%)
![Page 6: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/6.jpg)
Dados da coorte de nascimentos de 2004. Pelotas, RS (n=6000)
NúmeroPeso ao nascer
(g)
Número de
gravidez
1 750 1
2 1500 3
3 1520 2
4 2450 4
5 1790 1
6 3000 2
7 1930 2
..... ..... ...
5999 3510 1
6000 2900 1
![Page 7: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/7.jpg)
Descrição de uma variável numérica
Tabela que mostra um número deobservações ou valores dentro de certosintervalos
![Page 8: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/8.jpg)
Número de gravidezes das mães da coorte de 2004. Pelotas, RS
(n=6000)
Número de gravidez Frequência (n) %
1 2092 34,9
2 1644 27,4
3 970 16,1
4 544 9,1
5 282 4,7
6 168 2,8
7 105 1,8
8 69 1,2
9 48 0,8
10 39 0,7
11 20 0,3
12 11 0,1
13 8 0,1
![Page 9: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/9.jpg)
Número de gravidez das mães da coorte de 2004. Pelotas, RS (n=6000)
Número de gravidezes Frequência (n) %
1 2092 34,9
2 1644 27,4
3 970 16,1
≥4 1294 21,6
![Page 10: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/10.jpg)
Peso ao nascer das crianças da coorte de 2004. Pelotas, RS (n=4555)
Peso ao nascer (gramas) Frequência %
<1000 52 1,1
1000-1499 43 0,9
1500-1999 98 2,2
2000-2499 305 6,7
2500-2999 1112 24,4
3000-3499 1747 38,3
3500-3999 976 21,5
4000 222 4,9
![Page 11: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/11.jpg)
... mas para variáveis contínuas queremos descrever os dados de forma ainda mais sucinta!
◦ Medidas de tendência central
◦ Medidas de posição
◦ Medidas de dispersão
![Page 12: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/12.jpg)
MEDIDAS DE TENDÊNCIA CENTRAL
MEDIDAS DE DISPERSÃO
MEDIDAS DE POSIÇÃO
MEDIDAS DE POSIÇÃO
MÉDIAMEDIANAMODA
AMPLITUDEINTERVALO INTERQUARTILVARIÂNCIADESVIO PADRÃO
TERCILQUARTILQUINTILDECILPERCENTIL
![Page 13: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/13.jpg)
Utilizadas para variáveis:
◦ Quantitativas ou numéricas
Discreta
Contínua
São valores calculados com o objetivo dedescrever os dados de forma ainda maisresumida do que usando uma tabela
![Page 14: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/14.jpg)
Média
Moda
Mediana
![Page 15: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/15.jpg)
Média
◦ xi: valor de cada indivíduo◦ ∑: somatória◦ n: total de indivíduos
x
x
n
i
i
n
1
Vantagem:Utiliza TODOS os
valores da distribuição
Desvantagem:É influenciada por valores extremos
![Page 16: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/16.jpg)
Moda◦ Valor que mais se repete na amostra (na
distribuição)
1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9
Moda: 2
◦ Quando mais de um valor se repete o mesmo número de vezes BIMODAL
![Page 17: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/17.jpg)
Mediana Valor que divide a distribuição ao meio
1º passo: ordenar os dados de menor a maior
2º passo: ver qual valor ocupa o “meio” da distribuição
Se... Número ímpar de dados: valor do meio
1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9
Número par de dados: média dos dois do meio1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 8, 9, 9
Fórmula:(n + 1)/2
![Page 18: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/18.jpg)
Semelhantes para distribuições simétricas: Peso ao nascer
◦ Média: 3131 g
◦ Mediana: 3180 g
Distantes para distribuições assimétricas: Renda familiar
◦ Média: R$ 791
◦ Mediana: R$ 500
![Page 19: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/19.jpg)
Qual medida de tendência central usar?◦ MÉDIA ou MEDIANA?
![Page 20: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/20.jpg)
Distribuição simétrica
0
500
1000
1500
2000
n
1000 2000 3000 4000 5000 6000Peso ao nascer
Média: 3131 gramas; Mediana: 3180 gramas
Média
![Page 21: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/21.jpg)
Distribuição assimétrica
0
1000
2000
3000
n
0 5000 10000 15000 20000Renda familiar (reais)
Média: R$ 791; Mediana: R$ 500
Mediana
![Page 22: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/22.jpg)
Percentis (dividem os dados em 100 partes iguais)◦ Percentil 10, percentil 50, percentil 99...
Quartis◦ Primeiro, segundo, terceiro, quarto quartil
Quintil◦ Primeiro, segundo, terceiro, quarto, quinto quintil
![Page 23: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/23.jpg)
. su peson,d
peso ao nascer em gramas
-------------------------------------------------------------
Percentiles Smallest
1% 1950 1100
5% 2340 1490
10% 2570 1550 Obs 962
25% 2870 1570 Sum of Wgt. 962
50% 3180 Mean 3200.639
Largest Std. Dev. 511.0475
75% 3510 4690
90% 3830 4700 Variance 261169.5
95% 4050 4700 Skewness -.1061833
99% 4450 4880 Kurtosis 3.579037
![Page 24: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/24.jpg)
Várias maneiras de medir a dispersão
◦ Amplitude (maior - menor)
◦ Amplitude interquartil (p75 - p25)
◦ Variância
◦ Desvio padrão
![Page 25: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/25.jpg)
Amplitude◦ Valor maior – valor menor
◦ Apenas considera os valores extremos
◦ Ex: 5 medidas de glicemia em mmol/l
80; 85; 88; 90; 500
Amplitude: 500-80=480
◦ Medidas que se distanciam muito das demais influenciam muito a amplitude
![Page 26: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/26.jpg)
Amplitude interquartil◦ Percentil 75 – percentil 25
◦ Considera apenas a parte central dos valores de um conjunto de dados
◦ Joga fora os valores mais altos e os mais baixos
Não influenciada pelos valores discrepantes
![Page 27: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/27.jpg)
Variância (S2)◦ Boas propriedades estatísticas
◦ Usa todas as observações
◦ É uma medida dos “desvios” (ao quadrado) de cada observação em relação à média
Pq ao quadrado?
Unidade de medida ao quadrado difícil interpretação
![Page 28: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/28.jpg)
Desvio padrão (S)◦ É a raiz quadrada da variância
◦ Quanto mais próximos os valores individuais estiverem de sua média, < a dispersão e < o desvio-padrão
◦ Muito útil para distribuições dos dados aproximadamente normais
![Page 29: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/29.jpg)
Ou Gaussiana
Simétrica
Forma de “sino”
É uma distribuição contínua
Descreve bem fenômenos biológicos
5 4 0 0
5 0 0 0
4 6 0 0
4 2 0 0
3 8 0 0
3 4 0 0
3 0 0 0
2 6 0 0
2 2 0 0
1 8 0 0
1 4 0 0
1 0 0 0
6 0 0
1 8
1 6
1 4
1 2
1 0
8
6
4
2
0
S t d . D e v = 5 5 7 . 3 8
M e a n = 3 1 5 2
N = 5 2 5 8 . 0 0
Percentagem
Peso ao nascer
![Page 30: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/30.jpg)
![Page 31: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/31.jpg)
1) UMA REVISÂO SOBRE GRÀFICOS E TABELAS E SUAS
APLICAÇÔES.
![Page 32: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/32.jpg)
• População (universo) = conjunto de todos os possíveis valores de uma variável ou característica.
• Amostra = conjunto de observações extraída de uma população.
![Page 33: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/33.jpg)
Em Estatística, variável é atribuição de um número acada característica da unidade experimental de umaamostra ou população.
Vários tipos de variáveis são encontradas no dia-a-dia,sendo importante a distinção entre as mesmas.
Quando uma característica ou variável é não-numérica,denomina-se variável qualitativa ou atributo.
![Page 34: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/34.jpg)
Exemplos de variável qualitativa
a) Sexo
b) Religião
c) Cor de olhos
d) Faixa etária
Uma variável qualitativa é expressa em categorias
![Page 35: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/35.jpg)
Quando a variável é expressa numericamente, denomina-se variável quantitativa.
Uma variável quantitativa pode ser discreta ou contínua.
Exemplos de variável quantitativa
a) Peso dos órgãos
b) Idade
c) Número de filhos
d) Altura
![Page 36: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/36.jpg)
![Page 37: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/37.jpg)
Uma etapa importante no trabalho científico é a
divulgação à comunidade dos resultados obtidos.
É assim que a contribuição do trabalho ao
patrimônio científico da humanidade é colocada
à disposição de todos. Essa divulgação é feita
principalmente em revistas científicas
especializadas de circulação nacional e
internacional e obedece a certos padrões na sua
apresentação.
![Page 38: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/38.jpg)
Durante os cursos de graduação e pós-graduação (não
importa a carreira escolhida), muitos, provavelmente,
terão alguma bolsa de pesquisa, farão algum estágio e
principalmente publicarão trabalhos em revistas
científicas. Tais atividades requerem do aluno a
apresentação de seu trabalho (resultados) de forma
compatível com os padrões acadêmicos nacionais e
internacionais. Além disso, na atividade profissional de
cada um, certamente haverá a necessidade de apresentar
relatórios, projetos e estudos desenvolvidos para seus
clientes.
![Page 39: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/39.jpg)
Conteúdo de hoje:
• Tabelas de Frequência;
• Gráficos;
•Exercícios de Fixação valendo nota.
![Page 40: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/40.jpg)
Os dados são registrados em fichas, com várias informações.
Para obter apenas os dados é preciso fazer uma apuração.
Variável qualitativa – apuração é a simples contagem
Exemplo: número de nascidos vivos para cada sexo
Variável quantitativa – anotar cada valor observado
Exemplo: número do prontuário e peso ao nascer
![Page 41: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/41.jpg)
Após a apuração, há necessidade dos dados serem dispostos de
uma forma ordenada, quando possível, e resumida, a fim de
auxiliar o pesquisador na sua análise e facilitar a compreensão
das conclusões apresentadas ao leitor. Os dados podem estão
serem apresentados na forma de tabelas estatísticas. Essas
devem ser auto-suficientes, isto é, devem ter significado próprio,
de modo a prescindir, quando isoladas, de consultas ao texto.
Uma tabela estatística deve conter o número, o título, o corpo e
o rodapé (fonte, notas e notas específicas).
![Page 42: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/42.jpg)
Componentes mais importantes de uma tabela:
Título – explica o que a tabela contém
Corpo – formado pelo cabeçalho, pela coluna indicadora e pelas linhas e
colunas de dados:
Cabeçalho – especifica o conteúdo das colunas
Coluna indicadora – especifica o conteúdo das linhas
![Page 43: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/43.jpg)
título
cabeçalho
coluna indicadora
corpo
coluna de dados
![Page 44: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/44.jpg)
Tabela de contingência: os elementos da amostra ou
população são classificados de acordo com dois ou mais
fatores (diferentes anos de arrecadação).
![Page 45: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/45.jpg)
mais interessante!
![Page 46: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/46.jpg)
![Page 47: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/47.jpg)
![Page 48: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/48.jpg)
![Page 49: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/49.jpg)
frequência relativa
(porcentagem)
![Page 50: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/50.jpg)
frequência
frequência
relativa
![Page 51: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/51.jpg)
frequência
relativa
frequência
![Page 52: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/52.jpg)
Como definir o número de classes?
- poucas: perde-se muita informação
- muitas: pode-se ter pormenores desnecessários
O número adequado de classes é definido pelo
pesquisador.
Na escolha, é conveniente usar extremos de classes fáceis
de trabalhar.
![Page 53: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/53.jpg)
Exemplo - Tabela de variáveis contínuas
Informações sobre peso de recém-nascidos medidos
ao longo de um ano. Como fazer uma tabela com essa
informação?
1)Definir as faixas de pesos (classes)
1,0 – 1,5 1,5 – 2,0 2,0 – 2,5 2,5 – 3,0
3,0 – 3,5 3,5 – 4,0 4,0 – 4,5 4,5 – 5,0
Intervalo de classe: 0,5 kg (escolha pessoal)
![Page 54: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/54.jpg)
2) Contar quantos dados existem em cada classe
1,0 |– 1,5 ---> 1
1,5 |– 2,0 ---> 3
2,0 |– 2,5 ---> 16
2,5 |– 3,0 ---> 31
3,0 |– 3,5 ---> 34
3,5 |– 4,0 ---> 11
4,0 |– 4,5 ---> 4
4,5 |– 5,0 ---> 2 1,5 2,0
fechado aberto
(pertence) (não pertence)
extremos de classe:
valores limites dos intervalos
de classe
podem pertencer ou não à
classe
![Page 55: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/55.jpg)
3) Determinar o Ponto médio de cada classe: a metade de cada
intervalo considerado. PM1= (1,5 + 2,0)/2 = 1,75.
4) Somar a freqüência total das classes e determinar a freqüência
relativa fR(i)= f(i)/ftotal
Peso (kg) f(i) fR
1,25 1 1%
1,75 2 2%
2,25 16 16%
2,75 31 31%
3,25 34 34%
3,75 11 11%
4,25 4 4%
5,25 1 1%
Total 100 100%
Tabela 01 – Peso de Recém-nascidos*
* Medido até 5 horas do nascimento
![Page 56: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/56.jpg)
Gráfico que fornece os intervalos de classe ao longo do eixo
horizontal e as frequências (absolutas ou relativas) no eixo
vertical.
1 2 3 4 50
5
10
15
20
25
30
35
40
Peso de Recém-nascidosF
req
uên
cia
Peso (Kg)
freq
1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25
![Page 57: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/57.jpg)
1 2 3 4 5
0
5
10
15
20
25
30
35
40
Peso de Recém-nascidos
freqF
req
uên
cia
Peso (Kg)
1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25
![Page 58: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/58.jpg)
São normalmente utilizados pararepresentar uma série temporal, conduzindoa uma interpretação dinâmica do fenômenoestudado.
![Page 59: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/59.jpg)
Neste tipo de gráfico considera-se apenasuma variável, devendo-se tomar cuidadocom a quantidade de categorias arepresentar, afim de não prejudicar avisualização do gráfico.
![Page 60: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/60.jpg)
Tabelas:◦ São convenientes quando há necessidade ou
relevância em explicitar todos os valores.
◦ Quando deseja-se que os parâmetrosapresentados sejam conhecidos para fins deaplicação, reprodução etc.
◦ Quando a comparação entre diferentes colunasde uma mesma linha não correlacionam-se,diretamente, com as demais linhas da tabela.
Exemplo de tabela
![Page 61: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/61.jpg)
Gráficos:◦ Para um grande número de dados, quando não
há relevância na apresentação dos valores, é maisconveniente agrupar os dados e, se possível,grafa-los diretamente. Caso contrário, pode-segerar uma nova tabela (enxugada).
◦ Quando deseja-se avaliar ocomportamento,tendências ou a relação entreduas colunas de uma tabela.
◦ Comparar duas ou mais colunas em relação auma determinada variável. Neste caso, aapresentação em um único gráfico permite umarápida comparação.
![Page 62: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/62.jpg)
Cabeçalhos de tabelas devem ser curtos para evitarcolunas com largura desproporcional aos seus dados.Em tais casos, é conveniente a criação de uma legendalogo abaixo da tabela. O tamanho efetivo da tabela podeneste caso ser bastante reduzido.
Quando há muitas linhas numa tabela, e a largura entreelas é estreita, convém separar com traços para evitar adescontinuidade do leitor ao comparar diferentescolunas de uma mesma linha.
O uso de continuidade de colunas deve ser avaliadoquando principalmente há espaços suficientes para quetodas as diferentes colunas da tabela sejam repetidasem cada linha.
Tabelas envolvendo matrizes simétricas podemdispensar repetições de valores e, conseqüentemente,economizar a metade do espaço.
![Page 63: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/63.jpg)
deve propiciar uma visualização rápida do fenômeno e paraisso, conter apenas o essencial para sua execução;
o tamanho deve ser adequado à sua publicação emtrabalhos técnico-científicos, revistas, periódicos, cartazesou livros;
deve sempre ter um título e a fonte dos dados originais e,se necessário, números e notas explicativas;
deve ser construído em uma escala que não desfigure osfatos ou as relações que se deseja destacar;
atenção ao comparar diferentes gráficos - verificar apossibilidade de manter as escalas na mesma proporção;
Alguns pontos devem ser respeitados na construção de um gráfico,
a saber:
![Page 64: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/64.jpg)
2) (FUVEST) Sabe-se que a média aritmética de 5 números inteiros distintos, estritamente positivos, é 16. O maior valor que um desses inteiros pode assumir é:
a) 16 b) 20 c) 50 d) 70 e) 100
RESPOSTA: D
3) O time de futebol do Cruzeiro de Minas Gerai, fez 6 partidas amistosas, obtendo os seguintes resultados, 4 x 2, 4 x 3, 2 x 5, 6 x 0, 5 x 3, 2 x 0. Qual a média de gols marcados nestes amistoso?
X = 4+4+2+6+5+2/ 6 = 3,8
4) 1. Um colégio resolveu inovar a forma de calcular a média final de seu alunos.
1º bimestre teve peso 2.2º bimestre teve peso 2.3 bimestre teve peso 3.4 bimestre teve peso 3.
Vamos calcular a média anual de Ricardo que obteve as seguintes notas em historia. 1 bim = 3, 2 bim = 2,5, 3 bim = 3,5 e 4 bim = 3
![Page 65: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/65.jpg)
![Page 66: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/66.jpg)
Classifique as variáveis abaixo em qualitativas ou quantitativas
(discretas ou contínuas):
a) População: Estação meteorológica de uma cidade.
Variável: precipitação pluviométrica, durante o ano.
Resp.:
b) P: Alunos de uma cidade.
V: Cor dos olhos.
Resp.:
c) P: Bolsa de valores de São Paulo.
V: Número de ações negociadas.
Resp.:
d) P: Funcionários de uma empresa.
V: Salários.
Resp.:
Quantitativa contínua
Qualitativa
Quantitativa discreta
Quantitativa discreta
![Page 67: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/67.jpg)
Exercícios:
Faça a distribuição dos dados abaixo:
a) Sendo limite inferior 30 e 10 para intervalo de classe:
54429889693948669465
74645545359456784167
60738576655350418059
88853557556591817174
77736168734752336884
![Page 68: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/68.jpg)
b) Os resultados obtidos pelo lançamento de um dado 50 vezes foram
os seguintes:
3425164265
1563152522
6244531345
4363153361
5626346256
![Page 69: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/69.jpg)
Respostas:
a)
Σ = 1,000Σ = 50
0,080
0,200
0,380
0,600
0,780
0,920
1,000
4
10
19
30
39
46
50
0,080
0,120
0,180
0,220
0,180
0,140
0,080
35
45
55
65
75
85
95
4
6
9
11
9
7
4
30 ? 40
40 ? 50
50 ? 60
60 ? 70
70 ? 80
80 ? 90
90 ? 100
1
2
3
4
5
6
7
FriFifrixifiNOTASi
![Page 70: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/70.jpg)
Respostas:
b)
Σ = 1,000Σ = 50
0,120
0,280
0,460
0,600
0,800
1,000
6
14
23
30
40
50
0,120
0,160
0,180
0,140
0,200
0,200
6
8
9
7
10
10
1
2
3
4
5
6
FriFifrifixi
![Page 71: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/71.jpg)
MÉDIA ARITMÉTICA
Dados Agrupados: Sem intervalo de classes
Fórmula:
X = Σ fixi
Σ fi
Σ fi.xi = 78Σ = 34
0
6
20
36
16
2
6
10
12
4
0
1
2
3
4
fi.xifiIdade (xi)
X = 2,29
![Page 72: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/72.jpg)
Fórmula:
X = Σ xifiΣ fi
MÉDIA ARITMÉTICA
Dados Agrupados: Com intervalo de classes
Σ fi.xi = 6440Σ = 40
608
1404
1760
1312
840
516
152
156
160
164
168
172
4
9
11
8
5
3
150 ? 154
154 ? 158
158 ? 162
162 ? 166
166 ? 170
170 ? 174
1
2
3
4
5
6
fi.xixifiEstaturas
(cm)
i
X = 161
![Page 73: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/73.jpg)
1. 3) População ou universo é:
a) Um conjunto de pessoas;
b) Um conjunto de elementos quaisquer
c) Um conjunto de pessoas com uma característica comum;
d) Um conjunto de elementos com pelo menos uma característica em comum;
e) Um conjunto de indivíduo de um mesmo município, estado ou país.
2. 4) Uma parte da população retirada para analisá-la denomina-se:
a) Universo;
b) Parte;
c) Pedaço;
d) Dados Brutos;
e) Amostra.
3. 5) A parte da estatística que se preocupa somente com a descrição de determinadas
características de um grupo, sem tirar conclusões sobre um grupo maior denomina-se:
a) Estatística de População;
b) Estatística de Amostra;
c) Estatística Inferencial
d) Estatística Descritiva;
e) Estatística Grupal.
![Page 74: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/74.jpg)
1. 4)Uma série estatística é denominada Temporal quando?
a) a) O elemento variável é o tempo;
b) b) O elemento variável é o local;
c) c) O elemento variável é a espécie;
d) d) É o resultado da combinação de séries estatísticas de tipos diferentes;
e) e) Os dados são agrupados em subintervalos do intervalo observado.
2. 5) Suponha que uma pesquisa de opinião pública deve ser realizada em um estado que
tem duas grandes cidades e uma zona rural. Os elementos na população de interesse são todos
os homens e mulheres do estado com idade acima de 21 anos. Que tipo de amostragem você
sugeriria?. Amostragem Estratificada
3. 6) Um médico está interessado em obter informação sobre o número médio de vezes em
que 15.000 especialistas prescreveram certa droga no ano anterior (N = 15.000). Deseja-se obter
uma amostra n = 1.600. Que tipo de amostragem você sugeriria e por que? Amostragem
Sistemática
7) 1. De acordo com as normas para representação tabular de dados, quando o valor
de um dado é muito pequeno, para ser expresso com o número de casa decimais utilizadas ou
com a unidade de medida utilizada, deve-se colocar na célula correspondente.
a) Zero (0);
b) Três pontos (...);
c) Um traço horizontal (-)
d) Um ponto de interrogação (?);
Um ponto de exclamação (!).
![Page 75: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/75.jpg)
1. 8) Assinale a afirmativa verdadeira:
a) a) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos
horizontalmente.
b) b) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos
verticalmente.
c) c)Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos verticalmente e
um gráfico de colunas, horizontalmente.
d) d)Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos
horizontalmente e um gráfico de colunas, verticalmente.
e) e) Todas as alternativa anteriores são falsas.
1. 9) Um dado foi lançado 50 vezes e foram registrados os seguintes resultados
5 4 6 1 2 5 3 1 3 3
4 4 1 5 5 6 1 2 5 1
3 4 5 1 1 6 6 2 1 1
4 4 4 3 4 3 2 2 2 3
6 6 3 2 4 2 6 6 2 1
9a. .A amplitude Total (n)
6 a) 5
7 b) 6
8 c) 7
9 d) 10
10 e) 50
11
12
![Page 76: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/76.jpg)
a. A freqüência simples absoluta do primeiro elemento:
a) a) 10%
b) b) 20%
c) c) 1
d) d) 10
e) e) 20
![Page 77: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/77.jpg)
1. Qualquer variável com distribuiçãosimétrica (normal) pode ser relacionadacom uma distribuição normal padrão◦ Média: zero; DP: 1
◦ Posso estimar entre quais valores está x% dosmeus dados
![Page 78: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/78.jpg)
2. Área abaixo da curva◦ A área abaixo de toda a curva normal = 1, ou
seja, a probabilidade de que uma observaçãofique em algum lugar abaixo da curva é 100%
3. A probabilidade de se estimar alocalização exata de um indivíduo emespecífico é “zero”◦ Não posso estimar a posição de um valor
específico, mas posso calcular: Proporção de indivíduos abaixo ou acima de certo valor
Proporção de indivíduos entre certos valores
![Page 79: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/79.jpg)
Exemplo
Qual a probabilidade de uma criança terpeso ao nascer igual a 4000 gramas?◦ Não tenho como calcular esta probabilidade
exata, mas posso calcular...
Qual é a proporção de crianças com peso aonascer maior de 4000 gramas?
![Page 80: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/80.jpg)
Média = 3230
DP = 610
Crianças com peso ao nascer > 4000
gramas
![Page 81: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/81.jpg)
Distribuição normal padrão◦ (x - média)/desvio padrão
◦ (4000 - 3230)/610 = 1,26 = z
Olhando as tabelas de distribuição normal...
z = 0,1038, ou seja, 10,4% das crianças tempeso ao nascer maior do que 4000 gramas
![Page 82: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/82.jpg)
O que seria uma amostra? Não é melhoravaliar toda a população ?
![Page 83: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/83.jpg)
Quero conhecer um atributo de uma população (alvo)◦ Estado nutricional das crianças brasileiras
menores de 5 anos
Escolho um grupo para estudar◦ Crianças menores de 5 anos da cidade de Pelotas
Deste grupo tiro uma amostra
![Page 84: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/84.jpg)
UNIVERSO ou POPULAÇÃO TOTAL
POPULAÇÃO ALVO
AMOSTRA
![Page 85: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/85.jpg)
1. Representar a população◦ Equiprobabilidade = representatividade Todos os indivíduos da população alvo têm a mesma
chance de participar do estudo (de serem sorteados)
POPULAÇÃO ALVO POPULAÇÃO ALVO
![Page 86: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/86.jpg)
2. Precisão◦ Amostra de tamanho adequado
◦ Garantir o mínimo de precisão
◦ Garantir a chance de demonstrar uma diferençaentre dois grupos PODER: probabilidade de encontrar uma diferença qdo ela
realmente existe
Quanto maior a amostra, maior o poder
◦ Estudos com baixo poder (amostra pequena) para testar associações são um desperdício de tempo e dinheiro
![Page 87: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/87.jpg)
3. Variabilidade amostral◦ Cada amostra dá um resultado◦ Repetir o processo de amostragem e estudar a
distribuição dos resultados
Como será que a distribuição das amostrasse compara com a distribuição em todapopulação?◦ Se coletarmos muitas amostras independentes,
do mesmo tamanho, de uma mesma população ecalcularmos a média de cada amostra... Distribuição das médias amostrais
![Page 88: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/88.jpg)
Tem importância pelo que nos conta sobrea população que representa
A média e o desvio padrão da amostra sãousados para estimar a média e o desviopadrão da população
s
xamostra
população
![Page 89: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/89.jpg)
A média da distribuição das médiasamostrais é a média da população (isso eujá sei!!!)
E como é a variabilidade da média dapopulação?◦ O desvio padrão da distribuição das amostras se
denomina ERRO PADRÃO
![Page 90: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/90.jpg)
Enquanto o desvio padrão mede avariabilidade dos indivíduos da amostra
... o erro padrão mede a variabilidade damédia das amostras◦ E indica com que precisão a média da população
pode ser estimada pela média amostral
![Page 91: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/91.jpg)
Erro padrão
nep
Desvio padrão da população
Tamanho da amostra
![Page 92: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/92.jpg)
Dificilmente nós conhecemos o desvio
padrão da população ( )
Então se usa o desvio padrão da amostra (s)para estimar o erro padrão
n
sep
Desvio padrão da amostra
Tamanho da amostra
![Page 93: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/93.jpg)
Serve para calcular o Intervalo de Confiança
Intervalo de Confiança: intervalo de valoresque contém o parâmetro de interesse◦ Valores dentro dos quais existe uma certa
probabilidade de estar incluída a real média dapopulação
◦ Usado para comparar se existem diferenças entredois ou mais grupos Testes de hipóteses
◦ Isso será visto nas próximas aulas...
![Page 94: Nilo Antonio de Souza Sampaio - Probabilidade/Estatística](https://reader033.vdocuments.pub/reader033/viewer/2022042521/55939d241a28abf77f8b4580/html5/thumbnails/94.jpg)
Massad E, Menezes R, Silveira P, Ortega N. MétodosQuantitativos em Medicina. SP: Manole, 2004
Kirkwood B and Sterne J. Essential of medical statistics.Blackwell Science, 2003