rcg0148- aula4 · 2020. 3. 10. · revisao-aula3~ sum ario 1 revisao-aula3~ bioestat stica -...
TRANSCRIPT
RCG0148- AULA4
03 e 5 de Marco de 2020
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 1 / 41
REVISAO-AULA3
Sumario
1 REVISAO-AULA3
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 2 / 41
REVISAO-AULA3
Distribuicao de Probabilidades
PESSOAS SELECIONADAS ALEATORIAMENTE NUM ESTUDO
VARIÁVEL ALEATÓRIA
DISCRETA CONTÍNUA
DISTRIBUIÇÃO DE PROBABILIDADES
DISTRIBUIÇÃO DE FREQUÊNCIAS ~
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 3 / 41
REVISAO-AULA3
Bernoulli
Variável aleatória de Bernoulli (ou com distribuição de Bernouli) de parâmetro p – representa-se X ~ Ber(p)
X = nº de sucessos numa prova de Bernoulli, em que P(sucesso) = p (0 < p <1)
! " = 0 = 1 − '! " = 1 = ' ! " = ( = ')(1 − '), -), ( = 0, 1
/ " = 0 . 1 − ' + 1 . ' = '
/ "2 = 0² . 1 − ' + 1² . ' = '
4 " = / "2 − /2 " = ' − '2 = '(1 − ')
Esperançae
Variância
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 4 / 41
REVISAO-AULA3
Binomial
Variável aleatória binomial (ou com distribuição binomial) de parâmetros n e p – representa-se X ~
Bin(n,p)
X = nº de sucessos em n provas de Bernoulli independentes e com P(sucesso) = p em cada uma (X
= 0, 1, 2, ..., n)
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 5 / 41
REVISAO-AULA3
Poisson
Se o número médio de ocorrências no intervalo total for λ > 0 e
se X – número de ocorrências no intervalo total, então X tem
distribuição de Poisson com parâmetro λ.
Ex: nº de acidentes por semana
num cruzamento ou numa
secção de estrada (excetuando-
se acidentes em cadeia).
Ex: nº de clientes que chegam a uma
loja ou a um serviço em determinado
intervalo de tempo (excetuando-se
chegadas em grupo).
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 6 / 41
REVISAO-AULA3
NormalA distribuicao normal tambem e chamada distribuicao gaussiana,distribuicao de Gauss ou distribuicao de Laplace–Gauss, em referencia aosmatematicos, fısicos e astronomos frances Pierre–Simon Laplace (1749 –1827) e alemao Carl Friedrich Gauss (1777 – 1855).
** https://pt.wikipedia.org/wiki/Distribuicao-normalBioestatıstica - RCG0148 03 e 5 de Marco de 2020 7 / 41
REVISAO-AULA3
Normal PADRONIZADAA distribuicao normal com media 0 e desvio padrao 1 e chamada dedistribuicao normal padrao.
Z = X − µσ
Z
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 8 / 41
REVISAO-AULA3
Normal PADRONIZADA acumulativa
A distribuicao normal com media 0 e desvio padrao 1 e chamada dedistribuicao normal padrao.
Z
Z
Φ(x) = P (X ≤ x)
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 9 / 41
REVISAO-AULA3
Tabela da Normal Padrao
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 10 / 41
REVISAO-AULA3
Atividade para Memorizar
● Sabe-se que o tempo gasto no exame de um paciente tem distribuicaoaproximadamente Normal, com media 30 min e desvio padrao de 5min.
1 Sorteando-se um medico residente ao acaso, qual e a probabilidade deleterminar o exame antes de 24 minutos?
2 Qual deve ser o tempo de exame, de modo a permitir que 95% dosresidentes terminem no prazo estipulado?
3 Qual e o intervalo de tempo, simetrico em torno da media tal que 80%dos residentes gastam para completar o exame?
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 11 / 41
REVISAO-AULA3
Solucao
1 P (X < 24min) = P (Z < −1,2) = 11,5%
2 Z = X−µσ e X = µ +Z × σ =>X = 30 + 1,64.5 = 38,2min
3 P (a <X < b) = 80% so uma cauda P (X < b) = 90%O Z correspondente e: P (Z < 1,28) = 90% assima = 30 − 1,28.5 = 23,6 e b = 30 + 1,28.5 = 36,4
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 12 / 41
REVISAO-AULA3
Atividade para Memorizar
1 Uma populacao X tem uma distribuicao normal de media 100 e desviopadrao 10. Qual P (95 <X < 105)?
2 Uma populacao X tem uma distribuicao normal de media 10 e desviopadrao 1. Qual P (X > 7)?
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 13 / 41
REVISAO-AULA3
Solucao
1 Uma populacao X tem uma distribuicao normal de media 100 e desviopadrao 10. Qual P (95 <X < 105)?Basta transformar para Z P (−0,5 < z < 0,5) = 38,3%
2 Uma populacao X tem uma distribuicao normal de media 10 e desviopadrao 1. Qual P (X > 7)?Basta transformar para Z, P (Z > −3) = 0.9986%?
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 14 / 41
REVISAO-AULA3
Amostragem
TECNICAS DE AMOSTRAGEM E SEUS USOS
● I) Aleatoria simples Populacoes ricamente homogeneas.
● II) Sistematica Populacoes ordenadas.
● III) Estratificada Populacoes heterogeneas.
● IV) Conglomerado Subgrupos de populacoes.
● V) Nao-probabilıstica Amostragem acidental, intencional ou porquotas.
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 15 / 41
REVISAO-AULA3
Aleatoria simples
AMOSTRA ALEATÓRIA SIMPLES
População finita (n:N) ou população infinita (n:∞).
SORTEIOCOMPUTADOR COM REPOSIÇÃO SEM REPOSIÇÃO
Dados gerados num sistema de
referência.
Dados coletados numa tabela de
números aleatórios.
Um elemento pode ser retirado mais de uma vez.
Cada elemento só pode ser retirado
uma vez.
NnCn
N
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 16 / 41
REVISAO-AULA3
Aleatoria simples
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 17 / 41
REVISAO-AULA3
Aleatoria simples
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 18 / 41
REVISAO-AULA3
Sistematica
AMOSTRA SISTEMÁTICA
Lista de N elementos da população (p.ex., registros das
internações ou consultas ambulatorio).
Amostra de tamanho n.
Unidade amostral inicial selecionada das primeiras k unidades da lista (k = N/n).
Ex.: seleciona-se, aleatoriamente, a 4ª pessoa da lista; a amostra segue, então, com os elementos
4+k, 4+2k...
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 19 / 41
REVISAO-AULA3
Estratificada
AMOSTRA ESTRATIFICADA
População heterogênea
Estratos mais ou menos homogêneos
Amostragem simples ao acaso
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 20 / 41
REVISAO-AULA3
Por Conglomerado
AMOSTRA POR CONGLOMERADOS
POPULAÇÃO
CONGLOMERADO(ex.: quarteirões, famílias, edifícios,
escolas)
Amostra aleatória simples
Contagem completa dentro do
conglomerado
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 21 / 41
REVISAO-AULA3
Nao Probabilistica
AMOSTRAGEM NÃO-PROBABILÍSTICA(Não-inferência – não se conhece a probabilidade de um indivíduo ser incluído na
amostra)
AMOSTRAGEM ACIDENTAL
AMOSTRAGEM INTENCIONAL
AMOSTRAGEM POR QUOTAS
Coletam-se elementos até se atingir o
número desejado (ex.: pesquisas de opinião).
Os elementos são coletados dentro do grupo de interesse
(ex.: sala de espera da clínica X).
A amostra recebe quotas proporcionais ao total da população
(ex.: pesquisas de mercado).
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 22 / 41
REVISAO-AULA3
Distribuicao Amostral
● Para fazermos inferencia a populacao, tendo como base a amostraaleatoria representativa e retirada dessa populacao, vamos estudar oque ocorre com o processo.
● Vamos escolher o tipo de inferencia que vamos utilizar. Vamos falarde um valor? De um intervalo? Vamos colocar a prova um valor?
● Isto chamamos de estimacao● estimacao pontual do valor de um parametro da distribuicao,● estimacao de um intervalo de valores provaveis para o parametro, ou● teste de hipoteses estatısticas, por meio da rejeicao ou nao rejeicao de
uma afirmacao, que define um conjunto de valores provaveis para oparametro.
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 23 / 41
REVISAO-AULA3
Comecamos a falar de inferencia
Nosso objetivo e verificar a qualidade de uma estimativa, uma vez que naoe possıvel dizer-se se a estimativa esta perto ou nao do verdadeiro valor deθ (desconhecido), parametro. Mas antes vamos definir e estimativa!!Um parametro e um valor, um numero que representa uma caracterısticaunica da populacao. Se X uma variavel de uma populacao, os principaisparametros seriam:
● A media de X, anotada por µ
● A variancia de X, anotada por σ2
● O desvio padrao de X, anotado por σ
● A proporcao de elementos de P que apresentam determinadacaracterıstica, anotada por: ρ , entre outros.
A ESTIMATIVA E O VALOR(UM NUMERO) OBTIDO PELA AMOSTRAE ATRIBUIDO AO PARAMETRO.
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 24 / 41
REVISAO-AULA3
Propriedades legais para o estimador (T)
● A diferenca de T para θ deve ser pequena !
EQM = E[(T − θ)2] = var[T ] + (E[T ])2
● Um estimador cuja tendencia seja nula, chama-se nao tendencioso(ou nao enviesado)!
● Tem que ser mais eficiente. Se um estimador T tem uma EQM menordo que o EQM de outro estimador T*, quando estima o parametro, θ,a partir de uma amostra, dizemos que T faz e mais eficiente!
● Se pensarmos que quanto maior for a amostra, melhor sera ainferencia, entao um bom estimador Tn (baseado numa amostra detamanho n) deve satisfazer a propriedade de que, EQM diminui etende para zero a medida que se aumenta o numero de observacoes.
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 25 / 41
REVISAO-AULA3
Entendendo
µT
estimativa
estimativa
Varibilidade alta, não viciado
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 26 / 41
REVISAO-AULA3
Entendendo
µT
estimativaestimativa
Varibilidade baixa, viciado
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 27 / 41
REVISAO-AULA3
Entendendo
µTestimativa
estimativa
Varibilidade baixa, não viciado
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 28 / 41
REVISAO-AULA3
Entendendo
MÉDIA E VARIÂNCIA: POPULAÇÃO vs AMOSTRA
Xµ2Xs
população
", $%Número de irmãos
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 29 / 41
REVISAO-AULA3
Entendendo
MÉDIA E VARIÂNCIA: POPULAÇÃO vs AMOSTRA
24
Xµ2Xs
população
", $%
", $%
", $%
", $%
Número de irmãos
Média e Variância do n. de irmãosPopulação de amostras
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 30 / 41
REVISAO-AULA3
Entendendo
MÉDIA E VARIÂNCIA: POPULAÇÃO vs AMOSTRA
25
Xµ 2
Xs
2Sµ 22ss
Xµ2Xs
média
variância
população
população
população
", $%
", $%
", $%
", $%
Número de irmãos
Média e Variância do n. de irmãosPopulação de amostras
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 31 / 41
REVISAO-AULA3
Estimador Media
Para estimar a media da populacao, usando os elementos de uma amostraaleatoria, podemos utilizar a media da amostra, . Meu parametro agora ea media µ e o estimador e :
µX = E[X] = µ
σ2X= V ar[X] = σ
2
n
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 32 / 41
REVISAO-AULA3
Teorema do Limite Central
Seja X uma v.a. que tem media µ e variancia σ2. Para uma amostraX1,X2, ...Xn, retirada ao acaso e com reposicao de X, a distribuicao deprobabilidade da media amostral X aproxima-se, para n grande, de umadistribuicao normal, com media µ e variancia σ2
n , isto e ,
X ∼ N (µ, σ2
n ).
● Se a distribuicao de X e normal, entao e normal exata, para todo n.
● O desvio padrao da media amostral e√
σ2
n = σ√n
.
● σ√n
, e chamado de ERRO PADRAO.
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 33 / 41
REVISAO-AULA3
Estimador Variancia
Para estimar a variancia da populacao, usando os elementos de umaamostra aleatoria, podemos utilizar a variancia da amostra, S2.
S2 = ∑ni=1(Xi − X)2n − 1
Meu parametro agora e a variancia σ2 e o estimador e S2 :
E[S2] = σ2
V ar[S2] = 2 × σ4n − 1
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 34 / 41
REVISAO-AULA3
Estimador Proporcao
Para estimar a proporcao da populacao, usando os elementos de umaamostra aleatoria, podemos utilizar a proporcao da amostra (frequencia dedeterminado elemento), X.
p = Xn
Meu parametro agora e a proporcao ρ e o estimador e p :
E[p] = ρ
V ar[p] = ρ(1 − ρ)n
DP [p] =√
ρ(1 − ρ)n
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 35 / 41
REVISAO-AULA3
COMPARE COM O EXERCICIO QUE FIZEMOS
1 Uma populacao X tem uma distribuicao normal de media 100 e desviopadrao 10. Qual P (95 < X < 105)?
2 Uma populacao X tem uma distribuicao normal de media 10 e desviopadrao 1. Qual P (X > 7)?
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 36 / 41
REVISAO-AULA3
Anterior
1 Uma populacao X tem uma distribuicao normal de media 100 e desviopadrao 10. Qual P (95 <X < 105)?Basta transformar para Z P (−0,5 < z < 0,5) = 38,3%
2 Uma populacao X tem uma distribuicao normal de media 10 e desviopadrao 1. Qual P (X > 7)?Basta transformar para Z, P (Z > −3) = 0.9986%?
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 37 / 41
REVISAO-AULA3
Solucao
1 Uma populacao X tem uma distribuicao normal de media 100 e desviopadrao 10. Qual P (95 < X < 105)?
Neste caso vamos utilizar X ∼ N (µ, σ2
n ).Portanto Z = X−µ
σ√n
Veja quem sem saber o tamanho da amostra nao podemosresolver o problema, pois a ideia e estimar dois valores para amedia agora!!!!
2 Uma populacao X tem uma distribuicao normal de media 10 edesvio padrao 1. Qual P (X > 7)?Veja quem sem saber o tamanho da amostra nao podemosresolver o problema, pois a ideia e estimar dois valores para amedia agora!!!!
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 38 / 41
REVISAO-AULA3
Aplicacao do Teorema Central do Limite
● Tem-se a distribuicao dos nıveis sericos de colesterol de todos oshomens de 20 a 74 anos (EUA), µ = 211 mg/100 mL e = 46mg/100 mL. Selecionando amostras repetidas de tamanho 25 dapopulacao, que proporcao de amostras tera um valor medio de 230mg/100 mL ou acima?
● Pelo TCL, a distribuicao de medias de amostras de tamanho 25 eaproximadamente normal com media µ = 211 e desvio-padraoσ√n= 9,2mg/100mL. Como Z = X−µ
σ√n
variavel aleatoria normal
padrao, z = (230 − 211)/9,2 = 2,07.
● Acima desse valor, encontra-se 0,019 da area sob a curva normalpadrao, logo 1,9% das amostras tera um valor medio acima de ouigual a 230 mg/100 mL.
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 39 / 41
REVISAO-AULA3
Aplicacao do Teorema Central do Limite
E possıvel obter, os limites superior e inferior que incluem 95% dasmedias das amostras de tamanho 25 extraıdas da populacao, econforme o tamanho das amostras aumenta, a quantidade devariabilidade entre as medias diminui; consequentemente, os limitesque englobam 95% dessas medias se aproximam.P (a < X < b) = 95%
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 40 / 41
REVISAO-AULA3
Referencias
●●● BUSSAB, W.O.; MORETTIN, P. Estatıstica basica. 4 ed. Sao Paulo,Atual, 1987.
● MEDRONHO R; CARVALHO DM; BlOCH KV; LUIZ RR;WERNECK GL. Epidemiologia.Atheneu, 2 ed. Sao Paulo, 2008
● PAGANO, M. e GAUVREAU, K. Princıpios de Bioestatıstica -Traducao da 2ª Edicao Norte Americana, Pioneira ThonpsonLearning, Sao Paulo, SP,2004.
● ROSNER, B.Fundamentos de bioestatistica. 8ª Edicao NorteAmericana, Cengage Learning, 2016.
● SOARES , J. F. e SIQUEIRA, A. L. Introducao a Estatıstica Medica.UFMG, Belo Horizonte,1999.
Bioestatıstica - RCG0148 03 e 5 de Marco de 2020 41 / 41