estatistica aplicada (30h) unidade i
TRANSCRIPT
Autores:Prof.EdwinF.F.Silva Prof.WesleyCândidodeMeloColaboradores:Prof.SantiagoValverde Prof.JeanCarlosCavaleiro Prof.DanielScodelerRaimundo
Estatística Aplicada
Professores conteudistas: Edwin F. F. Silva e Wesley Cândido de Melo
Edwin F. F. Silva
PossuilicenciaturaemFísicapelaUniversidadeCatólicadeBrasília(2005);especializaçãoemHigienedasradiaçõesionizantes(Senacap,2011);emMetodologiadoEnsinoeAprendizagememMatemática(2009);pós-graduaçãoemTransporte(emandamento)pelaUniversidadedeBrasília.Atualmente,éprofessordaFaculdadeFortium,ministrandoaulasdecálculoeestatísticanoscursosdeSistemadeInformaçõeseAdministração,edaUniversidadePaulista,nocursodeEngenharia.Atuaempesquisas relacionadasàpoluição sonora,naáreadepolosgeradoresdeviagensetambémcomocorretordequestõesdoscursosdegraduaçãoadistânciadaUNIPecomotutordocursodeRHdaUNIPInterativa.
Wesley Cândido de Melo
Possui licenciatura em Física pela Universidade Católica de Brasília (2006); especialização em Matemáticae Estatística pela FACITEC (2008); pós-graduação em Transporte (em andamento) pela Universidade de Brasília.Atualmente, é professor da Universidade Paulista, ministrando aulas para os cursos de Engenharia, Gestão de RHeSegurançaPrivada;daFaculdade JK,noscursosdeAdministraçãoeRadiologia.Atua tambémcomocorretordequestõesdoscursosdegraduaçãoadistânciadaUNIPecomotutordocursodeRHdaUNIPInterativa.Épesquisadorvinculado ao grupo de pesquisa em Poluição sonora com ênfase em Ruídos aeronáuticos no curso de Física daUniversidadeCatólicadeBrasília.
©Todososdireitosreservados.Nenhumapartedestaobrapodeserreproduzidaoutransmitidaporqualquerformae/ouquaisquermeios(eletrônico,incluindofotocópiaegravação)ouarquivadaemqualquersistemaoubancodedadossempermissãoescritadaUniversidadePaulista.
Dados Internacionais de Catalogação na Publicação (CIP)
S586e Silva,EdwinF.Estatísticaaplicada/EdwinF.Silva;WesleyCândidodeMelo.–
SãoPaulo:EditoraSol,2012.112p.,il.Nota: este volume está publicado nos Cadernos de Estudos e
PesquisasdaUNIP,SérieDidática,anoXVII,n.2-064/12,ISSN1517-9230.
1.Estatística.2.Distribuiçãodefrequências.3.Probabilidades.I.Título.
CDU519.2
Prof.Dr.JoãoCarlosDiGenioReitor
Prof.FábioRomeudeCarvalhoVice-Reitor de Planejamento, Administração e Finanças
Profa.MelâniaDallaTorreVice-Reitora de Unidades Universitárias
Prof.Dr.YugoOkidaVice-Reitor de Pós-Graduação e Pesquisa
Profa.Dra.MaríliaAncona-LopezVice-Reitora de Graduação
Unip Interativa – EaD
Profa.ElisabeteBrihy
Prof.MarceloSouza
Profa.MelissaLarrabure
Material Didático – EaD
Comissãoeditorial: Dra.AngélicaL.Carlini(UNIP) Dr.CidSantosGesteira(UFBA) Dra.DivaneAlvesdaSilva(UNIP) Dr.IvanDiasdaMotta(CESUMAR) Dra.KátiaMosorovAlonso(UFMT) Dra.ValériadeCarvalho(UNIP)
Apoio: Profa.CláudiaReginaBaptista–EaD Profa.BetisaMalaman–ComissãodeQualificaçãoeAvaliaçãodeCursos
Projetográfico: Prof.AlexandrePonzetto
Revisão: AndréiaGomes GeraldoTeixeiraJr.
SumárioEstatística Aplicada
APRESENTAçãO......................................................................................................................................................7INTRODUçãO...........................................................................................................................................................7
Unidade I
1HISTÓRIADAESTATÍSTICA..............................................................................................................................91.1Introduçãoàestatística........................................................................................................................91.2Importânciadaestatística.................................................................................................................111.3Elementosfundamentaisdaestatística...................................................................................... 12
1.3.1Populaçãoeamostra............................................................................................................................. 121.4Fasesdométodoestatístico............................................................................................................. 131.5Dadosestatísticos................................................................................................................................ 131.6Formasiniciaisdetratamentodosdados................................................................................... 151.7Notaçõesporíndices.......................................................................................................................... 16
1.7.1Notaçãosigma(∑)................................................................................................................................. 161.8Sériesestatísticas–simplesecompostas.................................................................................. 19
2APRESENTAçãODEDADOS–GRáFICOSETABELAS........................................................................ 202.1Elementosbásicosdastabelas........................................................................................................ 26
3MEDIDASDETENDÊNCIACENTRAL:MÉDIA,MODAEMEDIANAPARADADOSSIMPLES.................................................................................................................................................. 26
3.1Amédiaaritméticasimples(x)....................................................................................................... 273.2Amédiaaritméticaponderadaxp................................................................................................. 293.3Amediana(Md)..................................................................................................................................... 313.4Amoda..................................................................................................................................................... 343.5Posiçãorelativadamédia,modaemediana............................................................................. 36
4MEDIDASDEDISPERSãOPARADADOSSIMPLES.............................................................................. 364.1Amplitudetotal..................................................................................................................................... 384.2Desviomédioabsoluto....................................................................................................................... 394.3Variância.................................................................................................................................................. 404.4Desviopadrão........................................................................................................................................ 454.5Coeficientedevariação..................................................................................................................... 46
Unidade II
5DISTRIBUIçãODEFREQUÊNCIAS............................................................................................................. 525.1Aconstruçãodeumadistribuiçãodefrequênciasparadadoscontínuos.................... 53
5.2Aconstruçãodeumadistribuiçãodefrequênciasparadadosdiscretos...................... 595.3Representaçõesgráficasdedadosagrupados......................................................................... 60
6ASMEDIDASDEPOSIçãOEVARIABILIDADENUMADISTRIBUIçãODEFREQUÊNCIA................................................................................................................................................... 69
6.1Asmedidasdeposição....................................................................................................................... 706.1.1Amédia....................................................................................................................................................... 706.1.2Amediana.................................................................................................................................................. 716.1.3Amoda........................................................................................................................................................ 72
6.2Asmedidasdedispersãonumadistribuiçãodefrequência................................................ 736.2.1Odesviomédio........................................................................................................................................ 736.2.2Variância..................................................................................................................................................... 746.2.3Desviopadrão........................................................................................................................................... 75
7INTRODUçãOÀPROBABILIDADE............................................................................................................. 807.1Teoriasdosconjuntos,espaçoamostraleeventos................................................................. 81
8PROBABILIDADE:ORIGEM,MÉTODOSEPRINCIPAISTEOREMAS................................................ 918.1Origensdaprobabilidade.................................................................................................................. 92
8.1.1Métodosobjetivos.................................................................................................................................. 928.1.2Métodosubjetivo.................................................................................................................................... 96
8.2Principaisteoremasdeprobabilidade.......................................................................................... 96
7
APrESEntAção
Oobjetivodestematerial é fazer comqueoaluno tenhacondiçõesde interpretarumconjuntodeobservaçõesdeformaclaraeobjetiva,afimdedistinguiraslimitaçõeseasvantagensdousodeamostras,assimcomoosmétodospara suaobtenção; tenhahabilidadeparadescrevere interpretardadospormeiodefiguras(tabelasegráficos),estimativaspontuaisedevariabilidade;calcularointervalodeconfiançadaproporçãoemédia,assimcomoidentificarsuaaplicação;coletareinterpretardadosdeformasistematizadaeimprimircredibilidadeaanálisesquantitativasdosfenômenosderealidadeinvestigada.
Assim,esperamoscontribuirdamelhorformapossívelcomseuaprendizado.
Comnossoscumprimentos,
Equipeorganizadora.
Introdução
DesdeaAntiguidade,aestatísticafazpartedavidadaspessoas,mesmoquedeformaindireta,masocertoéqueessaciênciaestápresentenavidadaspessoasotempotodo.Quandoabrimosumjornal,porexemplo,láestáumasériedegráficosetabelasquenosauxiliamnoentendimentodedeterminadotema,ouquandolemosumareportagemquetrazcomotemaaprobabilidadedeomercadofinanceirofecharemaltaouembaixa,ou,ainda,virandoapáginadessemesmojornal,temosamanchetedivulgandoosdadosdoCenso2010.
Diantedessesfatos,nosperguntamosdequeformaaestatísticapodenosajudar,sejanolevantamentodedadosparaumaempresasabercomovãosuasvendas,sejaparasaberosriscosdeinvestirnasaçõesdeumaempresa,ou,ainda,comoogovernopodedeterminarascaracterísticasdosváriosaspectos,sociais,econômicoseambientaisdosestadoseatémesmodenossopaís.
Sãoperguntascomoessasqueaestatísticanosajudaaresponder,eaindanãopodemospensarnessaciênciacomoseelaselimitasseaapenascompilartabelasdedadoseosilustrargraficamente.Dessaforma,édesuaimportânciaconhecerasinúmerasvariáveisassociadasaela,poisemqualquerramodasociedadecontemporâneaestãopresentesosprocessosestatísticos.Eoestudantequenãosoubertrabalharcomessesconceitosestaráemdesvantagemnomercadodetrabalho.
Paratiraromáximoproveitodainterpretaçãodeumdeterminadofenômeno,deve-seseguiralgumasetapas, como,por exemplo,planejaraobtençãodedados, interpretar eanalisarosdadosobtidoseapresentarosresultadosdemaneiraafacilitaratomadadedecisõesrazoáveis.
É fundamentalqueotextoproduzidonestematerial leveoalunoapensaremsituaçõesdoseucotidianoequedessa formaelepossaassociara teoriacomapráticavivenciadaemseudiaadia.Pensandonisso,ele foidivididoemduasunidades,nasquais serãoabordados,naprimeiraunidade:sériesestatísticas,gráficosestatísticos,medidasdetendênciacentral,medidasdedispersão,entreoutros
8
temas;jánasegundaunidade,serãoapresentados:dadostabulares,distribuiçãodefrequência,medidasdeposiçãoevariabilidadenumadistribuiçãodefrequência,probabilidade,bemcomoalgunsdeseusteoremas,entreoutrostemas.
9
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Unidade IComoaUniãorealizaadistribuiçãoderendaparaosEstados,MunicípioseoDistritoFederal?Como
saberquemdeverecebermaisoumenosverbas?Comosabersedeterminadotrechodeumaviaourodoviaéounãoperigoso?
SãoaquestõescomoessasqueadisciplinaEstatísticaprocuraresponder.
1 HIStÓrIA dA EStAtÍStICA
Na história do desenvolvimento humano, a sociedade primitiva se deparou com os primeirosproblemasparasaberotamanhodasuapopulação,aquantidadedeterrasesuasriquezas,porissoteveanecessidadedecontá-las.Emdecorrênciadisso,osgovernantesdasgrandescivilizaçõesantigasfizeramindiretamenteumestudoestatísticoparasaberosbensqueseuEstadopossuíaecomoapopulaçãodesseEstadoestavadistribuída.
NoAntigoEgito,aproximadamente3040a.C.,Heródotopediuquefossefeitoumestudosobreariquezadapopulação,comoobjetivodesaberaquantidadederecursoseconômicosehumanospararealizaraconstruçãodaspirâmides.NaChina,aproximadamente2238a.C.,oimperadorYaopediuquefossefeitoumestudodapopulação,comobjetivosindustriaisecomerciais.
Apalavra“estatística”foisugeridapeloalemãoGottifriedAchemmel(1719/1772)eéassociadaàpalavralatinastatus(Estado).
EssaciênciateveaceleradodesenvolvimentoapartirdoséculoXVII,comosestudosdeBernoulli,Fermat,Laplace,Gausseoutrosqueestabeleceramsuascaracterísticasatuais.
Saiba mais
Paraumaabordagemmaisdetalhadadahistóriada estatística, ler oartigo:“Conceitosiniciaisebrevehistóricodaestatística”,disponívelem:<http://mundobr.pro.br/uneal/wp-content/uploads/2010/04/01.conceitos_inicias-historico-somatorio.pdf>.Acessoem:12jul.2012.
1.1 Introdução à estatística
Atodoinstante,nosnoticiários,emrevistas,jornais,internet,ouvimosfalarnapalavra“estatística”,o que é possível perceber o quanto é importante conhecermos a fundo essa ciência. Algumas de
10
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
suasaplicabilidadespodemserobservadasnaspesquisasdeopiniãopúblicaenosdadospublicadosdiariamentenaimprensa.Narealidade,aestatísticacontemplamuitosoutrosaspectos,sendodevitalimportâncianainterpretaçãodeprocessosemqueexistavariabilidade.
De acordo com Dervalmar, é possível distinguir duas concepções para a palavra “estatística”. Noplural,“estatísticas”indicaqualquercoleçãodedadosquantitativosou,ainda,ramodamatemáticaquetratadacoleta,daanálise,dainterpretaçãoedaapresentaçãodemassadedadosnuméricos.Assim,por exemplo, as estatísticas demográficas referem-se aos dados numéricos sobre o quantitativo denascimentos,falecimentos,matrimônios,desquitesetc.Asestatísticaseconômicasestãorelacionadasaos dados numéricos como emprego, produção, vendas e com outras atividades ligadas aos váriossetoresdavidaeconômica.
Nosingular,“estatística”indicaaatividadehumanaespecializada,ouumcorpodetécnicas,ouaindaumametodologiadesenvolvidaparaacoleta,aclassificação,aapresentação,aanáliseeainterpretaçãodedadosquantitativoseautilizaçãodessesdadosparaatomadadedecisões.
Estatísticaéumconjuntodemétodoseprocessosquantitativosqueserveparaestudaremedirosfenômenoscoletivos.
Parafinsdidáticos, é comumos livros-textos apresentarema estatística emduasgrandes áreas,emboranãosetratedeáreasisoladas:estatística descritivaeestatística inferencial.
• estatística descritiva –éaquelaquetemporobjetivodescrevereanalisardeterminadapopulação,utilizandométodosnuméricos e gráficos, para sedeterminarempadrões, emumconjuntodedados,eassimapresentarainformaçãoemumaformaconveniente.
Exemplo 1: Ográficoaseguirapresentaaparticipaçãorelativadasbandeirasdecartõesdecrédito,noquartotrimestrede2010.
Visa52,2%
Outras9,4%
MasterCard38,4%
Figura1-Participaçãorelativadasbandeiras(quantidadedetransações)
Pormeiodográfico,épossívelverclaramentequemaisdametadedastransaçõessãofeitascomabandeiraVisaequeaproximadamente40%sãofeitascomabandeiraMasterCard.Comoográficodescreveostiposdebandeirasdecartõesutilizadasemtodasastransaçõesdoquartotrimestrede2010,ográficoéumexemplodeestatísticadescritiva.
11
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Exemplo 2:ÍndiceNacionaldePreçosaoConsumidor(INPC)
Suaapresentaçãoenvolveasintetização,emumúnicodado,dosaumentosdosprodutosdeumacestabásica.
Trata-sedeumexemplodeestatística inferencial,queconstituioconjuntodemétodosparaatomadadedecisões,nassituaçõesemqueháincerteza,variaçõesououtrasgeneralizaçõesacercadeumconjuntomaiordedados.
Exemplo 3:Análisedemercado
Quandoumaempresapretendelançarumproduto,precisaconheceraspreferênciasdosconsumidoresnomercadodeinteresse.Faz-senecessáriaumapesquisademercado.
Exemplo 4:Ocorrênciadeterremotos
Osgeólogosestãocontinuamentecoletandodadossobreaocorrênciadeterremotos.Gostariamdeinferirquandoeondeocorrerãotremoresequalasuaintensidade.Trata-se,semdúvida,deumaquestãocomplexaqueexigelongaexperiênciageológica,alémdecuidadosaaplicaçãodemétodosestatísticos.
1.2 Importância da estatística
Comodesenvolvimentohumanoe tecnológico, temospresenciadograndesdescobertasnaáreada saúde, da engenharia, da economia etc.; por outro lado, também observamos os problemas queseespalhampelomundo,porexemplo,aameaçacomadegradaçãodomeioambiente,asepidemias(H1N10) causando grandes preocupações para os governantes e para a população mundial. Comoajudarpesquisadores,cientistas,engenheirosetc.asenortearemcomoquedeveserfeitotantoparacriarnovaspossibilidadescomotambémparasolucionarosproblemasexistentes?
Ométodoestatísticolidacominformações,associandoosdadosaoproblema,mostrandocomoeoquecoletarparaobterconclusõesapartirdetodososdados,detalformaqueessasconclusõespossamserentendidasporoutraspessoas.Assim,essemétodoauxiliaosváriosprofissionaisnoplanejamentoenatomadadedecisões.
Saiba mais
Oartigo“Aelaboraçãodeestatísticasdemortalidadesegundocausasmúltiplas” apresenta uma aplicação da estatística mostrando a suaimportância para a tomada de decisões. Disponível em: <http://www.scielosp.org/pdf/rbepid/v3n1-3/03.pdf>.Acessoem:15jul.2012.
12
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Vejamosalgunsexemplos:
Ogovernoanualmentedivulgaocensosobreadinâmicadapopulaçãobrasileira,apresentandoseucrescimentodemográfico,suascaracterísticasecomovivemosbrasileiros.
Asgrandesempresasfazemlevantamentossobrevendas,produção,inventário,folhadepagamentoeoutrosdados,afimdeverificarseaempresaestácrescendo,comoseucrescimentoestáemrelaçãoaoutrasempresasecomotomardecisõesfuturas.
Aanálisedosdadosémuitoimportanteparafazerumplanejamentoadequado.
Saiba mais
Para mais informações sobre o Censo, acesse o site do IBGE:<http://www.ibge.gov.br>.
1.3 Elementos fundamentais da estatística
Amostra:équalquersubconjuntonãovaziodeumapopulação.
Amostragem: éomeiodeescolhadaamostraeconsistenaseleçãocriteriosadoselementosaseremsubmetidosaoestudo.
1.3.1 População e amostra
Paraopesquisador,oestudodequalquerfenômeno,sejaelenatural,econômico,socialoubiológico,necessitadacoletaedaanálisededadosestatísticos.Acoletadedadoséparte inicialdequalquerpesquisa.
População:éoconjuntodetodosositens(pessoas,coisaseobjetos)queinteressamaoestudodeumfenômenocoletivo.
Parâmetro:éadenominaçãodeumacaracterísticanuméricaestabelecidaparatodaumapopulação.
Estimador:éacaracterísticanuméricaestabelecidaparatodaaamostra.
Exemplo: pesquisassobretendênciasdevotação.
Emépocasdeeleição,écomumarealizaçãodepesquisascomoobjetivodeconhecerastendênciasdo eleitorado. Para que os resultados sejam, de fato, representativos, deve-se atentar para que ascaracterísticas da população à qual os resultados da pesquisa serão estendidos sejam tão próximas
13
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
quanto possível. A escolha da amostra, o questionário, a entrevista, a sintetização dos dados e arepresentaçãodosresultadossãoasetapasdessetipodepesquisa.
Populaçãosãotodos
oseleitoreshabilitadosdo
município.
Fenômenocoletivo
(EleiçõesparaPrefeituradeummunicípio).
Amostraéumgruponuméricodeeleitores
selecionadonapopulaçãodomunicípio
ParâmetroéumaproporçãodevotosparaocandidatoAobtidanapopulação
EstimadoréumaproporçãodevotosparaocandidatoAobtidanaamostra
Amostra
Figura2
1.4 Fases do método estatístico
Emumapesquisa,quandosedesejaempreenderumestudoestatísticocompleto,existemfasesdotrabalhoquedevemsertrabalhadasparasechegaraosresultadosfinaisdoestudo.
Asprincipaisfasessão:
• definição do problema –delimitaçãodoproblema;
• planejamento –organizaçãodasaçõesqueserãorealizadasnapesquisadecampo;
• coleta de dados – iracampobuscarasinformações;
• apuração dos dados – organizaçãodasinformaçõescoletadas;
• apresentação dos dados – gráficosetabelas;
• análise e interpretação dos dados – pormeioda linguagemmatemática (média,mediana,moda,desviopadrão,percentuaisetc.).
Observequaissãoasfasesprincipaisdométodoestatístico–compõemaorganizaçãodeumprojeto,suaexecuçãoeapresentaçãofinal.
1.5 dados estatísticos
Quandosetrabalhacomaobservação,amensuração,aanáliseeainterpretaçãodenúmeros,essesnúmerosnosconduzemaíndicesinflacionários,índicesdedesemprego,probabilidadededeterminadocandidatoganharaseleiçõesetc.Essesnúmeros,portanto,serãochamadosdedadosestatísticos,osquaisprecisarãoserorganizadosesumarizadosparasuacorretainterpretação.
O dado bruto significaqueos dadosnãoestãonumericamenteorganizadoseprocessados.Éoprocessamentoeaorganizaçãodosdadosqueostransformameminformação,enfatizando
14
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
seus aspectos mais importantes. A informação, portanto, é resultado de um tratamento dosdados.
Paraorganizar e processar osdados estatísticos, podem-seutilizar resumos visuais enuméricos,comográficos,mapas,tabelasemodelosnuméricos.
Amensuraçãoouaobservaçãodeitenscomoíndicesdepreços,rendamensalpercapitadeumEstadoetc.dãoorigemaosdadosestatísticos.Comoesses itensoriginamvaloresque tendemaapresentarcertograudevariabilidadequandosãomedidossucessivasvezes,iremoschamá-los,então,devariáveis.
Éimportanteidentificarosquatrotiposdevariáveis:variáveiscontínuas,variáveisdiscretas,variáveisnominaisevariáveisordinais.
• Variáveis contínuas:podemassumirqualquervalornumintervalocontínuo(dadocontínuo),ouseja,seráumnúmeroreal.Exemplos:altura,peso,velocidadeetc.
• Variáveis discretas:emgeral,originam-sedacontagemde itensesópodemassumirvaloresinteiros.Exemplos:númerodealunosemsaladeaula,númerodeprofessoresquetrabalhamnaescolaetc.
• Variáveis nominais:sãoaquelasqueexistemcomoobjetivodedefinircategorias,easobservações,mensuraçõeseanálisessãofeitas levando-seemcontaessasmesmascategorias.Exemplosdecategoriaseriam:separaçãoporsexo,estadocivil,esportepredileto,coretc.
• Variáveis ordinais: quando existe odesejodedispor os elementosobservados segundoumaordem de preferência ou desempenho, atribuem-se valores relativos para indicar essa ordem.Exemplo:primeiro,segundo,terceirograudeescolaridadeetc.
Asvariáveisdiscretasecontínuassãoditasvariáveisquantitativasporqueenvolvemdadosnuméricos.Jáasvariáveisnominaiseordinaisprecisamsertransformadasemvaloresnuméricosparaseremobjetodaanáliseestatística,esãoditasvariáveisqualitativas.Porexemplo:emumdepartamentodaempresaJJ,quetem36funcionários,fez-seumapesquisaparaverificaralgunsdados.Classifiqueasvariáveis,conformeosdadosdatabelaaseguir.
Tabela 1
Estado civil Grau de instrução Nº filhos Salário (X. min) Idade (anos-meses)
Solteiro EnsinoFundamental - 4,00 2303
Casado EnsinoFundamental 1 4,56 3210
Casado EnsinoSuperior 3 19,40 4811
Solteiro EnsinoMédio - 10,53 2508
Solteiro EnsinoMédio - 16,22 3105
15
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Resolução
Variável qualitativa nominal:estadocivil.
Variável qualitativa ordinal:graudeinstrução.
Variável quantitativa discreta:númerodefilhos.
Variável quantitativa contínua:salárioeidade.
Variáveis discretas e contínuas =variáveisquantitativas.
Variáveis nominais e ordinais =variáveisqualitativas.
Eainda:
Dados qualitativos:consistemematribuirqualidadeouatributoàvariávelpesquisada.
Dados quantitativos:consistememnúmerosquerepresentamcontagensoumedidas.
1.6 Formas iniciais de tratamento dos dados
Emgeral,quandonospropomosabuscarouconstruirinformaçõesapartirdedados,deparamo-nos,inicialmente, com um conjunto de dados brutos que pouco nos dizem. É preciso organizá-losminimamenteparaquecomecemafazeralgumsentido,viabilizandosuaanálise.
Exemplo 1:atabelaaseguirapresentaasnotasde40estudantesdadisciplinadeestatística.
Tabela 2
50 96 75 87 65 45 72 1032 54 25 69 72 30 81 2024 45 80 90 64 95 23 9080 35 96 47 65 70 73 6360 20 45 89 20 90 80 70
Essatabelaéchamadadetabelaprimitivaoudadosbrutos,poisosdadoscoletadosestãodispostosconformeaordemdacoletaenãonaordemdenumeração.
Observandoosdadosanteriores,tabelaprimitiva,ficadifícilvisualizaremtornodequevalortendemaseconcentrarasnotasdosestudantes,qualamaiorouqualmenornota,eaindaquantosalunosseachamabaixodeumadadanota.
16
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Uma primeira forma de organização dos dados brutos é o chamado rol. Obtemos o rol quandoorganizamososdadosbrutosemordemcrescenteoudecrescentedegrandeza.
Aindacomrespeitoàtabeladenotados40estudantesdadisciplinadeestatística,vejamoscomofica:
Tabela 3
10 20 20 20 23 24 25 30
32 35 45 45 45 47 50 54
60 63 64 65 65 69 70 70
72 72 73 75 80 80 80 81
87 89 90 90 90 95 96 96
Agora,podemossaber,comrelativafacilidade,qualamenornota(10)equalamaiornota(96).Paradeterminaraamplitudedorol,bastarealizaradiferençaentreomaioreomenornúmerodorol,ouseja,paraoexemplo,aamplitudedevariaçãofoide96–10=86.
Exemplo 2:sejaA={10,7,3,9,1,5,10,4,2,8}oconjuntodasnotasdosalunos,determineoroleaamplitudedorol:
{10,7,3,9,1,5,10,4,2,8}àdadobruto
{1,2,3,4,5,7,8,9,10,10}àrol
Amplitude={maiorvalordorol–menorvalordorol}
àA=10–1=9
Limites de classe:sãoosnúmerosextremosdecadaclasse;sendoassim,temosumlimiteinferioreumsuperior,quedenominamosdeamplitudedevariação.
A=Lsup.-Linf.
1.7 notações por índices
Anotaçãoporíndicesébastanteutilizadanaestatística,sendoimportanteesclarecerseusignificado.Osímboloxi(lê-se“xíndicei”)irárepresentarqualquerumdosnvaloresassumidospelavariávelx,x1,x2,x3,x4,...,x.“n”édenominadoíndiceepoderáassumirqualquerdosnúmerosentre1,2,3,4,...,n.
1.7.1 Notação sigma (∑)
Amaioriadosprocessosestatísticosvaiexigirocálculodasomadeumconjuntodenúmeros.Aletramaiúsculagregasigma(∑)éutilizadapararepresentarosomatório.
17
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Assim,sedeterminadavariávelytiverosvalores3,5,7,9e11,o∑yserá:
∑y=3+5+7+9+11
∑y=35
Poroutrolado,seoconsumosemanaldearrozporx,duranteummês,foi2kg,4kg,3kg,5kg,ototalconsumidoporxnomêsteriasido:
∑x=2+4+3+5
∑x=14,xteriaconsumido14kgdearrozduranteomêsreferido.
Anotaçãosigmapossuialgumaspropriedadesqueprecisamosdesenvolverparafacilitarosconteúdosqueestudaremosnestadisciplina.
A) x x xi
n
i11=
∑ ∑ ∑= = ,issosignificaquedevemossomarasnobservaçõesdex,começandocom
aprimeira.
Porexemplo,numconjuntodedadosx={2,4,6,8,10,12},emquen=6,temos:
x x
x
ii
n
ii
i
= =∑ ∑
∑
= = + + + + +
=1 1
6
2 4 6 8 10 12
42
Poroutrolado,épossívelutilizaressanotaçãoquandosepretendeanalisarasomadeapenasumapartedosdadosdisponibilizados, podendo-se, portanto, abreviar a somadeumconjuntodedados.Dessaforma,podemoster:
x x x xi1 2 31
3
+ + = ∑x x x x xi
i8 9 10 11
8
4
+ + + ==∑
B)Secadavalordavariávelxémultiplicadooudivididoporumaconstante,temosqueissoseráigualaovalordaconstantemultiplicadooudivididopelasomatóriadex.
c x c x. .= ∑∑
18
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Assim,
4 4 4 4 4
4 4
1 2 3 41
4
1 2 3 41
4
x x x x x
x x x x x
ii
ii
= + + +
= + + + =
=
=
∑
∑( )
Porexemplo:sexi={2,4,6,8,10,12},n=6,ecadavalordexémultiplicadopelaconstantec=2,temos:
cx c x= ∑∑cx c xi
ii
i
= = + + + + =
= + + + += =∑ ∑
1
6
1
6
2 2 2 4 2 8 2 10 2 12
2 2 4 6 8 10
( ) ( ) ( ) ( ) ( )
( ++
= = ===∑∑
12
2 2 2 42 841
6
1
6
)
( )x xi iii
C)Osomatóriodeumaconstantecseráigualaoprodutodaconstantepelonúmerodevezes(n)queelaserepete.Assim,temos:
c ncii i
n
==∑Porexemplo,numadeterminadaobservação,oconjuntodedadosdexi={7,7,7,7,7,7},n=6,
temosquexiéumaconstantecqueserepete.Então,temos:
x c
xi c nc
i i
iii
=
= = = + + + + + = ===∑∑
1
6
1
6
7 7 7 7 7 7 6 7 42( )
D)Osomatóriodeumasomaoudeumadiferençadeduasvariáveisseráigualàsomaoudiferençadossomatóriosindividuaisdasduasvariáveis.Assim,temos:
( )
( )
x y x y
x y x y
i i i ii
n
i
n
i
n
i i i ii
n
i
n
i
n
+ = +
− = −
===
===
∑∑∑
∑∑∑111
111
19
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Porexemplo:
i X Y (X-Y)
( )x y
x y
− =
− = − =∑∑ ∑
9
20 11 9
1 8 5 3
2 3 2 1
3 4 0 4
4 5 4 1
- - - -
Σ 20 11 9
Figura3
E)Osomatóriodeumconjuntodedadosxaoquadradonosobrigaaelevarcadaelementodexiaoquadradoparaefetuarasoma.Assim,temos:
x x x x xii
n
n2
112
22
32 2
=∑ = + + + +...
Porexemplo,numadadaobservação,oconjuntodedadosdexi={2,4,6,8,10},n=5;temos,então:
xii
2
1
52 2 2 2 22 4 6 8 10
4 16 36 64 100 220=∑ = + + + + =
= + + + + =
F)Osomatórioaoquadradodeumconjuntodedadosseráobtidotomando-seasomadosvaloresdexieelevando-seaoquadrado.Assim,temos:
( ) ( ... )x x x x xii
n
n=∑ = + + + +
1
21 2 3
2
Porexemplo,setemosummesmoconjuntoxi={2,4,6,8,10},n=5,talqualnoexemplodoitemE,teremosumresultadodistinto.Vejamos,nestecaso:
( ) ( ) ( )xii=∑ = + + + + = =
1
52 2 22 4 6 8 10 30 900
Nãoconfunda xii
n2∑ com xi
i
n
∑
2
,pois,conformeseobservanoexemploanterior,seusresultadosserãodiferentes.
1.8 Séries estatísticas – simples e compostas
Umasérieestatísticadefine-secomoqualquertabelanaqualhajadistribuiçãodeumconjuntodedadosestatísticosdestinadosaumamesmaordemdeclassificação:quantitativa. Ou,ainda,nosentido
20
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
maisamplo,sérieéumasucessãodenúmerosreferidosaqualquervariável.Casoosnúmerosexpressemdadosestatísticos,asérieseráchamadadesérie estatística.
Astabelassãoutilizadasparaapresentarsériesestatísticas.Ostrêscaracterespresentesnatabelaqueasapresentasão:
• a época(fatortemporaloucronológico)–aqueserefereofenômenoestudado;
• o local(fatorespacialougeográfico)–ondeofenômenoacontece;
• o fenômeno(espéciedefatooufatorespecífico)–queédescritodeformacategórica.Assériessãodivididasemdoisgrupos:
Assériessãodivididasemdoisgrupos:
1. Séries homógradas:ondehávariaçãodiscretaoudescontínuanavariáveldescrita.
-SérietemporalSéries homógradas: -Sériegeográfica-Sérieespecífica.
2. Séries heterógradas: são aquelas nas quais o fenômeno/fato apresentam gradações ousubdivisões.
Séries heterógradas: Distribuiçãodefrequências
2 APrESEntAção dE dAdoS – gráFICoS E tAbElAS
Arepresentaçãográficadassériesestatísticastemporfinalidadesintetizarosresultadosobtidose,assim,chegaraconclusõessobreaevoluçãodofenômenoousobrecomoserelacionamosvaloresdasérie.Ográficomaisapropriadoficaráacritériodopesquisador,respeitandooselementosdeclareza,simplicidadeeveracidade(NOGUEIRA,2009).
Diretrizesparaaconstruçãodeumgráfico:
• otítulodográficodeveseromaisclaroecompletopossível,sendonecessárioacrescentarsubtítulos;
• aorientaçãogeraldosgráficosdeveserdaesquerdaparaadireita;
• asquantidadesdevemserrepresentadasporgrandezaslineares;
• semprequepossível,aescalaverticalhádeserescolhidademodoaapareceralinha0(zero);
• sódevemserincluídasnodesenhoascoordenadasindispensáveisparaguiaravistanaleitura,umtracejadomuitocerradodificultaoexamedográfico;
• aescalahorizontaldeveserlidadaesquerdaparaadireitaeaverticaldebaixoparacima;
21
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
• os títulos e as marcações do gráfico dispor-se-ão de maneira que sejam facilmente legíveis,partindodamargemhorizontalinferioroudamargemesquerda.
Leituraeinterpretaçãodeumgráfico:
• declararqualofenômenooufenômenosrepresentados,aregiãoconsiderada,operíododetempo,afontedosdadosetc.;
• examinarotipodegráficoescolhido,verificarseéomaisadequado,criticarasuaexecução,noconjuntoenosdetalhes;
• analisarcadafenômenoseparadamente,fazendonotarospontosmaisemevidência,omáximoeomínimo,asmudançasmaisbruscas;
• investigarseháuma“tendênciageral”crescenteoudecrescenteou,então,seofatoexpostoéestacionário;
• procurardescobriraexistênciadepossíveisciclosperiódicos,qualoperíodoaproximadoetc.
Eisostiposmaiscomunsdegráficos:
Gráfico em linha
1234567
500
400
300
200
100
0
Série1
Série2
Figura4
Gráfico em colunas
População
1940195019601970
100
80
60
40
20
0
População
Figura5
22
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Gráfico em barras
Ésemelhanteaográficoemcolunas,porémosretângulossãodispostoshorizontalmente.
PopulaçãodoBrasil
020406050100
1970
1960
1950
1940
PopulaçãodoBrasil
Figura6
Gráfico em setores
Anos Faturamento de uma empresa (em milhões)
2008 3
2009 4
2010 5
Total 12
Figura7
É a representação gráfica de uma série estatística, em círculo, por meio de setores. É utilizadoprincipalmentequandosepretendecompararcadavalordasériecomototal.
Total__________360ºParte___________xº
• Para2008:12-360º3-xºxº=90º
• Para2009:12-360º4-xºxº=120º
• Para2010:12-360º5-xºxº=150º
23
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
2008
2009
2010
Figura8
Gráfico polar
Éarepresentaçãodeumasériepormeiodeumpolígono.Movimentomensaldecomprasdeumaagênciaem1972.
Tabela 4
Meses Valores (R$ 1.000,00)
Janeiro 12
Fevereiro 13
Março 14
Abril 12
Maio 15
Junho 19
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
JanFev
Mar
Abr
Mai
JunJul
Ago
Set
Out
Nov
Dez 20
15
10
5
0
Série1
Figura9
24
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Gráfico carta geográfica
É a representação gráfica de um mapa geográfico indicando um acontecimento, por exemplo,aprevisãode tempoparadeterminadodiaemdeterminadoEstadooupaís.Afiguraa seguir éumcartogramaqueinformaaproduçãodepetróleosegundosuasregiõesgeográficas.
Cartograma 1.2–Produçãodepetróleo,segundoregiõesgeográficas(milhõesb/d)–2003
áfrica
AméricasCentraledoSul
8,4
14,2
6,7
7,9
7,9
22,6
OrienteMédio
ásia-Pacífico
EuropaeEx-UniãoSoviética
AméricadoNorte
Figura10
Nota:incluióleodexisto,óleodeareiasbetuminosas–oLGN,excetoparaoBrasil.
ParaoBrasil,incluiLGNenãoincluióleodexistoeóleodeareiasbetuminosas.
Pictograma
Éarepresentaçãográficamaisutilizadanaatualidadeporjornaiserevistas,poiséumgráficodeformaatraenteedefácilinterpretação.Mostraofenômenoestudadoinseridocomumgráficodelinha,coluna,barraoudesetor,conformeoexemploaseguir,emqueumoutdoorapontaaverbagastacompublicidadejuntocomumgráficodelinhaparamostrarseudesempenhoanual.
25
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Figura11
Publicidadeemalta
Institucional De utilidade pública
Orçamentoprevêaumentode20%emgastosdaadministraçãodireta
Valor da publicidadeEmR$Milhões
2007200820092010 200720082009201080,1
120,2
158,1167 532,1
425,1
294,7
152,6
Figura12
Saiba mais
AplicaçãodegráficosdecontroledeSomaAcumulada(CUSUM)paramonitoramento de um processo de usinagem. Disponível em: <http://dspace.universia.net/bitstream/2024/542/1/ArtigoXVISIMPEP2009.PDF>.Acessoem:20jul.2012.
26
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
2.1 Elementos básicos das tabelas
Umaformadesintetizarosvaloresqueumaoumaisvariáveispodemassumirépormeiodeumatabela.
Umatabelaéconstituídadosseguinteselementos:
Quadro 1
Título Éoconjuntodeinformaçõesqueprecedeatabelaecontémaindicaçãodosfatores:oquê?Quando?Onde?
Cabeçalho Éapartesuperiordatabelaqueespecificaoconteúdodascolunas.
Corpo da tabela Éoespaçoquecontémasinformaçõessobreofenômenoobservado.
Fonte Éaindicaçãodaentidaderesponsávelpelolevantamentodosdados.
Título Produção de petróleo em barris/dia
Estado e Região TotalBarris/dia Cabeçalho
RiodeJaneiro 1.597.387
Colunaindicadora
EspíritoSanto 193.962
Amazonas 52.964
Bahia 49.472
RioGrandedoNorte 60.861
Sergipe 42.072
SãoPaulo 16.983
Alagoas 6.300
Ceará 7.530
Paraná(xisto) 3.393
Rodapé
Figura13
3 MEdIdAS dE tEndÊnCIA CEntrAl: MÉdIA, ModA E MEdIAnA PArA dAdoS SIMPlES
Nodesenvolvimentodeumestudoestatístico,muitasvezeséinviávelexaminartodososelementosda população de interesse para tirar conclusões; pensando nisso, há medidas que possibilitamcondensar as informações para esclarecer a fase analítica da estatística descritiva. A inferênciaestatísticanosdáelementosparageneralizar,demaneirasegura,asconclusõesobtidasdaamostraparaapopulação.
Quandosetratadeamostra,apreocupaçãocentraléqueelasejarepresentativa.
27
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Assim que decidimos extrair informações por meio de um levantamento amostral, temosimediatamentedoisproblemas:
• definircautelosamenteapopulaçãodeinteresse;
• selecionaracaracterísticaqueiremospesquisar.
Portanto,temossituaçõesprofissionaisemquenosbastampoucosdadosouestatísticasdedadossimples.Poroutro lado,têm-setambémsituaçõesemqueumnúmeromaiordeelementosdeveserinvestigadoetratadocomodistribuiçõesdefrequência.
Quandoestamosdiantedeumconjuntodedados,sejaelepequenoougrande,emgeralbuscamosmedidasquepossamserusadasparaindicarumvalorquetendearepresentarmelhoraqueledeterminadoconjuntodenúmeros.Easmedidasmaisusadasnessesentidosãoaschamadasmedidasdetendênciaeventualoucentral,quesãoamédia,amedianaeamoda.
Sabe-sequeessesvaloresserãomedidosdeformadistintaconformeumgrandeconjuntodedadosouumpequenoconjuntodedados. Tambémocálculodessesvalores seráafetadocasoasvariáveissejamdiscretasoucontínuas.
Em estatística, a média é o valor médio de uma distribuição ou de um conjunto de dados,determinado segundo uma regra estabelecida a priori e que se utiliza para representar todos osvaloresdadistribuição.Existemdiversas formasdecalcularamédiadeumconjuntodenúmeros,porexemplo,algumasdelassão:médiaaritmética,médiaaritméticaponderada,médiageométricaemédiaharmônica.
observação
Neste módulo, trataremos do cálculo dessas estatísticas para oschamados dados simples ou conjuntos de dados com menos de 30elementos.
3.1 A média aritmética simples (x)
Amédiaaritméticaéumdosvaloresmaisrepresentativosdeumconjuntodedados.Obtém-seovalordamédiaaritméticadividindo-seosomatóriodosvaloresdoconjuntodedadospelonúmerodevalorestotaldesseconjunto.
Namédiaaritmética,temoscomosímbolo:x(lê-se“xtraço”ou“xbarra”).
Assim,temosque,paraaamostra,secalculaovalormédioutilizando-seosseguintesparâmetros:
28
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
x
x
n
ii
n
= =∑
1,onde
x⇒Médiaaritméticadaamostra(estimativa)
n⇒Númerodedadosdaamostra
xi⇒Cadavariáveldaamostra
Vamos, agora, tomar um exemplo de média aritmética. Supondo um conjunto de dadosxi = {2,4,6,8,10,12},onden=6,temos:
x
x
n
ii
n
= = + + + + + ==∑
1 2 4 6 8 10 126
7
Exemplo 1:
Umaamostradasnotasdasprovasdematemáticadosestudantesda7ªsériedeumagrandeescoladeSãoPauloxi,emque:
xi={87,42,64,58,90,90,85,63,47,74,100,94}en=12,temos:
x
x
n
ii
n
= = + + + + + + + + + + + ==∑
1 87 42 64 58 90 90 85 63 47 74 100 9412
74 5,
Anotamédianaprovadematemáticadosestudantesda7ªsériedessaescoladeSãoPaulo,poramostragem,é74,5.
observação
Sãoaspropriedadesqueamédiaaritméticasimplespossuiqueafazemamedidadetendênciacentralmaisusadaemaisimportantedetodas.
Sãopropriedadesdamédiaaritmética:
• emumconjuntodedados,ésemprepossívelocálculodamédia,independentementedequaiselementoscompõemesseconjuntodedados;
• emumdeterminadoconjuntodedados,ovalordamédiaseráúnicoecorresponderáaumaconstante;
• todososvaloresdedeterminadoconjuntodedadosirãoafetaramédia,seumvalorsemodifica,a média aritmética também se modificará; somando-se ou subtraindo-se uma determinadaconstantecacadaelementodeumdeterminadoconjuntodedadosxi=x1,x2,x3,...,xn,amédia
29
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
aritméticaficaráaumentadaoudiminuídadessaconstantec;se,poroutrolado,multiplicarmoscada elemento desse conjunto de dados por uma constante c, a nova média será tambémmultiplicadaporessaconstantec;sedividirmoscadaelementodoconjuntodedadosporessamesmaconstantec,amédiaserádivididaporc.
Assim,setemosumconjuntoxi=x1,x2,x2,...,xn,amédiaserá:
x
x
ni
n
1
11= =
∑,logo:
x
c x
nx
x
nncn
x x ci
i
n
ii
n
21
21
2 1=+
⇒ = + ⇒ = += =∑ ∑( )
• asomaalgébricadosdesviosdosnúmerosdeumconjuntodedadosemtornodamédiaézero,issopodeserrepresentadodaseguinteforma:
x xi − =∑ 0
Porexemplo,setemosumconjuntodedadosxi=(2,4,6,8,10),onden=5,temosque:
x
xii= = + + + + ==∑
1
5
52 4 6 8 10
56
Seaplicarmosafórmulaacima,temos:
x x xi i− = − = − + − + − + − + −∑ ∑ 6 2 6 4 6 6 6 8 6 10 6( ) ( ) ( ) ( ) ( )
x x
x x
i
i
∑∑
− = − − + + +
− =
4 2 0 2 4
0
observação
A média aritmética é a mais utilizada em nosso dia a dia. É obtidadividindo-seasomadasobservaçõespelonúmerodelas.
3.2 A média aritmética ponderada xp
Numconjuntodedadosemquecadaelementooucadaobservaçãopossuiamesmaimportância,o cálculodamédia aritmética simplesmostrará bemapopulaçãoou a amostra estudada.Noentanto, se queremos atribuir pesos distintos ou importâncias distintas aos elementos de um
30
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
conjuntodedados,aestatísticaaseradotadaéamédiaaritméticaponderada,emqueacadavalorxideveráseratribuídoumdeterminadopesopi.Aexpressãoestatísticaparaocálculodamédiaponderadaé:
x
x p
pp
i ii
n
ii
n= =
=
∑
∑1
1
Supondoqueumestudantetenhadeefetuarumasériedequatroexamesparaobtersuamédiafinalepassardeano,cadaexamepossuiumpesodiferentenacomposiçãodessamédia,conformeatabelaaseguir:
x
x p
p
x
p
i ii
n
ii
n
p
=
=+ + +
=
=
∑
∑1
1
0 30 68 0 20 89 0 40 45 0 1
,
( , ) ( , ) ( , ) ,
logo
00 1000 30 0 20 0 40 0 10
20 4 17 8 18 10 66 2
( ), , , ,
, , ,
+ + += + + + =xp
Exame Nota Peso
1 68 0,30
2 89 0,20
3 45 0,40
4 100 0,10
1,00
Figura14
Anotamédiaserá,então,66,2, resultadodiferentedoqueseriaobtidoseutilizássemosamédiaaritméticasimples.
Numconjuntodedados,emquecadaelementooucadaobservaçãopossuiimportânciadiferente,utilizamosamédiaaritméticaponderada.
Exemplificandoasmédiasaritméticaeponderada:
Média aritmética–exemplo:umalunotirouasnotas5,8e6emtrêsprovas.Asuamédiaaritméticaserá(5+8+6)/3=7,25.
Média ponderada–exemplo:umalunofezumteste(peso1)eduasprovasprova(peso2), tirando 8 no teste, 5 na primeira prova e 6 na segunda prova. A sua média (ponderada)será [(1 x 8) + (2 x 5) + (2 x 6) ]/3 = 6. Se o teste e a prova tivessem o mesmo peso (enão importa qual o valor do peso, importa apenas a relação entre os pesos), a média seria,aproximadamente,6,33.
Distribuição por frequência é a tabela em que se organizam grandes quantidades de dados,determinandoonúmerodevezesquecadadadoocorre–frequência (fi) –eaporcentagemcomqueaparece–frequência relativa (fr).
31
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
observação
∑fi=nnúmerototaldeobservações;
xi=valordavariáveloupontosmédiosdeclasses;
k=númerodeclassesoudevaloresindividuaisdiferentedavariável.
Exemplo: em uma turma, a nota atribuída a 30 alunos, referente a um teste de estatística, foidispostaemordemcrescente:4,4,4,4,5,5,5,5,5,5,5,5,6,6,6,6,6,7,7,7,7,7,8,8,8,8,9,9,10.
Observandoquealgumasnotasserepetem,podemosutilizaronúmerodeobservaçõesoufrequênciadecadaumdelescomoopesooufatordeponderação.
Assim:
(4x4)+(7x5)+(5x6)+(5x7)+(4x8)+(2x9)+(1x10)x=-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------=6,294+7+5+5+4+2+1
Utilizandoumatabelapararepresentaradistribuiçãodefrequência,temos:
Tabela 5
xi fi xi fi
∑xi fi 176x=------------------------------------=---------------------------=6,29n28
4 4 4x4=16
5 7 5x7=35
6 5 6x5=30
7 5 7x5=35
8 4 8x4=32
9 2 9x2=18
10 1 10x1=10
∑ 28 176
3.3 A mediana (Md)
Outramedidaimportantedeumconjuntodedadoséamediana.Amedianadividedeterminadoconjunto de dados que deverá estar ordenado em dois grupos iguais, em que metade terá valoresmenores,emetadeterávaloresmaioresqueamediana.
Antesdecalcularamediana,éprecisoorganizarosvaloresnumrolemordemcrescente,paraentãocontaratéametadedosvaloreseencontraramediana.Emgeral,apósorganizarmososdadosemumrol,podemoscalcularaposiçãodamedianacomafórmulaaseguir:
32
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
(n+1)Md=----------------------------2
Em que n é o número de dados observados. Por exemplo, para um conjunto de dadosxi = {6,9,3,5,2,9,5,5,8,7,1,7,2},emquen=13,temosprimeiroqueorganizaressesdados em um rol e depois encontrar a posição da mediana para então saber qual será amediana.Senão,vejamos:
rolxi-{1,2,3,5,5,5,6,7,7,8,9,9}
(n+1)13+1Md=----------------------------=----------------------------=722
Md=5
Amedianaéoutramedidadeposiçãodefinidacomoonúmerodomeio,quandoasmedidassãoorganizadasemordemascendenteoudescendente.Emoutraspalavras,amedianadeumconjuntodetermosordenadoséovalorsituadodetalformanoconjuntoqueoseparaemdoissubconjuntosdemesmonúmerodeelementos.
observação
Seonúmerodeelementosforímpar,entãoamedianaseráexatamenteovalor“domeio”.Seonúmerodeelementosforpar,entãoamedianaseráexatamenteamédia“dosdoisvaloresdomeio”.
Paradeterminaramediana:
• organizeoconjuntodedadosemumrol;
• paraumconjuntodedadoscujon=ímpar,amedianaseráovalordomeio;
• paraumconjuntodedadoscujon=par,amedianaseráamédiadosdoisvaloresdomeio.
Paraumconjuntodedadosxi={6,4,8,3,2,9,7,1},emquen=8,temos,então:
rolxi={1,2,3,4,6,7,8,9}
(n+1)8+1Posiçãomediana=----------------------------=----------------------------=4,522
Amedianaseráovalorqueestáameiocaminhodosdoisvaloresmédios;nessecaso,entre4e6.Comofazer?Deve-setiraramédiaentreosdoisvaloresdomeioparaobterovalordamediana.
33
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Assim,temos:
4+6Md=----------------------------=52
observação
Quandousamosamediana?
Empregamosamedianaquando:
• desejamosobteropontoquedivideadistribuiçãoempartesiguais;
• hávaloresextremosqueafetamdemaneiraacentuadaamédia;
• avariávelemestudoésalário.
Em teoria da probabilidade e em estatística, a mediana é uma medida de tendênciacentral,umnúmeroque representaasobservaçõesdedeterminadavariável,de tal formaqueessenúmero,amediana,deumgrupodedadosordenados,separaametadeinferiordaamostra,população ou probabilidade de distribuição, da metade superior. Mais concretamente, 1/2 dapopulaçãoterávaloresinferioresouiguaisàmediana,e1/2dapopulaçãoterávaloressuperioresouiguaisàmediana.
Emcasosdepopulações(n)ímpares,amedianaseráoelementodeposiçãocentraln +
°12
.
Paraoscasosdepopulações(n)pares,amedianaseráoresultadodamédiasimplesdoselementosdeposiçãocentral
ne
n2
12
° +
° .Porexemplo,paraasseguintesséries,temos:
Exemplo 1
1,3,5,7,9,ondasérieéímpar,temos:
n +
°
+
°
12
5 12
3ºposição
Amedianaéiguala5,poiséa3ªposiçãodasérie.
34
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Exemplo 2
1,2,4,7,9,10,ondasérieépar,temos:
n n
en
e
21
2
63
12
3 4
° +
°
° +
°
° °
e
3°e4°
Amédiaseráamédiaentreo3°eo4°elementodasérie,queserá:
3°=4
4°=7
Md
Md
= +
=
4 72
5 5,Md=5,5
3.4 A moda
Muitasvezes,emumconjuntodedados,existemvaloresquese repetemcomfrequênciamaior.Amoda éjustamenteessevalorouessesvaloresquemaisserepetememumconjuntodedados.Épossívelhaverestatísticasquenãopossuammodaouquepossuammaisdeumamoda.
Noexemploquedemosanteriormente,paraumconjuntodedadosxi={1,2,3,4,6,7,8,9},nãoexistemoda,ediz-sequeoconjuntooudistribuiçãoéamodal.
Amodaéumaestatísticamuitomaisdescritivaesuaimportânciacresceàmedidaqueumvalorougrupodevaloresserepetemaisqueoutros,enessesentidoamodaindicariaovalortípicodaqueleconjuntodedadoscommaiorocorrência.Porexemplo,oconjuntodedadosxi={2,2,7,9,9,9,10,10,11,12,18}temmodaiguala9,porqueonúmero9éaquelecommaiorfrequência,repetindo-setrêsvezes.
Denominamos moda o valor ou valores de um conjunto de dados que aparecem com maiorfrequênciaemumasérie.Porexemplo:osaláriomodaldosprofessoresdeumaescolaéosaláriomaiscomum,istoé,osaláriorecebidopelomaiornúmerodeempregadosdessaescola.
Amodapodeapresentarmaisdeumvalor,diferentementedamédiaoudamediana.Éespecialmenteútilquandoosvaloresouobservaçõesnãosãonuméricos,umavezqueamédiaeamedianapodemnãoserbemdefinidas.
Amodade{pera,pera,banana,limão,limão,limão,pêssego}élimão.
35
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Asérie{1,3,4,5,5,6,6}apresentaduasmodas(bimodal):5e6.
Asérie{1,3,2,5,8,7,4,9}nãoapresentamoda.
Exemplo
Sabendo-sequeaproduçãoleiteiradiáriadeumavaca,duranteumasemana,foide10,14,13,15,16,18e12litros,pede-sequeseencontreamédia,amodaeamedianaparaaproduçãodiáriadeleitedessavaca.
Média
x
x
n
ii
n
= = + + + + + + = ==∑
1 10 14 13 15 16 18 127
987
14
Logo,x=14litrosdeleiteemmédiapordia,oquesignificaumaproduçãode98litrosdeleiteemmédiaporsemana.
observação
Amédiapodeserumnúmerodiferentedetodososvaloresdaamostraqueelarepresenta.
Moda
Comonãopossuiumvalorqueaparececommaiorfrequênciaqueosoutros,nãohávalordemodaparaesseexemplo.
Mediana
Ordenandoosdadosdeformacrescente,temos:10-12-13-14-15–16–18
Mdn
Md
Md
= +
°
= +
°
= °
12
7 12
4
Medianaseráo4°elementodasérie,queéiguala14litrosdeleitepordia.
36
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
observação
Cada frequência acumulada é a soma das frequências anteriores àclasse.
f1a=f1f2a=f1a+f2f3a=f2a+f3f4a=f3a+f4...........fna=f(n-1)a+fn
3.5 Posição relativa da média, moda e mediana
Emumadistribuiçãodefrequênciassimétricas,asmedidasdemédia,medianaemodacoincidem.Já quando a assimetria torna-se diferente, essa diferença é tanto maior quanto é a assimetria.Resumidamente,temos:
(a) (b) (c)
x=Md=Mo MoMdx xMdMo
Figura15-Distribuições:(a)simétrica,(b)assimétricae(c)assimétricanegativa.
a)x=xmd=Moàcurvasimétrica
b)Mo<xmd<xàcurvaassimétricapositiva
c)x<xmd<Moàcurvaassimétricanegativa
4 MEdIdAS dE dISPErSão PArA dAdoS SIMPlES
Observamosqueamoda,amediana,eamédiapodemserusadasparacondensar,numúniconúmero,aquiloqueé“médio”ou“típico”deumconjuntodedados.Noentanto,ainformaçãofornecidapelasmedidasdeposiçãonecessita,emgeral,sercomplementadapelasmedidasdedispersão.Essasmedidassãousadasparaindicaroquantoosdadosseapresentamdispersosemtornodaregiãocentral.Dessaforma,caracterizamograudevariaçãoexistentenoconjuntodevalores.Asmedidasdedispersãomaisutilizadassão:
• amplitudetotal;
37
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
• desviopadrão;
• variância;
• coeficientedevariação.
Noteque,quantomaioresforemasmedidasdedispersão,maisheterogêneossãoosdadose,aocontrário,quantomenoresforemessasmedidas,maishomogêneoéoconjunto.
Vejamosaseguiralgunsexemplosquemostramanecessidadedeconhecermosasmedidasdedispersão.
Exemplo 1
Sabe-se que em Honolulu (Havaí) e em Houston (Texas) a temperatura média diária é quase amesma,emtornode23,9ºC.Pergunta-se:seráque,porisso,podemosinferirqueatemperaturasejabasicamenteamesmaemambasas localidades?Ounão serápossívelque, enquantoumacidadeémelhorparanatação,aoutraosejaparaatividadesexternas?
AtemperaturaemHonoluluvariamuitopoucoaolongodoano,oscilando,emgeral,entre21,1ºCe26,7ºC.Poroutrolado,atemperaturaemHoustonpodediferirsazonalmente(nasestaçõesdoano),istoé,apresentar-sebaixaemjaneiro(cercade4,4ºC)ealtaemjulhoeagosto(bempertode37,8ºC).Logo,podemosperceberumaoscilaçãosignificativa.DesnecessáriodizerqueaspraiasemHoustonnãoestãocheiasdegenteoanotodo.
Exemplo 2
Suponhaque,numaparticularcidade,tantoladrõesquantoprofessoressecundáriostenhamumarendamédiamensaldeR$900,00.Seráqueessainformaçãoindicaqueasduasdistribuiçõesderendasão, necessariamente, semelhantes? Muito ao contrário, poder-se-ia descobrir que elas diferem, emuito,numoutroaspectoimportante,queéofatodeasrendasdosprofessoresconcentrarem-seaoredordeR$900,00(seremconstantes,homogêneas),enquantoasdosladrõesespalham-semais(sãodescontínuas,heterogêneas),oquereflete,portanto,maioresoportunidadesparaprisões,desemprego,pobrezae,emalgunscasos,fortunasexcepcionais.
Os fatosmostramqueprecisamos,alémdeumamedidade tendênciacentral,deum índicequesinalizeograudedispersãodosdadosemtornodamédia.Esseíndiceéumamedidaindicativadoquecostumamoschamardevariabilidadeoudispersão.
Retornando ao exemplo 1, poderíamos concluir que a distribuição de temperatura em Houston(Texas)temmaiorvariabilidadedoqueadistribuiçãodetemperaturasemHonolulu(Havaí).Damesmaforma,podemosdizerqueadistribuiçãoderendasentreprofessoresapresentamenosvariabilidadedoqueadistribuiçãoderendasentreladrões.
Assim,quandosedesejaentender,analisaredescreverdeformaadequadaumdeterminadoconjuntodedados,faz-senecessáriodispornãoapenasdeinformaçõesrelativasàsmedidasdeposição.Épreciso
38
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
quesedisponhadeinformaçõesrelativasàvariabilidade(dispersão)daquelesnúmerosquecompõemoreferidoconjuntodedados.Essasmedidasdevariabilidadeoudispersãoindicamseosdadosobservadosestãopróximosouseparadosunsdosoutros.
Diferentedasmedidasdeposição,asmedidasdedispersãonãosãoautoexplicativas,suaaplicabilidadedependedacomparaçãodepopulaçõesoudeamostrasdomesmotamanhoedamesmacaracterísticaparaqueseobtenhaalgumainformaçãoimportanteapartirdaqueladeterminadavariabilidade.
Asprincipaismedidasdedispersãosão:aamplitudetotal(ouintervalo),odesviomédio,avariânciaeodesviopadrão.Amédiaservedereferênciaparatodasessasmedidas,excetoparaointervalo(ouamplitudetotal).Àproporçãoqueessasmedidasseelevam,issorepresentaumaumentodadispersão,oquesignificaque,seamedidaforigualazero,nãoexistedispersão.
Asmedidasdevariabilidade,quetêmamédiaaritméticacomopontodereferência,sãoimportantesporquenospermitemavaliarograudedispersãodasobservaçõesemrelaçãoaessamesmamédia,istoé,permitem-nosavaliaroquãodistanteosdadosdeumdeterminadogrupodeobservaçõesestãoda média calculada, dando-nos uma noção mais precisa da situação de determinada população ouamostra,alémdecondiçõesdetirarconclusõeseinformaçõesimportantesdaquelesdadosdisponíveis.
Exemplo 3
UmestudantedeeconomiaresolvefazerumapesquisasobreossaláriosmédiosdosfuncionáriosdedeterminadosetorindustrialemSãoPaulo.Nessapesquisa,esseestudanteconseguiuosseguintesdadosemtermosdesaláriosmínimosmensais:
xi={1.0;1.5;2.0;2.0;2.0;2.5;3.0;3.0;80.0;85.0}
Aocalcularosaláriomédiodessesetor,elechegouaovalormédiode18,2saláriosmínimospormês.Ora,masessedado,semocálculodesuadispersãoemrelaçãoàmédiaaritmética,pouconosdizsobrearealidadedessapopulação,eacabamosporterumavisãodistorcidadopadrãodevidadamaiorpartedosfuncionáriosdessesetoranalisadopeloestudante.Asmedidasdevariabilidadeoudispersãonospermitemperceberessadistorção.
Temos,comoprincipaismedidasdedispersão,intervalo,desviomédio,variânciaedesviopadrão.
As medidas mais comuns de variabilidade para dados quantitativos são a variância; a sua raizquadradaeodesviopadrão.Aamplitudetotal,adistânciainterquartílicaeodesvioabsolutosãomaisalgunsexemplosdemedidasdedispersão.
4.1 Amplitude total
Ointervalo ouamplitude total dedeterminadoconjuntodedadoséobtidopeladiferençaentreomaioreomenorvalornesseconjuntodenúmeros.Indica,portanto,adistânciaentreamaioreamenorobservaçãodeumconjuntodedados.Assim,temos:
39
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Amplitudetotal=Valormáximo-Valormínimo
Porexemplo,numconjuntodedadosxi={2,3,3,5,5,5,8,10,12},emquen=9,aamplitudetotalserá:
Atotal=Vmáximo-Vmínimo=12-2=10
Emalguns casos, o intervaloouamplitude total pode ser expresso simplesmentepela indicaçãodomenoredomaiornúmerodoconjuntodedados.Nocasodoexemploanterior,aamplitudetotalpoderia ser expressa simplesmentepela identificaçãodomenor edomaiornúmero, indicada comosendode(2a12)ou(2–12).
Agrandevantagemdaamplitudetotaléqueelaapresentacertafacilidadedesercalculada,mesmoquandooconjuntodedadosobservadosérelativamentegrande.Noentanto,comoaamplitudetotalapenaslevaemcontaosdoisextremosdoconjuntodenúmeros,emalgunscasoselapodeserumamedidaenganosaquantoàindicaçãodadispersãodeumconjuntodenúmeros,tendo,portanto,umautilidadelimitada.
Ointervalodedeterminadoconjuntodedadoséobtidopeladiferençaentreomaioreomenorvalornesseconjuntodenúmeros.
4.2 desvio médio absoluto
Odesviomédioabsolutoinauguraoestudodasmedidasdevariabilidadequetêmamédiacomopontodereferência.
Ochamadodesvionadamaiséqueadiferençaentre cadavalordedeterminadoconjuntodedadoseamédiadessemesmoconjuntodenúmeros (xi-x).Ovalorabsolutodeumnúmeroseráelepróprio, semosinalque lheéassociado,eé indicadopormeiodeduas linhasverticaisqueoenquadram.
Assim,|-67|=67;|9|=9.
Éprecisocalcularprimeiroamédiaaritméticadosdadosdisponíveis,queemgeralseapresentamcomodadosamostrais.
O desvio médio absoluto será calculado pela média dos desvios dos valores a contar da média,ignorandoosinal(+ou-)dodesvio,ouseja,convertendoosvaloresdosdesviosemvaloresabsolutos,considerando-ostodosdesviospositivos.Assim,temos:
Dmédio= x x
n
ii
n
−=∑
1
40
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Emquenéonúmerodeobservações.
Vamos,agora,tomarumexemplodedesviomédio.Numconjuntodedadosamostraisxi={2,4,6,8,10,12},emquen=6,determineodesviomédio.Temos,então:
Dmédio=x x
ni −∑
Precisamos,primeiro,calcularamédia,paraentãopassarmosaocálculododesviomédio.Relembrandoafórmuladocálculodamédiaaritmética,temos:
xx
nx xi= ⇒ = + + + + + = ⇒ =∑ 2 4 6 8 10 12
67 7
Agora,podemoscalcularosdesviosparacadavalordoconjuntodedados.Assim,temos:
xi - xDmédio= x x
n
i −=
− + − + − + + +∑ 5 3 1 1 3 5
6
Dmédio= 5 3 1 1 3 56
3+ + + + +
=
Dmédio=3
2–7 -5
4–7 -3
6–7 -1
8–7 1
10–7 3
12–7 5
Σ 0
Figura16
Ovalorencontradoanteriormenterepresentaadiferençamédiadecadaobservaçãoeamédiadadistribuição,mastambémnessecasosóseriapossívelobtermaisinformaçõesapartirdodesviomédiocomparando com outras populações ou amostras de mesmas características. Por exemplo, se outroconjuntodedados,comasmesmascaracterísticasetamanho,apresentasseumdesviomédioabsolutoiguala2,4,ouseja,menorqueodesviomédioabsolutocalculadonoexemploanterior,poder-se-iadizerqueessesegundoconjuntodevaloresémaishomogêneodoqueonossoexemplo,jáqueadiferençadecadaumdosseuselementosemrelaçãoàmédiaaritméticaémenor.Teríamos,assim,umadispersãomenor.
Odesvioéqueadiferençaentrecadavalordedeterminadoconjuntodedadoséamédiadessemesmoconjuntodenúmeros.
4.3 Variância
Comonocálculododesviomédio,paraocálculodavariância,precisaremosutilizarodesviodecadaelementodeumconjuntodedadosemrelaçãoàmédiaaritmética(xi-x).Noentanto,aoinvésde
41
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
trabalharmoscomosvaloresabsolutos(emmódulo),agoraosdesviossãoelevadosaoquadradoantesdasoma.Paraocasodedadosamostrais,aoinvésdedividirmosporn,dividimosporn–1(queéototaldaamostramenosumaunidade).
Avariânciairánosdizerograudedispersãodedeterminadogrupodedadoscomrelaçãoàmédiaaritméticadessesnúmeros.Assim,avariânciapopulacionalpoderásercalculadadaseguinteforma:
σµ2
2
=−∑ ( )x
ni ,onde
σ2:Variânciapopulacional;xi:Cadaobservaçãodoconjuntodedadospopulacional;µ:Médiadapopulação;n:Númerodeobservações.
Avariânciaamostralpoderásercalculadapelaseguintefórmula:
sx x
ni2
2
1=
−−
∑ ( ) ,onde
s2:Variânciadaamostra;xi:Cadaobservaçãodoconjuntoamostral;x:Médiadaamostra;n:Númerodeobservaçõesdaamostra.
Porexemplo,sejadeterminadoconjuntodedadosxi={1,3,5,7,9,11,13},emquen=7.Calculeavariânciadesseconjuntodedados,supondo:
• queesseconjuntodedadosrepresentatodaumapopulação;
• queesseconjuntodedadosrepresentaumaamostra.
A)Paracalcularavariânciadesseconjuntodedados,considerandoqueele representatodaumapopulação,devemosutilizaraseguintefórmula:
σµ2
2
=−∑ ( )x
ni
Devemospassaraocálculodamédiadesseconjuntodedadospara,então,procederaocálculodavariância.Sendoassim,temos:
µ µ
µ
= ⇒ =
= + + + + + + =
=
∑ x
ni
1 3 5 7 9 11 137
7
7
(médiapopulacional)
42
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Partindodamédia,podemosagoracalcularosdesviosepartirparaocálculodavariânciapopulacional,jáquesupomosqueoconjuntodedadosrepresentavatodaapopulação.Assim,temos:
µ xi - µ (xi - µ)2
σµ
σ
σ
22
22 2 2 2 2 2
2
6 4 2 2 4 67
36 16 4 4 16
=−
=+ + + − + − + −
=+ + + + +
∑( )
( ) ( ) ( )
x
Ni
3367
16
162
=
=σ
7 7–1=6 62
7 7–3=4 42
7 7–5=2 22
7 7–7=0 0
7 7–9=-2 (-2)2
7 7–11=-4 (-4)2
7 7–13=-6 (-6)2
Σ 0 112
Figura17
Dessemodo,avariânciapopulacionaldesseconjuntodedadosseriaiguala16.
B)Se,poroutrolado,temosomesmoconjuntodedadosesupondoqueelerepresentaapenasdadosamostrais,devemoscalcularavariânciaamostraldeoutraforma,partindodocálculodamédiapara,então,calcularmosavariância.
Comovimosnoitem2,aexpressãoparaocálculodamédiaaritméticaemumaamostraéamesmadocálculodamédiaparaumapopulação,masutilizaremosparaasamostrasoutranotação.Vejamos:
xx
nxi= ⇒ =∑ 7 (médiaamostral).
Normalmente,amédiaamostralaproxima-sedamédiapopulacionalquantomaiorotamanhodaamostra,masnãoseigualaaela.
Passemos,então,aocálculodavariânciaamostral.Utilizaremososmesmospassosdocálculodavariânciapopulacional.Dessaforma:
sx x
ni2
2
1=
−−
∑ ( )
x xi - x (xi - x)2
Sx x
n
S
S
i22
22 2 2 2 2 2
2
1
6 4 2 2 4 67 1
36 16 4 4
=−
−
=+ + + − + − + −
−
=+ + +
∑( )
( ) ( ) ( )
++ +−
=
=
16 367 1
1126
18 6662S , ...
7 7–1=6 62
7 7–3=4 42
7 7–5=2 22
7 7–7=0 0
7 7–9=-2 (-2)2
7 7–11=-4 (-4)2
7 7–13=-6 (-6)2
Σ 0 112
Figura18
43
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Avariânciaamostraldesseconjuntodedadoséiguala18,666.
Comoamédiaaritmética,avariânciapossuialgumaspropriedadesimportantesquedevemoscolocaremdestaqueequefacilitamocálculodealgunsproblemasmaiscomplexos.
A)Somando-seousubtraindo-seumaconstanteacadaelementodeumconjuntodedados,ovalordavariâncianãosealtera.
Porexemplo,umconjuntodedadosxi={2,4,6,8},emquen=4,eamédiaéiguala5.Avariânciadesseconjuntoserádadacomosegue:
σµ
σ
σ
22
22 2 2 2
22 2
2 5 4 5 6 5 8 54
3 1
=−
⇒ = − + − + − + −
=−( ) + −( )
∑ ( ) ( ) ( ) ( ) ( )x
ni
++ += + + + = =
1 3
49 1 1 9
4204
52 2
Sesomarmosumaconstantec=4acadaumdoselementosdoconjuntodedados,temosumnovoconjuntodedadosyi={6,8,10,12},emqueamédiaseráiguala9.Avariânciaserá,então:
σµ
σ
22 2
2 2 2 2 2
22
2
6 9 8 9 10 9 12 9
4
3 1
=−
=−( ) + −( ) + −( ) + −( )
=−( ) + −(
∑ ( )y
ni
)) + ( ) + ( ) = + + + = =2 2 21 3
49 1 1 9
4204
5
Sendoassim,demonstramosqueσ σ222 = =,ouseja,aosomarmosumaconstanteacadaelemento
deumconjuntodedados,avariânciapermaneceamesma.
B)Aomultiplicarmosumaconstantecacadaelementodeumconjuntodedados,temosumanovavariânciaaomultiplicarmosavariânciadoconjuntodedadosoriginalporc2.
Assim,anovavariânciaserárepresentadadaseguinteforma:
σ σ22 2
12= c .
C)Aodividirmoscadaelementodeumconjuntodedadosporumaconstantearbitráriac,obtemosanovavariânciadividindo-seaantigavariânciaporc2.
Assim,podemosapresentaranovavariânciadaseguinteforma:
σ σ22 1
2
2=c
D)Avariânciadeumaconstanteéigualazero.
44
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Existeumafórmulaalternativaereduzidaparaocálculodavariânciapopulacional,deduzidadafórmulaoriginal,queé:
σ µ22
2= −∑ x
ni
Paraavariânciaamostral,tambémexisteumafórmulaalternativabastanteutilizadaquenãoexigeocálculodamédiaequedecorredafórmulaanterior:
sx x n
nxi i22 2
1=
−−
∑ ∑( )
lembrete
Relembrandoaspropriedadesdevariância:
• aosomarmosumaconstanteacadaelementodeumconjuntodedados,avariânciapermaneceamesma;
• aomultiplicarmosumaconstantecacadaelementodeumconjuntodedados,temosumanovavariânciaaomultiplicarmosavariânciadoconjuntodedadosoriginalporc2;
• aodividirmoscadaelementodeumconjuntodedadosporumaconstantearbitráriac,obtém-seanovavariânciadividindo-seaantigavariânciaporc2;
• variânciadeumaconstanteéigualazero.
Saiba mais
Paraaprofundamentodotemadestaunidade,seguemalgunslinksquepodemauxiliá-lo:
“Métodos quantitativos e estatísticos para a tomada de decisão”.Disponível em: <http://www.santahelena.ueg.br/posgraduacao/mba/2007/download/metodosquantitativos/METODOS_QUANTITATIVOS_PARTE_I.pdf>.Acessoem:25jul.2012.
“Estatísticaexploratória”.Disponívelem:<http://www.cin.ufpe.br/~psb/EAD/Estatistica%20Exploratoria%20-%20Volume%201%20v11.pdf>.Acessoem:25jul.2012.
45
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
4.4 desvio padrão
Obtém-se o desvio padrão extraindo-se a raiz quadrada da variância. Assim como a variância eodesviomédio,odesviopadrãotambémrepresentaumamedidadevariabilidadeabsoluta,e indicaodesviodecadaumdosnúmerosxideumdadoconjuntodeobservaçõesemrelaçãoàmédiaμ.Étambémchamadoporalgunsautoresdedesviodaraizmédiaquadrática.
Matematicamente,odesviopadrãopoderáserrepresentadodaseguinteforma:
DesviopadrãopopulacionalDesviopadrãoamostral
σµ
=−∑ ( )x
ni
2
sx x
ni=−
−∑ ( )2
1
Porexemplo,umconjuntodedadosamostraisxi={2,4,6},emquen=3eamédiaéiguala4.Vamos,então,calcularodesviopadrãoparaaamostra:
sx x
n
s
i=−
−= − + − + −
−=
= − + + = = =
∑ ( ) ( ) ( ) ( )
( )
2 2 2 2
2 2
12 4 4 4 6 4
3 1
2 0 22
82
4 2
Esseconjuntodedadosiráapresentarumdesviopadrãoiguala2.
Aspropriedadesdavariânciatambémsãoaplicáveisaodesviopadrão.Noentanto,existemduaspropriedades que serão distintas no caso do desvio padrão por causa de sua característica de raizquadradamédiapositivadavariância.
Assim,aomultiplicarmoscadaelementodeumconjuntodedadosporumaconstantec,onovodesviopadrãoseráigualaoantigomultiplicadopelaconstante.Temos,então:
σ2=c.σ1
Poroutrolado,sedividirmoscadaelementodeumconjuntodedadosporumaconstantec,onovodesviopadrãoseráigualaoanteriordivididopelaconstantec.Assim,temos:
σ σ2
1=c
Asdemaispropriedadesdavariânciaserãoasmesmasparaodesviopadrão.
46
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
4.5 Coeficiente de variação
Emestatísticadescritiva,ocoeficientedevariaçãoservepara indicar seodesviopadrãoégrandeoupequenoemrelaçãoàmédiaaritméticadasériequeestásendoestudada;portanto,éumacomparaçãoentreodesviopadrãoeamédiaaritméticadeumapesquisaquevaideterminarem porcentagem o quanto houve de desvio em relação à média. O coeficiente de variação écalculadopor:
Cvsx
= ,onde:
S=desviopadrão;
x=médiaaritmética,quepodeserdeumasériepopulacionalouamostral.
Porexemplo,noitem3.4,foideterminadoodesviopadrãodeumasérieamostral,portanto,vamoscalcularocoeficientedevariaçãodessasérie,queserá:
CvSx
Cv
Cv
Cv
=
=
==
240 5
50
,
%
Nesse exemplo, o coeficiente de variação é grande, indica que a variabilidade foi a metade emrelaçãoàmédiadessasérie.
Aspropriedadesdavariânciaseaplicamaodesviopadrão,exceto:
• quandomultiplicarmoscadaelementodeumconjuntodedadosporumaconstantec,onovodesviopadrãoseráigualaoantigomultiplicadopelaconstante;
• quandodividirmoscadaelementodeumconjuntodedadosporumaconstantec,onovodesviopadrãoseráigualaoanteriordivididopelaconstantec.
Em probabilidade e estatística, o desvio padrão é a medida mais usada da dispersão estatística.Nãoésenãocomoaraizquadradadavariância,ou,ainda,éaraizquadradadamédiaaritméticadosquadradosdosdesvios,tomadosapartirdamédiaaritmética.Édefinidodessaformademodoadar-nosumamedidadadispersãoqueseja:
• umnúmeroquenãosejanegativo;
• useasmesmasunidadesdemedidaqueosnossosdados.
47
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Faz-seumadistinçãoentreodesviopadrão(sigma)dototaldeumapopulaçãooudeumavariávelaleatóriaeodesviopadrãosdeumsubconjuntoemamostra.
OtermodesviopadrãofoiintroduzidonaestatísticaporKarlPearson,emseulivroSobreadissecçãodecurvasdefrequênciaassimétricas,de1894.
Exemplo
Utilizando-seoexemploapresentadoanteriormente,temosqueaproduçãoleiteiradiáriadeumavaca,duranteumasemana,foide10,14,13,15,16,18e12litros,pede-secalcularaamplitude,odesviopadrão(S),avariância(S2)e5ocoeficientedevariação(CV).
Solução
Amplitude
R=18–10=8litrosdeleite,ouseja,amaiorvariaçãodonúmerodelitrosdeleiteproduzidopordiapelavacaéde8litros.
observação
Sabemosqueamédiaparaessesdadosé:x=14litrosdeleitepordia.
Desvio padrão
s
x x
n
x x x x xn x
ni
n
=−( )
−=
−( ) + −( ) + + −( )−
==∑ 1
2
1 12
22 2
1 1
...
10 14 14 14 13 14 15 14 16 14 18 14 12 12 2 2 2 2 2−( ) + −( ) + −( ) + −( ) + −( ) + −( ) + − 44
7 1
2( )−
=
−( ) + ( ) + −( ) + ( ) + ( ) + ( ) + −( ) += + + + + + + =
4 0 1 1 2 4 2
616 0 1 1 4 16 4
64
2 2 2 2 2 2 222
6=
7 ≅ 2,65litrosdeleiteporsemana
Variância
S2=(S)2=(2,65)2≅7(litrosdeleite)2
Coeficientedevariação
48
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
cvSx
= = =2 6514
0 1893,
, ouseja,existeumavariabilidadede18,93%dosdadosemrelaçãoàmédia.
Saiba mais
Dicadeleitura:
“Análise do risco na avaliação de projetos de investimentos: umaaplicação do método de Monte Carlos”. Disponível em: <http://www.regeusp.com.br/arquivos/c6-Art7.pdf>.Acessoem:18jul.2012.
resumo
Nesta unidade, vimos que a estatística utiliza métodos matemáticosparasolucionarproblemasreaisdetomadadedecisãoquandoháincerteza.
Em situações nas quais poderíamos contar unicamente com a sorte,temosuminstrumentoquenospossibilitaaumentaraschancesdetomaramelhordecisão.
Utiliza ferramentas matemáticas definidas e, mesmo lidando comgrandenúmerodedados,essasferramentasresumemaanáliseemtabelasou gráficos. Na prática, a estatística pode ser empregada como baseconceitualefundamentalemváriasoutrasciências,inclusiveemanálisesgerenciais.
Foram apresentados também os cálculos de medidas de tendênciacentral (média,mediana,moda), asquais sãoutilizadaspara representara série pesquisada. Vimos que, por meio delas, podemos observar ocomportamentodavariávelqueasoriginou, istoé,nosdáumaideiadatendênciadetodoumconjuntodedados.E,ainda,foramapresentadasdeformaresumidaasideiasdesimetriaeassimetriaemfunçãodasmedidasdetendênciacentral.
Foram abordadas questões a respeito da distribuição de frequênciae suas representações gráficas, estudo das medidas de dispersão evariabilidade;e,porfim,foiapresentadoumestudodeintroduçãoaocálculoda probabilidade que nos ajuda a entender o significado de fenômenosaleatóriosparaoentendimentodoqueéprovávelepresumíveleaindaosváriostiposdefenômenosemdistribuiçãodeprobabilidade.
49
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Exercícios
Questão 1 (ENEM/2011–adaptada).Umaequipedeespecialistasdocentrometeorológicodeumacidademediu a temperaturado ambiente, semprenomesmohorário, durante15dias intercalados,apartirdoprimeirodiadeummês. Esse tipodeprocedimentoé frequente,umavezqueosdadoscoletadosservemdereferênciaparaestudoseverificaçãodetendênciasclimáticasaolongodosmeseseanos.Asmediçõesocorridasnesseperíodoestãoindicadasaseguir:
Dia do mês Temperatura (em ºC)
1 15,5
3 14
5 13,5
7 18
9 19,5
11 20
13 13,5
15 13,5
17 18
19 20
21 18,5
23 13,5
25 21,5
27 20
29 16
Emrelaçãoàtemperatura,osvaloresdamédia,medianaemodasão,respectivamente,iguaisa:
A)17oC,17oCe13,5oC.
B)17oC,18oCe13,5oC.
C)17oC,13,5oCe18oC.
D)17oC,18oCe21,5oC.
E)17oC,13,5oCe21,5oC
Respostacorreta:AlternativaB.
50
Unidade i
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Análise das alternativas
Comosdadosfornecidos,tem-seaseguintetabeladefrequências:
xi 13,5 14 15,5 16 18 18,5 19,5 20 21,5
fi 4 1 1 1 2 1 1 3 1
1)Paracalcularamédiatem-se:
X−
= + + + + + + + +13 5 4 14 1 15 5 1 16 1 18 2 18 5 2 19 5 1 20 3 215 14
, . . , . . . , . , . . , .++ + + + + + +
= =1 1 1 2 1 3 1
25515
17
Amédiaé17oC.
2)Amediana(valordooitavotermo)é18oC.
3)Amodaé13,5oC.
Sendoassim,
A)Alternativaincorreta.
Justificativa:deacordocomoscálculos.
B)Alternativacorreta.
Justificativa:deacordocomoscálculos.
C)Alternativaincorreta.
Justificativa:deacordocomoscálculos.
D)Alternativaincorreta.
Justificativa:deacordocomoscálculos.
E)Alternativaincorreta.
Justificativa:deacordocomoscálculos.
Questão 2(ENEM/2011).AparticipaçãodosestudantesnaOlimpíadaBrasileiradeMatemáticadasEscolasPúblicas(OBMEP)aumentaacadaano.Oquadroindicaopercentualdemedalhistasdeouro,porregião,nasediçõesdaOBMEPde2005a2009.
51
Revi
são:
And
réia
Gom
es -
Dia
gram
ação
: Léo
- 0
1/08
/201
2
Estatística aplicada
Região 2005 2006 2007 2008 2009
Norte 2% 2% 1% 2% 1%
Nordeste 18% 19% 21% 15% 19%
Centro-Oeste 5% 6% 7% 8% 9%
Sudeste 55% 61% 58% 66% 60%
Sul 21% 12% 13% 9% 11%
Disponívelem:http://www.obmep.org.br.Acessoem:abr.2010(adaptado).
Emrelaçãoàsediçõesde2005a2009daOBMEP,qualopercentualmédiodemedalhistasdeourodaregiãoNordeste?
A)14,6%.
B)18,2%.
C)18,4%.
D)19,0%.
E)21,0%.
Resolução desta questão na plataforma.