da escola pÚblica paranaense 2009 - … · este caderno pedagógico faz parte do projeto de...

72
O PROFESSOR PDE E OS DESAFIOS DA ESCOLA PÚBLICA PARANAENSE 2009 Produção Didático-Pedagógica Versão Online ISBN 978-85-8015-053-7 Cadernos PDE VOLUME I I

Upload: vanphuc

Post on 10-Nov-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

O PROFESSOR PDE E OS DESAFIOSDA ESCOLA PÚBLICA PARANAENSE

2009

Produção Didático-Pedagógica

Versão Online ISBN 978-85-8015-053-7Cadernos PDE

VOLU

ME I

I

GOVERNO DO PARANÁ

SECRETARIA DE ESTADO DA EDUCAÇÃO DO PARANÁ

PROGRAMA DE DESENVOLVIMENTO EDUCACIONAL – PDE

FORMAÇÃO CONTINUADA EM REDE

CADERNO PEDAGÓGICO

ESTATÍSTICA APLICADA COM O USO

DA INFORMÁTICA

SIRLEI DA APARECIDA KURCREVSKI

PITANGA

2010

calipolensebasket.wordpress.com

2

GOVERNO DO PARANÁ

SECRETARIA DE ESTADO DA EDUCAÇÃO DO PARANÁ

PROGRAMA DE DESENVOLVIMENTO EDUCACIONAL – PDE

FORMAÇÃO CONTINUADA EM REDE

ESTATÍSTICA APLICADA COM USO DA INFORMÁTICA

Professora PDE:

Sirlei da Aparecida Kurcrevski

Disciplina:

Estatistica

Professor Orientador:

Professor Mestre: SAULO H. WEBER

UNIVERSIDADE ESTADUAL DO CENTRO-OESTE-UNICENTRO

PITANGA

2010

3

SUMÁRIO

Apresentação ...................................................................................................................... 04

Unidade I – Conceitos estatísticos .................................................................................... 06

Módulo I – Revisão histórica e conceitos.............................................................. 07

Módulo II – População e amostras em pesquisas ................................................ 20

Módulo III – Apuração dos resultados em uma pesquisa estatística ................ 30

Módulo IV – Gráficos estatísticos ......................................................................... 37

Módulo V – A utilização de planilhas eletrônicas para análise estatística ....... 51

Unidade II – Investigação Estatística ............................................................................... 53

Módulo I – Conteúdos e objetivos a serem trabalhados ..................................... 54

Módulo II – Recursos, habilidades e interpretação dos resultados com a

utilização de planilhas ...........................................................................................

59

CONSIDERACOES FINAIS............................................................................................ 61

REFERËNCIAS................................................................................................................ 62

Anexo .................................................................................................................................. 63

4

Na busca da melhoria da qualidade do ensino, enquanto profissionais da área da

educação, procuramos encontrar formas que maximizem o processo de aprendizagem em um

contexto focado na realidade do aluno. Esta tem sido a principal busca dos educadores,

sobretudo na área de ciências exatas.

Consciente de que a solução para a melhoria do ensino/aprendizagem nas ciências

constitui-se em um processo educacional contínuo coletivo e que demanda a socialização

dos métodos implementados, apresentamos esse trabalho.

Este Caderno Pedagógico faz parte do Projeto de Intervenção Pedagógica na Escola,

pensado a partir da realidade da escola pública, principalmente o EJA, apresentando-se como

atividade relacionada ao Programa de Desenvolvimento Educacional-PDE, proposto pela

Secretaria de Estado da Educação do Paraná.

O enfoque desta produção consubstancia-se no fato de que a evolução tecnológica

tem disponibilizado novas formas de comunicações. Dentre elas estão às comunicações

estatísticas, utilizando-se de tabelas e gráficos, que permitem disponibilizar uma grande

quantidade de informações. Assim essa ferramenta matemática, encontra-se cada vez mais

presente em jornais; revistas e panfletos dentre outros. Portanto, para se ter uma

compreensão mais ampla e critica da realidade é necessário saber ler e interpretar tabelas e

gráficos. Contudo observa-se que os alunos, em sua grande maioria, apresentam dificuldades

na leitura e interpretação gráfica, tornando-se necessário implementar ações educativas que

possam minimizar essas dificuldades.

Para contribuir com a melhoria do processo de ensino, este material teórico foi

concebido tendo como referencia não apenas as teorias estatísticas disponíveis como também

a elaboração de um trabalho de pesquisa com os alunos. Para a conclusão deste trabalho de

pesquisa, os resultados serão analisados através da utilização de planilhas eletrônicas,

utilizando-se os equipamentos computacionais disponibilizados pelo Estado. Esta relação

teoria/prática com resultados obtidos com o auxilio da computação encontra-se em harmonia

com as Diretrizes Curriculares da Educação de Jovens e Adultos (2006, p.27) que prega “...

enfrentar problemas novos construindo soluções originais com agilidade e rapidez, a partir do

APRESENTAÇÃO

5

uso metodologicamente adequado de conhecimentos científicos; tecnológicos e socio-

historicos...”

O Caderno Pedagógico foi dividido em duas unidades, a primeira tratando da

fundamentação teórica sobre os conceitos estatísticos básicos e a segunda sobre investigação

estatística, composta de uma pesquisa de campo.

Objetivamos, por meio do Caderno Pedagógico, contribuir com o processo de

ensino, acreditando que este material possa ser “útil para aflorar maiores reflexões sobre o

ensino da estatística.” Juntos buscaremos construir uma educação mais democrática,

participativa e voltada para a inclusão das tecnologias no processo de ensino.

6

UNIDADE I

CONCEITOS

ESTATÍSTICOS

7

MÓDULO I

REVISÃO HISTÓRICA

E CONCEITOS

8

REVISÃO HISTÓRICA

Origem:

Embora a palavra estatística ainda não existisse, há indícios de que 3000 anos a.C. se

faziam censos na Babilônia, China e Egito. A própria Bíblia leva a essa recuperação histórica:

o livro quarto (Números) do Velho Testamento começa com uma instrução a Moisés. Fazer

um levantamento dos homens de Israel que estivessem aptos a guerrear.

A palavra estatística vem de “STATUS” (Estado, em latim). Sob essa palavra

acumularam-se descrições e dados relativos ao Estado. A Estatística, nas mãos dos estadistas

constituiu-se verdadeira ferramenta administrativa.

Evolução:

A evolução da estatística fez com que H.G. Wells, há um século, dissesse:

“Raciocinar estatisticamente será um dia tão necessário quanto à habilidade de ler e

escrever”.

Atual:

Historicamente, o desenvolvimento e o crescimento da estatística moderna podem ser

relacionados, como vimos, a três fenômenos isolados: a necessidade do governo de coletar

dados sobre os cidadãos; o desenvolvimento da teoria da probabilidade e o advento da

informática.

A observação histórica revela que durante as civilizações egípcia, grega e romana, os

dados eram obtidos principalmente com o objetivo de recolher imposto e para o

recenseamento militar. Na idade média, as instituições religiosas freqüentemente mantinham

registros relativos a nascimentos, mortes e casamentos. Nos EUA, mantinham-se vários

registros durante o período colonial e a partir de 1790 a Constituição deste país passou a

exigir um censo a cada 10 anos. De fato a crescente necessidade dos censos ajudou a

incentivar o desenvolvimento de equipamentos de tabulação no início do século XX.

As tabelas se tornaram mais completas, levando a necessidade da elaboração dos

primeiros gráficos para representação de dados coletados e tabelados estatisticamente.

Com a utilização do estudo das probabilidades para a analise e interpretação de

fenômenos coletivos a Estatística deixou de ser uma simples captação de dados numéricos.

9

A base dos estudos da Estatística é intimamente ligada aos fenômenos coletivamente

típicos de populações que apresentam uma característica comum.

AMOSTRAGEM, ESTATÍSTICA DESCRITIVA,

PROBABILIDADES E INFERÊNCIA ESTATÍSTICA

INTRODUÇÃO

A Estatística pode ser considerada como um método quantitativo que se preocupa e

coletar, organizar, analisar e interpretar um conjunto de observações, visando à tomada de

decisões.

O principal objetivo da Estatística é possibilitar o estudo de conclusões para o todo

“População”, a partir de informações e /ou observações de parte do todo “Amostra”.

DEFINIÇÃO: É a Ciência dos dados, constituída de um conjunto de métodos e processos

quantitativos que servem para estudar e medir fenômenos coletivos.

Assim, a Estatística permite resumir, descrever, diagnosticar ou estimar fenômenos

coletivos baseados em estudos ou medições a respeito do fenômeno ou da determinação de

alguns de seus indicadores.

Pode-se dizer que toda ciência que manipula dados experimentais necessita da

Estatística como método de análise de dados, para que o pesquisador possa tirar conclusões

que tenham validade científica.

Na área de Engenharia, a aplicação da Estatística é muito vasta, estando presente

principalmente no estudo do controle estatístico da qualidade industrial, onde a técnica de

controle tem evoluído e proporcionado resultados importantes.

Para ilustrar, suponha um processo produtivo onde ao se fabricar certa peça, uma de

suas dimensões é planejada em 5 cm com desvio padrão de 0,02 cm, Um conjunto de 36 peças

fabricadas forneceu uma média de 4,95 cm; podemos dizer que elas estão dentro da

especificação desejada? O comprimento médio verdadeiro é menor que 5 cm? O número de

peças observadas é suficiente para se obter conclusões acerca de toda produção? Pode-se

constatar uma série de indagações que poderiam surgir e cujas respostas serão possíveis

graças aos métodos desenvolvidos mais adiante.

O estudo que irá se desenvolver pode ser dividido em quatro partes: Estatística

Descritiva, Probabilidades, Amostragem e Inferência Estatística. A Estatística Descritiva se

10

preocupa apenas em organizar e descrever um conjunto de observações. O estudo da

Amostragem vai possibilitar o conhecimento das principais técnicas de obtenção de amostras

bem como suas aplicações. O estudo de Probabilidades será necessário para que possamos

desenvolver os principais métodos de Inferência Estatística. A Inferência Estatística vai

possibilitar a tomada de decisões acerca de populações partindo de amostras.

ESTATÍSTICA GERAL

Visa elaborar métodos gerais aplicáveis a todas as fases do estudo dos fenômenos

coletivos de massa. A estatística matemática e a parte da estatística geral que tem por

finalidade o estudo das propriedades matemáticas dos fenômenos coletivos de massa e a

dedução e demonstração rigorosa dos procedimentos e formulas usada. A estatística geral

ainda pode ser dividida em dois grandes campos.

ESTATÍSTICA DESCRITIVA - consiste num conjunto de métodos que ensinam a reduzir

uma quantidade de dados bastante numerosa por um numero pequeno de medidas, substitutas

e representantes daquela massa de dados.

Nesse aspecto, trata da coleta, de organização, classificação, apresentação e descrição

dos dados observados, referindo-se a maneira de apresentar um conjunto de dados em tabelas

e gráficos e a maneira de resumir, através de certas medidas, as informações contidas nestes

dados.

ESTATÍSTICA INDUTIVA - refere-se a um processo de generalização, a partir de

resultados particulares e, consiste em inferir (deduzir ou tirar conclusões a respeito das)

propriedades de um universo (população) a partir de uma parte do universo (amostra).

O processo de generalização, que e característico do método indutivo, está associado a

uma margem de incerteza. A medida da incerteza e tratada mediante técnicas e métodos que

se fundamentam na Teoria das Probabilidades.

O MÉTODO ESTATÍSTICO

Método é um conjunto de meios dispostos convenientemente para se chegar a um fim

que se deseja.

11

Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso e

outros, por necessidades práticas, sem aplicação de um método. Atualmente, quase todo

acréscimo de conhecimento resulta da observação e de um estudo. Dos métodos científicos,

destacam-se o método experimental e estatístico.

O método experimental consiste em manter constantes todas as causas (fatores) e variar

esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. E o método

preferido no estudo das ciências da natureza, como a Física, a Química, etc.

O método estatístico muitas vezes há necessidade de descobrir fatos em um campo em

que o método experimental não pode ser aplicado, nas ciências sociais, por exemplo, já que os

vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto

se faz variar a causa que, naquele momento interessa que seja avaliada. (como exemplo, pode-

se citar a determinação das causas que definem preço de uma mercadoria. Para ser aplicado o

método experimental, terá que fazer variar a quantidade da mercadoria e verificar se tal fato

ira influenciar seu preço, porem, seria necessário que não houvesse alteração nos outros

fatores. Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salários, o

gosto dos consumidores deveria permanecer constante, seria necessária a fixação do nível

geral dos preços das outras necessidades etc. Mas isso tudo e impossível).

O método estatístico, embora mais difícil e menos preciso, diante da impossibilidade de

manter as causas constantes, admite todas essas causas presentes variando-as, registrando

essas variações e procurando determinar, no resultado final, que influencias cabem a cada

uma delas.

FASES DO MÉTODO ESTATÍSTICO

As principais fases do Método Estatístico são:

Definição ou Delimitação do problema

Planejamento

Execução

Definição ou Delimitação do problema: É saber exatamente aquilo que se deseja pesquisar

ou analisar.

Saber que tratamento Estatístico é de interesse consistindo em uma definição ou

formulação correta do problema a ser estudado. Além de considerar minuciosamente o

problema do estudo um pesquisador deve levantar e examinar trabalhos realizados no mesmo

12

campo e em campos análogos que possam dar informações preliminares antes de se dedicar

diretamente à Pesquisa. Uma lista de fatores relevantes deverá resultar dessa investigação

preliminar. Saber exatamente o que se pretende pesquisar é o mesmo que definir o problema

corretamente.

Planejamento: Consiste na definição dos objetivos da pesquisa e de toda a operacionalização.

É a determinação das fontes de dados e como obter as informações, ou seja, a escolha

do método de pesquisa; da forma de coleta dos dados; definir claramente que tipo de

delineamento estatístico será empregado ou, no caso de aplicação de questionários, escolher

corretamente as perguntas, verificar sua correta formulação; da construção e teste do

instrumento de coleta dos dados; da definição do plano de amostragem e do tamanho da

amostra; do processamento e análise dos dados; da definição dos recursos necessários

(humanos, financeiros, materiais e tecnológicos); da definição dos procedimentos de campo;

da definição de responsabilidades, cronograma e definição de custos, prazos e datas para o

cumprimento de cada etapa da pesquisa.

São fases do planejamento:

Definição clara dos objetivos da pesquisa: A definição do objetivo da pesquisa deve estar

perfeitamente amarrada à solução do problema de pesquisa.

Alem disso, devem ser levados em consideração.

tempo disponível;

recursos disponíveis (físicos, humanos, financeiros e tecnológicos);

acessibilidade aos detentores dos dados;

disponibilidade de meios de captação dos dados.

EXEMPLO: Qual a eficiência dos programas educacionais do Governo Federal?

Objetivo Principal: Reunir informações que possibilitem ao Governo determinar quais

programas educacionais alcançam melhores níveis de eficiência.

Objetivos Secundários:

apontar em que nível os objetivos estão sendo cumpridos;

determinar o número de beneficiados em cada programa;

verificar se o recurso disponibilizado foi alocado corretamente.

13

FORMULAÇÃO DE QUESTÕES E HIPÓTESES: São indagações amplas, que, para

serem respondidas, vão exigir a colocação de um conjunto de perguntas especificas no

questionário.

Em relação ao exemplo anterior, são questões de pesquisa:

Quais programas estão cumprindo seus objetivos.

Quantas pessoas são beneficiadas por este ou aquele programa.

Quando a pesquisa quer relacionar causa e efeito entre variáveis, surge a necessidade do

estabelecimento de hipóteses ou proposições de pesquisa. Uma hipótese consiste numa

afirmação sobre o possível relacionamento de causa e efeito dentre variáveis. Esta hipótese

será verificada por meio das informações obtidas pela pesquisa e poderá ser rejeitada ou não.

Em relação ao exemplo anterior, são hipóteses de pesquisa:

o número de beneficiados pelo programa atingiu o patamar mínimo previamente

estabelecido, então o programa cumpre seus objetivos.

os recursos disponibilizados foram alocados corretamente, então maiores serão os níveis de

eficiência do programa.

ESTABELECIMENTO DE NECESSIDADES DE DADOS E

DEFINIÇÃO DE VARIÁVEIS DA PESQUISA

Para a realização da pesquisa, e preciso conhecer a fonte, ou seja, descobrir onde se

encontram os dados, quem os possui como estão armazenados, se estão disponíveis etc.

As fontes de dados dividem-se em duas formas:

Fontes Primárias: aquelas portadoras de dados que nunca foram coletados, tabulados

e analisados.

São fontes primarias: contribuintes, telespectadores, radiouvintes, leitores, etc.

Fontes Secundárias: são aquelas que possuem dados que já foram coletados,

tabulados e analisados.

São fontes de dados secundários: FIBGE, Fundação SEADE, FIPE, FGV, relatórios de

pesquisa, jornais, revistas, livros etc.

14

DETERMINAÇÃO DA METODOLOGIA DE PESQUISA

Na determinação da metodologia de pesquisa a ser utilizada devemos levar em consideração o

quanto segue:

1 – Determinação do tipo de pesquisa:

pesquisa exploratória;

pesquisa conclusiva descritiva;

pesquisa conclusiva causal.

2 – Determinação dos métodos e técnicas de coleta de dados:

levantamentos bibliográficos ou documentais;

estatísticas publicadas;

entrevistas com entendidos;

observação sistemática;

entrevistas pessoais ou por telefone;

questionários distribuídos e recolhidos pessoalmente ou pelo correio;

levantamento de campo;

estudos em laboratórios;

estudos de caso.

3 – Determinação da população de pesquisa, do tamanho da amostra e do processo de

amostragem.

É um dos passos mais importantes do processo de pesquisa, principalmente quando se

tratar de pesquisas descritivas. Nesse sentido, é preciso determinar qual a população de

interesse, ou seja, grupo de indivíduos ou produtos que tenham pelo menos uma característica

em comum. Estabelecida a população de interesse, determina-se em seguida o tipo de

levantamento de dados:

levantamento censitário;

levantamento por amostragem.

4 – Planejamento da coleta de dados: consiste na definição de uma série de medidas que

venham a facilitar a realização da coleta de dados e que minimizem a ocorrência de fatores

que possam comprometer os resultados da pesquisa. A coleta dos dados depende do tipo de

15

pesquisa e dos métodos e técnicas a serem utilizados. Pode compreender as seguintes

definições:

perfil dos entrevistados e dos supervisores de campo;

número e distribuição de entrevistadores e de supervisores de campo pelas áreas de

pesquisa, número de entrevistas diárias por entrevistador;

prazo para realização do campo;

sistema de remuneração dos entrevistadores;

material e forma de treinamento dos entrevistadores;

procedimentos de supervisão a serem seguidos pelos supervisores de campo;

procedimentos de verificação das entrevistas realizadas.

5 – Previsão do processamento e análise dos dados: neste passo, o pesquisador deverá

prever como os dados deverão ser processados e que análises deverão ser efetuadas para se

resolver o problema de pesquisa. Essa previsão pode incluir a definição de:

tabelas, quadros, gráficos e figuras;

variáveis que terão tabulação simples;

variáveis que terão tabelas cruzadas;

medidas estatísticas a serem calculadas para cada variável;

variáveis que serão submetidas a testes estatísticos.

EXECUÇÃO

Nesta etapa procede-se a efetiva realização da pesquisa. Compreendendo a Coleta dos

dados e seu Processamento, analise e interpretação.

A execução de uma pesquisa pode ser dividida em três etapas:

1 - Preparação do Campo: Consistindo em:

construção, pré-teste e reformulações, quando necessárias, do instrumento de pesquisa

e do manual de campo;

impressão do instrumento e do manual do campo:

recrutamento, seleção e treinamento dos pesquisadores de campo;

distribuição do trabalho entre a equipe.

2 - Campo: Consiste na realização efetiva da pesquisa ou obtenção de dados, com as

necessárias verificações das possíveis falhas por parte dos pesquisadores ou do instrumento de

pesquisa:

16

coleta dos dados;

conferencia, verificação e correção dos preenchimentos dos instrumentos de coleta de

dados.

3 - Coleta dos dados: refere-se à obtenção e registro das informações, que pode ocorrer por

meio de coletas, contagem ou experimentação.

A coleta de dados e dita direta, quando feita sobre elementos informativos de registros

obrigatórios. A coleta direta e dividida em continua (registro de nascimento, casamento,

óbitos etc.), periódica (censo populacional, quantidade de produção de certa cultura sazonal),

ou ocasional (determinada por algum acontecimento fortuito, epidemias, catástrofes, etc.).

A coleta de dados e dita indireta, quando feita com elementos conhecidos por coleta direta ou

do conhecimento de outros fenômenos relacionados com o aquele estudado.

CRÍTICA DOS DADOS

É o estudo cuidadoso a procura de possíveis falhas, imperfeições ou discrepâncias, a

fim de evitar erros grosseiros, que possam influir sensivelmente nos resultados.

A crítica dos dados e dita externa quando visa erros do informante e interna quando visa erros

originais da coleta.

PROCESSAMENTO E ANÁLISE

Apuração dos dados: e o processamento dos dados e a disposição mediante critérios de

classificação. Consiste em digitar e condensar ou classificar os dados coletados.

Exposição ou apresentação dos dados: visa tornar mais fácil o exame daquilo que e

objeto de tratamento estatístico, os dados podem ser apresentados em tabelas ou

gráficos, permitindo visualmente a comparação com outros elementos ou ainda

previsões básicas descritivas.

Analise e interpretação dos resultados: e a ultima fase do trabalho e permite tirar

conclusões que auxiliem na solução de problemas. Após a obtenção de informações

suficientes, pode-se estabelecer parâmetros amostrais (estimativas) para a população

com uma determinada probabilidade de erro.

17

COMPONENTES DO MÉTODO ESTATÍSTICO

VARIÁVEIS: são as características que podem ser observadas (ou medidas) em cada

elemento da população, sob as mesmas condições.

Uma variável observada (ou medida) num elemento da população deve gerar apenas

um resultado. As variáveis surgem quando perguntamos o quê vamos observar ou medir nos

elementos de uma população.

Como definir uma variável na prática?

Na população de funcionários de uma empresa, podemos definir variáveis, tais como:

tempo de serviço, estado civil, etc. Podemos pensar em observá-las com perguntas do tipo:

Há quanto tempo o Sr. (ou Sr.ª) trabalha nesta empresa? ________________________

Qual o seu estado civil? _______________________

Estas perguntas, contudo, não estão identificando bem as variáveis de interesse, pois

os funcionários podem interpretá-las de diferentes formas e, por exemplo, para a primeira

pergunta, podem ocorrer respostas tais como: há pouco mais de 12 anos. Há 7 meses, há

muito tempo, etc., não caracterizando propriamente observações da variável tempo de serviço,

por não estarem sendo observadas de forma homogênea.

Para que as observações do tempo de serviço sejam feitas sob as mesmas condições,

precisamos estabelecer a sua unidade de medida, como, por exemplo, anos completos de

trabalho na empresa. E a pergunta poderia ser:

Há quanto tempo o Sr. (ou a Sr.ª) trabalha nesta empresa?

______________ anos completos.

Quanto à variável estado civil, suas possíveis respostas são atributos. Para evitar

alguma resposta estranha, podemos estabelecer previamente as possíveis alternativas de

resposta. E a pergunta poderia ser:

Qual seu estado civil? ( ) solteiro ( ) casado ( ) viúvo

( ) desquitado ( ) divorciado

Ao efetuar estas perguntas a um funcionário da empresa, teremos, para cada pergunta,

apenas uma resposta. Cada pergunta está, então, associada a uma variável.

Na descrição ou análise de um conjunto de dados estatísticos, pode-se associar a eles

certos tipos de variáveis, pois o tratamento matemático exigido e o método estatístico a ser

18

utilizado dependem dessa variável. Podemos considerar dois tipos de variáveis: qualitativas e

quantitativas.

Variáveis qualitativas estão associadas a uma característica que denota qualidade ou

atributo.

Alguns exemplos de variáveis qualitativas são: cor dos olhos dos operários de certa

indústria (azuis, castanhos, verdes), desempenho dos operários (ótimo, bom, sofrível, etc.),

qualidade dos produtos (defeituosos, perfeitos, recuperáveis, etc.).

Variáveis quantitativas estão associadas a valores numéricos, podendo ser discretas ou

contínuas.

Variável quantitativa discreta: quando o número de valores possíveis for finito ou infinito

enumerável.

Como exemplos de variáveis discretas pode-se citar: números de peças produzidas por

uma indústria, número de defeitos encontrados em seus produtos, número de dias que choveu

durante o mês de março em certa localidade, etc.

Variável quantitativa contínua é aquela que pode, ao menos teoricamente, assumir qualquer

valor entre dois valores possíveis dessa variável.

Alguns exemplos de variáveis contínuas são: comprimentos de parafusos fabricados

por certa máquina, tempos gastos pelos operários para realizar certa tarefa, resistência à

ruptura dos cabos produzidos por certa companhia, etc. Costuma-se dizer, de uma maneira

quase geral, que as variáveis discretas estão associadas às contagens e as variáveis contínuas

às medições.

Para ilustrar:

Pode-se dizer que:

NOME SEXO

JOÃO MASC

MARIA FEM

PEDRO MASC

LÚCIA FEM

19

É uma forma de medida? De certa maneira, pode-se, dizer que sim. É a chamada

medida QUALITATIVA. Mas pode-se também associar a masculino o nº 1 e a feminino nº

2 e a tabela transforma-se em QUANTITATIVA:

NOME SEXO

JOÃO 1

MARIA 2

PEDRO 1

LÚCIA 2

Poderia ser também:

SEXO QUAN

TIDADE

MASC 1) 2

FEM (2) 2

20

MÓDULO II

POPULAÇÃO E

AMOSTRAS EM

PESQUISAS

21

POPULAÇÃO E AMOSTRA

Ex. Em uma pesquisa sobre o perfil de trabalho dos funcionários de uma empresa, a

população pode ser definida como o conjunto de todos os funcionários da empresa, numa

determinada época. Contudo, se a coleta de dados for feita no próprio local de trabalho e no

período de uma semana, os funcionários que neste período estão de férias ou de licença ficam

inacessíveis de serem observados e portanto temos uma redução nesta população. Esta

redução no número de elementos é o que chamamos de amostra.

População ou universo – é qualquer conjunto de informações que tenham, entre si, uma

característica comum.

No exemplo das pessoas da comunidade, observa-se que o conjunto de todas as

estaturas constitui uma população de estaturas; o conjunto de todos os pesos constitui uma

população de pesos; o conjunto de todas as cores de olhos constitui uma população de cores

de olhos.

Para ilustrar:

Se uma população for muito grande (por exemplo, o conjunto de todas as estaturas de

uma comunidade), o pesquisador poderá ter um trabalho astronômico para estudá-la. E em

alguns casos os resultados serão sempre falhos.

É só pensar no número de nascimentos e mortes diários, isto é, na entrada e saída de

informações, para avaliar a dificuldade e a imprecisão do trabalho. Nesses casos, o Estatístico

recorre a uma amostra.

Exatamente! O que importa é a variável

estudada. Você pode ter uma população

de pesos de ratos ou de comprimento

de minhocas. Então, POPULAÇÃO não

implica necessariamente

pessoas?

22

Amostra: constitui uma redução da população a dimensões menores, com a menor perda

possível das características essenciais.

Por exemplo: considere uma escola com 400 alunos (meninos, entre 6 e 16 anos).

Ao fazer um estudo das estaturas (qual a estatura média?) pode-se simplificar o

trabalho colhendo-se uma amostra de 40 alunos e estudar-se o comportamento da variável

estatura apenas nesses alunos.

Para ilustrar:

Uma amostra, para ser boa, te de ser representativa, ou seja, deve conter em

proporção tudo o que a população possui qualitativa e quantitativamente. E tem de ser

imparcial, isto é, todos os elementos da população devem ter igual oportunidade de fazer

parte da amostra, também chamada de amostra probabilística.

Para garantir a REPRESENTATIVIDADE e a IMPARCIALIDADE é preciso

obedecer a certas regras:

BUSCA-SE FAZ-SE

REPRESENTATI-

VIDADE

Análise da população para ver se seus

elementos distribuem-se homogeneamente ou se formam

grupos com características peculiares. Se esse for o caso,

temos de respeitar as proporções com que esses grupos

integram a população.

IMPARCIALIDA-

DE

Sorteio (mediante a utilização de um

dispositivo que gere números aleatórios) dos elementos que

farão parte da amostra.

Claro! Como poderiam ser

outras variáveis: nº de

cáries, notas em História

ou renda familiar.

NÃO! Se você fizer

isso não estará sendo

IMPARCIAL.

E eu posso escolher que

quiser para a minha

amostra? Só os meus

amigos?

A variável estudada

poderia ser inteligência

ou nº de filhos?

23

Ao disponibilizar-se uma amostra representativa da população inicial, as pessoas (no

caso, os alunos) passam a ser tratadas como DADOS e podem dar origem a diversas

RELAÇÕES ESTATÍSTICAS, como por exemplo, média aritmética, mediana, moda,

variância, desvio padrão, etc.

Essas relações Estatísticas possibilitam descrever sob diversos ângulos, o conjunto de

dados representado pela amostra. Por essa razão, o estudo dessas relações pertence ao campo

da ESTATÍSTICA DESCRITIVA. O interesse do pesquisador está voltado para a população

da qual se originou a amostra. Ele estuda as características da am ostra (isto é, calcula as

relações Estatísticas) com o objetivo de transferir, de generalizar suas conclusões para a

população.A parte da Estatística que se interessa pelas generalizações, ou seja, pelas

transferências de conclusões das amostras para as populações chama-se ESTATÍSTICA

INFERENCIAL.

Na transferência de suas conclusões (da amostra para a população) o pesquisador vale-

se de um poderoso recurso que é a TEORIA DAS PROBABILIDADES. Essa teoria permite

avaliar (e controlar) o tamanho do erro que ele estará cometendo ao fazer generalizações

(= inferência).

Finalmente, uma consideração importante com respeito à utilização de amostras. Se

uma população for muito grande o trabalho estatístico poderá ser astronômico do ponto de

vista do trabalho, do custo e dos recursos humanos. Por essa razão é que se vale de uma

amostra. Uma amostra também pode ser útil quando o processo de pesquisa é destrutivo.

Por exemplo: em r uma população de fósforos deseja-se avaliar a porcentagem de falhas. Há

dois caminhos:

1) Risca-se um por um e ao cabo de algum tempo concluí-se que a falha é da

ordem de, digamos, 2%.Neste caso há a queima de todo o estoque.

2) Colhe-se, com critério, uma amostra, risca-se um por um os fósforos que a

compõem e, ao cabo de algum tempo (menor, sem dúvida, que no caso anterior), concluí-se

que a falha é de aproximadamente 2%, podendo ser 1,8% ou 2,2%.

Na obtenção das amostras, deve-se usar técnicas adeq uadas para que as mesmas

sejam representativas das populações, ou seja, devem possuir características básicas das

populações. Evidentemente, devido a aleatoriedade, sempre existirão certas discrepâncias no

processo de amostragem.

24

TIPOS DE AMOSTRAGEM

Pode-se falar em dois tipos de amostragem:

Amostragem probabilística: Quando todo o elemento da população tem probabilidade

conhecida e diferente de zero, de pertencer à amostra.

Amostragem não-probabilística: Quando nem todos os elementos da população tem

probabilidade conhecida de pertencer à amostra.

A vantagem do uso da amostragem probabilística é que a mesma permite o cálculo do

erro amostral, o que não acontece com a amostragem não-probabilística.

Há três tipos de amostragens probabilísticas básicas:

Amostragem casual simples (ao acaso, aleatória, elementar) é aquela onde todos os

elementos da população têm igual probabilidade de pertencer à amostra.

Essa técnica é equivalente a um sorteio lotérico, ou seja, enumeramos a população de

1 a N, sorteando a seguir, por meio de dispositivo aleatório qualquer, k elementos dessa

seqüência, os quais corresponderão aos elementos da amostra (n).

A probabilidade de cada elemento tem de pertencer a amostra é n/N (chamada de

fração amostral).

Quando a amostragem for feita com reposição o número de amostras possíveis é dado

por Nn, enquanto que, para a amostragem sem reposição esse número é dado por C n

N

Uma maneira utilizada para fazer o sorteio dos elementos que compõem a amostra é o

uso de uma tabela de números aleatórios. Essa tabela consiste de inúmeros dígitos, obtidos

por um processo equivalente a um sorteio equiprovável.

EXEMPLOS:

1) Obter uma amostra de 30% dos alunos do 2º E.E. e determinar o peso médio

dos alunos amostrados.

-----------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------

25

2) Obtenha uma amostra de 10% de um grupo de 90 alunos

-----------------------------------------------------------------------------------------------------------------

--------------------------------------------------------------------------------------------------------------

3) Selecionar aleatoriamente uma amostra de 7 elementos de um conjunto formado

pelos números de 1 a 3500.

-----------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------

4) Obter uma amostra de 30 elementos de uma população de 500 elementos.

-----------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------

Amostragem sistemática é uma forma simplificada de amostragem casual simples, podendo

ser utilizada quando os elementos da população se apresentam ordenados a retirada dos

elementos para compor a amostra é feita periodicamente.

Por exemplo, em um processo de produção, onde se deseja executar o controle de

qualidade, podemos tomar uma peça para compor a amostra, em cada k (salto) peças

produzidas. Ou então, em um arquivo de nomes de pessoas que estão em ordem alfabética,

também podemos pegar uma ficha a cada k fichas. O primeiro elemento deve ser sorteado. Se

há possibilidade de saber o total podemos calcular o salto que deve ser dado por n

Nk ,

onde N é o tamanho da população e n é o tamanho da amostra.

EXEMPLOS:

1) Compor uma amostra de 7 elementos retirados de uma população de 490

elementos.

-----------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------

26

2) Obter uma amostra sistemática de 10% dos elementos de um grupo de 160

indivíduos.

-----------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------

3) Formar uma amostra de 7 elementos retirados de um conjunto de 412 elementos.

-----------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------

Amostragem estratificada é utilizada quando a população pode ser dividida em

subpopulações ou estratos, devendo a variável de interesse ser mais ou menos homogênea

dentro de cada estrato.

Na composição da amostra devem ser sorteados elementos de todos os estratos, para

que todos sejam representados na amostra.

Para se especificar quantos elementos de cada estrato deverão fazer parte da amostra,

existem 3 maneiras.

(1) Uniforme: Quando há o sorteio de um mesmo número de elementos de cada estrato.

Evidentemente, esse processo deve ser utilizado se os estratos da população forem

pelo menos aproximadamente do mesmo tamanho.

(2) Proporcional: Quando há o sorteio um número de elementos proporcional ao tamanho de

cada estrato.

Sua utilização é mais geral que a uniforme, pois, independe do tamanho de cada

estrato.

(3) Ótima: Quando leva-se em consideração o tamanho de cada estrato e também a variação

da variável de interesse dentro de cada estrato.

Essa variação é expressa em termos do desvio padrão de cada estrato. Dessa maneira,

o estrato que tiver menor variação contribuirá com uma quantidade menor de elementos.

EXEMPLOS:

1) Em uma sala com 90 alunos, 54 são homens e 36 são mulheres. Obtenha uma

amostra estratificada de 10%.

-----------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------

27

2) Tem-se uma comunidade com 528 pessoas, distribuídos pelas classes A(67),

B(113), C(320) e D(28). Selecionar uma amostra:

a) aleatória de 3%

b) aleatória de 15 pessoas

c) de 4% das pessoas, proporcionalmente às classes

d) sistemática de 5% de pessoas.

-----------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------

QUESTÕES TEÓRICAS

1) Quais são as três principais áreas da Estatística?

2) Defina o termo Estatística.

3) Defina os termos amostra e população.

4) Quais são as principais razões da amostragem?

5) Em que circunstâncias é a amostragem preferível a um censo completo?

6) Para ser útil, que características deve ter uma amostragem?

7) Dê cinco exemplos em que a Estatística é útil.

8) Contraste dados quantitativos e qualitativos.

PROBLEMAS PROPOSTOS

1) Uma população é constituída de 2500 elementos. Obter uma amostra casual simples

de 50 elementos, explicando o procedimento utilizado.

2) Uma população é constituída pelos 800 alunos de uma escola. Tendo uma listagem

dessa população, já ordenada, explique qual o procedimento para obter uma amostra

sistemática de 40 alunos.

3) A Receita Federal arquiva as declarações de imposto de renda pela ordem de

chegada. Selecionar uma amostra sistemática de 2% de um lote de 800 declarações.

28

4) Em uma turma estão matriculados 53 alunos, sendo os 20 primeiros do sexo

masculino. Sortear uma amostra aleatória simples de 25% desses alunos, indicando cada

componente da amostra pelo seu número e sexo.

5) Um serviço de contabilidade atende 70 pequenas empresas, 20 médias e 5 grandes.

Sortear uma amostra de 20% proporcional ao tamanho da empresa.

6) Uma população encontra-se dividida em 3 estratos, com tamanhos respectivamente,

n1 = 40, n2 = 100 e n3 = 60. Sabendo-se que ao ser realizada uma amostragem estratificada

proporcional, 9 elementos da amostra foram retirados do 3º estrato, determine o número total

de elementos da amostra.

7) O Edifício Central foi sorteado para efeito de um levantamento por amostragem.

Informações coletadas na portaria do prédio revelaram: os moradores desses apartamentos são

18 comerciários, 5 industriais, 28 bancários e 9 profissionais liberais. Selecionar uma amostra

de 20%, proporcionalmente às profissões.

8) Indicando cada elemento por seu número, selecionar uma amostra de 3%

proporcional ao sexo de um grupo de 240 pessoas, das quais as 67 primeiras são do sexo

masculino.

9) Em uma cidade com 3000 habitantes, deseja-se fazer uma pesquisa sobre a

preferência por tipo de lazer entre as pessoas de 20 anos de idade, levando em consideração o

sexo.

a) qual a população envolvida na pesquisa?

b) supondo que na cidade existam 560 mulheres e 600 homens com 20 anos,

selecione uma amostra sistemática e uma amostra estratificada de 3% desses habitantes.

CRÍTICA DOS DADOS obtidos os dados, eles devem ser cuidadosamente criticados à

procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou

de certo vulto, que possam influir sensivelmente nos resultados.

APURAÇÃO DOS DADOS: nada mais é do que a soma e o processamento dos dados

obtidos na amostragem. Pode ser manual ou eletrônica.

29

Exemplo: uma amostragem realizada em uma favela, sobre a renda familiar, em

salários mínimos, apresentou o seguinte resultado.

1,3 2,4 3,2 1,5 1,0 1,0 1,3 1,5 1,6

2,3 4,2 1,8 3,2 74,1 3,5 2,0 1,8 1,9

2,2 2,0 3,1 2,2 3,0 2,7 1,7 1,5 0,9

O valor 74,1 muito provavelmente não pertence a um morador da favela, este dado

deve ser desconsiderado, pois o mesmo ou foi anotado errado ou a resposta foi

mentirosa. Citar mais exemplos de peso e estatura.

30

MÓDULO III

APURAÇÃO DOS

RESULTADOS EM

UMA PESQUISA

ESTATÍSTICA

31

EXPOSIÇÃO DOS RESULTADOS

Um conjunto de observações de certo fenômeno, não estando adequadamente

organizado, fornece poucas informações de interesse do pesquisador.

Para obter-se informações de interesse sobre o fenômeno em estudo, deve-se agrupar

as observações em tabelas ou gráficos convenientemente construídos. O tipo de tabela ou

gráfico utilizado é em função do tipo de variável que representa o fenômeno de interesse.

Tabela é um quadro que resume um conjunto de observações, que ajuda muito a compreender

um fenômeno.

Uma Tabela deve seguir um conjunto de Normas convencionadas pelo Conselho

Nacional de Estatística.

As normas servem como instrumento capaz de orientar todos que se utilizam de dados

numéricos, de modo a garantir a clareza das informações.

Uma Tabela deve ser clara, objetiva, concisa e auto-suficiente, isto é, deve ter

significado próprio, eliminando a necessidade de textos explicativos, bem como a Tabela deve

ser exaustiva e mutuamente exclusiva, ou seja, não deve apresentar itens para os quais não

tenha classe nem sequer itens que pertençam a mais de uma classe.

A Tabela é composta basicamente dos seguintes elementos:

a) Corpo: conjunto de linhas e colunas que contém informações sobre a variável

em estudo;

b) Cabeçalho: parte superior da tabela que especifica o conteúdo das colunas;

c) Coluna Indicadora: parte da tabela que especifica o conteúdo das linhas,

d) Coluna Numérica: parte da tabela que especifica a quantidade das linhas;

e) Linhas: informações das variáveis;

e) Título: conjunto de informações, as mais completas e resumidas possíveis,

respondendo às perguntas: o quê? quando? onde?, localizado no topo da tabela;

f) Rodapé: parte inferior da tabela contendo a fonte e informações adicionais.

32

EXEMPLOS:

1) TABELA SIMPLES

EXPORTAÇÕES

Produtores toneladas

Soja 1300

Milho 270

Arroz 320

Banana 50

2) DUPLA ENTRADA OU CONJUGADA

NOTAS DOS ALUNOS - 2000

Alunos 1º bim 2ºbim.

A 4,5 2,3

B 7,8 8,2

C 10,0 9,5

D 2,0 3,5

Fonte: DIAP

3) Segundo o setor de Cadastro da Receita Estadual, em 1993 ocorreram 746 novos

cadastros no ICMS/PR entre Regime Simples e Regime Normal. Em 1994, ocorreram 1024

novos cadastrados. Em 1993, 496 eram enquadradas no Regime Simples, das quais 168

Indústrias. Em 1994, 633 eram do Comércio e das 1024, 800 eram de Regime Normal, sendo

256 Indústrias. Com Regime Normal, em 1993, 70% eram do Comércio. Construir uma tabela

que retrate a situação acima.

Anos

REGIME

Total Regime Normal Regime Simples

Total

33

PROBLEMAS PROPOSTOS

1) O Movimento religioso de certo município, no período de 1992/1994,

apresentou os seguintes dados:

- em 1992, houve 56738 batizados (dos quais 26914 do sexo feminino), 15884

casamentos e 13678 extrema-unções;

- em 1993, houve 33915 batizados do sexo masculino e 29568 do sexo feminino;

os casamentos foram em número de 17032 e as extrema-unções, 14328;

- em 1994, de um total de 71232 nascimentos, 34127 eram do sexo masculino; as

extrema-unções foram 16107 e os casamentos 16774. Construa uma tabela.

2) Construir uma tabela para os dados.

No ano de 1993, houve 627 matrículas na Escola Rural e, em 1994, 813. Em 1993,

595 eram brasileiros, dos quais 185 mulheres, sendo que havia apenas 5 moças estrangeiras.

Em 194 foram matriculados 50 estrangeiros, dos quais apenas 12% eram mulheres; dos

brasileiros matriculados nesse ano, havia 204 mulheres. Em 1995, dos 849 alunos não havia

nenhuma moça estrangeira, mas dos 797 brasileiros, 185 eram do sexo feminino.

3) Numa pesquisa visando avaliar o desempenho escolar dos alunos do Colégio

“XXX”, um dos pontos de interesse recaiu sobre a renda familiar e o tamanho das famílias

dos alunos. Uma amostra de 150 alunos foi entrevistada e os resultados são: dos 52 alunos

provenientes de famílias de baixa renda, 5 tinham famílias pequenas e 15 tinham famílias

médias. Dentre aqueles com renda média baixa, 8 tinham famílias pequenas, 10 famílias

médias e 20 famílias grandes. Dentre os 45 alunos de famílias de renda média, 25 eram

provenientes de famílias médias e 10 de famílias grandes. De modo análogo, dos 12 que

representavam as famílias de renda média alta, 5 eram de famílias pequenas e apenas 2 de

famílias grandes. Além disso, a amostra continha 3 alunos oriundos de famílias de alta renda:

duas pequenas e uma grande. Mostre uma tabela adequada.

34 DISTRIBUIÇÕES DE FREQUÊNCIAS

Quando trabalha-se com poucos valores numéricos, o trabalho estatístico fica

sensivelmente reduzido. No entanto, normalmente tem-se que trabalhar com grande

quantidade de dados.

Um dos objetivos da Estatística Descritiva neste caso é obter uma significativa

redução na quantidade de dados com os quais devemos operar d iretamente. Isto pode ser

conseguido modificando-se a forma de apresentação destes dados.

Suponha que observando-se as notas de 30 alunos em uma prova, obtém-se os

seguintes valores:

X:

3,5 5 4,5 4 4,5 5 3,5 4 4 5

2 3 4,5 3,5 4 4,5 3 4 3 4

3,5 3,5 3,5 4 4 3 4 4 5 3

Interpretando-se como freqüência simples de um elemento o número de vezes que

este elemento figura no conjunto de dados, pode-se reduzir significativamente o número de

elementos com os quais deve-se trabalhar.

DISTRIBUIÇÃO DA FREQUÊNCIA – VARIÁVEL DISCRETA é uma representação

tabular de um conjunto de valores onde coloca-se na primeira coluna em ordem crescente

apenas os valores distintos da série e na segunda coluna dispõe-se os valores das freqüências

simples correspondentes.

Usando-se f para representar a freqüência simples, a seqüência pode ser

representada pela tabela:

NOTAS DOS ALUNOS

xi fi

2 1

3 5

3,5 6

4 10

4,5 4

5 4

Fonte: Escola “X”

35

Observações:

1) a colocação de um índice i para x e para f tem a finalidade de referência. Deste modo xi

representa o primeiro valor distinto da série e fi representa a freqüência simples do primeiro

valor e assim sucessivamente.

2) Consegue-se reduzir de 30 elementos que constituíam a série original para apenas 12

elementos.

Deve-se optar por uma variável discreta na representação de uma série de valores quando o

número de elementos distintos da série for pequeno.

CONSTRUÇÃO DA VARIÁVEL DISCRETA

A construção de uma variável discreta é bastante simples. Basta observar quais são

os elementos da seqüência (dados brutos), ordená-los (rol), e colocá-los na primeira coluna da

tabela. Em seguida, computar a freqüência simples de cada elemento distinto e colocá-la na

segunda coluna da tabela.

Exemplo de construção de uma variável discreta. A seqüência abaixo representa a

observação do número de acidentes por dia, em uma rodovia, durante 20 dias.

X: (pontos)

0 2 0 1 1 0 0 0 3 2

1 0 1 2 0 1 3 2 2 0

Os valores distintos da série são: 0, 1, 2 e 3.

As freqüências simples respectivas são: 8, 5, 5 e 2.

Portanto, a variável discreta representativa desta seqüência é:

Nº DE ACIDENTES NA BR 123

xi fi

0 8

1 5

2 5

3 2

Fonte: P.R.F.

36

QUESTÕES TEÓRICAS

1) Qual é o objetivo de agrupar os dados por freqüência?

2) O que é uma variável discreta?

3) Qual a característica de um conjunto de dados que indique o uso de uma

variável discreta ao se agrupar os dados por freqüência?

PROBLEMA PROPOSTO

1) Os resultados do lançamento de um dado 50 vezes foram os seguintes:

6 5 2 6 4 3 6 2 6 5

1 6 3 3 5 1 3 6 3 4

5 4 3 1 3 5 4 4 2 6

2 2 5 2 5 1 3 6 5 1

5 6 2 4 6 1 5 2 4 3

Forme uma distribuição de freqüência sem intervalos de classes.

37

MÓDULO IV

GRÁFICOS

ESTATÍSTICOS

38

GRÁFICOS ESTATÍSTICOS

Representar graficamente significa fazer um desenho que sintetize de maneira

clara o comportamento de uma ou mais variáveis.

Existem vários tipos de representações gráficas. Os melhores gráficos são os que

primam pela simplicidade e clareza.

PRINCIPAIS GRÁFICOS:

DIAGRAMA POR LINHA POLIGONAL – é a representação gráfica de uma série

estatística, por meio de segmentos de retas, que une em seqüência, os pontos de um sistema

cartesiano.

Exemplos:

1)

Mês VENDAS (R$ )

Janeiro 170

Fevereiro 230

Marco 320

Abril 410

Maio 530

Junho 600

Fonte: loja Z

39

2) COMÉRCIO EXTERIOR

ANOS

US$ (bilhões)

Importação Exportação

1996 12 14

1997 15 17,2

1998 17 24,3

1999 19,2 20,4

2000 21,2 22,5

2001 25,4 20,3

Fonte: BB

* Previsão

40

GRÁFICO EM BARRAS é a representação gráfica de uma série estatística, em ordem

crescente ou decrescente, por meio de retângulos dispostos na horizontal, com espaço entre

eles.

Exemplo:

MOVIMENTO DA LOJA

“IMPORTADOS” – AGO/2000

Modelos Unidades

BMW

HONDA

FERRARI

GOLF

BESTA

30

23

07

32

48

Fonte: Loja “Importados”

GRÁFICO EM SETORES é a representação gráfica de uma série estatística por meio de

superfícies setoriais.

Exemplo:

PRODUÇÃO NA REGIÃO “ABC”

Produtos Toneladas

Feijão

Trigo

Soja

Milho

Total

170

230

570

830

Fonte: Cooperativa “ABC”

41

HISTOGRAMA (variável discreta) é um conjunto de hastes, representadas em um sistema

cartesiano que tem por base os valores distintos da série (xi) e por altura, os valores

proporcionais às freqüências simples correspondentes destes elementos (fi).

Exemplo:

DEPENDENTES POR FAMÍLIA

Dependentes fi

2

3

5

6

7

1

4

8

6

2

Fonte: Empresa “XX”

42

MEDIDAS DE POSIÇÃO

Medidas de Tendência Central são medidas, isto é, Estatísticas, cujos valores estão

próximos do CENTRO de um conjunto de dados.

As principais medidas de tendência central são: MÉDIA ARITMÉTICA,

MEDIANA e MODA.

PARA DADOS NÃO AGRUPADOS (ISOLADOS)

MÉDIA ARITMÉTICA ( x ) – é o quociente entre a soma dos valores de uma série e o

número dos valores das séries.

x = n

...21 nxxx x =

n

xn

i

i1

Propriedade:

“A soma dos desvios a partir da média é sempre nula.”

Ex: dada a série:

20, 35, 25, 40Kg

IMPORTANTE: a média aritmética é o valor que pode SUBSTITUIR todos os valores da

variável, isto é, é o valor que a variável teria se em vez de VARIÁVEL, ela fosse constante.

MÉDIA PONDERADA (P) – é o quociente entre o produto dos valores pelos respectivos

pesos e a soma dos pesos.

P = n

nn

PPP

PxPxPx

*...

...

21

2211

P =

1

11

P

Px

43

Exemplo:

As notas de um aluno são: 35, 47, 53 e 70 pontos, com pesos 1, 2, 3, 10, respectivamente,

calcule a média.

MEDIANA (Md) – é o valor central de uma série, ordenada.

A mediana é útil principalmente quando o conjunto de dados é muito influenciado

pelos extremos, refletindo aqui com mais fidelidade que a média aritmética a medida de

tendência central correspondente.

Ex:

1) 20, 19, 17, 18, 17, 23 e 27 anos.

2) 120, 130, 110, 140, 150 e 180 toneladas.

IMPORTANTE: quando n é ímpar, a Md é um valor do próprio conjunto; quando n é par, a

MD é a média aritmética dos valores centrais. (Por isso, no caso de n par, a mediana é sempre

um valor teórico)

MODA (Mo) – é o valor de uma série que ocorre com maior freqüência, ou seja, o valor que

ocorre o maior número de vezes.

Um conjunto de valores pode não apresentar moda, como também a moda poderá não

ser única.

Ex:

1) 170, 180, 190, 170, 120, 170 e 210 cm.

2) 70, 80, 50, 80, 90, 70 e 100 kg.

3) 20, 30, 22, 25, 27 e 43 anos.

Exercícios:

1) Calcule a média, mediana e moda da série: 170, 180, 145, 123 e 124, 145 cm.

44

MEDIDAS DE POSIÇÃO PARA DADOS AGRUPADOS

MÉDIA ARITMÉTICA ( X ) – é a média ponderada, onde os pesos são as freqüências das

classes.

X =

i

iI

f

fX

EXEMPLO 1:

Considere-se a distribuição relativa a 34 famílias de 4 filhos, tomando para variável o número

de filhos do sexo masculino. Determine a média.

Nº de FILHOS fi

0

1

2

3

4

Total

2

6

10

12

4

34

EXEMPLO 2:

O número de dependentes dos funcionários da empresa X é dado por

Xi fi

1

2

3

4

5

6

2

4

6

7

3

1

45

MODA (MO)

Nº de FILHOS Fi

0

1

2

3

4

Total

2

6

10

12

4

34

A maior freqüência é 12, logo a moda é 3, ou seja Mo = 3

MEDIANA (Md) P é a posição da mediana, P = 2

fie o valor de P deve ser localizado na

freqüência acumulada.

Nº de FILHOS Fi

0

1

2

3

4

Total

2

6

10

12

4

34

UTILIZAÇÃO DAS MEDIDAS DE TENDÊNCIA CENTRAL

Na maioria das situações, não se necessita calcular as três medidas de tendência

central. Normalmente, precisa-se de apenas uma das medidas para caracterizar o centro da

série. Surge, então, a questão: qual medida deve ser utilizada?

A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da

série.

Quando todos os dados de uma série estatística são iguais, a média, a mediana e a

moda coincidirão com este valor e, portanto, qualquer uma delas representará bem a série. No

entanto, este caso dificilmente ocorrerá na prática.

46

Na maioria das vezes, tem-se valores diferenciados para a série e conseqüentemente a

medida irá representar bem, apenas os dados da série que se situam próximos a este valor. Os

dados muito afastados em relação ao valor da medida, não serão bem representados por ela.

Desta forma, se uma série apresenta forte concentração de dados em sua área central,

a média, a mediana e a moda ficam também situadas e sua área central representando bem a

série. Como a mais conhecida é a média, opta-se por esta medida de tendência central.

Concluindo, deve-se optar pela média, quando houver forte concentração de dados na área

central da série.

Se uma série apresenta forte concentração de dados em seu início, a mediana e a

moda estarão posicionadas mais no início da série, representando bem esta concentração. A

média que é fortemente afetada por alguns valores posicionados no final da série se deslocará

para a direita desta concentração não a representando bem. Como a mais conhecida entre a

mediana e a moda é a mediana, esta será a medida indicada neste caso.A mesma situação

ocorre se a série apresenta forte concentração de dados e seu final.

Concluindo, deve-se optar pela mediana quando houver forte concentração de dados

no início ou no final da série. A moda deve ser opção como medida de tendência central

apenas em séries que apresentam um elemento típico, isto é, um valor cuja freqüência é muito

superior à freqüência dos outros elementos da série.

EXERCÍCIOS PROPOSTOS

1) Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O lote só é

aprovado se apresentar um peso superior a 40 quilos. Se as unidades que compõem

determinado lote pesam: 3; 4; 3,5; 5,0; 3,5; 4; 5; 5,5; 4; 5, este lote será aprovado? Qual é o

peso médio do produto?

2) A média aritmética de 3 números é 24, sendo os números 26, 30 e x. Encontre o valor de x.

47

MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE

Se a natureza fosse estável, se as mesmas causas produzissem sempre os mesmos

efeitos, é bem possível que o homem nunca tivesse desenvolvido a noção de variação. Mas a

realidade é outra: o mundo está em permanente oscilação.

Assim como o homem sempre se preocupou com “medir as coisas” (extensão das

propriedades, tamanho dos rebanhos, quantidade de dinheiro, etc) preocupou-se também com

a criação de métodos matemáticos que possibilitassem medir as variações ocorridas.

Ao conjunto das medidas, isto é, estatísticas, que mede as oscilações de uma variável

deu-se o nome de MEDIDAS DE VARIABILIDADE.

Embora existam várias medidas de variabilidade, vamos ocupar-nos de apenas duas:

VARIÂNCIA e DESVIO PADRÃO.

Imagine-se dois conjuntos (A e B) de atiradores.

Os números nos quadros abaixo, dão os acertos de cada atirador, os totais de acertos

e o número de atiradores de cada conjunto.

CONJUNTO A 8, 9, 10, 8, 6, 11, 7, 13

TOTAL DE ACERTOS: 72

TOTAL DE ATIRADORES: 8

CONJUNTO B 7, 3, 10, 6, 5, 13, 18, 10

TOTAL DE ACERTOS: 72

TOTAL DE ATIRADORES: 8

Pode-se fazer a seguinte pergunta: qual dos grupos de atiradores é mais estável? Ou,

em qual dos grupos a variação entre os desempenhos é menor?

Recorrer à média aritmética de acertos NÃO RESOLVE o problema (em ambos os

casos x A = x B = 9 acertos); concluir que os conjuntos são igualmente estáveis também não

dá, pois no CONJUNTO A os acertos variam de 6 a 13, portanto a amplitude total de variação

é 13 – 6 = 7; e no CONJUNTO B os acertos variam de 3 a 18, portanto a amplitude total de

variação é 18 – 3 = 15 acertos. Para dizer que algo variou, precisamos de um ponto de

48

referência. E esse ponto vai ser a média aritmética de cada conjunto (média que, por

coincidência, é igual em A e B).

DADOS NÃO AGRUPADOS

VARIÂNCIA (s2)

S2 =

1

2)(

n

XXi

EXEMPLO

1) Calcular a variância do exemplo dos atiradores;

Para fugir dessa unidade de medida tão embaraçosa, vamos extrair a RAIZ

QUADRADA positiva dessas variâncias.

O resultado é uma nova medida: o DESVIO PADRÃO que tem a vantagem de vir

expresso em uma unidade de medida linear.

DESVIO PADRÃO (s) – é a medida de dispersão mais utilizada. Trata-se da medida da

oscilação dos valores de uma série em torno da média. O desvio padrão é indicado pela letra

S, para dados amostrais e por , para dados populacionais. Convencionalmente, para efeito

de cálculos, consideraremos populacional se n > 30.

S =

1

2

n

XX =

n

XX 2

EXEMPLO

1) Calcular o dp do exemplo;

Essas fórmulas lembram médias. De fato, pode-se interpretar o desvio padrão como

uma média capaz de medir variação.

49

ATENÇÃO

Quanto maior a variância, maior a heterogeneidade entre os elementos de um

conjunto.

Quanto maior a variância, maior o correspondente desvio padrão.

INTERPRETAÇÃO DO DESVIO PADRÃO

O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão.

É fundamental que o interessado consiga relacionar o valor obtido do desvio padrão

com os dados da série.

Quando uma curva de freqüência representativa da série é perfeitamente simétrica,

podemos afirmar que o intervalo [ X - ; X - ] contém aproximadamente 68% dos

valores da série.

O intervalo [ X - 2 ; X - 2 ] contém aproximadamente 95% dos valores da série.

E o intervalo [ X - 3 ; X - 3 ] conte aproximadamente 99% dos valores da série.

Estes percentuais vão ser mais tarde comprovados, no estudo da Distribuição Normal

de Probabilidade.

Para a compreensão inicial do desvio padrão, estas noções são suficientes.

QUESTÕES TEÓRICAS

1) Indique três medidas de tendência central.

2) Em que condições são iguais a média e a mediana de uma distribuição?

3) Quando a mediana é melhor do que a média como a medida do valor típico em um grupo?

4) Ante a entrada súbita de elementos muito altos em uma população, o que ocorreria com a

média? Com a mediana? E com a variância?

1) Calcule o desvio padrão dos números:

a) 9, 9, 9, 9, 9, 9, 9

b) 12, 10, 20, 13, 15

50

2) Calcule o desvio padrão dos seguintes dados de pesos em quilogramas de 2 grupos (A

e B) de alunos, dizendo ainda com base nesse cálculo, qual o grupo mais homogêneo

(menos disperso)?

Grupo A: 43, 45, 52, 54, 56

Grupo B: 46, 53, 58, 60, 66

3) Calcule a variância das distribuições onde os desvios padrões são:

a) 8,9 kg

b) 6,2 kg

4) Calcule o coeficiente de variação dos números:

a) 3, 7, 2, 4, 8, 3

b) 16, 16, 16, 16, 16

5) A regional da Receita Federal efetuou um levantamento nas declarações das cidades A

e B e constatou:

Cidade A: X = R$ 27000 S = R$ 1500

Cidade B: X = R$ 32000 S = R$ 1700

Determine a cidade com menor dispersão.

6) Numa empresa, o salário médio dos homens é R$ 2000,00 com S = R$ 750,00 e o das

mulheres é em média R$ 1500,00 e S = R$ 600,00. Determine que classe possui maior

dispersão.

7) O fornecedor “A” de parafusos enviou ao departamento de compras de uma empresa,

uma amostra de 2000 parafusos, variando entre 101 e 113 mm. O departamento de

compras efetuou uma análise e encontrou X = 107,9 mm e S = 2,72mm. O fornecedor

“B” apresentou um lote deste mesmo parafuso com X = 108 mm e S = 1,08 mm, qual

o lote que você escolheria se fosse o comprador? Justifique.

8) A série a, b, c, d tem média 100 kg e variância 200 kg. Se todos os elementos da série

forem multiplicados por 10, qual o valor da média, do desvio padrão e da variância de

nova série?

51

MÓDULO V

A UTILIZAÇÃO DE

PLANILHAS ELETRÔNICAS

PARA ANÁLISE ESTATÍSTICA

Tela com gráfico - Excel

52

Desde o advento da revolução da informática, textos estatísticos vêm despendendo

esforços para alcançar a maneira apropriada de incorporar o uso de pacotes de software para a

estatística. Um dilema envolvendo o ensino desse curso na faculdade é de que modo os

estudantes poderiam ter acesso (frequentemente através de licenças de uso e versões para

alunos) ao software estatístico selecionado e como esses pacotes poderiam ser utilizados no

curso. Geralmente , os estudantes não estão familiarizados com esses pacotes antes do curso

de estatística, e somente um número limitado pode utilizá-los nos cursos subsequentes. Assim

sendo, os estudantes podem vê-los apenas como mais um obstáculo a ser ultrapassado durante

o curso de estatística.

No entanto, nos últimos anos, com o crescimento da funcionalidade e do poder dos

aplicativos de planilhas de cálculo, praticamente todos os tipos de análise estatística ensinados

num curso introdutório têm o suporte direto de planilhas eletrônicas, gratuitamente

disponibilizadas por instituições de ensino superiores, disponível para uma variedade de

diferentes sistemas incluindo Windows e Macintosh. Além de seu possível uso num curso de

estatística, os alunos constantemente aprendem os fundamentos de uma aplicação de planilha

de cálculo em um curso de sistemas de computação, e então utilizam as planilhas em cursos

de contabilidade, finanças e outras áreas de administração. Tendo em vista que a habilidade

em aplicações de planilhas de cálculo dos alunos principiantes efetivamente varia, e como a

disponibilidade de computadores na escola e em casa é geralmente limitada, a demonstração

das planilhas pode ser incorporada através do ensino em laboratórios escolares..

Planilhas eletrônicas

53

UNIDADE II

INVESTIGAÇÃO

ESTATÍSTICA

54

MÓDULO I

CONTEÚDOS E

OBJETIVOS A SEREM

TRABALHADOS

55

A introdução do computador, no ambiente escolar, é hoje uma necessidade para o

crescimento de uma pedagogia inovadora, assentada na capacidade de educadores propensos a

didáticas renovadoras. E a importância do papel do educador neste processo informatizado

está em se conscientizar de que se ele não se colocar dentro de seu tempo e caminhar em

direção ao desenvolvimento ficará muito difícil gerar um atuação docente de qualidade.O

educador tem que estar consciente de que a tecnologia computadorizada não se resume em

teclado, mouse, CPU e software, mas sim em saber empregá-los numa realidade existencial.É

preciso existir uma aliança na utilização de novas tecnologias, buscando a possibilidade de

criar e transformar conhecimentos estimulando a comunicação entre as pessoas e visando a

expansão da autonomia pessoal nos processos de aprendizado. O uso destas tecnologias irá

mudar o enfoque do processo escolar para o qual os usuários tenham um conhecimento

intelectual e profissional de acordo com seus objetivos.

Após o ensino dos conteúdos estatísticos teóricos básicos e ensino de utilização de

planilhas no laboratório de informática, elaborar-se-á um trabalho de pesquisa com os alunos

que além de promover o ensino de estatística através de um trabalho prático busca

desenvolver um método de ensino com auxilio da tecnologia da informática, disponível nas

escolas.

Para essa pesquisa, haverá a elaboração e aplicação de questionários, que serão

respondidos pelos alunos, após análise das reservas florestais existentes em cada propriedade

rural onde o mesmo resida ou com a qual tenha contato. Neste questionário serão obtidas

diversas informações, dentre elas diâmetro dos caules das árvores, as quais subsidiarão todo

o estudo envolvido. Assim o discente verificará, na prática, os conceitos estatísticos

anteriormente revisados além de aprender a organizar os dados em tabelas. A primeira parte

do trabalho, será através uma investigação estatística com as características abaixo.

56

INVESTIGAÇÃO ESTATÍSTICA

1. CONTEÚDOS A SEREM TRABALHADOS:

Conhecimentos básicos de Estatística: Distinção entre população e amostra; técnica de coleta

de dados; cálculo de média, mediana, moda, variância e desvio padrão; construção de gráficos

estatísticos; análise e interpretação dos resultados.

2. OBJETIVO GERAL:

Por meio de observação em uma área rural, de sua propriedade ou da vizinhança, aplicar os

conceitos básicos de Estatística, a partir da obtenção dos diâmetros dos caules de árvores.

2.1. OBJETIVOS ESPECÍFICOS:

- Aplicar os conhecimentos básicos de Estatística verificados em sala de aula: população e

amostra; técnica de coleta de dados; cálculo de média, mediana, moda, variância e desvio

padrão; construção de gráficos estatísticos; análise e interpretação dos resultados;

- Possibilitar a interdisciplinaridade com conteúdos de diferentes disciplinas.

3. PÚBLICO ALVO:

Alunos do CEEBJA-Pitanga

4. SEQUÊNCIA DIDÁTICA DA ATIVIDADE:

Após o ensino dos conteúdos básicos de estatística , promover-se-á uma reunião com o

grupo de estudantes para apresentação dos objetivos do trabalho e os dados a serem obtidos;

identificação de um local onde serão coletados os dados a serem trabalhados estatisticamente

e realização da coleta de dados. Estes dados deverão ser obtidos aleatoriamente por meio de

uma amostra de 40 árvores existentes no local, onde serão coletados dos dados do “Diâmetro

à Altura do Peito – DAP”. (*DAP: Diâmetro à Altura do Peito, convencionado como o

diâmetro do tronco a 1,3 m de altura.). Para a anotação destes dados, os alunos preencherão a

seguinte planilha:

57

NOME: ....................................................................................................

LOCAL DO EXPERIMENTO:................................................................

DATA: .....................................................................................................

MEDIDAS DOS DIÂMETROS DAS ARVORES (DAP)-cm

5. RECURSOS DIDÁTICOS:

Lápis, caneta, borracha, calculadora,fita métrica, máquina fotográfica, quadro branco, pincel,

planilhas eletrônicas e computador.

6. HABILIDADES TRABALHADAS:

Utilizar-se das linguagens como meio de expressão, comunicação e informação; inter-

relacionar pensamentos, idéias e conceitos ;desenvolver o pensamento crítico e flexível e a

58

autonomia intelectual; adquirir, organizar, avaliar e transmitir informações; entender e

ampliar fundamentos e conceitos científicos e tecnológicos; desenvolver a criatividade e a

responsabilidade.

7 . RESULTADOS ESPERADOS.

A partir dos dados obtidos dos Diâmetros à Altura do Peito (DAPs) de uma amostra de

vegetação existente, os alunos serão capazes de aplicar os conhecimentos básicos de

Estatística. Para isso cada aluno preencherá uma planilha eletrônica, similar a disposta na

pagina 59, e através dela e dos aplicativos gráficos aplicará alguns conceitos estatísticos, que

compreendem:

a) Diferenciar População e Amostra;

b) Aplicar a técnica de coleta de dados aleatória;

c) Organizar os dados;

d) Organizar os dados em tabelas de distribuição de freqüências;

e) Aplicar os conceitos de medidas de tendência central (Média Aritmética, Mediana e Moda)

e de medidas de dispersão (Variância e Desvio padrão);

f) Representar graficamente dos dados obtidos;

g) Analisar e interpretar os dados obtidos.

h) Concluir os resultados obtidos, fazendo projeções e perspectivas em relação ao ambiente

estudado.

59

MÓDULO II

RECURSOS,

HABILIDADES E

INTERPRETAÇÃO DE

RESULTADOS COM A

UTILIZAÇÃO DE

PLANILHAS

60

A seguinte tabela será preenchida sob a forma de planilha eletrônica e contribuirá para o

entendimento prático de conceitos estatísticos.licativos computacionais livres, que

disponibilizam a elaboração de planilhas e gráficos, permitindo o tratamento da informação na

sua plenitude.

Cada aluno fará uma análise em intervalos de classe:

a)Monte uma tabela, considerando uma variável contínua, com as características

abaixo:

Classes Intervalo

DAP

(cm)

Ponto

Médio

(xi)

Frequência

(fi)

Cálculo

x= xi.fi

Média

fi

xx

Cálculos Acessórios Desvio

Padrão

1

)( 2

fi

xxifis

xxi

2xxi fi .(xi - x )

1

2

3

4

5

6

Soma

2

61

CONSIDERAÇÕES FINAIS

Muitos foram os desafios para a produção deste trabalho. No entanto a expectativa

quanto os resultados, deu – nos forças para que continuássemos.

Ao final dos estudos realizados para a construção desse caderno pedagógico,

percebem-se os grandes desafios que os profissionais educadores da área de ciências terão que

enfrentar.

O domínio apenas dos conceitos matemáticos e estatísticos, não são suficientes para o

ensino das ciências: eles são necessários pois demandam a utilização das tecnologias

atualmente disponíveis para que o aluno possa vivenciar a sua real necessidade.

62

REFERÊNCIAS BIBLIOGRÁFICAS

BARBETTA, Pedro Alberto. Estatística Aplicada às Ciências Sociais. UFSC, 2002.

GONCALVES, Fernando Antonio. Estatística Descritiva. ATLAS, 1977.

LEVINE, David M.; BERENSON, Mark L.; STEPHAN, David. Estatística: Teoria e

Aplicações. LTC, 2000.

MARTINS, Gilberto de Andrade. Princípios de Estatística. ATLAS, 1983.

TOLEDO, Geraldo Luciano. Estatística Básica. ATLAS, 1988.

63

LISTA DE ANEXOS

Anexo I

Slides de apresentação de conteúdos estatísticos da unidade I .................... 64

Slides de apresentação da unidade II ............................................................. 70

64

Slides 1 – 8 Unidade I

1

6

4 3

2

8

65

Slides 9 – 16 Unidade I

7 1

5

9 10

11 12

16 15

14 13

66

Slides 17 – 24 Unidade I

17

24 23

22 21

20 19

18

67

Slides 25 – 32 Unidade I

25

27

32 31

30 29

28

26

68

Slides 33 – 40 Unidade I

33

37

36 35

34

40

38

39

69

Slides 41 – 43 Unidade I

41

43

42

70

Slides 1 – 6 Unidade II

1 2

6 5

4 3

71

Slides 7 – 13 Unidade II

7

12 11

10 9

8

13