Buscar

Apostila -1

Prévia do material em texto

1
ESTATÍSTICA APLICADA
ESTATÍSTICA APLICADA
Graduação
2
ESTATÍSTICA APLICADA
© Departamento de Ensino a Distância - Universidade Salgado de Oliveira
Todos os direitos reservados. Nenhuma parte desta publicação pode ser reproduzida, arquivada ou transmitida de nenhuma forma ou por nenhum meio sem
permissão expressa e por escrito da Associação Salgado de Oliveira de Educação e Cultura, mantenedora da Universidade Salgado de Oliveira
(UNIVERSO).
A 923 e AUGUSTO, Adriana Santos.
Estatística. / Adriana Santos
 Augusto. Edição revisada por Simara da
 Costa Guimarães. São Gonçalo, RJ: EaD/
 UNIVERSO, 2007.
 108 p. 21,0 X 28,0 cm.
 1. Estatística. I. Título.
CDD 519.5
DIREÇÃO SUPERIOR
Chanceler Joaquim de Oliveira
Reitora Marlene Salgado de Oliveira
Pró-Reitor de Planejamento e Finanças Wellington Salgado de Oliveira
Pró-Reitor de Organização e Desenvolvimento Jefferson Salgado de Oliveira
Pró-Reitor Administrativo Wallace Salgado de Oliveira
Pró-Reitora Acadêmica Jaina dos Santos Mello Ferreira
Pró-Reitor de Extensão Manuel de Souza Esteves
Pró-Reitor de Pós-Graduação e Pesquisa Marcio Barros Dutra
Pró-Reitor de Graduação Tecnológica Marcílio Ribeiro Borges
DEPARTAMENTO DE ENSINO A DISTÂNCIA
Diretora Claudia Antunes Ruas Guimarães
FICHA TÉCNICA
Texto: Adriana Santos Augusto
Revisão: Lívia Antunes Maria Faria e Walter P. Valverde Júnior
Projeto Gráfico e Editoração: Antonia da Silva Machado
Supervisão de Materiais Instrucionais: Janaina Gonçalves de Jesus
Ilustração: Daniel Mattos
Capa: Willian José Mendes da Silva
Supervisão: Ademir Nunes Corrêa
Impressão: Departamento Gráfico
Tiragem: 500 exemplares
Coordenação Geral:
Departamento de Ensino a Distância
Rua Marechal Deodoro 217, Centro, Niterói, RJ, CEP 24020-420
ead@universo.edu.br
www.universo.edu.br
3
ESTATÍSTICA APLICADA
APRESENTAÇÃO
Você acaba de receber o Livro de Estudo da disciplina Estatística Aplicada.
Este livro foi elaborado página a página pensando em você e nas suas necessidades. Por isso,
leia-o sempre e reflita sobre cada assunto. O estudo constante lhe garantirá maior segurança e
aprendizado.
Não esqueça de se organizar! Reserve um horário para leituras complementares, fazer seus
exercícios, garantindo assim um ótimo desempenho.
Desejamos que você tenha um excelente estudo e alcance o sucesso!
4
ESTATÍSTICA APLICADA
5
ESTATÍSTICA APLICADA
PALAVRA DA REITORA
Acompanhando as necessidades de um mundo cada vez mais complexo, exigente e
necessitado de aprendizagem contínua, a Universidade Salgado de Oliveira (UNIVERSO) apresenta a
UNIVERSO Virtual, que reúne os diferentes segmentos do ensino a distância na universidade. Nosso
programa foi desenvolvido segundo as diretrizes do MEC e baseado em experiências do gênero bem-
sucedidas mundialmente.
São inúmeras as vantagens de se estudar a distância e somente por meio dessa modalidade de
ensino são sanadas as dificuldades de tempo e espaço presentes nos dias de hoje. O aluno tem a
possibilidade de administrar seu próprio tempo e gerenciar seu estudo de acordo com sua disponibilidade,
tornando-se responsável pela própria aprendizagem.
O ensino a distância complementa os estudos presenciais à medida que permite que alunos e
professores, fisicamente distanciados, possam estar a todo momento ligados por ferramentas de interação
presentes na Internet através de nossa plataforma.
Além disso, nosso material didático foi desenvolvido por professores especializados nessa
modalidade de ensino, em que a clareza e objetividade são fundamentais para a perfeita compreensão
dos conteúdos.
A UNIVERSO tem uma história de sucesso no que diz respeito à educação a distância. Nossa
experiência nos remete ao final da década de 80, com o bem-sucedido projeto Novo Saber. Hoje, oferece
uma estrutura em constante processo de atualização, ampliando as possibilidades de acesso a cursos
de atualização, graduação ou pós-graduação.
Reafirmando seu compromisso com a excelência no ensino e compartilhando as novas tendências em
educação, a UNIVERSO convida seu alunado a conhecer o programa e usufruir das vantagens que o
estudar a distância proporciona.
Seja bem-vindo à UNIVERSO Virtual!
Professora Marlene Salgado de Oliveira
Reitora
6
ESTATÍSTICA APLICADA
7
ESTATÍSTICA APLICADA
SUMÁRIO
1. Apresentação da disciplina. ..................................................................................... 09
2. Plano da disciplina. ................................................................................................. 11
3. Unidade 1 - Elementos da estatística descritiva. ....................................................... 13
4. Unidade 2 - Representação gráfica........................................................................... 33
5. Unidade 3 - Medidas de tendência central. ............................................................... 39
6. Unidade 4 - Medidas de dispersão. .......................................................................... 49
7. Unidade 5 - Noções de amostragem. ........................................................................ 57
8. Unidade 6 - Cálculo das probabilidades. ................................................................... 65
9. Unidade 7 - Distribuição de probabilidade. ................................................................ 73
10. Unidade 8 - Correlação e regressão. ........................................................................ 83
11. Considerações finais ............................................................................................... 95
12. Conhecendo o autor ............................................................................................... 97
13. Referências ............................................................................................................ 99
14. Anexos ................................................................................................................... 101
8
ESTATÍSTICA APLICADA
ESTATÍSTICA APLICADA
9
APRESENTAÇÃO DA DISCIPLINA
Caro aluno,
Seja bem-vindo à disciplina Estatística Aplicada.
Muitos falam em estatística, mas poucos sabem o que é e para que ela serve. A estatística é um
ramo da matemática aplicada que desempenha um papel fundamental para a compreensão da realidade.
Ela nos fornece métodos para coleta, organização, análise e interpretação de dados para posterior
utilização dos mesmos em tomada de decisões.
Na Antigüidade, assim como hoje, os povos mantinham um registro permanente do número de
habitantes, nascimentos e óbitos. O que faziam ainda não tinha nome. A palavra ESTATÍSTICA surgiu na
Idade Média, quando as informações eram tabuladas com finalidades bélicas e tributárias, ou seja, sua
importância maior era servir ao Estado, daí o nome.
A estatística será de grande utilidade para você, pois é uma ferramenta indispensável não só nos
negócios, mas em todas as ciências, afinal de contas, você poderia imaginar o mundo de hoje sem
registros numéricos? Já se deu conta da facilidade com que “projetamos” o futuro muito antes de ele
acontecer? E isso acontece em todos os ramos da nossa vida.
Assim, desejamos que você realize um ótimo estudo e, lembre-se: a aprendizagem é infinita!
Utilize nossas referências bibliográficas para aprofundar e engrandecer seus conhecimentos sobre os
assuntos aqui estudados, pois isso lhe acrescentará muito, não só como aluno, mas também como
profissional e cidadão.
Tenha um excelente estudo! Sucesso!
10
ESTATÍSTICA APLICADA
11
ESTATÍSTICA APLICADA
PLANO DA DISCIPLINA
A disciplina Estatística possui objetivos próprios no que diz respeito ao processo ensino-
aprendizagem, desenvolvendo competências e habilidades necessárias à formação de futuros
profissionais que atuarão na sociedade contemporânea. São objetivos gerais da disciplina: capacitar o
aluno para o uso da metodologia estatística mediante aplicação de técnicas de análise estatística de
dados, deprojeção e metodologia de tomada de decisão; utilizar os conceitos e o conteúdo prático dos
Métodos Quantitativos aplicados para o desenvolvimento de trabalhos pedagógico-científicos e
proporcionar melhor aplicabilidade interdisciplinar durante o exercício do curso.
O conteúdo programático foi divido em oito unidades que abordarão desde os Elementos da
Estatística Descritiva até a Correlação e Regressão.
Seguiremos, agora com a apresentação de cada unidade:
Unidade 1 – Elementos da Estatística Descritiva
Objetivo: identificar conceitos básicos da disciplina; compreender o que é exatamente a estatística e
para que ela serve; interpretar um levantamento estatístico; conhecer as séries estatísticas; trabalhar
os dados estatístico através da montagem de uma distribuição de freqüências.
Unidade 2 – Representação Gráfica
Objetivo: construir e analisar os gráficos que você tanto conhece e que fazem parte da sua vida
cotidiana.
Unidade 3 – Medidas de Tendência Central
Objetivo: compreender as medidas de tendência central e calculá-las para dados não agrupados e
dados agrupados em classes de freqüências.
Unidade 4 - Medidas de Disperção
Objetivo: compreender as medidas de dispersão, calcular essas medidas para dados não agrupados
e dados agrupados em classes de freqüências.
Unidade 5 - Noções de Amostragem
Objetivo: conhecer mais sobre o cálculo e os tipos de amostra e os métodos probabilísticos.
Unidade 6 - Cálculo das Probabilidades
Objetivo: caracterizar os experimentos aleatórios; calcular as possibilidades de acontecimento de tais
experimentos, a chance de um evento ocorrer ou não, ou seja, a probabilidade de sucesso ou insucesso.
Unidade 7- Distribuição de Probabilidade
Objetivo: identificar e calcular problemas relacionados à contagem – Distribuição Binomial; identificar e
calcular problemas relacionados a espaços amostrais contínuos e às variáveis contínuas – Distribuição
Normal.
Unidade 8 – Correlação e Regressão
Objetivo: ajustar uma reta a um conjunto de dados e determinar a equação da reta que constitui o
melhor ajuste; calcular e classificar o grau de correlação existente entre duas variáveis.
12
ESTATÍSTICA APLICADA
ESTATÍSTICA APLICADA
13
U
N
ID
A
D
E
 1
ELEMENTOS DA ESTATÍSTICA
DESCRITIVA
Nesta primeira unidade, estudaremos o que é o método estatístico,
bem como as suas fases. Aprenderemos as definições de variável, população
e amostra, assim como algumas técnicas para o cálculo de uma amostra.
Também iremos estudar as séries estatísticas e a distribuição de freqüências.
OBJETIVOS DA UNIDADE:
• Identificar conceitos básicos da disciplina.
• Compreender o que é exatamente a estatística e para que ela
serve.
• Interpretar um levantamento estatístico.
• Conhecer as séries estatísticas.
• Trabalhar os dados estatístico através da montagem de uma
distribuição de freqüências.
PLANO DA UNIDADE:
• Conceitos básicos da Estatística.
• Séries estatísticas.
• Distribuição de freqüências.
Bem-vindo à primeira unidade de estudo
UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA
14
CONCEITOS BÁSICOS
Estatísticas são feitas todos os dias em jornais e revistas, algumas vezes
por órgãos que não conhecemos e que não sabemos se são confiáveis ou
não. O dia-a-dia de um cidadão está cheio de “armadilhas”
espalhadas na mídia de modo a levá-lo a percorrer caminhos
nem sempre corretos. Para não cair nessas “armadilhas”, a
primeira coisa que devemos saber é distinguir os dois tipos
de estatística - a que envolve a contagem pura e simples,
como o censo da população, feito de tempos em tempos pelo
IBGE e a calculada por amostragem, como, por exemplo, as
pesquisas sobre a intenção de voto.
A decisão quanto à metodologia a ser utilizada, se
recenseamento ou amostra, vai depender principalmente dos
custos e do tempo para apuração dos dados. É óbvio que o
ideal seria consultar toda a população, porém isso custa caro e nem sempre
os recursos existentes são suficientes para isso. Por isso, normalmente utiliza-
se a pesquisa amostral.
Deve-se saber também que há algumas regras básicas empregadas na
“contabilidade” e na generalização dos dados obtidos.
A coleta, a organização, a descrição, o cálculo, a análise e interpretação
dos coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto que a
análise e a interpretação dos dados amostrais, associado a uma margem de
incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, que
se fundamenta na teoria da probabilidade e é muito útil na análise de jogos,
entre outros. Por exemplo, não é preciso provar todas as caixas de bombom
produzidas numa fábrica para se saber se o chocolate é bom. A amostragem
nos permite mensurar o que queremos apenas sobre uma parcela pequena
de determinada “população”, denominada amostra e utilizar essa informação
para fazer inferência sobre toda a população.
Método Estatístico
Método: é o meio mais eficaz para atingir determinada meta. Dos métodos
científicos destacamos o método experimental e o método estatístico.
• Método Experimental: consiste em manter constante todas as
causas, menos uma, que sofre variação para se observar seus
efeitos, caso existam. Ex: Estudos da Química, Física, etc. Em
laboratório é fácil mantermos constantes, por exemplo, a pressão
e variarmos a temperatura para estudar o efeito dessa variação .
• Método Estatístico: diante da impossibilidade de manter as causas
constantes, admitem todas essas causas presentes variando-as,
registrando essas variações e procurando determinar, no resultado
final, que influências cabem a cada uma delas. Ex.: Quais as causas
que definem o preço de uma mercadoria quando a sua oferta
diminui? É um método muito usado nas ciências sociais, pois seria
impossível, no momento da pesquisa, manter constantes a
ESTATÍSTICA APLICADA
15
uniformidade dos salários, o gosto dos consumidores, nível geral
de preços de outros produtos, etc.
Fases do Método Estatístico
• Definição do Problema
O que exatamente se pretende pesquisar? Ou seja, é preciso definir
corretamente o problema.
• Planejamento
Como levantar informações? Que dados deverão ser obtidos? Qual
levantamento a ser utilizado? Censo? Amostragem? Qual é o cronograma de
atividades? Quais são os custos envolvidos no processo?
• Coleta
É o registro de dados com um objetivo determinado. A coleta de dados
pode ser Direta ou Indireta.
• Coleta Direta: é feita pelo próprio pesquisador (censo)
ou através de registros permanentes quando é obtida
diretamente da fonte. Ex: empresa que realiza uma pesquisa
para saber a preferência dos consumidores pela sua marca.
A coleta direta de dados pode ser classificada quanto ao fator
tempo em contínua, periódica ou ocasional.
• Coleta Contínua: quando é feita continuamente. Ex.:
registros de nascimento, óbitos, casamentos;
• Coleta Periódica: quando é feita em intervalos
constantes de tempo. Ex.: censo (de 10 em 10
anos);
• Coleta Ocasional: quando é feita a fim de atender
a uma emergência. Ex.: coleta de dados
epidemiológicos.
• Coleta Indireta: é feita por deduções a partir de dados
que são conhecidos, conseguidos pela coleta direta, por
analogia, por avaliação, indícios ou proporcionalização.
Quanto aos dados coletados, ou seja, a matéria-prima sobre
a qual iremos aplicar os métodos estatísticos, eles podem
ser primários ou secundários.
• Dados primários:quando são publicados pela
própria pessoa ou organização que os haja
recolhido. Ex: tabelas do censo demográfico do IBGE.
• Dados secundários: quando são publicados por
outra organização.
UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA
16
Quando determinado jornal publica estatísticas referentes ao censo
demográfico extraídas do IBGE.
Trabalhar com fontes primárias é sempre mais seguro!
• Crítica
Os dados coletados devem ser cuidadosamente criticados para evitar
erros que possam vir a alterar os resultados. Ex.: numa pesquisa feita numa
academia perguntou-se o peso dos atletas. Resposta: 765 kg.É
obvio que houve algum tipo de erro na coleta do dado, este
deve ser, então, descartado.
• Apuração
É a organização dos dados obtidos na coleta, através de
sua contagem e agrupamento.
• Apresentação dos Dados
Há duas formas de apresentação. A apresentação tabular
segundo regras práticas fixadas pelo Conselho Nacional de
Estatística e a apresentação gráfica dos dados. Uma não exclui a outra.
• Análise dos Resultados
Esta é a última fase do método estatístico. Refere-se ao cálculo de medidas
e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística
descritiva).
Nesta etapa obteremos conclusões sobre o todo (população), a partir das
informações fornecidas pela parte que representa o todo (amostra).
População ou Universo Estatístico
É o conjunto total de elementos portadores de pelo menos uma característica
em comum. Ex.: o universo dos alunos de uma escola.
Variáveis
Variável é o conjunto de resultados possíveis de um fenômeno. Ex.: sexo,
cor da pele, idade...Pode ser classificada de variável quantitativa ou variável
qualitativa.
• Variável Qualitativa: quando seu valores são expressos por atributos:
sexo, cor da pele,etc.
• Variável Quantitativa: quando os dados são de caráter quantitativo,
e o conjunto dos resultados possui uma estrutura numérica, se divide
em variável discreta e variável contínua.
• Variável Discreta ou Descontínua: seus valores são
expressos geralmente através de números inteiros não-
negativos. Resulta normalmente de contagens. Ex: número
de filhos de um casal - pode assumir valores como 0; 1; 2;
3;..., mas nunca valores como: 1,5; 3,72; etc.
EXEMPLIFICANDO
ESTATÍSTICA APLICADA
17
• Variável Contínua: pode assumir qualquer valor entre
dois limites, ou seja, assume valores em um intervalo
real. Resulta normalmente de uma mensuração, ou seja,
podem assumir, teoricamente, qualquer valor entre dois
limites. Ex.: temperatura. Normalmente as medições dão
origem a variáveis contínuas e as contagens a variáveis
discretas.
Amostragem
Amostra é uma parcela representativa da população que é
examinada com o propósito de tirarmos conclusões sobre essa
população. É um subconjunto finito de uma população. Uma
amostra deve ser cuidadosamente planejada a fim de garantir
a menor margem de erro na pesquisa. A margem de erro é um
intervalo controlado dentro do qual podem variar os resultados
finais. Nenhum levantamento estatístico feito por amostragem
é perfeito, ou melhor dizendo, um estudo bem planejado não
elimina o erro, apenas o limita.
Para selecionar uma amostra é preciso levar em conta as
características de distribuição física da população, ou seja,
algumas áreas têm uma população maior que outras. É preciso levantar os
dados em proporção à densidade populacional das regiões. Por exemplo, se o
objeto de estudo é o tipo de programa de TV mais assistido, não adianta fazer
o estudo apenas em uma turma de escola de educação infantil, pois o resultado
obviamente seria desenho animado. Crianças não costumam assistir a
telejornais ou a filmes da madrugada. Se a pesquisa fosse feita dessa forma,
o resultado não estaria correto.
Assim, no caso de uma população ser composta de 35% de crianças,
40% de adultos e os outros 25% de idosos, uma amostra dessa população
também deve conter crianças, adultos e idosos na mesma proporção.
Amostragem Casual ou Aleatória Simples
É o processo mais utilizado. Equivale a um sorteio lotérico.
Pode ser realizada da seguinte forma: numera-se a população
de 1 a n e sorteando-se, a seguir, por meio de um dispositivo
aleatório qualquer, n números dessa seqüência, que
corresponderão aos elementos
pertencentes da amostra.
 Obter uma amostra de 10% dos 580
alunos de uma escola:
1º - numeramos os alunos de 1 a 580.
2º - escrevemos os números dos alunos de 1 a 580 em pedaços
iguais de papel, colocamos na urna e após mistura, retiramos, um a um,
cinqüenta e oito números que formarão a amostra.
Quando o número de elementos da amostra é muito grande como neste
caso, esse tipo de sorteio é muito trabalhoso. Então, utiliza-se uma tabela
de números aleatórios, construída de modo que os algarismos de 0 a 9 são
distribuídos ao acaso nas linhas e colunas.
EXEMPLIFICANDO
UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA
18
Amostragem Proporcional Estratificada:
Quando a população se divide em estratos (subconjuntos da
população), é imprescindível que o sorteio dos elementos da amostra leve
em consideração tais estratos, daí obtemos os elementos da amostra
proporcional ao número de elementos desses estratos.
Vamos obter uma amostra proporcional estratificada, de 10%, dos
pacientes internados em um SPA. Supondo que sejam 106 mulheres e 54
homens. São, portanto, dois estratos (sexo masculino e sexo feminino). Logo,
temos:
Numeramos, então, os pacientes de 01 a 160, sendo 01 a 54 homens
e 55 a 160, mulheres e procedemos o sorteio casual com urna ou tabela de
números aleatórios, que será vista na unidade VII.
No caso da tabela acima, estamos selecionando uma amostra
composta por pessoas, portanto não podemos selecionar 5,4 pessoas do
sexo masculino. Devemos, então, “arredondar” o número 5,4 para um
número inteiro, ou seja, 5.
Dúvidas no arredondamento?
Existem duas formas de representar um número quando não podemos
representá-lo com todos os seus dígitos, o truncamento e o arredondamento.
O truncamento - Truncar um número é “quebrá-lo” de acordo com o
número de dígitos que queremos representar.
Representar os números abaixo com apenas dois dígitos.
27,283 27
27,575 27
27,897 27
Em todos os casos o número será representado da mesma forma, não
importando o tamanho do erro.
EXEMPLIFICANDO
EXEMPLIFICANDO
Erro- Toda vez que um nú-
mero não é representado
com todos os seus algaris-
mos, estamos cometendo um
erro. Por exemplo: ao apro-
ximarmos o número 2,7 para
3 estamos aumentando esse
número em 0,3 (erro!), ou
então, ao aproximarmos o
número 2,2 para 2 estamos
diminuindo esse número em
0,2 (erro!). O erro cometido
deve ser o menor possível!!!
ESTATÍSTICA APLICADA
19
Arredondamento - Para arredondar um número, devemos seguir a
seguinte regra: Observe o primeiro algarismo que será “descartado”. Se
esse algarismo for 0, 1, 2, 3 ou 4 mantemos a mesma ordem. Se esse
algarismo for 5, 6, 7, 8 ou 9, aumentamos a ordem em 1.
Arredondar os números abaixo para duas casas decimais.
2,232 2,23
2,235 2,24
Amostragem Sistemática:
Quando os elementos da população já se acham ordenados, não há
necessidade de sorteio.
Suponhamos um prédio com
200 apartamentos, dos quais
desejamos obter uma amostra
formada por 20 apartamentos para uma pesquisa de
opinião. Podemos, neste caso, usar o seguinte
procedimento: como 200/20 = 10, escolhemos por
sorteio casual um número de 01 a 10, o qual indicaria
o primeiro elemento sorteado para a amostra; os
demais elementos seriam periodicamente considerados
de 10 em 10. Assim, suponhamos que o número
sorteado fosse 6, a amostra seria: 6o apartamento,
16o apartamento, 26o apartamento, etc.
Até aqui, vimos como se faz um levantamento estatístico, o que é e
para que serve. Vimos ainda como é selecionada uma amostra e qual a
importância desta.
Veremos agora o que são séries estatísticas.
Vamos, então, passo a passo.
 Você sabe o que é uma tabela?
TABELA - É um quadro que resume um conjunto de observações
organizados segundo linhas e colunas.
Veja o exemplo de tabela abaixo:
EXEMPLIFICANDO
EXEMPLIFICANDO
UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA
20
Ex.: Equipamentos existentes, disponíveis ao SUS, por tipo, segundo
as grandes regiões – Brasil - 2002
• O lado direito e esquerdo de uma tabela oficial deve ser aberto.
• Na construção das tabelas, devemos colocar:
• um traço horizontal ( - ) quando o valor for zero;
• três pontos ( ... ) quando não tivermos os dados;
• zero ( 0 ) quando o valor for muito pequeno em relação à
unidade utilizada;
• um ponto de interrogação quando nãotivermos certeza quanto
à exatidão de determinado valor.
Agora que você já sabe o que é uma tabela e como construí-la vamos
conhecer as séries estatísticas.
SÉRIE ESTATÍSTICA
É uma tabela que apresenta um conjunto de dados estatísticos em
função da época, local ou espécie.
TIPOS DE SÉRIES ESTATÍSITICAS
SÉRIES HOMÓGRADAS
São as séries em que a variável estudada é discreta, ou seja, não
contínua. Pode ser temporal, geográfica ou específica.
Série Temporal: o que está em estudo é o fator tempo. O local e a espécie
são elementos fixos.
ARTE E COMÉRCIO LTDA
UNIDADES EXPORTADAS
Fonte: dados fictícios.
Série Geográfica: o que está em estudo é o fator geográfico. A época
e a espécie são elementos fixos.
ESTATÍSTICA APLICADA
21
ARTE E COMÉRCIO LTDA
UNIDADES EXPORTADAS – 2004
Fonte: dados fictícios.
Série Específica: a variável em estudo é o fator ou a espécie.
ARTE E COMÉRCIO LTDA
UNIDADES EXPORTADAS – 2004
Fonte: dados fictícios.
SÉRIES CONJUGADAS OU TABELAS DE DUPLA ENTRADA:
apresentam duas ou mais séries em uma mesma tabela, havendo duas ordens
de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma
série geográfica temporal.
ARTE E COMÉRCIO LTDA
UNIDADES EXPORTADAS
Fonte: dados fictícios.
Conhecidas as séries estatísticas, vamos estudar agora a distribuição
de freqüências, em que aprenderemos a organizar os dados coletados
através ou não da amostra, faremos também uma breve revisão de como
calcular porcentagem. Vamos em frente!
Mas, afinal, o que é uma distribuição de freqüências?
A distribuição de freqüências é um tipo de tabela que condensa uma
série de dados de acordo com a repetição de seus valores (freqüências).
UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA
22
1. Dados brutos ou Tabela primitiva
Trata-se de uma relação de elementos ou tabela que não foram
numericamente organizados. São os dados coletados sem nenhuma
arrumação. Apenas olhando para os números, é difícil ter uma idéia do
comportamento da amostra. Não sabemos, por exemplo, quem é o menor,
quem é o maior, quais são os números que mais se repetem, etc.
EX.: 25, 21, 22, 21, 22, 23, 24, 21 ,30, 26, 30, 26, 40, 34, 32, 38, 37, 38, 40, 31
2. ROL
Se olharmos no dicionário veremos como definição que o rol é a relação
obtida após a ordenação dos dados (crescente ou decrescente). Ordenando
os dados podemos ter uma idéia melhor do comportamento da amostra.
Percebemos, desta forma, os dados que mais se repetem, os que aparecem
menos, quem é o menor deles e quem é o maior, etc.
EX.: 21, 21, 21, 22, 22, 23, 24, 25, 26, 26, 30, 30, 31, 32, 34, 37, 38, 38, 40, 40
3. Os tipos de distribuição de freqüência
Distribuição de freqüência SEM INTERVALOS DE CLASSE
Essa distribuição é usada quando o número de dados diferentes que
aparecem é pequeno. Trata-se de uma simples condensação dos dados,
conforme as repetições de seu valores. No exemplo dado, ao invés de
escrevermos o número 21 três vezes, escrevemos apenas uma e indicamos
que ele se repete três vezes, ou seja, a freqüência do número 21 é igual a
três.
EX.:
Distribuição de Freqüência COM INTERVALOS DE CLASSE
Quando o tamanho da amostra é grande, com vários números
diferentes se repetindo, uma tabela de distribuição de freqüências como a
vista acima seria muito longa (comprida). Dessa forma, agrupamos os valores
em vários intervalos de classe, diminuindo o tamanho da tabela.
Tabela Primitiva
ESTATÍSTICA APLICADA
23
No exemplo dado, temos:
Como você já deve ter percebido, a Estatística utiliza alguns nomes
que talvez lhe sejam desconhecidos. Mas, a partir de agora, com certeza,
você os aprenderá. Afinal de contas, é para isto que estamos aqui: para
ensinar e também aprender!
NOMECLATURAS
CLASSE (i)
É cada um dos intervalos de variação da variável analisada. Ex.: na
tabela anterior, a 3ª classe, simbolizada por i = 3, varia de 29 até 33, ou
seja, (29 33). O símbolo significa intervalo aberto à direita e fechado à
esquerda, ou seja, nessa classe estão contidos os valores de 29 (inclusive)
até 33 (exclusive). Por exemplo, dado o número 33 do ROL, este não pertence
a classe 3 e sim a classe 4 representada por 33 37. Sempre utilizaremos
o intervalo fechado à esquerda e aberto à direita.
4.2. LIMITES DE CLASSE
Os limites de classe são os extremos de cada classe. O menor número é o
limite inferior de classe ( li ) e o maior número, limite superior de classe ( Li ).
No intervalo 29 33, l3 = 29 e L3 = 33.
4.3. AMPLITUDES
Aqui, podemos citar a amplitude do intervalo de classe, a amplitude
amostral e amplitude total da distribuição. Vejamos, então, cada uma delas.
AMPLITUDE DO INTERVALO DE CLASSE (hi)
É calculado após conhecermos o valor de i (nº de classes) e o valor de AA
(amplitude amostral). hi =
Se a distribuição por classes já estiver construída, nesse caso, hi = Li -
li, ou seja, a diferença entre os limites de cada classe.
Ex.: na tabela anterior.
h1 = 25-21=4
h2 = 29-25=4
h3 = 33-29=4
h4 = 37-33=4
h5 = 41-37=4
UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA
24
Na distribuição de freqüência com classe, devemos sempre que possível
ter hi igual em todas as classes.
AMPLITUDE AMOSTRAL (AA = Xmáx - Xmin)
Trata-se da diferença entre o valor máximo e o valor mínimo da amostra
(ROL). No nosso exemplo: AA=40-21=19.
AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT = L(max) - l(min))
É a diferença entre o limite superior da última classe e o limite inferior
da primeira classe.
EX.: na tabela anterior, AT = 41 - 21= 20.
Obs.: AT sempre será maior ou igual a AA.
PONTO MÉDIO DE CLASSE
O ponto médio de classe é o ponto que divide o intervalo de classe em
duas partes iguais.
EX.: considere a 3ª classe da tabela em 29 33, o ponto médio x3 =
(29+33)/2 = 31.
O ponto médio será de suma importância para o cálculo da média,
pois, como dito anteriormente, na tabela organizada com intervalos de
classe, não sabemos mais, exatamente, quais são os valores representados
em cada intervalo. Assim, consideraremos esses valores como sendo o ponto
médio dos intervalos para que o erro seja o menor possível.
Cálculo do número de intervalos de classe
Podemos calcular o número de intervalos de classe de duas formas:
pela Regra de Sturges ou pela raiz quadrada de n.
Regra de Sturges - Número de Classes
Para determinar o número de classes ideal de uma distribuição, utiliza-
se a Regra de Sturges, de acordo com o tamanho da amostra.
i 1 + 3,3 log.n
Onde n é o número de elementos da relação de dados brutos. Para o exemplo
dado, temos:
i 1 + 3,3 log20 = 5,29 5.
DICA
ESTATÍSTICA APLICADA
25
Se você não possui uma calculadora científica para calcular o valor do
logaritmo de n, busque nos anexos os respectivos valores.
Regra da Raiz Quadrada de n - Número de Classes
Para determinar o número de classes ideal de uma distribuição, utiliza-
se a regra da Raiz Quadrada de n, de acordo com o tamanho da amostra.
i n
Onde n é o número de elementos da relação de dados brutos. Para o
exemplo dado, temos: i 20 = 4,47 4.
Valores da raiz de n encontram-se previamente calculados nos anexos.
Se i=4 deve-se calcular o novo hi.
Ex.: na tabela anterior.
h1= 26-21=5
h2= 31-26=5
h3= 36-31=5
h4= 41-36=5
Na tabela de distribuição de freqüências sem intervalo de classes
tínhamos um total de treze linhas com dados obtidos, já na tabela com
intervalos de classe, apenas 5 ou 4 de acordo com a regra que for utilizada.
Apesar de ser uma tabela mais “legível”, a precisão dos valores se perde um
pouco, pois não sabemos mais quais são exatamente os sete números que
aparecem no primeiro intervalo de classe, por exemplo. Mesmo assim, é a
tabela mais usada, pois num levantamento de grande porte, seria inviável e
incompreensível trabalharmos com os inúmeros valores que aparecem.
DICA
DICA
UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA
26
Para a construção de uma tabela de distribuição de freqüências com
intervalos de classe, é muito importante o cálculodo número de intervalos
de classe ou pela regra de Sturges ou pela raiz quadrada de n. Qualquer
regra para determinação do número de intervalos de classes não determina
com exatidão o valor de i, mas dá ao pesquisador uma noção do tamanho da
tabela. Cabe ao pesquisador decidir com quantos intervalos de classe irá
trabalhar. Na verdade, o número de intervalos de classe vai depender do
tipo de dado que está sendo trabalhado. Por exemplo, se os dados referirem-
se às notas de uma prova, talvez seja conveniente que os arrumemos em
intervalos de 1 em 1 para que possamos ter uma idéia do número de alunos
aprovados (nota maior que sete), o número de
alunos em recuperação (nota entre quatro e sete) e o número de alunos
reprovados (nota inferior a quatro).
Para construção de uma Distribuição de Freqüências c/ intervalos
de Classes devemos seguir os seguintes passos (roteiro):
1º passo - Organize os dados brutos em um ROL.
Dados Brutos:
25, 21, 22, 21, 22, 23, 24, 21 ,30, 26, 30, 26, 40, 34, 32, 38, 37, 38, 40, 31
Rol:
21, 21, 21, 22, 22, 23, 24, 25, 26, 26, 30, 30, 31, 32, 34, 37, 38, 38, 40, 40
2º passo - Calcule a amplitude amostral AA (maior valor da amostra menos
o menor).
AA = 40 - 21 = 19
3º passo - Calcule o número de classes através da “Regra de Sturges” ou
da raiz quadrada de n.
i 1 + 3,3 log20 = 5,29 5 ou i n = 20 =4,47 4
O número de intervalos de classe pode ser diferente se calculado por
uma regra ou por outra. Cabe ao pesquisador definir o número de intervalos
de classe com que irá trabalhar.
ESTATÍSTICA APLICADA
27
4º passo - Calcule a amplitude dos intervalos de classe (amplitude amostral
dividida pelo número de intervalos de classe).
hi = AA/i = 19/5 = 3,8 4
No caso de termos que arredondar o valor de hi, este deve ser
arredondado sempre para mais para que haja folga na última classe, no
contrário corre-se o risco de a tabela montada não incluir o último valor,
e nenhum valor pode ser descartado.
5º passo - Montemos, então, a tabela. O menor número da amostra será o
limite inferior do 1º intervalo de classe e de h em h, no nosso exemplo, de 4
em 4, montamos, então, os limites de todos os intervalos de classe. O primeiro
elemento das classes seguintes sempre será formado pelo último elemento
da classe anterior.
6o passo - Agora é só marcar quantos números temos em cada intervalo de
classe. A maneira mais simples de fazer é através de marcações da seguinte
forma: lemos o primeiro número e identificamos qual a classe a que ele
pertence. Identificada a classe, riscamos o número e o marcamos na classe
a que ele pertence.
Agora é só apagar a coluna de marcação e está pronta a tabela!
UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA
28
DADOS ABSOLUTOS E DADOS RELATIVOS
Os dados absolutos são os resultantes da coleta direta da fonte, sem
outra manipulação senão a contagem ou medida. Já os dados relativos são
razões que se estabelecem entre dados absolutos e têm por finalidade realçar
ou facilitar as comparações entre quantidades. Os dados relativos são de
fácil compreensão. Como o nome mesmo diz, relativo, em relação a.
Porcentagem
As porcentagens são partes proporcionais calculadas sobre cem
unidades. O emprego da porcentagem é de suma importância quando o intuito
é destacar a participação da parte no todo.
Exemplo:
Considere a série:
Clínica A - 2005
Número de Pacientes Atendidos no Mês de Março por Setor
Fonte: Dados Fictícios.
Porcentagens dos pacientes atendidos em cada setor:
Pediatria:
Alergologia:
Radiologia:
Podemos inserir esses dados na nossa tabela através de uma nova coluna:
Clínica A - 2005
Número de pacientes atendidos no mês de março por setor
Fonte: Dados Fictícios.
ESTATÍSTICA APLICADA
29
TIPOS DE FREQÜÊNCIAS
• Freqüência Simples ou Absoluta (fi) - É o número de observações
correspondentes a uma classe ou a um valor.
• Freqüência Simples Relativa (fri) - É o número de observações
de um valor ou de uma classe, em relação ao número total de
observações.
Em porcentagens temos:
Obs.: a soma das freqüências relativas é sempre igual a 1 ou 100%. Devido a
erros de arredondamento pode acontecer de o somatório das freqüências
relativas dar diferente de 1 ou 100%. Por exemplo:
Se isso acontecer, devemos retirar ou acrescentar a diferença no intervalo
de maior freqüência, pois dessa forma cometeremos um erro menor do que
cometeríamos se alterássemos o intervalo de menor freqüência. O ideal é
trabalharmos com pelo menos 4 casas após a vírgula.
Freqüências Acumuladas (Fi.)
É a soma das freqüências anteriores até a classe ou valor inclusive. Na
tabela mais a frente, quantas pessoas tiraram nota até o limite superior do
intervalo?
Freqüência Acumulada Relativa (Fri)
Trata-se da freqüência acumulada de uma classe dividida pela
freqüência total. Podemos, ainda, representá-la em valores percentuais
multiplicando a freqüência acumulada relativa por 100. No exemplo abaixo,
qual o percentual das notas até o limite superior do intervalo?
Exemplo: notas de um teste de estatística aplicado em uma turma do
curso de Nutrição.
No exemplo abaixo, temos as freqüências simples (absoluta - fi ; relativa
- fri e relativa percentual - fri %).
UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA
30
No exemplo a seguir, temos as freqüências acumuladas (acumuladas –
Fi; acumulada relativa – Fri e acumulada relativa percentual – Fri%).
No exemplo seguinte, vamos calcular também para completarmos o
cálculo da distribuição de freqüências, o ponto médio – xi.
NOTAS DE UM TESTE DE ESTATÍSTICA APLICADO EM UMA TURMA DO
CURSO DE NUTRIÇÃO.
Onde:
fi Freqüência simples absoluta.
xi Ponto médio de uma classe.
fri Freqüência relativa.
Fi Freqüência acumulada.
Fri Freqüência acumulada relativa.
ESTATÍSTICA APLICADA
31
Chegamos ao fim da unidade 1, onde estudamos os elementos da
Estatística descritiva. Espero que você tenha gostado .Vamos em frente.
É HORA DE SE AVALIAR!
Não esqueça de realizar as atividades desta unidade de
estudo, presentes no caderno de exercício! Elas irão ajudá-
lo a fixar o conteúdo, além de proporcionar sua autonomia no
processo de ensino-aprendizagem. Caso prefira, redija as
respostas no caderno e depois as envie através do nosso
ambiente virtual de aprendizagem (AVA). Interaja conosco!
Na próxima unidade estudaremos os gráficos Estatísticos. Vamos lá.
UNIDADE 1 - ELEMENTOS DA ESTATÍSTICA DESCRITIVA
32
ESTATÍSTICA APLICADA
33
U
N
ID
A
D
E
 2
REPRESENTAÇÃO GRÁFICA
Esta é uma unidade importante para o entendimento da estatística,
pois grande parte dos dados estatísticos são apresentados através de
gráficos. Nela aprenderemos a montar e a interpretar alguns dos gráficos
mais utilizados e os gráficos estatísticos específicos. Esperamos que vocês
gostem.
OBJETIVO DA UNIDADE:
Construir e analisar os gráficos que você tanto conhece e que fazem
parte da sua vida cotidiana.
PLANO DA UNIDADE:
• Gráfico em linha Curva.
• Gráficos em barra vertical.
• Gráficos em barra horizontal.
• Gráficos de setores.
• Cartogramas.
• Histograma.
• Polígono de Freqüência.
• Ogivograma.
• Ogiva de Galton.
Bons estudos!
UNIDADE 2 - REPRESENTAÇÃO GRÁFICA
34
Os gráficos são representações visuais dos dados estatísticos e não
substituem as tabelas. Devem corresponder aos dados de uma forma simples,
clara e objetiva.
Muito cuidado com os gráficos, pois se mal elaborados podem trazer
uma idéia falsa dos dados que estão sendo analisados, chegando mesmo a
confundir o leitor.
Por falar gráficos, quais você conhece? Você sabe qual é a
funcionalidade deles? Vejamos então.
Alguns Tipos de Gráficos
GRÁFICO EM LINHA OU CURVA
Estes gráficos são freqüentemente usados para a representação de
séries cronológicas com um grande número de períodos. Nos dão uma
visualização clara da variação dos dados existentes nas séries. Também
são ideais quando há necessidade de se representarem várias séries em
um mesmo gráfico.
Gráficos em barrasverticais (coluna).
DICA
ESTATÍSTICA APLICADA
35
GRÁFICOS EM BARRAS HORIZONTAIS
Quando as legendas são longas usa-se de preferência os gráficos em
barras horizontais. Os retângulos (barras) têm a mesma base e as alturas
são proporcionais aos respectivos dados.
GRÁFICOS EM SETORES
Estes gráficos são construídos em uma circunferência e empregados
sempre que desejamos ressaltar a participação do dado no total. O total é
representado pelos 360 graus de um círculo, que fica dividido em tantos
setores quantas são as partes. Os setores são tais que seus ângulos são
respectivamente proporcionais aos dados da série.
Devemos evitar o gráfico de setores quando tivermos mais de sete
dados.
As séries temporais, geralmente, não são representadas por este
tipo de gráfico.
IMPORTANTE
DICA
UNIDADE 2 - REPRESENTAÇÃO GRÁFICA
36
CARTOGRAMAS
São ilustrações relativas a cartas geográficas (mapas). O objetivo
desse gráfico é o de figurar os dados estatísticos diretamente relacionados
com áreas geográficas ou políticas.
HISTOGRAMA
É formado por um conjunto de retângulos justapostos, cujas bases
se localizam sobre o eixo horizontal, de tal modo que seus pontos médios
coincidam com os pontos médios dos intervalos de classe. É o gráfico que
melhor representa uma distribuição de freqüências com intervalos de
classe ( este assunto será abordado na unidade 3). No eixo horizontal (eixo
x), representamos as classes da distribuição e no eixo vertical (eixo y),
representamos as freqüências. A área de um histograma é proporcional à
soma das freqüências simples ou absolutas.
O histograma assemelha-se ao gráfico de colunas, a diferença é que
não há espaçamento entre as colunas.
IMPORTANTE
ESTATÍSTICA APLICADA
37
POLÍGONO DE FREQÜÊNCIA
É um gráfico em linha, sendo as freqüências marcadas sobre
perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos
intervalos de classe. Para realmente obtermos um polígono (linha fechada),
devemos completar a figura, ligando os extremos da linha obtida aos pontos
médios da classe anterior à primeira e da posterior à última da distribuição.
OGIVOGRAMA
É o gráfico de freqüências acumuladas. Ele é construído da mesma
forma que o histograma, porém no eixo vertical (eixo y), representaremos as
freqüências acumuladas.
OGIVA DE GALTON
A Ogiva de Galton ou polígono de freqüência acumulada é um gráfico
de linhas traçado marcando-se as freqüências acumuladas sobre
perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes
aos limites superiores dos intervalos de classe.
10 20 30 40 50 60
UNIDADE 2 - REPRESENTAÇÃO GRÁFICA
38
É HORA DE SE AVALIAR!
Não esqueça de realizar as atividades desta unidade de
estudo, presentes no caderno de exercício! Elas irão ajudá-
lo a fixar o conteúdo, além de proporcionar sua autonomia
no processo de ensino-aprendizagem. Caso prefira, redija
as respostas no caderno e depois as envie através do nosso
ambiente virtual de aprendizagem (AVA). Interaja conosco!
Nessa unidade, vimos os principais e os mais importantes gráficos
estatísticos. Com uma ferramenta computacional é muito simples representar
dados graficamente. Na próxima unidade veremos as medidas de tendência
central.
ESTATÍSTICA APLICADA
39
U
N
ID
A
D
E
 3
MEDIDAS DE TENDÊNCIA CENTRAL
Estudaremos aqui três tipos de medidas de tendência central: média
aritmética, moda e mediana. Essas medidas servem para visualizarmos a
distribuição de freqüências no eixo de variação da variável estudada.
OBJETIVOS DA UNIDADE:
Compreender as medidas de tendência central e calculá-las para dados
não agrupados e dados agrupados em classes de freqüências.
PLANO DA UNIDADE:
• Média Aritmética.
• Moda.
• Mediana.
Bons estudos!
UNIDADE 3 - MEDIDAS DE TENDÊNCIA CENTRAL
40
As Medidas de Posição ou Tendência Central são denominadas dessa
forma devido aos dados observados tenderem, em geral, a se agrupar em
torno dos valores centrais. As outras medidas de posição são as
separatrizes, que englobam a própria mediana, os decis, os quartis e os
percentis.
MÉDIA ARITMÉTICA
A Média Aritmética ( ) é a medida de posição que possui maior
estabilidade e é igual ao quociente entre a soma dos valores da variável e o
número total de observações. Veja, abaixo, a fórmula:
Em que xi são os valores da variável e n o número de observações.
Para dados não agrupados a Média Aritmética Simples ( ) é calculada
da seguinte forma:
EXEMPLIFICANDO
Ex.: Um aluno de determinada instituição de ensino tirou as
seguintes notas em estatística: 7, 10 e 6. Sabendo-se que a
nota final desse aluno é calculada através da média
aritmética das três avaliações feitas no período, temos como
média final do aluno:
x1 = 7; x2 = 10 e x3 = 6
Em relação aos dados agrupados sem intervalos de classe,
consideremos a distribuição relativa a 38 crianças pacientes de uma clínica
pediátrica com idades entre 0 e 4 anos.
As freqüências representam quantas vezes ocorreu determinada idade,
por exemplo, ao invés de escrevermos 0,0,1,1,1,1,1,1 etc., atribuímos a
ESTATÍSTICA APLICADA
41
freqüência, logo, a idade 0 (zero) ocorre duas vezes; a idade 1 ocorre seis
vezes e assim por diante. As freqüências funcionam como fatores de
ponderação. A média aritmética, nesse caso, é a média aritmética
ponderada, ou seja, em vez de somarmos o número 0 duas vezes, o número
1 seis vezes, o número 2 doze vezes e assim por diante, ponderamos os
valores da variável com suas respectivas freqüências. Esta ponderação é
dada pela fórmula:
Obs.: = n, ou seja, a soma das freqüências é igual a n.
= 38, n = 38.
A idade média das crianças atendidas na clínica será .
Agora, vejamos os dados agrupados com intervalos de classe.
Observe a seguir as notas de 50 alunos de uma turma de estatística:
Neste caso não temos como saber se os sete alunos da primeira classe
tiveram notas, por exemplo, zero ou 1,9. Então, para diminuirmos o erro
cometido com o agrupamento, utilizamos como valor representativo de cada
intervalo o seu ponto médio (xi). Utilizamos, então, a mesma fórmula, sendo
que xi agora não é mais o valor da variável e sim o ponto médio de cada
classe. A média aritmética é calculada, então, da seguinte forma:
UNIDADE 3 - MEDIDAS DE TENDÊNCIA CENTRAL
42
Em que é o ponto médio da classe.
No nosso exemplo: , , , , .
Outros tipos de médias menos usados são as médias geométrica,
harmônica, quadrática, cúbica e biquadrática.
IMPORTANTE
A média aritmética para a população é denotada por .
Você já ouviu falar em moda? Não, não é bem dessa moda
que vamos falar! É a Moda na Estatística. Vamos estudar
sobre ela, agora?
MODA (M
O
)
A Moda é o valor que mais aparece em uma série de valores. Você
deve estar se perguntando: Como assim o valor que mais aparece? É isso
mesmo!
EXEMPLIFICANDO
Por exemplo: o número de calçado mais vendido em uma
sapataria é a moda. Até os vendedores ambulantes, mesmo
sem saber, utilizam-se da moda. De uma maneira grosseira,
podemos nos lembrar daquilo que está na moda, ou seja,
daquilo que mais aparece.
Viu como é simples?
Podemos calcular a Moda para diversos tipos de dados. Veja como
fazer isso:
Moda para dados não agrupados
A moda de uma distribuição para dados não agrupados é fácil de ser
vista, é só procurarmos o valor que mais aparece. Uma distribuição pode ter
nenhuma (amodal), uma (unimodal), duas (bimodal) ou mais modas.
Exemplos:
· Na série {6, 7, 9, 11, 11, 11, 12, 12} a moda é igual a 11. A
distribuição é unimodal;
· A série {2, 5, 7, 11,12} não possui um número que apareça
mais que os outros. A série é amodal;
EXEMPLIFICANDO
ESTATÍSTICA APLICADA
43
· A série {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas modas:
4 e 7. A série é bimodal;
· Em outros casos, pode haver três ou mais valores que mais se
repetem. Nesse caso, a série tem três ou mais modas.
Moda para dados agrupados sem intervalos de classe
Uma vez agrupados osdados, a moda é o valor da variável de maior
freqüência.
Ex.: Manequim de roupa feminina mais vendida em uma loja de
departamentos:
Resposta: 38 é o manequim modal, pois é o de maior freqüência.
Moda para dados agrupados com intervalos de classe
Classe modal é a classe que apresenta a maior freqüência. Nesse
caso, a moda está compreendida entre os limites da classe modal. O método
mais simples para o cálculo consiste em tomarmos o ponto médio da classe
modal como sendo a própria moda. A este valor chamamos de moda bruta.
Em que l* é o limite inferior da classe modal e L* o limite superior da
classe modal.
Ex.: Como podemos calcular o peso modal da tabela abaixo?
Resposta: A classe modal é 50|— 55, pois é a de maior freqüência. l2 =
50 e L2 = 55
EXEMPLIFICANDO
EXEMPLIFICANDO
UNIDADE 3 - MEDIDAS DE TENDÊNCIA CENTRAL
44
Mo = kg
IMPORTANTE
Não temos como saber o real valor da moda, pois não
conhecemos mais os valores que estão compreendidos em
um determinado intervalo. Portanto, este valor é apenas
estimado.
Você conhece a fórmula de Czuber? Pois, então conhecerá agora.
Fórmula de CZUBER (processo mais elaborado)
Em que:
li é o limite inferior da classe modal.
D1 = f
* - f(ant)
D2 = f
* - f(post)
h* é a amplitude da classe modal.
f* é a freqüência simples da classe modal.
f(ant) é a freqüência simples da classe anterior à classe modal.
f(post) é a freqüência simples da classe posterior à classe modal.
Para o cálculo do peso modal da tabela anterior temos:
Passemos a estudar, agora, a mediana para dados não-agrupados,
agrupados sem intervalos de classe e agrupados em classes.
MEDIANA (M
D
)
A mediana de um conjunto de valores previamente ordenados. É o
valor situado bem no meio do conjunto de valores de tal forma a separá-los
em dois subconjuntos de mesmo número de elementos.
ESTATÍSTICA APLICADA
45
Mediana para dados não-agrupados
· Quando o número de valores for ímpar:
Ex.: Dada uma série de valores {7, 2, 8, 13, 11, 7, 15, 12, 1} o primeiro
passo a ser dado é a construção do rol: {1, 2, 7, 7, 8, 11, 12, 13, 15}.
O valor que divide a série em duas partes iguais é o 8, logo a
mediana Md = 8.
Na prática, o valor mediano é dado por , ou seja,
a mediana será o quinto elemento da série ordenada, que é 8. Md = 8
· Quando o número de valores for par:
Ex.: Calcular a mediana da série {1, 2, 0, 0, 2, 4, 4, 3, 6, 4, 5, 6}
Rol - {0, 0, 1, 2, 2, 3, 4, 4, 4, 5, 6, 6} - Md
Temos, aqui, duas observações a serem feitas, por isso preste
bastante atenção:
· A mediana coincidirá com um dos elementos da série quando o
número de elementos for ímpar. Quando o número de elementos
da série for par, a mediana nunca coincidirá com um dos
elementos da série. Neste caso, a mediana será sempre a média
aritmética dos 2 elementos centrais da série;
· A média aritmética, a mediana e a moda de uma série de valores
não têm, necessariamente, o mesmo valor.
Mediana para dados agrupados sem intervalos de classe
Neste caso, basta identificarmos a freqüência acumulada (Fi) igual ou
imediatamente superior à . A mediana será o valor da variável que
corresponder a essa freqüência acumulada.
Ex.: Veja a tabela a seguir:
=, logo a mediana será Md = 3.
EXEMPLIFICANDO
EXEMPLIFICANDO
EXEMPLIFICANDO
=
UNIDADE 3 - MEDIDAS DE TENDÊNCIA CENTRAL
46
Mediana para dados agrupados em classes
Para esse tipo de dado é preciso determinar a classe da mediana, que
será aquela que corresponder à freqüência acumulada igual ou
imediatamente superior à .
A mediana é dada pela fórmula:
Em que:
li é o limite inferior da classe mediana.
F(ant) é a freqüência acumulada anterior à classe mediana.
f* é a freqüência simples da classe mediana.
h* é a amplitude do intervalo da classe mediana.
Exemplo:
IMPORTANTE
Neste caso a mediana é estimada, pois não temos todos os
valores da distribuição.
Qual é a medida que devemos usar?
Todas as médias são valores que estão compreendidos entre
o menor e o maior valor observado. Todas são igualmente
importantes, portanto uma não deve prevalecer sobre a outra. Devemos
saber que:
EXEMPLIFICANDO
ESTATÍSTICA APLICADA
47
· A média aritmética é a mais empregada apenas pelo fato de
ser mais simples o seu cálculo e mais compreensível o seu
resultado. É a medida de posição que possui a maior
estabilidade;
· A moda será utilizada quando a medida de posição for o valor
mais típico da distribuição. É uma medida de rápida obtenção;
· Quando desejamos obter o ponto que divide a distribuição em
duas partes iguais, quando há valores extremos que afetam
de maneira acentuada a média aritmética ou quando a variável
em estudo é salário, usamos a mediana.
A média aritmética de uma série de valores, por exemplo, é influenciável
pelos seus extremos, enquanto que a mediana depende da posição e não
dos valores dos elementos na série ordenada. É por isso que, no caso de
séries com extremos muito distantes, usamos mais a mediana do que a
média aritmética, para que não haja influência dos extremos.
Ex.: Na série { 8, 9, 10, 15, 18}, a média = 12 e a mediana = 10. Já na série
{ 6, 8, 10, 11, 75 }, a média = 22 e a mediana = 10.
A média do segundo conjunto de valores é maior do que a do primeiro
por influência do valor extremo (75), porém, nas duas séries, a mediana é a
mesma, ou seja, não adianta analisarmos apenas as médias aritméticas
de uma série de valores, é preciso analisar também a mediana.
É HORA DE SE AVALIAR!
Não esqueça de realizar as atividades desta unidade de
estudo, presentes no caderno de exercício! Elas irão ajudá-
lo a fixar o conteúdo, além de proporcionar sua autonomia
no processo de ensino-aprendizagem. Caso prefira, redija
as respostas no caderno e depois as envie através do nosso
ambiente virtual de aprendizagem (AVA). Interaja conosco!
Vimos nesta unidade as medidas de tendência central. A média de um
conjunto de valores ou de uma distribuição de classes é fundamental dentro
do estudo da Estatística. Ela é um dos principais parâmetros de estudo e
pesquisas. Na próxima unidade, veremos as medidas de dispersão – o cálculo
dessas medidas nos permite a verificação de quão representativa é a média
de uma distribuição em relação a todas as suas observações.
EXEMPLIFICANDO
UNIDADE 3 - MEDIDAS DE TENDÊNCIA CENTRAL
48
ESTATÍSTICA APLICADA
49
U
N
ID
A
D
E
 4
MEDIDAS DE DISPERSÃO
Estudaremos aqui as medidas de dispersão. Elas permitem calcular a
dispersão (como os dados estão espalhados) existente entre os dados
observados, estejam eles agrupados ou não, em relação à média aritmética.
OBJETIVOS DA UNIDADE:
Compreender as medidas de dispersão, calcular essas medidas, para
dados não agrupados e dados agrupados em classes de freqüências.
PLANO DA UNIDADE:
• Amplitude total.
• Variância.
• Desvio padrão.
• Coeficiente de variação.
Bons estudos!
UNIDADE 4 - MEDIDAS DE DISPERSÃO
50
A média aritmética, a moda e a mediana são valores representativos
do todo, portanto a obtenção desses valores se faz fundamental no estudo
de um conjunto de valores. Porém, para analisarmos um fenômeno estatístico,
não basta obtermos apenas medidas de posição ou gráficos estatísticos.
Para uma análise mais profunda, devemos saber como esses dados estão
distribuídos no todo. As medidas de variabilidade ou dispersão nos dão
exatamente isso. Elas fazem uma descrição de como os dados estão
espalhados no todo. Existem diversas medidas de dispersão, porém, em nossa
disciplina, estudaremos quatro delas, que são:
· Amplitude total;
· Variância;
· Desvio padrão;
· Coeficiente de variação;
Ex.: Observe os seguintes conjuntos de valores referentes à mesma variável:
X = {20, 20, 20, 20, 20}
Y = {05, 15, 20, 30 ,30}
Z = {01, 01, 03, 05, 90}
Os três conjuntos apresentam a mesma média aritmética ,
porém é fácil notar que o primeiro conjunto de valores é mais homogêneo
que os outros dois, pois todos os valores sãoiguais. Já o segundo é mais
homogêneo que o terceiro, pois este é o mais disperso de todos. Portanto
não adianta dois ou mais conjuntos de valores terem a mesma média
aritmética, algumas outras análises se fazem necessárias.
AMPLITUDE TOTAL (AT)
Amplitude Total (AT) é a diferença entre o limite superior da última
classe e o limite inferior da primeira classe, ou seja, é a diferença entre os
valores extremos de um conjunto de dados .
Trata-se da única medida de dispersão que não tem a média como
ponto de referência. A amplitude total é instável, pois só leva em consideração
os valores extremos dos conjuntos de dados, descuidando do conjunto de
valores intermediários, por isso é pouco utilizada.
Uma de suas utilizações é na hora de decidirmos por uma distribuição
de freqüência com ou sem intervalos de classes. Fazemos uso da amplitude
total quando queremos determinar a amplitude da temperatura em um dia,
por exemplo, medida de cálculo rápido sem muita exatidão.
EXEMPLIFICANDO
ESTATÍSTICA APLICADA
51
Ex.:
Dada a série 2, 3, 5, 6, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 21, 22, 23, 23, 23, 24, 25,
25, 27, 27, 48, 60 e 70 a amplitude amostral será:
Agrupando os dados sem intervalos de classe:
Com intervalos de classe:
VARIÂNCIA (S2)
A variância mede o grau de variabilidade em torno da média. É a média
aritmética dos quadrados dos desvios (cada valor menos a média).
Diferente da amplitude total que se deixa influenciar pelos extremos, a
variância leva em consideração todos os valores da variável em estudo.
Ela baseia-se nos desvios em torno da média.
EXEMPLIFICANDO
UNIDADE 4 - MEDIDAS DE DISPERSÃO
52
Variância Amostral
· Para dados isolados:
= cada valor observado.
= média dos valores observados.
 n = tamanho da amostra.
· Para dados agrupados:
IMPORTANTE
No denominador da fórmula da variância trabalhamos sempre
com n-1 graus de liberdade para diminuir o erro do cálculo da
variância com agrupamento da distribuição.
Em que:
= cada valor observado, no caso de dados agrupados com intervalos
de classe, é o ponto médio do intervalo de classe.
= média dos valores observados.
= somatório das freqüências (n).
 fi = freqüência de cada classe.
Ex.: Ao analisarmos as idades dos pacientes atendidos num dia em duas
clínicas de saúde A e B, temos:
Clínica A
EXEMPLIFICANDO
i
ESTATÍSTICA APLICADA
53
Clínica B
Podemos observar que a variância da Clínica A é bem menor do que a
variância da Clínica B, apesar de as médias aritméticas serem iguais. Isso
significa que os dados referentes às idades dos pacientes atendidos na
primeira clínica são mais homogêneos, ou seja, mais concentrados em torno
da média que os da segunda clínica, que são mais dispersos.
DESVIO PADRÃO
O desvio padrão é a medida de dispersão mais empregada, pois
leva em consideração a totalidade dos valores da variável em estudo e o
seu resultado está na mesma unidade de medida da variável, diferente da
variância, que é uma medida quadrática. Quanto maior o desvio padrão mais
heterogêneos são os dados. O desvio é um indicador de variabilidade
bastante estável. Ele baseia-se nos desvios em torno da média aritmética.
É a média quadrática dos desvios, isto é, a raiz quadrada da variância.
No nosso exemplo temos:
Propriedades do desvio padrão
· 1ª = Somando-se (ou subtraindo-se) uma constante a todos
os valores de uma variável, o desvio padrão não se altera;
· 2ª = Multiplicando-se (ou dividindo-se) todos os valores de uma
variável por uma constante (diferente de zero), o desvio padrão
fica multiplicado (ou dividido) por essa constante.
EXEMPLIFICANDO
UNIDADE 4 - MEDIDAS DE DISPERSÃO
54
COEFICIENTE DE VARIAÇÃO DE PEARSON - CVP
O desvio padrão tem algumas limitações. Um desvio padrão de 5
unidades, por exemplo, pode ser considerado pequeno para uma série de
valores cujo valor médio é 500, porém, se a média for igual a 15, essa relação
muda completamente.
IMPORTANTE
Outra questão a ser considerada é que o fato de o desvio
padrão ser expresso na mesma unidade dos dados, o que
não nos permite comparar duas ou mais séries de valores
expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, utilizamos o
coeficiente de variação CV. O coeficiente de variação é uma
medida de dispersão relativa, ou seja, é admensional, é a relação entre o
desvio padrão e uma medida de tendência central. Portanto, existem
diversos tipos de coeficientes de variação. Aqui, estudaremos apenas um: o
coeficiente de variação de Pearson.
OBS.: O CV pode ser expresso em decimal ou em porcentagem.
Ex.: Consideremos os pesos e as alturas de um grupo de jovens atletas
de uma escola de ensino fundamental da baixada fluminense: qual das
medidas (Estatura ou Peso) possui maior homogeneidade?
Apenas através do desvio padrão não podemos dizer nada, pois este
só pode ser comparado no caso de dados com a mesma unidade de medida.
Teremos, então, que calcular o CVP da Estatura e o CVP do Peso. O menor
resultado será o de menor dispersão ou variabilidade, ou seja, o de maior
homogeneidade.
Comparando os CVP, concluímos que as estaturas apresentam maior
homogeneidade que os pesos. Se levarmos em consideração o coeficiente
de variação das duas variáveis, podemos afirmar que a média dos dados é
EXEMPLIFICANDO
ESTATÍSTICA APLICADA
55
representativa, pois o CV é bem pequeno, tanto para estaturas quanto para
os pesos.
Estudamos nesta unidade as medidas de dispersão. O cálculo do desvio
padrão é de grande importância no estudo da Estatística. Por ser um valor
que se encontra na mesma unidade da variável, fica fácil seu entendimento.
Ele mostra, em valores, o afastamento das observações em relação à média
aritmética.
Quando precisamos trabalhar variáveis diferentes, podemos compará-las
através do coeficiente de variação. O estudo da dispersão ou afastamento
dos dados é muito importante na nossa disciplina.
É HORA DE SE AVALIAR!
Não esqueça de realizar as atividades desta unidade de
estudo, presentes no caderno de exercício! Elas irão ajudá-
lo a fixar o conteúdo, além de proporcionar sua autonomia
no processo de ensino-aprendizagem. Caso prefira, redija
as respostas no caderno e depois as envie através do nosso
ambiente virtual de aprendizagem (AVA). Interaja conosco!
Veremos, na próxima unidade, como calcular uma amostra.
UNIDADE 4 - MEDIDAS DE DISPERSÃO
56
ESTATÍSTICA APLICADA
57
U
N
ID
A
D
E
 5
NOÇÕES DE AMOSTRAGEM
Esta unidade talvez seja uma das mais importantes da nossa disciplina,
pois, num levantamento estatístico, a amostra deve ser representativa da
realidade, se isso não ocorrer, não poderemos tirar nenhuma conclusão do
comportamento de toda a população. Aqui aprenderemos mais um pouco
sobre o cálculo de amostra e como poderemos confiar em seus resultados.
OBJETIVO DA UNIDADE:
Conhecer mais sobre o cálculo e os tipos de amostra e os métodos
probabilísticos.
PLANO DA UNIDADE:
• Amostragem Casual ou Aleatória Simples.
• Amostragem por Conglomerados.
• Amostragem Acidental.
• Amostragem Intencional.
• Amostragem por Quotas.
• Amostragem Estratificada.
Bons estudos!
UNIDADE 5 - NOÇÕES DE AMOSTRAGEM
58
CONCEITOS BÁSICOS
Nem sempre a realização de um censo é possível, ou seja, obter
informações referentes a todos os elementos de uma população torna-se,
muitas vezes, praticamente impossível. Limitações de tempo e custo justificam
o uso de técnicas amostrais.
Amostra é uma parcela representativa da população que é examinada
com o propósito de tirarmos conclusões sobre a mesma. É um subconjunto
finito de uma população. Uma amostra deve ser cuidadosamente planejada
a fim de garantir a menor margem de erro na pesquisa.
Para selecionar uma amostra é preciso levar em conta as
características de distribuição física da população, ou seja, algumas áreas
têm uma população maior que outras. É preciso levantar os dados em
proporção à densidade populacional das regiões.
EXEMPLIFICANDO
Por exemplo,se o objeto de estudo é o tipo de programa de
TV mais assistido, não adianta fazer o estudo apenas em
uma turma de escola de educação infantil, pois o resultado
obviamente seria desenho animado. Crianças não costumam
assistir a telejornais ou filmes da madrugada. Se a pesquisa
fosse feita dessa forma, o resultado não estaria correto. Assim, no caso de
uma população ser composta de 35% de crianças, 40% de adultos e os
outros 25% de idosos, uma amostra dessa população também deve conter
crianças, adultos e idosos na mesma proporção.
Tipos de amostragem
Existem basicamente dois métodos para composição da amostra: o
método probabilístico e o não-probabilístico ou intencional.
Métodos probabilísticos
Neste método, faz-se necessário que cada elemento da população
possua determinada probabilidade de ser selecionado, ou seja, se o tamanho
da população for N, a probabilidade de cada elemento ser selecionado será
. Esse método garante que cada elemento da população tenha a
mesma chance de ser selecionado como elemento da amostra. Assim,
podemos garantir cientificamente a aplicação das técnicas estatísticas de
inferências. Somente com base em amostragens probabilísticas é que se
podem realizar inferências ou induções sobre a população a partir do
conhecimento da amostra.
Amostragem casual ou aleatória simples
A amostragem casual ou aleatória simples é o processo mais utilizado.
Equivale a um sorteio lotérico. Ela pode ser realizada da seguinte forma:
numera-se a população de 1 a n e sorteiam-se, a seguir, por meio de um
dispositivo aleatório qualquer, n números dessa seqüência, que
corresponderão aos elementos pertencentes à amostra.
A margem de erro é um interva-
lo controlado dentro do qual
podem variar os resultados fi-
nais. Um estudo bem planejado
é capaz de reduzir o erro de
amostragem.
ESTATÍSTICA APLICADA
59
Obs.: Quando o número de elementos da amostra é muito grande como, por
exemplo, neste caso, tal tipo de sorteio é muito trabalhoso. Neste caso,
utiliza-se uma tabela de números aleatórios, construída de modo que os
algarismos de 0 a 9 sejam distribuídos ao acaso nas linhas e colunas.
Tabela de números aleatórios
Exemplo: Uma determinada universidade possui 7000 alunos.
Pretende-se fazer uma pesquisa para verificar como vai a saúde dos alunos.
Serão selecionados, aleatoriamente, 5% dos alunos. Deslocar um funcionário
para escrever 7000 números de matrícula em um pedaço de papel e depois
sortear 350 pedaços é algo praticamente inviável e desnecessário. Então, a
amostra é sorteada com o uso de uma tabela de números aleatórios da
seguinte forma: os números de matrícula existentes possuem 4 dígitos,
escolhemos 4 linhas ou colunas da tabela e selecionamos os números que
correspondem a alunos matriculados na instituição. Os números que não
correspondem são descartados. Se selecionarmos, por exemplo, as 4
primeiras colunas teremos como números selecionados 5772, 2880, 7454,
9120, 0425, 1205, 5254 ... Estas são, então, as matrículas selecionadas,
caso existam.
Amostragem proporcional estratificada
Quando a população se divide em estratos (subconjuntos da população)
é imprescindível que o sorteio dos elementos da amostra leve em
consideração tais estratos. Daí, obteremos os elementos da amostra
proporcional ao número de elementos desses estratos.
EXEMPLIFICANDO
UNIDADE 5 - NOÇÕES DE AMOSTRAGEM
60
Ex.: Vamos obter uma amostra de 10% dos pacientes internados em
um SPA, supondo que sejam 106 mulheres e 54 homens. São, portanto,
dois estratos (sexo masculino e sexo feminino). Logo, temos:
Numeramos os pacientes de 01 a 160, sendo 01 a 54 homens e 55 a
160, mulheres e, fazemos o sorteio casual com urna ou tabela de números
aleatórios.
Amostragem sistemática
Quando os elementos da população já se acham ordenados, não há
necessidade de sorteio. Neste caso, calcula-se o número de elementos da
amostra e divide-se o número de elementos da população pelo de elementos
da amostra (x), assim, escolhemos os elementos ordenados de x em x.
Ex.: Imaginemos um prédio com 200 apartamentos dos quais
desejamos obter uma amostra formada por 20 apartamentos para uma
pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento:
como 200/20 = 10. Escolhemos por sorteio casual um número de 01 a 10, o
qual indicaria o primeiro elemento sorteado para a amostra; os demais
elementos seriam, periodicamente, considerados de 10 em 10. Assim,
suponhamos que o número sorteado fosse 6, a amostra seria: 6º.
apartamento, 16º. apartamento, 26º. apartamento etc.
Amostragem por conglomerados (ou agrupamentos)
Algumas populações não permitem ou dificultam extremamente a
identificação de seus elementos. Não obstante, pode ser relativamente fácil
identificar alguns subgrupos da população. Em tais casos, uma amostra
aleatória simples desses subgrupos (conglomerados) pode ser colhida e
uma contagem completa deve ser feita para o conglomerado sorteado.
Agrupamentos típicos são quarteirões, famílias, organizações, agências,
edifícios etc.
Ex.: Num levantamento da população de determinada cidade, podemos
dispor do mapa indicando cada quarteirão e não dispor de uma relação
atualizada dos seus moradores. Pode-se, então, colher uma amostra dos
quarteirões e fazer a contagem completa de todos os que residem naqueles
quarteirões sorteados.
MÉTODOS NÃO-PROBABILÍSTICOS
São amostragens nas quais há uma escolha deliberada dos
elementos da amostra. Não é possível generalizar os resultados das
pesquisas para a população, pois as amostras não-probabilísticas não
garantem a representatividade da população. 
EXEMPLIFICANDO
EXEMPLIFICANDO
ESTATÍSTICA APLICADA
61
AMOSTRAGEM ACIDENTAL
Trata-se de uma amostra formada por aqueles elementos que vão
aparecendo, que são possíveis de se obter até completar o número de
elementos da amostra. Ela é geralmente utilizada em pesquisas de opinião,
em que os entrevistados são acidentalmente escolhidos.
Ex.: Pesquisas de opinião em praças públicas, ruas de grandes cidades.
AMOSTRAGEM INTENCIONAL
De acordo com determinado critério, é escolhido intencionalmente um
grupo de elementos que irão compor a amostra. O investigador se dirige
intencionalmente a grupos de elementos dos quais deseja saber a opinião.
Ex.: Numa pesquisa sobre preferência por determinado cosmético, o
pesquisador se dirige a um grande salão de beleza e entrevista as pessoas
que ali se encontram.
AMOSTRAGEM POR COTAS
Trata-se de um dos métodos de amostragem mais comumente usados
em levantamentos de mercado e em prévias eleitorais. Ele abrange três
fases: primeiramente classifica a população, ou seja, verifica o que é relevante
para a característica a ser estudada; em segundo lugar ele determina a
proporção da população para cada característica com base no que se conhece
sobre a população; em terceiro e último lugar, o pesquisador fixa cotas para
cada entrevistador de modo que a amostra total observada contenha a
proporção da população determinada na fase anterior.
Ex.: Numa pesquisa sobre programa de TV mais assistido, provavelmente,
será interessante dividirmos a população em homens e mulheres, cidade e
campo, idade, renda média, faixas etárias etc.
CÁLCULO PARA O DIMENSIONAMENTO DA AMOSTRA
Para se dimensionar uma amostra, devemos saber:
· A população é finita ou infinita?
· Por exemplo: A população constituída por todos os brinquedos
produzidos em um dia de trabalho em uma fábrica é finita,
enquanto que a população constituída por todos os resultados
(cara e coroa) em sucessivos lances de uma moeda é infinita.
· A variável estudada é discreta ou contínua?
· Variável Discreta ou Descontínua: seus valores são expressos,
geralmente, através de números inteiros não negativos. Resulta
normalmente de contagens. Ex.: Número de filhos de um casal
- pode assumir valores como 0; 1; 2; 3... mas nunca valores
como: 1,5; 3,72 etc.
UNIDADE 5 - NOÇÕES DE AMOSTRAGEM
62
· Variável Contínua: pode assumir qualquer valor entredois
limites, ou seja, assume valores em um intervalo real. Resulta,
normalmente, de uma mensuração, ou seja, podem assumir,
teoricamente, qualquer valor entre dois l imites. Ex.:
Temperatura. Normalmente, as medições dão origem a variáveis
contínuas e as contagens a variáveis discretas.
· O erro amostral – expresso na unidade da variável estudada;
O erro amostral é a máxima diferença que o pesquisador admite entre a
média da população ( ) e a média da amostra ( ).
· O desvio padrão da população – expresso na unidade da variável;
O desvio padrão da população pode ser determinado através de estudos
anteriormente feitos ou de suposições sobre o assunto.
· A abscissa da curva normal padrão (Z) para um determinado nível
de confiança.
Normalmente utilizamos os níveis de confiança:
Para 95% Z=1,96
99% Z=2,58
Fórmulas para o cálculo da amostra
Em que:
· Z é a abscissa da curva normal padrão.
· é o desvio padrão da população.
· N é o tamanho da população.
· d é o erro amostral.
· é a estimativa da proporção verificada em pesquisa anterior. Por
exemplo: se a variável analisada for a proporção de crianças míopes de
uma determinada cidade e em uma pesquisa anterior essa proporção foi de
20%, então, = 0,20. Quando se tratar de um trabalho original e o pesquisador
não dispuser de nenhum valor, faz-se =50% = 0,50.
·
Obs. 1: Quando a população for infinita, usaremos as fórmulas e
 para variáveis contínuas e discretas, respectivamente. Quando
ESTATÍSTICA APLICADA
63
a população for finita, poderemos usar estas mesmas fórmulas, porém fazendo
uma pequena correção depois com a fórmula .
Obs. 2: Quando o pesquisador não dispõe de uma pesquisa inicial e, portanto,
não tem o valor do desvio padrão, ele toma aleatoriamente 30 indivíduos
desta população e calcula o desvio padrão.
Ex.: Uma pesquisa de opinião sobre a relação universidade e comunidade
será realizada com a participação dos alunos e professores do curso de
estatística. É necessário dimensionar a amostra, tendo em vista a
impossibilidade de realização de um senso. Sabe-se que uma mesma pesquisa
foi feita no ano anterior e registrou 30% de satisfação da população em
relação ao trabalho que a universidade desenvolve com a comunidade. Qual
será o número de indivíduos que farão parte desta amostra se a comunidade
é de aproximadamente 8000 pessoas? Considere o nível de confiança de
95% e o erro de amostragem de 5%.
Solução: Considerando que os dados são discretos, usaremos a fórmula
e corrigiremos depois com a fórmula .
Em que:
 amostra inicial.
n = amostra corrigida.
 = valor obtido do trabalho anterior. Probabilidade de sucesso estimado.
 = 1 – 0,30 = 0,70
d = precisão (erro de amostragem).
z = nível de confiança – abscissa da curva normal para 95% z = 1,96
O valor da amostra inicial é:
A amostra corrigida é:
Resultado: A amostra calculada terá 311 indivíduos.
EXEMPLIFICANDO
UNIDADE 5 - NOÇÕES DE AMOSTRAGEM
64
É HORA DE SE AVALIAR!
Não esqueça de realizar as atividades desta unidade de
estudo, presentes no caderno de exercício! Elas irão ajudá-
lo a fixar o conteúdo, além de proporcionar sua autonomia
no processo de ensino-aprendizagem. Caso prefira, redija
as respostas no caderno e depois as envie através do nosso
ambiente virtual de aprendizagem (AVA). Interaja conosco!
Vimos, nesta unidade, vários processos para o cálculo de n (tamanho
da amostra). Em uma pesquisa, o tamanho da amostra deve ser cuidado
somente e calculado, pois do contrário, pode comprometer todo um trabalho.
Na próxima unidade vamos estudar o cálculo das Probabilidades.
ESTATÍSTICA APLICADA
65
U
N
ID
A
D
E
 6
CÁLCULO DAS PROBABILIDADES
Todas as vezes que se estudam fenômenos de observação, cumpri-se
distinguir o próprio fenômeno e o modelo matemático (determinístico ou
probabilístico), que melhor o explica.
Os fenômenos estudados pela estatística, são fenômenos que estão
sujeitos ao acaso (fenômenos aleatórios), porque mesmo em condições
normais de experimentação variam de uma observação para outra.
Para fenômenos aleatórios adotar-se-á um modelo matemático
probabilístico chamado de: Cálculo das Probabilidades. Este é o objeto de
estudo de nossa unidade.
OBJETIVO DA UNIDADE:
Caracterizar os experimentos aleatórios calcular as possibilidades de
acontecimento de tais experimentos, a chance de um evento ocorrer ou não,
ou seja, a probabilidade de sucesso ou insucesso.
PLANO DA UNIDADE:
• Caracterização de um experimento aleatório
• Espaço amostral
• Evento
• Eventos mutuamente exclusivos
• Definição de Probabilidade
• Principais teoremas
• Probabilidades finitas dos espaços amostrais finitos
• Espaços amostrais finitos equiprováveis
• Probabilidade condicional
• Teorema do produto
• Independência estatística
Bons estudos!
UNIDADE 6 - CÁLCULO DAS PROBABILIDADES
66
CARACTERIZAÇÃO DE UM EXPERIMENTO ALEATÓRIO
A fim de se entender melhor a caracterização dos experimentos, convém
observar o que há de comum nos seguintes experimentos:
Retirar uma carta de um baralho de 52 cartas e observar o seu naipe.
Retirar com ou sem reposição, bolas de uma urna, que contém 5 bolas
brancas e 6 pretas.
Jogar um dado e observar o número mostrado na face de cima.
A análise desses experimentos revela:
a) cada experimento poderá ser repetido indefinidamente sob as mesmas
condições;
b) não se conhece um particular valor do experimento a priori, porém podem-
se descrever todos os possíveis resultados – as probabilidades.
c) quando o experimento for repetido um grande número de vezes, surgirá
uma regularidade, isto é, haverá uma estabilidade da fração f = r/n
(freqüência relativa), em que n é o número de repetições e r o número de
sucesso de um particular resultado estabelecido antes da realização.
Como veremos adiante, a característica (c) é de fundamental
importância para a avaliação da probabilidade de certo evento.
ESPAÇO AMOSTRAL
Para cada experimento , define espaço amostral S o conjunto de
todos os possíveis resultados desse experimento.
a) Jogar um dado e observar o número da face de cima.
S = {1, 2, 3, 4, 5, 6}
b) jogar duas moedas e observar o resultado.
S = {(ca, ca); (ca, co); (co, ca); (co, co)}, onde ca = cara e co = coroa.
Obs: S poderá ser um conjunto finito ou infinito enumerável. Trataremos de
conjuntos finitos.
o símbolo significa ex-
perimento.
EXEMPLIFICANDO
ESTATÍSTICA APLICADA
67
EVENTO
É um conjunto de resultados do experimento, isto é, um subconjunto
de S. Inclusive e o próprio S.
Usando as operações com conjuntos, podemos formar novos eventos.
Assim:
· É o evento que ocorre se pelo menos um deles ocorrer.
· É o evento que ocorre se ambos ocorrerem simultaneamente.
· É o evento que ocorre se A não ocorre.
a) jogar três moedas e observar o resultado.
S = {(ca, ca, ca); (ca, ca, co); (ca, co, ca); (co, ca, ca);
( co, co, ca); (co, ca, co); (ca, co, co); (co, co, co)}
A = Evento ocorrer pelo menos duas caras.
A = {(ca, ca, ca); (ca, ca, co); (ca, co, ca) ; (co, ca, ca)}
b) lançar um dado e observar o número da face de cima.
S = {1, 2, 3, 4, 5, 6}
B = Evento ocorrer número par.
B = {2, 4, 6}
Sendo S um espaço amostral finito com n elementos, pode-se verificar
que o número total de eventos extraído de S é 2n.
EVENTOS MUTUAMENTE EXCLUSIVOS
Dois eventos A e B são ditos mutuamente exclusivos se A e B não
puderem ocorrer simultaneamente, isto é, .
jogar um dado e observar o resultado
S = {1, 2, 3, 4, 5, 6}
A ocorrer número par – {2, 4, 6}
B ocorrer número ímpar – {1, 3, 5}
Eventos mutuamente exclusivos ou disjuntos.
DEFINIÇÃO DE PROBABILIDADE
Dado um experimento aleatório e S o espaço amostral, a
probabilidade de um evento, Pr(A) é uma função definida em S, que associado
a cada evento um número real, satisfaz os seguintes axiomas:
·
· Pr(S) = 1
·
EXEMPLIFICANDO
EXEMPLIFICANDO
UNIDADE 6 - CÁLCULO DAS PROBABILIDADES

Continue navegando