Buscar

Apostila Probabilidade e Estatística para Bacharelado em Sistemas de Informação

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 101 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 101 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 101 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

FACULDADES KENNEDY
PROBABILIDADE E ESTATÍSTICA PARA BACHARELADO EM
SISTEMAS DE INFORMAÇÃO
PROF. AMINTAS PAIVA AFONSO
 IPATINGA
 2006
- 1 -
ÍNDICE
1 ESTATÍSTICA
1.1 Introdução à Estatística
 1.1.1 Método Estatístico
 1.1.2 A Estatística
 1.1.3 Fases do Método Estatístico
 1.1.4 A Estatística nas Empresas
 1.1.5 Atividades Complementares
1.2 População e Amostra
 1.2.1 Atividades Complementares
1.3 Variáveis quantitativas contínuas e discretas
 1.3.1 Atividades Complementares
1.4 Variáveis qualitativas nominais e ordinais
 1.4.1 Atividades Complementares
1.5 Planejamento de experimento e amostragem
 1.5.1 Controlando os Efeitos das Variáveis
 1.5.2 Replicação e Tamanho da Amostra
 1.5.3 Aleatorização e Outras Estratégias Amostrais
 1.5.4 Erros Amostrais 
 1.5.5 Atividades Complementares 
1.6 Tabelas de freqüência
 1.6.1 Tabelas
 1.6.2 Séries Estatísticas
 1.6.3 Séries Conjugadas. Tabela de Dupla Entrada
 1.6.4 Dados Absolutos e Dados Relativos
 1.6.5 Atividades Complementares
 1.6.6 Distribuição de Freqüência
 1.6.7 Atividades Complementares
1.7 Gráficos Estatísticos
 1.7.1 Diagramas
 1.7.2 Gráfico Polar
 1.7.3 Cartograma
 1.7.4 Pictograma
 1.7.5 Atividades Complementares
- 2 -
2 MEDIDAS ESTATÍSTICAS
2.1 Medidas de tendência central (média, mediana, moda)
 2.1.1 Média Aritmética (X)
 2.1.2 Moda (Mo)
 2.1.3 Mediana (Md)
 2.1.4 Atividades Complementares
2.2 Medidas de Dispersão ou de Variabilidade
 2.2.1 Amplitude Total
 2.2.2 Variância e Desvio Padrão
 2.2.3 Coeficiente de Variação
 2.2.4 Atividades Complementares
3 PROBABILIDADE
3.1 Experimento Aleatório
3.2 Espaço Amostral
3.3 Eventos
3.4 Probabilidade
3.5 Eventos Complementares
3.6 Eventos Independentes
3.7 Eventos Mutuamente Exclusivos
3.8 Exercícios resolvidos
3.9 Atividades Complementares
3.10 Teorema de Bayes
- 3 -
1 CONCEITOS FUNDAMENTAIS
1.1 Introdução à Estatística
Todas as ciências têm suas raízes na história do homem.
A Matemática, que é considerada “a ciência que une à clareza do raciocínio a síntese da
linguagem”, originou-se do convívio social, das trocas, da contagem, com caráter prático,
utilitário, empírico.
A Estatística, ramo da Matemática Aplicada, teve origem semelhante.
Embora a palavra ESTATÍSTICA ainda não existisse, há indícios de que 3.000 anos a.C.
já se faziam censos na Babilônia, China e Egito, objetivando a taxação de impostos.
A própria Bíblia leva-nos a essa recuperação histórica: O livro quarto (Números) do velho
testamento começa com uma instrução a Moisés: Fazer um levantamento dos homens de
Israel que estivessem aptos para guerrear.
Na época do imperador César Augusto, saiu um edito para que se fizesse um censo em
todo o império romano. (A palavra “CENSO” deriva de “CENSERE” que em latim,
significa “TAXAR”.)
Por isso, diz a Bíblia, Maria e José viajaram para Belém.
A palavra ESTATÍSTICA vem de “STATUS” (ESTADO, em latim). Sob essa palavra
acumularam-se descrições e dados relativos ao Estado. A ESTATÍSTICA, nas mãos dos
estadistas, constituiu-se uma verdadeira ferramenta administrativa.
Em 1805, Guilherme, o conquistador, ordenou que se fizesse um levantamento
estatístico da Inglaterra. Esse levantamento deveria incluir informações sobre terras,
proprietários, uso da terra, empregados e animais. Serviria, também, de base para o
cálculo de impostos. Tal levantamento originou um volume intitulado “Domesday Book”.
No século XVII ganhou destaque na Inglaterra, a partir das tábuas de mortalidade, a
aritmética política, de John Graunt, que consistiu de exaustivas análises de nascimentos
e mortes. Dessas análises resultou a conclusão, entre outras, de que a porcentagem de
nascimentos de crianças do sexo masculino era ligeiramente superior à de crianças do
sexo feminino.
E saibam que as Tábuas de Mortalidade usadas hoje pelas companhias de seguros
originam-se de estudos como esse.
A palavra ESTATÍSTICA (“STATISTICS”) foi cunhada pelo acadêmico alemão
GOTTFIRIED ACHENWALL (Godofredo) por volta da metade do século XVIII. Deixaram-se
de lado o simples levantamento e o registro de dados numéricos para proceder ao estudo
de como tirar conclusões sobre o todo, observando parte desse todo. O todo seria
a população e a parte do todo, a amostra.
1.1.1 Método Estatístico
1.1.1.1 O Método Científico
Método é um conjunto de meios dispostos convenientemente para se chegar a um fim
que se deseja.
Dos métodos científicos, vamos destacar o método experimental e o estatístico.
- 4 -
1.1.1.2 O Método Experimental
O método experimental consiste em manter constantes todas as causas (fatores),
menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos,
caso existam.
É o método preferido no estudo da Química, da Física etc.
1.1.1.3 O Método Estatístico
Muitas vezes temos necessidade de descobrir fatos em um campo em que o método
experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o
fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a
causa que, naquele momento, nos interessa.
Exemplo:
→ A determinação das causas que definem o preço de uma mercadoria. Para aplicarmos
o método experimental, teríamos que fazer variar a quantidade da mercadoria e
verificar se tal fato iria influenciar seu preço.
Porém, seria necessário que não houvesse alteração nos outros fatores. Assim, deveria
existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos
consumidores deveria permanecer constante, seria necessária a fixação do nível geral
dos preços das outras necessidades etc. Mas isso tudo é impossível.
Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso,
denominado método estatístico.
O método estatístico, diante da impossibilidade de manter as causas constantes,
admite todas essas causas presentes variando-as, registrando essas variações e
procurando determinar, no resultado final, que influências cabem a cada uma delas.
1.1.2 A Estatística
A utilização das PESQUISAS é muito comum nas mais diversas atividades humanas.
Muitas decisões são tomadas tendo como ponto de partida a análise de resultados de
cuidadosas pesquisas.
Exemplos:
→ Na época das eleições, as pesquisas eleitorais fornecem elementos para que os
partidos e os candidatos redimensionem a campanha eleitoral.
→ Quando do levantamento de um novo produto, as indústrias realizam pesquisas junto
aos consumidores para sondar a aceitação desse produto.
→ Emissoras de televisão frequentemente fazem pesquisas com os espectadores, a fim
de observarem a aceitação de seus programas.
Conclusão:
A Estatística é uma parte da Matemática Aplicada que estuda métodos para a coleta, a
organização, descrição, análise e interpretação de dados. Todo o seu estudo objetiva,
entre outros, a tomada de decisões.
A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva,
enquanto a análise e a interpretação desses dados ficam a cargo da Estatística
Indutiva ou Inferencial.
- 5 -
A análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de uma
empresa.
Exemplo:
→ Na Faculdade Pereira de Freitas, o conhecimento de seus problemas (condições de
funcionamento, produtividade), a formulação de soluções apropriadas e um
planejamento objetivo de ação.
1.1.3 Fases do Método Estatístico
Podemos distinguir no método estatístico as seguintes fases:
1.1.3.1 Coleta de Dados
A coleta de dados numéricos pode ser direta ou indireta.
A coleta é direta quando feita sobre elementosinformativos de registro obrigatório
(nascimentos, casamentos e óbitos, importação e exportação de mercadorias),
elementos pertinentes aos prontuários dos alunos de uma faculdade ou, ainda, quando
os dados são coletados pelo próprio pesquisador através de inquéritos e questionários,
como é o caso das notas de verificação e de exames, do censo demográfico etc.
A coleta direta de dados pode ser classificada relativamente ao fator tempo em:
a. contínua (registro) – quando feita continuamente, tal como a de nascimentos e
óbitos e a de freqüência dos alunos às aulas;
b. periódica – quando feita em intervalos constantes de tempo, como os censos
(de 10 em 10 anos) e as avaliações periódicas dos alunos;
c. ocasional – quando feita extemporaneamente, a fim de atender a uma
conjuntura ou a uma emergência, como no caso de epidemias que assolam ou
dizimam rebanhos inteiros.
A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou
do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como
exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de
dados colhidos por uma coleta direta.
1.1.3.2 Crítica dos Dados
Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis
falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto,
que possam influir sensivelmente nos resultados.
A crítica é externa quando visa às causas dos erros por parte do informante, por
distração ou má interpretação das perguntas que lhe foram feitas; é interna quando visa
observar os elementos originais dos dados da coleta.
1.1.3.3 Apuração dos Dados
Nada mais é do que a soma e o processamento dos dados obtidos e a disposição
mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica.
1.1.3.4 Exposição ou Apresentação dos Dados
Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser
apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame
daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas
típicas.
- 6 -
1.1.3.5 Análise dos resultados
Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o todo
(população) a partir de informações fornecidas por parte representativa do todo
(amostra). Assim, realizadas as fazes anteriores (Estatística Descritiva), fazemos
uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou
Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados
conclusões e previsões.
1.1.4 A Estatística nas Empresas
No mundo atual, a empresa é uma das vigas-mestras da Economia dos povos.
A direção de uma empresa, de qualquer tipo, incluindo as estatais e governamentais,
exige de seu administrador a importante tarefa de tomar decisões, e o conhecimento e
o uso da Estatística facilitarão seu tríplice trabalho de organizar, dirigir e controlar a
empresa.
Por meio de sondagem, de coleta de dados e de recenseamento de opiniões,
podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e
financeiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer
suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio
ou longo prazo.
A Estatística ajudará em tal trabalho, como também na seleção e organização da
estratégia a ser adotada no empreendimento, ainda, na escolha das técnicas de
verificação e avaliação da quantidade e da qualidade do produto e mesmo dos
possíveis lucros e/ou perdas.
Tudo isso que se pensou, que se planejou, precisa ficar registrado, documentado para
evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do material e,
ainda, para um controle eficiente do trabalho.
O esquema do planejamento é o plano, que pode ser resumido com o auxílio da
Estatística, em tabelas e gráficos, que facilitarão a compreensão visual dos cálculos
matemático-estatísticos que lhes deram origem.
O homem de hoje, em suas múltiplas atividades, lança mão de processos e técnicas
estatísticos, e só estudando-os evitaremos o erro das generalizações apressadas a
respeito de tabelas e gráficos apresentados em jornais, revistas e televisão,
frequentemente cometido quando se conhece apenas “por cima” um pouco de Estatística.
- 7 -
1.1.5 Atividades Complementares
1. Complete: O método experimental é o mais usado por ciências como: 
Química, da Física etc.
2. As ciências humanas e sociais, para obterem os dados que buscam, lançam mão de
que método?
Embora mais difícil e menos preciso, o método estatístico.
3. O que é Estatística?
A Estatística é uma parte da Matemática Aplicada que estuda métodos para a coleta, a organização,
descrição, análise e interpretação de dados. Todo o seu estudo objetiva, entre outros, a tomada de
decisões.
4. Cite as fases do método estatístico.
Coleta de Dados, Crítica dos Dados, Apuração dos Dados, Exposição ou Apresentação dos Dados e Análise
dos resultados
5. Para você, o que é coletar dados?
A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos,
casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos
alunos de uma faculdade ou, ainda, quando os dados são coletados pelo próprio pesquisador através de
inquéritos e questionários, como é o caso das notas de verificação e de exames, do censo demográfico etc.
A coleta direta de dados pode ser classificada relativamente ao fator tempo em:
a. contínua (registro) – quando feita continuamente, tal como a de nascimentos e óbitos e a de freqüência
dos alunos às aulas;
b. periódica – quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as
avaliações periódicas dos alunos;
c. ocasional – quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma
emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros.
A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de
outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre
a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta.
6. Para que serve a crítica dos dados?
Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições,
a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam influir sensivelmente nos
resultados.
A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má
interpretação das perguntas que lhe foram feitas; é interna quando visa observar os elementos originais
dos dados da coleta.
7. O que é apurar dados?
Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de
classificação. Pode ser manual, eletromecânica ou eletrônica.
8. Como podem ser apresentados ou expostos os dados?
Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma
adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento
estatístico e ulterior obtenção de medidas típicas.
9. As conclusões, as inferências pertencem a que parte da Estatística?
Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses
resultados conclusões e previsões.
10. Cite três ou mais atividades do planejamento empresarial em que a Estatística se faz
necessária.
Podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis,
as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maiorpossibilidade de serem alcançados a curto, médio ou longo prazo. Na seleção e organização da estratégia a
ser adotada no empreendimento, ainda, na escolha das técnicas de verificação e avaliação da quantidade
e da qualidade do produto e mesmo dos possíveis lucros e/ou perdas.
1.2 População e Amostra
- 8 -
As pessoas de uma comunidade podem ser estudas sob diversos ângulos. Por exemplo,
podem ser estudadas quanto ao sexo (masculino ou feminino), quanto à estatura
(baixa, média ou alta), quanto à renda (pobres e ricas), etc.
Sexo, estatura e renda são variáveis, isto é, são propriedades as quais podemos
associar conceitos ou números e assim expressar, de certa maneira, informações sob
a forma de medidas.
POPULAÇÃO (ou UNIVERSO) é qualquer conjunto de INFORMAÇÕES que tenham,
entre si, uma CARACTERÍSTICA COMUM.
Voltemos às pessoas da citada comunidade. O conjunto de TODAS as estaturas constitui
uma POPULAÇÃO DE ESTATURAS; o conjunto de TODOS os pesos constitui uma
POPULAÇÃO DE PESOS; o conjunto de TODAS as cores de olhos constitui uma
POPULAÇÃO DE CORES DE OLHOS.
Então, população não implica necessariamente GENTE e PESSOAS. O que importa é a
VARIÁVEL estudada. Você pode ter uma POPULAÇÃO DE PESO DE RATOS ou
COMPRIMENTOS DE MINHOCAS.
Se uma população for muito grande (por exemplo, o conjunto de todas as estaturas de
uma comunidade), o pesquisador poderá ter um trabalho astronômico para estudá-la. E
em alguns casos os resultados serão sempre falhos.
É só pensar no número de nascimentos e mortes diários, isto é, na ENTRADA e SAÍDA
de informações, para avaliar a dificuldade e a imprecisão do trabalho.
Nesses casos, o estatístico recorre a uma AMOSTRA, que, basicamente, constitui uma
REDUÇÃO da população a DIMENSÕES MENORES, SEM PERDA DAS
CARACTERÍSTICAS ESSENCIAIS.
Exemplo:
Imaginemos uma escola com 400 alunos (meninos, idades entre 6 e 16 anos).
Se quisermos fazer um estudo das estaturas (qual a estatura média?) podemos
simplificar o trabalho colhendo uma amostra de, digamos, 40 alunos e estudar o
COMPORTAMENTO DA VARIÁVEL ESTATURA APENAS nesses alunos.
A variável estudada poderia ser inteligência, número de filhos, número de cáries, notas
em história ou renda familiar.
Uma amostra, para ser BOA, tem de ser REPRESENTATIVA, ou seja, deve conter EM
PROPORÇÃO tudo o que a população possui QUALITATIVA E QUANTITATIVAMENTE.
E tem de ser IMPARCIAL, isto é, todos os elementos da população devem ter IGUAL
OPORTUNIDADE de fazer parte da amostra.
Logo, algum amigo poderá fazer parte da amostra, mas não todos.
Definições:
- 9 -
VARIÁVEIS (DADOS) são observações (tais como medidas, sexos, respostas de
pesquisas) que tenham sido coletados.
ESTATÍSTICA é uma coleção de métodos para o planejamento de experimentos,
obtenção de dados e, consequentemente organização, resumo, apresentação, análise,
interpretação e elaboração de conclusões baseadas nos dados.
Uma POPULAÇÃO é a coleção completa de todos os elementos (escores, pessoas,
medidas e outros) a serem estudados. A coleção é completa no sentido de que inclui
todos os sujeitos a serem estudados.
Uma AMOSTRA é um subconjunto finito de uma população.
1.2.1 Atividades Complementares
1. Identifique (a) a amostra e (b) a população. Determine, também, se é provável
também que a amostra seja representativa da população.
a. Um repórter da Veja se coloca em uma esquina e pergunta a 10 adultos se acham
que o atual presidente está fazendo um bom trabalho. 
Amostra: os 10 adultos selecionados; População: todos os adultos; não representativa
b. O Datafolha pesquisa 5000 famílias selecionadas aleatoriamente e verifica que
entre as televisões em uso 19% estão ligadas no programa O Aprendiz (com base
em dados da Folha de São Paulo).
c. Em uma pesquisa Gallup de 1059 adultos selecionados aleatoriamente, 30%
responderam “sim” quando lhes foi perguntado “você tem uma arma em casa?”.
Amostra: os 1059 adultos selecionados; População: todos os adultos; representativa
d. Uma estudante de graduação da Universidade Federal do Pará realiza um projeto
de pesquisa sobre como adultos brasileiros se comunicam. Ela começa com uma
pesquisa pelo correio enviada a 500 adultos que conhece. Ela pede a eles que
devolvam por correio a resposta a esta pergunta: “Você prefere usar o correio
eletrônico ou o correio usual?” Ela recebe de volta 65 respostas, com 42 delas
indicando preferência pelo correio usual.
2. Imagine que alguém resolveu fazer uma pesquisa sobre o esporte preferido da
população brasileira. Para tanto, entrevistou 2000 pessoas. Esta amostra da
população brasileira estaria sendo representativa se:
1. todas fossem do mesmo sexo?
2. todas fossem da mesma idade?
3. todas fossem da mesma cidade?
4. todas fossem da mesma classe social?
1.3 Variáveis (Dados) Quantitativas Contínuas e Discretas
- 10 -
A cada fenômeno corresponde um número de resultados possíveis.
Exemplo:
→ para o fenômeno “sexo” não dois os resultados possíveis: masculino e feminino;
→ para o fenômeno “número de filhos” há um número de resultados possíveis, expresso
através dos números naturais: 0, 1, 2, 3, 4, ..., n;
→ para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem
tomar um número infinito de valores numéricos dentro de um determinado intervalo.
Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.
Os exemplos acima nos dizem que as variáveis podem ser:
a. quantitativa – quando seus valores são expressos em números (salários dos
operários, idade dos alunos de uma escola etc.). Uma variável quantitativa que
pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de
variável contínua; uma variável que só pode assumir valores pertencentes a
um conjunto enumerável recebe o nome de variável discreta.
b. qualitativa – quando seus valores são expressos por atributos: sexo (masculino
– feminino), cor da pele (branca, preta, amarela, vermelha, parda) etc.;
Definimos os termos população e amostra. Os dois termos seguintes são usados para
distinguir entre casos nos quais temos dados para uma população inteira, e casos nos
quais temos dados apenas para uma amostra.
Definições:
Um PARÂMETRO é uma medida numérica que descreve alguma característica de uma
população.
Uma ESTATÍSTICA é uma medida numérica que descreve alguma característica de uma
amostra.
Exemplos:
→ Parâmetros: Quando Lula foi eleito presidente em 2006, ele recebeu 60,83% dos
95.838.220 votos no segundo turno. Se encararmos a coleção de todos esses votos
como a população a ser considerada, então 60,83% é um parâmetro, não uma
estatística. 
→ Estatística: Com base em uma amostra de 877 executivos pesquisados, achou-se
que 45% deles não contratariam alguém que cometesse um erro tipográfico em sua
solicitação de emprego. Esse número de 45% é uma estatística porque se baseia em
uma amostra, não da população inteira de todos os executivos.
Alguns conjuntos de dados consistem em números (tais como 66 um e 72 um), enquanto
outros são não numéricos (tais como cor dos olhos: verde e marrom). Os termos dados
quantitativos e dados qualitativos são em geral usados para distinguir entre esses
dois tipos.
Definições:
- 11 -
Dados Quantitativos consistem em números que representam contagens ou medidas.
Dados Qualitativos (ou categóricos ou de atributos) podem ser separados em
diferentes categorias que se distinguem por alguma característica não-numérica.
Exemplos:
→ Dados Quantitativos: Os pesos de modelos.
→ Dados Qualitativos: Os sexos (masculino/feminino) de atletas profissionais.
Quando trabalhamos com dados quantitativos, é importante usar as unidades de medida
apropriadas, tais como dólares, horas, metros, e assim por diante. Devemos ter especial
cuidado em observar referências como “todas as quantidades estão em milhares de
dólares” ou “todos os tempos estão em centésimosde segundo” ou “as unidades são
quilogramas”. Ignorar tais unidades de medida pode levar a conclusões muito erradas. A
NASA perdeu seu Mars Climate Orbiter de $125 milhões de dólares quando ele bateu
porque o programa de controle tinha dados de aceleração em unidades inglesas, que
foram interpretadas incorretamente como unidades métricas.
Os dados quantitativos podem ainda ser descritos pela distinção entre os tipos
discretos e contínuos.
Definições:
Dados Discretos surgem quando o número de valores possíveis é ou um número finito
ou uma quantidade “enumerável”. (Isto é, o número de valores possíveis é 0, ou 1, ou 2
e assim por diante.)
Dados (numéricos) Contínuos resultam de infinitos valores possíveis que
correspondem a alguma escala contínua que cobre um intervalo de valores sem vazios,
interrupções ou saltos.
Exemplos:
→ Dados Discretos: Os números de ovos que as galinhas botam são dados discretos
porque representam contagens. 
→ Dados Contínuos: As quantidades de leite das vacas são dados contínuos porque são
medidas que podem assumir qualquer valor em um intervalo contínuo. Durante um
dado intervalo de tempo, uma vaca pode produzir uma quantidade de leite que pode
ser qualquer valor entre 0 e 5 galões. Seria possível obter-se 2,34315 galões, porque
a vaca não é restrita a quantidades discretas de 0, 1, 2, 3, 4 ou 5 galões.
De modo geral, as medições dão origem a variáveis contínuas e as contagens ou
enumerações, a variáveis discretas.
1.3.1 Atividades Complementares
- 12 -
1. Determine se o valor dado é uma estatística ou um parâmetro.
a. O Senado atual do Brasil compõe-se de 75 homens e 6 mulheres. Parâmetro
b. Uma amostra de estudantes é selecionada e a média do número de livros-texto
comprados é 4,2.
c. Uma amostra de estudantes é selecionada e a média de tempo de espera na fila
para comprar livros-texto é 0,65 h. Estatística
d. Em um estudo de todos os 2223 passageiros a bordo do Titanic, verificou-se que
706 sobreviveram quando ele afundou.
2. Determine se os valores dados são de um conjunto de dados discreto ou contínuo.
a. O salário de presidente de George Washington era de $25.000 por ano, e o valor
atual do salário do presidente é de $400.000. Contínuo
b. Um estudante de estatística obtém dados amostrais e encontra que o peso médio
dos carros na amostra é de 1200 Kg. 
c. Em uma pesquisa com 1059 adultos, verificou-se que 39% deles tinham armas em
suas casas (com base em uma pesquisa do Gallup). Discreto
d. Quando 19.218 máscaras de gás do exército americano foram testadas, verificou-
se que 10.322 delas eram defeituosas (com base em dados da revista Times).
1.4 Variáveis Qualitativas Nominais e Ordinais
- 13 -
Outra maneira comum de classificar dados é usar quatro níveis de mensuração:
nominal, ordinal, intervalar e razão.
Tudo parece indicar que uma das grandes preocupações do homem é – e sempre foi – a
MEDIÇÃO: Medir terras, a quantidade de gado no pasto, a riqueza, porções de
medicamentos etc.
A invenção dos números (isto é, de palavras capazes de expressar quantidades) permitiu
que o homem deixasse de guardar informações num lugar físico, concreto (ex: pedrinhas
e gravetos), para guardá-las num lugar psicológico: A MEMÓRIA.
Com a escrita, o homem supera esse problema. O ALGARISMO – representação gráfica
do número possibilitou-lhe anotar as informações como garantia contra o esquecimento.
MEDIR uma magnitude (GRANDEZA) significa associar a essa magnitude um NÚMERO
REAL.
Quando se mede uma grandeza, realizam-se em cadeia, as seguintes operações:
- Definição do que vai ser medido;
- Definição de um critério para a medição, isto é, de uma ESCALA;
- Leitura;
- Interpretação.
Embora número seja sempre número, as magnitudes diferem umas das outras quanto à
classe a que pertencem: Estatura, peso, velocidade, inteligência, maturidade,
temperatura, beleza etc.
O processo de mensuração depende do NÍVEL, isto é, da CLASSE a que pertence a
magnitude (= GRANDEZA).
Cada nível supõe certas características associadas às grandezas nele contidas. Assim, há
características de 1º Nível, 2º Nível, 3º Nível e 4º Nível. A complexidade e a informação
aumentam com o Nível.
Níveis de Mensuração:
1º NÍVEL – O Nível Nominal de Mensuração é caracterizado por dados que consistem
em nomes, rótulos ou categorias apenas. Os dados não podem ser ordenados (tal como
do menor para o maior). É o nível de mensuração mais baixo, mais rudimentar possível.
Sua escala de medida chama-se NOMINAL. A base, o fundamento para a atribuição dos
números é de natureza QUALITATIVA, DISTINTIVA.
Exemplos:
→ Sim/não/indeciso: Respostas de pesquisa.
→ Cores: As cores de carros dirigidos por estudantes da faculdade (vermelho, preto,
azul, branco, e assim por diante).
Numa sala há 8 alunos, 5 dos quais do sexo masculino. Convencionando que os homens
serão designados por 1 e as mulheres, por 2, tudo o que se pode fazer é escrever.
o u dizer: 
- 14 -
João → 1
Pedro → 1
Alberto → 1
Carlos → 1
Otávio → 1
Maria → 2
Adriana → 2
Patrícia → 2
- Há 5 x 1 = 5 Homens
- Há 3 x 2 = 3 Mulheres
Notar que não tem sentido matemático fazer a operação 3 x 2 = 6, pois 2 NÃO
REPRESENTA uma QUANTIDADE, mas sim, uma CATEGORIA. Por essa razão, esse 2
poderia ser substituído pelo símbolo , daí resultando 3 = 3 mulheres.
Como os dados nominais não têm ordenação ou significado numérico, eles não devem
ser usados para cálculos. Algumas vezes, usam-se números associados às diferentes
categorias (especialmente quando os dados são codificados para computador),
mas esses números não têm qualquer significado computacional e qualquer média
calculada com eles não tem qualquer significado.
Conclusão: No 1º Nível, os algarismos têm cara de números, mas não são números:
São CATEGORIAS. Portanto, não são possíveis operações aritméticas com valores
atribuídos às VARIÁVEIS. O 1º Nível presta-se a CODIFICAÇÕES e estas comportam,
no máximo, CONTAGENS.
Outros exemplos:
→ Números de telefones: João → 3292-3541
→ Placas de automóveis: APA 4506 (carro da Adriana)
→ Camisas de jogadores: Pelé → 10
2º NÍVEL – Os dados estão no Nível Ordinal de Mensuração se podem ser arranjados
em alguma ordem, mas diferenças entre os valores dos dados ou não podem ser
determinadas ou não são significativas. Este nível já é um pouco mais elaborado que o
anterior e corresponde ao que popularmente se designa por ORDENAÇÃO; a escala de
medida chama-se ORDINAL.
As grandezas de 2º nível podem ser avaliadas em termos de mais que ou menos que,
embora a quantificação precisa seja impossível.
Exemplos:
→ Postos: Com base em vários critérios, uma revista classifica cidades de acordo com
suas “condições de habitação”. Esses postos (primeiro, segundo, terceiro, e assim por
diante) determinam uma ordenação. No entanto, as diferenças entre os postos não
têm significado. Por exemplo, a diferença de “segundo menos primeiro” pode sugerir
2 - 1 = 1, mas essa diferença de 1 não tem significado porque não é uma quantidade
que possa ser comparada a outras tais diferenças. A diferença entre a primeira e a
segunda, cidades, não é a mesma que a diferença entre a segunda e a terceira
cidades. Usando a classificação da revista a diferença entre Belo Horizonte e Ipatinga,
não pode ser comparada quantitativamente com a diferença entre Belém e Marabá.
→ Notas em Cursos: Um professor de faculdade atribui notas A, B, C, D ou F. Essas
notas podem ser arranjadas em ordem, mas não podemos determinar as diferenças
entre elas. Por exemplo, sabemos que A é maior do que B (assim, há uma ordem),
mas não podemos subtrair B de A (assim, a diferença não pode ser encontrada).
→ Notas em Cursos: resultantes de provas tradicionais – produzem mensurações de 2º
nível. Assim, se João tirou 8 e Maria, 4, é mais possível concluir que João sabe mais
que Maria, embora NÃO se possa concluir que João saiba o dobro do que ela sabe.
Dados ordinaisfornecem informações sobre comparações relativas, mas não as
magnitudes das diferenças. Usualmente, os dados ordinais não devem ser usados para
cálculos, tais como uma média, mas essa orientação é, algumas vezes, violada (tal como
quando usamos notas dadas por letras para calcular o conceito médio da turma).
- 15 -
3º NÍVEL – O Nível Intervalar de Mensuração é como o nível ordinal, com a
propriedade adicional de que a diferença entre quaisquer dois valores de dados é
significativa. No entanto, os dados nesse nível não têm um ponto inicial zero natural
(quando o nada da quantidade está presente). É no 3º nível que surge, pela 1ª vez, uma
escala de medida propriamente dita. É a escala INTERVALAR, caracterizada pela
existência de:
- Uma unidade de medida (arbitrária, porém fixa);
- Um zero relativo, isto é, convencional.
Exemplos:
→ Anos: Os anos 1000, 2000, 1776 e 1492. (O tempo não começa no ano 0, de modo
que o ano 0 é arbitrário e não um ponto inicial zero natural que represente “nenhum
tempo”.)
→ As escalas termométricas. O zero é convencional em todas, bem como a distância
entre dois traços contíguos – os chamados GRAUS.
Assim, se o corpo A está a 40ºC e outro, B, a 10ºC, não tem sentido dizer que A é
“quatro vezes mais quente” que B só porque 40:10 = 4. Os valores são ordenados, e
podemos determinar a sua diferença de 30ºC. No entanto, não há um ponto inicial
natural. O valor de 0ºC pode parecer um ponto inicial, mas é arbitrário e não significa
ausência total de calor. Como 0ºC não é um ponto inicial zero natural, é errado dizer
que 50ºC é duas vezes mais quente do que 25ºC. Mas não há dúvida de que A é bem
mais quente que B.
4º NÍVEL – O Nível de Mensuração de Razão é o nível intervalar com a propriedade
adicional de que há também um ponto inicial zero natural (onde zero indica que nada da
quantidade está presente). Para valores nesse nível, diferenças e razões são, ambas,
significativas. O 4º nível define a chamada escala de razão ou RACIONAL. Essa escala é
muito parecida com a de 3º nível, exceto quanto à origem: o zero é absoluto, isto é, é
zero mesmo.
Em função disso, todas as operações aritméticas passam a ter sentido e, portanto, NÃO
HÁ CÁLCULO QUE NÃO POSSA SER FEITO.
Exemplos:
→ Pesos: Os pesos (em quilates) de diamantes de anéis (0 representa nenhum peso, e
4 quilates é duas vezes mais que 2 quilates).
→ Preços: Os preços de livros-texto (R$0,00 representa nenhum custo, e um livro de
R$90,00 custa três vezes um livro de R$30,00).
Esse nível de mensuração é chamado nível de razão porque o ponto inicial zero torna as
razões significativas. Entre os quatro níveis de mensuração, a maior dificuldade surge
entre os níveis intervalar e de razão.
- 16 -
1.4.1 Atividades Complementares
1. Classifique as variáveis em qualitativas ou quantitativas (contínuas ou descontínuas):
a. Universo: alunos de uma faculdade.
 Variável: cor dos cabelos - ... Qualitativa
b. Universo: casais residentes em uma cidade.
Variável: número de filhos - ... Quantitativa Discreta
c. Universo: as jogadas de um dado.
Variável: o ponto obtido em cada jogada - ... Quantitativa Discreta
d. Universo: peças produzidas por certa máquina.
Variável: número de peças produzidas por hora - ... Quantitativa Discreta
e. Universo: peças produzidas por certa máquina.
Variável: diâmetro externo - ... Quantitativa Contínua
2. Quais das variáveis abaixo são discretas e quais são contínuas:
a. População: alunos de uma cidade.
 Variável: cor dos olhos.
b. População: estação meteorológica de uma cidade.
Variável: precipitação pluviométrica, durante um ano. Quantitativa Contínua
c. População: Bolsa de Valores de São Paulo.
Variável: número de ações negociadas. Quantitativa Discreta
d. População: funcionários de uma empresa.
Variável: salários. Quantitativa Discreta
e. População: pregos produzidos por uma máquina.
Variável: comprimento. Quantitativa Contínua
f. População: casais residentes em uma cidade.
 Variável: sexo dos filhos.
g. População: propriedades agrícolas do Brasil.
 Variável: produção de algodão. Quantitativa Contínua
h. População: segmentos de reta.
Variável: comprimento. Quantitativa Contínua
i. População: bibliotecas da cidade de Ipatinga.
 Variável: número de volumes. Quantitativa Discreta
j. População: aparelhos produzidos em uma linha de montagem.
 Variável: número de defeitos por unidade. Quantitativa Discreta
k. População: indústrias de uma cidade.
Variável: índice de liquidez. Quantitativa Contínua
3. Determine qual dos quatro níveis de mensuração (nominal, ordinal, intervalar, razão)
é mais apropriado.
a. Altura das jogadoras de basquete da seleção brasileira. razão
b. Classificação de “encontro as cegas” como fantástico, bom, médio, fraco,
inaceitável. 
c. Classificação da revista Consumer Reports em “melhor comprar, recomendado, não
recomendado”. ordinal
d. Números do seguro social.
e. O número de respostas “sim” recebidas quando se perguntou a 1250 motoristas se
alguma vez tinham usado o telefone celular enquanto dirigiam. razão
f. Códigos postais (CEP).
- 17 -
4. Além do Básico
a. Interpretação do Aumento da Temperatura. Na tirinha do desenho “Born
Loser” de Art Sansom, Brutus expressa satisfação com o aumento da temperatura
de 1º para 2º. Quando perguntam a ele o que há de tão bom em relação a 2 º, ele
responde “É duas vezes mais quente do que essa manhã”. Explique por que Brutus
está errado mais uma vez.
Sem qualquer ponto inicial natural, as temperaturas estão no nível intervalar de mensuração; razões
tais como “dobro” não tem significado.
b. Interpretação da Pesquisa Política. Um pesquisador entrevista 200 pessoas e
lhes pergunta sobre o partido político de sua preferência. Ele codifica as respostas
como 0 (para PT), 1 (para PSDB), 2 (para PMDB), 3 (para quaisquer outras
respostas). Ele calcula, então, a média dos números e obtém 0,95. Como se pode
interpretar esse valor?
c. Escala para Classificação de Comida. Um grupo de estudantes desenvolve uma
escala de classificação da qualidade da comida da lanchonete, com 0
representando “neutra: nem boa nem ruim”. Dão-se números negativos para
refeições ruins e números positivos para refeições boas, com o valor absoluto dos
números correspondendo a seriedade da má ou boa qualidade. As três primeiras
refeições tiveram classificações 2, 4 e -5. Qual é o nível de mensuração para tal
classificação? Justifique sua escolha.
Ordinal ou intervalar são respostas razoáveis, mas ordinal faz mais sentido porque as diferenças entre
valores não são, provavelmente, significativas. Por exemplo, a diferença entre uma comida classificada
como 1 e uma comida classificada como 2 não é, provavelmente, a mesma entre uma comida
classificada como 9 e uma comida classificada como 10.
- 18 -
1.5 Planejamento de Experimento e Amostragem
Devemos entender que o método usado para coletar dados é absoluta e criticamente
importante, e devemos saber que a aleatoriedade é particularmente importante.
 Se os dados amostrais não forem coletados de maneira apropriada, eles
podem ser de tal modo inúteis que nenhuma manipulação estatística poderá
salva-los.
 A aleatoriedade comumente desempenha papel crucial na determinação de
quais dados coletar.
Os métodos estatísticos são direcionados pelos dados. Normalmente, obtemos dados de
duas fontes distintas: estudos observacionais e experimentos.
Definições:
Em um estudo observacional, observamos e medimos características específicas, mas
não tentamos modificar os sujeitos objeto do estudo.
Em um experimento, aplicamos algum tratamento e passamos, então, a observar seu
efeito sobre os sujeitos.
Exemplos:
→ Estudo Observacional: uma pesquisa do Gallup, por exemplo, simplesmente
observa as pessoas (em geral, através de entrevistas) sem modificá-las de modo
algum.
→ Experimento: o teste clínico da droga Liptor envolve o tratamento de algumaspessoas com a droga, de modo que as pessoas tratadas são modificadas.
Definições:
Em um estudo transversal, os dados são observados, medidos e coletados em um
ponto no tempo.
Em um estudo retrospectivo (ou de controle de caso), os dados são coletados do
passado, voltando-se no tempo (através de exames de registros, entrevistas e assim por
diante).
Em um estudo prospectivo (ou longitudinal ou de coorte), os dados são coletados no
futuro, de grupos (chamados coortes) que compartilham fatores comuns.
Essas três definições se aplicam aos estudos observacionais, mas agora mudamos nossa
atenção para os experimentos. Os resultados de experimentos são algumas vezes
destruídos por causa do confundimento.
Definição:
O confundimento ocorre em um experimento quando o pesquisador não está apto a
distinguir entre os efeitos de diferentes fatores.
Tente planejar o experimento de modo que o confundimento não ocorra.
Por exemplo, suponha que um professor na faculdade experimente uma nova tática de
freqüência (“sua média no curso cai um ponto para cada aula que você mata”), mas
ocorre um inverno excepcionalmente ameno, sem chuvas ou temporais fortes que
atrapalharam a freqüência no passado. Assim, se a freqüência melhorar, não poderemos
determinar se essa demora se deveu à nova tática ou ao inverno ameno. Os efeitos da
tática de freqüência e do tempo foram confundidos.
- 19 -
1.5.1 Controlando os Efeitos das Variáveis
Um dos elementos–chave no planejamento de um experimento é o controle dos efeitos
das variáveis. Podemos obter tal controle usando dispositivos como experimentos
cegos, blocos, planejamento experimental completamente aleatorizado ou um
planejamento experimental rigorosamente controlado, descritos a seguir.
Experimento Cego - Em 1954, planejou-se um experimento maciço para testar a
eficácia da vacina Salk na prevenção da pólio, que matava ou paralisava milhares de
crianças. Naquele experimento, um grupo de tratamento recebeu a vacina Salk real,
enquanto um segundo grupo recebeu um placebo que não continha qualquer droga. Nos
experimentos que envolvem placebos, há sempre um efeito placebo, que ocorre
quando um sujeito não tratado relata melhora nos sintomas. (A melhora relatada no
grupo placebo pode ser real ou imaginada.) Esse efeito placebo pode ser minimizado ou
contabilizado através do uso de um experimento cego, uma técnica em que o sujeito
não sabe se está recebendo o tratamento ou o placebo. O experimento cego nos permite
determinar se o efeito do tratamento é ou não significativamente diferente do efeito do
placebo. O experimento da pólio foi do tipo duplo-cego, o que significa que a ocultação
ocorreu em dois níveis (1) as crianças que recebiam a injeção não sabiam se estavam
recebendo a vacina Salk ou um placebo, e (2) os médicos que davam as injeções e
avaliavam os resultados também não sabiam.
Blocos – No planejamento de um experimento para testar a eficácia de um ou mais
tratamentos, é importante colocar os sujeitos (em geral, chamados unidades
experimentais) em grupos diferentes (ou blocos) de tal modo que os grupos sejam muito
semelhantes. Um bloco é um grupo de sujeitos que são semelhantes nos modos que
possam afetar o resultado do experimento.
Ao conduzir um experimento que testa um ou mais tratamentos diferente,
forme blocos (ou grupos) de sujeitos com características similares.
Planejamento Experimental totalmente Aleatorizado – Na decisão de como associar
os sujeitos aos diferentes blocos, você pode usar a seleção aleatória ou tentar controlar
cuidadosamente a associação, de modo que os sujeitos dentro de cada bloco sejam
semelhantes. Uma abordagem é usar um planejamento experimental completamente
aleatorizado, onde os sujeitos são colocados nos blocos através de um processo de
seleção aleatória. Um exemplo de um planejamento experimental totalmente
aleatorizado é a característica do experimento da pólio: as crianças foram destinadas ao
grupo de tratamento ou ao grupo placebo através de uma seleção aleatória (equivalente
à jogada de uma moeda).
Existe uma técnica especial – Amostragem – para recolher amostras, que garante,
tanto quanto possível, o acaso na escolha.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido,
o que garante à amostra o caráter de representatividade, e isto é muito escolhido, pois,
como vimos, nossas conclusões relativas à população vão estar baseadas nos resultados
obtidos nas amostras dessa população.
Planejamento Rigorosamente Controlado – Outra abordagem para atribuir sujeitos
aos grupos é usar um planejamento rigorosamente planejado, no qual os sujeitos são
escolhidos cuidadosamente de modo que em cada bloco sejam similares em relação ao
que é importante ao experimento. Em um experimento que testa a eficácia de uma droga
feita para baixar a pressão sanguínea, se o grupo do placebo inclui um homem de 30
anos, com excesso de peso, fumante e que consome sal e gordura em abundância, o
grupo do tratamento deve incluir, também, uma pessoa com características semelhantes
(o que, nesse caso, seria fácil de achar).
- 20 -
1.5.2 Replicação e Tamanho da Amostra
Além do controle dos efeitos das variáveis, outro elemento-chave do planejamento
experimental é o tamanho das amostras. As amostras devem ser grandes o bastante
para que o comportamento errático, que é característica de amostras muito pequenas,
não disfarce os verdadeiros efeitos dos diferentes tratamentos. A repetição de um
experimento é chamada replicação, e a replicação é usada efetivamente quando temos
sujeitos suficientes para reconhecer diferenças a partir de tratamentos diferentes. (Em
outro contexto, replicação se refere à repetição ou duplicação de um experimento de
modo que os resultados possam ser confirmados ou verificados). Com replicação,
tamanhos amostrais grandes aumentam a chance de reconhecimento dos efeitos de
diferentes tratamentos. No entanto, uma amostra grande não é, necessariamente, uma
boa amostra. Embora seja necessário ter uma amostra que seja suficientemente grande,
é mais importante ter uma amostra na qual os dados tenham sido escolhidos de alguma
maneira apropriada, tal como seleção aleatória (descrita mais adiante).
Use um tamanho de amostra grande o bastante para que possa ser vista a
verdadeira natureza de quaisquer efeitos e obtenha a amostra usando um
método apropriado, tal como um baseado em aleatoriedade.
No experimento planejado para testar a vacina Salk, 200.000 crianças receberam a
verdadeira vacina e 200.000 outras crianças receberam um placebo. Como o
experimento real usou tamanhos amostrais suficientemente grandes, a eficácia da vacina
pôde ser comprovada. No entanto, embora os grupos de tratamento e de placebo fossem
muito grandes, o experimento teria sido um fracasso se os sujeitos não tivessem sido
destinados a cada grupo de um modo que tornasse ambos os grupos semelhantes no que
era importante para o experimento.
1.5.3 Aleatorização e Outras Estratégias Amostrais
Na estatística, como na vida, um dos piores erros consiste em coletar dados de uma
maneira não apropriada. Não podemos deixar de enfatizar esse ponto muito importante:
Se os dados amostrais não forem coletados de maneira adequada, eles
podem ser de tal modo inúteis que nenhuma manipulação estatística
poderá salvá-los.
Vamos, agora, definir os métodos de amostragem mais comuns.
1.5.3.1 Amostragem Aleatória simples ou casual
Definições:
Em uma amostra aleatória, membros de uma população são selecionados de tal modo
que cada membro individual tenha chance igual de ser selecionado.
Uma amostra aleatória simples (amostragem casual) de tamanho n é selecionada de
tal modo que toda amostra possível de mesmo tamanho n tem a mesma chance de ser
escolhida.
Este tipo de amostragem é equivalente a um sorteio lotérico.
Na prática, a amostragem casual ou aleatóriasimples pode ser realizada numerando-se a
população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório
qualquer, k números dessa seqüência, os quais corresponderão aos elementos
pertencentes à amostra.
- 21 -
Exemplo:
→ Vamos obter uma amostra representativa para a pesquisa da estatura de noventa
alunos de uma faculdade: 
a. Imagine uma sala de aula com 60 alunos arrumados em 6 filas de 10 alunos cada.
Suponha que o professor selecione uma amostra de 10 alunos jogando um dado e
selecionando a fila correspondente ao resultado da jogada. O resultado é uma
amostra aleatória porque cada estudante individual tem a mesma chance (uma
chance em seis) de ser escolhido. No entanto, a amostra não é uma amostra aleatória
simples porque nem todas as amostras de tamanho 10 têm a mesma chance de
serem escolhidas. Por exemplo, esse planejamento amostral, ao usar um dado para
selecionar uma fileira, torna impossível selecionar 10 estudantes que estejam em filas
diferentes (mas há uma chance em seis de selecionar os 10 estudantes da primeira
fila).
b. Numeramos os alunos de 01 a 90. Escrevemos os números, de 01 a 90, em pedaços
iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a
caixa para misturar bem os pedaços de papel e retiramos, um a um, nove números
que formarão a amostra. Neste caso, 10% da população.
Com a amostragem aleatória, esperamos que todos os componentes da população sejam
(aproximadamente) proporcionalmente representados. Amostras aleatórias são
selecionadas por vários métodos diferentes, incluindo o uso do computador para gerar
números aleatórios. (Antes dos computadores, eram usadas tabelas de números
aleatórios).
Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se
muito trabalhoso. A fim de facilitá-lo, foi elaborada uma Tabela de Números
Aleatórios (ANEXO I), construída de modo que os 10 algarismos (0 a 9) são
distribuídos ao acaso nas linhas e colunas.
ANEXO I
TABELA DE NÚMEROS ALEATÓRIOS
5 7 7 2 0 0 3 9 8 4 8 4 4 1 7 9 6 7 7 1 4 0 2 1 1 3 9 7 5 6 4 9 8 6 5 4 0 8 9 3 2 9 6 8 7 4 5 4 8 3
2 8 8 0 5 3 5 1 5 9 0 9 9 3 9 8 8 7 5 8 7 0 2 7 7 1 7 7 1 7 0 6 3 2 0 2 7 8 6 2 1 6 7 4 2 9 6 5 1 7
9 2 5 9 1 8 5 2 8 7 3 0 4 8 8 6 9 7 4 8 3 5 2 5 1 8 8 8 7 4 0 3 6 2 9 8 3 8 5 8 6 5 8 6 4 2 4 1 0 3
9 0 3 8 1 2 9 1 7 4 3 0 1 9 7 5 8 9 0 7 5 0 6 4 1 5 5 9 7 1 8 8 1 3 7 4 9 5 3 0 5 2 7 8 3 0 1 1 7 5
8 0 9 1 1 6 9 4 6 7 5 8 6 0 8 2 0 6 6 6 9 0 4 7 5 6 1 8 4 6 4 5 1 1 1 2 3 5 3 2 4 5 5 0 4 1 1 3 4 3
2 2 0 1 7 0 3 1 3 2 9 6 9 1 9 2 7 5 4 0 1 6 5 4 2 9 7 2 7 4 9 9 0 0 9 5 9 7 6 1 0 0 9 8 2 4 3 0 0 7
5 6 2 4 1 0 0 4 3 0 2 0 4 6 2 9 9 0 5 3 5 3 1 1 0 5 8 4 4 1 2 1 6 4 7 9 1 9 7 6 2 9 5 1 6 2 6 0 6 6
7 9 4 4 9 2 6 2 0 2 9 6 8 6 6 4 3 0 0 0 9 4 5 6 6 9 3 0 2 0 5 9 8 7 8 7 3 5 4 4 2 2 5 0 9 7 7 8 1 9
5 3 9 9 6 6 4 5 0 8 8 9 7 8 5 0 7 7 5 3 3 7 2 5 7 7 4 1 2 7 6 2 3 8 0 2 2 3 5 7 6 2 0 1 4 1 6 0 3 5
1 8 9 2 8 7 3 5 8 8 5 5 0 5 2 1 3 6 5 1 3 9 2 8 5 0 1 4 6 6 8 5 7 9 3 0 1 9 7 9 7 2 6 6 6 4 3 1 4 5
5 3 0 8 5 8 9 6 6 3 0 5 6 1 2 5 7 0 2 2 5 0 4 1 2 8 9 6 6 2 6 6 4 3 6 3 0 6 6 3 0 1 3 2 7 9 8 5 2 2
0 3 5 8 8 0 2 9 2 8 7 6 8 9 5 1 1 8 2 4 8 8 8 9 4 6 4 7 4 8 5 9 1 9 2 9 8 7 0 3 1 0 3 3 9 9 6 7 1 2
2 7 0 7 8 1 8 8 6 5 6 9 4 9 9 8 0 0 2 8 0 4 7 0 5 1 3 0 0 1 4 7 1 8 9 7 3 3 2 1 8 5 8 2 4 5 4 3 2 4
0 5 2 1 0 8 5 9 0 1 0 6 2 2 2 4 9 8 9 1 8 1 1 7 5 5 4 4 6 6 1 6 0 7 7 3 0 7 6 6 1 0 1 2 3 1 7 8 5 8
4 0 3 6 1 3 2 7 8 4 3 0 8 2 3 3 3 6 3 9 6 9 4 2 0 5 5 8 6 4 6 1 1 2 3 3 8 9 2 7 8 9 5 2 6 6 7 1 9 3
5 4 6 0 2 5 2 8 8 5 8 8 2 0 0 0 1 0 5 9 6 1 0 5 3 6 6 1 3 3 7 2 0 1 0 1 1 9 0 1 6 1 1 0 5 1 2 0 9 1
7 1 5 1 6 3 4 0 7 6 5 1 1 1 7 3 7 3 5 2 3 7 3 1 6 0 4 5 8 8 9 2 7 3 4 3 7 1 2 8 0 4 9 8 0 9 0 2 4 8
6 1 0 2 0 1 8 1 7 3 9 2 6 0 6 6 7 3 5 8 5 3 3 4 4 2 6 8 2 6 3 8 3 4 0 3 2 7 4 4 8 6 0 4 4 6 6 5 9 3
8 2 5 5 9 3 1 3 4 6 3 0 9 5 2 6 5 5 0 6 9 6 1 7 6 5 9 1 7 2 3 9 7 9 9 6 1 2 4 9 5 2 8 0 6 3 2 6 9 9
8 9 9 8 5 4 1 4 2 1 7 4 1 3 5 7 6 8 1 9 8 6 2 8 6 0 8 9 4 7 3 3 1 5 2 6 2 8 7 7 4 5 3 8 4 8 0 8 0 8
0 0 9 9 8 4 8 4 1 4 6 7 9 5 1 3 7 7 5 8 9 0 1 4 5 0 7 9 4 2 7 3 6 3 3 1 0 6 6 0 4 3 4 0 1 2 5 5 0 4
6 2 4 1 5 0 7 8 2 0 4 8 0 5 8 8 4 3 5 2 9 8 0 3 1 9 9 3 9 2 0 3 0 4 9 7 2 5 8 4 9 5 9 5 0 3 6 3 3 1
9 4 2 7 9 0 6 9 2 4 6 8 0 9 9 2 1 1 8 6 0 7 6 3 8 3 1 9 3 2 9 9 5 1 1 5 5 5 7 1 0 9 2 7 0 2 6 7 0 0
4 4 8 9 2 9 2 8 8 4 3 6 2 8 2 5 1 5 8 2 8 7 7 4 1 8 9 7 2 5 7 6 1 0 6 3 2 6 7 6 0 2 2 6 7 4 5 3 2 8
9 7 3 0 7 6 9 5 3 3 2 1 1 0 5 4 2 6 9 5 6 6 6 5 5 2 0 4 9 9 3 6 5 8 4 8 0 3 0 8 9 3 6 3 5 8 1 7 9 6
3 9 1 6 5 8 0 4 4 4 8 0 1 5 5 9 5 9 8 3 9 0 9 5 5 4 6 6 8 1 8 4 3 9 6 0 8 5 3 8 8 8 6 6 3 3 3 5 6 9
6 0 7 8 1 1 0 3 2 6 6 7 5 0 3 4 0 9 6 1 3 1 3 0 2 0 7 6 9 3 6 6 3 0 8 3 5 1 0 9 3 3 8 3 6 4 7 6 0 5
0 3 1 9 2 3 4 7 6 2 8 9 5 7 7 7 9 1 3 3 8 8 4 7 6 0 5 9 3 7 5 4 3 9 4 8 7 7 6 7 4 9 8 5 3 8 4 3 9 1
4 1 2 8 5 2 6 7 5 6 2 5 3 9 5 9 9 6 6 5 5 1 3 6 9 0 3 2 2 2 3 9 3 3 0 5 2 2 9 9 0 3 3 9 9 7 9 6 9 9
7 7 5 4 9 8 5 0 3 9 2 5 3 7 4 2 5 2 9 7 1 0 0 3 5 6 0 4 9 2 8 1 6 6 8 6 7 0 0 1 4 8 8 9 5 5 8 2 1 0
2 8 6 3 4 1 6 1 9 1 6 4 2 4 8 3 8 1 3 7 3 4 4 8 8 3 2 7 9 6 3 8 7 1 6 9 7 3 0 6 7 7 5 0 2 5 6 4 4 0
7 4 2 4 4 8 8 5 4 0 1 2 3 3 5 9 6 7 5 0 1 4 9 8 1 4 2 6 4 2 7 9 7 9 1 3 5 2 8 9 6 9 7 8 8 0 4 4 7 1
0 0 2 4 0 3 3 7 9 6 4 6 6 8 7 5 0 5 3 2 4 2 1 6 6 3 3 3 2 8 9 7 2 6 3 6 4 7 2 7 7 3 6 5 3 8 3 4 4 6
0 5 4 1 4 7 6 9 6 9 4 5 3 6 1 6 7 1 1 8 9 5 5 1 9 7 2 2 0 4 1 3 2 3 9 6 5 8 6 0 0 3 6 9 4 8 7 9 8 3
6 2 6 9 8 4 9 7 9 7 4 7 2 3 6 6 5 1 5 6 1 3 0 8 6 9 1 1 5 2 7 5 5 9 2 6 8 6 8 1 8 0 4 3 0 0 9 8 9 2
- 22 -
Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo
qualquer da mesma, a partir da qual iremos considerar números de dois, três ou mais
algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os
elementos da amostra.
A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-
versa), verticalmente (de cima para baixo ou vice-versa) ou formando o desenho de uma
letra qualquer. A opção, porém, deve ser feita antes de iniciado o processo.
Assim, para o nosso exemplo, considerando a 18ª linha, tomamos os números de dois
algarismos (tantos algarismos quanto formam o maior número da população), obtendo:
61 02 01 81 73 92 60 66 73 58 53 34
Evidentemente, o número 92 será desprezado, pois não consta da população, como será
abandonado um numeral que já tenha aparecido. 
Temos, então:
61 02 01 81 73 60 66 58 53 34
Medindo as alturas dos alunos correspondentes aos números sorteados, obteremos uma
amostra das estaturas dos noventa alunos.
1.5.3.2 Amostragem Proporcional Estratificada
Muitas vezes a população se divide em subpopulações – estratos.
Como é provável que a variável em estudo apresente, de estrato em estrato, um
comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo,
convém que o sorteio dos elementos da amostra leve em consideração tais estratos.
É exatamente isso que fazemos quando empregamos a amostragem proporcional
estratificada, que, além de considerar a existência dos estratos, obtém os elementos da
amostra proporcional ao número de elementos dos mesmos. Logo, temos:
Exemplo:
→ Supondo, no exemplo anterior (b), que, dos noventa alunos, 54 sejam meninos e 36
sejam meninas, vamos obter a amostra proporcional estratificada.
São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra
de 10% da população. Logo, temos:
b.1 
SEXO POPULAÇÃO 10% AMOSTRA
M
F
54
36
10 x 54  100 = 5,4
10 x 36  100 = 3,6
5
4
Total 90 10 x 90  100 = 9,0 9
b.2 Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem a meninos e
de 55 a 90, meninas. Tomamos na tabela de números aleatórios a primeira e a
segunda colunas da esquerda, de cima pra baixo, obtemos os seguintes números:
57 28 92 90 80 22 56 79 53 18 03 27 05 40
Temos então:
28 22 53 1803 → para os meninos;
57 90 80 56 → para as meninas.
- 23 -
Com a amostragem estratificada, subdividimos a população em pelo menos dois
subgrupos (ou estratos) que compartilham as mesmas características (tais como sexo ou
faixa etária) e em seguida, extraímos uma amostra de cada subgrupo (ou estrato).
1.5.3.3 Amostragem por Conglomerado
Na amostragem por conglomerado, primeiro dividimos a área da população em
seções (ou conglomerados), depois selecionamos aleatoriamente alguns desses
conglomerados e então escolhemos todos os membros desses conglomerados
selecionados.
É fácil confundir a amostragem estratificada com amostragem por conglomerado, porque
ambas envolvem a formação de subgrupos. Mas a amostragem por conglomerado usa
todos os membros de uma amostra de conglomerados, enquanto a amostragem
estratificada usa uma amostra de membros de todos os estratos. 
Exemplo:
→ Pesquisas Eleitorais – Selecionamos aleatoriamente 30 zonas eleitorais de um
grande número de zonas e, em seguida, entrevistamos todos os eleitores daquelas
zonas selecionadas. Isso é muito mais rápido e muito menos dispendioso do que
selecionar uma pessoa de cada uma das muitas zonas da área populacional. Os
resultados da amostragem estratificada ou por conglomerado podem ser ajustados ou
ponderados para corrigir quaisquer representações desproporcionais de grupos.
1.5.3.4 Amostragem Sistemática
Quando os elementos da população já se acham ordenados, não há necessidade de
construir o sistema de referência.
Exemplos:
→ os prontuários médicos de um hospital;
→ os prédios de uma rua;
→ as linhas de produção.
Nesses casos, a seleção dos elementos que constituirão a amostra pode ser feita por um
sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos
sistemática.
Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar
um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o
tamanho da amostra em 10% da população.
Exemplo:
→ Suponhamos uma rua contendo 900 prédios, dos quais desejamos obter uma amostra
formada de cinqüenta prédios. Podemos, neste caso, usar o seguinte procedimento:
como 900  50 = 18, escolhemos por sorteio casual um número de 1 a 18 (inclusive),
o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos
seriam periodicamente considerados de 18 em 18. Assim, se o número sorteado fosse
o 4, tomaríamos, pelo lado direito da rua, o 4º prédio, o 22º, o 40º etc., até
voltarmos ao início da rua, pelo lado esquerdo.
- 24 -
1.5.4 Erros Amostrais
Não importa quão bem planejemos e executemos o processo de coleta da amostra,
provavelmente sempre haverá algum erro nos resultados.
Exemplo:
→ Selecione aleatoriamente 1000 adultos, pergunte a eles se formaram no Ensino Médio
e a porcentagem amostral de respostas “sim”. Se você selecionar aleatoriamente
outra amostra de 1000 adultos, é provável que você obtenha uma porcentagem
amostral diferente.
Definições:
Um erro amostral é a diferença entre o resultado amostral e o verdadeiro resultado da
população; tais erros resultam das flutuações amostrais devidas ao acaso.
Um erro não-amostral ocorre quando os dados amostrais são coletados, registrados ou
analisados incorretamente (tal como a seleção de uma amostra tendenciosa, o uso de um
instrumento de medida defeituoso, ou cópia incorreta dos dados).
Após ler toda esta seção, é fácil ficarmos espantados com a variedade de diferentes
definições. Mas lembre-se desse ponto principal: o método usado para coletar os dados é
absoluta e criticamente importante, e devemos saber que a aleatoriedade é
particularmente importante. Se os dados amostrais não forem coletados de maneira
apropriada, os dados podem se tornar tão inúteis que nenhuma manipulação estatística
poderá salva-los.
- 25 -
1.5.5 Atividades Complementares
1. Resolva:
a. Pesquisa – peso dos colegas de sua classe (incluindo você).
Amostra – correspondente a 30% da população.
Sugestão – faça uso da caderneta de seu professor e da Tabela dos Números
Aleatórios (5ª e 6ª colunas, de baixo para cima).
b. Pesquisa – estatura dos alunos do curso de Sistemas de Informação.
Amostra – 15% da população.
Sugestão – Use a Tabela dos Números Aleatórios (25ª linha, da esquerda para
direita).
SÉRIES POPULAÇÃO 15% AMOSTRA
A
B
 
c. Em uma faculdade existem 250 alunos, sendo 35 no 1º período, 32 no 2º, 30 no 3º,
28 no 4º, 35 no 5º, 32 no 6º, 31 no 7º e 27 no 8º. Obtenha uma amostra de 40
alunos e preencha o quadro da página seguinte. 
Como, neste caso, foi dado o número de elementos da amostra, devemos, então,
calcular o número de elementos de cada estrato proporcionalmente ao número de
elementos da amostra. Assim, para a 1ª série, temos:
250/35 = 40/x  x = 35 x 40  250 = 5,6  x = 6
Logo:
SÉRIE POPULAÇÃO CÁLCULO PROPORCIONAL AMOSTRA
1ª
2ª
3ª
4ª
5ª
6ª
7ª
8ª
35
....
....
28
....
....
....
....
10 x 40  250 = 5,6
....
....
....
....
....
31 x 40  250 = ....
....
6
....
....
....
6
....
....
....
Total 250 - 40
2. Uma faculdade abriga 124 alunos. Obtenha uma amostra representativa
correspondendo a 15% da população.
Sugestão: use a 8ª, 9ª e 10ª colunas, a partir da 1ª linha, da Tabela de Números
Aleatórios (de cima para baixo).
002 – 014 – 016 – 034 – 039 – 053 – 054 – 056 – 062 – 066 – 076 – 082 – 094 – 096 – 099 – 105 – 110
– 118 - 123
3. No curso de Sistemas de Informação há 80 alunos. Obtenha uma amostra de 12
alunos.
Sugestão: decida, juntamente com a classe e seu professor, o uso da Tabela de
Números Aleatórios.
- 26 -
4. O diretor de uma faculdade, na qual estão matriculados 280 meninos e 320 meninas,
desejoso de conhecer as condições de vida extra-escolar de seus alunos e não
dispondo de tempo para entrevistar todas as famílias, resolveu fazer um
levantamento, por amostragem, em 10% dessa clientela. Obtenha, para esse diretor,
os elementos componentes da amostra.
5. Uma cidade X apresenta o seguinte quadro relativo às suas faculdades:
ESCOLAS
Nº DE ESTUDADANTES
MASCULINO FEMININO
A
B
C
D
E
F
80
102
110
134
150
300
95
120
92
228
130
290
Total 876 955
Obtenha uma amostra proporcional estratificada de 12º estudantes.
6. Uma população encontra-se dividida em três estratos, com tamanhos,
respectivamente, n1 = 40, n2 = 100 e n3 = 60. Sabendo que, ao ser realizada uma
amostragem estratificada proporcional, nove elementos da amostra foram retirados
do 3º estrato, determine o nº total de elementos da amostra. 30
7. Mostre como seria possível retirar uma amostra de 32 elementos de uma população
ordenada formada por 2.432 elementos.
Na ordenação geral, qual dos elementos abaixo seria escolhido para pertencer à
amostra, sabendo-se que o elemento de ordem 1.420 a ela pertence?
1.648º, 290º, 725º, 2.025º, 1.120º. 1.648º
8. Determine se a descrição dada corresponde a um estudo observacional ou a um
experimento.
a. Teste de Droga – Dá-se Lipitor a pacientes para se determinar se essa droga tem ou
não o efeito de baixar os níveis altos de colesterol. Experimental
b. Tratamento da Sífilis – Muita controvérsia surgiu em relação a um estudo de
pacientes com sífilis que não receberam um tratamento que poderia tê-los curado. A
saúde deles foi acompanhada durante anos, após ter sido descoberto que tinham
sífilis. 
c. Fraude ao Consumidor – O Birô de pesos e medidas de Minas gerais seleciona
aleatoriamente postos de gasolina e obtém 2 litros de gasolina de cada bomba. A
quantidade bombeada é medida para verificar a exatidão. Estudo observacional
d. Braceletes Magnéticos – Os passageiros de navios de cruzeiro recebem braceletes
magnéticos, que eles concordam em usar numa tentativa de eliminar ou diminuir o
enjôo.
- 27 -
9. Identifique o tipo de estudo observacional(transversal, retrospectivo ou prospectivo).
a. Pesquisa Médica – Um pesquisador da Faculdade de Medicina da UFMG obtém dados
sobre ferimentos na cabeça examinando os registros do hospital dos últimos 5 anos.
Restropectivo
b. Psicologia do Trauma – Um pesquisador do Hospital Mt Sinai planeja obter dados
acompanhando (até o ano 2010) irmãos de vítimas fatais do ataque terrorista ao
World Trade Center em 11 de setembro de 2001.
c. Estatística do Desemprego – O Ministério do Trabalho obtém dados atuais do
desemprego pesquisando 50.000 pessoas este mês. Transversal
d. Ganhadores de Loteria – Um economista coleta dados entrevistando pessoas que
ganharam na loteria entre os anos de 1995 e 2000.
10. Identifique qual destes tipos de amostragem é usado: aleatória, sistemática, de
conveniência, estratificada ou por conglomerados.
a. Notícias na Televisão – Um repórter de noticiário da rede Globo analisa a reação a
uma história impressionante entrevistando pessoas que passam em frente ao seu
estúdio. De conveniência
b. Seleção de Júri – O comissário de jurados do Condado de Dutches obtém uma lista
de 42.763 proprietários de carros e obtém um conjunto de jurados selecionando cada
centésimo nome da lista. 
c. Pesquisas Telefônicas – Em uma pesquisa do Gallup de 1059 adultos, os sujeitos
da entrevista foram selecionados usando-se um computador para gerar
aleatoriamente números de telefones, que eram então discados. Aleatória
d. Posse de Carro – Uma pesquisadora da General Motors dividiu todos os carros
registrados em categorias de subcompacto, compacto, médio, intermediário e grande.
Ele está pesquisando 200 proprietários de carro de cada categoria.
e. Bebida entre Estudantes – Motivado pelo fato de um estudante ter morrido por
excesso de bebida, uma faculdade fez um estudo do hábito de bebida dos estudantes,
selecionando aleatoriamente 10 classes diferentes e entrevistando todos os
estudantes em cada uma dessas classes. De conglomerado
f. Marketing – Uma executiva de marketing da General Motors descobriu que o
departamento de relações públicas da empresa tinha acabado de imprimir envelopes
com os nomes e endereços de todos os proprietários de Corvete. 
g. Ponto de Checagem de Sobriedade – O autor foi observador de um ponto de
checagem de sobriedade da polícia, no qual cada quinto chofer era parado e
entrevistado. (Ele testemunhou a prisão de um ex-aluno). Sistemática
h. Pesquisa de Boca de Urna – Uma rede de notícias está planejando uma pesquisa
na qual 100 seções eleitorais serão selecionadas aleatoriamente e todos os eleitores
serão entrevistados ao deixarem o local.
i. Educação e Salário – Um economista está estudando o efeito da educação sobre o
salário e realiza uma pesquisa com 150 trabalhadores selecionados aleatoriamente de
cada uma das seguintes categorias: menos do que Ensino Médio; Ensino Médio; mais
do que Ensino Médio. Estratificada
j. Antropometria – Um estudante de estatística obtém dados sobre altura/peso
entrevistando membros da família.
k. Pesquisa Médica – Um pesquisador da UFES examina todos os pacientes cardíacos
de cada um dos 30 hospitais selecionados aleatoriamente. De conglomerado
- 28 -
l. Pesquisa da MTV – Um especialista em Marketing para a MTV está planejando uma
pesquisa na qual 500 pessoas serão selecionadas aleatoriamente de cada faixa etária
de 10-19, 20-29, e assim por diante.
11. Identifique as amostras aleatórias e as amostras aleatórias simples.
a. Amostragem de Comprimidos de Aspirina – Um farmacêutico mistura bem
um recipiente com 1000 comprimidos de Bufferin e retira, então, 50 que devem
ser testados para verificar o conteúdo exato de aspirina. Esse planejamento
amostral resulta em uma amostra aleatória? Em uma amostra aleatória simples?
Explique. Sim, sim.
b. Amostragem de Estudantes – Uma sala de aula compõe-se de 30 alunos,
sentados em 5 filas diferentes, com seis alunos em cada fila. O instrutor joga um
dado e o resultado é usado para selecionar uma amostra dos estudantes em uma
fila particular. Esse plano amostral resulta em uma amostra aleatória? Em uma
amostra aleatória simples? Explique.
c. Amostra de Conveniência – Um repórter de notícias se coloca em uma esquina
e obtém uma amostra de residentes da cidade selecionando cinco adultos que
passam e perguntando sobre seus hábitos de fumo. Esse plano amostral resulta
em uma amostra aleatória? Em uma amostra aleatória simples? Explique. Não, não.
d. Amostra Sistemática – Um engenheiro de controle da qualidade seleciona cada
centésima fonte de computador que passa em uma esteira transportadora. Esse
plano amostral resulta em uma amostra aleatória? Em uma amostra aleatória
simples? Explique.
e. Amostra Estratificada – O shopping do Vale planeja realizar uma pesquisa de
mercado com 100 homens e 100 mulheres em Ipatinga, a qual consiste em um
número igual de homens e mulheres. Esse plano amostral resulta em uma
amostra aleatória? Em uma amostra aleatória simples? Explique. Sim, não.
f. Amostra por Conglomerado – Um pesquisador de mercado seleciona
aleatoriamente 10 quarteirões em Timóteo e pergunta então a todos os adultos
residentes nos quarteirões selecionados se possuem ou não um aparelho DVD.
Esse plano amostral resulta em uma amostra aleatória? Em uma amostra aleatória
simples? Explique.
- 29 -
1.6 Tabelas de freqüência
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem
assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. E
isso ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que
irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo,
permitindo-nos determinações administrativas e pedagógicas mais coerentes e
científicas.
Definições:
Tabela é um quadro que resume um conjunto de observações. Uma tabela compõe-se
de:
Corpo – conjunto de linhas e colunas que contém informações sobre a variável em
estudo;
Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas;
Coluna Indicadora – parte da tabela que especifica o conteúdo das linhas;
Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se
inscrevem nos seus cruzamentos com as colunas;
Casa ou Célula – espaço destinado a um só número;
Título – conjunto de informações, as mais completas possíveis, respondendo às
perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela.
Há ainda a considerar elementos complementares da tabela, que são a fonte, as notas e
as chamadas, colocadas, de preferência, no seu rodapé.
Exemplo:
PRODUÇÃO DE CAFÉ
BRASIL – 2005-06
ANOS
PRODUÇÃO
(1.000 t)
2005
2006
2 134
2 594
FONTE: IBGE.
De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células devemos
colocar:
 um traço horizontal () quando o valor é zero, não só quanto à natureza das coisas,
como quanto ao resultado do inquérito;
 três pontos (...) quando não temos os dados;
 um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado
valor;
 zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se
os valores são impressos em números decimais, precisamos acrescentar à parte
decimal um número correspondente de zeros (0,0; 0,00; 0,000; ...).
- 30 -
1.6.1 Séries Estatísticas
Definição:
Série estatística é toda tabela que apresenta a distribuição de um conjunto de dados
estatísticos em função da época, do local ou da espécie.
Daí, podemos inferir que numa série estatística observamos a existência de três
elementos ou fatores: o tempo, o espaço e a espécie.
Conforme varie um dos elementos da série, podemos classificá-la em histórica,
geográfica e específica.
1.6.1.1 Séries Históricas, Cronológicas, Temporais ou Marchas
Descrevem os valores da variável, em determinado local, discriminados segundo
intervalosde tempo variáveis.
Exemplos:
a. O Brasil fecha 2006 com a melhor safra de soja da sua história: 54,7 milhões de
toneladas. Isso é 3% a mais que a safra de 2005. Estimando-se um faturamento de
R$ 24 bilhões. O país é o segundo maior produtor mundial, atrás dos EUA.
Estados que lideram a produção no país: Mato Grosso, Paraná e Goiás. (Revista Isto
é).
PRODUÇÄO MEDIA DE
SOJA NO BRASIL
2005-06
ANOS
PRODUÇÃO
(1.000 t)
2005
2006
51 138 
52 223
FONTE: IBGE.
b.
PREÇO DO ACÉM NO VAREJO
SÃO PAULO – 1989-94
ANOS
PREÇO MÉDIO
(US$)
1989
1990
1991
1992
1993
1994
2,24
2,73
2,12
1,89
2,04
2,62
FONTE: APA.
1.6.1.2 Séries Geográficas, Espaciais, Territoriais ou de Localização
Descrevem os valores da variável, em determinado instante, discriminados segundo
regiões.
DURAÇÃO MÉDIA DOS
ESTUDOS SUP ERIORES
1994
PAÍSES NÚMERO
DE ANOS
Itália
Alemanha
França
Holanda
Inglaterra
7,5
7,0
7,0
5,9
Menos de 4
FONTE: APA.
- 31 -
1.6.1.3 Séries Específicas ou Categóricas
Descrevem os valores da variável, em determinado tempo e local, discriminados segundo
especificações ou categorias.
Exemplo:
a. A industria da soja gera cerca de 1,5 milhão de empregos diretos. Representa 20% do
sistema agroindustrial. (Revista Isto é)
b.
REBANHOS BRASILEIROS
1992
ESPÉCIES
QUANTIDADE
(1.000 cabeças)
Bovinos
Bubalinos
Eqüinos
Asininos
Muares
Suínos
Ovimos
Caprinos
Coelhos
154.440,8
1.423,3
549,5
47,1
208,5
34.532,2
19.955,9
12.159,6
6,1
FONTE: IBGE.
1.6.2 Séries Conjugadas e Tabela de Dupla Entrada
Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de
valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries.
Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Em
uma tabela desse tipo ficam criadas duas ordens de classificação: uma horizontal
(linha) e uma vertical (coluna).
TERMINAIS TELEFÔNICOS EM SERVIÇO
1991-93
REGIÕES 1991 1992 1993
Norte
Nordeste
Sudeste
Sul
Centro-Oeste
342.938
1.287.813
6.234.501
1.497.315
713.357
375.678
1.379.101
6.729.467
1.608.989
778.925
403.494
1486.649
7231.634
1.746.232
884.882
FONTE: Ministério das Comunicações.
A conjugação, no exemplo dado, foi série geográfica-série histórica, que dá origem à
série geográfico-histórica ou geográfico-temporal.
Podem existir, se bem que mais raramente, pela dificuldade de representação, séries
compostas de três ou mais entradas.
- 32 -
EXPORTAÇÃO
BRASILEIRA
2005
PRODUTOS
QUANTIDADE
(em bilhões de
toneladas)
Grãos
Farelo
Óleo
20,5
14,2
2,4
FONTE: Companhia Nacional de Abastecimento
(Conab).
1.6.3 Dados Absolutos e Dados Relativos
Definições:
Dados Absolutos, são dados estatísticos resultantes da coleta direta da fonte, sem
outra manipulação se não a contagem ou medida. A leitura dos dados absolutos é
sempre enfadonha e inexpressiva; embora esses dados traduzam um resultado exato e
fiel, não têm a virtude de ressaltar de imediato as suas conclusões numéricas. Daí o uso
imprescindível que faz a Estatística dos dados relativos. O número de vezes que um valor
da variável, de uma pesquisa, é citado representa a freqüência absoluta daquele valor.
Dados Relativos são o resultado de comparações por quociente (razões) que se
estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as
comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de
percentagens, índices, coeficientes e taxas. A freqüência relativa é o quociente
entre a freqüência absoluta de uma variável e o total de citações de todas as variáveis da
pesquisa.
1.6.3.1 As percentagens
Consideremos a série:
MATRÍCULAS NAS ESCOLAS DA
CIDADE A - 2007
CATEGORIAS Nº DE ALUNOS
Ensino Fundamental
Ensino Médio
Ensino Superior
19.286
1.681
234
Total 21.201
Dados fictícios.
Calculemos as percentagens de alunos de cada grau:
Ensino Fundamental → 19286 x 100  21201 = 90,96 = 91,0
Ensino Médio → 1681 x 100  21201 = 7,92 = 7,9
Ensino Superior → 234 x 100  21201 = 1,10 = 1,1
Com esses dados, podemos formar uma nova coluna na série em estudo;
MATRÍCULAS NAS ESCOLAS
DA CIDADE A - 2007
CATEGORIAS Nº DE ALUNOS %
Ensino Fundamental
Ensino Médio
Ensino Superior
19.286
1.681
234
91,0
7,9
1,1
Total 21.201 100
Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A, 91 estão
matriculados no 1º grau, 8, aproximadamente, no 2º grau e 1 no 3º grau.
O emprego da percentagem é de grande valia quando é nosso intuito destacar a
participação da parte no todo.
- 33 -
Consideremos, agora, a série:
MATRÍCULAS NAS ESCOLAS
DA CIDADE A e B - 2007
CATEGORIAS
Nº DE ALUNOS
CIDADE A CIDADE B
Ensino Fundamental
Ensino Médio
Ensino Superior
19.286
1.681
234
38.660
3.399
424
Total 21.201 42.483
Dados fictícios.
Qual das cidades tem, comparativamente, maior número de alunos em cada período?
Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a
respeito usando os dados absolutos. Porém, usando as percentagens, tal tarefa fica
bastante facilitada. Assim, acrescentando na tabela anterior as colunas correspondentes
às percentagens, obtemos:
MATRÍCULAS NAS ESCOLAS DA CIDADE A e B - 2007
CATEGORIAS
CIDADE A CIDADE B
Nº DE ALUNOS % Nº DE ALUNOS %
Ensino 
Fundamental
Ensino Médio
Ensino Superior
19.286
1.681
234
91,0
7,9
1,1
38.660
3.399
424
91,0
8
1
Total 21.201 100 42.483 100
Dados fictícios.
O que nos permite dizer que, comparativamente, contam, praticamente, com o mesmo
número de alunos em cada grau.
1.6.3.2 Os Índices - Índices Econômicos
Definição:
Os Índices são razões entre duas grandezas tais que uma não inclui a outra.
Exemplos:
→ Índice Cefálico = (diâm. transverso da cabeça diâm. longitudinal do crânio) x 100
→ Quociente Intelectual = (idade mental  idade cronológica) x 100
→ Densidade Demográfica = população  superfície
→ Índices Econômicos:
 Produção per capta = valor total da produção  população
 Consumo per capta = consumo do bem  população
 Renda per capta = renda  população
 Receita per capta = receita  população
- 34 -
1.6.3.3 Os Coeficientes
Definição:
Os Coeficientes são razões entre o número de ocorrências e o número total (número
de ocorrências e número de não ocorrências).
Exemplos:
→ Coeficiente de Natalidade = número de nascimentos  população total
→ Coeficiente de Mortalidade = número de óbitos  população total
→ Coeficientes Educacionais:
 Coeficiente de evasão escolar = nº de alunos evadidos  nº inicial de matrículas
 Coeficiente de aproveitamento escolar = nº de alunos aprovados  nº final de
matrículas
 Coeficiente de recuperação = nº de alunos recuperados  nº de alunos em recuperação
1.6.3.4 Os Coeficientes
Definição:
As Taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1, 1000
etc.) para tornar o resultado mais inteligível..
Exemplos:
→ Taxa de Mortalidade = coeficiente de mortalidade x 1000
→ Taxa de Natalidade = coeficiente de natalidade x 1000
→ Taxa de Evasão Escolar = coeficiente de evasão escolar x 100
Exercício Resolvido:
O Estado A apresentou 733.986 matrículas na 1ª série, no início do ano de 1994, e
683.816 no fim do ano. O Estado B apresentou, respectivamente, 436.127 e 412.457
matrículas. Qual o Estado que apresentou maior evasão escolar?
A → TEE = (733.986 – 683.816) x 100  733.986 = 6,83 = 6,8%
B → TEE = (436.127 – 412.457) x 100  436.127 = 5,42 = 5,4%
O Estado que apresentou maior evasão escolar foi A.
1.6.4 Atividades Complementares
- 35 -
1. Classifique as séries:
a. Histórica
PRODUÇÃO DE BORRACHA
NATURAL 1991-93
ANOS TONELADAS
1991
1992
1993
29.543
30.712
40.663
FONTE: IBGE.
b. Específica
AVICULTURA
BRASILEIRA - 1992
ESPÉCIES
NÚMERO
(1.000
CABEÇAS)
Galinhas
Galos, frangos e pintos
Codornas
204.160
435.465
2.488
FONTE: IBGE.
c. Geográfica
VACINAÇÃO CONTRA A
POLIOMELITE - 1993
REGIÕES QUANTIDADE
Norte
Nordeste
Sudeste
Sul
Centro-Oeste

Outros materiais