Estatística Básica

breadcrumb-separator

URI

Angela Maria Pasquali

em 11/10/2015

Conteúdos escolhidos para você

Compilado_de_Estatistica _V3 1-03-04-2023

Compilado_de_Estatistica _V3 1-03-04-2023

UNIP

Compilado_de_Estatistica _V4 0-04-04-2023

Compilado_de_Estatistica _V4 0-04-04-2023

UNIP

Compilado_de_Estatistica _V2 0-02-04-2023 (1)

Compilado_de_Estatistica _V2 0-02-04-2023 (1)

UNIP

Introdução à Bioestatística

Introdução à Bioestatística

FAEL

UNIDADE 2 - Estatística Básica - Descritiva (Com exercícios)

UNIDADE 2 - Estatística Básica - Descritiva (Com exercícios)

AMPLI

Perguntas dessa disciplina

Leia o texto a seguir: Consideremos o seguinte experimento aleatório: Vamos sortear uma amostra de 20 funcionários de uma empresa que tem 100 funcioná

FAM

Leia o texto a seguir: Consideremos o seguinte experimento aleatórioLeia o texto a seguir: A distribuição binomial de probabilidade é aplicada à exper

FAM

5. Enquanto a estatística descritiva se concentra em resumir os dados em mãos, a estatística inferencial dá um passo adiante e busca usar uma pequena

de da Pergunta: 0,5 pontos Salva PERGUNTA 1 Relacione as variáveis de uma pesquisa estatística, apresentadas à esquerda, com as características de ...

UNIP São Luís

Pergunta 1 Considere uma empresa que deseja analisar os salários de seus funcionários para determinar se houve uma melhora significativa nos rendi...

Material

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Conteúdos escolhidos para você

Compilado_de_Estatistica _V3 1-03-04-2023

Compilado_de_Estatistica _V3 1-03-04-2023

UNIP

Compilado_de_Estatistica _V4 0-04-04-2023

Compilado_de_Estatistica _V4 0-04-04-2023

UNIP

Compilado_de_Estatistica _V2 0-02-04-2023 (1)

Compilado_de_Estatistica _V2 0-02-04-2023 (1)

UNIP

Introdução à Bioestatística

Introdução à Bioestatística

FAEL

UNIDADE 2 - Estatística Básica - Descritiva (Com exercícios)

UNIDADE 2 - Estatística Básica - Descritiva (Com exercícios)

AMPLI

Perguntas dessa disciplina

Leia o texto a seguir: Consideremos o seguinte experimento aleatório: Vamos sortear uma amostra de 20 funcionários de uma empresa que tem 100 funcioná

FAM

Leia o texto a seguir: Consideremos o seguinte experimento aleatórioLeia o texto a seguir: A distribuição binomial de probabilidade é aplicada à exper

FAM

5. Enquanto a estatística descritiva se concentra em resumir os dados em mãos, a estatística inferencial dá um passo adiante e busca usar uma pequena

de da Pergunta: 0,5 pontos Salva PERGUNTA 1 Relacione as variáveis de uma pesquisa estatística, apresentadas à esquerda, com as características de ...

UNIP São Luís

Pergunta 1 Considere uma empresa que deseja analisar os salários de seus funcionários para determinar se houve uma melhora significativa nos rendi...

Prévia do material em texto

1 
 
 
 
 
 
 
 
 
 
Estatística 
Básica 
Silvio Alves de Souza 
 
 
 2 
ÍNDICE 
 
Conceitos Básicos de Estatística ................................................................................ 3 
População ................................................................................................................ 6 
Amostra ................................................................................................................... 7 
Arredondamento de números .................................................................................. 7 
Proporção .............................................................................................................. 12 
Porcentagem ......................................................................................................... 14 
Exercícios .............................................................................................................. 14 
Fases do Método Estatístico ..................................................................................... 19 
Definição do Problema .......................................................................................... 19 
Planejamento ......................................................................................................... 19 
Coleta dos Dados .................................................................................................. 20 
Apuração dos Dados ............................................................................................. 22 
Apresentação dos Dados....................................................................................... 22 
Análise e Interpretação dos Dados ........................................................................ 23 
Questionários ............................................................................................................ 24 
Ordem das Questões ............................................................................................. 25 
Tipo de Abordagem ............................................................................................... 25 
Clareza nas Perguntas .......................................................................................... 25 
Não Sugerir Respostas .......................................................................................... 26 
A Necessidade do Pré-Teste ................................................................................. 26 
A Prática de Pesquisas por Amostragem .............................................................. 26 
Amostragem .............................................................................................................. 27 
Amostragem Aleatória Simples .............................................................................. 27 
Amostragem Estratificada ...................................................................................... 28 
Amostragem por Conglomerado ............................................................................ 31 
Amostragem Sistemática ....................................................................................... 32 
Exercícios .............................................................................................................. 33 
Distribuição de Freqüência ........................................................................................ 40 
Dados Brutos ......................................................................................................... 40 
Rol ......................................................................................................................... 40 
Tabela de freqüência ............................................................................................. 41 
Distribuição de Freqüências de Dados Tabulados Não-Agrupados em Classes41 
Distribuição de Freqüências de Dados Agrupados em Classes ......................... 42 
Manual para Normalização de Publicações Técnico – cientificas .......................... 46 
Exercícios .............................................................................................................. 47 
Medidas de Tendência Central. ................................................................................. 53 
Medidas de Variabilidade .......................................................................................... 64 
Exercícios .............................................................................................................. 68 
Representação Gráfica ............................................................................................. 75 
Exercícios .............................................................................................................. 91 
Probabilidade ............................................................................................................ 93 
Exercício:................................................................................................................. 109 
Distribuições de probabilidade ................................................................................ 116 
Teste de Hipótese ................................................................................................... 140 
Correlação ............................................................................................................... 154 
Regressão Linear .................................................................................................... 162 
Regressão Múltipla .................................................................................................. 164 
 3 
 
Conceitos Básicos de Estatística 
 
Definição de Estatística: 
 
 No plural (Estatísticas) indica qualquer coleção consistente de dados 
numéricos, reunidos com a finalidade de fornecer informações acerca de 
uma atividade qualquer. Assim, por exemplo, as estatísticas demográficas 
referem-se aos dados numéricos sobre nascimentos, falecimentos, 
matrimônios, desquites, etc. As estatísticas econômicas consistem em dados 
numéricos relacionados com emprego, produção, preços, vendas e com 
outras atividades ligadas aos vários setores da vida econômica. 
 
 No singular, indica uma metodologia desenvolvida para a coleta, a 
classificação, a apresentação, a análise e a interpretação de dados 
quantitativos e a utilização desses dados para a tomada de decisões. 
 
A grosso modo podemos dividir a estatística em três áreas: 
 
 Estatística Descritiva 
 Probabilidade 
 Inferência Estatística 
 
 
Estatística Descritiva 
 
Pode ser definida como um conjunto de técnicas destinadas a descrever, 
analisar e interpretar dados, a fim de que possamos tirar conclusões a respeito de 
características de interesse. 
É, em geral, utilizada na etapa inicial da análise, quando tomados contatos 
com os dados pela primeira vez. 
 
Probabilidade 
 
 4 
 Aplicada a não poucos das ciências naturais, do comportamento e sociais, e 
constitui, presentemente, um importante instrumento para análise de qualquer 
situação (em ciência, administração ou na vida diária) que, de alguma forma, 
envolva um elemento de incerteza, ou chance. 
 
 
 5 
Inferência Estatística 
 
É o estudo de técnicas que possibilitam a extrapolação dos resultados, 
estimação de quantidades desconhecidas e testar hipóteses a partir de um conjunto 
de dados denominado amostra. Podemos assim chegar a conclusões sobre a 
população. 
 
 
 
 
 
 
 
 
 
Natureza dos dados 
 
 Dados Nominais: São dados categóricos (qualitativos ou descritivos). 
Exemplos: solteiro ou casado, sim ou não, gordo ou magro, etc. Podem ser 
transformados em dados numéricos, como por exemplo: 1 – sim e 2 – não. 
 
 Dados ordinais: Sãodados numéricos os quais podemos estabelecer 
desigualdades, como por exemplo 1- madeira e 2 – diamante. Temos que 
2>1. Em se tratando de dados ordinais , > não significa necessariamente “ 
maior do que”. Pode representar por exemplo “ mais feliz do que” , “ mais 
gostoso do que” , mais resistente do que, etc. 
 
 Dados intervalares: São dados numéricos que podemos estabelecer 
desigualdades e formar diferenças. Exemplo: Temperaturas. 
 
 Dados de razão: São dados numéricos que podemos estabelecer 
desigualdades, diferenças, formar multiplicação e divisão. Exemplos: peso, 
altura, dinheiro, volume, etc. 
 
População Amostra 
Estatística Descritiva 
Inferência 
 6 
 
Objetivo do Estudo da Estatística 
 
A utilização da Estatística é cada vez mais acentuada em qualquer atividade 
profissional da vida moderna. Nos seus mais diversificados ramos de atuação, as 
pessoas estão freqüentemente expostas à Estatística, utilizando-a com maior ou 
menor intensidade. Isto se deve às múltiplas aplicações que o método estatístico 
proporciona àqueles que dele necessitam. 
 
 
 População 
 
Conjunto da totalidade dos indivíduos sobre o qual de faz uma inferência. 
 
Em linguagem mais formal, a população é o conjunto constituído por todos os 
indivíduos que apresentem pelo menos uma característica comum, cujo 
comportamento interessa analisar (inferir). 
 
Essas características da população são comumente chamadas de 
parâmetros, os quais são valores fixos e ordinariamente desconhecidos. 
 
Exemplo: 
Se se quiser realizar um estudo censitário das rendas das famílias, poderia 
existir uma observação para cada família no Brasil, podemos limitar a população ao 
estado de Minas Gerais. 
 
Observação: 
É importante ficar bem claro que uma população é estudada em termos de 
observações de características nos indivíduos, e não em termos de pessoas ou 
objetos em si. Assim, por exemplo, as alturas dos cidadãos de MG constituem uma 
população. Poderia haver uma população correspondente aos pesos desses 
mesmos cidadãos. 
 
 7 
 Amostra 
 
Um subconjunto, uma parte selecionada da totalidade de observações 
abrangidas pela população, através da qual se faz um juízo ou inferência sobre as 
características da população. 
 
Exemplo: 
Avaliação de um Programa de Ensino – Toma-se certo número de pares de 
turmas: a um conjunto de turmas ensina-se um assunto por um novo método, e ao 
outro conjunto, pelo método clássico. Aplica-se uma prova a ambos os grupos. As 
notas observadas nesses conjuntos de turmas consistem a nossa amostra. Se os 
resultados do novo método forem melhores, iremos aplica-lo a todas as turmas – isto 
é, à população. A partir da amostra estabelecemos o que é conveniente para a 
população, ou seja, fazemos uma inferência sobre a população. 
 
 Arredondamento de números 
 
Arredondamento por falta 
Quando o primeiro dígito, aquele situado mais à esquerda entre os que irão 
ser eliminados, for igual ou menor que quatro, não deverá ser alterado o dígito 
remanescente. 
 
 
Número a arredondar 
 
 
Arredondamento para 
 
Número arredondado 
12,489 Inteiros 12 
20,733 Décimos 20,7 
35,992 Centésimos 35,99 
 
Arredondamento por excesso 
 
Quando o primeiro dígito, aquele situado mais à esquerda entre os que irão 
ser eliminados, for maior ou igual a cinco seguido por dígitos maiores que zero, o 
dígito remanescente será acrescido de uma unidade. 
 8 
 
 
 
Número a arredondar 
 
 
Arredondamento para 
 
Número arredondado 
15,504 Inteiros 16 
16,561 Décimos 16,6 
17,578 Centésimos 17,58 
 
Arredondamento centrais 
 
Quando o dígito situado mais à esquerda dos que serão eliminados for um 
cinco ou um cinco seguido somente de zeros, o último dígito remanescente, se for 
par, não se altera, e se for ímpar será aumentado uma unidade. 
 
 
Número a arredondar 
 
 
Arredondamento para 
 
Número arredondado 
15,500 Inteiros 16 
16,500 Inteiros 16 
17,750 Décimos 17,8 
17,705 Centésimos 17,70 
 
Arredondamento de Soma 
 
Quando se trata de soma, deve-se arredondar primeiro o total, e 
posteriormente as parcelas. Há aqui dois casos a considerar: 
 
a) Se a soma das parcelas da série arredondada for superior ao total, deve-se 
retornar à série original, arredondando-se, por falta, tantas parcelas quantas 
forem as unidades excedentes. Serão escolhidas as parcelas anteriormente 
arredondadas por excesso e cujas frações desprezadas representem o menor 
erro relativo. 
 9 
 
O erro relativo será definido como: dados dois números diferentes de zero 
x
 
e 
y
 com 
yx 
, o erro relativo entre eles será calculado pela expressão 
x
yx
ER


 
 O arredondamento do erro é feito de modo a poder identificar a ordem das 
parcelas. 
 
Exemplo: O quadro abaixo apresenta um modelo de arredondamento, para inteiro, 
da soma total de uma série. 
 
Série original Erro relativo Série arredondada Série corrigida 
5,51 0,082 6 6 
7,50 0,062 8 8 
14,63 0,025 15 15 
20,10 20 20 
24,73 0,011 25 24 * 
27,52 0,017 28 27 * 
Total : 99,99 102 100 
 
Observações: 1. (*) série corrigida 
 2. O arredondamento do erro foi milesimal para poder identificar as 
duas menores parcelas. 
 
Veja o cálculo dos erros relativos 
 
0816670
6
5156
,
,
ER 


 
0625000
8
5078
,
,
ER 


 
0246670
15
631415
,
,
ER 


 
0108000
25
732425
,
,
ER 


 
 10 
0171430
28
522728
,
,
ER 


 
 
 
b) Se a soma das parcelas da série arredondada for inferior ao total, deve-se 
retornar à série original, arredondando-se, por excesso, tantas parcelas 
quantas forem as unidades em falta. Serão escolhidas as parcelas 
anteriormente arredondadas por falta e cujas frações desprezadas 
representem o menor erro relativo. 
 
 11 
Exemplo: O quadro abaixo apresenta um modelo de arredondamento, para 
centésimo, da soma total de uma série. 
 
Série original Erro relativo Série arredondada Série corrigida 
2,514 0,0016 2,51 2,51 
12,502 0,0002 12,50 12,50 
4,6355 4,64 4,64 
11,1028 0,0002 11,10 11,10 
35,733 0,0001 35,73 35,74 * 
7,524 0,0005 7,52 7,52 
Total : 74,0113 74,00 74,01 
 
Observação: (*) série corrigida 
 
Exemplo: A tabela a seguir apresenta os resultados de uma pesquisa realizada com 
162 alunos de uma escola pública: 
 
Idades 
(anos) 
Freqüência 
simples 
Porcentagem 
(calculadora) 
Porcentagem 
(décimos) 
Erro 
Porcentagem 
Corrigida 
Menos 
17 
1 0,61728 0,6 0,0279938 0,6 
17 60 37,03704 37,0 0,0010001 37,0 
18 72 44,44444 44,4 0,0009999 44,4 
19 24 14,81481 14,8 0,0009997 * 14,9 
Mais 
19 
5 3,08642 3,1 3,1 
Total 162 99,99999 99,9 100 
 
 12 
Tabela 1: Idade dos alunos do 3º ano 
do curso técnico integrado diurno 
do CEFET – OP no ano de 2008. 
 
Idades 
(anos) 
Freqüência 
simples 
Porcentagem 
 
Menos 
17 
1 0,6 
17 60 37,0 
18 72 44,4 
19 24 14,9 
Mais 
19 
5 3,1 
Total 162 100 
Fonte: Relatório de pesquisa CEFET - OP 
 
 
Proporção 
 
Um certo número de pessoas foi classificado em quatro categorias. Essas 
categorias são, naturalmente, mutuamente exclusivas e exaustivas. Em outras 
palavras: uma pessoa só poderá estar incluída em uma única categoria, e todas elas 
deverão estar classificadas. 
 Em termos simbólicos, pode-se escrever: 
 
1N
= número de pessoas incluídas na categoria 1. 
2N= número de pessoas incluídas na categoria 2. 
3N
= número de pessoas incluídas na categoria 3. 
4N
= número de pessoas incluídas na categoria 4. 
4321 NNNNN 
= número total de pessoas consideradas. 
 
 13 
Neste caso, a proporção de pessoas pertencentes à primeira categoria é 
determinada mediante o cálculo do seguinte quociente 
N
N1
 
 
A proporção de pessoas pertencentes à segunda categoria é determinada 
mediante o cálculo do seguinte quociente 
N
N2
 
Sucessivamente temos 
 
N
N3
 e 
N
N4
 
 
o cálculo da proporção das pessoas pertencentes à terceira e quarta categoria. 
 
Observe que 
 
1
N
N
N
N
N
N
N
N
N
N 4321 
. 
 
Exemplo: A tabela a seguir apresenta o número de sócios praticantes e não-
praticantes de futebol em um clube hipotético. 
 
Tabela 2: número de sócios praticantes e não-praticantes 
de futebol em um clube hipotético 
Sócios Praticante (exclusivamente) de: Clube 1 Proporção 
Futebol de salão 580 0,100 
Futebol de campo 430 0,074 
Não-Praticantes 4810 0,826 
Total 5820 1,000 
 
 
 
 14 
 
 
 Porcentagem 
 
As porcentagens são obtidas a partir do cálculo das proporções, simplesmente 
multiplicando-se o quociente obtido por 100. Para representá-las usamos o símbolo 
%. 
 
Voltando ao exemplo anterior temos: 
 
Tabela 3: número de sócios praticantes e não-praticantes 
de futebol em um clube hipotético 
Sócios Praticante (exclusivamente) de: Clube 1 Porcentagem (%) 
Futebol de salão 580 10 
Futebol de campo 430 7,4 
Não-Praticantes 4810 82,6 
Total 5820 100 
 
 
 
 Exercícios 
 
1) Considere as situações a seguir e identifique a população e a amostra em cada 
caso. 
 
a. Para a análise de desempenho dos alunos da 8.ª série de uma determinada 
escola municipal foram escolhidas as notas de português de 35 alunos. 
b. Uma amostra de sangue foi retirada de um paciente com suspeita de alto 
colesterol. 
c. Uma maternidade entrevista 20 mães de recém nascidos dos 218 partos, no 
mês de janeiro, para avaliar a satisfação na prestação de serviço. 
d. A fim de avaliar a intenção de voto dos eleitores para deputado estadual, um 
candidato entrevista 2.120 eleitores em Minas Gerais. 
 15 
 
2) Use os critérios de arredondamento para arredondar cada valor a seguir para 
décimos. 
 
a) 21,24 d) 0,75 g) 3,521 
b) 1,088 e) 5,819 h) 9,275 
c) 125,5555 f) 0,3333 i) 235,25 
3) Aplique os critérios de arredondamento para completar o quadro abaixo: 
 
Número a arredondar Arredondamento para Número arredondado 
25,458 Centésimo 
123,99 Décimo 
205,7056 Milésimo 
17,561 Inteiro 
 
4) Aplique os critérios de arredondamento para completar o quadro abaixo: 
 
Número a arredondar Arredondamento para Número arredondado 
1,23 Décimo 
5,488 Centésimo 
0,126 Centésimo 
35,4 Inteiro 
13,99 Décimo 
25,7056 Milésimo 
7,561 Inteiro 
690,1555 Centésimo 
0,115588 Milésimo 
 
 
5) A tabela abaixo representa a produção, em unidades, da fábrica X de 
determinada peça no segundo semestre de 2005. 
 
Mês Produção 
 16 
Julho 35.500 
Agosto 34.750 
Setembro 36.800 
Outubro 35.150 
Novembro 32.300 
Dezembro 31.250 
 
Calcule: (Use arredondamento para centésimos) 
 
a) a proporção de peças produzidas no mês de outubro. 
b) a proporção de peças produzidas até setembro. 
c) a porcentagem de peças produzidas em dezembro. 
 
6) Uma escola ia contratar um grupo de 8 professores para dar um curso sobre 
computadores em 48 horas, pagando um total de R$ 9 216,00. No entanto, como 
medida de economia, ela resolveu contratar somente 6 professores e dar o curso em 
36 horas. Quanto a escola economizará? 
 
7) João comprou uma mercadoria em uma loja de utilidades. Quando foi pagar a 
conta, o vendedor informou-lhe que devido a uma promoção relâmpago, ele teria 8 
% de desconto na compra à vista pagando, pelo produto, R$ 276,00. João optou por 
não pagar à vista. Quanto ele pagará pela mercadoria se compra-la a prazo? 
 
8) Para as situações descritas a seguir, identifique a população e a amostra 
correspondente. Discuta a validade do processo de inferência estatística, ou seja, se 
as amostras foram coletadas corretamente, para cada um dos casos. Não esqueça 
de apontar o erro de cada caso. 
 
a) Uma amostra de sangue foi retirada de um paciente com suspeita de 
anemia. 
 
 17 
b) Para verificar a audiência de um programa de TV, 563 indivíduos foram 
entrevistados por telefone com relação ao canal em que estavam 
sintonizados. 
 
c) A fim de avaliar a intenção de voto para presidente dos brasileiros, 122 
pessoas foram entrevistadas em Brasília. 
 
9) Para encher um reservatório em 15 dias, são necessárias 3 torneiras. Em quanto 
tempo 5 torneiras, idênticas às anteriores, encherão o mesmo reservatório? 
 
10) Um navio dispõe de reservas suficientes para alimentar 14 homens durante 45 
dias, mas recebe 4 sobreviventes de um naufrágio. Durante quantos dias durarão as 
reservas de alimento? 
 
11) Calcule: 
 
a) 15 % de R$ 2 800,00 ? 
 
b) 42 % de R$ 18 300,00 ? 
 
12) Resolva os problemas abaixo: 
 
a) Numa classe foram reprovados 15 % dos alunos, isto é, 9 alunos. Quantos 
alunos haviam nesta classe? 
 
b) Em uma cidade haviam 5600 eleitores do candidato A e 7800 eleitores do 
candidato B. 
 
1) Qual a proporção dos eleitores do candidato A? 
 
2) Qual a proporção dos eleitores do candidato B? 
 
13) Em um colégio existem 1 200 alunos, dos quais 720 são meninos. Determine: 
 
 18 
a) Qual a proporção do número de meninos? 
 
b) Qual a proporção do número de meninas? 
 
14) Num livro de 200 páginas, há 30 linhas em cada página. Se houvesse 25 linhas, 
quantas páginas teria o livro? 
 
 19 
Fases do Método Estatístico 
 
Quando se pretende empreender um estudo estatístico completo existem 
diversas fases do trabalho que devem ser desenvolvidas para se chegar aos 
resultados finais do estudo. 
 
Definição do Problema 
 
A primeira fase do trabalho estatístico consiste em uma definição ou 
formulação correta do problema a ser estudado. 
O problema deve ser preciso, bem determinado e específico. 
Além de considerar detidamente o problema objeto do estudo, o analista 
deverá examinar outros levantamentos realizados no mesmo campo e análogos, 
uma vez que parte da informação de que necessita pode, muitas vezes, ser 
encontrada nesses últimos. 
Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir 
corretamente o problema. 
 
 
Planejamento 
 
Consiste em se determinar o procedimento necessário para resolver o 
problema e, em especial, como levantar informações sobre o assunto objeto do 
estudo. 
Mais especialmente, na fase do planejamento a preocupação maior reside na 
escolha das perguntas. 
É nessa fase que será escolhido o tipo de levantamento a ser utilizado. Sob 
esse aspecto, pode haver dois tipos de levantamento: 
a) Levantamento censitário, quando a contagem abranger todo o 
universo. 
b) Levantamento por amostragem, quando a contagem for parcial. 
 
Nesta fase temos outros elementos importantes que devem ser tratados. 
 
 20 
a) cronograma das atividades, através do qual são fixados os prazos 
para as varias fases; 
b) Os custos envolvidos; 
c) O exame das informações disponíveis; 
d) O delineamento da amostra; 
e) A forma como serão escolhidos os dados, etc. 
 
Obs: Os livros mais específicos sobre pesquisa de mercado poderão ser 
consultados.Coleta dos Dados 
 
O terceiro passo é essencialmente operacional. 
A coleta de dados se refere à obtenção, reunião e registro sistemático de 
dados, com um objetivo determinado. 
 
Espécies de dados: 
 
I) Dados Primários: quando são publicados ou comunicados pela 
própria pessoa ou organização que os haja recolhido. 
II) Dados Secundários: Quando são publicados ou comunicados por 
outra organização. 
 
Um conjunto de dados é, pois, primário ou secundário em relação a 
alguém. 
É mais seguro trabalhar com fontes primárias, pois: 
 
a) Uma fonte primária oferece, em geral, informações mais detalhadas 
do que uma secundária. 
b) É mais provável que as definições de termos e de unidades figurem 
somente nas fontes primárias. 
c) O uso da fonte secundária traz o risco adicional de erros de 
transcrição. 
 21 
d) Uma fonte primária poderá vir acompanhada de cópias dos 
impressos utilizados para coletar as informações, juntamente com o 
procedimento adotado na pesquisa, a metodologia seguida e o tipo 
de tamanho da amostra. 
 
Essas informações proporcionam ao usuário uma idéia do grau de garantia 
que os dados oferecem. 
A coleta de dados pode ser realizada de duas maneiras: direta ou 
indiretamente. 
 
 
Coleta Direta 
 
 A coleta é direta quando é obtida diretamente da fonte. 
 
Ex.: Uma empresa pesquisa seus consumidores. 
 
Há três tipos de coleta direta: 
 
a) Coleta direta contínua: quando estes são obtidos ininterruptamente, 
automaticamente e na vigência de um determinado período. 
Ex.: Registros de nascimento, de casamento, de óbito, etc. 
 
b) Coleta direta periódica: quando é realizada em períodos curtos, 
determinados, de tempo em tempo. 
Ex: Recenseamento demográfico. O censo industrial. 
 
c) Coleta direta ocasional: Quando os dados forem colhidos 
esporadicamente, atendendo a uma conjuntura qualquer ou a uma 
emergência. 
Ex.: Casos fatais em surto epidêmico. 
 
 
 22 
Coleta Indireta 
 
 A coleta dos dados é indireta quando é inferida a partir dos elementos 
conseguidos pela coleta direta, ou através do conhecimento de outros fenômenos 
que, de algum modo, estejam relacionados com o fenômeno em questão. 
 É feita, portando, por deduções e conjunturas, podendo ser realizada: 
a) Por analogia: quando o conhecimento de um fenômeno é induzido a 
partir de outro que com ele guarda relações de casualidade. 
b) Por proporcionalização: Quando o conhecimento de um fato se induz 
das condições quantitativas de uma parte dele. 
c) Por indícios: quando são escolhidos fenômenos sintomáticos para 
discutir um aspecto geral da vida social. 
d) Por avaliação: quando através de informações fidedignas ou 
estimativas cadastrais, se presume o estado quantitativo de um 
fenômeno. 
 
 
Apuração dos Dados 
 
 Consiste em resumir os dados, através de sua contagem e agrupamento. 
 Ela pode ser manual, mecânica, eletromecânica ou eletrônica. 
 Através da apuração tem-se a oportunidade de condensar os dados, de modo 
a obter um conjunto compacto de números, o qual possibilita distinguir melhor o 
comportamento do fenômeno na sua totalidade. 
 Entretanto, a contrapartida da melhor apreciação dos dados em seu conjunto 
é a perda correspondentes de detalhes, uma vez que se trata de um processo de 
sintetização. 
 
Apresentação dos Dados 
 
 Há duas formas de apresentação, que não se excluem mutuamente. 
 
 23 
a) Apresentação Tabular: É uma apresentação numérica dos dados. 
Consiste em dispor os dados em linhas e colunas distribuídas de 
modo ordenado. 
b) Apresentação Gráfica: Constitui uma Apresentação Geométrica. 
Embora a apresentação tabular seja de extrema importância, no 
sentido de facilitar a análise numérica dos dados, não permite ao 
analista obter uma visão tão rápida, fácil e clara do fenômeno e sua 
variação como a conseguida através de um gráfico. 
 
 
Análise e Interpretação dos Dados 
 
É a última fase e a mais importante e também a mais delicada. 
O interesse maior, nesta etapa, reside em tirar conclusões que auxiliem o 
pesquisador a resolver seu problema. 
A análise está ligada essencialmente ao cálculo de medidas, cuja finalidade 
principal é descrever o fenômeno. 
 
 
 24 
Questionários 
 
Questionários são o meio mais comum de coleta de informações. 
 Dois tipos de questões são usualmente empregados na redação de 
questionários: 
 
 Questões de múltipla escolha 
 
 Questões de resposta aberta 
 
As alternativas em uma questão de múltipla escolha devem ser claras, 
mutuamente excludentes e, quando pedirem opiniões, fornecer opções dos dois 
lados do assunto. Idealmente, as opções devem cobrir todas as respostas prováveis. 
Se, entretanto, muitas alternativas são apresentadas, elas podem não ser 
suficientemente claras e confundir o respondente no momento de sua decisão. A 
grande desvantagem de questões de múltipla escolha é que tendem a sugerir uma 
resposta, já que limita as respostas possíveis, impedindo o respondente de dizer 
exatamente o que pensa. 
 Este tipo de limitação não ocorre nas questões de resposta aberta, em que o 
entrevistado usa suas próprias palavras para responder à pergunta. Uma pergunta 
deste tipo produz uma grande gama de respostas que devem ser classificadas em 
grupos homogêneos antes que se possa fazer uma análise estatística. Esta 
classificação é uma tarefa difícil quando o número de respostas a serem analisadas 
é muito grande. Por isso, questões de respostas abertas são mais freqüentemente 
empregadas em estudos pilotos ou nos estágios exploratórios, quando se procura 
determinar quais tipos de respostas aparecerão. Essas informações são então 
usadas na construção do questionário a ser utilizado na obtenção dos dados de um 
grupo maior. Às vezes é inevitável misturar os dois tipos de pergunta, quando, por 
exemplo, colocamos a opção “outros” e pedimos especificação. Se os dados forem 
analisados por computador, deve-se pensar na etapa da codificação ao redigir as 
perguntas. 
 
 
 25 
Ordem das Questões 
 
 Um questionário consistente em uma bateria de questões arranjadas em certa 
ordem. As primeiras questões são para estabelecer contato com o respondente e 
devem ser bem simples. Quando vários tópicos estão envolvidos, deve-se completar 
um tópico antes de passar a outro. A ordem das questões freqüentemente afeta as 
respostas dadas pelo respondente, já que as perguntas chamam a atenção do 
entrevistado para um conjunto de pensamentos e sentimentos, em cujo contexto as 
outras perguntas serão respondidas. Em pesquisa de mercado, por exemplo, 
questões que mencionam um produto específico tendem a viciar as perguntas que 
se seguem; conseqüentemente, estas questões identificando produtos ou firmas 
devem ser colocadas no final, sempre que possível. 
 
 
Tipo de Abordagem 
 
 Muitas pessoas tendem a racionalizar ou exagerar suas respostas quando 
são questionadas diretamente sobre seus motivos, realizações ou outros assuntos 
que envolvam seu prestígio ou auto-estima. Para se evitar a introdução de 
tendenciosidade nessas respostas, usa-se freqüentemente uma abordagem indireta 
na elaboração de questões que envolvem prestígio. Por exemplo, ao invés de 
perguntas: “Você terminou o curso secundário?”, pode-se perguntar: “Em que ano 
você estava quando deixou de estudar?”. Na segunda pergunta tenta-se evitar 
constrangimento aos respondentes que não terminaram o curso secundário. 
 
 
Clareza nas Perguntas 
 
 Uma pergunta deve ter aproximadamente o mesmo sentido para todos os 
entrevistados; caso contrário, os dados obtidosnão terão grande utilidade. Termos 
com sentido dúbio devem ser evitados. As perguntas devem ser simples. Nem todos 
os entrevistados entenderão questões com enunciado complexo, originando, assim, 
resultados ruins. 
 
 26 
 
Não Sugerir Respostas 
 
 Na formulação das perguntas deve-se evitar um tipo de redação como esta: 
“Você concorda em que esta bebida, sendo a melhor, deva custar mais caro?” 
 Esta pergunta sugere tão obviamente uma resposta que é praticamente inútil. 
Algumas vezes, entretanto, é difícil perceber que a redação de uma pergunta possa 
sugerir determinada resposta. 
 
 
A Necessidade do Pré-Teste 
 
 Assim que um questionário tenha sido redigido, deve ser testado em um 
estudo piloto. Esta fase é fundamental para detectar dificuldades não observadas, 
como o lay out do questionário, ordem e redação das perguntas, necessidade de 
instruções mais claras para os entrevistadores, etc. Naturalmente, a correção dessas 
imprecisões melhorará a qualidade do levantamento. 
 
 
A Prática de Pesquisas por Amostragem 
 
 O leitor deve convencer-se de que é fundamental conhecer as características 
específicas da área onde pretende participar de pesquisas por amostragem. O 
significado especial de algumas palavras, os melhores locais e horários para se 
fazer coleta de dados, o tipo de entrevistador são, entre outros, fatores importantes 
para o bom andamento do levantamento. Só lendo literatura na área específica é 
que se pode, entretanto, conhecer estes detalhes. 
 
 
 27 
Amostragem 
 
 
Conceitos Fundamentais 
 
 Assim que decidimos obter informações através de um levantamento 
amostral, temos imediatamente dois problemas: 
 
 definir cuidadosamente a população de interesse e 
 selecionar a característica que iremos pesquisar. 
 
A população-alvo é a população sobre a qual vamos fazer inferências 
baseadas na amostra. 
 Caracterizada a população-alvo, o próximo passo é escolher as 
características que iremos medir. Aqui o erro freqüente é querer incluir muitas 
características. A qualidade da mensuração cai com o aumento do número de 
perguntas. Devemos, portanto, fixar-nos apenas em perguntas que contribuam para 
a quantificação adequada da característica populacional de real interesse para o 
estudo. 
 Para que possamos fazer inferências válidas sobre a população a partir de 
uma amostra, é preciso que esta seja representativa. Uma das formas de se 
conseguir representatividade é fazer com que o processo de escolha da amostra 
seja, de alguma forma, aleatório. Além disso, a aleatoriedade permite o cálculo de 
estimativas dos erros envolvidos no processo de inferência. 
 
 
Amostragem Aleatória Simples 
 
 Neste caso a amostra é escolhida elemento a elemento. A população é 
numerada de 1 a N. escolhem-se, em seguida, na tábua de números aleatórios, n 
números compreendidos entre 1 e N. esse processo é equivalente a um sorteio no 
qual se colocam todos os números misturados dentro de uma urna. Os elementos 
correspondentes aos números escolhidos formarão a amostra. 
 
 28 
Exemplo: A tabela a seguir refere-se aos diâmetros de 30 eixos produzidos por uma 
industria automobilística (dados hipotéticos) 
 
26 32 26 19 20 22 30 31 17 20 
16 17 28 15 26 19 14 16 16 26 
27 31 13 26 18 29 18 16 21 24 
 
Extrair, sem reposição, uma amostra aleatória de tamanho n = 5. 
 
Solução: Primeiramente deveremos numerar a população. 
 
Eixo 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 
Diâmetro 26 32 26 19 20 22 30 31 17 20 16 17 28 15 26 19 14 
 
Eixo 18 19 20 21 22 23 24 25 26 27 28 29 30 
Diâmetro 16 16 26 27 31 13 26 18 29 18 16 21 24 
 
 
 Escolhemos uma coluna na TNA. 
 Procuramos os 5 primeiros números não superiores a 30, lendo os dos 
últimos algarismos ou os dois primeiros. 
 
Obtemos: 
2.ª coluna 
Leitura na TNA (2 últimos) 18 15 22 24 03 
Diâmetro 16 26 31 26 26 
 
 
Amostragem Estratificada 
 
 Quando os elementos da população estão divididos em grupos não 
superpostos, é mais fácil e mais eficiente escolher, independentemente, uma 
 29 
amostra aleatória simples dentro de cada um destes grupos, os quais são chamados 
estratos. 
 Esta forma de amostragem é uma das mais utilizadas, já que a maioria das 
populações tem estratos bem definidos: os homens e as mulheres; os alunos das 
escolas X, Y, Z; os estados brasileiros; ect. 
 O mais comum é utilizar-se a Amostragem Estratificada Proporcional, que 
consiste em selecionar os elementos da amostra entre os vários estratos, em 
número proporcional ao tamanho de cada um dos estratos. Em outras palavras, 
sejam: 
 
 N o número de elementos da população 
 L o número de estratos 
 
iN
 o número de elementos do estrato i 
n o tamanho da amostra a ser selecionada 
in
 tamanho de amostra no estrato i 
 
 
Note que 
N = N1 + N2 + ... + NL 
 
Calcula-se a fração de amostragem dada por: 
f = 
N
n
 
Obs: A fração de amostragem calcula o tamanho de amostra por unidade da 
população. 
 
O número de elementos a serem sorteados em cada estrato será: 
.fNn 11 
 
.fNn 22 
 
.fNn LL 
 
 
 30 
Exemplo: Na execução de uma rede elétrica, uma firma especializada utiliza 
eletrodutos de dois tipos: E e F. em uma análise do custo do material 
foram considerados 30 faturas, representadas abaixo pelo preço de 10m 
de eletroduto. 
 
Eletroduto (estrato) E 
 
Fatura 01 02 03 04 05 06 
Preço (R$) 710 710 715 715 755 760 
 
Eletroduto (estrato) F 
 
Fatura Preço 
(R$) 
Fatura Preço 
(R$) 
Fatura Preço 
(R$) 
Fatura Preço 
(R$) 
01 750 07 760 13 770 19 790 
02 750 08 765 14 770 20 795 
03 750 09 765 15 770 21 795 
04 750 10 765 16 785 22 800 
05 755 11 765 17 785 23 810 
06 760 12 765 18 790 24 820 
 
 
 Extrair, sem reposição, uma amostra estratificada proporcional de tamanho 
n = 8. 
 
Solução: 
 
f = 
30
8
= 0,27 
 
De cada estrato serão sorteadas respectivamente nE e nF unidades: 
 
nE = (0,27) . 6 = 1,62  2 
 
 31 
nF = (0,27) . 24 = 6,48 6 
 
Para encontrar a amostra referente ao eletroduto E utilizamos TNA (8.ª coluna – 
primeiro algarismo) e para encontrar a amostra referente ao eletroduto F utilizamos 
TNA (4.ª coluna – últimos algarismos). Assim obtemos: 
 
Estrato E F 
Leitura na 
TNA 
03 01 20 03 18 17 24 12 
Fatura (R$) 715 710 795 750 790 785 820 765 
 
Entre as vantagens da amostragem estratificada destacam-se: 
a) os dados são geralmente mais homogêneos dentro de cada estrato do que na 
população como um todo; 
b) o custo da coleta e análise dos dados é freqüentemente menor nesse tipo de 
amostragem do que na aleatória simples, devido a conveniências 
administrativas; 
c) podem-se obter estimativas separadas dos parâmetros populacionais para 
cada estrato sem selecionar outra amostra e, portanto, sem custo adicional. 
 
 
Amostragem por Conglomerado 
 
 Uma amostra por conglomerado é uma amostra aleatória simples na qual 
cada unidade de amostragem é um grupo, ou conglomerado de elementos. 
 O primeiro passo para se usar este processo é especificar conglomerados 
apropriados. Os elementos em um conglomerado devem ter características 
similares. Como regra geral, o número de elementos em um conglomerado deve ser 
pequeno em relação ao tamanho da população, e o número de conglomerados, 
razoavelmente grande. 
 Tanto no caso da amostragem estratificada, como no da amostragem por 
conglomerados, a população deve estar dividida em grupos. Na amostragem 
estratificada, entretanto,seleciona-se uma amostra aleatória simples dentro de cada 
grupo (estrato) enquanto que na amostragem por conglomerado selecionam-se 
 32 
amostras aleatórias simples de grupos, e todos os itens dentro dos grupos 
(conglomerados) selecionados farão parte da amostra. 
 A amostragem por conglomerado é recomendada quando: 
a) ou não se tem um sistema de referência listando todos os elementos da 
população, ou a obtenção dessa listagem é dispendiosa; 
b) o custo da obtenção de informações cresce com o aumento da distância entre 
os elementos; 
 
Exemplo: Supondo que se deseje estimar o rendimento médio familiar em um 
determinado bairro, como deve ser escolhida a amostra? 
 
Solução: 
A amostragem aleatória simples é inviável, pois pressupõe uma listagem de 
todas as famílias do bairro, o que é praticamente impossível de se obter. 
A alternativa da amostragem estratificada é também inviável, já que aqui 
também é necessária uma listagem dos elementos por estrato. 
A melhor escolha é a amostragem por conglomerado. O sistema de referência 
pode ser constituído por todos os quarteirões do bairro. Cada quarteirão é um 
conglomerado. Extrai-se uma amostra aleatória simples de quarteirões e neles 
pesquisa-se a renda familiar em todas as casas. 
 
 
 
Amostragem Sistemática 
 
 Uma amostragem sistemática de tamanho n é constituída dos elementos de 
ordem K, K+r, K+2r, ... , onde K é um inteiro escolhido aleatoriamente entre 1 e n . E 
r é o inteiro mais próximo da fração 
 
n
N
r 
 
 
 Por exemplo, se a população tem 100 elementos e vamos escolher uma 
amostra de tamanho 6, K é um inteiro escolhido aleatoriamente entre 1 e 6, e r = 
100/6 = 16,6 = 17. 
 33 
 Pela TNA (8ª coluna – primeiro algarísmo) K = 3. Assim a amostra será 
composta pelos elementos de posição: 
 
3, 20, 37, 54, 71, 88 
 
 Se o tamanho da população é desconhecido, não podemos determinar 
exatamente o valor de r. Escolheremos intuitivamente um valor razoável para r. 
 Às vezes a amostragem sistemática é preferida à amostragem aleatória 
simples, porque é mais fácil de executar, estando portando menos sujeita a erros, e 
proporciona mais informações com menor custo. 
 
Exemplo: escolha a técnica adequada para extrair uma amostra de 50 
compradores de uma loja. 
 
Solução: A amostragem aleatória simples não pode ser empregada neste caso, 
pois o entrevistador não pode determinar quais compradores serão incluídos na 
amostra, uma vez que não se conhece o tamanho N da população, até que todos os 
compradores tenham ido à loja. Assim, ele pode usar a amostragem sistemática 
(digamos 1 em cada 20 compradores) até obter a amostra do tamanho desejado. 
 
Exercícios 
 
1) Com relação a amostragem aleatória é CORRETO afirmar que: 
 
a) ( ) Utilizamos a tabela de números aleatórios para encontrar o valor do k. 
b) ( ) É utilizada quando conhecemos parte da população 
c) ( ) Pode ser utilizada quando não conhecemos a população 
d) ( ) É um método aleatório em que não há possibilidade do pesquisador 
interferir na escolha da amostra; 
e) ( ) Nenhuma das alternativas acima. 
 
2) Com relação a amostragem sistemática é CORRETO afirmar que: 
 
 34 
a) ( ) Permite encontrar amostras de população cujo número total de 
elementos é desconhecido; 
b) ( ) A amostra é encontrada utilizando uma progressão geométrica cujo 
primeiro termo é o primeiro elemento da população ; 
c) ( ) A amostra é encontrada utilizando uma progressão aritmética cujo 
primeiro termo é o primeiro elemento da população ; 
d) ( ) A amostra é encontrada utilizando uma progressão aritmética cuja razão 
é encontrada na tabela de números aleatórios; 
e) ( ) Nenhuma das alternativas acima. 
 
3) Com relação a amostragem estratificada é CORRETO afirmar que: 
 
a) ( ) Permite encontrar amostras de estratos que não possuem nenhuma 
característica em comum; 
b) ( ) Os estratos devem ser disjuntos; 
c) ( ) A amostra é sempre dividida em partes iguais para cada estrato; 
d) ( ) Utilizamos uma amostragem aleatória simples considerando todos os 
estratos juntos; 
e) ( ) Nenhuma das alternativas acima. 
 
4) O gerente de um determinado banco com o intuito de fazer uma pesquisa junto a 
seus clientes utiliza o seguinte processo: Pega o primeiro cliente que compareceu à 
agência naquele dia e o entrevista. O segundo a ser entrevistado é o 6.º cliente. O 
terceiro a ser entrevistado é o 11.º cliente e assim sucessivamente até que a 
agência feche. É CORRETO afirmar que: 
 
a) ( ) O gerente utilizou uma amostragem estratificada proporcional; 
b) ( ) O gerente utilizou uma amostragem aleatória simples; 
c) ( ) O gerente utilizou uma amostragem sistemática; 
d) ( ) O gerente não utilizou nenhum método de amostragem; 
e) ( ) Nenhuma das alternativas acima. 
 
 35 
5) Considere o seguinte problema: Deve-se extrair uma amostra estratificada 
proporcional de tamanho 60 de uma população de tamanho 4.000, que consiste de 
três estratos de tamanhos N1=2.000, N2=1.200 e N3= 800. É CORRETO afirmar que: 
 
a) ( ) Do primeiro estrato deverá ser extraída 18 amostras; 
b) ( ) Do segundo estrato deverá ser extraída 30 amostras; 
c) ( ) Do terceiro estrato deverá ser extraída 12 amostras; 
d) ( ) Deverá extrair 20 amostras de cada estrato; 
e) ( ) Nenhuma das alternativas acima. 
 
6) A única opção que traz dois métodos de amostragem em que é preciso conhecer 
todos os elementos da população é: 
 
a) ( ) Aleatória simples e por conglomerado; 
b) ( ) Por conglomerado e sistemática; 
c) ( ) Aleatória simples e sistemática; 
d) ( ) Estratificada e por conglomerado; 
e) ( ) Nenhuma das alternativas acima. 
 
7) Os dados abaixo se referem a taxa de hemoglobina no sangue (em gramas/cm3) 
de 12 professores de uma determinada escola. 
 
Professor 1 2 3 4 5 6 7 8 9 10 11 12 
Taxa de 
hemoglobina 
11,1 12,2 15,2 11,3 14,4 12,7 13,5 15,8 11,7 16,3 14,1 12,5 
 
Extrair uma amostra sistemática de 3 taxas de hemoglobina. (Usar 7.ª coluna da 
TNA, último algarismo). 
 
8) Os dados abaixo referem-se ao salário (em salários mínimos) de 20 funcionários 
administrativos em uma indústria. 
 
10.1 7.3 8.5 5 4.2 3.1 2.2 9 9.4 6.1 
 36 
3.3 10.7 1.5 8.2 10 4.7 3.5 6.5 8.9 6.1 
 
 
a) Extraia uma amostra de 6 elementos usando a amostra aleatória simples. 
(Usar 2.ª coluna na TNA, dois últimos algarismos); 
 
b) Extraia uma amostra de 5 elementos usando a amostra sistemática. (Usar 
2.ª coluna na TNA, último algarismo). 
 
 
 37 
9) Uma pesquisa com usuários de transporte coletivo na cidade de São Paulo 
indagou sobre os diferentes tipos usados nas suas locomoções diárias. Dentre 
ônibus, metrô e trem, o número de diferentes meios de transporte utilizado foi o 
seguinte: 2, 3, 2, 1, 2, 1, 2, 1, 2, 3, 1, 1, 1, 2, 2, 3, 1, 1, 1, 1, 2, 1, 1, 2, 2, 1, 2, 1, 2 e 
3. 
 
a) Extraia uma amostra de 10 elementos usando a amostra aleatória simples. 
(Usar 3.ª coluna na TNA, dois últimos algarismos); 
 
b) Extraia uma amostra de 10 elementos usando a amostra sistemática. (Usar 
3.ª coluna na TNA, dois últimos algarismos); 
 
10) A idade dos 20 ingressantes num certo ano no curso de pós-graduação em 
jornalismo de uma universidade foi o seguinte: 22, 22, 22, 22, 23, 23, 24, 24, 24, 24, 
25, 25, 26, 26, 26, 26, 27, 28, 35 e 40. 
 
a) Extraia uma amostra de 8 elementos usando a amostra aleatória simples. 
(Usar 3.ª coluna na TNA, dois últimos algarismos); 
 
b) Extraia uma amostra de 8 elementos usando a amostra sistemática. (Usar 
3.ª coluna na TNA, último algrarismo); 
 
11) Umnovo medicamento para cicatrização está sendo testado e um experimento é 
feito para estudar o tempo (em dias) de completo fechamento em cortes 
provenientes de cirurgia. As 30 cobaias tiveram os seguintes tempos: 15, 17, 16, 15, 
17, 14, 17, 16, 16, 17, 15, 18, 14, 17, 15, 14, 15, 16, 17, 18, 18, 17, 15, 16, 14, 18, 
18, 16, 15 e 14. 
 
a) Extraia uma amostra de 10 elementos usando a amostra aleatória simples. 
(Usar 3.ª coluna na TNA, dois últimos algarismos); 
 
b) Extraia uma amostra de 10 elementos usando a amostra sistemática. (Usar 
3.ª coluna na TNA, dois últimos algarismos); 
 
 38 
 
12) Um exame vestibular para uma faculdade tem 80 questões, sendo 40 de 
português e 40 de matemática. Para os 20 melhores classificados, apresentamos o 
número de acertos em cada disciplina, em ordem decrescente de pontos: 
 
Aluno 1 2 3 4 5 6 7 8 9 10 
Português 35 35 34 32 31 30 26 26 24 23 
Matemática 31 29 27 28 28 26 30 28 25 23 
 
Aluno 11 12 13 14 15 16 17 18 19 20 
Português 23 12 11 20 17 12 14 20 8 10 
Matemática 21 32 31 20 21 25 20 13 23 20 
 
a) Extraia uma amostra de 5 alunos usando a amostra aleatória simples. 
(Usar 3.ª coluna na TNA, dois últimos algarismos); 
 
b) Extraia uma amostra de 5 alunos usando a amostra sistemática. (Usar 3.ª 
coluna na TNA, dois últimos algarismos); 
 
13) Em uma escola da rede municipal, estão matriculados 370 alunos no curso da 
manhã. Eles estão distribuídos na seguinte maneira: 
 
Salas 5.ª A 5.ª B 5.ª C 6.ª A 6.ª B 6.ª C 6.ª D 7.ª A 7.ª B 8.ª A 8.ª B 8.ª C 
Alunos 30 25 30 30 30 25 25 35 40 35 35 30 
 
a) Extraia uma amostra de 74 alunos usando a amostra estratificada. (Usar 3.ª 
coluna na TNA, dois últimos algarismos) 
 
14) O Departamento de Ensino de uma Escola Particular, de um bairro de classe 
média, deseja realizar uma pesquisa para saber se seria conveniente criar o 2.º grau 
em seu quadro de turmas. Isso porque ela ministra apenas da 1.ª série à 8.ª série do 
ensino básico e fundamental. 
Para isso ela contrata uma firma de consultoria para realizar esta pesquisa. 
 39 
Suponhamos que você faça parte dessa firma e seja indicado(a) para formular 
um questionário a fim de coletar dados que irão ajudar na solução deste problema. 
Então você deverá criar um questionário com esse objetivo. Bom trabalho.!!! 
 
 40 
Distribuição de Freqüência 
 
Dados Brutos 
 
 Feita a coleta, os dados originais ainda não se encontram prontos para 
análise, por não estarem numericamente organizados. Por essa razão, costuma-se 
chamá-los de dados brutos. 
 
Exemplo: Na tabela 1, estão relacionadas as notas em estatística dos alunos do 7.º 
período de Matemática. 
 
Tabela 1: Notas em estatística dos alunos do 7.º período de Matemática 
 
16 14 15 14 15 
15 12 11 13 16 
16 12 15 16 15 
18 11 16 15 16 
15 13 12 15 15 
17 15 12 17 
 
 
Rol 
 
 O Rol é uma lista em que os valores estão dispostos em uma determinada 
ordem, crescente ou decrescente. 
 
Tabela 2:Notas em estatística dos alunos do 7.º período de Matemática 
 
11 13 15 15 16 
11 13 15 15 16 
12 14 15 16 17 
12 14 15 16 17 
12 15 15 16 18 
 41 
12 15 15 16 
 
 
Tabela de freqüência 
 
 
 As tabelas de freqüências são representações nas quais os valores se 
apresentam em correspondência com suas repetições, evitando –se assim que eles 
apareçam mais de uma vez na tabela, como ocorre com o rol. 
 A tabela de freqüências proporciona uma apresentação esteticamente mais 
vantajosa dos dados, facilitando ainda a verificação do comportamento do 
fenômeno. É possível, por outro lado, com a utilização de uma tabela de 
freqüências, a obtenção de estatísticas (medidas) com menos cálculo, e, 
conseqüentemente, em menos tempo do que se esse trabalho fosse realizado a 
partir dos dados brutos. 
 As tabelas de freqüências podem representar tanto valores individuais como 
valores agrupados em classes. 
 
Distribuição de Freqüências de Dados Tabulados Não-Agrupados em Classes 
 
 É uma tabela onde os valores da variável aparecem individualmente. Esse 
tipo de apresentação é utilizado para representar uma variável discreta ou 
descontinua. 
 
Exemplo: A tabela abaixo representa as notas em estatística dos alunos do 7.º 
período de Matemática da FAFIDIA. 
 
Tabela 3: Notas obtidas em uma 
avaliação de estatística dos alunos 
do 7.º período de Matemática da FAFIDIA 
 
 
Notas 
Freqüência 
fj 
 42 
 
11 2 
12 4 
13 2 
14 2 
15 10 
16 6 
17 2 
18 1 
 29 
 
 
Distribuição de Freqüências de Dados Agrupados em Classes 
 
 Muitas vezes, mesmo com o risco de se sacrificar algum detalhe manifestado 
na ordenação de valores individuais, há vantagem em resumir os dados originais em 
uma distribuição, onde os valores observados não mais aparecerão individualmente, 
mas agrupados em classes. 
 Para variáveis contínuas sempre usamos agrupar. Para variáveis discretas e 
número de valores representativos dessa variável muito grande também agrupamos. 
 
 
Elementos de uma Distribuição de Freqüências 
 
1) Freqüência Simples Absoluta: fj 
 
É o número de observações correspondentes a essa classe ou a esse 
valor. A freqüência simples absoluta, ou simplesmente freqüência, é 
simbolizada por fj . 
 
2) Amplitude Total: At 
 
 43 
É a diferença entre o maior e o menor valor observado da variável em 
estudo. 
 
3) Número de Classes 
 
É cada um dos grupos de valores em que se subdivide a amplitude total do 
conjunto de valores observados da variável. 
Uma classe pode ser identificada por seus extremos ou pela ordem em que 
ela se encontra na tabela (valor do índice j) 
O número de classes pode ser calculado usando a fórmula de Sturges: 
 
k = 1 + 3,3 log10 N 
 
Onde 
 k = número de classes 
N = número total de observações 
 
 
O arredondamento de k é feito para o inteiro imediatamente superior. 
 
4) Limites de classes 
 
Os limites de classe são seus valores extremos. 
 
a) Limite Inferior: É o valor mínimo de uma classe. 
b) Limite Superior: É o valor máximo de uma classe. Este pode não 
pertencer à classe atual. 
 
5) Amplitude do Intervalo de classe 
 
Amplitude do intervalo de classe ou simplesmente intervalo de classe é o 
comprimento da classe, sendo geralmente definida como a diferença entre seus 
limites superior e inferior. Pode-se também tomar a diferença entre dois limites 
inferiores ou superiores. 
 44 
 
6) Ponto médio de classe 
 
O ponto médio ou valor médio é o valor que a representa, para efeito de 
cálculos de certas medidas.Na distribuição de freqüências com valores 
agrupados em classes, considera-se que os resultados incluídos em cada classe 
distribuem-se uniformemente por seu intervalo. 
Exemplo 1: A tabela abaixo representa as notas obtidas por 29 alunos em uma 
avaliação de estatística 
 
Amplitude total = 18 – 11 = 7 
Número de classes: 
k = 1 + 3,3 x log 29 
k = 1 + 3,3 x 1,4624 
k = 5,83 
k  6 
 
Amplitude do intervalo de classe: 
 At / k = 7 / 6 =1,17  1,2 
 
Tabela 4: Notas obtidas em uma avaliação de estatística dos alunos do 7.º período 
de Matemática da FAFIDIA 
 
 
 
 
 
 
 
 
 
 
 
 
Notas fj 
11,0 12,2 6 
12,2 13,4 2 
13,4 14,6 2 
14,6 15,8 10 
15,8 17,0 6 
17,0 18,2 3 
Total 29 
 45 
 
 Exemplo 2: 
 
Tabela 5: Notas obtidas em uma avaliação de estatística dos alunos do 7.º períodode Matemática da FAFIDIA 
 
 
 
Notas 
 
Simples 
fj 
Acumulada 
simples 
 Fj 
“abaixo de” 
Relativa 
Simples 
frj 
Relativa 
Acumulada 
Frj 
“abaixo de” 
11,0 12,2 6 6 0,21 0,21 
12,2 13,4 2 8 0,07 0,28 
13,4 14,6 2 10 0,07 0,35 
14,6 15,8 10 20 0,34 0,69 
15,8 17,0 6 26 0,21 0,90 
17,0 18,2 3 29 0,10 1,00 
Total 29 
 
ROTEIRO PARA A ELABORAÇÃO DE UMA TABELA DE FREQÜÊNCIAS COM 
DADOS AGRUPADOS EM CLASSES 
 
 
Para a construção de uma tabela de freqüências, é conveniente adotar-se um 
roteiro que, embora baseado em critérios relativamente arbitrários, facilita e torna 
operacional o trabalho de quem irá montar a tabela. O roteiro proposto consta dos 
seguintes passos: 
 
a) Lista de dados brutos que pode ou não ser transformada em rol; 
b) Encontrar a amplitude total do conjunto de valores observados: 
 
 
 
Menor valor do conjunto Maior valor do conjunto - At = 
 46 
c) Calcular o número de classes (k) usando a fórmula de Sturges: 
 
d) Determinar a amplitude do intervalo de classe. 
 
Muitas vezes convém arredondar o número correspondente à amplitude 
do intervalo de classe a que se chegou para um número mais adequado, que 
facilite os cálculos. 
 
e) Determinar os limites das classes, escolhendo-se preferencialmente, 
números inteiros. 
f) Construir a tabela de freqüências. 
 
 
Manual para Normalização de Publicações Técnico – cientificas 
Ed. UFMG 
 
Tabelas de distribuição de freqüência 
 
1) As tabelas devem ser dotadas de um título claro e conciso localizado acima 
delas. São numeradas seqüencialmente em todo o trabalho, com algarismos 
arábicos (1, 2, 3, ...), segundo normas do IBGE. 
2) No cabeçalho de cada coluna indica-se o seu conteúdo. Os títulos das 
colunas podem ser datilografados verticalmente, se necessário, para 
economizar espaço. 
3) Não se deve deixar nenhuma “casa” vazia no corpo da tabela, usando-se os 
símbolos, conforme convenção internacional: 
 
- quando, pela natureza do fenômeno, o dado não existir 
Z quando o dado for rigorosamente zero 
... quando não se dispuser do cálculo 
 
4) Na construção de tabelas usam-se os seguintes traços: 
 
 47 
a) traço duplo horizontal, limitando o quadro; 
b) traço simples vertical, separando a coluna indicadora das demais e 
estas entre si; no corpo da tabela pode ser eliminado desde que o número de 
colunas seja pequeno e não haja prejuízo na leitura dos dados; 
5) a tabela não deve ser fechada lateralmente, tampouco se colocam traços 
horizontais separando os dados numéricos. 
 
 
Exercícios 
 
1) As cifras abaixo representam os ganhos de 15 vendedores: 
 
425 440 610 518 324 
482 624 390 468 457 
509 561 482 480 520 
 
2) Dão-se a seguir os pesos, em libras, de 20 candidatos a empregos no corpo de 
bombeiros de uma cidade: 
 
225 182 194 210 205 172 181 198 164 176 
180 193 178 193 208 186 183 170 186 188 
 
3) Os seguintes números de unidades de um produto foram completados em 
determinados dia por 20 operários de uma fábrica de artigos de artesanato: 
 
61 58 59 72 47 55 40 73 66 60 
71 69 63 58 51 42 67 80 62 53 
 
 
4) Uma auditoria em 60 faturas de venda revelou os seguintes números de erros na 
fixação de preços: 
 
0 0 2 1 4 1 0 1 3 2 
 48 
2 0 1 1 1 4 0 3 1 5 
1 1 0 2 0 0 1 1 4 3 
0 1 0 2 1 4 3 1 0 0 
5 1 2 0 3 0 2 1 1 3 
1 4 3 0 2 0 1 1 0 1 
 
 
5) Dão-se, a seguir, os números de alarmes falsos(acionados acidentalmente ou por 
mau funcionamento do equipamento) recebidos em 30 dias por um serviço de 
monitoramento da segurança: 
 
3 6 2 4 5 8 2 5 6 3 
4 7 4 6 5 5 5 4 3 7 
4 4 6 3 9 5 7 4 4 6 
 
As questões de 6 a 11 são referentes à tabela a seguir. Ela se refere a notas de 
alunos, em uma prova de 30 pontos, de uma determinada escola. 
 49 
 
 
 
6) O valor do limite superior da 4.ª classe é de: 
 
a) ( ) 17; 
b) ( ) 18; 
c) ( ) 19; 
d) ( ) 20; 
e) ( ) Nenhuma das alternativas acima. 
 
7) O valor do limite inferior da 3.ª classe é de: 
 
a) ( ) 13; 
b) ( ) 14; 
c) ( ) 15; 
d) ( ) 16; 
e) ( ) Nenhuma das alternativas acima. 
 
8) O valor da freqüência acumulada simples da 5.ª classe é de: 
 
a) ( ) 8; 
b) ( ) 10; 
c) ( ) 20; 
d) ( ) 26; 
Notas fj 
 11 6 
 2 
 2 
 10 
 6 
 21 4 
Total 30 
 50 
e) ( ) Nenhuma das alternativas acima. 
 
9) O valor da freqüência relativa acumulada 4.ª classe é de: 
 
a) ( ) 0,2000; 
b) ( ) 0,2667; 
c) ( ) 0,3333; 
d) ( ) 0,6667; 
e) ( ) Nenhuma das alternativas acima. 
 
10) Porcentagem dos alunos que tiraram abaixo de 50% da nota da prova é de: 
a) ( ) 20%; 
b) ( ) 27%; 
c) ( ) 34%; 
d) ( ) 67%; 
e) ( ) Nenhuma das alternativas acima. 
 
11) A nota em que 66% dos alunos estão acima dela é de: 
 
a) ( ) 15; 
b) ( ) 16; 
c) ( ) 17; 
d) ( ) 18; 
e) ( ) Nenhuma das alternativas acima. 
 
As questões de 12 a 15 são referentes à tabela a seguir. Ela se refere a pacientes 
internados no hospital X, localidade Y, no ano Z. 
 
 51 
 
 
 
 
 
 
 
 
 
12) O valor do limite superior da 4.ª classe é 
de: 
 
13) O valor do limite inferior da 3.ª classe é de: 
 
14) O valor da freqüência acumulada simples da 5.ª classe é de: 
 
15) O valor da freqüência relativa simples da 4.ª classe é de: 
 
16) Os dados se referem aos pesos dos alunos de uma determinada escola: 
 
60.5 60 70 47.4 60 57 52 47 55 50 
55 58 54 66 58.5 63 73 95 39 54.5 
72.8 47 58 85.2 49.2 52 56 84 75 50 
80.9 57.8 68.5 54.5 48 49 58 60 55 71 
55 58 63.5 52.5 51.6 59 87 73 49 86 
 
Após construir uma tabela de distribuição de freqüência agrupada em classes, a 
freqüência simples da terceira classe é de: 
 
17) Os dados abaixo se referem aos pesos dos alunos de uma determinada escola: 
 
60.5 60 70 47.4 60 57 52 47 55 50 
55 58 54 66 58.5 63 73 95 44 54.5 
Grupo etários (em 
anos) 
fj 
 20 1 
 3 
 5 
 6 
 4 
 70 1 
Total 20 
 52 
72.8 47 58 85.2 49.2 52 56 84 75 50 
80.9 57.8 68.5 54.5 48 49 58 60 55 71 
55 58 63.5 52.5 51.6 59 87 73 49 86 
 
Siga os passos para a construção de uma tabela de distribuição de freqüência com 
dados agrupados: 
 
a) Determine a amplitude total 
 
b) Determine a amplitude de classe 
 
c) Construa a tabela usando 7 classes 
 
d) Inclua na tabela as freqüências relativas simples 
 
e) Inclua na tabela as freqüências acumuladas (abaixo de) simples 
 
f) Inclua na tabela as freqüências acumuladas (abaixo de) relativas 
 
 
18) Com relação à tabela de distribuição de freqüência agrupada acima responda: 
 
a) Quantos alunos pesam até 69 kg? 
 
b) Quantos alunos pesam mais de 76 kg? 
 
c) Qual a porcentagem de alunos que pesam menos de 62 kg? 
 
 
 
 53 
 Medidas de Tendência Central. 
 
 
Medidas de Posição 
 
1) Média Aritmética Simples 
 
Dados não agrupados 
 
 A média aritmética simples, amostral, de um conjunto de n observações 
nxxx ,,, 21 
 é definida por 
 
n
x
x
n
i
i


1
 
 
A média aritmética simples, populacional, de um conjunto de 
N
 observações 
Nx,,2x,1x 
 é definida por 
 
N
xN
i
i


1
 
 
Exemplo: Os dados a seguir representam as alturas de 5 alunos de uma 
determinada escola. 
 
 1,60 1,68 1,80 1,76 1,66 
 
Qual a média aritmética? 
Solução: A média será 
 54 
700,1
5
66,176,180,168,160,1
5
5
1
1









x
x
x
x
n
x
x
i
i
n
i
i
 
 
 55 
Cálculo da Média de dados em tabela de distribuição de freqüência 
 
Considere: 
 
xi o ponto médio da classe i , 
fi a freqüência da classe i, 
k a quantidade de classe. 
 
A média aritmética é definida por: 
 





k
i
i
k
i
ii
f
fx
x
1
1
.
 
 
OBS.: 
 
 Caso tenhamos uma tabela de distribuição agrupada em classes, o valor de 
xi será o ponto médio da classe. 
 O arredondamento será sempre uma casa decimal a mais que os dados. 
 
Exemplo: A tabela abaixo representa as notas em estatística dos alunos do 7.º 
período de Matemática da FAFIDIA. Calcule a nota média. 
 
 
 
Notas 
Freqüência 
fj 
 
ii f.x
 
11 2 22 
12 4 48 
13 2 26 
14 2 28 
 56 
15 10 150 
16 6 96 
17 2 34 
18 1 18 
 29 422 
 
Solução: A nota média será 
6,14
29
422
.
1
1





k
i
i
k
i
ii
f
fx
x
 
Exemplo: A tabela abaixo representa as notas obtidas por 500 alunos em um teste 
de geografia. Calcule a nota média. 
 
 
 
 
 
 
 
 
 
 
 
 
Solução: A nota média será 
 
95,56
500
475.28
..
6
1
6
1
1
1









i
i
i
ii
k
i
i
k
i
ii
f
fx
f
fx
x
 
Notas fj xi xi.fi 
10 25 44 17,5 770 
25 40 70 32,5 2.275 
40 55 92 47,5 4.370 
55 70 147 62,5 9.187,5 
70 85 115 77,5 8.912,5 
 85 100 32 92,5 2.960 
Total 500 28.475 
 57 
 
 
2) Mediana: Md 
 
Dados não agrupados 
 
Para evitar a possibilidade de sermos enganados por valores muito pequenos 
ou muito grandes, ocasionalmente descrevemos o “meio” ou “centro”de um 
conjunto de dados com outras medidas estatísticas que não a média. Uma 
dessas medidas, a MEDIANA de n valores, exige que os ordenemos, e se define 
como: 
 
O valor do elemento do meio se n é ímpar, ou a média aritmética dos dois 
valores do meio se n é par. 
 
Assim dizemos que a mediana é o valor do 
2
1n 
 elemento. 
 
Exemplo: Em um mês recente, o Departamento de Caça e Pesca de um estado 
reportou 
 
 53 31 67 53 36 
 
violações em atividade de caça e pesca em cinco regiões. Qual a mediana? 
 
Solução: Ordenando os elementos temos: 31, 36, 53, 53, 67. Como temos 5 
elementos, a mediana é o valor do elemento central, 
3
2
15


. A mediana é o valor 
do 3.º elemento. Logo a mediana é Md = 53. 
 
Exemplo 2: Em algumas áreas, as pessoas autuadas por certas infrações leves de 
tráfego podem freqüentar um curso de direção defensiva em lugar de pagar uma 
multa. Se 12 desses cursos foram freqüentados por 
 
 58 
 40 32 37 30 24 40 38 35 40 28 32 37 
 
Cidadãos. Qual a mediana? 
 
Solução: Ordenando os elementos temos: 
 
 24 28 30 32 32 35 37 37 38 40 40 40 
 
Como temos 12 elementos, número par, a mediana será a média aritmética dos 
elementos centrais. A mediana será a média aritmética dos elementos 35 e 37. Logo 
a mediana será 
36
2
3735


Md
. 
 
Cálculo da Mediana de dados em tabela de distribuição de freqüência 
 
 Se tivermos uma tabela de distribuição de freqüência simples, então podemos 
proceder como no caso anterior. 
 
Exemplo: A tabela abaixo representa as notas em estatística dos alunos do 7.º 
período de Matemática da FAFIDIA. 
 
 
 
Notas 
Freqüência 
fj 
 
11 2 
12 4 
13 2 
14 2 
15 10 
16 6 
17 2 
18 1 
 29 
 59 
 
Qual a nota mediana? 
 
Solução: Como temos 29 elementos, o valor mediano deverá estar na posição 
15
2
129


. Logo o elemento mediano é o 015 elemento. 
Assim somando as freqüências temos 
1552242 
. A mediana será 15. 
Portanto a nota mediana é 15. 
 
Para uma distribuição de freqüência agrupada em classes, a mediana é tal 
que metade da área total dos retângulos do histograma da distribuição está à sua 
esquerda, e a outra metade está à sua direita. 
De modo geral podemos calcular a mediana por: 
 
c
f
j
Lx~Md 
 
 
onde 
 
L: é a fronteira inferior da classe em que a mediana deve estar. 
f: é a sua freqüência 
c: o intervalo de classe 
j: é o número de elementos que ainda faltam quando atingimos L. 
 
Exemplo: A tabela abaixo representa as notas obtidas por 500 alunos em um teste 
de geografia. Calcule a nota mediana. 
 
 60 
 
 
 
 
 
 
 
 
 
 
 Solução: Como temos 500 elementos, o valor mediano deverá estar no 
0250
2
500

elemento. 
Assim 44 + 70 + 92 = 206 e 44 + 70 + 92 + 147 = 353 > 250. A mediana estará na 
4.ª classe. Usando a fórmula temos: 
 
L = 55, f = 147, c = 15 e j = 250-206 = 44. Logo 
 
5,59
15
147
44
55


Md
Md 
Portanto a mediana é 59,5. 
 
3) Moda: Mo 
Dados não agrupados 
 
É o valor que ocorre com maior freqüência e mais de uma vez. 
 
Exemplo: Vinte reuniões de um clube de dança tiveram as seguintes freqüências de 
seus membros 
 
 26 25 28 23 25 24 24 21 23 26 
 28 26 24 32 25 27 24 23 24 22 
 
Notas fj 
10 25 44 
25 40 70 
40 55 92 
55 70 147 
70 85 115 
 85 100 32 
Total 500 
 61 
Qual a moda? 
Solução: A moda vale 24, pois ocorre 5 vezes. 
 
 
Observação: A moda é raramente utilizada em inferência estatística pelo fato de 
nem sempre existir (o que ocorre quando não há dois valores iguais) ou de, 
eventualmente, não ser única. 
 
Exemplo: Os dados a seguir referem-se a quantidade de pessoas que assistiram a 6 
sessões de um filme no cinema: 
 
121 133 121 133 114 141 
 
Qual o número modal de pessoas que assistiram ao filme? 
 
Solução: Temos que os números 121 e 133 repetem, ambos, duas vezes. Portanto a 
moda não é única. Logo as modas são 121 e 133. 
 
Cálculo da Moda de dados em tabela de distribuição de freqüência 
 
Se tivermos uma tabela de distribuição de freqüência simples, então podemos 
proceder como no caso anterior. 
 
Exemplo: A tabela abaixo representa as notas em estatística dos alunos do 7.º 
período de Matemática da FAFIDIA. 
 
 
 
Notas 
Freqüência 
fj 
 
11 2 
12 4 
13 2 
 62 
14 2 
15 10 
16 6 
17 2 
18 1 
 29 
 
Qual a nota modal? 
Solução: A nota que ocorre com maior freqüência é a nota 15, pois ocorre 10 vezes. 
Logo a nota modal é Mo = 15. 
 
Quando temos uma tabela de distribuição de freqüência agrupada em classes, o 
cálculo da moda é feito utilizando a fórmula de Czuber. 
 
1.º passo: Identificamos a classe modal ( aquela que possui maior frequência) 
2.º passo: Aplica-se a fórmula 
 
hLMo 



21
1
 
 
onde 
L: É o limite inferior da classe modal. 
1
: Diferença entre a freqüência da classe modal e a classe imediatamente anterior. 
2
: Diferença entre a freqüência da classe modal e a classe imediatamenteposterior. 
h: Amplitude da classe modal 
 
Exemplo: A tabela abaixo representa as notas obtidas por 500 alunos em um teste 
de geografia. Calcule a nota modal. 
 
 63 
 
 
 
 
 
 
 
 
 
 
 Solução: 
1.º passo: A classe modal é a 4.ª, pois ela possui a maior freqüência. 
2.º passo: Temos 
L = 55, 
55921471 
, 
321151472 
 e h = 15 
5,64
15
3255
55
55




Mo
Mo 
 
Logo a nota modal é Mo = 64,5. 
Notas fj 
10 25 44 
25 40 70 
40 55 92 
55 70 147 
70 85 115 
 85 100 32 
Total 500 
 64 
Medidas de Variabilidade 
 
 
São medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou 
dispersão, dos valores em torno da média. 
 Considere os dois conjuntos da dados a seguir: 
 
Conjunto 1 20 20 20 20 20 20 20 
Conjunto 2 30 15 15 20 20 20 20 
 
 Ambos os conjuntos têm média 20, no entanto a variabilidade dos elementos 
do conjunto 2 é maior. 
 
 
Desvio padrão 
 
Símbolo: S 
 
Dados não agrupados 
 
 
Amostral 
 
Populacional 
 




























 

n
x
x
n
S
n
i
in
i
i
2
1
1
2
1
1
 
 





























n
x
x
n
n
i
in
i
i
2
1
1
21
 
 
 
Cálculo do desvio padrão de dados em tabela de distribuição de freqüência 
 
 65 
Sejam : 
 xi o ponto médio da classe i , 
 fi a freqüência da classe i, 
 k a quantidade de classe. 
 66 
 
 
Amostral 
 
Populacional 
 































n
fx
fx
n
S
i
k
i
ik
i
ii
2
1
1
2
.
.
1
1
 
 
 





























n
fx
fx
n
i
k
i
ik
i
ii
2
1
1
2
.
.
1

 
 
 
A variância de um conjunto de dados é denotada por s2 
 O desvio padrão aumenta quando a dispersão dos dados aumenta. 
 
Exemplo: A tabela abaixo representa as notas obtidas por 500 alunos em um teste 
de geografia. Calcule o desvio-padrão. 
 
 
 
 
 
 
 
 
 
 
 
Temos que 
Notas fj xi xi.f xi
2. f 
10 25 44 17,5 770 13.475 
25 40 70 32,5 2.275 73.937,5 
40 55 92 47,5 4.370 207.575 
55 70 147 62,5 9.187,5 574.218,8 
70 85 115 77,5 8.912,5 690.718,8 
 85 100 32 92,5 2.960 273.800 
Total 500 28.475 1.833.725 
 67 
 
 
 
 
2,19
183868,368
75,723.183
499
1
25,651.621.1725.833.1
499
1
500
475.28
725.833.1
1500
1
2















s
s
s
s
s
 
 
Logo o desvio-padrão é de 19,2. 
 68 
Exercícios 
 
1) A tabela abaixo se refere ao peso, em kg, de 50 alunos de uma determinada 
escola. 
Peso = xi fi 
45 8 
55 22 
65 8 
75 6 
85 5 
95 1 
Total 50 
 
a) Calcule a média dos dados agrupados 
 
b) Calcule a variância. 
 
2) A média aritmética é a razão entre: 
 
a) ( ) O número de valores e o somatório; 
b) ( ) O somatório dos valores e o número; 
c) ( ) Os valores extremos; 
d) ( ) Os dois valores centrais. 
 
3) Numa distribuição de valores todos iguais, o desvio-padrão é: 
 
a) ( ) negativo; 
b) ( ) positivo; 
c) ( ) a unidade; 
d) ( ) zero. 
 
4) A média de um conjunto de valores iguais a uma constante é: 
 
 69 
a) ( ) zero; 
b) ( ) o valor da constante; 
c) ( ) a unidade; 
d) ( ) a quantidade de valores que temos 
 
5) O desvio-padrão de um conjunto de dados é 4. A variância será: 
 
a) ( ) 3; 
b) ( ) 4; 
c) ( ) 16; 
d) ( ) 81. 
 
6) Uma empresa possui dois serventes recebendo salários de R$ 250,00 cada um, 
quatro escriturários recebendo R$ 600,00 cada um, um chefe de escritório com 
salário de R$ 1.000,00 e três técnicos. A média de salários da empresa é de R$ 
1.050,00. Quanto cada técnico recebe? 
 
7) A média do conjunto de valores 
 
46,1 57,5 21,6 16,8 4,2 
é igual a? 
 
8) O desvio-padrão do conjunto de valores 
 
46 57 21 16 4 
É igual a? 
 
9) Os 20 dados abaixo se referem aos índices pluviométricos em determinado 
Estado: 
 
144 152 159 160 160 151 157 146 154 145 
141 150 142 146 142 141 141 150 143 158 
 
 70 
Determine: 
a) O índice médio. 
b) O índice mediano. 
 
10) Os dados abaixo se referem a pesos (em gramas) de 50 ratos usados em um 
estudo de deficiência de vitaminas. 
 
136 125 135 137 126 129 124 118 120 126 
119 92 115 115 127 95 100 113 95 113 
146 103 101 118 121 129 110 126 106 148 
137 87 126 119 125 132 108 118 119 117 
120 110 82 105 102 104 133 104 132 146 
 
a) Construa uma tabela de distribuição de freqüência agrupada em classes. 
b) Qual o peso modal? 
c) Qual o desvio-padrão? 
d) Um rato é considerado magro se seu peso é menor que
sx 2
 e gordo se seu 
peso é maior que 
sx 2
. Quais os pesos máximo e mínimo para que um rato seja 
considerado magro ou gordo? 
e) Baseado na letra e, um rato cujo peso é de 135 gramas é considerado magro ou 
gordo? Justifique sua resposta. 
 
11) Dê um exemplo numérico, com no máximo 4 amostras, em que a média e a 
mediana sejam iguais e o desvio-padrão seja nulo. 
 
12) Dê um exemplo numérico, com no máximo 4 amostras, em que a média é menor 
que a mediana. 
 
13) Um artigo de jornal fez menção a determinada pesquisa citando que o conjunto 
amostral acusa x = 5, x2 = 7 e s = 0,5. Por erro esqueceram de citar o tamanho da 
amostra utilizado. Considerando as informações anteriores o que podemos dizer 
sobre os possíveis tamanho da amostra? 
 71 
14) Uma lista de números acusa x =202, x2 = 3.452 e n = 15. Qual o desvio-
padrão? 
 
15) Em quatro paradas no box, o mecânico dos pneus dianteiros trocou o pneu 
dianteiro direito dos carros de corrida em 
 
10,8 12,0 10,5 10,7 
 segundos. Calcule: 
 
a) o tempo médio de troca de pneus 
b) o desvio-padrão. 
 
 
16) A tabela a seguir apresenta o tempo que 80 estudantes dedicam a atividade de 
lazer durante uma semana escolar típica 
 
 
 
 
 
 
 
 
 
 
Calcule: 
a) o tempo médio 
b) o tempo mediano 
c) Qual a porcentagem dos alunos que dedicam mais de 25 horas de lazer ? 
 
17) Uma lista de números acusa x =40 e x2 = 156. Quantos valores figuram na 
lista, se seu desvio-padrão é 2,0? 
 
Horas fj 
 10 15 9 
 15 20 28 
 20 25 27 
 25 30 12 
 30 35 4 
Total 80 
 72 
18) Um inspetor de controle de qualidade examinou 15 engradados de telhas de 
cerâmica, contendo cada um 144 telhas. Os números de telhas trincadas nessas 
caixas foram 
 
2 5 3 4 2 0 1 5 7 3 0 2 2 4 3 
 
Calcule: 
a) o número médio de telhas trincadas e 
b) o desvio-padrão. 
 
 73 
19) A tabela de distribuição a seguir apresenta o número de peças defeituosas em 
uma produção de determinado produto 
 
N.º de defeitos N.º de peças 
0 5 
1 10 
2 18 
3 124 5 
Total 40 
 
Calcule: 
a) a média 
b) a mediana 
c) a moda 
d) Qual das três medidas melhor representa os dados? 
 
20) A tabela a seguir apresenta os salários pagos a 100 operários de uma empresa 
 
 
 
 
 
 
 
 
 
 
Calcule: 
a) o salário médio 
b) o salário mediano 
c) Qual a porcentagem dos empregados que ganham acima de 4 
salários? 
N.º de salários 
mínimos 
fj 
 0 2 40 
 2 4 30 
 4 6 10 
 6 8 15 
 8 10 5 
Total 100 
 74 
d) O dono da empresa afirmou, em entrevista, que seus funcionários 
ganham, em média, R$ 1440,00. Considerando o salário mínimo no 
valor de R$ 330,00, a afirmação do dono da empresa é verdadeira? 
 
 75 
Representação Gráfica 
 
 
1) Classificação dos gráficos segundo o objetivo 
 
É possível distinguir, de certo modo arbitrariamente, dois objetivos que 
justifiquem o emprego de gráficos. Os gráficos são usados para apresentar 
visualmente dados numéricos, proporcionando maior facilidade e rapidez de 
compreensão dos mesmos, ou, então, para apresentar conclusões ou resultados 
de uma análise. Há, portanto, dois tipos de gráficos, conforme o objetivo ou uso a 
que se destinam: gráficos de informação e gráficos de análise. 
 
a) Gráficos de Informação 
 
São gráficos destinados principalmente ao público em geral, objetivando 
proporcionar uma visualização rápida e clara da intensidade das modalidades e 
dos valores relativos ao fenômeno observado. 
São gráficos tipicamente expositivos, devendo, por conseguinte, ser o mais 
completo possível, dispensando comentários explicativos adicionais. 
 
b) Gráficos de Análise 
 
Os gráficos de análise prestam-se melhor ao trabalho estatístico, 
fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser 
também informativos. 
Quando se usam gráficos para apresentar os resultados de uma análise, 
esses freqüentemente vêm acompanhados de uma tabela. Inclui-se, muitas vezes, 
um texto dissertativo, chamando a atenção do leitor para os pontos principais 
revelados pelo gráfico ou pela tabela. 
 
 
2) Uso indevido dos gráficos 
 
 76 
Muitas vezes, o uso indevido dos gráficos pode trazer uma idéia falsa dos 
dados que estão sendo analisados, chegando mesmo a confundir o leitor. 
 
 
3) Gráficos em linhas ou gráficos lineares 
 
Os gráficos em linha são freqüentemente usados para a representação de 
séries de tempo (quando um dos fatores for o tempo). 
Para construir o gráfico em linha, basta marcar os pontos 
correspondentes aos valores observados em cada período e uni-los por meio de 
um traço contínuo. 
 
 77 
Exemplo: O dado apresentado na tabela representa as matriculas em uma 
escola municipal. 
 
Tabela: Matrículas em Escola Municipal 
 
Ano 2003 2002 2001 2000 1999 1998 1997 1996 1995 
Matrículas 1580 1650 1450 1800 1650 1490 1590 1630 1530 
 
 
Matriculas na Rede Municipal de BH
1450
1480
1510
1540
1570
1600
1630
1660
1690
1720
1750
1780
1810
20
03
20
02
20
01
20
00
19
99
19
98
19
97
19
96
19
95
Ano
M
a
tr
ic
u
la
s
 
 
4) Gráficos em barras 
 
Exemplo: A tabela a seguir apresenta a pulsação, por minutos, de alunos do 
primeiro ano da Faculdade de Ciências Médicas de MG, 1990. 
 
Tabela: Pulsação, por minutos, de alunos do primeiro ano da Faculdade de Ciências 
Médicas de MG, 1990 
 
Pulsação Freqüência 
 78 
(p/m) 
60 3 
68 6 
82 12 
84 4 
98 3 
100 2 
 
 
 
 
 
 
Pulsação, por minuto, de alunos do 
primeiro ano da Faculdade de 
Ciências Médicas de MG, 1990
0
2
4
6
8
10
12
14
60 68 82 84 98 100
Pulsação
F
re
q
u
ên
ci
a
 
 
 
 79 
0
2
4
6
8
10
12
Frequên
cia
60 68 82 84 98 100
Pulsação
Pulsação, por minuto, de alunos do 
primeiro ano da Faculdade de 
Ciências Médicas de MG, 1990
 
 
 
5) Gráficos de Pizza ou setores 
 
Exemplo: A tabela a seguir apresenta a pulsação, por minutos, de alunos do 
primeiro ano da Faculdade de Ciências Médicas de MG, 1990. 
 
 80 
Tabela: Pulsação, por minutos, de alunos do primeiro ano da Faculdade de Ciências 
Médicas de MG, 1990 
 
Pulsação 
(p/m) Freqüência 
60 3 
68 6 
82 12 
84 4 
98 3 
100 2 
 
Pulsação, por minuto, de alunos do 
primeiro ano da Faculdade de Ciências 
Médicas de MG, 1990
60
68
82
84
98
100
 
 
 
6) Histograma 
 
O histograma é um gráfico formado por um conjunto de retângulos 
justapostos, de forma que a área de cada retângulo seja proporcional à 
freqüência da classe que ele representa. Assim, a soma dos valores 
correspondentes às áreas dos retângulos será sempre igual à freqüência total. 
O histograma é constituído tomando-se como referência dois eixos 
coordenados. No eixo horizontal são anotados os valores individuais da variável em 
estudo, ou os limites das classes. Por conseguinte, a dimensão horizontal de cada 
retângulo representará a classe. No eixo vertical será construída a escala onde 
 81 
serão lidos os valores relativos ao número de observações ou freqüências da classe. 
A área de cada retângulo do histograma corresponde à freqüência da classe que o 
retângulo representa. Para determinar a altura do retângulo, basta tomar a fórmula 
de cálculo da área de um retângulo: 
 
S = b x h 
 
Onde: 
 
 b = base do retângulo = amplitude do intervalo de classe 
 h = altura do retângulo 
 S = área do retângulo = freqüência da classe. 
 
 Para traçar o gráfico deve-se calcular as alturas dos retângulos. Usando a 
fórmula acima temos: 
 
b
S
h 
 
 
Exemplo: A tabela a seguir apresenta a pulsação, por minutos, de alunos do 
primeiro ano da Faculdade de Ciências Médicas de MG, 1990. 
 
Tabela: Casos de Hanseníase em Minas Gerais 
 
Anos Número 
1980 32903 
1984 37582 
1988 37102 
1992 29070 
1996 11459 
1999 5118 
 
 
 
 82 
Casos de Hanseníase em MG
0
5000
10000
15000
20000
25000
30000
35000
40000
1980 1984 1988 1992 1996 1999
Ano
N
úm
er
o
 
 
7) Poligonal Característica 
 
A poligonal característica é a representação do contorno do histograma. 
 
 
8) Polígono de Freqüências 
 
Unindo por linhas retas os pontos médios das bases superiores dos 
retângulos do histograma, obtém-se outra representação dos dados, denominado 
Polígono de Freqüências. 
 83 
9) Ogiva ou Polígono de Freqüências Acumuladas 
 
Tem por finalidade a representação gráfica das tabelas de freqüências 
acumuladas. 
Quando o polígono de freqüências acumuladas se refere às freqüências 
relativas, usa-se a denominação ogiva percentual ou polígono de freqüências 
relativas acumuladas. 
 
 
10) Box-plot 
 
Box-plot: Gráfico em que temos o ponto de mínimo, 1º quartil, mediana, 3º 
quartil e o ponto de máximo. 
 
Exemplos: 
 
a) Considere o conjunto de dados 
 
0 1 2 2 3 1 2 3 1 2 3 3 2 1 2 3 3 
 
 
No exemplo acima temos: 
 
Mínimo = 0 
1º quartil = 1 
2º quartil = Mediana = 2 
3º quartil = 3 
Máximo = 3. 
 
 84 
 
 85 
b) Considere o conjunto de dados 
 
0 1 2 3 4 1 2 2 2 1 0 3 4 2 1 0 2 0 2 3 1 2 0 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 3 3 3 3 3 3 3 3 3 3 3 
 
Nele temos: 
 
Mínimo = 0 
1º quartil= 1 
2º quartil = Mediana = 1 
3º quartil = 3 
Máximo = 4. 
 
 
 
 
 
11) Ramo-e-folhas 
 
É uma forma de visualização dos dados originais o qual nos permite 
ver a distribuição dos dados sem a perda de informações. 
 86 
Permite visualizar a ordenação dos dados. 
Para a construção de um gráfico ramo-e-folhas tomamos como ramo 
os algarismos mais a esquerda e as folhas os algarismos mais a direita. Por 
exemplo, no número 352, o ramo é 35 e a folha é o 2. 
 
 87 
Exemplo: 
 
a) Considere o conjunto de dados a seguir 
 
0 1 2 3 4 1 2 2 2 1 0 3 4 2 1 0 2 0 2 3 1 2 0 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 3 3 3 3 3 3 3 3 3 3 3 
 
 
O gráfico ramo-e-folhas será 
 
 
Ramo Folhas 
0 00000 
1 00000000000000000000000000 
2 0000000000 
3 00000000000000 
4 00 
 
 
b) Considere o conjunto de dados a seguir 
 
10 11 12 12 14 13 12 10 14 15 16 12 12 13 12 11 14 15 10 14 12 
 
O gráfico ramo-e-folhas será 
 
 
Ramo Folhas 
10 000 
11 00 
12 0000000 
13 00 
14 0000 
15 00 
 88 
16 0 
 
 89 
c) Considere o conjunto de dados a seguir 
 
100 110 121 124 145 135 122 100 146 151 162 121 123 134 122 118 145 151 100 
144 125 
 
O gráfico ramo-e-folhas será 
 
 
Ramo Folhas 
10 000 
11 08 
12 1122345 
13 45 
14 4556 
15 11 
16 2 
 
 
 
 90 
Tabelas - Normalização de Publicações Técnico – cientificas - Ed. UFMG 
 
 
6) As tabelas devem ser dotadas de um título claro e conciso localizado acima 
delas. São numeradas seqüencialmente em todo o trabalho, com algarismos 
arábicos (1, 2, 3, ...), segundo normas do IBGE. 
7) No cabeçalho de cada coluna indica-se o seu conteúdo. Os títulos das 
colunaspodem ser datilografados verticalmente, se necessário, para 
economizar espaço. 
8) Não se deve deixar nenhuma “casa” vazia no corpo da tabela, usando-se os 
símbolos, conforme convenção internacional: 
 
- quando, pela natureza do fenômeno, o dado não existir 
Z quando o dado for rigorosamente zero 
... quando não se dispuser do cálculo 
 
9) Na construção de tabelas usam-se os seguintes traços: 
 
a) traço duplo horizontal, limitando o quadro; 
b) traço simples vertical, separando a coluna indicadora das 
demais e estas entre si; no corpo da tabela pode ser eliminado 
desde que o número de colunas seja pequeno e não haja 
prejuízo na leitura dos dados; 
10) a tabela não deve ser fechada lateralmente, tampouco se colocam traços 
horizontais separando os dados numéricos. 
 
 91 
Exercícios 
 
1) Observe o histograma abaixo. 
 
Número de defeitos em instrumentos 
óticos
40
120
340
290
160
30
0
50
100
150
200
250
300
350
400
0 1 2 3 4 5
Número de defeitos
Fr
eq
uê
nc
ia
 
 
 
Complete a tabela de distribuição abaixo. 
 
Número de defeitos fi 
0 
1 120 
2 
3 
4 
5 
Total 
 
 
 
 
 92 
 
 
 
 
 
 
 
 
 
 
 
 
 93 
Probabilidade 
 
Técnicas de contagem 
 
Fatorial 
 
 O fatorial de um número inteiro positivo 
n
 é representado por 
!n
 (Lê-se: n 
fatorial). 
O fatorial do número 
n
 é obtido pela multiplicação de 
n
 por todos os inteiros 
inferiores até o número 1. 
    12n1nn!n  
 
 
Exemplos: 
1) 
241.2.3.4!4 
 
2) 
7201.2.3.4.5.6!6 
 
 
Por definição: 
1!0 
 
1!1 
 
Observação: 
!5.6!4.5.6!6 
 
Exemplo: 
 
Qual o valor de 
!3!10
!12

? 
Solução: 
22
6
11.12
1.2.3.!10
!10.11.12
!3!10
!12


 
 
Exercício: 
Muitas calculadoras ou computadores não podem calcular diretamente valores de 
!70
 ou superiores. Para 
n
 muito grande, 
!n
 pode ser aproximado por 
k10!n 
, 
 94 
onde o valor de 
k
 é dado por 
  n43429448,039908993,0nlog5,0nk 
. 
Calcule 
!50
 utilizando a tecla fatorial da calculadora e utilizando a aproximação. 
 
Princípio Fundamental da Contagem 
Se um primeiro acontecimento pode ocorrer de 
1
m
 maneiras distintas, um segundo 
pode ocorrer de 
2
m
 maneira distintas e, sucessivamente, um 
ésimon 
 
acontecimento pode ocorrer de 
n
m
 maneiras distintas, sendo todos eventos 
independentes, então o número de maneiras distintas em que os 
n
 acontecimentos 
ocorrem conjuntamente é 
n21
m..m.m 
. 
 
Exemplos: 
1) Quantas placas para identificação de veículos podem ser confeccionadascom 3 
letras e 3 algarismos? ( Considere 26 letras, supondo que não há nenhuma 
restrição) 
 
2) Existem 5 ruas ligando os supermercados X e Y e 3 ruas ligando os 
supermercados Y e W. Quantos trajetos diferentes podem ser utilizados para irmos 
de X a W, passando por Y? 
 
Arranjo Simples 
 
Corresponde ao estudo da quantidade de maneiras em que se pode agrupar os 
objetos de uma amostra em que a ordem dos objetos seja relevante. 
 
O número de arranjos simples (sem repetição) de 
r
 elementos escolhidos dentre 
n
 elementos é 
 !rn
!n
A
r,n


 
 
 95 
Exemplos: 
 
1) No estoque de uma determinada empresa existem 8 caixas diferentes, das quais 
devem ser escolhidas e empilhadas 4. De quantas maneiras podemos empilhar 
estas 4 caixas? 
Solução: A ordem com que empilhamos as caixas é relevante, logo temos um 
problema de arranjo. Assim 
 
680.1
!48
!8
A
4,8



 
2) Um almoxarifado necessita organizar uma estante, destinada a armazenar 
suprimentos diversos. Sabendo que existem 3 itens diferentes da área industrial 
(departamento de produção), 6 itens diferentes da área de transporte e 3 itens 
diferentes do departamento de recursos humanos. Calcule: 
 
a) de quantas maneiras os itens poderiam ser organizados? 
b) se os itens da produção precisassem necessariamente ficar juntos, quantas 
maneiras de organizar todos os itens possíveis? 
Solução: 
a) Temos 12 itens diferentes. Ao organizá-los a ordem é relevante. Assim 
 
600.001.479
!1212
!12
A
12,12



 
 
b) Temos 3 itens diferentes da área industrial. Os outros 9 não precisam ficar juntos. 
Podemos então considerar os 3 itens da produção como um único bloco. Assim 
teremos 
   
!3.!10
!33
!3
!1010
!10
A.A
3,310,10





 
 
Combinação Simples 
 
Corresponde ao estudo da quantidade de maneiras em que se pode agrupar os 
objetos de uma amostra em que a ordem dos objetos seja irrelevante. 
 
 96 
O número de combinações simples (sem repetição) de 
r
 elementos escolhidos 
dentre 
n
 elementos é 
  !r.!rn
!n
C
r,n


 
 
Exemplos: 
1) Uma empresa de pesquisa mercadológica deseja selecionar uma comissão 
formada por 4 consumidores de uma amostra previamente selecionada de 8 
pessoas. Calcule: 
 
a) de quantas maneiras possíveis as 4 pessoas poderão ser selecionadas? 
b) se a comissão fosse composta por um presidente, um vice-presidente, um relator 
e um secretário, escolhidos nessa ordem, de quantas maneiras possíveis 
poderemos formar a comissão? 
 
Solução: 
a) 
 
70
!4.!48
!8
C
4,8



 
b) 
 
680.1
!48
!8
A
4,8



 
2) Em um departamento industrial existem 8 engenheiros eletricistas e 7 técnicos em 
eletrônica. Sabendo que uma comissão deverá ser formada, calcule de quantas 
maneiras a comissão poderá ser elaborada, supondo que: 
a) 5 pessoas devem ser escolhidas. 
b) 3 engenheiros e 2 técnicosdevem ser escolhidos. 
 
Solução: 
a) 
 
003.3
!5.!515
!15
C
5,15



 
b) 
   
176.1
!2.!27
!7
!3.!38
!8
CC
2,73,8





 
 97 
Probabilidade 
 
Definições: 
 
Experimento Aleatório: é qualquer processo que permite ao pesquisador fazer 
observações cujos resultados não podem ser previstos com certeza. 
 
Exemplos: 
1
E
: Retirar uma carta de um baralho com 52 cartas e observar seu naipe. 
2
E
 :Jogar uma moeda 10 vezes e observar o número de caras obtidas. 
3
E
 : Em uma linha de produção, fabricam-se peças em série e conta-se o 
número de peças defeituosas produzidas em um período de 24 horas. 
4
E
 : Uma lâmpada é fabricada. Em seguida é testada e verifica-se o tempo 
de vida. 
5
E
 : Retira-se uma bola de uma urna que contém bolas pretas, vermelhas e 
amarelas e observa sua cor. 
 
Espaço Amostral: Para cada experimento E, define-se espaço amostral S o 
conjunto de todos os possíveis resultados desse experimento. 
 
Exemplos: 
 
Considerando os experimentos aleatórios anteriores, o espaço amostral para cada 
um deles pode ser descrito como: 
 
1
S
: {ouro, copa, paus, espada} 
 
2
S
 : {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10} 
 
3
S
 : {0, 1, 2, 3, ..., N}, onde N é o máximo de peças produzidas em 24 horas. 
 
4
S
 : {t | t ≥ 0} 
 
5
S
 : {preta, vermelha, amarela} 
 O espaço amostral pode ser: 
1. Finito: formado por um número limitado de resultados possíveis. 
 98 
2. Infinito enumerável: formado por um número infinito de resultados, os quais 
podem ser listados ou enumerados. 
 
Exemplo: número de mensagens que são transmitidas corretamente por dia 
em uma rede de computadores. 
 
3. Infinito: formado por intervalo de números reais. 
 
Evento: É qualquer subconjunto do espaço amostral. 
A é um evento ↔ A 

S 
 
Em particular S é o evento certo e 

 é o evento impossível. 
Exemplo: 
Considere o experimento 
E = jogar uma moeda três vezes e observar os resultados. 
Então 
                k,k,k,c,k,k,k,c,k,k,k,c,c,k,c,c,c,k,k,c,c,c,c,cS 
 
Seja o evento: A = ocorrer pelo menos duas caras. 
Então 
        c,k,c,c,c,k,k,c,c,c,c,cA
 
 
Eventos Mutuamente Exclusivos: Dois eventos A e B são denominados 
mutuamente exclusivos, se eles não puderem ocorrer simultaneamente, isto é 
 BA
 . 
 
Exemplo: 
 Considere o experimento 
E = jogar um dado e observar o número da parte de cima. 
Então 
 654321 ,,,,,S 
 
 Sejam os eventos: A = ocorrer um número par, e B = ocorrer um número 
ímpar. 
 Então 
 6,4,2A 
, 
 5,3,1B 
 e 
 BA
. 
 
Definição clássica de probabilidade 
 99 
 
Dado um experimento aleatório E, S o espaço amostral e A um evento. A 
probabilidade do evento A, 
 AP
, é uma função definida em S que associa a cada 
evento um número real calculada pela relação: 
 
 
 
 Sn
An
AP 
 
Onde: 
 An
: é o número de vezes em que o evento A pode ocorrer 
 
 Sn
: é o número de vezes em que o espaço amostral S pode ocorrer 
 
Obs: Ao expressar a probabilidade devemos fazê-la utilizando as frações ordinárias 
ou com 4 casas decimais. 
 
Exemplos: 
1. Considere um baralho com 52 cartas. Qual a probabilidade de se retirar uma 
carta de ouro? 
Solução: Em um baralho temos 13 cartas de ouro. Logo considerando o evento A 
= retirar uma carta de ouro temos 
 
4
1
52
13
AP 
 
 
2. Num lote de 12 peças, 4 são defeituosas; duas peças são retiradas 
aleatoriamente. Qual a probabilidade de ambas serem defeituosas? 
Solução: Evento A = ambas peças são defeituosas. 
Número de maneiras do evento A ocorrer = 
 
6
!2.!24
!4
2
4







 . 
Número de maneiras do espaço S ocorrer = 
 
66
!2.!212
!12
2
12







 . 
Logo 
 
11
1
66
6
AP 
. 
3. A MasterCard International efetuou um estudo de fraude em cartões de 
crédito. Os resultados estão apresentados na tabela a seguir. 
 
 100 
Tabela: Tipos de fraude em cartões de crédito 
Tipo de fraude Número de ocorrência 
Cartão roubado 243 
Cartão falsificado 85 
Pedido por correio/ telefone 52 
Outros 46 
 
Selecionando aleatoriamente um caso de fraude, qual a probabilidade de: 
a) a fraude resultar de um cartão roubado? 
b) A fraude não ser de cartão falsificado? 
Solução: 
a) Considere o evento A = cartão roubado. Logo 
  5704,0
426
243
AP 
. 
b) Considere o evento B = cartão não falsificado. Então 
  8005,0
426
341
BP 
 
 
Propriedades da probabilidade 
 
Para cada evento A é associado um número real 
 AP
 com as seguintes 
propriedades: 
1) 
  10  AP
 
2) 
  1SP
 
3) Se A e B forem eventos mutuamente exclusivos então 
     BPAPBAP 
 
 
Eventos complementares: Dois eventos A e B são complementares quando A U B 
= S. Neste caso vale a propriedade 
    1BPAP 
. 
Neste caso simbolizamos 
c
AB 
 
 
Exemplo: O evento A = chuva e o evento B = não chuva são complementares. 
 101 
 
Evento Composto: É qualquer evento que combina dois ou mais eventos simples. 
 
Exemplo: No lançamento de um dado considere o evento A = {2,5}. 
 
Regra da Adição: Se A e B são dois eventos quaisquer, então: 
       BAPBPAPBAP 
 
 
Observações: 
 
 BAP 
 denota a probabilidade do evento A, ou do evento B, ou de 
ambos. 
 
 BAP 
 denota a probabilidade do evento A e do evento B 
simultaneamente em um mesmo experimento. 
 
 102 
Exemplos: 
1) As preferências de homens e mulheres por cada gênero de filme alugado em uma 
locadora de vídeos, estão apresentados na tabela a seguir: 
Tabela: Preferência de homens e mulheres por filmes 
Sexo / Filme Comédia Romance Policial 
Homens 136 92 248 
Mulheres 102 195 62 
 
Sorteando-se ao acaso uma dessas locações de vídeo, pergunta-se a probabilidade 
de: 
a) Uma mulher ter alugado um filme ou o filme é do gênero policial; 
b) Um homem ter alugado um filme ou o filme é do gênero romance. 
Solução: 
a) Considere os eventos 
A = mulher aluga o filme e 
B = Filme é do gênero policial 
       BAPBPAPBAP 
 
  7269,0
835
607
835
62
835
310
835
359
BAP 
 
b) Considere os eventos 
A = homem aluga o filme e 
B = Filme é do gênero romance 
       BAPBPAPBAP 
 
  8036,0
835
671
835
92
835
287
835
476
BAP 
 
 
 103 
2) Uma loja de material de construção possui 2 caixas de conexões. Na primeira, 
das 30 conexões 11 são defeituosas. Na segunda, das 12 conexões 4 são 
defeituosas. Uma conexão é retirada aleatoriamente. Qual a probabilidade de a 
conexão ser defeituosa ou ter sido retirada da segunda caixa? 
Solução: 
a) Considere os eventos 
A = conexão defeituosa. 
B = conexão retirada da segunda caixa. 
 
       BAPBPAPBAP 
 
  5476,0
42
23
42
4
42
12
42
15
BAP 
 
Obs: Este exemplo pode ser melhor visualizado utilizando a árvore de probabilidade. 
Ou seja: 
 
Regra da Multiplicação: Se A e B são dois eventos quaisquer, então: 
 
 
     BP.APBAP 
 se A e B são independentes ou 
 
     A|BP.APBAP 
 se A e B são dependentes 
 
Notação: 
 A|BP
 representa a probabilidade de ocorrência do evento B dado que o 
evento A ocorreu. É chamado de probabilidade condicional.104 
Dois eventos A e B são independentes se a ocorrência de um deles não 
afeta a probabilidade de ocorrência do outro. Caso contrário eles são 
dependentes. 
 
Exemplos: 
1) Uma determinada companhia produz um lote de 50 filtros de combustíveis, dos 
quais 6 são defeituosos. Escolhem-se aleatoriamente e testam-se dois filtros do lote. 
Determine a probabilidade de ambos serem bons, se os filtros são selecionados: 
a) com reposição; 
b) sem reposição. 
 
Solução: Considere os eventos 
A = filtro bom. 
B = filtro bom. 
a) Como processo de escolha é com reposição, então a escolha do primeiro filtro 
não afeta a escolha do segundo filtro. Logo são independentes. Assim 
     BP.APBAP 
 
  7744,0
2500
1936
50
44
50
44
BAP 
 
b) Como processo de escolha é sem reposição, então a escolha do primeiro filtro 
afeta a escolha do segundo filtro. Logo são dependentes. Assim 
     A|BP.APBAP 
 
  7722,0
2450
1892
49
43
50
44
BAP 
 
 
 105 
2) Uma loja de material de construção possui 2 caixas de conexões. Na primeira, 
das 30 conexões 11 são defeituosas. Na segunda, das 12 conexões 4 são 
defeituosas. Uma conexão é retirada aleatoriamente de cada caixa. Calcule a 
probabilidade de: 
 
a) Apenas uma ser defeituosa. 
b) Ambas serem defeituosas. 
c) Ambas não serem defeituosas. 
Solução: 
a) Podemos ter os seguintes casos: DB ou BD. Assim 
Caso 1: 
A = defeituosa na primeira 
B = boa na segunda. 
     BP.APBAP 
 
  2444,0
360
88
12
8
30
11
BAP 
 
Caso 2: 
A = defeituosa na segunda 
B = boa na primeira. 
     BP.APBAP 
 
  2111,0
360
76
30
19
12
4
BAP 
 
Portanto a probabilidade de apenas uma ser defeituosa é de 
  4555,02111,02444,0defeituosaumaapenasP 
 
b) 12,22%. 
c) 42,22%. 
 106 
 
Teorema da probabilidade total 
 
 Considere o espaço amostral particionado em 
k
 eventos, 
k21
A,,A,A 
, satisfazendo às seguintes condições: 
a) 

ji
AA
 para todo 
ji 
. 
b) 
SAAA
k21
 
. 
c) 
  0AP
i

 para 
k,,2,1i 
. 
Seja um evento F qualquer, referente ao espaço amostral 
S
. Então: 
     


k
1i
ii
A|FPAPFP
 
 
Demonstração: Considere F um evento qualquer em S. Então 
     
k21
AFAFAFF  
 
Usando a regra do produto teremos 
       
k21
AFPAFPAFPFP  
 
Usando a regra do produto teremos o teorema da probabilidade total 
             
kk2211
A|FPAPA|FPAPA|FPAPFP  
 
     


k
1i
ii
A|FPAPFP
 
Cqd. 
 
Exemplo: 
Uma determinada peça é manufaturada por três fábricas, denominadas X, Y e Z. 
Sabe-se que X produz o dobro de peças que Y, e Y e Z produzem o mesmo 
número de peças. Sabe-se também que 2% das peças produzidas por X e Y são 
defeituosas, enquanto que 4% das produzidas por Z são defeituosas. Todas as 
peças são colocadas em um depósito, e depois uma peça é extraída 
aleatoriamente. Qual a probabilidade de que a peça escolhida seja defeituosa? 
 107 
Solução:Considere os seguintes eventos 
F = a peça é defeituosa 
1
A
 = a peça provém da fábrica X. 
2
A
 = a peça provém da fábrica Y. 
3
A
 = a peça provém da fábrica Z. 
Empregando o teorema da probabilidade total temos 
             
332211
A|FPAPA|FPAPA|FPAPFP 
 
Sabe-se que: 
 
2
1
AP
1

 
 
4
1
AP
2

 
 
4
1
AP
3

 
    02,0A|FPA|FP
21

 
  04,0A|FP
3

 
Logo 
  0250,004,0
4
1
02,0
4
1
02,0
2
1
FP 
 
Assim, a probabilidade da peça ser defeituosa é de 0,0250 ou 2,50%. 
 
 108 
 
Teorema de Bayes (Thomas Bayes 1702 - 1761) 
 
 Considere o espaço amostral particionado em 
k
 eventos, 
k21
A,,A,A 
, satisfazendo às seguintes condições: 
a) 

ji
AA
 para todo 
ji 
. 
b) 
SAAA
k21
 
. 
c) 
  0AP
i

 para 
k,,2,1i 
. 
Seja um evento F qualquer, referente ao espaço amostral 
S
. Então: 
 
   
 FP
A|FPAP
F|AP ii
i

 
 
Exemplo: 
1) (voltando ao exemplo anterior) Uma determinada peça é manufaturada por três 
fábricas, denominadas X, Y e Z. Sabe-se que X produz o dobro de peças que Y, e Y 
e Z produzem o mesmo número de peças. Sabe-se também que 2% das peças 
produzidas por X e Y são defeituosas, enquanto que 4% das produzidas por Z são 
defeituosas. Todas as peças são colocadas em um depósito, e depois uma peça é 
extraída aleatoriamente. Qual a probabilidade de que a peça escolhida seja 
produzida pela fábrica Y dado que ela era defeituosa? 
Solução:Considere os seguintes eventos 
F = a peça é defeituosa 
1
A
 = a peça provém da fábrica X. 
2
A
 = a peça provém da fábrica Y. 
3
A
 = a peça provém da fábrica Z. 
Sabe-se que: 
  0250,0FP 
 (pelo exemplo anterior) 
 
4
1
AP
2

 
    02,0A|FPA|FP
21

 
Logo 
 109 
 
   
 FP
A|FPAP
F|AP 22
2

 
 
0250,0
02,0
4
1
F|AP
2

 
 
0250,0
005,0
F|AP
2

 
  2000,0F|AP
2

 
 
2) Uma rede local de computadores é composta por um servidor e cinco clientes (A, 
B, C, D e E). Registros anteriores indicam que dos pedidos de determinado tipo de 
processamento, realizados através de uma consulta, cerca de 10% vêm do cliente A, 
15% do B, 15% do C, 40% do D e 20% do E. Se o pedido não for feito de forma 
adequada, o processamento apresentará erro. Usualmente, ocorrem os seguintes 
percentuais de pedidos inadequados: 1% do cliente A, 2% do cliente B, 0,5% do 
cliente C, 2% do cliente D e 8% do cliente E. 
a) Qual é a probabilidade de o sistema apresentar erro? 
b) Qual é a probabilidade de que o processo tenha sido pedido pelo cliente E, 
sabendo-se que apresentou erro? 
 
 
 
Exercício: 
 
1) As preferências de homens e mulheres por cada gênero de filme alugado em 
uma locadora de vídeos, estão apresentados na tabela a seguir: 
 
Sexo / Filme Comédia Romance Policial 
Homens 136 92 248 
Mulheres 102 195 62 
 
Sorteando-se ao acaso uma dessas locações de vídeo, pergunta-se a probabilidade 
de: 
 110 
c) Uma mulher ter alugado um filme e o filme ser de comédia; 
d) Um homem ter alugado um filme e o filme ser de romance. 
 
2) Uma determinada companhia produz um lote de 50 filtros de combustíveis, dos 
quais 6 são defeituosos. Escolhem-se aleatoriamente e testam-se dois filtros do lote. 
Determine a probabilidade de ambos serem bons, se os filtros são selecionados: 
c) com reposição; 
d) sem reposição. 
 
3) Joga-se dois dados equilibrados e soma-se os dois resultados. Qual a 
probabilidade de se obter o total 5 ? 
 
4) Se 226 dentre 300 assinantes de um jornal, selecionado aleatoriamente, 
afirmaram que lêem a seção cômica diariamente. Qual a probabilidade de um 
assinante escolhido aleatoriamente não ler a seção cômica? 
 
5) Diga se cada afirmação é verdadeira ou se ela é falsa. 
 
a. Espaço amostral é o conjunto de todos os resultados possíveis de um 
experimento. 
b. Se dois eventos não podem ocorrer ao mesmo tempo eles são chamados de 
mutuamente excludentes. 
c. A regra da adição é usada para encontrar a probabilidade de dois eventos 
ocorrerem simultaneamente. 
d. A amostra é um subconjunto da população. Em todo experimento a amostra pode 
ser igual à população. 
e. Dado x um evento, então 
  1xP0 
. 
 
6) Dois dados são lançados simultaneamente.Qual a probabilidade de o primeiro 
resultado ser maior do que o segundo? 
 
7) Um grupo de 100 alunos de dois cursos de uma faculdade foram escolhidos para 
responderem a uma pesquisa. A tabela a seguir apresenta a composição destes 
alunos: 
 111 
 
 Matemática Pedagogia 
Homens 31 10 
Mulheres 23 36 
 
Selecionando aleatoriamente um aluno: 
a) qual a probabilidade dele ser homem ou ser do curso de Pedagogia? 
b) qual a probabilidade dela ser mulher dado que é do curso de Matemática? 
 
8) Uma livraria acaba de receber 40 novos livros, entre eles 12 romances históricos. 
Se quatro desses livros são escolhidos aleatoriamente, e sem reposição, qual a 
probabilidade de nenhum deles ser romance histórico? (Expressar o resultado em 
fração) 
 
9) A tabela a seguir apresenta o número de pacientes internados no hospital X, por 
Alas. 
 
 
Alas 
Sexo e Número 
Total Masculino Feminino 
A 415 220 635 
B 250 375 595 
C 105 220 325 
Total 740 815 1555 
 
A probabilidade de um paciente selecionado aleatoriamente ser do sexo feminino ou 
estar internado na ala A é de: 
 
10) Complete com V se a afirmação for verdadeira e com F se for falsa. 
 
a. ( ) Espaço amostral é o conjunto de todos os resultados possíveis de um 
experimento. 
 
 112 
b. ( ) Se dois eventos podem ocorrer ao mesmo tempo eles são chamados de 
mutuamente excludentes. 
 
c. ( ) A regra da multiplicação é usada para encontrar a probabilidade de dois 
eventos ocorrerem simultaneamente. 
 
d. ( ) A amostra é um subconjunto da população. Em todo experimento a amostra 
nunca será igual à população. 
 
e. ( ) Dado x um evento, então 
  10  xP
. 
 
11) Dois dados são lançados simultaneamente. Qual a probabilidade de o primeiro 
resultado ser menor do que o segundo? 
 
12) Um grupo de 100 alunos de dois cursos de uma faculdade foram escolhidos para 
responderem a uma pesquisa. A tabela a seguir apresenta a composição destes 
alunos: 
 
 Matemática Pedagogia 
Homens 31 10 
Mulheres 23 36 
 
Selecionando aleatoriamente um aluno(a): 
a) qual a probabilidade dele ser homem e ser do curso de Pedagogia? 
 
b) qual a probabilidade dela ser mulher ou ser do curso de Matemática? 
 
13) Uma livraria acaba de receber 40 novos livros, entre eles 12 romances 
históricos. Se um desses livros é escolhido aleatoriamente, e sem reposição, qual a 
probabilidade dele ser romance histórico? (Expressar o resultado em fração) 
 
14) Quais dos valores abaixo não podem ser probabilidade? 
 
 113 
0 ; 0,0001; -0,2 ; 3/2 ; 2/3 ; 
2
 ; 
2,0
 
 
15) Quanto é P(A), se A é o evento “Fevereiro tem 30 dias este ano”? 
16) Quanto é P(A), se A é o evento “Novembro tem 30 dias este ano”? 
17) Qual a probabilidade do resultado “cara” ao jogar uma moeda? 
18) A MasterCard International efetuou um estudo de fraude em cartões de crédito. 
Os resultados estão na tabela a seguir 
 
Tipo de fraude Número 
Cartão roubado 243 
Cartão falsificado 85 
Pedido por correio/ telefone 52 
Outros 46 
 
Selecionado aleatoriamente um caso de fraude, qual a probabilidade de a fraude 
resultar de um cartão falsificado? 
19) Um casal planeja ter 2 filhos. 
a) Relacione os diferentes resultados, de acordo com o sexo de cada criança. 
b) Determine a probabilidade de o casal ter 2 meninas 
c) Determine a probabilidade de exatamente uma criança de cada sexo. 
 
20) Em um teste com 3 questões do tipo verdadeiro/falso, um estudante que não 
está preparado deve responder cada uma aleatoriamente. 
a) Relacione os diferentes resultados possíveis. 
b) Qual é a probabilidade de responder corretamente todas as três questões? 
c) Qual a probabilidade de “palpitar” incorretamente todas as três questões? 
d) Qual a probabilidade de acertar duas questões? 
 
21) Diga se os dois eventos são mutuamente excludentes: 
a. Escolha de um espectador de televisão do sexo masculino; 
b. Escolha de alguém que raramente utiliza o controle remoto. 
 
22) Diga se os dois eventos são mutuamente excludentes: 
 114 
c. Girar uma roleta e obter um número 7; 
d. Girar uma roleta e obter um número par. 
 
23) De um conjunto de cinco empresas, deseja-se selecionar, aleatoriamente, uma 
empresa, mas com probabilidade proporcional ao número de funcionários. O número 
de funcionários da Empresa A é 20; de B é 15; de C é 7; de D é 5 e de E é 3. 
a) Qual a probabilidade de cada uma das empresas ser selecionada? 
b) Qual é a probabilidade de a Empresa A não ser 
 
Selecionada? 
24) Se 
4,0)( AP
 e 
5,0)( BP
, o que se pode dizer quanto a 
)( BAP 
 se A e B são 
eventos mutuamente exclusivos? 
25) Num lote de 12 peças, 4 são defeituosas; três peças são retiradas 
aleatoriamente. Calcule: 
a. A probabilidade de ambas serem defeituosas. 
b. A probabilidade de ambas não serem defeituosas. 
c. A probabilidade de ao menos uma ser defeituosa. 
26) Um lote é formado por 10 peças boas, 4 com defeitos leves e 2 com defeitos 
graves. Uma peça é escolhida aleatoriamente. Calcule a probabilidade de: 
a. Ela não tenha defeitos graves. 
b. Ela não tenha defeito. 
c. Ela ou seja boa ou tenha defeitos graves. 
27) Três máquinas, A, B e C produzem respectivamente 40%, 50% e 10% do total 
de peças de uma fábrica. As porcentagens de peças defeituosas nass respectivas 
máquinas são 3%, 5% e 2%. Uma peça é selecionada aleatoriamente e verifica-se 
que é defeituosa. Qual a probabilidade de que a peça tenha vindo da máquina B? 
28) A probabilidade de o aluno X resolver um problema é de 3/5 e a do aluno Y 
resolver o mesmo problema é de 4/7. Qual a probabilidade de que o problema seja 
resolvido? 
29) Um grupo de 15 elementos apresenta a seguinte composição: 
 
 Homem Mulher 
Menores 5 3 
 115 
Adultos 5 2 
 
Um elemento é escolhido ao acaso. Pergunta-se: 
a. Qual a probabilidade de ser homem? 
b. Qual a probabilidade de ser adulto? 
c. Qual a probabilidade de ser mulher e menor? 
d. Sabendo-se que o elemento escolhido é adulto, qual a probabilidade de ser 
homem? 
e. Dado que a escolhida é mulher, qual a probabilidade de ser menor/ 
 
30) Suponha que um fabricante de sorvete recebe 20% de todo o leite que utiliza de 
uma fazenda 
1F
, 30% de uma outra fazenda 
2F
 e 50% de 
3F
. Um órgão de 
fiscalização inspecionou as fazendas de surpresa, e observou que 20% do leite 
produzido por 
2F
 estava adulterado por adição de água, enquanto que para 
2F
 e 
3F
, essa proporção era de 5% e 2%, respectivamente. Na indústria de sorvetes os 
galões de leite são armazenados em um refrigerador sem identificação das 
fazendas. Para um galão escolhido ao acaso, calcule: 
a) a probabilidade de que o leite tenha sido produzida pela fazenda 
1F
 
b) a probabilidade de que o leite tenha sido produzida pela fazenda 
2F
 
c) a probabilidade de que o leite tenha sido produzida pela fazenda 
3F
 
31) Uma companhia que fura poços artesianos trabalha numa região escolhendo 
aleatoriamente o ponto de furo. Não encontrando água nessa tentativa, sorteia outro 
local e, caso também não tenha sucesso, faz uma terceira e última tentativa. Admita 
probabilidade de 0,7 de encontrar água em qualquer ponto dessa região. Calcule a 
probabilidade de: 
a) encontrar água na segunda tentativa. 
b) encontrar água em até duas tentativas 
encontrar água. 
 116 
Distribuições de probabilidade 
 
 
Variável Aleatória 
Definição: 
 Sejam E um experimento e S o espaço amostral associado ao experimento. 
Uma função X, que associe a cadaelemento 
Ss
 um número real 
 sX
 é 
denominada variável aleatória. 
 
Veja a ilustração 
 
 
Exemplo: 
E: Lançamento de duas moedas; 
X: Número de caras obtidas nas duas moedas; 
        k,k,c,k,k,c,c,cS 
, onde c= cara e k= coroa; 
A variável aleatória X pode assumir os valores 0, 1 e 2. 
 
Outros exemplos de variáveis aleatórias: 
2. X: número de acidentes com aviões de uma determinada companhia; 
3. X: número de mulheres entre 10 empregados recém-admitidos; 
4. X: número de peças produzidas por uma empresa em determinado dia; 
5. X: altura de um adulto do sexo masculino selecionado aleatoriamente. 
 
 117 
 
Definições: 
 
Uma variável aleatória discreta admite um número finito de valores ou um número 
infinito enumerável de valores. 
 
Exemplo: 
a. O número de espectadores que vêem um filme. 
b. Número de peças produzidas em um dia. 
 
Uma variável aleatória contínua admite um número infinito de valores, e esses 
valores podem ser associados a mensurações em uma escala contínua. 
 
Exemplo: 
a) A voltagem em uma pilha. 
b) Quantidade de leite em um copo. 
 
Distribuição de Probabilidade 
 
Dada uma variável aleatória discreta, podemos identificar: 
1) Quais os possíveis resultados podem ocorrer; 
2) Qual a probabilidade de cada resultado ocorrer. 
Por exemplo: No lançamento de duas moedas não viciadas, o número de caras 
possíveis e suas probabilidades é dada por: 
 118 
Tabela: Distribuição de probabilidade do nº 
de caras no lançamento de duas moedas 
Nº de caras 
x 
Probabilidade 
0 1/4 
1 2/4 
2 1/4 
Total 1 
 
Assim, definimos: 
A Distribuição de probabilidade de uma variável aleatória X é a descrição do 
conjunto de probabilidades associadas aos possíveis resultados de X. Podemos 
também chamá-la de função de probabilidade. 
Simbolicamente temos: 
...,2,1)()(  icomxXPxp ii
 
 
No caso do exemplo anterior temos: 
4
1
)2X(P)2(p
4
2
)1X(P)1(p
4
1
)0X(P)0(p



 
O gráfico da distribuição de probabilidade é dada por: 
 
 119 
Gráfico: Distribuição de probabilidade do número 
de caras no lançamento de duas moedas 
 
 
A função de probabilidade deve satisfazer às seguintes propriedades: 
1) 
0)( ixp
; 
2) 
1)( 
i
ixp
. 
Função de distribuição acumulada 
 Podemos também representar uma distribuição de probabilidade por sua 
função de distribuição acumulada definida por: 
 xxXPxF ),()(
 
onde 

 é o conjunto dos números naturais. 
 
Obs.: A distribuição acumulada descreve a probabilidade de ocorrer um valor até x. 
Exemplo: No lançamento de duas moedas não viciadas, a distribuição acumulada do 
número de caras possíveis é dada por: 
 













x2se1
2x1se
4
3
1x0se
4
1
xF
 
 120 
Tabela: Distribuição de probabilidade acumulada do nº 
de caras no lançamento de duas moedas 
Valores possíveis 
x 
Distribuição acumulada 
0 1/4 
1 3/4 
2 4/4 
 
 O gráfico da distribuição acumulada da variável X = número de caras em dois 
lançamentos é: 
 
Gráfico: Distribuição de probabilidade do número 
de caras no lançamento de duas moedas 
 
Valor esperado 
A média ou valor esperado de uma variável aleatória X é dado por: 



k
1i
ii )x(p.x)X(E
 
 
Variância 
A variância de uma variável aleatória X é dada por: 
22 )()(  XEXVar
 
 
 121 
Exemplo: No lançamento de duas moedas não viciadas, a média e a variância são 
dadas por: 
Valores possíveis 
x 
Probabilidade 
p(x) 
 ii xpx 
 
 
 i
2
i xpx 
 
0 1/4 0 0 
1 2/4 2/4 2/4 
2 1/4 2/4 1 
Total 1 1 1,5 
 
Assim 



k
1i
ii 1)x(p.x
 
5,015,1)X(E)X(Var 22  
 
 
Exercícios 
1) Num lote de 12 peças, 4 são defeituosas. Duas peças são retiradas 
aleatoriamente sem reposição. Resolva: 
a) Encontre a distribuição de probabilidade associada a variável aleatória 
X = número de peças defeituosas. 
b) Faça o gráfico do resultado obtido na letra a. 
c) Encontre a distribuição acumulada de X. 
d) Faça o gráfico do resultado obtido na letra c 
e) Encontre a média de peças defeituosas, ou seja, a média de X. 
f) Encontre a variância do número de peças defeituosas, ou seja, a variância de X. 
2) Considere o lançamento de um dado honesto. Encontre a distribuição de 
probabilidade associada ao resultado da face deste dado. 
3) Suponha 
 
5
x
xP 
 (onde x assume valores 0, 1, 2, 3). 
 xP
 Define uma 
distribuição de probabilidade? 
4) Suponha 
 
3
x
xP 
 (onde x assume valores 0, 1, 2). 
 xP
 Define uma distribuição 
de probabilidade? 
 122 
5) Suponha 
 
  !x!x34
3
xP


 (onde x assume valores 0, 1, 2, 3). 
 xP
 Define uma 
distribuição de probabilidade? 
6) O peso de um livro escolhido aleatoriamente é uma variável aleatória discreta ou 
contínua? 
7) O custo de uma peça escolhida aleatoriamente é uma variável aleatória discreta 
ou contínua? 
8) Suponha que a variável aleatória discreta x possa tomar os valores 1, 2, 3, ..., n e 
que esses valores sejam igualmente prováveis. Mostre que  
2
1n 

 e 
 
12
1n22 
 
Pricipais propriedades: 
 Considere c constante e X e Y variáveis aleatórias. 
Média Variância 
E(c) = c V(c) = 0 
E(X+c) = E(X) + c V(X + c) = V(X) 
E(cX) = c E(X) V(cX) = c2 V(X) 
E(X+Y) = E(X) + E(Y) DP(cX) = |c| DP(X) 
E(X-Y) = E(X) - E(Y) 
 
 123 
 
Principais Distribuições discretas 
I) Distribuição Binomial 
Premissas assumidas pelo modelo binomial: 
a) n provas independentes e do mesmo tipo são realizadas; 
b) cada prova admite apenas dois resultados: sucesso e falha; 
c) a probabilidade de sucesso em cada prova é 
p}sucesso{P 
 constante em todo o 
experimento. Neste caso consideramos amostragem aleatória com reposição. 
 
A probabilidade da variável X assumir certo valor x, pertencente ao conjunto {0, 1, 2, 
...} é dada por 
xnx )p1.(p.
x
n
)x(p 






 
Onde 
p.n)X(E 
 e 
)p1.(p.n)X(Var 
. 
 
Exercícios: 
1) Num lote de 12 peças, 4 são defeituosas; duas peças são retiradas 
aleatoriamente e com reposição. Calcule: 
a) Qual a probabilidade de ambas serem defeituosas? 
b) Qual a probabilidade de apenas uma ser defeituosa? 
Solução: 
a) Usando probabilidade (regra da multiplicação) temos 
 
9
1
12
4
12
4
AP 
. 
Resolvendo usando a distribuição binomial temos: 
Seja A: uma peça ser defeituosa. Então 
 
12
4
pAP 
. Assim a probabilidade de 
retirar duas peças defeituosas é: 
9
1
144
16
)
12
8
.(
12
4
.
2
4
)
12
4
1.(
12
4
.
2
2
)2(p 0
2
22
2
























 
 
b) Exercício 
 124 
 2) Dados históricos mostram que 5% dos itens provindos de um fornecedor 
apresentam algum tipo de defeito. Considerando um lote de 20 itens, calcule a 
probabilidade de (com reposição): 
a) haver algum item com defeito; 
b) haver exatamente dois itens defeituosos; 
c) haver mais de dois itens defeituosos; 
d) qual é o número esperado de itens defeituosos? 
e) e de itens bons? 
 
3) Se 7% das lâmpadas de certa marca são defeituosas, achar a probabilidade de 
que, numa amostra de 100 lâmpadas, escolhidas ao acaso e com reposição, 
tenhamos três defeituosas. 
 
II) Distribuição geométrica 
 Se um casosatisfaz todas as condições de um experimento binomial, exceto 
pelo fato de o número de provas não ser fixo, então aplicamos a distribuição 
geométrica. 
A distribuição geométrica se aplica quando estamos interessados na probabilidade 
de o primeiro sucesso ocorrer em determinada prova. 
Para que o sucesso ocorra, por exemplo na 
ésimax 
 prova, deve-se ser precedido 
por 
1x 
 fracassos, cuja probabilidade é 
  1xp1 
.
 
 
 125 
 
A distribuição é chamada geométrica porque seus valores sucessivos constituem 
uma progressão geométrica. 
 Considere um experimento E e uma variável aleatória X com 
probabilidade de sucesso p. Se X tem distribuição geométrica, então a 
probabilidade de X obter sucesso na x-ésima prova é dada por 
 
    ,3,2,1x,11pxp 1x  
 
 
 
Exercícios; 
1) Num lote de 12 peças, 4 são defeituosas. Seleciona-se aleatoriamente 5 peças. 
Qual a probabilidade de a primeira peça defeituosa ser a 3ª peça escolhida? 
Solução: A probabilidade de uma peça ser defeituosa é 
  3333,0
12
4
defeitop  
Escolhida 5 peças, a probabilidade da primeira peça defeitosa ser a 3ª é 
    1481,03333,013333,03p 2 
 
2) A probabilidade de uma criança contrair uma doença contagiosa, à qual está 
exposta é 0,70. Qual é a probabilidade de a sétima criança exposta à doença ser a 
primeira a contraí-la? 
 
 126 
 
III) Distribuição hipergeométrica 
 A distribuição hipergeométrica é utilizada quando temos uma amostragem 
sem reposição de uma população finita. Neste caso o experimento também admite 
apenas dois resultados possíveis, sucesso e fracasso. 
Considere uma população com N objetos do tipo A e r objetos do tipo B. Se 
extraírmos n objetos sem reposição, então a probabilidade de obter x objetos do tipo 
A e n-x objetos do tipo B é dada por 
n...,,1,0xcom
n
rN
xn
r
x
N
)x(p 





 














 
Onde 
pnXE .)( 
 e 
1rN
nrN
).p1.(p.n)X(Var



. 
 
Exercícios: 
1) Num lote de 12 peças, 4 são defeituosas; duas peças são retiradas 
aleatoriamente e sem reposição. Calcule: 
a) Qual a probabilidade de ambas serem defeituosas? 
b) Qual a probabilidade de apenas uma ser defeituosa? 
 
Solução: 
a) Consideremos peças boas sendo do tipo B e peças defeituosas tipo A. temos: N = 
4, n = 2, r = 8 e x = 2. Assim 
11
1
2
84
22
8
2
4
)2(p 





 














 
Utilizando probabilidade temos: 
 
11
1
11
3
12
4
AP 
. 
 
2) Placas de vídeo são expedidas em lotes de 30 unidades. Antes que a remessa 
seja aprovada, um inspetor escolhe aleatoriamente cinco placas do lote e as 
 127 
inspeciona. Se nenhuma das placas inspecionadas for defeituosa, o lote é aprovado. 
Se uma ou mais forem defeituosas, todo o lote é inspecionado. Supondo que haja 
três placas defeituosas no lote, qual é a probabilidade de que o controle da 
qualidade aponte para a inspeção total? 
 
IV) Distribuição de Poisson 
Suponha que queremos avaliar o número de ocorrência de um evento por unidade 
de tempo, de comprimento, de área, de volume, etc. 
Exemplo: 
a) número de consultas em uma base de dados por minuto; 
b) número de erros de tipografia em um formulário; 
Se tivermos: 
a) Independência entre as ocorrências do evento e 
b) Os eventos ocorrerem de forma aleatória, 
 
Então a probabilidade da variável aleatória X assumir um determinado valor é dada 
por 
...,1,0xcom
!x
.e
)x(p
x

  
Onde 
 )X(Var)X(E
. 
 
Exercícios: 
1) Suponha que as consultas num banco de dados ocorrem de forma independente 
e aleatória, com uma taxa média de três consultas por minuto. Qual a probabilidade 
de que no próximo minuto ocorram: 
a) nenhuma consulta? 
b) uma consulta? 
c) duas consultas? 
d) menos do que três consultas? 
 
Solução: 
 Seja 

= taxa média = 3 consultas/min. 
 128 
a) Queremos a probabilidade de não ter consulta no próximo minuto, ou seja, 
x = 0. Assim 
0498,0
1
10498,0
!0
3.e
)0(p
03




 
Portanto a probabilidade de, no próximo minuto, ter nenhuma consulta é 0,0498. 
b) Queremos a probabilidade de ter 1 consulta no próximo minuto, ou seja, 
x = 1. Assim 
1494,0
1
30498,0
!1
3.e
)1(p
13




 
Portanto a probabilidade de, no próximo minuto, ter nenhuma consulta é 0,1494. 
c) Queremos a probabilidade de ter 2 consulta no próximo minuto, ou seja, 
x = 2. Assim 
2241,0
2
90498,0
!2
3.e
)1(p
23




 
Portanto a probabilidade de, no próximo minuto, ter nenhuma consulta é 0,2241. 
 
d) Queremos 
      4233,02241,01494,00498,02p1p0p 
 
 
2) Suponha que as consultas num banco de dados ocorrem de forma independente 
e aleatória, com uma taxa média de três consultas por minuto. Qual a probabilidade 
de que nos próximos dois minutos ocorram mais do que 5 consultas? 
 
 129 
 
Distribuições contínuas 
 Uma variável aleatória X é dita contínua quando ela assume qualquer valor 
real dentro de um intervalo. 
 Exemplos: 
1) Altura de uma pessoa; 
2) Tempo de viagem; 
3) Tempo de uma reação química; 
4) Volume de leite em um copo; etc 
Propriedades 
 
 Seja 
)(xf
 a função densidade de probabilidade da variável 
contínua X. Então 
)(xf deve satisfazer às seguintes propriedades: 
 
1) 
realxxf  ,0)(
 
2) 
1)( 


dxxf
 
3) Se ]b,a[A  , então 
b
a
dx)x(f)A(P .
 
 
 
Seja 
)(xf
 a função densidade de probabilidade da variável contínua X, então temos: 
a) 



 dxxfxXE )(.)(
 
 
b) 



 dxxfxXVar )(.)()( 22  .
 
 
 Uma curva de densidade é o gráfico de uma distribuição contínua 
de probabilidade. Deve satisfazer as seguintes propriedades 
 
 130 
1. A área total sob a curva deve ser 1; 
2. Todo ponto da curva deve ter uma altura vertical não inferior a 0. 
 
 
 131 
 
I) Distribuição Uniforme. 
 
Uma variável aleatória X tem distribuição uniforme quando todos os seus valores 
possíveis tem a mesma probabilidade. 
A curva de densidade de X é uma reta horizontal. 
 
 Uma variável aleatória X tem distribuição uniforme de parâmetros 

 e 
 com   se 







],[,0
],[,
1
)(



xpara
xpara
xf 
Neste caso 
2
)(
 
XE
 e 
12
)(
)(
2 
XVar
. 
 
Exemplos: 
1) Suponha por exemplo o lançamento de um dado não viciado. Os valores 
possíveis são {1, 2, 3, 4, 5, 6}. Como todos os resultados são igualmente 
possíveis,1/6, então temos uma distribuição uniforme. 
A curva de densidade é dada por 
 
Gráfico: Curva de densidade da probabilidade 
de lançamento de um dado 
 
 132 
2) Um profissional de computação observou que seu sistema gasta entre 20 e 24 
segundos para realizar determinada tarefa, segundo uma distribuição uniforme em 
[20, 24]. Sua curva de densidade é dada por 
 
Gráfico: Curva de densidade da probabilidade 
de um sistema 
 
Exercício: 
Um profissional de computação observou que seu sistema gasta entre 20 e 24 
segundos para realizar determinada tarefa. Considere a probabilidade uniforme em 
[20, 24]. Resolva: 
a) Encontre, graficamente, a função densidade de probabilidade. 
b) 
)23( XP
. 
c) 
)(XE
 
d) 
)(XVar
. 
 
 
II) Distribuição Exponencial 
 
Uma distribuição exponencial é utilizadaquando queremos modelar a variável 
aleatória contínua que representa: 
a) Tempo até a próxima consulta a uma base de dados; 
b) Tempo entre pedidos a um servidor; 
c) Distância entre defeitos de uma fita. 
 133 
 
Sejam as variáveis aleatórias: 
tX
 = número de ocorrências no intervalo de tempo [0, t]; e 
T
 = tempo entre as ocorrências. 
Sendo 

 a taxa média de ocorrências por unidade de tempo, então, considerando 
independência entre as ocorrências, 
T
 tem distribuição exponencial dada por: 
tetf ..)(  
 
 
Onde 

1
)( TE e 
2
1
)(

TVar
 
 
A curva de densidade da variável T com distribuição exponencial é dada por 
 
 A probabilidade 
  

b
a
t.e.bTaP .
 
 
Exercícios: 
 134 
1) Seja a variável aleatória T definida como o tempo de resposta na consulta a um 
banco de dados, em minutos. Suponha que essa variável tenha a seguinte função 
densidade de probabilidade: 







0,0
0,2
)(
2
tpara
tparae
xf
t 
 
Calcule: 
a) A probabilidade de a resposta demorar mais do que 3 minutos? 
b) Calcule )32(  TP . 
 
Solução: 
a)   0025,00025,00eeedte.23TP 3.2.23
t.2
3
t.2  


 . 
b) 
 
0208,0
0183,00025,0eeedte.23T2P 2.23.232
t.2
3
2
t.2

 
 
2) O tempo de vida (em horas) de um transistor é uma variável aleatória T com 
distribuição exponencial. O tempo médio de vida do transistor é de 500 horas. 
a) Faça a curva de densidade. 
b) Calcule a probabilidade de o transistor durar mais do que 500 horas. 
c) Calcule a probabilidade de o transistor durar entre 300 e 1000 horas. 
 
 135 
 
III) Distribuição Normal 
 
Uma variável aleatória X tem distribuição normal se seu histograma tem a 
forma de um sino. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Definição 
Dados os parâmetros 

 e 
0
 reais, a função densidade de probabilidade 
da normal é dada por: 
2)(
2
1
.
2.
1
)( 





x
exf 
Onde 
)(XE e )(XVar . 
 
Podemos perceber que o cálculo de probabilidade usando a distribuição 
normal é muito difícil devido ao tipo de função. Uma forma de contornarmos este 
problema é utilizar a distribuição normal padronizada. 
Vendas de auto peças
6000,0
5500,0
5000,0
4500,0
4000,0
3500,0
3000,0
2500,0
2000,0
1500,0
1000,0
500,0
0,0
200
100
0
Std. Dev = 994,59 
Mean = 2516,6
N = 1488,00
 136 
A distribuição normal padronizada tem este nome pois sua média é 0 e a 
variância é um. Com isso os cálculos ficam muito mais práticos pois podemos utilizar 
as tabelas de probabilidade normal padronizada. 
Uma conseqüência importante do fato de uma distribuição Normal ser 
completamente caracterizada por sua média e desvio-padrão é que a área sob a 
curva entre um ponto qualquer e a média é função somente do número de desvios-
padrões que o ponto está distante da média. 
Como existem uma infinidade de distribuições normais (uma para cada média 
e desvio-padrão), transformamos a unidade estudada seja ela qual for (peso, 
espessura, tempo, etc.) na unidade Z, que indica o número de desvios-padrão a 
contar da média. 
Para padronizar um conjunto de dados que tem distribuição normal é só 
aplicar a fórmula 



X
z
 
 
Utilização da tabela da normal padronizada 
 A tabela nos dá a área sobre o gráfico, ou seja, a probabilidade. 
 
Exemplo 1: A resistência à tração do papel usado em sacolas de super-mercado é 
uma característica de qualidade importante. 
Sabe-se que essa resistência segue um modelo Normal com média 40 psi e 
desvio padrão 2 psi. 
Se a especificação estabelece que a resistência deve ser maior que 35 psi, 
qual a probabilidade que uma sacola produzida com este material satisfaça a 
especificação? 
   35XP135XP 
 
   5,2ZP
2
4035
ZP35XP 





 

 
Pela tabela da normal padronizada temos probabilidade de 0,0062. 
Logo a resposta é 1-0,0062 = 99,38%. 
 
 137 
 
 
Exercícios 
1) Utilizando a tabela da distribuição normal padronizada calcule: 
a) 
 42,0zP  
b) 
 75,0zP  
c) 
 30,0zP  
d) 
 56,0zP  
e) 
 72,0z25,0P  
f) 
 20,0z25,0P  
g) o valor de z tal que   90,0zZzP  . 
 
Propriedades da distribuição normal 
 
1) a curva é simétrica em torno da média; 
2) 
  0xflim
x


 
3) a área total sob a curva é igual a 1; 
 
área=1
área=0,5 área=0,5
 
 
 138 
 
Comparação entre média e variância 
 
A
C
B
x
f(x)
 
 
a) da distribuição A para B muda a tendência central, mas a variabilidade é 
constante; 
b) da distribuição A para C muda a variabilidade, mas a tendência central é 
constante; 
c) da distribuição B para C muda a tendência central e a variabilidade. 
 
 
 139 
 
Exercícios 
 
1) Suponha que a absorção de água(%) em certo tipo de piso cerâmico tenha 
distribuição normal com média 2,5 e desvio-padrão 0,6. Selecionando, 
aleatoriamente, uma unidade desse piso, qual é a probabilidade de ele acusar 
absorção de água entre 2% e 3,5%? 
2) Uma fábrica de chocolates comercializa barras que pesam em média 200g. Os 
pesos são normalmente distribuídos. Sabe-se que o desvio padrão é igual a 40g. 
Calcule a probabilidade de uma barra de chocolate, escolhida aleatoriamente, pesar 
a) entre 200 e 250g; 
b) mais de 230g; 
c) menos que 150g. 
 
 
 
 140 
Teste de Hipótese 
 
Teste de Hipótese 
 
Em Estatística, uma hipótese é uma afirmação sobre uma propriedade de 
uma população. 
Podemos estar interessados em saber informações sobre a média, a 
proporção ou a variância. 
 
Componentes de um teste de hipótese 
 
1) Hipótese nula - 
0H
: é uma afirmação sobre o valor de um parâmetro 
populacional. Deve conter o sinal de igualdade e deve escrever-se como 
 ,,
. 
2) Hipótese alternativa - 
1H
: é a afirmação que deve ser verdadeira se a hipótese 
nula for falsa. Não deve conter o sinal de igualdade. 
 
Exemplos: 
a) Testar a afirmação de que a média populacional é 75. 
Solução: Neste caso temos 
75:0 H
 e 
75:1 H
. 
 
b) Testar a afirmação de que a média é no máximo 2,50. 
Solução: Neste caso temos 
50,2:0 H
 e 
75:1 H
. 
 
3) Erro tipo I: Consiste em rejeitar a hipótese nula quando ela é verdadeira. 
 
 
 
0H
 verdadeira 
0H
 falsa 
Rejeita 
0H
 Erro tipo I Acerto 
Não rejeita 
0H
 Acerto Erro tipo II 
 
 
4) Nível de significância - 

: A probabilidade do erro tipo I ocorrer. 
 141 
5) Erro tipo II: Consiste em não rejeitar a hipótese nula quando ela é falsa. 
6) A probabilidade de ocorrer o erro tipo II é 

. 
7) Estatística de teste: É uma estatística amostral baseado nos dados amostrais. 
8) Região crítica: É o conjunto de todos os valores da estatística de teste que 
levam à rejeição da hipótese nula. 
9) Valor Crítico: É o valor, ou valores, que separa(m) a região crítica dos valores 
da estatística de teste que não levam à rejeição da hipótese nula. 
 
Conclusões no teste de hipótese 
 
Em um teste de hipótese concluímos por: 
 rejeitar a hipótese nula ou 
 não rejeitar a hipótese nula. 
 
 
 
 
Tipos de teste 
 
 Bilateral (sinal de 
1H
: 

 ): a região crítica está situada nas duas regiões. 
Neste caso 
 
2

ItipoErroP
. 
 
 
 142 
 
 
 
 
 Unilateral esquerdo (sinalde 
1H
: <): a região crítica está situada na parte 
esquerda. Neste caso 
  ItipoErroP
. 
 
 
 
 
 
 Unilateral direito (sinal de 
1H
: >): a região crítica está situada na parte direita. 
  ItipoErroP
. 
 
 
 
Teste de uma afirmação sobre uma média: grandes amostras 
 143 
 
 Considere uma amostra razoavelmente grande (
30n
) para valer o teorema 
central do limite, ou que os dados provenham de uma distribuição aproximadamente 
normal. Para testarmos alguma informação com respeito à média populacional 
utilizamos a estatística de teste dada por: 
 
Estatística de teste: 
n
x
z x



 
 
 Caso 

 seja desconhecido podemos substituí-lo por 
s
. 
 
Os valores críticos são encontrados na Tabela A – 2. 
 
Exemplo: 
 O tempo médio entre falhas de um rádio da Telektronic Companhy para 
aviões de pequeno porte é 420 horas. Após terem sido modificados 35 aparelhos de 
rádio, em uma tentativa de melhorar sua confiabilidade, os testes acusaram um 
tempo médio de 385 horas para esta amostra, com desvio-padrão de 24 horas. Ao 
nível de significância de 0,05, teste a afirmação de que as modificações melhoraram 
a confiabilidade. 
 
Solução: 
a) As hipóteses são: 





420:
420:
1
0


H
H 
b) O teste é bilateral, pois o sinal de 
1H
 é 

. 
c) O nível de significância é 
05,0
; 
d) Os valores críticos são 
96,1z
2

; Logo temos: 
 144 
 
 
 
 
e) Os dados amostrais são: 
385x
 e 
24s
; 
f) Como n=35 (
30n
), a estatística de teste é dada por: 
 
63,8
35
24
420385





n
x
z x
 
 
g) Conclusão: Como a estatística de teste está na dentro da região crítica, então 
rejeitamos 
0H
. 
 
 145 
Teste de uma afirmação sobre uma média: pequenas amostras 
 
 
Considere uma amostra pequena (
30n
) , que os dados provenham de uma 
distribuição normal e que o desvio-padrão populacional 

 é desconhecido. Para 
testarmos alguma informação com respeito à média populacional utilizamos a 
estatística de teste dada por: 
 
Estatística de teste: 
n
s
x
t x


 
 
Os valores críticos são encontrados na Tabela A – 3. 
O número de Graus de liberdade = n – 1. 
 
 
Exemplo: 
 Os sete valores relacionados a seguir são cargas axiais (em libras) da 
primeira amostra de sete latas de alumínio de 12oz. A carga axial de uma lata é o 
peso máximo que seus lados podem suportar, e deve ser superior a 165 libras, 
porque esta é a pressão máxima aplicada quando se fixa a tampa no lugar. Ao nível 
de significância de 0,01, teste a afirmação do engenheiro supervisor de que esta 
amostra provém de uma população com média superior a 165 libras. 
 
270 273 258 204 254 228 282 
 
 
Solução: 
a) As hipóteses são: 





165:
165:
1
0


H
H 
b) O teste é unilateral direito, pois o sinal de 
1H
 é>; 
c) O nível de significância é 
01,0
; 
 146 
d) O valor do grau de liberdade é de 7-1 = 6. Logo o valor crítico é 
143,3t
; 
Logo temos: 
 
 
 
 
 
 
 
e) Os dados amostrais são: 
7,252x
 e 
6,27s
; 
 
Como n = 7 (
30n
), a estatística de teste é dada por: 
 
407,8
7
6,27
1657,252





n
s
x
t x
 
 
f) Conclusão: Como a estatística de teste está na dentro da região crítica, então 
rejeitamos 
0H
. 
 
 
 
Teste de uma afirmação sobre variância ou desvio-padrão 
 
Ao testar uma hipótese sobre o desvio-padrão 

 ou a variância 
2
 de uma 
população, admitimos que os valores da população sejam distribuídos normalmente. 
 147 
Para testar uma informação sobre desvio-padrão 

 ou a variância 
2
 a 
estatística de teste é dada por: 
 
Estatística de teste:  
2
2
2 1


sn 

, 
 
onde 
 
n = tamanho da amostra 
2s
 = variância amostral 
2
 = variância populacional 
 
 
Os valores críticos são encontrados na Tabela A – 4. 
O número de Graus de liberdade = n – 1. 
 
 
 
 
Exemplo: 
 O tempo para transmitir 10 MB em determinada rede de computadores varia 
segundo um modelo normal, com média 7,4 segundos e variância 1,3 segundos. 
Depois de algumas mudanças na rede, acredita-se numa redução no tempo de 
transmissão de dados, Além de uma possível mudança na variabilidade. Foram 
realizados 10 ensaios independentes com um arquivo de 10 MB e foram coletados 
os tempos de transmissão, em segundos: 
 148 
 
6,8 7,1 5,9 7,5 6,3 6,9 7,2 7,3 6,6 6,3 
 
Resolva: 
a) Existe evidência suficiente de que as mudanças na rede de computadores 
alteraram a variabilidade no tempo de transmissão de dados? Ao nível de 
0,05. 
b) Existe evidência suficiente de que as mudanças na rede de computadores 
alteraram o tempo médio de transmissão de dados? Ao nível de 0,05 
 
Solução da letra a: 
 
a) As hipóteses são: 






3,1:
3,1:
2
2
0
1


H
H 
b) O teste é bilateral direito, pois o sinal de 
1H
 é 

; 
c) O nível de significância é 
05,0
; 
d) O valor do grau de liberdade é de 10-1 = 9. Logo os valores críticos são 
700,22 
 e 
023,192 
; Logo temos: 
 
 
 
 
 
 
 
e) Os dados amostrais indicam: 
304,0s
; 
 149 
f) a estatística de teste é dada por: 
 
10,2
3,1
304,0)110(2 


 
 
g) Conclusão: Como a estatística de teste está na dentro da região crítica, então 
rejeitamos 
0H
. 
 
 
 
TESTE DE HIPÓTESE PARA PROPORÇÃO 
 
 O teste para proporção é aplicado em situações nas quais queremos verificar 
se a proporção de algum atributo na população pode ser igual a certo valor 
0p
 . 
SUPOSIÇÕES: 
1) São verificadas as condições para um experimento binomial. Isto é, temos um 
número fixo de provas independentes com probabilidade constante, e cada 
prova comporta dois resultados, que designamos “sucesso” e “falha”. 
 
2) As condições 
5np
 e 
5nq
 são ambas verificadas, de modo que a 
distribuição binomial das proporções amostrais pode ser aproximada por uma 
distribuição normal com 
np
 e 
npq
. 
 150 
______________________________________________________________ 
NOTAÇÃO: 
 
n
: número de provas; 
p
: proporção populacional (usada na hipótese nula); 
n
x
p ˆ
: proporção amostral; 
pq 1
 
______________________________________________________________ 
 
 
ESTATÍSTICA DE TESTE: 
n
pq
pp
z


ˆ 
 Os valores críticos são obtidos na tabela A – 2 (distribuição normal 
padronizada). 
 
Exemplos: 
1) Uma empresa retira periodicamente amostras aleatórias de 500 peças de sua 
linha de produção para análise da qualidade. As peças da amostra são 
classificadas como defeituosas ou não, sendo que a política da empresa 
exige que o processo produtivo seja revisto se houver evidência de mais de 
1,5% de peças defeituosas. Na última amostra, foram encontradas nove 
peças defeituosas. Usando nível de significância de 1%, o processo precisa 
ser revisto? 
Solução: 
h) As hipóteses são: 





015,0:
015,0:
1
0
pH
pH 
i) O teste é unilateral direito, pois o sinal de 
1H
 é 

. 
j) O nível de significância é 
01,0
; 
k) O valor crítico é 
33,2z
; Logo temos: 
 151 
 
 
 
l) Os dados amostrais são: 
018,0
500
9
ˆ p
 
m) Critérios para a aproximação normal:5,7015,0500  pn
 e 
5,492985,0500)015,01(500 qn
 
 
n) Estatística de teste é dada por: 
 
552,0
005436,0
003,0
500
985,0015,0
015,0018,0ˆ






n
pq
pp
z
 
 
o) Conclusão: Como a estatística de teste está fora da região crítica, então não 
rejeitamos 
0H
. 
 
2) Em um estudo da eficácia do air-bag em automóveis, constatou-se que, em 
821 colisões de carros de tamanho médio equipados com air-bag, 46 colisões 
resultaram em hospitalização do motorista. Ao nível de significância de 0,01, 
teste a afirmação de que a taxa de hospitalização nos casos de air-bag é 
inferior à taxa de 7,8% para colisões de carros de tamanho médio equipados 
com cintos automáticos de segurança. 
 
 152 
Exercícios 
 
Média (Grandes amostras) 
 
1) O gerente de uma empresa de transporte suspeita da afirmação de um 
vendedor de pneus de que o seu produto tem uma vida média de, ao menos, 
28 000 milhas. Para verificar a afirmação, a firma instala 40 desses pneus em 
seus caminhões, obtendo uma vida média de 27 563 milhas, com desvio-
padrão de 1 348 milhas. Qual a conclusão do gerente, se a probabilidade de 
um erro tipo I deve ser 0.01? 
 
2) A vida média de uma amostra de 100 lâmpadas de certa marca é 1615 horas. 
Por similaridade com outros processos de fabricação, supomos o desvio-
padrão igual a 120 horas. Utilizando um nível de significância de 2 %, teste a 
afirmação de que a duração média de todas as lâmpadas dessa marca é igual 
a 1600 horas. 
 
Média (Pequenas amostras) 
 
1) Admitindo que a pressão sanguínea arterial em homens siga o modelo 
Normal, 7 pacientes foram sorteados e tiveram sua pressão medida obtendo 
os seguintes resultados: 
 
82 - 84 - 78 - 85 - 69 - 80 - 75 
 
 Utilizando um nível de significância de 0,02 , teste a afirmação de a média da 
 pressão sanguínea é de 82. 
2) O inspetor de qualidade da JF Construções mediu 25 barras de aço e obteve 
as seguintes medidas em metros: 
 
4,51 5,38 4,84 5,33 4,74 4,99 5,15 5,52 5,82 5,45 
4,68 4,74 5,53 5,40 4,72 4,97 5,24 4,94 4,75 5,50 
4,81 5,25 4,86 4,93 4,95 
 
 153 
Pode-se afirmar, com com nível de significância de 5%, que tais barras foram 
sacadas de um lote cujo comprimento médio é de 5,00 metros? 
 
Variância 
 
1) A cofap alega que a variância da vida média de seus amortecedores é de 
nove meses. A Chevrolet ensaia 18 peças e encontra variância de um ano 
para a vida média das referidas peças. A 5% de significância, isso lhe permite 
refutar a alegação da Cofap? 
 
2) Um laboratório fez oito determinações da quantidade de impurezas em 
porções de certo composto. Os valores eram (em mg): 
 
12,4 – 12,6 – 12,0 – 12,0 – 12,1 – 12,3 – 12,5 – 12,7 
 
 Teste a hipótese de que o desvio-padrão é 1, ao nível se significância de 0,05. 
Usuários de uma rede de transmissão de energia elétrica têm reclamado da alta 
variação na tensão. A empresa encarregada da transmissão de energia elétrica 
instalou novos transformadores. O desvio-padrão calculado sobre 30 observações 
independentes foi de 8V e a distribuição de frequências dos valores da amostra 
sugere uma distribuição normal. A um nível de 5%, há evidência de redução na 
variação da tensão, que segund 
 154 
Correlação 
 
Correlação 
 
Com muita freqüência, na prática, verifica-se que existe uma relação entre 
duas (ou mais) variáveis. Por exemplo: os pesos dos adultos do sexo masculino 
dependem, em certo grau, de suas alturas; as circunferências de círculos dependem 
de seus raios; a pressão de uma determinada massa de gás depende de sua 
temperatura e de seu volume. 
Pesquisadores têm estudado os ursos, anestesiando-os a fim de obterem 
medidas vitais como idade, sexo, comprimento e peso. Como os ursos, em sua 
maioria, são bastante pesados e difíceis de serem levantados, os pesquisadores 
têm considerável dificuldade em pesar um urso na selva. Baseado nisso 
levantamos a seguinte pergunta: 
 
Será possível determinarmos o peso de um urso a partir de seu comprimento? 
 
 A tabela a seguir apresenta 8 dados (comprimento e peso) de ursos machos. 
No decorrer da exposição nosso objetivo é utilizar os dados da tabela acima para 
responder aa pergunta inicial. 
Tabela 1 
Comprimento: X (in) Peso: Y (lb) 
53,0 80 
67,5 344 
72,0 416 
72,0 348 
73,5 262 
68,5 360 
73,0 332 
37,0 34 
 
 Dado duas variáveis X e Y, ou mais, nosso objetivo é verificar se existe 
relação entre elas. Por exemplo: Os conjuntos X = {1, 2, 3, 4, 5} e Y = {3, 5, 7, 9, 11} 
são tais que Y = 2X+1. Portanto dizemos que as variáveis X e Y são 
correlacionadas. 
 155 
Encontrar uma relação entre variáveis é de fundamental importância para 
podermos predizer valores futuros. Por exemplo: se soubermos que duas variáveis 
se relacionam por Y = 2X – 4, então os valores de Y são encontrado apenas 
atribuindo valores a X. 
Vamos aqui estudar variáveis que se relacionam linearmente. No final deste 
estudo daremos um exemplo de variáveis que não se relacionam linearmente e sim 
de forma quadrática. 
 
Definição: Existe uma correlação entre duas variáveis quando uma delas está, de 
alguma forma, relacionada com a outra. 
 
 Como estamos interessados em variáveis que se relacionam linearmente, 
então estas relações são descritas por uma equação de uma reta, ou seja, equações 
do tipo Y = a0 + a1X. 
 Como não podemos basear nossas conclusões apenas em diagramas, 
necessitamos de métodos mais precisos e objetivos para tirarmos conclusões. 
Vamos utilizar o coeficiente de correlação linear. Ele também é conhecido como 
coeficiente de correlação de Pearson (Karl Pearson). 
 
Definição: O coeficiente de correlação linear r mede o grau de relacionamento 
linear entre os valores emparelhados x e y em uma amostra. 
 
 Podemos encontrar o valor do coeficiente de correlação linear r através da 
fórmula: 
 
  
  



2)(2.2)(2
))((
yynxxn
yxxyn
r
 
 
 Como r é calculado com base em dados amostrais, é uma estatística amostral 
usada para medir o grau da correlação linear entre x e y. Se tivéssemos todos os 
pares de valores (x, y) para a população, a fórmulas acima seria um parâmetro 
populacional. 
 
 156 
Arredondamento do coeficiente de correlação linear 
 
 Arredondamos o coeficiente de correlação linear r para três casas decimais, 
afim de que seu valor possa ser comparado com os valores críticos da tabela A-6. 
 
Os gráficos de dispersão a seguir descrevem alguns dos tipos de correlação 
existentes. 
 
Correlação linear positiva 
0
5
10
15
20
25
30
0 5 10
X
Y
 
 A correlação será considerada positiva se valores crescentes de X estiverem 
associados a valores crescentes de Y, ou valores decrescentes de X estiverem 
associados a valores decrescentes de Y. Neste caso 0 < r < 1. 
 
Correlação linear perfeita positiva 
0
5
10
15
20
25
30
0 5 10
X
Y
 
 A correlação linear será considerada perfeita positiva se valores 
crescentes de X estiverem perfeitamente alinhados a valores crescentes de Y, ou 
valores decrescentes de X estiverem perfeitamente alinhados a valores 
decrescentes de Y. Neste caso r = 1. 
 
Correlação Negativa 
 157 
0
5
10
15
20
25
30
0 2 4 6 8 10
X
Y
 
 A correlação é considerada negativa quando valores crescentes da variável X 
estiverem associados a valores decrescentes da variável Y, ou valores decrescentes 
de X estiverem associados a valores crescentes da variável Y. Neste caso–1 < r < 
0. 
 
Correlação negativa perfeita 
0
5
10
15
20
25
30
0 2 4 6 8 10
X
Y
 
 
A correlação linear será considerada perfeita negativa se valores crescentes 
de X estiverem perfeitamente alinhados a valores decrescentes de Y, ou valores 
decrescentes de X estiverem perfeitamente alinhados a valores crescentes de Y. 
Neste caso r = -1. 
 
Correlação nula 
0
5
10
15
20
25
30
0 2 4 6 8 10
X
Y
 
 Quando não houver relação entre as variáveis X e Y, ou seja, quando as 
variações de X e Y ocorrerem independentemente não existe correlação entre elas. 
Neste caso r = 0. 
 158 
 
Correlação não-linear 
0
10
20
30
0 5 10
X
Y
 
 Quando não houver correlação linear entre as variáveis X e Y pode 
acontecer que haja outro tipo de correlação. Esta correlação pode ser quadrática, 
exponencial, logarítmica, uma curva do 3.º grau, etc. 
 
Cálculo do coeficiente de correlação para os dados da tabela 1. 
 
 Para o cálculo do coeficiente de correlação é conveniente a construção de 
tabelas ampliadas, onde, a partir dos valores de X e Y, são determinadas todas as 
somas necessárias. 
 
Comprimento: 
X (in) 
Peso: 
Y (lb) 
X2 Y2 XY 
53 80 2809 6400 4240 
67,5 344 4556,25 118336 23220 
72 416 5184 173056 29952 
72 348 5184 121104 25056 
73,5 262 5402,25 68644 19257 
68,5 360 4692,25 129600 24660 
73 332 5329 110224 24236 
37 34 1369 1156 1258 
516,5 2176 34525,75 728520 151879 
 
 O valor de r é dado por r = 0,897. 
 
Interpretação do valor de r 
 159 
 
 Se o valor de r está próximo de 0 (zero), concluímos que não há correlação 
linear significativa entre X e Y, mas se r está próximo de –1 ou +1, concluímos pela 
existência de correlação linear significativa entre X e Y. Como o termo “próximo” é 
vaga, temos que adotar um critério de decisão. Adotaremos o critério a seguir 
 
Se o módulo do valor calculado de r excede o valor na tabela de Valores 
Críticos do Coeficiente de Correlação de Pearson, concluímos que há 
correlação linear significativa. Em caso contrário, não há evidência 
suficiente para apoiar a existência de uma correlação linear significativa. 
 
 Para encontrar o valor crítico na tabela de Valores Críticos do Coeficiente de 
Correlação de Pearson precisamos do número de pares (X, Y), representado pela 
letra n, e do nível de significância , erro tipo 1, (que pode ser 0,05 ou 0,01). Neste 
caso temos n = 8. Assim encontramos o valor crítico de 0,707 (para  = 0,05) e valor 
crítico de 0,834 (para  = 0,01). 
 A interpretação dos valores críticos é muito simples: Com oito pares de dados 
e sem qualquer correlação linear entre X e Y, há uma chance de 5 % de que o valor 
absoluto do coeficiente de correlação linear calculado r exceda 0,707. Com os 
mesmos dados há uma chance de 1 % de que o valor absoluto do coeficiente de 
correlação linear calculado r exceda 0,834. 
 Em nosso caso, como o valor calculado de r = 0,897 que é maior que 0,707 e 
0,834, então concluímos que há correlação linear significativa entre X (comprimento 
dos ursos) e Y (pesos dos ursos). 
 
Propriedades do Coeficiente de Correlação Linear r 
 
1) O valor de r está sempre compreendido entre –1 e +1; 
2) O valor de r não varia se todos os valores de qualquer uma das variáveis são 
convertidos para uma escala diferente; 
3) O valor de r não é afetado pela escolha de X ou Y; 
4) O valor de r mede a intensidade, ou grau, de um relacionamento linear. Não 
serve para medir a intensidade de um relacionamento não-linear. 
 160 
 
Teste de hipótese para determinar se há correlação 
 
Podemos utilizar dois métodos para verificar se duas variáveis possuem 
correlação linear entre elas. Utilizando a teoria do teste de hipótese vamos verificar 
se há correlação entre as variáveis X e Y de uma população. Neste caso usaremos o 
parâmetro  para representar a correlação entre duas variáveis de uma população. 
Assim temos: 
H0:  = 0 (Não há correlação linear entre as variáveis X e Y) 
H1:   0 (Há correlação linear significativa entre as variáveis X e Y) 
 
Método 1: A estatística de teste é t. Utilizamos a distribuição t de Student. 
 
Estatística de Teste t para Correlação Linear 
2
21



n
r
r
t
 
 
Valores críticos:Utilizar Tabela A-3 com n – 2 graus de liberdade. 
 
Método 2: Estatística de Teste é r. Usamos o valor calculado do Coeficiente de 
Correlação Linear de Pearson r. 
 
Estatística de Teste r para Correlação Linear 
Estatística de Teste: r 
Valores críticos: Tabela do Coeficiente de Correlação r de Peason. 
 
Exemplo: Para os dados da Tabela 1 temos: r = 0,897 (calculado). Utilizando o teste 
de hipótese teremos: 
 
Método 1: A estatística de teste será t = 4,971. Os valores críticos são t = -2,447 e t 
= 2,447 são obtidos na tabela A-3 com nível de significância 0,05. e 6 graus de 
liberdade. Como o valor da estatística de teste t = 4,971 está dentro da área crítica, 
 161 
então rejeitamos H0. Logo há evidências para apoiar a existência de uma correlação 
linear. 
 
Método 2: A estatística de teste é r = 0,897. Os valores críticos são r = - 0,707 e r = 
0,707 com n = 8 e nível de significância 0,5. Como r está dentro da área crítica, 
então rejeitamos H0. Logo há evidências para apoiar a existência de uma correlação 
linear. 
Rejeitar 
 = 0 
Não Rejeitar 
 = 0 
Rejeitar 
 = 0 
 -1 r = -0,707 r = 0,707 1 
 
 Como sabemos que há correlação entre as variáveis X e Y, basta agora 
encontrar qual a correlação, ou seja, qual a equação que relaciona as duas 
variáveis. Isto podemos facilmente encontrar usando a Regressão Linear. 
 
 162 
Regressão Linear 
 
Definição: Dada uma coleção de dados amostrais emparelhados (X, Y), a equação 
de regressão 
xbbyˆ 10 
 
descreve a relação entre as duas variáveis. O gráfico da equação de regressão é 
chamado reta de regressão. (ou reta de melhor ajuste, ou reta de mínimos 
quadrados) 
 Esta definição expressa uma relação entre x (chamada variável independente 
ou variável preditora) e 
yˆ
 (chamada variável dependente ou variável resposta). 
Temos que b0 é o intercepto y e b1 é o coeficiente angular. 
 
Suposições: 
 
1) Estamos investigando apenas relações lineares. 
2) Para cada x, y é uma variável aleatória com distribuição normal. Todas essas 
distribuições de y têm a mesma variância e, ainda, para um dado valor de x, a 
média da distribuição dos valores de y está sobre a reta de regressão. 
 
Fórmulas: 
 Estimamos os valores b0 e b1 pelas fórmulas a seguir. 
 
221
22
2
0
)x()x(n
)y)(x()xy(n
b
)x()x(n
)xy)(x()x)(y(
b










 
 
Arredondamentos 
 
 Cálculos intermediários arredondar para seis casas decimais. Arredondar o 
resultado final para uma casa decimal a mais que os dados. 
 163 
 
 Voltando ao problema proposto, Tabela 1, vamos calcular a reta de regressão 
entre as variáveis X e Y. 
 Temos que b0 = - 351,66 e b1 = 9,66. Assim y = -351,66 + 9,66 x . Esta 
relação nos diz que o peso de um urso é dado como 9,66 vezes o valor do 
comprimento do urso menos 351,66. 
 As equações de regressão podem ser úteis quando usadas para predizer o 
valor de uma variável, dado um valor determinado da outra variável. Ao predizer um 
valor de y com base em determinado valor de x: 
 
1) Se não há correlação linear significativa, o melhor valor predito de y é a média 
de y; 
2) Se há correlação linearsignificativa, obtém-se o melhor valor predito de y 
substituindo-se o valor de x na equação de regressão. 
 
Por exemplo, se queremos saber qual o peso de um urso de 80 in de 
comprimento teremos: y = - 351,66 + 9,66. 80 = 421,14 lb. 
 
 
 164 
Regressão Múltipla 
 
_______________________________________________________________ 
Definição: 
 Uma equação de regressão múltipla expressa um relacionamento linear entre 
uma variável dependente 
y
 e duas ou mais variáveis independentes 
 kxxx ,,, 21 
. 
_______________________________________________________________ 
 
Notação: 
 kk xbxbxbby 22110ˆ : fórmula geral da equação de regressão múltipla 
estimada; 
n
 : tamanho da amostra; 
k
 : número de variáveis independentes; 
yˆ
 : valor predito da variável dependente; 
kxxx ,,, 21 
 : variáveis independentes; 
0
 : intercepto; 
0b
 : estimativa de 
0 ; 
k ,,, 21 
 : coeficientes das variáveis independentes 
kxxx ,,, 21  ; 
kbbb ,,, 21 
 : estimativas de 
k ,,, 21  . 

 : erro 
 
Exemplos: 
 Os dados seguintes se referem ao mercado brasileiro de tratores e 
colheitadeiras. Baseados neles, determine a equação de regressão múltipla da 
produção em função das vendas internas e das exportações. 
 165 
 
Ano 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 
Produção 22,20 22,08 32,18 51,33 28,34 22,19 31,66 33,41 28,22 35,43 
Vendas 
internas 
18,94 16,84 27,41 46,69 22,74 13,97 21,47 24,85 24,70 31,06 
Exportações 4,22 5,82 4,48 5,03 5,26 8,36 10,06 8,86 4,21 5,27 
 
Solução: Saída do Excel 97. (Ferramentas – análise de dados - regressão) 
RESUMO DOS RESULTADOS 
 
Estatística de regressão 
R múltiplo 0,998739179 
R-Quadrado 0,997479948 
R-quadrado 
ajustado 
0,996759933 
Erro padrão 0,498084785 
Observações 10 
 
ANOVA 
 gl SQ MQ F F de significação 
Regressão 2 687,3836208 343,6918104 1385,359963 8,03403E-10 
Resíduo 7 1,736619173 0,248088453 
Total 9 689,12024 
 
 Coeficientes Erro padrão Stat t valor-P 
Interseção -0,899860129 0,811205051 -1,109288124 0,303955593 
Variável X 1 1,002741039 0,019093396 52,51768884 2,378E-10 
Variável X 2 1,083108449 0,082237436 13,17050357 3,39691E-06 
 
 
 
RESULTADOS DE RESÍDUOS 
 
Observação Y previsto Resíduos 
1 22,6627728 -0,462772798 
2 22,28999013 -0,209990135 
3 31,43759759 0,742402407 
4 51,36615447 -0,036154466 
5 27,59962153 0,740378468 
6 22,16321881 0,026781186 
7 31,52506097 0,134939033 
8 33,61459554 -0,204595539 
9 28,4277301 -0,207730097 
10 35,95325806 -0,523258059 
 
 
 166 
Interpretações: 
Na primeira tabela: 
 o valor de R-quadrado igual a 0,997 indica que, na amostra observada, cerca 
de 99,7% da variação da produção pode ser explicada por uma relação linear 
que envolve as vendas internas e as exportações. 
 o valor de R-quadrado ajustado igual a 0,997 é o coeficiente múltiplo de 
determinação, R-quadrado, modificado de modo a levar em conta o número 
de variáveis e o tamanho da amostra.. 
Na segunda tabela, o valor de F de significação = 8,034E-10, extremamente 
pequeno, mostra que no teste de hipótese rejeitamos a hipótese nula, 
0: 100  kH  . 
Na terceira tabela temos as estimativas dos coeficientes do modelo. Neste caso o 
modelo é: 
sExportaçõeVendasy  083,1003,1900,0ˆ