Buscar

apostila Estatística Básica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 75 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 75 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 75 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UNIVERSIDADE FEDERAL DE ALFENAS-UNIFAL
INSTITUTO DE CIÊNCIAS EXATAS-ICEx
NÚCLEO DE ESTATÍSTICA
APOSTILA DE ESTATÍSTICA BÁSICA
Professora: Natália Martins
natalia.martins@unifal-mg.edu.br
Alfenas - 2015
Sumário
1 Estatística Descritiva 5
1.1 Conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Distribuição de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1 Frequência Relativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.2 Frequência Acumulada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.3 Apresentação de Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.4 Construção de uma Distribuição de frequências . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.5 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Representação Grá�ca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.1 Grá�co de Barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.2 Grá�co de setores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.3 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.4 Polígonos de frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.5 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2 Medidas Estatísticas 13
2.1 Medidas de posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.1.1 Média para dados não agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.1.1.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.1.2 Média para dados agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.1.2.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.1.2.2 Características e Importância da Média . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.1.3 Mediana para dados não agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.1.3.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.1.3.2 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.1.4 Mediana para dados agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.4.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.5 Moda para dados não agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.5.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.6 Moda para dados agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.6.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1.7 Exercício . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Medidas de dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.1 Amplitude total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2.2 Variância para dados não agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2.2.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.3 Variância para dados agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.3.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.4 Desvio padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.4.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.5 Coe�ciente de variação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.5.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.6 Exercício . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1
3 Amostragem e Distribuições Amostrais 21
3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1.1 Importância do uso de amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.1.2 Vantagens do processo de amostragem em relação ao censo . . . . . . . . . . . . . . . . . . . 22
3.2 Técnicas de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.2.1 Amostragem Aleatória Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.2.2 Amostragem Sistemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.2.3 Amostragem por Conglomerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2.4 Amostragem Estrati�cada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.3 Distribuição t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.3.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4 Distribuição qui-quadrado (χ2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5 Distribuição F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4 Probabilidade 27
4.1 Conceitos e operações com eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.1.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.2 Probabilidade Condicional e o Teorema do Produto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.2.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.3 Independência de eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.3.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5 Variáveis Aleatórias 33
5.1 Distribuição de Probabilidade para Variáveis Aleatórias Discretas . . . . . . . . . . . . . . . . . . . . 33
5.1.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.1.2 Esperança de variáveis aleatórias discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.1.2.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.1.3 Variância de variáveis aleatórias discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.1.3.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5.2 Distribuição contínua de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5.2.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . 36
5.2.2 Esperança e Variância de variáveis aleatórias contínuas . . . . . . . . . . . . . . . . . . . . . . 36
5.2.3 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
6 Distribuições Discretas de Probabilidade 37
6.1 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
6.1.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
6.1.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
6.1.3 Esperança e Variância da Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . 38
6.1.4 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
6.2 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
6.2.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
6.2.2 Valor esperado e Variância da Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . 40
6.2.3 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
7 Distribuições de Probabilidade Contínuas 41
7.1 Distribuição Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
7.1.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
7.2 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
7.3 Distribuição Normal Padrão de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
7.3.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
7.3.2 Cálculo de probabilidade de qualquer distribuição normal . . . . . . . . . . . . . . . . . . . . 44
7.3.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
8 Teoria da Estimação 47
8.1 Estimativas pontuais e intervalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
8.2 Intervalos de Con�ança para a média (σ2 conhecida) . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
8.2.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
8.3 Intervalos de Con�ança para a média (σ2 desconhecida) . . . . . . . . . . . . . . . . . . . . . . . . . 48
8.3.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
8.4 Intervalos de Con�ança para proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
8.4.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
8.5 Intervalos de Con�ança para a diferença de médias populacionais . . . . . . . . . . . . . . . . . . . . 50
8.5.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
8.6 Intervalos de Con�ança para a variância (σ2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
8.6.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
8.7 Intervalos de Con�ança para o desvio padrão (σ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
8.7.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
9 Testes de Hipóteses 53
9.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
9.2 Erros Tipo I e Tipo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
9.3 Tipos de Testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
9.4 Algoritmo para realização de um teste de hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
9.5 Teste de hipóteses para médias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
9.5.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
9.6 Teste de hipóteses para proporções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
9.6.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
9.7 Teste de hipóteses para diferenças entre duas médias - variâncias iguais . . . . . . . . . . . . . . . . 58
9.7.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
9.8 Teste de hipóteses para variâncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
9.8.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
9.9 Teste de qui-quadrado para aderência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
9.9.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
9.10 Teste de qui-quadrado para independência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
9.10.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
10 Correlação e Regressão Linear Simples 65
10.1 Correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
10.1.1 Grá�co de dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
10.1.2 Coe�ciente de Correlação de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
10.1.2.1 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
10.2 Regressão - Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
10.2.1 Ajuste de uma reta de regressão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
10.2.1.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
10.2.2 Coe�ciente de Determinação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4
Capítulo 1
Estatística Descritiva
1.1 Conceitos básicos
Estatística é um conjunto de métodos para o planejamento de estudos e experimentos, obtenção de dados
e consequente organização, resumo, apresentação, análise, interpretação e elaboração de conclusões baseadas nos
dados.
O objeto da estatística é, em grande parte, o uso de dados amostrais para se fazerem inferências (ou generali-
zações) sobre uma população inteira. Devemos ter claro algumas de�nições básicas e fundamentais:
• Dados são observações coletadas.
• Uma população é a coleção completa de todos os elementos (escores, pessoas, medidas, ...) a serem estudados.
• Uma amostra é um subconjunto de membros selecionados de uma população.
• Um parâmetro é uma medida numérica que descreve alguma característica de uma população.
• Uma estatística é uma medida numérica que descreve alguma característica de uma amostra.
Os dados podem ser qualitativos ou quantitativos.
Dados qualitativos (ou categóricos ou de atributos) podem ser separados em diferentes categorias que se
distinguem por alguma característica não-numérica, por exemplo, sabor.
Dados quantitativos consistem em números que representam contagens ou medidas, por exemplo, peso corporal.
Os dados quantitativos podem, ainda, ser descritos pela distinção entre os tipos discreto e contínuo.
Dados discretos surgem quando o número de valorespossíveis é ou um número �nito ou uma quantidade
"enumerável". Exemplo: números de �lhos.
Dados contínuos resultam de in�nitos valores possíveis que correspondem a alguma escala contínua que cobre
um intervalo de valores sem vazios, interrupções ou saltos. Exemplo: altura.
1.2 Distribuição de Frequências
5
6
Agora somos capazes de diferenciar os vários tipos de dados. Precisamos aprender como identi�car as técnicas
estatísticas mais apropriadas para descrever cada tipo.
Uma tabela talvez seja o meio mais simples de se resumir um conjunto de observações e pode ser usada para todos
os tipos de dados. Uma tabela comumente usada para avaliar dados é chamada de distribuição de frequência.
Para dados qualitativos, essa distribuição consiste em classes ou categorias com as contagens numéricas
referentes a cada conjunto.
Tabela 1.1: Classi�cação de 2560 trabalhadores de uma empresa, segundo a renda mensal
Classe social N
o
de indivíduos
Baixa 1613
Média 701
Alta 246
Total 2560
Para exibir dados quantitativos (discretos ou contínuos) na forma de distribuição de frequência, precisamos
dividir o intervalo de valores das observações em uma série de intervalos não-sobrepostos distintos. Entretanto,
é necessário ter cuidado na construção desses intervalos, pois se houver muitos intervalos, o resumo dos dados
não constituirá grande melhoria com relação aos dados brutos (ou originais). Se houver poucos intervalos, um
grande volume de informações se perderá. Embora não seja necessário, geralmente os intervalos são frequentemente
construídos de modo que todos tenham as larguras iguais, o que irá facilitar as comparações entre as classes.
Uma vez determinado o limite superior e o inferior, o número de observações cujo os valores estejam dentro de
cada par de limites é contado e os resultados são arranjados na forma de tabela.
Tabela 1.2: Número de indivíduos classi�cados segundo o tempo de vida, em dias
Tempo de vida f
58 |- 179 9
180 |- 300 23
301 |- 422 58
Total 90
Dada a tabela não podemos recriar os valores brutos e mesmo perdendo alguma informação, a tabela nos fornece
informações importantes que nos auxiliam a entender a distribuição. Para dados qualitativos também há perda de
informação.
1.2.1 Frequência Relativa
Algumas vezes é útil conhecer a proporção dos valores situados em um determinado intervalo de uma distribuição
em vez do número absoluto. A frequência relativa para um intervalo é a proporção do número total que nele
aparece, dada por:
fr =
fa
n
(1.1)
em que fa é a frequência de classe (também chamada de frequência absoluta) e n a soma de todas as frequências.
7
As frequências relativas são, muitas vezes, expressas como percentuais em que a soma de todos os intervalos
equivale a 100%. São úteis para comparar dois conjuntos de dados que contenham números desiguais de observações.
Tabela 1.3: Frequência relativa do número de indivíduos classi�cados segundo o tempo de vida, em dias
Tempo de vida fa fr fr (%)
58 |- 179 9 0,10 10
180 |- 300 23 0,26 26
301 |- 422 58 0,64 64
Total 90 1,00 100
1.2.2 Frequência Acumulada
A frequência acumulada para uma classe é a soma da frequência absoluta (ou frequência relativa) daquela classe
mais as frequências absolutas (ou frequências relativas) de todas as classes anteriores.
Tabela 1.4: Frequências acumuladas do número de indivíduos classi�cados segundo o tempo de vida, em dias
Tempo de vida fa fr Fac
58 |− 179 9 0,10 9
180 |− 300 23 0,26 32
301 |− 422 58 0,64 90
Total 90 1,00
1.2.3 Apresentação de Tabelas
As tabelas têm título, corpo, cabeçalho e coluna indicadora. O título explica o que a tabela contém e é colocado
acima da tabela. O corpo é formado pelas linhas e colunas de dados. O cabeçalho especi�ca o conteúdo das
colunas e a coluna indicadora especi�ca o conteúdo das linhas.
Toda tabela deve ser delimitada por traços horizontais. Podem ser feitos traços verticais para separar as colunas,
mas não devem ser feitos traços verticais para delimitar a tabela. O cabeçalho é separado do corpo por um traço
horizontal.
As tabelas podem conter fontes, notas e chamadas. A fonte é o indicativo, no rodapé da tabela, da entidade
responsável pela sua organização ou fornecedora dos dados primários. As notas são colocadas no rodapé para
esclarecimento de ordem geral. E as chamadas também colocadas no rodapé, servem para esclarecer minúcias em
relação aos dados. São numeradas geralmente em algarismos arábicos.
1.2.4 Construção de uma Distribuição de frequências
Dado um conjunto de dados de uma variável X: x1, x2, ..., xn, e os mesmos dados ordenados (ROL): x1 = xmin
e xn = xmax.
1. Ordenar os dados:
8
2. Calcula-se a amplitude total (A):
A = xmax − xmin.
3. Calcula-se o número de classes (k):
• n < 100 utiliza a regra da raiz quadrada
k =
√
n
em que n é o no de observações e k é o número de classes.
• n > 100 utiliza a fórmula
k = 1 + 3, 32 log(n)
em que n é o no de observações e log é usado na base 10.
Arredonda-se o valor para o número inteiro mais próximo.
4. Calcula-se a amplitude do intervalo de classes (h): varia de acordo com a variabilidade dos dados e do
número de classes
h =
A
k − 1 .
5. Calcula-se os limites de classes:
O limite inferior da 1
a
classe (LI1) deve ser o menor valor. Os demais limites inferiores são obtidos por:
LIi = LSi−1
O limite superior é obtido por: LSi = LIi + h
6. Calcula-se o ponto médio (PM): é o ponto intermediário do intervalo da classe.
PMi =
LIi + LSi
2
Importante: Todas as observações da classe, referente ao ponto médio, são consideradas como sendo iguais.
1.2.5 Exemplos
1. Segue uma amostra de 25 medições, construa uma tabela de distribuição de frequências com classe, ponto
médio, frequência absoluta, relativa e acumulada.
7 6 6 11 8 9 11 9 10 8 7 7 5
9 10 7 7 7 7 9 12 10 10 8 6
ROL: 5 - 6 - 6 - 6 - 7 - 7 - 7 - 7 - 7 - 7 - 7 - 8 - 8 - 8 - 9 - 9 - 9 - 9 - 10 - 10 - 10 - 10 - 11 - 11 - 12
2. Trinta estudantes foram submetidos a um exame de estatística, obtendo as notas:
84 88 90 78 80 89 94 95 77 81
83 87 91 83 92 90 92 77 86 86
9
99 93 83 94 76 98 70 81 76 87
Construa uma tabela de distribuição de frequências com classe, ponto médio, frequência absoluta, relativa e
acumulada.
ROL: 70 - 76 - 76 - 77 - 77 - 78 - 80 - 81 - 81 - 83 - 83 - 83 - 84 - 86 - 86 - 87 - 87 - 88 - 89 - 90 - 90 - 91 - 92 -
92 - 93 - 94 - 94 - 95 - 98 - 99
1.3 Representação Grá�ca
Os grá�cos são utilizados para possibilitar uma visualização global dos resultados. Frequentemente mostram
padrões ou observações interessantes, difíceis de serem observadas de outra forma. O título é colocado abaixo
do grá�co. As escalas crescem da esquerda para a direita e de baixo para cima (eixo cartesiano). A legenda é
colocada, de preferência, à direita do grá�co.
1.3.1 Grá�co de Barras
É usado para apresentar variáveis qualitativas ou ordinais. Para traçá-lo, primeiro se traça o sistema de eixos
cartesianos. Depois colocam-se, no eixo das abscissas (ou das ordenadas) as categorias da variável em estudo. Em
seguida, constroem-se barras retangulares com base no eixo das abscissas (ou ordenadas) e altura (ou comprimento)
igual à frequência (Figura 1.1).
Figura 1.1: Relação trabalho e curso dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM
1.3.2 Grá�co de setores
Usados para retratar dados qualitativos como setores de um círculo (Figura 1.2). Envolve a divisão do círculo
nas proporções apropriadas. Sabe-se que o setor de circunferência formado por um ângulo de 360◦ equivale a 100%
da área da circunferência, aplica-se então uma regra de três simples:{
360o −→ 100%
Xo −→ fr%
10
Figura 1.2: Município de procedência dos alunos da disciplina Inferência Estatística docurso de Estatística da UEM
1.3.3 Histograma
Os histogramas são constituídos por um conjunto de retângulos, com as bases assentadas sobre um eixo hori-
zontal, tendo o centro da mesma no ponto médio da classe que representa, e cuja altura é proporcional à frequência
da classe. Se as amplitudes de classe forem todas iguais, as alturas serão numericamente iguais as frequências das
classes. Porém, se os intervalos de classe não tiverem todos a mesma amplitude, as alturas dos retângulos deverão
ser convenientemente ajustadas, a �m de que as áreas dos mesmos sejam proporcionais às frequências das classes
(Figura 1.3).
Figura 1.3: Idade dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM
1.3.4 Polígonos de frequências
É um grá�co de análise no qual as frequências das classes são localizadas sobre perpendiculares levantadas nos
pontos médios (PM) das classes. E pode ser obtido pela simples união dos PM dos topos dos retângulos de um
histograma. Completa-se o polígono unindo-se as extremidades da linha que une os pontos representativos das
frequências de classe ao PM da classe imediatamente anterior e posterior as classes extremas, que tem frequência
nula (Figura 1.4).
11
Figura 1.4: Idade dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM
Ao comparar histogramas ou polígonos de frequências, deve-se observar características como a posição no eixo
horizontal, a dispersão e a assimetria. Dizemos que uma distribuição é simétrica quando um lado da distribuição
é o re�exo do outro lado.
1.3.5 Exemplos
3. Esboce um histograma de frequências para as tabelas obtidas nos exemplos 1 e 2. No mesmo grá�co, trace o
polígono de frequências.
12
Capítulo 2
Medidas Estatísticas
2.1 Medidas de posição
As medidas de posição ou tendência central sintetizam os resultados contidos nos dados observados, pois repre-
sentam um valor central, em torno do qual os dados se concentram. As medidas mais usadas são: média, mediana
e moda.
2.1.1 Média para dados não agrupados
É a medida mais usada por ser a mais comum e compreensível delas, bem como pela relativa simplicidade do
seu cálculo, além de prestar-se bem ao tratamento algébrico.
A média aritmética ou simplesmente média de n dados (X1, X2, ..., Xn) é, por de�nição:
X =
∑n
i=1Xi
n
.
2.1.1.1 Exemplo
1. A média semestral de 6 alunos do curso com notas �nais: 60,5 - 72 - 98 - 83 - 88 - 79 é:
X =
∑6
i=1Xi
6
=
60, 5 + 72 + 98 + 83 + 88 + 79
6
= 80, 08
2.1.2 Média para dados agrupados
Se os dados estiverem agrupados na forma de uma distribuição de frequência, os pesos são substituídos pelas
frequências das classes:
X =
∑n
i=1 fiPMi
n
em que fi é a frequência da i-ésima classe;
n é o número de observações (igual a
∑
fi); e
PMi é o ponto médio (PM) da classe i.
13
14
2.1.2.1 Exemplo
2. A média dos indivíduos classi�cados segundo o tempo de vida, em dias é calculada por (ver tabela 2.1):
Tabela 2.1: Cálculos auxiliares para obtenção da média dos indivíduos
Tempo de vida f PM f · PM
58 - 179 9 118,5 1066,5
180 - 300 23 240 5520
301 - 422 58 361,5 20967
Total 90 27553,5
X é o ponto médio da classe.
X =
∑90
i=1 fiPMi
n
=
27553, 5
90
' 306 dias
2.1.2.2 Características e Importância da Média
1. É muito in�uenciada pelos valores extremos da distribuição; (Desvantagem)
2. Localiza-se, em geral, na classe de maior frequência;
3. Na sua determinação são considerados todos os dados da distribuição;
4. É única para um conjunto de dados.
2.1.3 Mediana para dados não agrupados
Para um conjunto de dados ordenados (Rol), a mediana é o valor que é precedido e seguido pelo mesmo número
de dados (observações). Isto é 50% dos dados são superiores à mediana e 50% são inferiores. Cálculo da mediana:
• Quando o número de dados (n) for ímpar:
Md = X(n+12 )
2.1.3.1 Exemplo
3. 2, 5, 8 com n = 3 ⇒ X( 3+12 ) = X2 = 5
• Quando o número de dados for par:
Md =
X(n2 ) +X(n+22 )
2
2.1.3.2 Exemplo
4. 1, 3, 7, 9 com n = 4 ⇒ Md =
X( 42 ) +X( 4+22 )
2
=
3 + 7
2
= 5
15
2.1.4 Mediana para dados agrupados
A classe mediana é obtida pelo processo descrito acima, dependendo se o n for par ou ímpar. Para identi�car a
qual classe pertence o número que ocupará a posição central, basta veri�car na coluna da frequência acumulada.
Md = LI +
( n
2 − Fa
fMd
)
h
em que LI é o limite inferior da classe mediana;
Fa é a frequência acumulada das classes anteriores a classe mediana;
fMd é a frequência da classe mediana; e
h é a amplitude da classe mediana.
2.1.4.1 Exemplo
5. Observe a tabela 1.4, a classe mediana é a terceira classe, pois o número de dados é par, portanto a mediana se
localiza entre a posição 45 e 46, sendo estas posições alocadas na terceira classe. Assim tem-se:
Md = LI +
( n
2 − Fa
fMd
)
h = 301 +
( 90
2 − 32
58
)
121 ' 328 dias
2.1.5 Moda para dados não agrupados
É o valor que ocorre com maior frequência, isto é, o valor mais comum. Pode não ser única, bem como pode
não existir.
2.1.5.1 Exemplo
6. 2, 3, 4, 5, 7, 7, 7, 8, 9 ⇒ Mo=7.
2.1.6 Moda para dados agrupados
Numa tabela de distribuição de frequências a moda localiza-se na classe de maior frequência (f) e pode ser
obtida pela fórmula que segue
Mo = LI +
(
∆1
∆1 +∆2
)
h
em que LI é o limite inferior da classe modal;
∆1 = (fMo − fant) é a diferença entre a frequência da classe modal e a classe imediatamente anterior;
∆2 = (fMo − fpost) é a diferença entre a frequência da classe modal e a classe imediatamente posterior; e
h é a amplitude da classe.
16
2.1.6.1 Exemplo
7. Observe a tabela 1.4, a classe modal é a terceira classe pois é a que tem maior frequência absoluta, assim tem-se:
Mo = LI +
∆1
∆1 +∆2
h = 301 +
(58− 23)
(58− 23) + (58− 0)121 = 346 dias
2.1.7 Exercício
1. Encontre a média, mediana e a moda para o peso de mexilhões da localidade de Sambaqui dada na tabela abaixo.
Tabela 2.2: Distribuição de frequências para o peso de mexilhões da localidade de Sambaqui
Peso f
8 |- 14 9
14 |- 20 12
20 |- 26 8
26 |- 32 4
32 |- 38 2
Total 35
2.2 Medidas de dispersão
Quando apresentamos uma medida de tendência central para representar um conjunto de dados, é necessário
que esta medida seja acompanhada de uma outra que resuma a variabilidade (dispersão) dos dados. Observe os
conjuntos a seguir:
A = 10, 10, 10, 10, 10, 10, 10
B = 1, 8, 10, 10, 11, 12, 18
C = 1, 2, 10, 10, 10, 13, 24
Os três conjuntos tem n = 7, calculando a média, mediana e moda temos:
XA = XB = XC = 10 unidades
MdA = MdB = MdC = 10 unidades
MoA = MoB = MoC = 10 unidades
Assim, veri�ca-se que os três conjuntos apresentam média, mediana e moda iguais a 10 unidades, porém
observando-os, percebe-se que eles são bem diferentes entre si, pois enquanto no conjunto A os dados são to-
dos iguais, os demais apresentam uma certa variação, sendo que esta variação é maior no conjunto C. Deste modo,
para sintetizarmos e�cientemente a informação de um conjunto de dados, temos que associar à medida de posição
utilizada, uma medida de dispersão, que vai informar como estes dados se comportam em torno da medida de
posição em questão.
Uma medida de dispersão quanti�ca a magnitude da variabilidade dos dados. Para os métodos estatísticos, a
medida de dispersão é de fundamental importância, pois a estatística só existe porque os fenômenos têm variabili-
dade.
17
2.2.1 Amplitude total
É a diferença entre o maior e o menor valor observado:
A = Xmax −Xmin.
Para os conjuntos tem-se: AA = 10− 10 = 0, AB = 18− 1 = 17 e AC = 24− 1 = 23.
Nota-se, então, que a amplitude do conjunto C é bem maior que nos demais. A amplitude é uma medida de
dispersão fácilde ser calculada, e é certamente a maneira mais natural e comumente utilizada para descrever a
variabilidade de um conjunto de dados. Porém, sua interpretação depende do número de observações, mas no seu
cálculo não são consideradas todas as observações, pois só utiliza os valores extremos.
2.2.2 Variância para dados não agrupados
Vimos que a média dos conjuntos A, B e C são iguais, mas apesar disso os valores do conjunto C estão bem
espalhados (dispersos) do que outros conjuntos. Dizemos que a variabilidade em C é maior do que em A e B,
�cando claro o uso de duas medidas para descrever razoavelmente bem um conjunto de dados: uma de posição e
outra de dispersão.
Para o cálculo da variância, o princípio básico é analisar os desvios das observações em relação à média. Em
cada caso, o valor zero para a variância indica ausência de variação e o valor da medida de dispersão vai aumentando
à medida que aumenta a variação.
A variância populacional, representada por σ2 (lê-se: sigma ao quadrado), é calculada através da expressão:
σ2 =
1
N
N∑
i=1
(Xi − µ)2,
em que µ é a média populacional e N é o tamanho da população. Observe que a variância populacional é a média
dos desvios de cada valor da população em relação a média populacional, ao quadrado.
Quando os dados são oriundos de uma amostra, deve-se utilizar a variância da amostra, usualmente representada
por s2 e calculada por:
s2 =
1
n− 1
n∑
i=1
(Xi −X)2
A variância da amostra é uma média dos desvios de cada valor da amostra em relação à média da amostra, ao
quadrado, com denominador igual a n− 1 (chamado de graus de liberdade) e não n.
Pode-se utilizar também, as fórmulas das variâncias populacional e amostral da seguinte forma:
σ2 =
1
N
[
n∑
i=1
X2i −
(
∑n
i=1Xi)
2
N
]
e s2 =
1
n− 1
[
n∑
i=1
X2i −
(
∑n
i=1Xi)
2
n
]
18
2.2.2.1 Exemplo
8. Para os conjuntos têm-se:
s2A =
(10− 10)2 + · · ·+ (10− 10)2
6
= 0 unidades2;
s2B =
(1− 10)2 + · · ·+ (18− 10)2
6
= 25, 7 unidades2 e
s2C =
(1− 10)2 + · · ·+ (24− 10)2
6
= 58, 3 unidades2.
2.2.3 Variância para dados agrupados
Quando os dados estão dispostos numa tabela de distribuição de frequências, o cálculo da variância é feito
através da fórmula:
População⇒ σ2 = 1
N
N∑
i=1
fi(PMi − µ)2 ou σ2 = 1
N
[
N∑
i=1
fiPM
2
i −
(
∑N
i=1 fiPMi)
2
N
];
Amostra⇒ s2 = 1
n− 1
n∑
i=1
fi(PMi −X)2 ou s2 = 1
n− 1 [
n∑
i=1
fiPM
2
i −
(
∑n
i=1 fiPMi)
2
n
].
2.2.3.1 Exemplo
9. O cálculo da variância para o número de indivíduos classi�cados segundo o tempo de vida, em dias, é obtido
por:
s2 =
1
n− 1
[
n∑
i=1
fiX
2
i −
(
∑n
i=1 fiXi)
2
n
]
=
1
89
[
9030750, 75− (27553, 5)
2
90
]
' 6688 dias.
Tabela 2.3: Cálculos auxiliares para obtenção da variância dos indivíduos
Tempo de vida f PM f · PM (PM)2 f · (PM)2
58 - 179 9 118,5 1066,5 14042,25 126380,25
180 - 300 23 240 5520 57600 1324800
301 - 422 58 361,5 20967 130682,25 7579570,5
Total 90 27553,5 9030750,75
2.2.4 Desvio padrão
Um inconveniente da variância é que ela é expressa em unidades ao quadrado, ou seja, caso esteja trabalhando
com o peso corporal de indivíduos, tomados em kg, a variância destes pesos é expressa em kg2, o que causa algumas
di�culdades de interpretação. No intuito de resolver este problema, trabalha-se com o desvio padrão que é de�nido
como a raiz quadrada positiva da variância, o qual é expresso na mesma unidade em que os dados foram coletados.
19
σ =
√
σ2; s =
√
s2.
2.2.4.1 Exemplos
10. Para os conjuntos A, B e C, tem-se: sA =
√
0 = 0 unidades, sB =
√
22 = 5, 1 unidades e sC =
√
50 =
7, 6 unidades.
11. No exemplo de dados agrupados, tem-se: s =
√
6688 ' 82 dias.
2.2.5 Coe�ciente de variação
A variância e o desvio padrão só podem ser utilizadas para comparar a variabilidade de dois ou mais conjuntos de
dados quando estes apresentarem a mesma média, mesmo número de observações e estiverem expressos nas mesmas
unidades. Então, para comparar qualquer conjunto de dados quanto à sua variabilidade, utiliza-se o coe�ciente
de variação (CV), que expressa a variabilidade dos dados em torno da média, dado por:
CV =
σ
µ
100%; CV =
s
X
100%
2.2.5.1 Exemplos
12. Para os conjuntos tem-se: CVA =
0
10
100 = 0%, CVB =
5, 1
10
100 = 51%, CVC =
7, 6
10
100 = 76%.
13. No exemplo de dados agrupados, tem-se: CV =
82
306
100 ' 27%.
2.2.6 Exercício
2. Encontre a variância, o desvio padrão e o coe�ciente de variação para o peso de mexilhões da localidade de
Sambaqui dada na tabela 2.2.
20
Capítulo 3
Amostragem e Distribuições Amostrais
3.1 Introdução
i) População: conjunto de indivíduos com pelo menos uma característica observável em comum.
ii) Amostra: porção ou fração da população, retirada segundo algumas técnicas especí�cas, que mantém as mesmas
características de interesse da população.
iii) Parâmetro: é uma medida associada à uma característica populacional. Ex: média (µ), variância (σ2), etc.
iv) Estatística: é uma medida associada à uma característica amostral. Ex: média (X), variância (s2).
Um dos principais problemas apresentados na estatística é o de fazer a�rmações sobre os parâmetros popula-
cionais (geralmente desconhecidos), como por exemplo, saber qual o tempo necessário para o organismo humano
degradar certo composto químico. E para responder a estas questões, lança-se mão do processo de amostragem,
que consiste em estudar apenas uma fração da população (a amostra) e a partir desta fazer inferências sobre a
população. Esquematicamente tem-se:
Figura 3.1: Representação esquemática do processo de amostragem e inferência
Para que o processo anteriormente descrito seja con�ável, é necessário que a amostra utilizada seja representativa
da população, e para isso, ela deve ser retirada segundo determinadas técnicas de amostragem. De posse de uma
amostra, representativa da população, para fazermos a inferência sobre os parâmetros populacionais, a partir desta
21
22
amostra, é necessário o conhecimento das relações existentes entre as estimativas obtidas e os valores dos parâmetros
populacionais, ou seja, é necessário conhecer a distribuição amostral do estimador utilizado, para que se possa fazer
uma inferência segura sobre um parâmetro qualquer.
3.1.1 Importância do uso de amostras
i) Conveniente no estudo de populações grandes.
ii) Indispensável no estudo de populações in�nitas.
iii) Indispensável em estudos nos quais a coleta de dados implica na destruição do material utilizado.
3.1.2 Vantagens do processo de amostragem em relação ao censo
i) Custo reduzido.
ii) Maior rapidez.
iii) Maior amplitude e �exibilidade.
iv) Maior exatidão.
3.2 Técnicas de amostragem
Ao coletarmos uma amostra podemos fazê-la com reposição ou sem reposição. Caso a amostragem seja realizada
com reposição, um mesmo indivíduo tem chance de pertencer mais de uma vez a amostra, o que não acontece,
no caso da amostragem sem reposição. Independentemente da maneira como a amostra é coletada (com ou sem
reposição), o importante é que os indivíduos que comporão a amostra deverão ser selecionados através de um
processo aleatório qualquer (sorteio), pois, somente nestas condições podemos aplicar os modelos probabilísticos da
estatística a esta amostra, o que vai garantir a validade dos testes estatísticos que serão realizados com base nos
resultados destas amostras. Os principais tipos de amostragem são:
3.2.1 Amostragem Aleatória Simples
Esta técnica só pode ser aplicada em populações homogêneas e de tamanho conhecido. Técnica: Enumera-se
todos os indivíduos da população e sorteia-se (por meio de um dispositivo aleatório qualquer), os indivíduosque
comporão a amostra. Neste tipo de amostragem podem ser retiradas Nn amostras diferentes com reposição ou
C(N,n) amostra diferentes sem reposição.
3.2.2 Amostragem Sistemática
23
É uma simpli�cação do processo anterior. Neste caso, apenas o primeiro elemento da amostra será sorteado, e
os demais serão retirados em uma progressão aritmética, com razão k, em que:
k =
N
n
com N = tamanho da amostra da população e n = tamanho da amostra até se completar o tamanho da amostra
desejado.
3.2.3 Amostragem por Conglomerados
Os elementos da população são divididos primeiramente em grupos distintos denominados conglomerados.
Cada elemento da população pertence a um e somente a um conglomerado. Extrai-se, então, uma amostra aleatória
simples dos conglomerados. Todos os elementos contidos em cada conglomerado amostrado formam a amostra. Uma
das principais aplicações da amostragem por conglomerados é a amostragem por áreas, em que os conglomerados
são quarteirões de uma cidade ou outras áreas bem de�nidas.
3.2.4 Amostragem Estrati�cada
É uma técnica utilizada quando a população a ser estudada é heterogênea, deste modo, subdivide-se a população
em estratos (sub-populações) que sejam homogêneas dentro de si, e heterogêneas entre si. Posteriormente, aplica-se
uma das técnicas de amostragens anteriormente descritas para retirar sub-amostras dentro de cada estrato, de modo
que a amostra �nal seja representativa da população como um todo (contenha indivíduos de todos os estratos).
3.3 Distribuição t de Student
Trata-se de um modelo de distribuição contínua que se assemelha à distribuição normal padrão, N(0, 1). É
utilizada para inferências estatísticas, particularmente, quando se tem amostras com tamanhos inferiores a 30
elementos, ou seja, n < 30.
A distribuição t também possui um parâmetro denominado grau de liberdade (gl) que é calculado por ϕ = n−1
em que n é o tamanho da amostra. A distribuição t é simétrica em relação à sua média.
A tabela t está tabelada de forma bicaudal. Assim:
24
3.3.1 Exemplos
1. Admita uma amostra com n = 10, o grau de liberdade será 9, ou seja, ϕ = n− 1 = 9 e α = 5%.
Na 1
a
coluna da com ϕ = 9 e na 1a linha com α = 0, 025 pois é α/2 = 0, 05/2 = 0, 025, encontra-se na
intersecção dessa linha e coluna o número 2,6850.
2. Sendo uma amostra de n = 26, ϕ = n− 1 = 25 α = 10%. Tem-se:
Na 1
a
coluna da com ϕ = 25 e na 1a linha com α = 0, 05, encontra-se na intersecção dessa linha e coluna o
número 2,0525.
3.4 Distribuição qui-quadrado (χ2)
Trata-se de um modelo de distribuição contínua muito importante para a teoria da inferência estatística.
Seja x1, x2, . . . , xp, p variáveis aleatórias independentes, normalmente distribuídas, com média zero e variância
um. De�ne-se variável aleatória com distribuição qui-quadrado, como:
χ2p = x
2
1 + x
2
2 + . . .+ x
2
p
em que p é um parâmetro da função densidade denominado grau de liberdade. Normalmente utiliza-se a letra grega
ϕ (lê-se �) para se indicar o grau de liberdade. Lembrando que ϕ = n− 1.
Conforme o número de graus de liberdade (valor do parâmetro), a curva que descreve a função densidade tem
determinada forma. A distribuição qui-quadrado está tabelada da cauda à direita.
3.4.1 Exemplos
3. Admita parâmetro 9, ou seja, ϕ = 9 e α = 5%.
Na 1
a
coluna da com ϕ = 9 e na 1a linha com α = 0, 05, encontra-se na intersecção dessa linha e coluna o
número 16,9.
4. Sendo ϕ = 25, α = 5% e uma distribuição bilateral, o valor da abscissa à direita, chamado qui-quadrado superior,
é obtido na tabela entrando-se na 1
a
coluna com 25 e 1
a
linha com α = 0, 025. Assim: χ2sup = 40, 6.
Para o cálculo do valor da abscissa à esquerda, chamado qui-quadrado inferior, é obtido na tabela entrando-se
na 1
a
coluna com 25 e 1
a
linha com α = 0, 975. Assim: χ2inf = 13, 1.
3.5 Distribuição F
25
Trata-se de um modelo de distribuição contínua também útil para inferências estatísticas.
A distribuição F é a razão entre duas variáveis aleatórias independentes com distribuições qui-quadrado. Assim,
uma distribuição F com “p” graus de liberdade no numerador e “q” graus de liberdade no denominador é expressa
por:
F (p, q) =
χ2p
p
χ2q
q
=
χ2p
χ2q
· q
p
A distribuição F possui dois parâmetros: graus de liberdade do numerador e graus de liberdade do denominador,
que são denominados, comumente, por ϕ1 e ϕ2, respectivamente.
A distribuição F é tabelada de forma que as abscissas deixam 5% na cauda à direita, dados os parâmetros ϕ1 e
ϕ2.
Existem tabelas que expressam abscissas para outros níveis de probabilidade na cauda à direita.
Para se encontrar o valor da abscissa inferior F1−α(ϕ1, ϕ2), quando se tem um teste bicaudal, utiliza-se a seguinte
fórmula:
F1−α(ϕ1, ϕ2) =
1
Fα(ϕ2, ϕ1)
Resumindo para um teste F (unicaudal ou bicaudal), tem-se:
Fsup = F (ϕ1, ϕ2) e Finf =
1
F(ϕ2,ϕ1)
3.5.1 Exemplos
5. Sendo ϕ1 = 9, ϕ2 = 5 e α = 0, 05, para uma distribuição F unilateral tem-se que F(9,5) = 4, 77.
6. Sendo ϕ1 = 9, ϕ2 = 5 e α = 0, 05, para uma distribuição F bilateral tem-se: o valor da abscissa superior é
F(sup) = 4, 77 e o valor da abscissa inferior é F(inf) =
1
F(5,9)
=
1
3, 48
= 0, 29.
26
Capítulo 4
Probabilidade
4.1 Conceitos e operações com eventos
Um experimento é todo fenômeno ou ação que geralmente pode ser repetido e cujo resultado é casual ou
aleatório. Por exemplo: o lançamento de um dado.
Um espaço amostral Ω (lê-se ômega) é o conjunto de todos os resultados possíveis de um experimento.
Um evento é todo subconjunto do espaço amostral. É denotado por letras maiúsculas do alfabeto.
Para exempli�car: o espaço amostral no lançamento de duas moedas é Ω = {KK,KC,CK,CC} e o evento pelo
menos uma cara é dado por A = {KK,KC,CK}.
As probabilidades são utilizadas para exprimir a chance de ocorrência de determinado evento.
De�nição Clássica da Probabilidade (Requer resultados igualmente prováveis):
Dado um conjunto de N eventos equiprováveis, a probabilidade de ocorrência de um determinado evento A é
P (A) =
n
o
de maneiras em que A pode ocorrer
n
o
total de observações
=
n
N
De�nição: Dado um experimento aleatório, a ocorrência simultânea dos eventos A e B de seu espaço amostral,
é chamada evento intersecção representada por A ∩B.
De�nição: Dado um experimento aleatório e dois eventos A e B de seu espaço amostral, a ocorrência de A, de
B ou de ambos, é chamada evento união representada por A ∪B.
De�nição: Os eventos são mutuamente exclusivos ou disjuntos se não tem elemento comum, ou se não
podem ocorrer simultaneamente (ou seja, P (A ∩B) = 0).
De�nição: O complemento de um evento A ou evento complementar de A, denotado AC , consiste de
todos os outros resultados no espaço amostral, ou seja, os elementos que pertencem a Ω e que não pertencem a A.
AXIOMA: Seja Ω um espaço amostral e seja A qualquer evento em Ω, isto é, A é um subconjunto de Ω. Então,
por de�nição, a probabilidade de ocorrer A é dada pela medida de A, nas seguintes condições:
1. P (Ω) = 1;
27
28
2. P (A) ≥ 0;
3. Se A e B são dois eventos disjuntos então P (A ∪B) = P (A) + P (B).
Daí, segue-se que 0 ≤ P (A) ≤ 1.
Teorema: Seja Ω o espaço amostral. Então, a probabilidade de que A não ocorra é dada por
P (Ac) = 1− P (A).
Teorema da Soma: Se A e B são dois eventos do espaço amostral Ω, então a probabilidade de que ocorra A
ou B é:
P (A ∪B) = P (A) + P (B)− P (A ∩B).
Corolário: Se A e B são disjuntos, isto é, P (A ∩B) = 0, então P (A ∪B) = P (A) + P (B).
4.1.1 Exemplos
1. Ao retirar uma carta de um baralho, os eventos às (A) e rei (K) são disjuntos. Qual a probabilidade de tirar um
às ou um rei numa única tentativa?
P (A ∪K) = P (A) + P (K) = 4
52
+
4
52
=
8
52' 0, 15
2. Qual a probabilidade de retirar um às (A) ou uma espada (E) em uma só tentativa?
P (A ∪ E) = P (A) + P (E)− P (A ∩ E) = 4
52
+
13
52
− 1
52
=
16
52
' 0, 31
3. Seja o lançamento de um dado: A: sair resultado par ⇒ A = {2, 4, 6}; Ac: sair resultado ímpar ⇒ A = {1, 3, 5};
B: sair resultado inferior a 3 ⇒ B = {1, 2}.
Calcule P (A), P (Ac), P (B) e P (A ∪B).
P (A) =
1
6
+
1
6
+
1
6
=
1
2
P (Ac) = 1− P (A) = 1− 1
2
=
1
2
P (B) =
1
6
+
1
6
=
1
3
P (A ∪B) = P (A) + P (B)− P (A ∩B) = 3
6
+
2
6
− 1
6
=
2
3
4.2 Probabilidade Condicional e o Teorema do Produto
Suponhamos que no lançamento de um dado são de�nidos os seguintes eventos:
A: sair resultado par ⇒ A = {2, 4, 6}
B: sair resultado inferior a 3 ⇒ B = {1, 2}
Segue-se, daí, que A ∩B = {2}. Já vimos que P (A) = 1/2 e P (A ∩B) = 1/6.
Consideremos agora a seguinte situação: um dado foi lançado, fora do alcance de nossas vistas, e fomos infor-
mados de que saiu resultado par, ou seja, de que ocorreu A. Nestas condições, pergunta-se: qual a probabilidade
de que tenha ocorrido o evento B?
29
Temos que introduzir a idéia de probabilidade condicional para resolver o problema.
Fomos informados de que A ocorreu, logo o espaço amostral Ω = {1, 2, 3, 4, 5, 6} passou a ser A (Ω1 = {2, 4, 6}).
Devemos obter a probabilidade de ocorrer B, sob a condição de que A tenha ocorrido ou, o que é o mesmo, obter a
probabilidade de B dado A, que indicamos por P (B|A) (OBS: o símbolo | não indica fração).
O novo espaço amostral A é constituído por três eventos equiprováveis (mesma probabilidade) e nos interessa
A ∩B = {2}. Então, P (B|A) = 1
3
.
Se dividirmos o numerador e denominador por 6, que é o número total de eventos do espaço amostral Ω, temos:
P (B|A) = 1
3
=
1
6
3
6
=
P (A ∩B)
P (A)
.
De�nição (Probabilidade Condicional): Dados dois eventos A e B, no espaço amostral Ω, se P (A) > 0 e
P (B) > 0, a probabilidade de B, dado A, é
P (B|A) = P (A ∩B)
P (A)
e a probabilidade de A, dado B, é
P (A|B) = P (A ∩B)
P (B)
.
Teorema do Produto: Se A e B são dois eventos do espaço amostral Ω, a probabilidade da ocorrência
simultânea de A e B é dada por:
P (A ∩B) = P (A)P (B|A) = P (B)P (A|B). (4.1)
4.2.1 Exemplo
4. Numa população composta por 200 animais de duas raças X e Y, os animais podem ser fecundos e não fecundos.
20% dos animais da raça X são fecundos, 30% dos animais da raça Y são não fecundos e 75% dos animais são
da raça X. Considere os eventos: X = {o animal é da raça X}; Y = {o animal é da raça Y};
A = {o animal é fecundo}; B = {o animal não é fecundo}.
Calcule a P (M |A) e P (B|M).
Fecundidade
Raça Não fecundo (B) Fecundo (A) TOTAL
X 120 30 150
Y 15 35 50
TOTAL 135 65 200
SOLUÇÃO:
P (Y |A) = P (Y ∩A)
P (A)
=
35/200
65/200
=
35
65
= 0, 5384.
P (B|Y ) = P (B ∩ Y )
P (Y )
=
15/200
50/200
=
15
50
= 0, 30.
30
4.3 Independência de eventos
Um resultado importante que pode ser obtido da expressão 4.1, ocorre quando dois eventos A e B são indepen-
dentes.
De�nição: Dois eventos são independentes quando a ocorrência ou não-ocorrência de um evento não tem
efeito algum na probabilidade de ocorrência do outro evento. Caso contrário, são dependentes. Exemplo: Se
lançarmos duas moedas simultaneamente, a face de uma moeda não interfere na face da outra moeda.
Se A é um evento independente de B, então P (A|B) = P (A) 6= 0 implica P (B|A) = P (B) (B também é
independente de A).
De�nição (Independência de eventos): Se A e B são eventos independentes, temos que:
P (A ∩B) = P (A)P (B).
4.3.1 Exemplos
5. No lançamento de duas moedas honestas, qual a probabilidade de que as duas faces sejam cara?
P (K ∩K) = 1/2 · 1/2 = 1/4
6. Seja os eventos no lançamento de um dado: A = {3, 4, 6} e B = {2, 4, 6}. Qual a probabilidade de sair o evento
A dado que o resultado é par?
P (A|B) = P (A ∩B)
P (B)
=
2/6
3/6
= 2/3
7. Duas moedas são jogadas simultaneamente. Veri�que se os eventos cara na 1
a
moeda e cara na 2
a
moeda são
independentes. (K = cara, C = coroa)
Ω = {KK,KC,CK,CC} A = {KK,KC} B = {KK,CK}
P (A) = 1/4 + 1/4 = 2/4 = 1/2 P (B) = 1/2 ⇒ P (A ∩B) = 1/4
P (A ∩B) = P (A)P (B) = 1/2 · 1/2 = 1/4.
Portanto, A e B são independentes.
8. Em um baralho, veri�que se os eventos retirar um às (A) e retirar uma carta de ouro (O) são independentes.
P (A) = 4/52 P (O) = 13/52 P (A ∩O) = 1/52
P (A ∩O) = P (A)P (O) = 4/52 · 13/52 = 1/52.
Portanto, A e O são independentes.
9. Uma amostra aleatória de 200 adultos é classi�cada pelo seu sexo e nível de instrução. Se uma pessoa desse
grupo for escolhida aleatoriamente, determine a probabilidade de que:
a) P (M e S) = P (M ∩ S) = 28/200 = 0, 14
b) P (F ou U) = P (F ∪ U) = P (F ) + P (U)− P (F ∩ U) = 112/200 + 39/200− 17/200 = 134/200 = 0, 67
31
Nível de Sexo
instrução Masculino (M) Feminino (F) TOTAL
Elementar (E) 38 45 83
Secundário (S) 28 50 78
Universitário (U) 22 17 39
TOTAL 88 112 200
c)P (E|F ) = P (E∩F )P (F ) = 45/200112/200 ' 0, 40
d) o nível de instrução e o sexo são independentes? Comprove calculando a intersecção entre sexo masculino
e nível secundário.
P (M) = 88/200 = 0, 44 P (S) = 78/200 = 0, 39 P (M ∩ S) = 28/200 = 0, 14
P (M ∩ S) = P (M)P (S) = 0, 44(0, 39) ' 0, 17 6= 0, 14
Portanto, o nível de instrução e o sexo não são independentes.
32
Capítulo 5
Variáveis Aleatórias
Em muitas situações o nosso interesse está mais relacionado com quantidades associadas aos possíveis resultados
do que neles individualmente. Por exemplo, em um experimento de germinação de sementes, o interesse não está
relacionado simplesmente com a germinação de cada semente mas, no número total de sementes que germinaram.
Essas quantidades associadas aos possíveis resultados de um experimento aleatório são denominados de variáveis
aleatórias (v. a.).
Quando se atribuem valores de probabilidade a todos os possíveis valores de uma variável aleatória (v.a.) X,
tanto por uma listagem como por uma função matemática, o resultado é uma distribuição de probabilidade. A
soma das probabilidades de todos os resultados possíveis deve ser igual a 1. Os valores individuais de probabilidade
podem ser designados por f(x), que enfatiza a existência de uma função matemática e por P (X = x), que enfatiza
que a v. a. pode assumir diversos valores, ou simplesmente por P (X).
Assim, uma variável aleatória é uma descrição numérica do resultado de um experimento. Exemplo: o
número de fregueses que entram numa loja em um intervalo de tempo de 20 minutos, altura dos estudantes de uma
sala de aula, etc. As variáveis aleatórias podem ser discretas ou contínuas.
Uma v.a. é discreta se toma valores que podem ser contados. Exemplo: número de acidentes numa semana,
números de defeitos em sapatos, número de terremotos, etc.
Uma v.a. é contínua quando pode tomar qualquer valor de determinado intervalo. Uma v.a. contínua tem
um número in�nito de valores possíveis. Exemplo: peso corporal, duração de uma conversa telefônica, alturas de
pinheiros, etc.
5.1 Distribuição de Probabilidade para Variáveis Aleatórias Discretas
Damos o nome de distribuição de probabilidade da variável aleatória discreta X, ao conjunto de pontos
[Xi; P (Xi)], em que Xi representa os diferentes valores da variável aleatória e P (Xi), a probabilidade de ocorrência
de Xi satisfazendo:
P (Xi) ≥ 0 e
∑
i
P (Xi) = 1.
Obs: Pode-se suprimir o índice “i”, ou seja, X ao invés de Xi e P(X) ao invés de P (Xi).
33
34
5.1.1 Exemplo
1. Um agricultor produz pepinos para conserva. Seja a distribuição de probabilidade da produção de pepinos em
conserva:
Tabela 5.1: Distribuição de probabilidade da produção de pepinosem conserva
X P(X)
-50 0,10
390 0,10
500 0,20
600 0,60
Total 1,00
5.1.2 Esperança de variáveis aleatórias discretas
É frequentemente útil descrever uma distribuição de probabilidade em termos de sua média e de sua variância.
A média é chamada valor esperado ou esperança da distribuição de probabilidade. O valor esperado de uma
v.a. X, denotado por E(X), é a média ponderada de todos os possíveis valores da variável com os respectivos valores
de probabilidade tomados como peso. Assim:
E(X) =
n∑
i=1
XiP (Xi).
5.1.2.1 Exemplo
2. A esperança para a produção de pepinos em conserva no exemplo anterior é:
SOLUÇÃO:
E(X) =
4∑
i=1
XiP (Xi) = (−50)(0, 10) + (390)(0, 10) + (500)(0, 20) + (600)(0, 60) = 494
Tabela 5.2: Demanda diária de aluguel de caminhonetes durante 50 dias
X P(X) X · P (X) X2 X2 · P (X)
-50 0,10 -5 2500 250
390 0,10 39 152100 15210
500 0,20 100 250000 50000
600 0,60 360 360000 216000
Total 1,00 494 281460
5.1.3 Variância de variáveis aleatórias discretas
35
A variância de uma v.a. X, denotada por V ar(X), é calculada em relação a E(X) como a média da distribuição
de probabilidade:
V ar(X) =
n∑
i=1
[Xi − E(Xi)]2P (Xi).
Uma fórmula alternativa e preferencial para encontrar a variância, que costuma simpli�car os cálculos, é obtida
por:
V ar(X) = E(X2)− [E(X)]2.
OBS: E(X2) =
n∑
i=1
X2i P (Xi).
5.1.3.1 Exemplo
3. A variância para a produção de pepinos em conserva é dada por (ver Tabela 5.2):
SOLUÇÃO: V ar(X) = E(X2)− [E(X)]2 = 281460− (494)2 = 37424.
5.2 Distribuição contínua de probabilidade
Ao contrário de uma v.a. discreta, uma v. a. contínua pode assumir qualquer valor fracionário dentro de um
intervalo de�nido de valores. Desta maneira, para distribuições de probabilidade, não se consegue enumerar todos
os possíveis valores de uma v. a. contínua com os valores de probabilidade correspondentes. Em lugar disso, a
abordagem mais conveniente é construir uma função densidade de probabilidade, ou curva de probabilidade, baseada
na função matemática correspondente. A proporção da área incluída entre dois pontos quaisquer, debaixo da curva
de probabilidade, identi�ca a probabilidade de que a v. a. contínua selecionada assuma um valor entre tais pontos.
Assim tem-se:
De�nição 1: A função f(x) é a função de densidade de probabilidade (f.d.p.) para a variável aleatória contínua
X, de�nida no conjunto de números reais R, se
1. f(x) ≥ 0 para todo x ∈ R;
2.
∫ +∞
−∞ f(x)dx = 1;
3. P (a < X < b) =
∫ b
a
f(x)dx.
36
5.2.1 Exemplo
4. Num estudo de comportamento animal, pássaros são libertados um de cada vez, sob circunstâncias que tornam
difícil a orientação. Espera-se que os pássaros escolham direções aleatórias. Está-se medindo o ângulo entre o
norte e a direção tomada pelo pássaro no sentido horário (azimute). A direção é dita aleatória se cada azimute
de 0
o
a 360
o
tiver a mesma chance de ser escolhido. Se X é a variável aleatória contínua azimute, podemos
estabelecer o seguinte modelo para representar a sua distribuição: f(x) =
{
1
360 , para 0 ≤ x ≤ 360
0, caso contrário
a) Veri�que se a função acima é uma f.d.p.
b) Determine a P (0o ≤ X ≤ 90o).
5.2.2 Esperança e Variância de variáveis aleatórias contínuas
De�nição 2: Seja X uma variável aleatória contínua com distribuição de probabilidade f(x). A média ou
esperança ou valor esperado de X é
µ = E(X) =
∫ ∞
−∞
xf(x)dx.
De�nição 3: Seja X uma variável aleatória contínua com distribuição de probabilidade f(x). A variância de
X é
σ2 = V ar(X) = E[(X − µ)2] =
∫ ∞
−∞
(x− µ)2f(x)dx.
Pode-se usar pela fórmula alternativa: V ar(X) = E(X2)− [E(X)]2.
OBS: E(X2) =
∫∞
−∞ x
2f(x)dx.
5.2.3 Exemplo
5. Encontre a esperança e a variância para a v. a. contínua do exemplo 4.
Capítulo 6
Distribuições Discretas de Probabilidade
6.1 Distribuição Binomial
A distribuição binomial é uma distribuição discreta de probabilidade, aplicável sempre que o processo de amos-
tragem é do tipo de Bernoulli. Um processo de Bernoulli é um processo de amostragem no qual:
1. Em cada tentativa existem dois resultados possíveis mutuamente exclusivos. Eles são chamados, por conveni-
ência, sucesso e fracasso.
2. As séries de tentativas, ou observações, são constituídas de eventos independentes.
3. A probabilidade de sucesso, indicada por p, permanece constante de tentativa para tentativa. Ou seja, o
processo é estacionário.
A distribuição binomial pode ser utilizada para determinar a probabilidade de se obter um dado número de
sucessos em um processo de Bernoulli. Três valores são necessários: o número de sucessos (X), o número de tenta-
tivas ou observações (n) e a probabilidade de sucesso em cada tentativa (p). A distribuição de probabilidade
Binomial para se determinar a probabilidade de um certo número de sucessos X é:
P (X = x) = C(n,x)p
x(1− p)n−x
=
n!
x!(n− x)!p
x(1− p)n−x
6.1.1 Exemplo
1. Numa criação de coelhos, a taxa de nascimento de machos é de 40%. Qual a probabilidade de que nasçam 4
coelhos machos, num dia em que nasceram 19 coelhos?
SOLUÇÃO:
P (X = 4) = C(19,4)(0, 40)
4(1− 0, 40)19−4 = 19!
4!15!
(0, 0256)(0, 0005) = 0, 0466 ou 4, 66%
37
38
Geralmente, existe um interesse na probabilidade acumulada de �X ou mais” sucessos ou �X ou menos” sucessos
ocorrerem em n tentativas. Em tal caso, precisa ser determinada a probabilidade de cada resultado incluído dentro
do intervalo dado, sendo tais probabilidades, então, somadas.
6.1.2 Exemplos
2. No exemplo anterior, qual a probabilidade de que nasçam pelo menos dois coelhos machos?
SOLUÇÃO:
P (X ≥ 2) = P (X = 2) + P (X = 3) + . . .+ P (X = 19)
P (X ≥ 2) = 1− P (X < 2) = 1− [P (X = 0) + P (X = 1)]
P (X ≥ 2) = 1− [0, 00006 + 0, 0008] = 0, 99914.
em que P (X = 0) = C(19,0)(0, 40)
0(0, 60)19 = 19!0!19! (1)(0, 00006) = 0, 00006;
P (X = 1) = C(19,1)(0, 40)
1(0, 60)18 = 19!4!18! (0, 40)(0, 0001) = 0, 0008.
3. Num rebanho bovino 30% dos animais estão atacados de febre aftosa. Retira-se, ao acaso, uma amostra de 10
animais. Qual a probabilidade de se encontrarem seis animais doentes? E a probabilidade de encontrarem 9
ou mais animais doentes?
SOLUÇÃO:
P (X = 6) = C(10,6)(0, 30)
6(0, 70)4 = 0, 0367.
P (X ≥ 9) = P (X = 9) + P (X = 10))
P (X ≥ 9) = 0, 0001 + 0, 000006 = 0, 000106.
em que P (X = 9) = C(10,9)(0, 30)
9(0, 70)1 = 0, 0001;
P (X = 10) = C(10,10)(0, 30)
10(0, 70)0 = 0, 000006.
6.1.3 Esperança e Variância da Distribuição Binomial
A esperança ou o número esperado de sucessos é dado por:
E(X) = np.
A variância do número de sucessos pode ser calculada por:
V ar(X) = np(1− p).
6.1.4 Exemplo
4. Para o exemplo 3, calcule a esperança e a variância associada com a probabilidade de se encontrarem animais
doentes.
39
SOLUÇÃO:
E(X) = np = 10(0, 30) = 3 animais;
V ar(X) = np(1− p) = 10(0, 30)(0, 70) = 2, 1 animais2.
6.2 Distribuição de Poisson
A distribuição de Poisson pode ser usada para determinar as probabilidades do número de ocorrências em um
intervalo contínuo de tempo ou espaço. Por exemplo, a variável aleatória de interesse pode ser o número de carros
que chegam a um lava-rápido em uma hora, o número de reparos necessários em 16 km de uma rodovia ou o número
de chamadas em uma central telefônica. Tal como no caso do processo de Bernoulli, supõe-se que os eventos são
independentes e que o processo é estacionário (a probabilidade permanece constante de tentativa para tentativa).
Somente um valor é necessário para determinar a probabilidade de um dado número de ocorrências em um
processo de Poisson: o número médio de ocorrências para a especí�ca dimensão de tempo ou espaço de interesse.
Este número médio é geralmente representado por λ (letra grega �lambda”). Assim, a funçãoprobabilidade de
Poisson é:
P (X = x) =
λxe−λ
x!
em que P (X = x) = a probabilidade de x ocorrências em um intervalo;
λ = número médio de ocorrências;
e = 2, 71828.
6.2.1 Exemplo
5. Um departamento de conserto de máquinas recebe uma média de 5 chamadas por hora.
a) Qual a probabilidade de que, em 1 hora selecionada aleatoriamente, sejam recebidas exatamente 3 chama-
das?
SOLUÇÃO:
b) Qual a probabilidade de que menos do que 3 chamadas sejam recebidas durante 1 hora?
SOLUÇÃO:
6. Um processo mecânico produz tecido para tapetes com uma média de 2 defeitos por jarda. Determine a probabi-
lidade de uma jarda quadrada ter exatamente um defeito, admitindo que o processo possa ser bem aproximado
por uma distribuição de Poisson.
SOLUÇÃO:
P (X = 1) =
(2)1e−2
1!
=
(2)(0, 135)
1
= 0, 271
40
6.2.2 Valor esperado e Variância da Distribuição de Poisson
O valor esperado em uma distribuição de probabilidade de Poisson é igual à média da distribuição:
E(X) = λ.
A variância do número de eventos em uma distribuição de probabilidade de Poisson é também igual à média da
distribuição:
V ar(X) = λ.
6.2.3 Exercícios
1. Numa criação de coelhos, a taxa de nascimento de fêmeas é de 55%. Sabe-se que em um dia nasceram 20
coelhos, responda:
a) Qual a probabilidade de que nasçam 5 coelhos fêmeas?
b) Qual a probabilidade de que nasçam no máximo 1 coelho fêmea?
c) Qual a probabilidade de que nasçam pelo menos 2 coelhos fêmeas?
2. Sabe-se que a probabilidade de um indivíduo sofrer uma reação nociva, resultante da infecção de um deter-
minado soro, é 0,0001. Determinar a probabilidade de, entre 2000 indivíduos:
a) exatamente três sofrerem a reação;
b) mais de dois sofrerem a reação.
3. Numa área dividida em quadrantes de 0,50 m2, foram encontrados em média 2,5 espécimes. Calcule a
probabilidade de:
a) encontrar num quadrante exatamente quatro espécimes.
b) encontrar no máximo um espécime num quadrante.
Capítulo 7
Distribuições de Probabilidade Contínuas
7.1 Distribuição Uniforme
O modelo uniforme é o modelo mais simples para v. a. contínuas.
De�nição: A v. a. X tem distribuição uniforme no intervalo [α, β] se sua f.d.p. é dada por
f(x) =
{ 1
β−α , se α ≤ x ≤ β
0, caso contrário
A Figura 7.1 representa a função dada acima.
Figura 7.1: Grá�co da distribuição uniforme
7.1.1 Exemplo
1. Suponha que uma grande sala de conferências usada por certa empresa não possa �car reservada por mais do que
quatro horas. No entanto, o uso da sala é tal que conferências longas e curtas ocorrem com muita frequência.
Na verdade, pode-se assumir que a duração X de uma conferência tem distribuição uniforme no intervalo [0,
4].
a) Qual é a função de densidade probabilidade?
41
42
f(x) =
{
1
4 , se 0 ≤ x ≤ 4
0, caso contrário
b) Qual é a probabilidade de que qualquer conferência dada dure pelo menos três horas?
P (X ≥ 3) =
∫ 4
3
1
4
dx =
1
4
.
c) Qual é a probabilidade de que qualquer conferência dada dure até duas horas?
P (0 ≤ X ≤ 2) =
∫ 2
0
1
4
dx =
1
2
.
7.2 Distribuição Normal
A mais importante distribuição de probabilidade para descrever uma v. a. contínua é a distribuição normal de
probabilidade. A distribuição normal de probabilidade é usada em ampla variedade de aplicações práticas em que
as variáveis aleatórias são a altura e peso das pessoas, notas de exames, medições cientí�cas, índices pluviométricos
e outros valores similares.
A distribuição de probabilidade normal é importante também na inferência estatística por três razões distintas:
1. As medidas produzidas em diversos processos aleatórios seguem esta distribuição.
2. Probabilidades normais podem ser usadas frequentemente como aproximações de outras distribuições.
3. As distribuições de estatísticas da amostra tais como a média e a proporção, frequentemente seguem distri-
buição normal independentemente da distribuição da população.
O formato, ou forma, da distribuição normal de probabilidade é ilustrado pela curva simétrica e mesocúrtica
(nem achatada, nem pontiaguda em termos de valores observados), em forma de sino apresentada na Figura 7.2.
Figura 7.2: Curva em forma de sino correspondente à distribuição normal de probabilidade
A função densidade de probabilidade que de�ne a curva em forma de sino da distribuição normal de probabilidade
é a seguinte:
f(x) =
1
σ
√
2pi
e−
(x−µ)2
2σ2
em que pi é a constante 3,1416;
e é a constante 2,7183;
µ é a média da distribuição;
σ é o desvio padrão da distribuição.
43
7.3 Distribuição Normal Padrão de Probabilidade
Dizemos que a variável aleatória que tem uma distribuição normal cuja média é zero (0) e o desvio padrão é
um (1) tem uma distribuição normal padrão de probabilidade simbolizada por X ∼ N(0, 1) (lê-se: X segue
uma distribuição normal com média 0 e variância 1). Comumente, usamos a letra z para designar essa variável
aleatória normal em particular. Ela tem a mesma aparência geral das outras distribuições normais, porém com as
propriedades especiais de µ = 0 e σ = 1. Assim, a fórmula da função densidade normal padrão de probabilidade é:
f(z) =
1√
2pi
e−
z2
2
À semelhança de outras variáveis aleatórias contínuas, os cálculos de probabilidade com quaisquer distribuições
normais são feitos calculando-se as áreas sob o grá�co da função densidade de probabilidade. Desse modo, para
encontrar a probabilidade de uma variável aleatória normal estar dentro de um intervalo especí�co, devemos calcular
a área sob a curva normal ao longo desse intervalo. Quanto à distribuição normal padrão, as áreas sob a curva
normal foram calculadas e estão disponíveis em tabelas que podem ser usadas no cálculo das probabilidades.
7.3.1 Exemplos
2. Calcule a P (0, 00 ≤ z ≤ 1, 00).
P (0, 00 ≤ z ≤ 1, 00) = 0, 3413
3. Calcule a P (−1, 00 ≤ z ≤ 1, 00).
P (−1, 00 ≤ z ≤ 1, 00) = P (−1, 00 ≤ z ≤ 0, 00) + P (0, 00 ≤ z ≤ 1, 00) = 0, 3413 + 0, 3413 = 0, 6826
4. Calcule a P (z ≥ 1, 58).
P (z ≥ 1, 58) = 0, 5− P (0, 00 ≤ z ≤ 1, 58) = 0, 5− 0, 4429 = 0, 0571
5. Calcule a P (z ≥ −0, 45).
P (z ≥ −0, 45) = P (−0, 45 ≤ z ≤ 0, 00) + P (z ≥ 0, 0) = 0, 1736 + 0, 5 = 0, 6736
6. Calcule a P (1, 00 ≤ z ≤ 1, 58).
P (1, 00 ≤ z ≤ 1, 58) = P (0, 00 ≤ z ≤ 1, 58)− P (0, 00 ≤ z ≤ 1, 00) = 0, 4429− 0, 3413 = 0, 1016
7. Calcule a P (z ≤ −1, 36).
8. Calcule a P (−0, 86 ≤ z ≤ 1, 55).
9. Calcule a P (z ≤ 0, 31).
10. Calcule a P (z ≤ −1, 69).
11. Calcule a P (−0, 14 ≤ z ≤ −2, 09).
Mas como calcular probabilidade de qualquer distribuição normal?
44
7.3.2 Cálculo de probabilidade de qualquer distribuição normal
Quando temos uma distribuição normal com média µ qualquer (diferente de zero) e um desvio padrão σ qualquer
(diferente de um), para responder às questões de probabilidade referentes à distribuição, efetua-se primeiramente
a conversão para distribuição normal padrão (µ = 0 e σ = 1). A fórmula usada para converter qualquer variável
aleatória normal X com média µ e desvio padrão σ em distribuição normal padrão é dada por:
z =
X − µ
σ
7.3.3 Exemplos
12. Consideremos uma distribuição normal com média µ = 100 e desvio padrão σ = 10. Calcule a probabilidade
para X entre 100 e 115.
z =
X − µ
σ
=
X − 100
10
=
100− 100
10
= 0
X − 100
10
=
115− 100
10
= 1, 5
P (0 ≤ z ≤ 1, 5) = 0, 4332, portanto, P (100 ≤ X ≤ 115) = 0, 4332.
13. Sabe-se que a vida útil de um componente elétrico segue uma distribuição normal com média µ = 2000 horas e
desvio padrão σ = 200 horas. Qual a probabilidade de que um componente aleatoriamente selecionado dure
entre 2000 e 2400 horas?
z =
X − µ
σ
=
X − 2000
200
=
2400− 2000
200
= 2
P (0 ≤ z ≤ 2) = 0, 4772, portanto, P (2000 ≤ X ≤ 2400) = 0, 4772.
14. O processo de empacotamentoem uma companhia de cereais foi ajustado de maneira que uma média de µ = 13
kg de cereal é colocada em cada saco. É claro que nem todos os sacos têm precisamente 13,0 kg devido a
fontes aleatórias de variabilidade. O desvio padrão do peso líquido é σ = 0, 1 kg, e sabe-se que a distribuição
dos pesos segue uma distribuição normal padrão.
a) Qual a probabilidade de que um saco escolhido aleatoriamente contenha entre 13,0 e 13,2 kg de cereal?
z =
X − µ
σ
=
13, 2− 13, 0
0, 1
= 2, 0
P (13, 0 ≤ X ≤ 13, 2) = P (0 ≤ z ≤ 2, 0) = 0, 4772
b) Qual a probabilidade de que o peso exceda 13,25 kg?
z =
X − µ
σ
=
13, 25− 13, 0
0, 1
= 2, 5
P (X ≥ 13, 25) = P (z ≥ 2, 5) = 0, 5− P (0 ≤ Z ≤ 2, 5) = 0, 5− 0, 4938 = 0, 0062
45
c) Qual a probabilidade de que o peso do cereal esteja entre 12,8 e 13,1 kg?
z1 =
X1 − µ
σ
=
12, 8− 13, 0
0, 1
= −2, 0
z2 =
X2 − µ
σ
=
13, 1− 13, 0
0, 1
= 1, 0
P (12, 8 ≤ X ≤ 13, 1) = P (−2, 0 ≤ z ≤ 1, 0) = 0, 4772 + 0, 3413 = 0, 8185
d) Qual a probabilidade de que o peso esteja entre 13,1 e 13,2 kg?
z1 =
X1 − µ
σ
=
13, 1− 13, 0
0, 1
= 1, 0
z2 =
X2 − µ
σ
=
13, 2− 13, 0
0, 1
= 2, 0
P (13, 1 ≤ X ≤ 13, 2) = P (1, 0 ≤ z ≤ 2, 0) = 0, 4772− 0, 3413 = 0, 1359
15. A distribuição da altura de plantas de Amaranthus hybridus, pode ser aproximada por uma distribuição normal
com média µ = 29, 7 cm e desvio padrão σ = 2, 7 cm. Calcule probabilidade de uma planta apresentar altura:
a) entre 29,7 e 32 cm;
P (29, 7 ≤ X ≤ 32) = P (29, 7− 29, 7
2, 7
≤ z ≤ 32− 29, 7
2, 7
) = P (0 ≤ z ≤ 0, 85) = 0, 3023
b) acima de 32 cm;
P (X ≥ 32) = P (z ≥ 32− 29, 7
2, 7
) = P (z ≥ 0, 85) = 0, 5− 0, 3023 = 0, 1977
c) entre 27 e 32 cm;
P (27 ≤ X ≤ 32) = P (27− 29, 7
2, 7
≤ z ≤ 32− 29, 7
2, 7
) = P (−1 ≤ z ≤ 0, 85) = 0, 3413 + 0, 3023 = 0, 6436
d) entre 25 e 27 cm.
P (25 ≤ X ≤ 27) = P (25− 29, 7
2, 7
≤ z ≤ 27− 29, 7
2, 7
) = P (−1, 74 ≤ z ≤ −1, 00) = 0, 4591−0, 3413 = 0, 1178
46
Capítulo 8
Teoria da Estimação
8.1 Estimativas pontuais e intervalares
A estimação é o processo que consiste em utilizar dados amostrais para estimar os valores de parâmetros
populacionais desconhecidos. Essencialmente, qualquer característica de uma população pode ser estimada a partir
de uma amostra aleatória. Entre os mais comuns, estão a média e o desvio padrão de uma população e a proporção
populacional.
As estatísticas amostrais são utilizadas como estimadores de parâmetros populacionais. Assim, uma média
amostral é usada como estimativa de uma média populacional; um desvio padrão amostral serve de estimativa do
desvio padrão da população; e a proporção de itens numa amostra, com determinada característica, serve para
estimar a proporção da população que apresenta aquela característica. Tais estimativas chamam-se estimativas
pontuais, porque originam uma única estimativa do parâmetro. Em virtude da variabilidade amostral, é usual
incluir uma �estimativa intervalar” para acompanhar a estimativa pontual. Essa nova estimativa proporciona um
intervalo de possíveis valores do parâmetro populacional. Observe a Tabela 8.1 que dá alguns exemplos de cada
tipo de estimativa.
Tabela 8.1: Exemplos de estimativas
Tipo de estimativa
Parâmetro
populacional Pontual Intervalar
Média O americano médio consome 40lb O consumo médio de carne no país
de carne por ano. está entre 30 e 50 lb por pessoa/ano.
Proporção 22% da população se opõe a um Entre 18% e 26% da população há oposição
aumento do limite de velocidade. a um aumento do limite da velocidade.
desvio padrão O desvio padrão da quilometragem O desvio padrão da quilometragem de
de um pneu radial é de 2000 milhas. um pneu radial está entre 1500 e 2500 milhas.
8.2 Intervalos de Con�ança para a média (σ2 conhecida)
47
48
Quando se conhece a variância populacional, o intervalo de con�ança para a média populacional pode ser obtido
por:
IC(µ, γ) = X ± zα
2
σ√
n
em que n é o tamanho da amostra.
8.2.1 Exemplos
1. Uma máquina produz rolamentos que apresentam desvio padrão de 0,042 polegadas em seu diâmetro. Desejando-
se conhecer o diâmetro médio dos rolamentos produzidos por esta máquina, extraiu-se uma amostra de 100
rolamentos, observando-se uma média igual a 0,824 polegadas. Obter o IC com 90% de con�ança para o
verdadeiro diâmetro médio dos rolamentos.
Tem-se X = 0, 824;σ = 0, 042;n = 100, γ = 0, 90, assim:
IC(µ, 90%) = 0, 824± z0,05 0, 042√
100
= 0, 824± 1, 64(0, 0042) = 0, 824± 0, 007
Portanto, o verdadeiro diâmetro médio dos rolamentos está no IC=[0,817; 0,831].
2. Em uma amostra com 36 elementos, encontrou-se uma média amostral de 15,5. Sabendo que a variância
populacional é conhecida e igual a 16, calcule o intervalo de con�ança para a média, com 95% de con�ança.
Tem-se X = 15, 5;σ = 4;n = 36, 1− α = 0, 95, assim:
IC(µ, 95%) = 15, 5± z0,025 4√
36
= 15, 5± 1, 96(0, 67) = 15, 5± 1, 3132
Portanto, o verdadeiro valor da média está no IC=[14,1868; 16,8132].
8.3 Intervalos de Con�ança para a média (σ2 desconhecida)
Quando não se conhece a variância populacional, o intervalo de con�ança para a média populacional pode ser
obtido por:
IC(µ, γ) = X ± tα
2 ,n−1
s√
n
tα
2
com n− 1 graus de liberdade, em que n é o tamanho da amostra.
8.3.1 Exemplos
3. Um CIA adquiriu uma amostra de 29 cabos ao acaso e veri�cou tensão de ruptura média igual a 2400 kg com
desvio padrão de 150 kg. Obter o IC com 95% de con�ança para a verdadeira tensão média de ruptura destes
cabos.
Tem-se n = 29, X = 2400, s = 150, γ = 0, 95.
IC(µ, 95%) = 2400± t0,025 150√
29
= 2400± 2, 04(27, 39) = 2400± 64, 74
49
Portanto, existe 95% de con�ança em se dizer que a verdadeira tensão média de ruptura dos cabos está entre
IC=[2335,26; 2464,74].
4. Construa o intervalo de con�ança sabendo que a média amostral é igual a 20, a variância amostral igual a 36,
baseado em uma amostra de 25 elementos. Considere um nível de 90%.
Tem-se n = 25; X = 20; s = 60; γ = 0, 90.
IC(µ, 90%) = 20± t0,05 6√
25
= 20± 1, 71(1, 2) = 20± 2, 48
Portanto, existe 90% de con�ança em se dizer que a verdadeira média está entre IC=[17,52; 22,48].
8.4 Intervalos de Con�ança para proporção
O intervalo de con�ança para uma proporção populacional (p) é muito semelhante àquele para uma média
populacional com σ conhecido. Assim, para amostras grandes (n > 30) tem-se que:
IC(p, γ) = p̂± zα
2
√
p̂ (1− p̂)
n
em que p̂ é a proporção estimada na amostra e n é o tamanho da amostra.
8.4.1 Exemplos
5. Foi realizada uma pesquisa nacional de 900 jogadoras de golfe para saber como as mulheres viam o tratamento
que lhes era dado nos cursos de golfe nos Estados Unidos. A pesquisa revelou que 396 gol�stas estavam
satisfeitas com a disponibilidade de tee times (hora de saída 1
a
tacada). Desse modo, estimação por ponto
da proporção da população de mulheres gol�stas que estão satisfeitas com a disponibilidade de tee times é de
396/900 = 0, 44. Estime um IC para 95%.
p̂ =
396
900
= 0, 44 (1− p̂) = 0, 56
IC(p, 95%) = 0, 44± z0,025
√
0, 44(0, 56)
900
= 0, 44± 1, 96(0, 0, 0165) = 0, 44± 0, 0324
Portanto, existe 95% de con�ança em se dizer que as mulheres gol�stas estão satisfeitas com a disponibilidade
de tee times entre IC=[0,4388; 0,4412], ou, 43,88% e 44,12%.
6. Em certo lago, uma amostra aleatória de 1000 peixes acusou 290 tilápias. Construa um intervalo de con�ança
de 95% de con�ança para a verdadeira proporção de tilápias na população piscosa do lago.
p̂ =
290
1000
= 0, 29 (1− p̂) = 0, 71
IC(p, 95%) = 0, 29± z0,025
√
0, 29(0, 71)
1000
= 0, 29± 1, 96(0, 0143) = 0, 29± 0, 03
∴ IC(p, 95%) = [0, 26; 0, 32].
50
8.5 Intervalos de Con�ança para a diferença de médias populacionais
Sejam duas populações

Outros materiais