Apostila Estatística Básica (2) ufpb

breadcrumb-separator

UNEB

em 25/03/2021

Conteúdos escolhidos para você

UNIDADE 3 - Probabilidade e estatistica AMPLI

UNIDADE 3 - Probabilidade e estatistica AMPLI

AMPLI

respostas

Função Densidade de Probabilidade

Função Densidade de Probabilidade

UEL

Apostila_Estatistica_2

Apostila_Estatistica_2

Notas de Estatística - MAT236

Notas de Estatística - MAT236

UFBA

Perguntas dessa disciplina

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

UNILAVRAS

Questão 10/10 - ENSINO DE ESTATÍSTICA E TRATAMENTO DA INFORMAÇÃO NA EDUCAÇÃO BÁSICA Ler em voz alta Considere o excerto de texto a seguir: “As medidas

de da Pergunta: 0,5 pontos Salva PERGUNTA 1 Relacione as variáveis de uma pesquisa estatística, apresentadas à esquerda, com as características de ...

UNIP São Luís

Um dos principais objetivos da estatística é a inferência, ou seja, a capacidade de fazer conclusões sobre uma população inteira a partir dos dados de

UNIDADE I 0,5 pontos Salvar resposta PERGUNTA 1 Relacione uma as variáveis de uma pesquisa estatística, apresentadas à esquerda, com as característ...

UNIP São Luís

Material

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Conteúdos escolhidos para você

UNIDADE 3 - Probabilidade e estatistica AMPLI

UNIDADE 3 - Probabilidade e estatistica AMPLI

AMPLI

respostas

Função Densidade de Probabilidade

Função Densidade de Probabilidade

UEL

Apostila_Estatistica_2

Apostila_Estatistica_2

Notas de Estatística - MAT236

Notas de Estatística - MAT236

UFBA

Perguntas dessa disciplina

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

UNILAVRAS

Questão 10/10 - ENSINO DE ESTATÍSTICA E TRATAMENTO DA INFORMAÇÃO NA EDUCAÇÃO BÁSICA Ler em voz alta Considere o excerto de texto a seguir: “As medidas

de da Pergunta: 0,5 pontos Salva PERGUNTA 1 Relacione as variáveis de uma pesquisa estatística, apresentadas à esquerda, com as características de ...

UNIP São Luís

Um dos principais objetivos da estatística é a inferência, ou seja, a capacidade de fazer conclusões sobre uma população inteira a partir dos dados de

UNIDADE I 0,5 pontos Salvar resposta PERGUNTA 1 Relacione uma as variáveis de uma pesquisa estatística, apresentadas à esquerda, com as característ...

UNIP São Luís

Prévia do material em texto

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE
CENTRO DE CIÊNCIAS E TECNOLOGIA AGROALIMENTAR - CAMPUS POMBAL
DISCIPLINA: ESTATÍSTICA BÁSICA
NOTAS DE AULA
ESTATÍSTICA BÁSICA
Prof. MSc. Carlos Sérgio Araújo dos Santos
POMBAL - PB
NOVEMBRO de 2013
Sumário
1 Introdução Geral p. 9
1.1 A Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 9
1.2 Estatística Descritiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 10
1.3 A Natureza da Estatística (Classificação das variáveis . . . . . . . . . . . p. 10
1.4 Fases do Método Estatístico . . . . . . . . . . . . . . . . . . . . . . . . . p. 11
1.5 Pesquisas e Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13
1.6 Conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13
1.7 Tabelas Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 14
1.8 Elementos de uma Tabela . . . . . . . . . . . . . . . . . . . . . . . . . . p. 14
1.9 Representação esquemática . . . . . . . . . . . . . . . . . . . . . . . . . p. 15
1.10 Distribuição de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . p. 15
1.10.1 Conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 15
1.10.2 Distribuição de frequência sem intervalos de classe . . . . . . . . p. 16
1.10.3 Distribuição de frequência com intervalos de classe . . . . . . . . p. 16
1.10.4 Elementos de uma Distribuição de Frequência . . . . . . . . . . . p. 17
1.10.5 Método Prático para construção de uma distribuição de frequências
com classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 18
1.10.6 Tipos de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . p. 18
1.11 Representação Gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 19
1.12 Gráficos utilizados para a análise de uma distribuição de freqüência . . . p. 20
1.12.1 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 20
1.12.2 Polígono de Freqüências . . . . . . . . . . . . . . . . . . . . . . . p. 20
1.12.3 Ogivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21
1.12.4 Gráfico por linha . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21
1.12.5 Gráfico por colunas . . . . . . . . . . . . . . . . . . . . . . . . . . p. 22
1.12.6 Diagrama por Superfície em Setores . . . . . . . . . . . . . . . . . p. 22
2 Análise Exploratória de Dados p. 24
2.1 Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 24
2.1.1 Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 24
2.1.2 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 26
2.1.3 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 28
2.2 Quartis, Decis e Percentis (ou Centis) . . . . . . . . . . . . . . . . . . . . p. 31
2.3 Quartis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 31
2.3.1 Primeiro Quartil: Q1 . . . . . . . . . . . . . . . . . . . . . . . . . . p. 31
2.3.2 Segundo Quartil: Q2 ou Md . . . . . . . . . . . . . . . . . . . . . p. 32
2.3.3 Terceiro Quartil: Q3 . . . . . . . . . . . . . . . . . . . . . . . . . . p. 32
2.4 Decis Di . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 33
2.4.1 Primeiro Decil: D1 . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 33
2.4.2 Segundo Decil: D2 . . . . . . . . . . . . . . . . . . . . . . . . . . p. 33
2.5 Percentis ou Centis Ci . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 34
2.5.1 Vigésimo Centil: C20 . . . . . . . . . . . . . . . . . . . . . . . . . p. 34
2.6 Medidas de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 35
2.6.1 Desvio - Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 36
2.6.2 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 37
2.6.3 Coeficiente de Variação . . . . . . . . . . . . . . . . . . . . . . . . p. 39
2.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 40
3 Probabilidade: Espaço amostral e eventos p. 45
3.1 Experimentos Aleatórios . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45
3.1.1 Tipos de fenômenos . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45
3.2 Espaço Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45
3.3 Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 46
3.4 Classe dos eventos aleatórios . . . . . . . . . . . . . . . . . . . . . . . . p. 46
3.5 Operações com eventos Aleatórios . . . . . . . . . . . . . . . . . . . . . p. 47
3.6 Propriedades das operações . . . . . . . . . . . . . . . . . . . . . . . . . p. 49
3.7 Partição de um Espaço Amostral . . . . . . . . . . . . . . . . . . . . . . . p. 50
3.8 Eventos Mutuamente Exclusivos ou Disjuntos . . . . . . . . . . . . . . . . p. 51
3.9 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 52
4 Probabilidade: Definições p. 53
4.1 Definição Clássica de Probabilidade . . . . . . . . . . . . . . . . . . . . . p. 53
4.2 Definição Axiomática de Probabilidade . . . . . . . . . . . . . . . . . . . p. 53
4.2.1 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 54
4.3 Eventos Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 55
4.4 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . p. 55
4.5 Probabilidade Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 56
4.6 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 57
4.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 59
5 Variáveis Aleatórias discretas p. 62
5.1 Variáveis Aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 62
5.2 Esperança de uma Variável Aleatória Discreta . . . . . . . . . . . . . . . . p. 64
5.3 Variância de uma Variável Aleatória Discreta . . . . . . . . . . . . . . . . p. 65
5.4 Função de Distribuição Acumulada . . . . . . . . . . . . . . . . . . . . . . p. 66
5.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 68
6 Distribuições Teóricas de Probabilidades de Variáveis Aleatórias Discre-
tas p. 70
6.1 Distribuição de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 70
6.2 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 71
6.2.1 Média e Variância de uma v.a. com Distribuição
Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 72
6.3 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 73
6.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 76
7 Variáveis Aleatórias contínuas p. 78
7.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 78
7.2 Função de Distribuição Acumulada . . . . . . . . . . . . . . . . . . . . . . p. 79
7.3 Esperança de uma Variável Aleatória Contínua . . . . . . . . . . . . . . . p. 80
7.4 Variancia de uma Variável Aleatória Contínua . . . . . . . . . . . . . . . . p. 80
7.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 81
8 Distribuições Teóricas de Probabilidades de Variáveis Aleatórias Contínuas p. 83
8.1 Distribuição Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 83
8.2 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 84
8.2.1 Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 85
8.2.2 Distribuição Normal Padrão . . . . . . . . . . . . . . . . . . . . . . p. 85
8.3 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 88
9 Teoria da Amostragem p. 90
9.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 90
9.2 Parâmetros e Estatísticas. . . . . . . . . . . . . . . . . . . . . . . . . . . p. 90
9.3 Técnicas de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 91
9.4 Conceitos Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 91
9.5 Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 92
9.5.1 As Amostras Probabilísticas . . . . . . . . . . . . . . . . . . . . . p. 92
9.5.2 Amostragem Aleatória Simples . . . . . . . . . . . . . . . . . . . . p. 93
9.5.3 Amostragem Aleatória Estratificada . . . . . . . . . . . . . . . . . p. 93
9.5.4 Amostragem por Conglomerados . . . . . . . . . . . . . . . . . . . p. 94
9.5.5 Amostragem Sistemática . . . . . . . . . . . . . . . . . . . . . . . p. 94
9.6 Amostragem Não-probabilística . . . . . . . . . . . . . . . . . . . . . . . p. 94
9.7 Erros no processo de amostragem . . . . . . . . . . . . . . . . . . . . . . p. 94
9.8 Distribuição Amostral da Média . . . . . . . . . . . . . . . . . . . . . . . . p. 95
9.9 Distribuição Amostral das Proporções . . . . . . . . . . . . . . . . . . . . p. 96
9.10 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 98
10 Teoria da Estimação p. 100
10.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 100
10.2 Estimação Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 100
10.3 Propriedades dos estimadores . . . . . . . . . . . . . . . . . . . . . . . . p. 101
10.3.1 Justeza e não-tedenciosidade . . . . . . . . . . . . . . . . . . . . p. 101
10.3.2 Consistência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 101
10.3.3 Eficiência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 102
10.3.4 Suficiência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 103
10.4 Estimação Intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 103
10.4.1 Intervalo de Confiança para Média com variância (populacional)
conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 103
10.4.2 Intervalo de Confiança para Média com variância (populacional)
desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 105
10.4.3 Intervalo de Confiança para proporção populacional . . . . . . . . p. 106
10.4.4 Intervalo de Confiança para Variância . . . . . . . . . . . . . . . . p. 107
10.5 Intervalo de Confiança para a diferença de médias de duas Populações . p. 108
10.5.1 As variâncias σ21 e σ
2
2 (populacionais) são conhecidas . . . . . . . p. 108
10.5.2 As variâncias σ21 e σ
2
2 são desconhecidas mas σ
2
1 = σ
2
2 . . . . . . . p. 109
10.6 Intervalo de Confiança para Diferença de Proporções . . . . . . . . . . . p. 110
10.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 112
11 Testes de Hipóteses p. 118
11.1 Hipótese Nula e Hipótese Alternativa . . . . . . . . . . . . . . . . . . . . . p. 118
11.2 Região Crítica do teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 118
11.3 Erros do Tipo I e erros do Tipo II . . . . . . . . . . . . . . . . . . . . . . . p. 119
11.4 Teste da hipótese para média populacional µ . . . . . . . . . . . . . . . . p. 120
11.4.1 σ conhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 120
11.4.2 σ desconhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 120
11.5 Teste para Proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 121
11.6 Teste de hipótese para variância . . . . . . . . . . . . . . . . . . . . . . . p. 122
11.7 Teste da hipótese da igualdade de duas médias . . . . . . . . . . . . . . p. 123
11.7.1 σ21 e σ
2
2 conhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . p. 124
11.7.2 σ21 e σ
2
2 desconhecidas . . . . . . . . . . . . . . . . . . . . . . . . p. 124
11.8 Teste de hipótese da diferença entre proporções . . . . . . . . . . . . . . p. 125
11.9 Teste da razão de variâncias . . . . . . . . . . . . . . . . . . . . . . . . . p. 125
11.10Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 128
12 Correlação e Regressão Linear Simples p. 134
12.1 Correlação Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . p. 134
12.1.1 Relação entre variáveis . . . . . . . . . . . . . . . . . . . . . . . . p. 134
12.1.2 Medida de Correlação . . . . . . . . . . . . . . . . . . . . . . . . . p. 134
12.2 Regressão Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 136
12.2.1 Pressuposições . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 137
12.2.2 Método de estimação dos parâmetros α e β . . . . . . . . . . . . . p. 138
12.3 Decomposição da variância total . . . . . . . . . . . . . . . . . . . . . . . p. 140
12.4 Análise de Variância da Regressão . . . . . . . . . . . . . . . . . . . . . p. 141
12.5 Coeficiente de determinação . . . . . . . . . . . . . . . . . . . . . . . . . p. 143
12.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 144
Referências p. 145
9
1 Introdução Geral
1.1 A Estatística
Para algumas pessoas, a Estatística não é senão um quadro de colunas mais ou
menos longas de números que dizem respeito à população, à indústria ou ao comércio,
como se vê frequentemente em revistas; para outras, ela dá gráficos mostrando a vari-
ação no tempo de um fato econômico ou social, a produção ou os números relativos aos
negócios de uma empresa, assim como se encontra nos escritórios de empresas privadas.
A utilização da Estatística é cada vez mais acentuada em qualquer atividade profis-
sional da vida moderna. Nos mais diversificados ramos de atuação, as pessoas estão
frequentemente expostas à Estatística, utilizando-a com maior ou menor intensidade. Isto
se deve às múltiplas aplicações que o método estatístico proporciona àqueles que dele
necessita.
A razão pela qual consideramos a Estatística uma ferramenta importante para tomada
de decisões está no fato de que ela não deve ser considerada como um fim em si própria,
mas como um instrumento fornecedor de informações que subsidiarão, em consequência,
a tomada de melhores decisões, baseadas em fatos e dados.
Podemos considerar a Estatística como a ciência que se preocupa com a coleta, or-
ganização, descrição, análise e interpretação dos dados experimentais, ou oriundos de
estudos observacionais visando a tomada de decisões.
Dentro dessa idéia, podemos considerar a Ciência Estatística como dividida basica-
mente em duas partes: A Estatística Descritiva, que se preocupa com a organização e
descrição dos dados experimentais, e a Estatística Indutiva, que cuida da sua análise e
interpretação.
10
1.2 Estatística Descritiva
Principalmente em pesquisa social, o analista defronta-se amiúde com a situação de
dispor de tantos dados que se torna difícil absorver completamente a informação que está
procurando investigar. É extremamente difícil captar intuitivamente todas as informações
que os dados contêm. É necessário, portanto, que as informações sejam reduzidas até o
ponto em que se possa interpretá-las mais claramente. Em outras palavras, é indispen-
sável resumí-las, através do uso de certas medidas-sínteses, mais comumentes conheci-
das como estatística descritiva ou simplesmente estatísticas. Por conseguinte, a estatística
descritiva é um número que sozinho descreve uma característica de um conjunto de dados.
Trata-se, portanto, de um número-resumo que possibilita reduzir os dados a proporções
mais facilmente interpretáveis.
Em um sentido mais amplo, a Estatística Descritiva pode ser interpretada como uma
função cujo objetivo é a observação de fenômenos de mesma natureza, a coleta de dados
numéricos referentes a esses fenômenos, a organização e a classificação desses dados
observados e a sua apresentação através de gráficos e tabelas, além do cálculo de coefi-
cientes (estatísticas) que permitem descrever resumidadamente os fenômenos.
1.3 A Natureza da Estatística(Classificação das variáveis
Variável é uma característica de uma unidade que será medida a partir daquela unidade
da amostra. Podemos descrever dois tipos de variáveis para estudo:
Variáveis Qualitativas: Podem ser separados em diferentes categorias, atributos, que
se distinguem por alguma característica não numérica. como nos seguintes exemplos:
a) População: alunos de uma universidade Variável: sexo (masculino ou feminino).
b) População: moradores de uma cidade Variável: tipo de habitação (casa, aparta-
mento, barraco, etc.).
c) População: peças produzidas por uma máquina Variável: qualidade (perfeita ou
defeituosa).
d) População Brasileira Variável: cor da pele (branca, preta, amarela, vermelha, parda).
11
Variáveis Quantitativas: Quando suas medidas consistem em números que repre-
sentam contagens ou medidas. Pode ser subdivida em:
1 - quantitativa discreta: pode assumir apenas valores pertences a um conjunto enu-
merável;
2 - quantitativa contínua: pode assumir qualquer valor em um certo intervalo de vari-
ação.
Alguns exemplos de variáveis quantitativas discretas são:
a) População: habitações de uma cidade. Variável: número de banheiros.
b) População: casais residentes em uma cidade. Variável: número de filhos.
c) População: aparelhos produzidos em uma linha de montagem. Variável: número de
defeitos por unidade.
d) População: Bolsa de valores de São Paulo. Variável: número de ações negociadas.
1.4 Fases do Método Estatístico
O método estatístico abrange as seguintes fases:
a) Definição do Problema
Consiste na:
- formulação correta do problema;
- examinar outros levantamentos realizados no mesmo campo (revisão da literatura);
- saber exatamente o que se pretende pesquisar definindo o problema corretamente
(variáveis, população, hipóteses, etc.)
b) Planejamento
Determinar o procedimento necessário para resolver o problema:
12
- Como levantar informações;
- Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial).
- Cronograma, Custos, etc.
c) Coleta ou levantamento dos dados
Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer.
A coleta pode ser:
Direta - diretamente da fonte;
Indireta - feita através de outras fontes. Os dados podem ser obtidos pela própria
pessoa (primários) ou se baseia no registro de terceiros (secundários).
d) Apuração dos dados ou sumarização
Consiste em resumir os dados, através de uma contagem e agrupamento. É um tra-
balho de coordenação e de tabulação.
Apuração: manual, mecânica e eletrônica.
e) Apresentação dos dados
É a fase em que vamos mostrar os resultados obtidos na coleta e na organização.
Esta apresentação pode ser:
Tabular (apresentação numérica)
Gráfica (apresentação geométrica)
f) Análise e interpretação dos dados
É a fase mais importante e também a mais delicada. Tira conclusões que auxiliam o
pesquisador a resolver seu problema.
13
1.5 Pesquisas e Dados
Antes de iniciar a análise de uma base de dados, é preciso determinar corretamente
que tipo de dados está disponível. Disso depende o tipo de análise a ser feito e a ferra-
menta a ser utilizada.
Pesquisa Estatística: É qualquer informação retirada de uma população ou amostra,
podendo ser através de Censo ou Amostragem.
Dados Estatísticos: Dados são observações documentadas ou resultados da medição.
Os dados podem ser obtidos pela percepção através dos sentidos (por exemplo obser-
vação) ou pela execução de um processo de medição.
Antes de iniciar a análise de uma base de dados, é preciso determinar corretamente
que tipo de dados está disponível. Disso depende o tipo de análise a ser feito e a ferra-
menta a ser utilizada.
Dados primários: são aqueles que não foram antes coletados, estando ainda em
posse dos pesquisados, e que são coletados com o propósito de atender às necessi-
dades específicas da pesquisa em andamento. As fontes básicas de dados primários são:
pesquisado, pessoas que tenham informações sobre o pesquisado e situações similares.
Dados secundários: são aqueles que já foram coletados, tabulados, ordenados e, às
vezes, até analisados e que estão catalogados à disposição dos interessados. As fontes
básicas de dados secundários são: a própria empresa, publicações, governos, Instituições
não governamentais e serviços padronizados de informações de marketing.
1.6 Conceitos básicos
População: Conjunto de todos os elementos relativos a um determinado fenômeno
que possuem pelo menos uma característica em comum, a população é o conjunto Uni-
verso, podendo ser finita ou infinita.
Amostra: É um subconjunto da população e deverá ser considerada finita, a amostra
14
deve ser selecionada seguindo certas regras e deve ser representativa, de modo que ela
represente todas as características da população como se fosse uma fotografia desta.
Amostragem: É o processo de retirada de informações dos "n"elementos amostrais,
no qual deve seguir um método criterioso e adequado (tipos de amostragem).
Censo: é a coleção de dados relativos a todos elementos da população.
Estatística: é uma medida numérica que descreve uma característica da amostra.
Parâmetro: é a medida numérica que descreve uma característica da população.
Estatística Descritiva: envolve a organização e sumarização dos dados através de
metodologias simples.
Estatística Inferencial: é a parte da estatística que envolve a análise e interpretação
da amostra.
1.7 Tabelas Estatísticas
Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis po-
dem assumir, para que tenhamos uma visão global da variação das mesmas.
Tabela: é uma maneira de apresentar de forma resumida um conjunto de dados
1.8 Elementos de uma Tabela
1) Título: O título deve responder as seguintes questões:
- O que? (Assunto a ser representado (Fato));
- Onde? (O lugar onde ocorreu o fenômeno (local));
- Quando? (A época em que se verificou o fenômeno (tempo)).
2) Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada
coluna.
15
3) Corpo: parte da tabela composta por linhas e colunas.
4) Linhas: parte do corpo que contém uma seqüência horizontal de informações.
5) Colunas: parte do corpo que contém uma seqüência vertical de informações.
6) Coluna Indicadora: coluna que contém as discriminações correspondentes aos
valores distribuídos pelas colunas numéricas.
7) Casa ou Célula: parte da tabela formada pelo cruzamento de uma linha com uma
coluna.
8) Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colo-
cadas as notas de natureza informativa (fonte, notas e chamadas).
9) Fonte: refere-se à entidade que organizou ou forneceu os dados expostos.
10) Notas e Chamadas: são esclarecimentos contidos na tabela (nota - conceituação
geral; chamada - esclarecer minúcias em relação a uma célula).
1.9 Representação esquemática
1.10 Distribuição de Frequências
1.10.1 Conceitos
Dados Brutos: é a relação de elementos que não foram numericamente organizados.
16
Ex : 45, 41, 42, 41, 42, 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
Rol: é uma lista em que os valores estão dispostos em uma determinada ordem, cres-
cente ou decrescente.
Ex : 41, 41, 41, 42, 42, 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Tabela de Frequências: são representações nas quais os valores se apresentam em
correspondência com suas repetições.
1.10.2 Distribuição de frequência sem intervalos de classe
É a simples condensação dos dados conforme as repetições de seu valores.
Exemplo:
Tabela 1: Distribuição do número de alunos em 20 turmas da UFCG
i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total
Dados 41 42 43 44 45 46 50 51 52 54 57 58 60
∑13
i=1 fi
(fi) 3 2 1 1 1 2 2 1 1 1 1 2 2 20
A soma das frequências é sempre igual ao número total de valores observados.
k∑
i=1
fi = n
1.10.3 Distribuição de frequência com intervalos de classe
Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos
valores em vários intervalos de classe.
Exemplo:
17Tabela 2: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi
1 41 ` 45 7
2 45 ` 49 3
3 49 ` 53 4
4 53 ` 57 1
5 57 ` 61 5
Total
∑5
i=1 fi 20
1.10.4 Elementos de uma Distribuição de Frequência
Frequência Simples Absoluta: é o número de observações correspondentes a uma
classe ou valor individual. É simbolizada por fi.
Amplitude TotalAt: É a diferença entre o maior e o menor valor observado da variável
em estudo. Ex: na tabela anterior At = 60− 41 = 19.
Classe: são os intervalos de variação da variável e é simbolizada por i e o número
total de classes simbolizada por k. Ex: na tabela anterior k = 5 e 49 ` 53 é a terceira
classe, em que i = 3.
Limites de Classe: são os extremos de cada classe. O menor número é o limite
inferior de classe (li) e o maior número, limite superior de classe(Li). Ex: em 49 ` 53,
l3 = 49 e L3 = 53. O símbolo ` representa um intervalo fechado à esquerda e aberto à
direita.
Amplitude do Intervalo de Classe: é obtida através da diferença entre o limite su-
perior e inferior da classe e é simbolizada por hi = Li − li. Ex: na tabela anterior
hi = 53− 49 = 4.
Ponto Médio de Classe xi: é o ponto que divide o intervalo de classe em duas partes
iguais. Ex: em 49 ` 53 o ponto médio x3 = (53 + 49)/2 = 51, ou seja x3 = (L3 + l3)/2.
18
1.10.5 Método Prático para construção de uma distribuição de fre-
quências com classe
1 - Organize os dados brutos em um ROL.
2 - Calcule a amplitude total At.
3 - Calcule o número de classes através da "Regra de Sturges".
k = 1 + 3, 3 log n
em que k é o número de classes e n é o número total de observações
4 - Calcule a amplitude do intervalo de classe h = At
k
.
No nosso exemplo: At = 19 e k = 5, logo h = 3, 8. Utilizaremos então h = 4
1.10.6 Tipos de Frequências
Frequência Simples Absoluta fi: é o número de repetições de um valor individual ou
de uma classe de valores da variável.
Frequência Simples Relativa fri: representa a proporção de observações de um
valor individual ou de uma classe, em relação ao número total de observações.
fri =
fi∑k
i=1 fi
=
fi
n
Em termos percentuais tem-se
fri =
fi
n
· 100
Exemplo:
Frequência Absoluta Acumulada "Abaixo de"Fi: é a soma da frequência simples
19
Tabela 3: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi fri Frequências
relativas
percentuais
1 41 ` 45 7 0,35 35%
2 45 ` 49 3 0,15 15%
3 49 ` 53 4 0,20 20%
4 53 ` 57 1 0,05 5%
5 57 ` 61 5 0,25 25%
Total
∑5
i=1 fi 20 1,00 100%
absoluta dessa classe ou desse valor com as frequências simples absolutas das classes
ou dos valores anteriores.
Exemplo:
Tabela 4: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi Fi
1 41 ` 45 7 7
2 45 ` 49 3 7 + 3 = 10
3 49 ` 53 4 7 + 3 + 4 = 14
4 53 ` 57 1 7 + 3 + 4 + 1 = 15
5 57 ` 61 5 7 + 3 + 4 + 1 + 5 = 20
Total
∑5
i=1 fi 20 −
Frequência Absoluta Acumulada "Acima de"Fi: é a soma da frequência simples
absoluta dessa classe ou desse valor com as frequências simples absolutas das classes
ou dos valores posteriores.
Exemplo:
1.11 Representação Gráfica
Os gráficos são uma forma de apresentação visual dos dados. Normalmente, contém
menos informações que as tabelas, mas são de mais fácil leitura. O tipo de gráfico depende
da variável em questão.
20
Tabela 5: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi Fi
1 41 ` 45 7 5 + 1 + 4 + 3 + 7 = 20
2 45 ` 49 3 5 + 1 + 4 + 3 = 13
3 49 ` 53 4 5 + 1 + 4 = 10
4 53 ` 57 1 5 + 1 = 6
5 57 ` 61 5 5
Total
∑5
i=1 fi 20 −
1.12 Gráficos utilizados para a análise de uma distribuição
de freqüência
1.12.1 Histograma
São os gráficos mais importantes na estatística inferencial. Quando os dados são
valores de uma variável medida numa escala intervalar/proporcional, uma tabela de fre-
quências para cada uma das classes mostra a distribuição de valores dessa variável. Esta
distribuição pode ser representada graficamente num histograma.
1.12.2 Polígono de Freqüências
Unindo por linhas retas os pontos médios das bases superiores dos retângulos do his-
tograma, obtém-se outra representação dos dados, denominada Polígono de Frequências.
21
1.12.3 Ogivas
A Ogiva tem por finalidade a representação gráfica das tabelas de frequências acumu-
ladas.
1.12.4 Gráfico por linha
É a representação gráfica de uma série estatística por meio de uma linha poligonal. é
um dos mais importantes gráficos; representa observações feitas ao longo do tempo, em
intervalos iguais ou não. Tais conjuntos de dados constituem as chamadas séries históricas
ou séries temporais. Traduzem o comportamento de um fenômeno em certo intervalo de
tempo.
22
1.12.5 Gráfico por colunas
É a representação de uma série estatística por intermédio de retângulos em posições
verticais. Este tipo de gráficos proporciona comparar grandezas.
1.12.6 Diagrama por Superfície em Setores
É a representaçao gráfica de uma série estatística por intermédio de superfícies seto-
riais. É utilizado quando se pretende comparar os valores de uma série com a sua soma
total. A representaçao é feita tomando como figura básica um círculo que é dividido em se-
23
tores. O quociente entre a soma dos valores da série e a área do círculo deve ser o mesmo
que entre cada valor da variável dependente e a respectiva área do setor representativo.
Porém em virtude da proporcionalidade das áreas dos setores de um círculo com seus
ângulos centrais, podem-se dividir os valores considerados na série proporcionalmente a
estes ângulos.
24
2 Análise Exploratória de Dados
2.1 Medidas de Posição
As medidas de posição, também chamada de medidas de tendência central, possuem
três formas diferentes para três situações distintas:
• MÉDIA
• MODA
• MEDIANA
2.1.1 Média
Existem dois tipos de média:
• POPULACIONAL, representada pela letra grega µ.
• AMOSTRAL, representada por x̄.
1 - Média: (Dados não agrupados)
Sejam os elementos x1, x2, . . . , xn de uma amostra, portanto "n"valores da variável
X. A média aritmética da variável aleatória X é definida por,
x̄ =
x1 + x2 + . . .+ xn
n
=
∑n
i=1 xi
n
25
Exemplo: Suponha o conjunto de dados que representa o peso ao nascer de bez-
erros da raça Nelore: 51, 40, 46, 48, 54, 56, 44, 43, 55 e 57. Determinar a média
aritmética simples deste conjunto de dados.
x̄ =
51 + 40 + 46 + 48 + 54 + 56 + 44 + 43 + 55 + 57
10
=
494
10
= 49, 4
2 - Média: (Dados agrupados em uma distribuição de frequência por valores simples)
Usa-se a média aritmética dos valores x1, x2, . . . , xn ponderados pelas respectivas
frequências absolutas: f1, f2, . . . , fn. Assim
x̄ =
x1f1 + x2f2 + . . .+ xnfn
n
=
∑n
i=1 xifi
n
Exemplo:
Tabela 6: Distribuição do número de alunos em 20 turmas da UFCG
i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total
Dados (xi) 41 42 43 44 45 46 50 51 52 54 57 58 60
∑13
i=1 fi
(fi) 3 2 1 1 1 2 2 1 1 1 1 2 2 20
xifi 123 84 43 44 45 92 100 51 52 54 57 116 120 981
Portanto:
x̄ =
981
20
= 49, 05
3 - Média: (Dados agrupados em uma distribuição de frequência por classes)
Usaremos a média aritmética dos pontos médios x1, x2, . . . , xn de cada classe, pon-
derados pelas respectivas frequências absolutas: f1, f2, . . . , fn. Assim
x̄ =
x1f1 + x2f2 + . . .+ xnfn
n
=
∑n
i=1 xifi
n
Exemplo:
26
Tabela 7: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi xi xifi
1 41 ` 45 7 43 301
2 45 ` 49 3 47 141
3 49 ` 53 4 51 204
4 53 ` 57 1 55 55
5 57 ` 61 5 59 295
Total
∑5
i=1 fi 20 − 996
Portanto:
x̄ =
996
20
= 49, 80
2.1.2 Moda
É o valor mais frequente da distribuição.
1 - Moda (Mo): (Dados não agrupados)
Sejam os elementos x1, x2, . . . , xn de uma amostra, o valor da moda para este tipo
de conjunto de dados é simplesmente o valor com maior frequência.
Exemplo: Obter a moda dos seguintes conjuntos de valores:
X = {4, 5, 5, 6, 6, 6, 7, 7, 8, 8}, Moda de X: Mo = 6.
Y = {1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 6, 6}, Moda de Y : Mo1 = 2 e Mo2 = 5.
W = {1, 2, 3, 4, 5} Moda de W : amodal
2 - Moda (Mo): (Dados agrupados em uma distribuição de frequênciapor valores
simples)
Para este tipo de distribuição, a identificação da moda é facilitada pela simples ob-
servação do elemento que apresenta maior frequência.
27
Tabela 8: Distribuição do número de alunos em 20 turmas da UFCG
i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total
Dados (xi) 41 42 43 44 45 46 50 51 52 54 57 58 60
∑13
i=1 fi
(fi) 3 2 1 1 1 2 2 1 1 1 1 2 2 20
Exemplo:
Portanto, se a maior frequência é fi = 3, logo Mo = 41.
3 - Moda (Mo): (Dados agrupados em uma distribuição de frequência por classes)
Para dados agrupados em classes, temos diversos métodos para o cálculo da moda.
Utilizaremos aqui o Método de Czuber denotado a seguir:
Método de Czuber
Procedimento:
– Identifica-se a classe modal (aquela que possuir maior frequência) CLASSE
(Mo).
– Utiliza-se a fórmula:
Mo = li + h ·
∆1
∆2 + ∆1
em que:
li = Limite inferior da classe modal.
∆1 = fmo − fant (frequência modal − frequência anterior)
∆2 = fmo − fpost (frequência modal − frequência posterior)
h = amplitude da classe modal
Exemplo:
Determinar a moda, pelo método de Czuber, usando os dados do exemplo
tem-se que:
Classe (Mo): 41 ` 45
li = 41
28
Tabela 9: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi
1 41 ` 45 7
2 45 ` 49 3
3 49 ` 53 4
4 53 ` 57 1
5 57 ` 61 5
Total
∑5
i=1 fi 20
h = 4
∆1 = fmo − fant = 7− 0 = 7
∆2 = fmo − fpost = 7− 3 = 4
Mo = 41 + 4 · 7
7 + 4
= 43, 54
2.1.3 Mediana
Construído o ROL, o valor da mediana é o elemento que ocupa a posição central, ou
seja, é o elemento que divide a distribuição em 50% de cada lado.
1 - Mediana (Md): (Dados não agrupados)
Sejam os elementos x1, x2, . . . , xn de uma amostra, portanto "n"valores da variável
X. A mediana da variável aleatória X é definida através do Elemento Mediano EMd,
– O número de observações é ímpar, então o valor da mediana será o valor local-
izado na posição EMd = n+12 ;
– O número de observações é par, então o valor da mediana será a média entre
o valor da posição EMd = n2 e o seu valor consecutivo.
Exemplo 1: Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8,
10 e 11. Determinar a mediana deste conjunto de dados.
29
Como n = 5, então o valor da mediana estará localizado na posição EMd = 5+12 = 3.
Portanto,
Md = 8
Exemplo 2: Suponha o conjunto de tempo de serviço de seis funcionários: 3, 7, 8,
10, 11 e 13. Determinar a mediana deste conjunto de dados.
Como n = 6, então o valor da mediana estará localizado na posição EMd = 62 = 3 e
na posição consecutiva obtendo uma média aritmética desses valores. Portanto,
Md =
8 + 10
2
= 9
2 - Mediana (Md): (Dados agrupados em uma distribuição de frequência por valores
simples)
Quando os valores da variável estiverem já tabulados, o procedimento a ser adotado
será praticamente idêntico ao anterior. Deve-se verificar se o número de observações
é ímpar ou par, para o cálculo do elemento mediano. Em seguida acrescenta-se uma
coluna à tabela de frequências original, onde serão determinadas as frequências
acumuladas.
Exemplo:
Tabela 10: Distribuição do número de alunos em 20 turmas da UFCG
i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total
Dados (xi) 41 42 43 44 45 46 50 51 52 54 57 58 60
∑13
i=1 fi
(fi) 3 2 1 1 1 2 2 1 1 1 1 2 2 20
(Fi) 3 5 6 7 8 10 12 13 14 15 16 18 20 -
Portanto:
EMd =
20
2
= 10, logo, Md = 46+50
2
= 48
3 - Mediana (Md): (Dados agrupados em uma distribuição de frequência por classes)
Procedimento:
– Calcula-se o elemento mediano EMd
30
– Pela Fi identifica-se a classe que contém o valor da mediana - CLASSE(Md)
– Utiliza-se a fórmula:
Md = li + h ·
EMd − Fant
fMd
em que:
li = Limite inferior da classe mediana;
Fant = Frequência acumulada anterior à classe mediana;
h = Amplitude da classe mediana;
fMd = Frequência absoluta simples da classe mediana.
Exemplo:
Tabela 11: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi Fi
1 41 ` 45 7 7
2 45 ` 49 3 10
3 49 ` 53 4 14
4 53 ` 57 1 15
5 57 ` 61 5 20
Total
∑5
i=1 fi 20 −
Portanto:
EMd =
20
2
= 10
CLASSE(Md) = 45 ` 49
Md = 45 + 4 · 10− 7
3
= 45 + 4 = 49
31
2.2 Quartis, Decis e Percentis (ou Centis)
Há uma série de medidas de posição semelhantes na sua concepção à mediana,
embora não sejam medidas de tendência central. Como se sabe, a mediana divide a
distribuição em duas partes iguais quanto ao número de elementos de cada parte. Já
os quartis permitem dividir a distribuição em quatro partes iguais quanto ao número
de elementos cada uma; os decis em dez partes e os centis em cem partes iguais.
Para simbolizar cada uma dessas medidas separatrizes, faremos:
Qi = quartis i = 1, 2, 3
Di = decis i = 1, 2, 3, . . . , 9
Ci = centis i = 1, 2, 3, . . . , 99
Assim, para dividir uma série ordenada de valores em quatro partes iguais, pre-
cisamos de três separatrizes (quartis); para dividi-la em dez, iremos recorrer a nove
separatrizes (decis); em cem, recorremos a noventa e nove separatrizes (centis). O
gráfico a seguir ilustra melhor o que foi dito em relação aos quartis e decis:
2.3 Quartis
2.3.1 Primeiro Quartil: Q1
Definição: Dado um conjunto ordenado (ordem crescente) de valores, o primeiro
quartil, Q1, é o valor que divide o conjunto em duas partes tais que um quarto ou
32
vinte e cinco por cento dos valores sejam menores d que ele e três quartos ou setenta
e cinco por cento dos restantes sejam maiores. O elemento que indica a ordem ou
posição do primeiro quartil é determinado, para dados agrupados em classes, pela
seguinte expressão:
EQ1 =
n
4
em que n é o número de valores do conjunto, ou número de observações.
2.3.2 Segundo Quartil: Q2 ou Md
Definição: Dado um conjunto ordenado de valores, o segundo quartil ou mediana
é o valor que divide em duas partes iguais quanto ao número de elementos, isto é,
cinquenta por cento ou dois quartos dos valores do conjunto são menores, e os dois
quartos restantes sao maiores do que ele. O elemento mediano é calculado, como
veremos, através da seguinte expressão:
EQ2 =
2n
4
=
n
2
2.3.3 Terceiro Quartil: Q3
Definição: Dado um conjunto ordenado (ordem crescente) de valores, o terceiro quar-
til é o valor que divide o conjunto em duas partes tais que setenta e cinco por cento
ou tres quartos dos valores sejam menores e vinte e cinco por cento ou um quarto
sejam maiores do que ele. O elemento que indica a ordem em que n encontra o
terceiro quartil é calculado, para dados tabulados, como segue:
EQ3 =
3n
4
Genericamente, para determinar a ordem ou posição do quartil a ser calculado, us-
aremos a seguinte expressão:
33
EQi =
in
4
em que i indica o número do quartil a ser calculado e n o número de elementos ou
observações da amostra.
2.4 Decis Di
A definição dos decis obedece ao mesmo princípio da dos quartis, com a modifi-
cação da porcentagem de valores que ficam aquém e além do decil que se pretenda
clacular. Assim, por exemplo:
2.4.1 Primeiro Decil: D1
O primeiro decil de um conjunto ordenado (ordem crescente) de valores é o valor
que divide um conjunto em duas partes tais que dez por cento ou um décimo dos
valores sejam menores e nove décimos ou noventa por cento sejam maiores do que
ele. O elemento que indica a posição do segundo decil é calculado pela seguinte
expressão:
ED1 =
n
10
2.4.2 Segundo Decil: D2
Trata-se do valor que divide o conjunto em duas partes, tais que vinte por cento ou
dois décimos dos valores sejam menores e oitenta por cento ou oito décimos dos
valores sejam maiores; para saber a ordem do segundo decil, usamos a expressão:
ED2 =
2n
10
De especial interesse é o quinto decil, que divide o conjunto em duas partes, tais que
cinco décimos ou cinquenta por cento dos valores sejam menores e cinco décimos ou
cinquenta por cento dos valores restantes maiores do que ele. Assim sendo, o quinto
34
decil é igual ao segundo quartil, que por sua vez é igual à mediana. O elemento que
indica a ordem do quinto decil é igual ao elemento mediano, ou seja:
ED5 =
5n
10
=
n
2
=
2n
4
Podemos, então, afirmar queMd = D5 = Q2
De uma forma geral, para calcular os decis, recorreremos à seguinte expressão que
define a ordem em que o decil se encontra:
EDi =
in
10
em que n indica o número de valores observados e i o número que identifica o decil
a ser calculado.
2.5 Percentis ou Centis Ci
Neste caso, cada parte em que foram subdivididos os valores do conjunto, através
dos noventa e nove centis, contará com um centésimo ou um por cento dos valores
do conjunto.
O elemento que definirá a ordem do centil, em uma distribuição de frequências de val-
ores tabulados agrupados em classes, será encontrado pelo emprego da expressão:
ECi =
in
100
em que i é o número indicador do centil e n é o número total de observações.
É oportuno lembrar que os centis englobam todos os decis e quartis. Assim, por
exemplo:
2.5.1 Vigésimo Centil: C20
O vigésimo centil é igual ao segundo decil, por que
35
EC20 =
20n
100
= 0, 2n = ED2 =
2n
10
= 0, 2n
A fórmula de cálculo dos centis será:
Ci = l + h
ECi − Fant
fCi
Exemplo:Na Tabela abaixo figuram os dados correspondentes ao consumo de elet-
ricidade de 80 usuários. Calcular as seguintes medidas:
Tabela 12: Distribuição do consumo de eletricidade
i Classes fi
1 5 ` 25 4
2 25 ` 45 6
3 45 ` 65 14
4 65 ` 85 26
5 85 ` 105 14
6 105 ` 125 8
7 125 ` 145 6
8 145 ` 165 2
Total
∑13
i=1 fi 80
a) Trigésimo centil: C30
b) Décimo quinto centil: C15
c) Nono Decil: D9
d) Septuagésimo quinto centil: C75
e) Primeiro quartil: Q1
2.6 Medidas de Dispersão
As medidas de dispersão indicam se os valores estão relativamente próximos um dos
outros, ou separados em torno de uma medida de posição: a média. Consideraremos
três medidas de dispersão:
36
– DESVIO-PADRÃO
– VARIÂNCIA
– COEFICIENTE DE VARIAÇÃO
2.6.1 Desvio - Padrão
Mede o grau de dispersão dos dados numéricos em torno de um valor médio.
1 - Desvio - padrão S: (Dados Brutos)
Seja o seguinte conjunto de números x1, x2, . . . , xn. O desvio-padrão ou média
quadrática dos desvios ou afastamentos em relação à média desse conjunto será
definido por:
S =
√∑n
i=1(xi − x̄)2
n− 1
Exemplo: Calcular o desvio-padrão do conjunto 10, 12, 13, 20, 25, 34, 45.
sabe-se que x̄ = 22, 714
S =
√√√√ 1
7− 1
7∑
i=1
(xi − 22, 714)2 =
√
1
6
[(10− 22, 714)2 + . . .+ (45− 22, 714)2]
S =
√
1
6
× 1007, 43 = 12, 958
2 - Desvio - padrão S: (Dados Tabulados)
Quando os valores vierem dispostos em uma tabela de frequências, o cálculo do
desvio-padrão se fará através da seguinte fórmula:
37
S =
√∑n
i=1(xi − x̄)2fi
n− 1
Exemplo:
Tabela 13: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi xi (xi − x̄) (xi − x̄)2 (xi − x̄)2fi
1 41 ` 45 7 43 -6,8 46,24 323,68
2 45 ` 49 3 47 -2,8 7,84 23,52
3 49 ` 53 4 51 1,2 1,44 5,76
4 53 ` 57 1 55 5,2 27,04 27,04
5 57 ` 61 5 59 9,2 84,64 423,20
Total
∑5
i=1 fi 20 − − − 803,20
como x̄ = 49, 80, portanto:
S =
√
803, 20
20− 1
=
√
42, 27 = 6, 5
2.6.2 Variância
A variância de um conjunto de dados é a média dos quadrados dos desvios dos
valores a contar da média. A fórmula da variância poderá ser calculada de duas
formas:
– POPULACIONAL, representada letra grega σ2
– AMOSTRAL, representada por S2
1- Variância: (Dados não agrupados)
σ2 =
∑n
i=1(xi − µ)2
N
ou
S2 =
∑n
i=1(xi − x̄)2
n− 1
38
Exemplo:
Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11.
Determinar a variância deste conjunto de dados.
como x̄ = 7, 8
S2 =
(3− 7, 8)2 + (7− 7, 8)2 + (8− 7, 8)2 + (10− 7, 8)2 + (11− 7, 8)2
5− 1
=
S2 =
38, 4
4
= 9, 7
2 - Variância: (Dados Tabulados)
Quando os valores vierem dispostos em uma tabela de frequências, o cálculo da
variância se fará através da seguinte fórmula:
σ2 =
∑n
i=1(xi − µ)2fi
N
ou
S2 =
∑n
i=1(xi − x̄)2fi
n− 1
Exemplo:
Tabela 14: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi xi (xi − x̄) (xi − x̄)2 (xi − x̄)2fi
1 41 ` 45 7 43 -6,8 46,24 323,68
2 45 ` 49 3 47 -2,8 7,84 23,52
3 49 ` 53 4 51 1,2 1,44 5,76
4 53 ` 57 1 55 5,2 27,04 27,04
5 57 ` 61 5 59 9,2 84,64 423,20
Total
∑5
i=1 fi 20 − − − 803,20
39
como x̄ = 49, 80 e S = 6, 5, portanto
S2 =
803, 20
19
= 42, 27
2.6.3 Coeficiente de Variação
Trata-se de uma média relativa à dispersão, útil para a comparação e observação
em termos relativos do grau de concentração em torno da média de séries distintas.É
dado por:
CV =
S
x̄
· 100
Classificação da distribuição quanto à dispersão:
– Dispersão Baixa: CV ≤ 15%
– Dispersão Média: 15% < CV < 30%
– Dispersão Alta: CV ≥ 30%
Exemplo:1
Numa empresa o salário médio dos funcionários do sexo masculino é de R$ 4.000,00,
com um desvio padrão de R$ 1.500,00, e os funcionários do sexo feminino é em
média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00. Então:
Sexo Masculino: CV = 1.500
4.000
· 100 = 37, 5%
Sexo Feminino: CV = 1.200
3.000
· 100 = 40%
40
2.7 Exercícios
1. Classifique as seguintes variáveis como Qualitativas ou Quantitativas (discretas
ou contínuas).
a) Número de computadores em um laboratório de informática
b) Renda familiar
c) Volume de Petróleo extraído por hora de uma jazida
d) Grupo Sanguíneo
e) Qualidade de uma peça produzida
f) Intenção de voto para presidente (possíveis respostas são os nomes dos can-
didatos, além de "nao sei")
g) Precipitação pluviométrica
h) Magnitude de um sismo, na escala Richter
i) Tipo de grão de híbrido de milho
j) Número de vargens por planta
2. Os dados abaixo referem-se a resistência à ferrugem de 32 híbridos de milho
recomendados para a região de Chapecó, SC, safra 1987/88
Tabela 15: Distribuição de frequências da resistência à ferrugem de 32 híbridos de milho
recomendados para a região de Chapecó, SC, safra 1987/88
Resistência à
ferrugem
fi
r 10
mr 6
ms 9
s 7
Obtenha as frequências relativas fri e construa um gráfico de barras para rep-
resentar esses dados.
3. As fases principais do método estatístico são:
a) Coleta dos dados, amostragem, apresentação tabular e apresentação gráfica
e definição dos problemas.
b) Amostragem, apresentação tabular, apuração dos dados, interpretação dos
dados e planejamento.
41
c)Definição do problema, planejamento, coleta dos dados, apuração, apresen-
tação dos dados, análise e interpretação dos dados.
4. Os dados abaixo referem-se a 12 áreas plantadas de soja na safra de verão em
milhões de hectares.
9,7 11,5 13,2 10,7 13,2 9,7
11,6 9,8 13,0 10,4 11,3 13,2
Determine:
a) a média, a moda e a mediana das áreas plantadas de soja.
b) O desvio padrão, a variância e o coeficiente de variação.
5. Dada a tabela abaixo
Tabela 16: Produção agrícola na Paraíba em milhões de Reais, 2004-2009
Ano Produção em mil-
hões de R$
2004 4,5
2005 5,3
2006 4,9
2007 5,1
2008 6,8
2009 7,1
Construa um gráfico mais apropriado para os dados da tabela.
6. Os dados abaixo relacionados representam o número de focos de incêndios de-
tectados por satélite entre os Estados da Paraíba e Pernambuco nos primeiros
16 dias de Novembro de 2010.
13 18 9 10
6 11 10 14
10 11 15 12
14 8 13 7
Calcular a Média, a Moda, a Mediana, o Desvio padrão, a variância e coeficiente
de variação de forma direta (sem construir tabela) dos dados acima.
7. Os dados abaixo referem-se ao consumo de água, em m3, de 40 famílias de
baixa renda de uma determinada cidade no mês de Julho de 2011.
42
Faixa de
consumo
fri
10 ` 15 0,10
15 ` 20 0,15
20 ` 25 0,30
25 ` 30 0,25
30 ` 35 0,15
35 ` 40 0,05
a) Obtenha as frequências simples absolutas e construa o histograma.
b) Calcule a média, a variância e o desvio padrão.
c) Calcule a mediana e a moda
d) Qual o percentual de famílias que consumiram pelo menos 25 m3 de água?
8. Um estudo foi realizado por um professor em três turmas, obtendo a média e o
desvio padrão das notas de sua disciplina, conforme abaixo. Qual a turma com
menor variabilidade? Justifique adequadamente.
Turma A B C
Média 6,5 8,0 8,0
Desvio Padrao 2,2 1,7 2,0
9. Quarenta alunos da UFCG foram questionados quanto ao número de livros lidos
no ano anterior.Foram registrados os seguintes valores:
4 2 1 0 3 1 2 0 2 1
0 2 1 1 0 4 3 2 3 5
8 0 1 6 5 3 2 1 6 4
3 4 3 2 1 0 2 1 0 3
a) Organize os dados em uma tabela adequada.
b) Qual o percentual de alunos que leram menos do que 3 livros.
c) Qual o percentual de alunos que leram 4 ou mais livros.
d) Calcule a média, a moda e a mediana
e) Calcule o desvio padrão, a variância e o coeficiente de variação.
10. (UFPB - 2011)A tabela a seguir apresenta a quantidade exportada de certo
produto, em milhares de toneladas, no período de 2000 a 2009.
43
Considerando os dados apresentados na tabela, identifique as afirmativas cor-
retas:
I. A quantidade exportada, de 2006 a 2008, foi crescente.
II. A média da quantidade exportada, de 2003 a 2006, foi de 53 mil toneladas.
III. A moda da quantidade exportada, de 2000 a 2009, foi de 52 mil toneladas.
IV. A média da quantidade exportada, de 2000 a 2004, foi maior que a média de
2005 a 2008.
V. A mediana da quantidade exportada, de 2000 a 2009, foi de 51 mil toneladas.
11. (UFPB - 2002) O gráfico ao lado mostra a porcentagem de acertos nas questões
de um concurso onde havia 12000 inscritos. Com base nos dados apresen-
tados, determine a quantidade de candidatos que acertou pelo menos duas
questões.
12. Complete a tabela e indique a mediana da amostra.
44
xi fi Fi fri
1 2 0,025
2 12
3 58
4 0,2
5
13. De um exame final de Estatística, aplicado a 50 alunos da UFCG em 2011
resultaram as seguintes notas:
4,0 4,2 4,3 4,4 4,5 4,5 4,6 5,0 5,1 5,2
5,3 5,3 5,5 5,7 5,8 6,0 6,1 6,3 6,4 6,5
6,6 6,7 6,8 6,9 7,0 7,2 7,5 7,6 7,7 7,9
8,0 8,3 8,5 8,6 8,8 8,9 9,0 9,1 9,2 9,3
9,3 9,4 9,4 9,5 9,5 9,6 9,7 9,8 9,8 9,9
Construa uma tabela de distribuição de frequências com intervalo de classe
por meio da regra de Sturges. Calcule a média, a moda, a mediana, o desvio
padrão e o coeficiente de variação das notas após os dados estarem tabulados
por classe.
45
3 Probabilidade: Espaço amostral e
eventos
3.1 Experimentos Aleatórios
3.1.1 Tipos de fenômenos
Fenômenos determinísticos: são aqueles em que os resultados são sempre os mes-
mos, qualquer que seja o número de ocorrências verificadas.
Fenômenos aleatórios: são aqueles que, mesmo repetidos várias vezes sob condições
semelhantes, apresentam resultados imprevisíveis.
Exemplos:
– Lançamento de uma moeda honesta;
– Lançamento de um dado;
– Retirada de uma carta de um baralho completo com 52 cartas;
– Determinação da vida útil de um componente eletrônico.
3.2 Espaço Amostral
Define-se espaço amostral (Ω) ao conjunto de todos os resultados possíveis de um
experimento.
Nos exemplos citados anteriormente, os espaços amostrais são:
46
Ω = {c, r} ;
Ω = {1, 2, 3, 4, 5, 6} ;
Ω = {Ao, . . . , Ko, Ap, . . . , Kp, Ac, . . . , Kc, Ae, . . . , Ke} ;
Ω = {t ∈ </t ≥ 0}.
3.3 Eventos
Chamamos de evento (E) a qualquer subconjunto do espaço amostral Ω de um ex-
perimento aleatório.
Qualquer que seja o evento E, se E ⊂ Ω, então E é um evento de Ω.
– Se E = Ω, E é chamado evento certo
– Se E ⊂ Ω e E é um conjunto unitário, E é chamado evento elementar.
– Se E = φ, E é chamado evento impossível.
3.4 Classe dos eventos aleatórios
Definição: é o conjunto formado de todos os eventos (subconjuntos) do espaço
amostral. Para efeito de exemplo, consideremos o espaço amostral finito: Ω =
{e1, e2, e3, e4}. A classe dos eventos aleatórios é:
F (Ω) =

φ
{e1}, {e2}, {e3}, {e4}
{e1, e2}, {e1, e3}, {e1, e4}, {e2, e3}, {e2, e4}, {e3, e4}
{e1, e2, e3}, {e1, e2, e4}, {e1, e3, e4}, {e2, e3, e4}
{e1, e2, e3, e4}
47
Genericamente, se o número de pontos amostrais de um espaço amostral é n, então
o número de eventos de F é 2n.
3.5 Operações com eventos Aleatórios
Considere um espaço amostral finito Ω = {e1, e2, . . . , en}. Sejam A e B dois eventos
de F (Ω). As seguintes operações são definidas.
União
Definição: A∪B = {ei ∈ Ω/ei ∈ A ou ei ∈ B}, i = 1, . . . , n. Portanto, o evento união
é formado pelos pontos amostrais que pertençam a pelo menos um dos conjuntos.
Figura 1: A ∪B
Observações:
1) A ∪B = B ∪ A
2) A ∪ A = A
3) A ∪ φ = A
4) Se A ⊂ B ⇒ A ∪B = B (em particular A ∪ Ω = Ω)
48
Intersecção
Definição: A ∩ B = {ei ∈ Ω/ei ∈ A e ei ∈ B}, i = 1, . . . , n. Portanto, o evento
intersecção é formado pelos pontos amostrais que pertença simultâneamente aos
eventos A e B.
Figura 2: A ∩B
Observações:
1) A ∩B = B ∩ A
2) A ∩ A = A
3) A ∩ φ = φ
4) Se A ⊂ B ⇒ A ∩B = A (em particular A ∩ Ω = A)
5) (A ∩B) ∩ C = A ∩ (B ∩ C)
Complementação
Definição: Ω − A = Ā = Ac = {ei ∈ Ω/ei /∈ A} , i = 1, . . . , n. O complemento de
um evento A é, portanto, o evento contendo todos os resultados no espaço amostral
Ω que não pertençam a A.
Observações:
1) (Ac)c = A
2) A ∪ Ac = Ω
3) φc = Ω
4) A ∩ Ac = φ
49
Figura 3: Ā = Ac
5) Ωc = φ
Exemplo: Lançam-se duas moedas. Sejam A: saída de faces iguais e B: saída de
cara na primeira moeda.
Determinar os eventos: A ∪B, A ∩B, Ac, Bc, (A ∪B)c, (A ∩B)c, Ac ∩Bc, Ac ∪Bc,
B − A, A−B, Ac ∩B e Bc ∩ A.
3.6 Propriedades das operações
Sejam A, B e C eventos associados a um espaço amostral Ω. As seguintes pro-
priedades são válidas:
a) IDEMPOTENTES
A ∩ A = A
A ∪ A = A
b) COMUTATIVAS
A ∪B = B ∪ A
A ∩B = B ∩ A
c) ASSOCIATIVAS
A ∩ (B ∩ C) = (A ∩B) ∩ C
A ∪ (B ∪ C) = (A ∪B) ∪ C
50
d) DISTRIBUTIVAS
A ∪ (B ∩ C) = (A ∪B) ∩ (A ∪ C)
A ∩ (B ∪ C) = (A ∩B) ∪ (A ∩ C)
e) ABSORÇÕES
A ∪ (A ∩B) = A
A ∩ (A ∪B) = A
f) IDENTIDADES
A ∩ Ω = A
A ∪ Ω = Ω
A ∩ φ = φ
A ∪ φ = A
g) COMPLEMENTARES
Ωc = φ
φc = Ω
A ∩ Ac = φ
A ∪ Ac = Ω
(Ac)c = A
h) "LEIS DAS DUALIDADES"ou "LEIS DE MORGAN"
(A ∩B)c = Ac ∪Bc
(A ∪B)c = Ac ∩Bc
3.7 Partição de um Espaço Amostral
Definição: Dizemos que os eventos A1, A2, . . . , An formam uma partição do espaço
amostral Ω se:
a) Ai 6= φ, i = 1, . . . , n
51
Figura 4: Partição de um Espaço Amostral.
b) Ai ∩ Aj = φ para i 6= j
c) ∪ni=1Ai = Ω
3.8 Eventos Mutuamente Exclusivos ou Disjuntos
Definição: Dois eventos ditos mutuamente exclusivos ou disjuntos se A e B não
puderem ocorrer juntos, ou seja, a realização de um exclui a realização do outro.
Segue que A e B são disjuntos se A ∩B = φ.
Figura 5: Eventos Mutuamente Exclusivos ou Disjuntos.
52
3.9 Exercícios
1. Quais das seguintes relações são verdadeiras?
(a)(A ∪B) ∩ (A ∪ C) = A ∪ (B ∩ C).
(b) (A ∪B) = (A ∩B) ∪B.
(c) A ∩B = A ∪B.
(d) (A ∪B) ∩ C = A ∩B ∩ C.
(e) (A ∩B) ∩ (B ∩ C) = φ.
2. Lançam-se três moedas. Enumerar o espaço amostral e os eventos:
(a) faces iguais;
(b) cara na primeira moeda;
(c) coroa na segunda e terceira moedas.
53
4 Probabilidade: Definições
4.1 Definição Clássica de Probabilidade
Dado um experimento aleatório, sendo Ω o seu espaço amostral, vamos admitir que
todos os elementos de Ω tenham a mesma chance de acontecer, ou seja, que Ω é
um conjunto equiprovável.
Define-se probabilidade de um evento A (A ⊂ Ω) ao número real P (A), tal que:
P (A) =
número de resultados favoráveis a A
número de resultados possíveis
=
n(A)
n(Ω)
4.2 Definição Axiomática de Probabilidade
Para um dado experimento, é necessário atribuir para cada evento A no espaço
amostral Ω um número P (A) que indica a probabilidade de A ocorrer. Para satis-
fazer a definição matemática de probabilidade, este número P (A) deve satisfazer
três axiomas específicos:
Axioma 1: Para qualquer evento A, P (A) ≥ 0.
Axioma 2: P (Ω) = 1.
Axioma 3: Para qualquer sequência finita de eventos disjuntos A1, A2, . . . , An
P
(
n⋃
i=1
Ai
)
=
n∑
i=1
P (Ai)
54
4.2.1 Propriedades
P.1 - P (φ) = 0
P.2 - Para qualquer sequência infinita de eventos disjuntos A1, A2, . . .
P
(
∞⋃
i=1
Ai
)
=
∞∑
i=1
P (Ai)
P.3 - Para qualquer evento A,
P (Ac) = 1− P (A)
P.4 - Para qualquer evento A, 0 ≤ P (A) ≤ 1.
P.5 - Se A ⊂ B, então P (A) ≤ P (B).
P.6 - Para qualquer evento dois eventos A e B
P (A ∪B) = P (A) + P (B)− P (A ∩B)
P.7 - Se os eventos A1, A2, . . . , An formam uma partição do espaço amostral, então:
n∑
i=1
P (Ai) = 1
Exemplo 1: Considere o lançamentode dois dados, sendo os eventos A = {soma
dos números igual a 9}, B = {número do primeiro dado maior ou igual a 4} e C =
{soma dos números menor ou igual a 4}. Enumere os elementos de A, B, C, A∩B e
A ∩ C. Obtenha P (A ∪B) e P (A ∪ C)
55
4.3 Eventos Independentes
Suponha que dois eventos A e B ocorram independentes um do outro no sentido
que a ocorrência ou não de um deles tenha nenhuma relação e nenhuma influência
na ocorrência ou na não ocorrencia do outro. Nessas condições
P (A ∩B) = P (A) · P (B)
Definição: Dois eventos são independentes se P (A ∩B) = P (A) · P (B).
Problema
Sejam A e B eventos tais que P (A) = 0, 2, P (B) = P , P (A ∪ B) = 0, 6. Calcular P
considerando A e B:
a) Mutuamente exclusivos;
b) independentes.
Resolução
a) P (A∩B) = 0 como P (A∪B) = P (A) +P (B)−P (A∩B) vem 0, 6 = 0, 2 + p− 0
∴ P = 0, 4
b) P (A ∩B) = P (A) · P (B) = 0, 2 · P como P (A ∪B) = P (A) + P (B)− P (A ∩B)
vem 0, 6 = 0, 2 + P − 0, 2P ∴ 0, 4 = 0, 8P logo, P = 0, 5
4.4 Probabilidade Condicional
Se A e B são dois eventos, a probabilidade de A ocorrer, depois B ter aconte-
cido, é representada por P (A/B) (Probabilidade de A dado B) e é denominada
probabilidade condicional de A, depois de B ter ocorrido.
É portanto natural definir-se a probabilidade condicional P (A/B) como a proporção
56
da probabilidade total P (B) que é representada pela probabilidade P (A ∩ B). Por-
tanto, tem-se a seguinte definição
P (A/B) =
P (A ∩B)
P (B)
, dado P (B) > 0
Se P (B) = 0 a P (A/B) não é definida
ou, equivalentemente
P (B/A) =
P (A ∩B)
P (A)
, dado P (A) > 0
Se P (A) = 0 a P (B/A) não é definida.
Tiramos da definição da probabilidade condicional o chamado TEOREMA DO PRO-
DUTO: Sejam A ⊂ Ω e B ⊂ Ω. Então, P (A ∩ B) = P (B) · P (A/B) ou P (A ∩ B) =
P (A) · P (B/A).
Exemplo: Um grupo de 86 pessoas está assim formado:
Escolhendo-se, ao acaso, uma pessoa do grupo, qual a probabilidade de que seja:
a) Uma mulher que fez o curso de medicina ?
b) Uma pessoa que fez o curso de medicina ?
c) Um engenheiro dado que seja homem ?
d) Não ser médico dado que não seja homem ?
4.5 Probabilidade Total
Seja Ω o espaço amostral de um experimento, e considere K eventos A1, A2, . . . , Ak
em Ω tal que A1, A2, . . . , Ak sejam disjuntos e
⋃k
i=1 Ai = Ω. Diz-se, então, que estes
57
eventos formam uma partição de Ω.
Se os eventosA1, A2, . . . , Ak formam uma partição de Ω, eB é qualquer outro evento
em Ω, então:
B = (A1 ∩B) ∪ (A2 ∩B) ∪ . . . ∪ (Ak ∩B)
Como os K eventos do lado direito da equação anterior são disjuntos:
P (B) =
k∑
i=1
P (Ai ∩B)
Mas P (Aj ∩B) = P (Aj) · P (B/Aj) em que j = 1, 2, . . . , k. Então
P (B) =
k∑
i=1
P (Aj) · P (B/Aj)
Exemplo: Uma urna contém 3 bolas brancas e 2 amarelas. Uma segunda urna
contém 4 bolas brancas e 2 amarelas. Escolhe-se, ao acaso, uma urna e dela retira-
se, também ao acaso, uma bola. Qual a probabilidade de que seja branca?
4.6 Teorema de Bayes
Sejam os eventos j = 1, 2, . . . , k que formam uma partição do espaço amostral Ω tal
que P (Aj) > 0 para todo j = 1, 2, . . . , k e seja B qualquer evento tal que P (B) > 0.
Então, para i = 1, 2, . . . , k, temos:
P (Aj/B) =
P (Aj)P (B/Aj)∑k
i=1 P (Ai) · P (B/Ai)
(4.1)
Prova: Pela definição de probabilidade condicional,
58
P (Aj/B) =
P (Aj ∩B)
P (B)
O numerador da equação (1) é igual a P (Aj ∩ B) e o denominador é igual a P (B)
(pela fórmula para probabilidade total).
Exemplo: Em uma fábrica de parafusos, as máquinas A, B e C produzem 25, 35 e 40
por cento do total produzido, respectivamente. Da produção de cada máquina, 5, 4
e 2 por cento, respectivamente, são parafusos defeituosos. Escolhe-se ao acaso um
parafuso e se verifica ser defeituoso. Qual será a probabilidade de que o parafuso
venha da máquina A? Da B? Da C?
59
4.7 Exercícios
1. Dez fichas numeradas de 1 até 10 são misturadas em uma urna. Duas fichas,
numeradas (X, Y ), são extraídas da urna, sucessivamente e sem reposição.
Qual é a probabilidade de que seja X + Y = 10? (R= 4/45)
2. Considere o conjunto de números inteiros {1, 2, 3, . . . , 19, 20}, e, por meio de
um sorteio aleatório, retire um número. Se o número sorteado for ímpar, qual a
probabilidade de o número sorteado ser o número 13? ( R = 1/10)
3. A probabilidade de que o aluno A resolva determinado problema é 2/3 e a prob-
abilidade de que o aluno B o resolva é 4/5. Se ambos tentarem independen-
temente a resolução, qual a probabilidade do problema ser resolvido? ( R =
14/15)
4. Numa festa beneficente, foram vendidos 20 números em uma "rifa", e serão
sorteados dois prêmios. Qual a probabilidade de uma pessoa que tenha adquirido
quatro números ganhar os dois prêmios? (R = 3/95)
5. Um lote é formado por 10 animais sadios, quatro com problemas menores e dois
com problemas graves. Todos os animais são numerados e é feita a escolha de
um animal ao acaso. Ache a probabilidade de que:
a) ele não tenha problemas; (R =5/8)
b) ele não tenha problemas graves; (R = 7/8)
c) ele ou seja sadio ou tenha problemas graves. (R = 3/4)
6. Duas bolas vão ser retiradas sem reposição de uma urna que contém 2 bolas
brancas, 3 pretas e 4 verdes. Qual a probabilidade de que ambas
a) sejam verdes? (R = 1/6)
b) sejam da mesma cor? ( R = 5/18)
7. Uma urna contém 5 bolas brancas, 4 vermelhas e 3 azuis. Extraem-se 3 bolas
(uma após a outra). Achar a probabilidade de que:
a) nenhuma seja vermelha. (R= 14/55)
b) exatamente uma seja vermelha. (R = 28/55)
c) todas sejam da mesma cor. (R= 4/55)
8. Numa população composta por 200 animais de duas raças X e Y , os animais
podem ser fecundos e não fecundos. Vinte por cento dos animais da raçaX são
60
fecundos; trinta por cento dos animais da raça Y sao não fecundos e setenta e
cinco por cento dos animais são da raça X. Escolhe-se um animal ao acaso.
Determine a probabilidade desse animal:
a) ser da raça Y dado que é fecundo; (R = 0,55)
b) ser não fecundo dado que é da raça Y .( R = 0,30)
9. Uma indústria produz determinado tipo de peça em três máquinas M1,M2 e
M3. A Máquina M1 produz 40% das peças, enquanto M2 e M3 produzem
30% cada uma. As porcentagens de peças defeituosas produzidas por essas
máquinas são respectivamente iguais a 1%, 4% e 3%. Se uma peça é sele-
cionada aleatóriamente da produção total, qual é a probabilidade dessa peça
ser defeituosa? (R = 0,025)
10. A urna A contém 3 fichas vermelhas e 2 azuis, e a urna B contém 2 vermelhas
e 8 azuis. Joga-se uma moeda honesta. Se a moeda der cara, extrai-se uma
ficha da urna A; se der coroa, extrai-se uma ficha da urna B. Uma ficha vermelha
é extraída. Qual a probabilidade de ter saído cara no lançamento? (R = 3
4
)
11. Num certo colégio, 4% dos homens e 1% das mulheres têm mais de 1,75 de
altura. 60% dos estudantes são mulheres. Um estudante é escolhido ao acaso
e tem mais de 1,75 m. Qual a probabilidade de que seja homem? ( R = 8
11
=
0, 7272)
12. A e B jogam 120 partidas de xadrez, das quais A ganha 60, B ganha 40 e 20
terminam empatadas. A e B concordam em jogar 3 partidas. Determinar a
probabilidade de:
a) A ganhar todas a três; (R = 1
8
)
b) duas partidas terminarem empatadas; (R = 5
72
)
c) A e B ganharem alternadamente. (R = 5
36
)
13. Em uma prova caíram dois problemas. Sabe-se que 132 alunos acertaram o
primeiro, 86 erraram o segundo, 120 acertaram os dois e 54 acertaram apenas
um problema. Qual a probabilidade de que um aluno, escolhido ao acaso:
a) não tenha acertado nenhum problema? ( R = 37
124
)
b) tenha acertado apenas o segundo problema? (R = 21
124
)
14. São retiradas, com reposição, duas cartas de um baralho com 52 cartas. Qual
a probabilidade de que as duas sejam de ouros? (R = 1
16
)
61
15. Um lote de certo tipo de peças é formado de 9 peças boas, 2 com pequenos
defeitos e uma com defeito grave. Uma dessas peças é escolhida ao acaso.
Determine a probabilidade de que a peça escolhida:
a) não tenha defeito; ( R = 3
4
)
b) não tenha defeito grave. (R = 11
12
)
16. Suponha que A e B sejam eventos independentesassociados a um experi-
mento. Se a probabilidade de A ou B ocorrerem for igual a 0, 6, enquanto a
probabilidade da ocorrência de A for igual a 0, 4, determine a probabilidade da
ocorrência de B. (R = 0,33)
17. As probabilidades de que dois eventos independentes ocorram são p e q, re-
spectivamente. Qual a probabilidade:
a) de nenhum desses eventos ocorra? (R = (1− p)(1− q))
b) de que pelo menos um desses eventos ocorra? ( R = (p+ q − pq))
62
5 Variáveis Aleatórias discretas
5.1 Variáveis Aleatórias
Definição: Considere um experimento para o qual o espaço amostral é denotado por
Ω. Define-se variável aleatória como uma função que associa um valor real a cada
elemento do espaço amostral.
X : Ω −→ <
Representa-se as variáveis aleatórias por letras maiúsculas e suas ocorrências por
letras minúsculas.
Exemplo
Suponha o experimento "lançar três moedas". Seja X: número de ocorrências da
face cara . O espaço amostral do experimento é:
Ω = {(c, c, c), (c, c, r), (c, r, c), (c, r, r), (r, c, c), (r, c, r), (r, r, c), (r, r, r)}
Se X é o número de caras, X assume os valores 0, 1, 2 e 3.
63
Definição: Seja X uma variável aleatória (v.a.). Se o número de valores possíveis
de X (isto é, o seu contradomínio), for finito ou infinito enumerável, denominamos X
de variável aleatória discreta.
Definição: Seja X uma variável aleatória discreta. Portanto, o contradomínio de
X será formado por um número finito ou enumerável de valores x1, x2, . . .. A cada
possível resultado xi, associaremos um número p(xi) = P (X = xi), i = 1, 2, 3, . . .,
denominado probabilidade de xi. Os números p(xi) devem satisfazer às seguintes
condições:
a) p(xi) ≥ 0,
b)
∑∞
i=1 p(xi) = 1
A função p definida acima, é denominada função de probabilidade da variável
aleatória X. A coleção de pares [xi, p(xi)], i = 1, 2, . . ., é denominada distribuição
de probabilidade.
Exemplo
Lançam-se dois dados. Seja a v.a. X: soma das faces. Determinar a distribuição de
probabilidade da variável aleatória X.
64
5.2 Esperança de uma Variável Aleatória Discreta
Suponha que uma variável aleatória X possua uma distribuição discreta cuja função
é p(x). A esperança de X, denotada por E(X), é um número definido por:
µ = E(X) =
∑
x
x · p(x)
Exemplo: Suponha que uma v.a. X possa assumir somente quatro valores: -2, 0, 1
e 4, e que P (X = −2) = 0, 1; P (X = 0) = 0, 4; P (X = 1) = 0, 3; P (X = 4) =
0, 2.
Então:
E(X) = −2 · (0, 1) + 0 · (0, 4) + 1 · (0, 3) + 4 · (0, 2) = 0, 9
Propriedades da Esperança
P1. Se a é uma constante qualquer
E(a) = a
P2. Se a é uma constante qualquer
E(aX) = a · E(X)
P3. SeX1, X2, . . . , Xn são n variáveis aleatórias tais queE(Xi) existe (i = 1, 2, . . . , n),
então
E(X1 +X2 + . . .+Xn) = E(X1) + E(X2) + . . .+ E(Xn).
P4. Se X1, X2, . . . , Xn são n variáveis aleatórias independentes tais que E(Xi) ex-
iste (i = 1, 2, . . . , n), então
65
E
(
Πni=1Xi
)
= Πni=1E(Xi)
5.3 Variância de uma Variável Aleatória Discreta
Definição: Suponha que X é uma v.a. com média µ = E(X). A variância de x,
representada por V (X) é definida por
V (X) = E[(x− µ)2]
V (X) = E(X2)− [E(X)]2
Variáveis Aleatórias Discretas
Suponha que uma v.a. X possua uma distribuição discreta, cuja função é p(x). Então
V (X) =
∑
x
(x− µ)2 · p(x) =
∑
x
x2 · p(x)− µ2
Exemplo: Suponha que uma v.a. X possa assumir somente quatro valores: -2, 0, 1
e 4, e que P (X = −2) = 0, 1; P (X = 0) = 0, 4; P (X = 1) = 0, 3;
P (X = 4) = 0, 2.
Como visto anteriormente, E(X) = 0, 9. Então
V (X) =
∑
x(x − µ)2 · p(x) = (−2 − 0, 9)2 · (0, 1) + (0 − 0, 9)2 · (0, 4) + (1 − 0, 9)2 ·
(0, 3) + (4− 0, 9) · (0, 2) = 3, 09
Propriedades da Variância
P1. V (c) = 0 se e somente se c for uma constante.
P2. V (aX) = a2V (X). sendo a constante
66
P3. V (aX + b) = a2V (X). com a e b constantes
P4. V (X ± Y ) = V (X) + V (Y )± 2cov(X, Y ).
5.4 Função de Distribuição Acumulada
Definição: A função de distribuição da variável aleatória X, representada por Fx ou
simplesmente F , é definida por:
FX(x) = P (X ≤ x) =xi≤x P (xi)
Observações:
a) A função de distribuição de X é também frequentemente chamada de função de
distribuição acumulada de X.
b) A função FX(x) é não-decrescente quando x aumenta, isto é, se x1 < x2, então
FX(x1) ≤ FX(x2).
c) 0 ≤ F (x) ≤ 1
d) P (a < X ≤ b) = F (b)− F (a)
e) P (a ≤ X ≤ b) = F (b)− F (a) + P (X = a)
f) P (a < X < b) = F (b)− F (a)− P (X = b)
g) Para qualquer valor de x
P (X > a) = 1− F (a)
Teoremas
a) Se X for uma variável aleatória discreta,
FX(x) =
∑
j
P (xj)
67
onde o somatório é estendido a todos os índices j que satisfaçam a condição xj ≤ x
Exemplo
Suponhamos que a v.a. X tome os três valores 0,1, e 2, com probabilidades 1/3, 1/6
e 1/2, respectivamente. Então:
O gráfico de F está apresentado na Figura abaixo
68
5.5 Exercícios
1. Suponha que 0,4; 0,3; 0,2 e 0,1, respectivamente, sejam as probabilidades de
que nenhum, um dois ou três problemas com energia afetarão certa subdivisão
durante dado ano. Determine a média e a variância da variável aleatória X que
representa o número de problemas com energia que afeta essa subdivisão.
2. As probabilidades de que haja 0, 1, 2, 3 ou 4 partes defeituosas em uma
máquina quando três partes são amostradas da linha de produção são, respec-
tivamente: 0,05; 0,20; 0,40; 0,25 e 0,10. Determinar:
a) o número médio de partes defeituosas;
b) a variância V (X) ;
c) F (X) e esboçar seu gráfico.
d) P (2 < X ≤ 4).
3. A função de probabilidades da variável aleatória X é: P (X) = 1
5
, para
X = 1, 2, 3, 4, 5.
a) Calcule E(X) e V (X)
b) Calcule P (X ≥ 2) e P (X < 4)
c) Determine F (X) e esboce seu gráfico.
4. Suponha que a duração X de uma ligação telefônica, em minutos, seja dada
pela seguinte distribuição de probabilidades:
X 1 2 3 4
P (X) 0,2 0,5 0,2 0,1
a) Determine P (X ≤ 3) e P (2 ≤ X ≤ 3).
b) Calcule E(X) e V (X).
c) Obtenha F (X) e esboçe seu gráfico.
5. Uma urna tem 4 bolas brancas e 3 pretas. Retiram-se 3 bolas sem reposição.
Seja X: número de bolas brancas, determinar a distribuição de probabilidades
de X.
6. Fazer o exercício anterior considerando extração com reposição.
69
7. Um jogo consiste em se retirar, ao acaso, uma bola de uma caixa contendo 5
bolas brancas, 3 pretas e 2 vermelhas. Se a bola selecionada for branca ganha-
se R$ 10,00 e se for preta ou vermelha perdem-se, respectivamente, R$ 5,00 e
R$ 15,00. Qual é o lucro médio do jogo?
8. Calcule a esperança e a variância de g(X) = 2X + 3, onde X é a variável
aleatória com distribuição de probabilidade
X 0 1 2 3
P (X) 1/4 1/8 1/2 1/8
70
6 Distribuições Teóricas de
Probabilidades de Variáveis
Aleatórias Discretas
6.1 Distribuição de Bernoulli
Consideremos uma única tentativa de um experimento aleatório. Podemos ter sucesso
ou fracasso nessa tentativa.
Seja p a probabilidade de sucesso e q a probabilidade de fracasso, com p + q = 1,
ou seja, q = 1− p.
Seja X : número de sucessos em uma única tentativa do experimento. X assume o
valor 0 que corresponde ao fracasso, com probabilidade q, ou o valor 1, que corre-
sponde ao sucesso, com probabilidade p.
P (X = 0) = q e P (X = 1) = p
Nessas condições a variável aleatória X tem distribuição de BERNOULLI, e sua
função de probabilidade é dada por:
P (X = x) = px · q1−x
A esperança da distribuição de Bernoulli é E(X) = p e sua variância é
V (X) = pq
Exemplo: Uma urna contém 15 bolas brancas e 25 bolas vermelhas. Uma bola é
71
retirada da urna e a variável aleatória X anota o número de bolas brancas obtidas.
Calcule a média e a variância de X e determinar P (X).
Solução:
X = 0→ q = 25
40
= 5
8
X = 1→ p = 15
40
= 3
8
P (X = x) = (3
8
)x(5
8
)1−x
E(X) = p = 3
8
V (X) = pq = 3
8
· 5
8
= 15
64
6.2 Distribuição Binomial
Consideremos n tentativas independentes de um mesmo experimento aleatório. Cada
tentativa admite apenas dois resultados: fracasso com probabilidade q e sucesso
com probabilidade p, p + q = 1. As probabilidades de sucesso e fracasso são as
mesmas para cada tentativa.Seja X: número de sucessos em n tentativas.
Determinaremos a função de probabilidades da variável X, isto é, P (X = k).
Logo,
P (X = k) =
(
n
k
)
pkqn−k
A variável X tem distribuição binomial, com parâmetros n e p, e indicaremos pela
notação
X ∼ B(n, p)
72
Exemplo: Será extraida uma amostra de 5 indivíduos de uma grande população,
onde 60% são do sexo feminino. Qual a probabilidade de:
a) exatamente 3 dos indivíduos escolhidos ser do sexo feminino?
b) pelo menos um dos indivíduos ser do sexo feminino?
c) ao menos 3 (uma maioria) ser do sexo feminino ?
Solução: Se X é a v.a. que representa o número de indivíduos que são do sexo femi-
nino, temos que X segue uma distribuição binomial, cuja probabilidade de "sucesso"
(ser do sexo feminino) em cada tentativa é 0,60. Portanto,
a)
P (X = 3) =
(
5
3
)
(0, 6)3(0, 4)2 = 0, 3456
b) A probabilidade que pelo menos um dos indivíduos ser do sexo feminino é dada
por
1− P (X = 0) = 1−
(
5
0
)
(0, 6)0(0, 4)5 = 1− 0, 0102 = 0, 9898
c) A probabilidade que ao menos 3 (uma maioria) ser do sexo feminino é dada por
P(X = 3) +
P(X = 4) + P(X = 5), ou seja:
(
5
3
)
(0, 6)3(0, 4)2 +
(
5
4
)
(0, 6)4(0, 4)1 +
(
5
5
)
(0, 6)5(0, 4)0 = 0, 6826
6.2.1 Média e Variância de uma v.a. com Distribuição
Binomial
Se X ∼ B(n.p)→ P (X = k) =
(
n
k
)
pkqn−k então
E(X) = n · p e V (X) = n · p · q
Exemplo: Em 100 lances de uma moeda honesta, determeine a média e a variância
do número de caras.
73
p = 1
2
e q = 1
2
logo,
E(X) = np = 100 · 1
2
= 50
V (X) = npq = 100 · 1
2
· 1
2
= 25
6.3 Distribuição de Poisson
Seja X uma v.a. com distribuição discreta, e suponha que X assuma valores inteiros
não negativos. É dito que X possui uma distribuição de Poisson com média λ onde
(λ > 0) se a função de probabilidade de X é dada por:
P (X = k) =
e−λλk
k!
k = 0, 1, 2, 3, . . .
em que X o número de sucessos no intervalo
Observação:O símbolo e representa uma constante que é aproximadamente igual a
2,7183. O seu nome é uma homenagem ao matemático suiço I. Euler, e constitui a
base do chamado logaritmo natural.
A distribuição de Poisson é muito usada na distribuição do número de:
1. carros que passam por um cruzamento por minuto, durante uma certa hora do dia;
2. erros tipográficos por página, em um material impresso;
3. defeitos por unidade (m2, m3, m, etc.) por peça fabricada;
4. mortes por ataque de coração por ano, numa cidade. É aplicada também em
problemas de filas de espera em geral, e outros.
A esperança E(X) = λ e a variância V (X) = λ.
74
A v.a. de Poisson tem um amplo range de aplicações em uma grande variedade
de áreas, porque se emprega como uma aproximação para uma v.a. binomial com
parâmetros (n, p) quando n é grande e p é pequeno. Supondo que X é uma v.a.
binomial com parâmetros (n; p) então λ = np.
Exemplo 1: Se a probabilidade de um indivíduio sofrer uma reação nociva, resultante
de ter tomado um certo soro é 0,001, determinar a probabilidade de que, entre 2000
indivíduos:
a) exatamente três sofrerem a reação;
Solução
Seja X a v.a. que representa o número de pessoas que sofrem a reação nociva após
injerir o soro. Então,
P (X = k) =
e−λλk
k!
k = 0, 1, 2, 3, . . .
onde λ = 2000 · 0, 001 = 2. Logo,
P (X = 3) =
e−223
3!
= 0, 18
b) mais do que dois sofrerem a reação.
P (X ≥ 3) = 1− P (X ≤ 2) = 1− [P (X = 0) + P (X = 1) + P (X = 2)]
= 1− [e
−220
0!
+
e−221
1!
+
e−222
2!
] = 0, 323
Exemplo 2: Numa central telefônica chegam 300 telefonemas por hora. Qual a
probabilidade de que:
a) num minuto não haja nenhum chamado
X: número de chamadas por minuto λ = 5
75
P (X = 0) =
e−550
0!
= 0, 006738
b) em 2 minutos haja 2 chamados
dois minutos λ = 10
P (X = 2) =
e−10102
2!
= 0, 002270
76
6.4 Exercícios
1. Retira-se uma bola de uma urna contendo 30 bolas brancas e 20 verdes. Qual
a probabilidade dessa bola ser verde?
2. Seja X ∼ Bernoulli(p) Mostre que E(X) = p e V (X) = pq, q = 1− p
3. A probabilidade de que certo tipo de componente sobreviverá a um teste de
choque é de 3/4. Determine a probabilidade de que exatamente dois dos próxi-
mos quatro componentes testados sobrevivam. (R = 27/128)
4. Uma grande rede varesjista compra certo tipo de equipamento eletrônico de
um fabricante. O fabricante indica que a taxa de equipamentos com defeito é
de 3%. O inspetor da rede seleciona 20 ítens de um carregamento. Qual é a
probabilidade de que haja pelo menos um ítem defeituoso entre esses 20? (R
= 0,4562)
5. De acordo com a publicação Chemical Energineerring Progress (nov. 1990)
aproximadamente 30% de todas as falhas nas tubulações das indústrias são
causadas por erro do operador. Qual é a probabilidade de que não mais que
quatro de 20 falhas sejam causadas por erro do operador? (R = 0,2375)
6. Se a probabilidade de uma lâmpada fluorescente ter vida útil de pelo menos 800
horas é de 0,9, determine a probabilidade de que, entre 20 lâmpadas,
a) exatamente 18 terão vida útil de pelo menos 800 horas. (R = 0,2852)
b) pelo menos 15 terão vida útil de pelo menos 800 horas. (R = 0,9887)
c) pelo menos duas não terão vida útil de pelo menos 800 horas. (R = 0,6083)
7. Uma loja tem um lote de 10 fechaduras, das quais 5 têm defeitos. Se uma
pessoa comprar 3 fechaduras, qual a probabilidade de encontrar no máximo
uma defeituosa?
8. Em 10 lançamentos de uma moeda honesta, qual é a probabilidade de obser-
varmos
a) exatamente 5 caras?
b) entre 3 e 7 caras?
c) mais do que 7 caras?
77
9. Uma empresa produz 10% de peças defeituosas. As peças são embaladas em
caixas que contém 12 peças. Calcule a probabilidade de um cliente comprar
uma caixa contendo:
a) nenhuma peça defeituosa;
b) uma peça defeituosa.
10. Uma cia de seguros descobriu que somente cerca de 0,1 por cento da popu-
lação está incluída em certo tipo de acidente por ano. Se seus 10000 segu-
rados são escolhidos, ao acaso, na população, qual é a probabilidade de que
não mais do que 5 de seus clientes venham a estar incluídos em tal acidente no
próximo ano?
11. Supondo que o número de carros que chegam numa fila do guichê de um pedá-
gio tem distribuição de Poisson a uma taxa de três por minuto, calcule a proba-
bilidade de que cheguem cinco carros nos próximos dois minutos.
12. Um caixa de banco atende 150 clientes por hora. Qual a probabilidade de que
atenda:
a) Nenhum cliente em 4 minutos
b) No máximo dois clientes em 2 minutos
13. Uma empresa geralmente compra grandes lotes de certo tipo de equipamento
eletrônico. O método utilizado rejeita o lote se dois ou mais ítens com defeitos
forem encontrados em uma amostra aleatória de 100 unidades.
a) Qual a probabilidade de rejeição de um lote se há 1% de ítens defeiuosas?
b) Qual a probabilidade de aceitação de um lote se há 5% de ítens defeiuosas?
78
7 Variáveis Aleatórias contínuas
7.1 Definições
Definição: Seja X uma variável aleatória. Suponha que <x, o contra-domínio de X,
seja um intervalo ou uma coleção de intervalos. Então diz-se que X é uma variável
aleatória contínua.
Definição: Seja X uma variável aleatória contínua. A função densidade de probabili-
dade f , indicada abreviadamente por f.d.p., é uma função f que satisfaz as seguintes
condições:
a) f(x) ≥ 0, x ∈ <x
b)
∫
<x f(x)dx = 1
Além disso, define-se, para qualquer c < d (em <x)
P (c < x < d) =
∫ d
c
f(x)dx
Observações:
a) P (c < x < d) representa a área sob a curva da f.d.p. f , entre os pontos x = c e
x = d.
b) Constitui uma consequência da descrição probabilística de X que, para qualquer
valor especificado de X, digamos x0, teremos P (X = x0) = 0, porque P (X = x0) =∫ x0
x0
f(x)dx = 0.
79
7.2 Função de Distribuição Acumulada
Definição: A função de distribuição da variável aleatória X, representada por Fx ou
simplesmente F , é definida por:
FX(x) = P (X ≤ x)
Teorema
a) Se X for uma variável aleatória contínua com f.d.p f então:
FX(x) =
∫ x
−∞
f(s)ds
Suponha que X seja uma variável contínua com f.d.p.
O gráfico está apresentado na Figura abaixo
Figura 6: Meyer,página 75.
80
7.3 Esperança de uma Variável Aleatória Contínua
Se uma variável aleatória X possui uma distribuição contínua com f.d.p. f(x), então
a esperança E(X) é definida por:
µ = E(X) =
∫ ∞
−∞
x · f(x)dx
Exemplo: Suponha que f.d.p. de uma v.a. X com uma distribuição contínua seja:
f(x) =
{
2x para 0 < x < 1
0 caso contrário
Então E(X) =
∫ 1
0
x · (2x)dx =
∫ 1
0
2x2dx = 2x
3
3
|10= 23
7.4 Variancia de uma Variável Aleatória Contínua
Suponha que uma v.a. X possua uma distribuição contínua, cuja f.d.p. é f(x). Então
V (X) =
∫ ∞
−∞
(x− µ)2f(x)dx =
∫ ∞
−∞
x2f(x)dx− µ2
Exemplo: Suponha que f.d.p. de uma v.a. X com uma distribuição contínua seja:
f(x) =
{
2x para 0 < x < 1
0 caso contrário
Como visto anteriormente, E(X) = 2
3
. Então
V (x) =
∫ 1
0
x2(2x)dx− (2
3
)2 =
∫ 1
0
2x3dx− (2
3
)2 = 2x
4
4
|10 −(23)
2 = 2
4
− 4
9
= 2
36
81
7.5 Exercícios
1. Sendo f(x) = Kx3 a densidade de uma variável aleatória contínua no intervalo
0 < x < 1, determine o valor de K.
2. Uma variável aleatória contínua X é definida pela seguinte função densidade:
f(x) =
{
3
2
(x− 1)2 se 0 ≤ x ≤ 2
0 caso contrário
Determinar:
a) A média.
b) A variância.
3. O diâmetro X de um cabo elétrico é uma variável aleatória contínua com função
densidade de probabilidade dada por:
f(x) =
{
K(2x− x2) se 0 ≤ x ≤ 1
0 se x < 0 ou x > 1
a) Determinar K.
b) Calcular E(X) e V (X).
c) Calcular P (0 ≤ x ≤ 1/2).
4. Determinar a média e a variância de X, cuja f.d.p. é dada por:
f(x) =
{
2
x2
se 1 ≤ x ≤ 2
0 se x < 1 ou x > 2
5. Dada a função
f(x) =
{
2e−2x se x ≥ 0
0 se x < 0
a) Mostre que esta é uma f.d.p.
b) Calcule a probabilidade de X > 10.
6. A duração de uma lâmpada é uma variável aleatória T , cuja f.d.p. é:
f(t) =
{
1
1000
e−
t
1000 para t ≥ 0 (em horas)
0 se t < 0
82
Calcular a probabilidade de uma lâmpada:
a) Se queimar antes de 1.000 horas.
b) Durar entre 800 e 1.200 horas.
7. Uma variável aleatória contínua tem a seguinte fdp:
f(x) =

2kx se 0 ≤ x < 3
kx para 3 ≤ x < 5
0 caso cantrário
Determinar o valor de k, a média e a variância da variável aleatória.
8. O número total de horas, medido em unidades de 100 horas, que uma família
utiliza o aspirador de pó em sua casa, durante o período de um ano, é uma
variável aleatória contínua X, que tem função de densidade
f(x) =

x se 0 < x < 1
2− x para 1 ≤ x < 2
0 caso cantrário
Determine a probabilidade de que, durante o período de um ano, a família use
o aspirador
a) menos de 120 horas;
b) entre 50 e 100 horas.
83
8 Distribuições Teóricas de
Probabilidades de Variáveis
Aleatórias Contínuas
8.1 Distribuição Uniforme
Usada comumente nas situações em que não há razão para atribuir probabilidades
diferentes a um conjunto possíveis de valores da variável aleatória em um determi-
nado intervalo.
Uma variável aleatória contínua X, definida no intervalo [a, b], tem distribuição Uni-
forme se sua função densidade de probabilidade for especificada por
f(x) =
{
k para a ≤ x ≤ b
0 para x < a ou x > b
O valor de k pode ser obtido da seguinte forma
∫ b
a
k dx = 1
k · x |ba= 1
k =
1
b− a
Logo,
84
f(x) =

1
b−a para a ≤ x ≤ b
0 para x < a ou x > b
Sua Função de distribuição F (X) é dada por
∫ x
a
1
b− a
ds =
x− a
b− a
Sua média E(X) e Variância V (X) são dados por
E(X) = b+a
2
e V (X) = (b−a)
2
12
Exemplo: Um ponto é escolhido ao acaso no intervalo [0,2]. Qual a probabilidade de
que esteja entre 1 e 1,5?
8.2 Distribuição Normal
A distribuição Normal, também conhecida por distribuição Gaussiana, segunda lei
de Laplace, Laplace, Laplace-Gauss, de Moivre, é uma família importante das dis-
tribuições contínuas de probabilidade, aplicável em muitas áreas (JOHNSON e KOTZ,
1970). Suas propriedades, além de fundamentar decisões, medir e prevenir riscos
e até explicar curiosidades, descrevem bem variáveis como comprimento de pinos e
diâmetros de discos, altura, peso, inteligência e tempo de gestação de seres vivos,
rendas e despesas de famílias ou categorias profissionais, rendimentos de máquinas
e campos de trigo, qualidade do ar, velocidade de molécula, distribuições diamétri-
cas e volumétricas de árvores, etc. Cada membro dessa família pode ser definido
por dois parâmetros, locação e escala: a média µ e a variância σ2, respectivamente.
A distribuição normal padrão possui média zero e variância um (JOHNSON e KOTZ,
1970).
Uma variável normal, de modo geral, retrata bem fenômenos cujo efeito final corres-
ponde à soma de múltiplas causas ou é afetado por diversas variáveis independentes
(típico de variáveis físico químicas, socioeconômicas, psicossociais, etc).
85
Carl Friedrich Gauss em 1809 se tornou associado com essa distribuição quando ele
analizou dados astronomicos, e definiu a equação desta densidade de probabilidade.
Ela é frequentemente chamada de curva de sino porque o gráfico da sua densidade
de probabilidade se assemelha um sino (JOHNSON e KOTZ, 1970).
Definição: Dizemos que uma v.a. X possui uma distribuição Normal (ou Gaussiana)
com média µ e variância σ2 (−∞ < µ < ∞ e σ > 0) se X possuir uma distribuição
contínua com função densidade de probabilidade dada por:
f(x) =
1
σ
√
2π
e−
1
2
(
x−µ
σ
)2
para −∞ < x <∞
8.2.1 Média
E(X) = µ
V (X) = σ2
Usaremos a seguinte notação: X ∼ N(µ, σ2)
8.2.2 Distribuição Normal Padrão
A distribuição normal com média zero (µ = 0) e variância um (σ2 = 1) é denominada
distribuição normal padrão N(0, 1). A função densidade de probabilidade de uma
distribuição normal padrão é em geral representada por φ(x) e dada por
φ(x) =
1√
2π
e−
x2
2
Se uma variável X tem uma distribuição normal com média µ e variância σ2, então a
variável
86
Z =
X − µ
σ
Z é chamada de Variável Normal Reduzida, Normal Padronizada ou Variável Nor-
malizada.
As probabilidades para uma distribuição normal com qualquer média e variância po-
dem ser determinadas através de Tabelas de uma distribuição normal padrão.
Como ilustração, na Figura 1 é apresentado o gráfico da função normal representada
com diferentes parametrizações.
Figura 7: Densidade da distribuição normal segundo diferentes parametrizações.
Exemplos do uso da Tabela
1. Seja X ∼ N(100, 25). Calcular
a) P (100 ≤ X ≤ 106)
b) P (89 ≤ X ≤ 107)
87
c) P (X ≤ 114)
d) P (X ≥ 108)
Resolução
µ = 100 e σ = 5, Z = X−100
5
.
a) P (100 ≤ X ≤ 106) = P (0 ≤ Z ≤ 1, 2) = P (Z ≤ 1, 2) − P (Z ≤ 0) = 0, 8849 −
0, 5000 = 0, 3849
b) P (89 ≤ X ≤ 107) = P (−2, 2 ≤ Z ≤ 1, 4) = P (Z ≤ 1, 4) − P (Z ≤ −2, 2) =
0, 9192− 0, 0139 = 0, 9053
c) P (X ≤ 114) = P (Z ≤ 2, 8) = 0, 9918
d) P (X ≥ 108) = P (Z ≥ 1, 6) = 1− P (Z ≤ 1, 6) = 1− 0, 9452 = 0, 0548
2. Supor uma população em que o peso dos indivíduos seja distribuido normalmente
com média 68 kg e desvio padrão 4 kg. Determinar a proporção de indivíduos
a) abaixo de 66 kg
b) acima de 72 kg
c) entre 66 e 72 kg
a) P (X < 66) = P (Z < −0, 5) = 0, 3085
b) P (X > 72) = P (Z > 1) = 1− P (Z ≤ 1) = 1− 0, 8413 = 0, 1587
c) P (66 < X < 72) = P (−0, 5 < Z < 1) = P (Z < 1) − P (Z < −0, 5) = 0, 8413 −
0, 3085 = 0, 5328
88
8.3 Exercícios
1. A dureza H de uma peça de aço pode ser pensada como uma variável aleatória
com distribuição uniforme no intervalo [50,70] da escala Rockwel. Calcular a
probabilidade de que uma peça tenha dureza entre 55 e 60.
2. A variável aleatória X tem distribuição uniforme com parâmetros a = 5 e b = 10.
Calcule as probabilidades:
a) P (X < 7)
b) P (8 < X < 9)
c) P (X > 8, 5)
3. A distribuição da altura de plantas de Amaranthus hybridus, X, pode ser aprox-
imada por uma distribuição normal de média 29,7 cm e desvio padrão 2,7 cm.
A probabilidade de uma planta apresentar altura:
a) entre 29,7 e 32,0 cm?
b) acima de 32,0 cm?
c) abaixo de 30,0 cm?
4. Certo tipo de armazenados de bateria dura, em média, três anos, com desvio
padrão de 0,5 ano. Assumindo que a vida dos armazenadores é distribuída
normalmente, encontre a probabilidade de que certo armazenador dure pelo
menos 2,3 anos.5. Uma indústria elétrica fabrica lâmpadas que têm vida útil, antes de queimarem,
normalmente distribuída com média igual a 800 horas e desvio padrão de 40
horas. Encontre a probabilidade de que uma lâmpada queime entre 778 e 834
horas.
6. Certa máquina fabrica resistores elétricos com uma resistência média de 40
ohms e desvio padrão de 2 ohms. Supondo que a resistência siga uma dis-
tribuiçao normal e que pode ser medida para qualquer grau de acuidade, qual
é a porcentagem de resistores que terão uma resistência excedendo 43 ohms?
7. O diâmetro de uma cabo elétrico é normalmente distribuído com média 0,8 e
desvio padrão 0,02. Qual é a probabilidade de que o diâmetro ultrapasse 0,81?
8. Vamos supor que uma galinha da linhagem Shaver 579 produza, em um período
de 72 semanas, 200 ovos em média, com variância de 49 ovos, e que esta var-
89
iável (produção de ovos) apresente distribuição aproximadamente Normal. Cal-
cule a probabilidade de uma galinha dessa linhagem produzir, em 72 semanas,
um número entre 190 e 210 ovos.
9. As massas das peças de um determinado lote têm distribuição normal, com
média de 65,3 g e desvio padrão de 5,5 g. Encontre a probabilidade de peças
com massas:
a) entre 60 e 70 g;
b) superiores a 63,2 g.
90
9 Teoria da Amostragem
9.1 Introdução
Um problema de inferência estatística é um problema no qual os dados de uma
certa população com uma distribuição de probabilidade desconhecida precisa ser
analizado, e algum tipo de inferência sobre essa distribuição desconhecida precisa
ser feito. Essa inferência é feita através dos dados de uma amostra.
9.2 Parâmetros e Estatísticas
Parâmetros: são medidas populacionais quando se investiga a população em sua
totalidade, neste caso é impossível fazer inferências, pois toda a população foi inves-
tigada.
Estatísticas ou Estimadores: são medidas obtidas da amostra, torna-se possível
neste caso utilizarmos as teorias inferênciais para que possamos fazer conclusões
sobre a população.
91
9.3 Técnicas de amostragem
O pesquisador procura tirar conclusões a respeito de um grande número de sujeitos.
Por exemplo, ele poderia desejar estudar:
– Os 190.000.000 de cidadãos que constituem a população brasileira.
– Os 1.000 membros de um sindicato.
– Os 45.000 estudantes de intercâmbio e assim sucessivamente.
Se o pesquisador trabalha com todo o grupo que ele tenta compreender, dize-
mos que está trabalhando com a POPULAÇÃO.
9.4 Conceitos Iniciais
Antes de iniciar o estudo da teoria da amostragem é necessário conhecer alguns
conceitos básicos.
População: O conjunto da totalidade dos indivíduos sobre o qual se faz uma infer-
ência recebe o nome de população ou universo. A população congrega todas as
observações que sejam relavantes para o estudo de uma ou mais seres animados
ou inanimados. Em linguagem mais formal, a população é o conjunto constituído
por todos os indivíduos que apresentem pelo menos uma característica comum, cujo
comportamento interessa analisar (inferir).
Amostra: A amostra pode ser definida como um subconjunto, uma parte selecionada
da totalidade de observações abrangidas pela população, através da qual se faz um
juízo ou inferência sobre as características da população.
Censo: é a coleção de dados relativos a todos elementos da população.
Estatística: é a medida numérica que descreve uma característica da amostra.
Parâmetro: é a medida numérica que descreve uma característica da população.
Variável: uma característica de uma unidade que será medida a partir daquela
unidade da amostra.
Unidade: qualquer elemento individual da população.
92
9.5 Amostragem
Esta é a ideia essencial da amostragem: obter informação sobre o todo, examinando
apenas uma parte.
Exemplos da utilização da amostragem:
– Sondagens à opinião pública que servem para conhecer a opinião da população
sobre variadas questões. As mais populares são as sondagens políticas.
– Inspeção de mercado utilizada com o intuito de descobrir as preferências das
pessoas em relação a certos produtos. Um dos exemplos mais conhecidos da
aplicação desta amostragem é a lista de audiências dos programas de televisão.
– Censo (recenseamento da população) que tem como objectivo obter informação
relativa ao número de ocupantes, idade, sexo, parentesco entre eles, etc. de
cada habitação do país.
– Amostragem de aceitação que consiste na seleção e inspeção cuidada de uma
amostra retirada de uma encomenda enviada pelo fornecedor. Baseado no es-
tado da amostra, toma-se a decisão de aceitar ou rejeitar a encomenda.
O pesquisador busca generalizar conclusões referentes à AMOSTRA, estendendo-
as para toda a POPULAÇÃO da qual essa amostra foi extraída.
As regras de amostragem podem ser classificadas em duas categorias:
Probabilística: São amostragem em que a seleção é aleatória de tal forma que cada
elemento tem igual probabilidade de ser sorteado para amostra.
Não-probabilística: São amostragens em que há uma escolha deliberada dos ele-
mentos da amostra.
9.5.1 As Amostras Probabilísticas
Os métodos de amostragem probabilística servem para assegurar uma certa pre-
cisão na estimação dos parâmetros da população, reduzindo o erro amostral.
A principal característica dos métodos de amostragem probabilística reside no fato
de que cada elemento da população tem uma probabilidade conhecida e diferente
de zero, de ser escolhida, quando da tiragem ao acaso para fazer parte da amostra.
93
O objetivo desta abordagem é obter a melhor representatividade possível.
Os tipos de amostragem probabilísticas são: Amostragem Aleatória Simples, Amostragem
Aleatória Estratificada, Amostragem por Conglomerados e Amostragem Sistemática.
9.5.2 Amostragem Aleatória Simples
A Amostragem aleatória simples é uma técnica segundo a qual cada um dos elemen-
tos (sujeitos) que compõe a população alvo tem igual probabilidade de ser escolhido
para fazer parte de uma amostra. A amostragem aleatória simples consiste em elab-
orar uma lista numérica de elementos de onde se tira, com a ajuda de uma tabela de
números aleatórios, uma série de números para constituir a amostra.
Exemplo:
Vamos retirar uma amostra para uma pesquisa de estatura de quarenta alunos de
uma sala de aula.
a) Numeramos os alunos de 01 a 40.
b) Escrevemos os números, de 01 a 40, em pedaços de papel, colocando-os dentro
de uma urna. Mexemos a urna para misturar bem os papéis, e retiramos, um a um,
quatro números que farão parte da amostra. Neste exemplo o tamanho da amostra é
igual a 10% da população mas este percentual pode variar dependendo do tamanho
da população que está sendo estudada.
9.5.3 Amostragem Aleatória Estratificada
A Amostragem aleatória estratificada é uma variante da amostra aleatória simples.
Esta técnica consiste em dividir a população alvo em subgrupos homogéneos chama-
dos "estratos"e a seguir tirar de forma aleatória uma amostra de cada estrato. A
Amostragem aleatória estratificada é utilizada quando a população inteira é recon-
hecida por certas características precisas, tais como a idade, o sexo, a incidência
de uma condição de saúde, tudo isto para assegurar a melhor representatividade
possível.
94
9.5.4 Amostragem por Conglomerados
Algumas populações não permitem, ou tornam-se extremamente difíceis que se iden-
tifiquem seus elementos, mas podemos identificar subgrupos da população. Em tais
casos, uma amostra aleatória simples desses subgrupos (conglomerados) podem
ser escolhida, e uma contagem completa deve ser feita no conglomerado sorteado.
Agregados típicos são: quarteirões, famílias, organizações, agências, edifícios, etc.
9.5.5 Amostragem Sistemática
Consiste quando existe uma lista ordenada de elementos da população. Esta técnica
consiste K elementos dessa lista sendo o primeiro elemento da amostra retirado ao
acaso.
O intervalo entre os elementos corresponde à razão entre o tamanho da população
e da amostra.
Exemplo: Se pretender uma amostra de 100 indivíduos e a população for de 1000 o
sistemaserá r = 1000/100 = 10 (dez em dez é o sistema), isto é, será incluído um
elemento da lista de 10 em 10 indivíduos a partir do primeiro número sorteado.
9.6 Amostragem Não-probabilística
A amostragem não-probabilística é a amostragem subjetiva, ou por julgamento, onde
a variabilidade amostral não pode ser estabelecida com precisão, consequentemente,
não é possível nenhuma estimativa do erro amostral.
Se o tamanho da amostra é bem pequeno; digamos, de uns 5 itens, a amostragem
aleatória pode dar resultados totalmente não representativos, ao passo que uma
pessoa familiarizada com a população pode especificar quais os itens mais repre-
sentativos da população.
9.7 Erros no processo de amostragem
Não há dúvida de que uma amostra não representa perfeitamente uma população.
Ou seja, a utilização de uma amostra implica na aceitação de uma margem de erro
95
que denominaremos ERRO AMOSTRAL.
Erro Amostral é a diferença entre um resultado amostral e o verdadeiro resultado
populacional; tais erros resultam de flutuações amostrais aleatórias.
Ocorrem erros não-amostrais quando:
– Os dados amostrais são coletados, registrados ou analisados incorretamente.
– Há uma utilização de um instrumento defeituoso durante a realização de men-
surações.
– Um questionário ou formulário possui questões formuladas de modo tenden-
cioso.
Não podemos evitar a ocorrência do ERRO AMOSTRAL, porém podemos limitar
seu valor através da escolha de uma amostra de tamanho adequado. Quanto
maior o tamanho da amostra, menor o erro cometido e vice-versa.
9.8 Distribuição Amostral da Média
De uma população X, tiramos uma amostra de tamanho n constituída pelos
elementos x1, x2, . . . , xn obtida de uma distrbuiçãoN(µ, σ2). Então, o estimador
da Média µ populacional na amostra é:
x̄ =
1
n
n∑
i=1
xi ∼ N(µ,
σ2
n
)
ou seja, x̄ tem distribuição Normal com E(x̄) = µ e V (x̄) = σ
2
n
. Podemos
escrever de forma equivalente que, se x̄ ∼ N(µ, σ2
n
) então
Z =
x̄− µ
σ√
n
∼ N(0, 1)
que é a forma mais adequada para aplicações.
Há uma observação importante a ser feita: se a população for finita e de tamanho
N conhecido, e se a amostra de tamanho n dela retirada for sem reposição, en-
tão:
x̄ ∼ N
(
µ,
σ2
n
N − n
N − 1
)
96
em que N−n
N−1 é o fator de correção.
Exemplo 1: Se X ∼ N(µ, σ2) onde µ = 20 e σ2 = 16, calcule a probabilidade
que:
a) x̄ > 21 se x̄ for baseado numa amostra de tamanho 16.
b) 19 < x̄ < 23 se x̄ for baseado numa amostra de tamanho 36.
Exemplo 2: Sabe-se que a altura média dos alunos de uma faculdade é de
175 cm e o desvio padrão, 25 cm. Retiramos uma amostra sem reposição, de
tamanho n = 100. Qual a probabilidade amostral da média das alturas estar
entre 160 e 180 cm?
9.9 Distribuição Amostral das Proporções
Veremos a distribuição amostral da proporção p de sucessos, característica que
se estuda na população
Seja p conhecida. A população pode ser definida como uma variável X tal que
{
X = 1 se o elemento da população tem a característica
X = 0 se o elemento da população não tem a característica
logo, µ = E(X) = p, σ2 = V (X) = p(1− p).
Retiramos uma grande amostra, n → ∞, x1, x2, . . . , xn, dessa população, com
reposição, e definimos x como o número de sucessos na amostra, isto é, o
número de elementos da amostra com a característica que se quer estudar.
O estimador de p é definido por p̂ = x
n
: proporção de sucessos na amostra.
X ∼ B(n, p) e E(X) = np e V (X) = npq sendo q = 1− p
Calculando esperança e variância de p̂, temos:
E(p̂) = E
(
x
n
)
= 1
n
E(x) = 1
n
· np = p ∴ E(p̂) = p ou µp̂ = p
O que garante que, para grandes amostras, a proporção amostral se distribui
com média igual à proporção populacional.
97
Vejamos agora:
V (p̂) = V
(
x
n
)
= 1
n2
· V (x) = 1
n2
npq ∴
ou V (p̂) = pq
n
ou σp̂ =
√
pq
n
Logo, a variancia da proporção amostral é a variância da população dividida
pelo número de elementos da amostra.
Quando n→∞ p̂ ∼= N
(
p, pq
n
)
, p̂ é aproximadamente normal.
Segue-se que, nas mesmas condições,
Z =
p̂− p√
pq
n
∼ N(0, 1)
A precisão da aproximação normal melhora na medida que o valor do tamanho
da amostra, n, aumenta e, para p próximo de 1/2. Uma regra geral usada, é
que a aproximação normal é boa quando np e nq ≥ 5.
Exemplo 3: Um fabricante afirma que sua vacina contra gripe imuniza em 80%
dos casos. Uma amostra aleatória de 25 indivíduos que tomaram a vacina foi
obtida e testes foram feitos para verificar a imunização ou não desses indiví-
duos. Se o fabricante estiver correto, qual é a probabilidade da proporção de
imunizados na amostra ser inferior a 0,75? E superior a 0,85?
Exemplo 4: Um varejista compra copos diretamente da fábrica em grandes
lotes. Os copos são embrulhados individualmente. Periodicamente o varejista
inspeciona os lotes para determinar a proporção dos quebrados. Se um grande
lote contém 10% de quebrados qual a probabilidade do varejista obter numa
amostra de 100 copos 17% ou mais defeituosos?
98
9.10 Exercícios
1. Com o objetivo de verificar que lanche deveria ser servido para os ado-
lescentes de um acampamento, selecionou-se uma amostra composta por
250 adolescentes sorteados entre os 2.000 presentes num acampamento.
Que tipo de amostragem foi utilizada?
2. Em uma cidade de 138.000 habitantes, deseja-se fazer uma pesquisa so-
bre as preferências de lazer entre pessoas da terceira idade, levando em
conta o sexo a que pertencem. Supondo que na cidade haja 8.500 mul-
heres e 5.300 homens acima de 65 anos de idade, determine uma amostra
estratificada com 200 elementos.
3. Um repórter da revista Business Week obtém uma relação numerada de
1.000 empresas com maiores cotações de ações na bolsa. Ele entrevistará
100 gerentes gerais das empresas correspondentes a esta amostra. Que
tipo de amostragem você surgeriria e por que?
4. Um tipo de fio é fabricado com resistência média à tensão de 78,3 quilogra-
mas e desvio-padrão de 5,6 quilogramas. Em quanto a variância da média
amostral muda quando o tamanho da amostra é
a) Aumentado de 64 para 196?
b) Reduzido de 784 para 49?
5. Uma engarrafadora utiliza uma máquina para encher garrafas plásticas com
refrigerante, cujo conteúdo segue uma distribuição Normal com µ = 298 ml
e σ = 3 ml. Qual é a probabilidade de:
a) determinada garrafa conter menos de 295 ml?
b) o conteúdo médio das garrafas de um pacote de 6 ser inferior a 295 ml?
6. Seja a variável X = chamadas telefonicas de longas distâncias (em minu-
tos), com X ∼ N(µ, σ2) em que µ = 8 e σ2 = 4. Se amostras aleatórias de
25 chamadas forem selecionadas,
a) que proporção das médias amostrais estará entre 7,8 e 8,2 min?
b) que proporção das médias amostrais estará entre 7,5 e 8 min?
c) Que proporção das médias amostrais estará entre 7,8 e 8,2 min para
uma amostra aleatória de 100 chamadas? Comparar os resultados a) e c).
7. A renda de um conjunto de pessoas de uma certa região tem média 6 s.m.
99
e desvio padrão de 2 s.m. Se desta população for extraída uma amostra de
n = 100 pessoas, qual a probabilidade da média desta amostra acuse um
valor superior a 6,3 s.m?
8. Se vamos extrair amostras de n = 100 observações de uma população
muito grande, em que a proporção populacional é 0,20, que porcentagem
de proporções amostrais poderemos esperar nos intervalos:
a) 0,16 a 0,24?
b) maior que 0,24?
9. Tendo em mente estimar a proporção de alunos de um determinado "Cam-
pus"universitário que eram favoráveis à reestruturação das contas acadêmi-
cas, um pesquisador social entrevistou uma amostra aleatória de 590 estu-
dantes e constatou que 57% deles era de fato, favoráveis à citada reestrutu-
ração. Considerando a proporção obtida como sendo o valor "p"populacional:
a) Calcule a probabilidade de numa amostra de 49 alunos, menos de 49%
sejam favoráveis à reestruturação das contas acadêmicas.
b) Calcule a probabilidade de numa amostra de 36 alunos, menos de 55%
sejam favoráveis à reestruturação das contas acadêmicas.
10. A proporção de estômatos da epidermeabaxial da folha de macieira da
variedade M-9, com tamanho acima de um determinado valor é 0,12. Ex-
traída uma amostra de 35 folhas, qual a probabilidade de que a proporção
amostral esteja entre 0,08 e 0,13?
11. Numa floresta de Eucalyptus saligna, a proporção de árvores mortas é de
4%. Foi tomada uma amostra aleatória de 100 árvores. Qual a probabil-
idade de que a proporção de árvores mortas na amostra fique entre 2 e
6%
100
10 Teoria da Estimação
10.1 Introdução
Inferência estatística é o processo pelo qual podemos tirar conclusões acerca
de um conjunto maior (a população) usando informação de um conjunto menor
(a amostra).
Podemos estimar o parâmetro θ usando a informação de nossa amostra. Chamamos
este único número que representa o valor mais plausível do parâmetro (baseado
nos dados amostrais) de uma estimativa pontual de θ. Alguns exemplos são a
média amostral, o desvio padrão amostral, a mediana amostral, os quais es-
timam a verdadeira média, desvio padrão e mediana da população (que são
desconhecidos).
10.2 Estimação Pontual
A estimação pontual (por ponto) consistirá simplesmente em, à falta de melhor
informação, adotar a estimativa disponível como sendo o valor do parâmetro.
A idéia é, em sua essência, extremamente simples, porém a qualidade dos re-
sultados irá depender fundamentalmente da conveniente escolha do estimador.
Assim, dentre os vários estimadores razoáveis que poderemos imaginar para
um determinado parâmetro, devemos ter a preocupação de escolher aquele
que melhor satisfaça às propriedades de um bom estimador.
101
10.3 Propriedades dos estimadores
Consideremos uma amostra (X1, X2, . . . , Xn) de uma v.a. que descreve uma
característica de interesse de uma população.
Seja θ um parâmetro que desejamos estimar, como por exemplo a média µ =
E(X) ou a variância σ2 = V (X).
Definição: Um estimador T do parâmetro θ é qualquer função das observações
da amostra, ou seja, T = g(X1, X2, . . . , Xn).
10.3.1 Justeza e não-tedenciosidade
Diremos que um estimador T é justo (ou não-tedencioso, ou não-viciado, ou
não-viesado) se sua média (ou expectância) for o próprio parâmetro que se
pretende estimar
E(T ) = θ para todo θ
A adoção de um estimador que não seja justo nos levará a incorrer no vício de
estimação, ou viés.
Exemplo
Seja X1, X2, . . . , Xn uma amostra aleatória de tamanho n obtida de uma pop-
ulação com média µ e variância σ2, então X̄ = 1
n
∑n
i=1 Xi é um estimador não
viciado de µ.
E(X̄) = E( 1
n
∑n
i=1 Xi) =
1
n
∑n
i=1E(Xi) =
nµ
n
= µ
10.3.2 Consistência
Diremos que uma sequência de estimadores Tn é consistente se, para todo
� > 0,
P{| Tn − θ |> �} → 0, n→∞ (10.1)
102
Em vez de usar (1) para verificar se uma sequência de estimadores é consis-
tente, pode-se usar o seguinte resultado
Proposição:Uma sequência {Tn} de estimadores de θ é consistente se
lim
n→∞
E(Tn) = θ
lim
n→∞
V (Tn) = 0
Exemplo
Se Xi ∼ Bernoulli(p) então X =
∑n
i=1 Xi ∼ Binomial(n, p), daí E(X) = np
e V (X) = np(1− p). Então,
E(p̂) = E(X
n
) = E(X)
n
= np
n
= p (e p̂ é um estimador não viciado de p);
V (p̂) = V (X
n
) = V (X)
n2
= np(1−p)
n2
= p(1−p)
n
e limn→∞
p(1−p)
n
= 0
concluindo-se que p̂ é um estimador consistente de p.
10.3.3 Eficiência
Se T e T ′ são dois estimadores não-viesados de um mesmo parâmetro θ, e
ainda
V (T ) < V (T ′),
então T diz-se mais eficiente do que T ′
Exemplo
Seja X1, X2, . . . , Xn uma amostra aleatória obtida de X com distribuição de
Bernoulli com parâmetro p, desconhecido. Encontre as variâncias V (p̂) e V (p̂1);
compare e mostre que p̂ é mais eficiente do que p̂1.
Solução:
V (p̂) = V (X1+X2+...+Xn
n
) = 1
n2
∑n
i=1 V (Xi) =
1
n2
∑n
i=1 p(1 − p) =
np(1−p)
n2
=
p(1−p)
n
;
103
V (p̂1) = V (X1) = p(1− p).
Como, para n > 1, V (p̂) = p(1−p)
n
< V (p̂1) = p(1 − p) e, sendo p̂ e p̂1 esti-
madores não viciados então, de acordo com a Definiçao, p̂ é mais eficiente do
que p̂1.
10.3.4 Suficiência
Em poucas palavras, diremos que um estimador é suficiente se contém o máx-
imo possível de informação com referência ao parâmetro por ele estimado.
Definição A estatística T = T (X1, X2, . . . , Xn) é dita suficiente para o parâmetro
desconhecido θ, quando a distribuição condicional de X1, X2, . . . , Xn dado T é
independente de θ
10.4 Estimação Intervalar
Uma estimativa pontual de parâmetros, por não dizer o quão próximo o parâmetro
estimado vai estar do parâmetro verdadeiro, não é suficiente para informar sobre
a precisão da estimativa. Os métodos de estimação por intervalo tem propósito
de determinar os intervalos aleatórios, chamados intervalos de confiança, que
contém o valor do parâmetro desconhecido com uma probabilidade especifi-
cada chamada nível de confiança. Neste caso a amplitude do intervalo dá uma
indicação da precisão da estimativa obtida.
10.4.1 Intervalo de Confiança para Média com variância (pop-
ulacional) conhecida
SejaX1, X2, . . . , Xn uma amostra aleatória de tamanho n obtida deX ∼ N(µ, σ2).
Então
X̄ = 1
n
∑n
i=1 Xi ∼ N(µ,
σ2
n
) e, com a variância σ2 é suposta conhecida, a
variável aleatória
104
Z =
X̄ − µ
σ√
n
∼ N(0, 1)
Assim, dado o nível de confiança 1−α, tendo em vista a simetria da distribuição
N(0, 1) e, para garantir que o intervalo obtido tenha amplitude mínima, obtemos
na tabela da distribuição normal padronizada, q1 = −Zα
2
e q2 = −q1 = Zα
2
tal
que P (Z ≤ Zα
2
) = 1− α
2
de modo que
P
(
− Zα
2
≤ X̄ − µσ√
n
≤ Zα
2
)
= 1− α
ou, equivalentemente,
P
(
X̄ − Zα
2
· σ√
n
≤ µ ≤ X̄ + Zα
2
· σ√
n
)
= 1− α
sendo o intervalo de confiança simétrico para µ dado por
IC(µ, 1− α) =
(
X̄ − Zα
2
· σ√
n
; X̄ + Zα
2
· σ√
n
)
Em geral usa-se também a seguinte representação:
IC(µ, 1− α) =
(
X̄ ± Zα
2
· σ√
n
)
Exemplo
Suponha que se extraia uma amostra de tamanho 35 de uma população com
média µ e desvio padrão conhecido e igual a 3,90. Suponha que a média
amostral seja 44,8. Determinar um intervalo com 95% de confiança para µ.
Solução:
Temos que,
1 − α = 0, 95, α = 0, 05, P (Z ≤ Zα/2) = 1 − α2 = 1 −
0,05
2
= 0, 975. Logo,
Zα/2 = 1, 96
105
IC(µ, 95%) = (44, 8± 1, 96 · 3,90√
35
)
IC(µ, 95%) = (44, 8± 1, 29)
Logo, o intervalo com 95% de confiança para µ é [43,51; 46,09]
10.4.2 Intervalo de Confiança para Média com variância (pop-
ulacional) desconhecida
Admitindo, mais realisticamente, que a variância σ2 é desconhecida, a variável
aleatória
t =
X̄ − µ
S√
n
∼ tn−1
isto é, tem distribuição de Student com n−1 graus de liberdade, e independente
de µ.
Dado o nível de confiança 1 − α, como a distribuição de t é simétrica e, para
obter um intervalo com amplitude mínima, obtemos na tabela da distribuiçao
tn−1, q1 = −tn−1;α
2
e q2 = −q1 = tn−1;α
2
tal que P (t ≥ tn−1;α
2
) = α
2
, seguindo
então que
P
(
− tn−1;α
2
≤ X̄ − µ
S√
n
≤ tn−1;α
2
)
= 1− α
e, de forma equivalente,
P
(
X̄ − tn−1;α
2
· S√
n
≤ µ ≤ X̄ + tn−1;α
2
· S√
n
)
= 1− α
de modo que o intervalo de confiança simétrico para µ é
IC = (µ, 1− α) =
(
X̄ − tn−1;α
2
· S√
n
; X̄ + tn−1;α
2
· S√
n
)
ou, de outra forma
IC = (µ, 1− α) =
(
X̄ ± tn−1;α
2
· S√
n
)
em que S é o desvio padrão amostral dado por
106
S =
√√√√ 1
n− 1
n∑
i=1
(Xi − X̄)2
Exemplo
Suponha que se extraia uma amostra de tamanho 25 de uma população com
média µ e desvio padrão desconhecido. Suponha que a média amostral seja
4,004 e o desvio padrão amostral seja 0,366. Determinar intervalo 99% de
confiança para µ.
Solução:
Temos que,
t0,005;24 = 2, 797
IC(4, 004± 2, 797 · 0,366√
25
)
IC(4, 004± 0, 205)
Logo, o intervalo com 99% de confiança para µ é [3,799; 4,209].
10.4.3 Intervalo de Confiança para proporção populacional
Seja X1, X2, . . . , Xn uma amostra aleatória de tamanho n obtida de uma pop-
ulação de Bernoulli com parâmetro p, onde os componentes da amostra só
podem assumir os valores 0 e 1.
Tem-se p̂ = X̄, a proporção amostral de sucessos, para n suficientemente
grande, tem uma distribuição aproximadamente normal com média p e variânciap(1−p)
n
. Logo,
Z =
p̂− p√
p(1−p)
n
∼ N(0, 1)
A expressão final para o intervalo de confiança aproximado para p, com nível de
confiança 1− α, será
107
IC(p, 1− α) =
(
p̂− Zα
2
·
√
p̂(1− p̂)
n
; p̂+ Zα
2
·
√
p̂(1− p̂)
n
)
ou, de forma equivalente,
IC(p, 1− α) =
(
p̂± Zα
2
·
√
p̂(1− p̂)
n
)
Exemplo
Uma amostra aleatória de 600 peças de computador são obtidas de um grande
lote de produção, observando-se 45 com defeito. Estimar, através de um inter-
valo de confiança de 95%, a proporção verdadeira, p, de peças de computador
com defeito no lote.
Solução:
Temos p̂ = X
n
= 45
600
= 0, 075, para 1− α = 0, 95, α = 0, 05 e Zα
2
= 1, 96 logo,
IC(p, 95%) = (0, 075± 1, 96
√
0,075·0,925
600
) = (0, 075± 0, 0211) ou
IC(p, 95%) = (0, 0539; 0, 0961) ou, ainda: IC(p, 95%) = (5, 39%; 9, 61%).
10.4.4 Intervalo de Confiança para Variância
Sendo µ desconhecida e (n−1)S
2
σ2
∼ χ2n−1 não depende de σ2. Com procedi-
mento semelhante ao caso anterior, temos
P
(
χ2n−1;1−α
2
≤ (n− 1)S
2
σ2
≤ χ2n−1;α
2
)
= 1− α,
ou, equivalentemente,
P
((n− 1)S2
χ2n−1;α
2
≤ σ2 ≤ (n− 1)S
2
χ2n−1;1−α
2
)
= 1− α,
108
Portanto, o intervalo de confiança simétrico para σ2 é dado por
IC(σ2, 1− α) =
((n− 1)S2
χ2n−1;α
2
;
(n− 1)S2
χ2n−1;1−α
2
)
.
Exemplo Suponha que seja retirada uma amostra de tamanho cinco de uma popu-
lação normalmente distribuída, e que se tenha encontrado uma variância amostral de
13,52. Construa um intervalo com 95% de confiança para a variância populacional.
Solução:
Temos que χ20,975;4 = 0, 484 e χ
2
0,025;4 = 11, 143. Logo o intervalo de confiança para
σ2 é
IC(σ2, 95%) =
(
4(13,52)
11,143
; 4(13,52)
0,484
)
IC(σ2, 95%) = (4, 85; 111, 74)
10.5 Intervalo de Confiança para a diferença de mé-
dias de duas Populações
Estes intervalos podem ser úteis em diversas situações práticas em que se deseja
comparar dois grupos com relação a certa característica. Por exemplo, um industrial
pode querer comparar dois processos de produção; um pesquisador médico certa-
mente interessa saber o efeito de uma nova droga em dois tipos de pacientes.
Descreveremos a seguir, como construir intervalos de confiança para a diferença
entre duas médias populacionais.
10.5.1 As variâncias σ21 e σ
2
2 (populacionais) são conhecidas
Como
x̄1 − µ1
σ1√
n1
∼ N(0, 1)
109
e
x̄2 − µ2
σ2√
n2
∼ N(0, 1)
Logo
Z =
(x̄1 − x̄2)− (µ1 − µ2)√
σ21
n1
+
σ22
n2
∼ N(0, 1)
Assim, temos
P
(
− Zα
2
≤ (x̄1 − x̄2)− (µ1 − µ2)√
σ21
n1
+
σ22
n2
≤ Zα
2
)
= 1− α
resultando então, no seguinte intervalo de confiança simétrico para µ1 − µ2:
IC(µ1 − µ2, 1− α) =
(
(x̄1 − x̄2)− Zα
2
√
σ21
n1
+
σ22
n2
; (x̄1 − x̄2) + Zα
2
√
σ21
n1
+
σ22
n2
)
Exemplo: O peso médio de duas amostras aleatórias independentes de n1 = 30
e n2 = 40 peças, extraídas de dois grandes lotes, foi X̄1 = 130g e X̄2 = 125g,
respectivamente. Admitindo que os pesos tenham distribuição normais com variân-
cias respectivas σ21 = 60g e σ
2
2 = 80g, estimar, através de um intervalo de 95% de
confiança, a diferença real dos pesos médios, µ1 − µ2, para os dois lotes.
10.5.2 As variâncias σ21 e σ
2
2 são desconhecidas mas σ
2
1 = σ
2
2
Se σ21 = σ
2
2 = σ
2 então, temos
Z =
(x̄1 − x̄2)− (µ1 − µ2)√
σ2( 1
n1
+ 1
n2
)
Sabemos que
S21 =
1
n1 − 1
n1∑
i=1
(xi − x̄)2
110
e
S22 =
1
n2 − 1
n2∑
i=1
(xi − x̄)2
são as variâncias amostrais. Como estamos supondo que σ21 = σ
2
2 = σ
2, então um
estimador não viciado para σ2 é dado por
S2p =
(n1 − 1)S21 + (n2 − 1)S22
n1 + n2 − 2
Temos finalmente
t =
(x̄1−x̄2)−(µ1−µ2)√
σ2( 1
n1
+ 1
n2
)√
(n1+n2−2)S2p
σ2(n1+n2−2)
=
(x̄1 − x̄2)− (µ1 − µ2)√
S2p(
1
n1
+ 1
n2
)
∼ tn1+n2−2
Procedendo de maneira análoga ao caso anterior, obtemos as seguintes expressões
para o IC(µ1 − µ2, 1− α) simétrico:
IC(µ1−µ2, 1−α) =
(
(x̄1−x̄2)−tn1+n2−2;α2
√
S2p(
1
n1
+
1
n2
); (x̄1−x̄2)+tn1+n2−2;α2
√
S2p(
1
n1
+
1
n2
)
)
e
IC(µ1 − µ2, 1− α) =
(
(x̄1 − x̄2)± tn1+n2−1;α2
√
S2p(
1
n1
+
1
n2
)
)
Exemplo: Duas amostras de plantas foram cultivadas com dois fertilizantes difer-
entes. A primeira amostra oriunda de 20 sementes, acusou altura média de 10,9 cm
e desvio padrão 2,0 cm. A segunda amostra, de 10 sementes, acusou uma altura
média de 10,5 cm com desvio padrão de 5,0 cm. Construir um intervalo de confiança
entre as alturas médias das populações ao nível de 95% de confiança.
10.6 Intervalo de Confiança para Diferença de Proporções
Sejam duas proporções p1 e p2, e suas respectivas proporções amostrais p̂1 e p̂2,
baseadas em amostras de tamanhos n1 e n2. Para grandes tamanhos de amostra
111
tem-se que:
p̂1 − p̂2 ∼ N
(
p1 − p2;
p1(1− p1)
n1
+
p2(1− p2)
n2
)
Portanto, o intervalo de confiança para p1− p2, com coeficiente de confiança 1− α é
dado por:
IC(p1−p2, 1−α) =
(
(p̂1−p̂2)−Zα
2
√
p̂1(1− p̂1)
n1
+
p̂2(1− p̂2)
n2
; (p̂1−p̂2)+Zα
2
√
p̂1(1− p̂1)
n1
+
p̂2(1− p̂2)
n2
)
ou
IC(p1 − p2, 1− α) =
(
(p̂1 − p̂2)± Zα
2
√
p̂1(1− p̂1)
n1
+
p̂2(1− p̂2)
n2
)
Exemplo 1: Numa pesquisa sobre intenção do comprador brasileiro, 30 famílias de
uma amostra aleatória de 150 declararam ter uma intenção comprar um carro novo
dentro de um ano. Uma outra amostra de 160 famílias 25 declararam a mesma
intenção. Construir um intervalo de 99% de confiança para a diferença entre as
proporções.
Exemplo 2: Numa pesquisa sobre a opinião dos moradores de duas cidades, A e B,
com relação a um determinado projeto, revelou que na cidade A, dos 400 entrevista-
dos, 180 eram favoráveis ao projeto, na cidade B, dos 600 entrevistados, 350 foram
favoráveis. Verifique, por meio de um intervalo de 90% de confiança, se há diferença
entre as proporções de moradores favoráveis nas duas cidades.
112
10.7 Exercícios
1. Suponha queX é o número de sucessos em n provas de Bernoulli com parâmetro
p. Mostre que a proporção amostral de sucessos p̂ = X
n
, é um estimador não
viciado da proporção populacional de sucessos p
2. Se X1, X2, . . . , Xn é uma amostra aleatória obtida de X com distribuição de
Poisson com parâmetro λ, mostre que a média amostral X̄ é um estimador não
viciado de λ.
3. Seja X a duração da vida de uma peça de equipamento tal que σ = 5 horas.
Admita que 100 peças foram ensaiadas fornecendo uma duração de vida média
de 500 horas e que se deseja obter um intervalo de 95% para a verdadeira média
populacional.
4. Deseja-se estimar a nota média em um exame aplicado em uma escola. Para
isso considerou-se uma amostra de 16 alunos submetidos a esse exame e
obteve-se uma nota média de 7,3 e um desvio padrão de 0,4. Construa o in-
tervalo com 95% de confiança para a verdadeira média.
5. A seguinte amostra refere-se a quantidade de peças de roupas confeccionadas
por 10 funcionários numa determinada empresa num determinado dia: 9, 8, 12,
7, 9, 6, 11, 6, 10, 9. Construir um intervalo de confiança para µ com um nível de
99%.
6. Uma empresa emprega 200 pessoas. Numa amostra aleatória de 25 notas de
despesas numa semana de dezembro, um auditor constatou uma despesa mé-
dia de 220 u.m. com desvio padrão de 20 u.m. Qual é a estimativa intervalar com
99% de confiança para a despesa média da empresa com seus empregados ?
7. Em uma empresa, o número médio da venda de 12 produtos distintos, coletados
por amostragem, indicou 27,33 como média de produtos vendidos por período
de tempo. O desvio-padrão desta amostra foi 4,28. Se desejarmos construir
um intervalo de 99% confiança para a verdadeira média de vendas, podemos
afirmar o quê?
8. Para avaliar a taxa de desemprego em uma cidade, obteve-se uma amostra
aleatória de 1.000 habitantes em idade de trabalho, dos quais 87 eram desem-
pregados. Estimar a porcentagem de desempregados em toda a cidade através
de um intervalo de 90% de confiança.
113
9. Uma amostra de onze elementos, extraída de uma população com distribuição
normal, forneceu variância s2 = 7, 08. Construir um intervalo de 90% de confi-
ança para a variância dessa população.
10. Em uma pesquisa de mercado sobre a preferência dos consumidoresem re-
lação a um novo produto, 155 de uma amostra de 250 consumidores preferiram
o novo produto. Estime, com 90% de confiança a proporção verdadeira de con-
sumidores da população que preferirão esse novo produto.
11. Através de uma amostra aleatória simples de 145 profissionais de certa região,
verificou-se que o salário médio é de 8 salários mínimos (s.m.) com um desvio
padrão de 1,8 s.m. A amostra também forneceu a informação de que 70% dos
profissionais eram casados.
a) Determine e interprete o intervalo de confiança de 99% para a proporção de
profissionais casados desta região?
b) Determine e interprete um Intervalo de Confiança de 90% para σ2.
12. Um engenheiro deseja estimar o rendimento médio de um processo químico
com distribuição normal baseado nas observações de rendimento obtidas de 3
repetições do experimento. Considere os dois estimadores do rendimento médio:
T1 =
X1 +X2 +X3
3
e
T2 =
X1 + 2X2 +X3
4
a) Encontre a esperança e a variância dos estimadores acima.
b) Verifique se são não viciados e consistentes. Qual é o melhor? Porquê?
13. SejaX uma única variável aleatória com distribuição de Bernoulli com parâmetro
θ. Sejam θ̂1 = X e θ̂2 = 1/2 dois estimadores de θ. Verifique se θ̂1 e θ̂2 são não
viciados para θ.
14. T1 e T2 são estimadores de um parâmetro θ, tais que:
E(T1) = θ V (T1) = 9
E(T2) = 3θ V (T2) = 3
114
Diga, justificando, qual destes estimadores é melhor estimador de θ.
15. Para uma amostra aleatória de 100 trabalhadores, em uma firma com 1200 em-
pregados, 70 preferem receber seus salários através de créditos em conta cor-
rente bancária. De posse dessa informação construir o intervalo de 90% de
confiança para a proporção de trabalhadores da firma que têm preferência pelo
crédito em conta corrente para seus trabalhos. [0,62 ; 0,77]
16. Um empresário está estudando os custos de produção de um determinado pro-
duto sob determinadas condições. Ele admite que essa variável é normalmente
distribuída com desvio padrão σ = 2 U.M.(Unidades Monetárias).
a) Determine os ICs de 99%; 95% e 93% para o custo médio verdadeiro do
produto utilizando os valores da seguinte amostra aleatória obtida: 4,8 7,1
8,1 4,5 5,6 6,8 7,2 5,7
[4,415 ; 8,035] , [4,839 ; 7,611] , [5,065 ; 7,385]
b) Suponha que no item a) o desvio padrão não fosse conhecido. Como ficaria
seus cálculos para determinar os ICs para µ?
[5,076 ; 7,385] , [5,345 ; 7,105] , [5,489 ; 6,961]
17. Em uma amostra aleatória de 400 eleitores de uma cidade, 228 foram contra
o uso de recurso públicos para a construção de uma certa obra. Com 95% de
confiança, qual a proporção correspondente a todos os eleitores da cidade?
18. Em uma amostra de 300 clientes de um supermercado, 234 deles utilizavam
cartão de crédito em suas compras. Construa um intervalo de 99% de confiança
para a proporção de que um cliente escolhido ao acaso vá comprar com cartão
de crédito.
19. Uma amostra aleatória da previsão de 15 analistas financeiros sobre os ganhos
por ação da General Motors Corporation foi coletada. O desvio padrão amostral
foi de $ 0,88. Ache o intervalo de confiança de 99% para a variância das pre-
visões dos analistas.
20. Uma amostra aleatória de dimensão n1 = 120 retirada da população X1 com
distribuição Normal de parâmetros µ1 e σ1, deu origem aos seguintes valores:
x̄1 = 20, 5 e s1 = 3, 5. Uma outra amostra, independente da anterior, de dimen-
são n2 = 130 e retirada da população X2 de parâmetros µ2 e σ2, deu origem aos
valores x̄2 = 28, 2 e s2 = 4, 8.
a) Determine o intervalo de confiança a 90% para µ1 − µ2 admitindo que σ1 = 4
115
e σ2 = 5. [-8,636 ; -6,764]
b) Determine o intervalo de confiança a 90% para µ1 − µ2 assumindo, como é
mais natural, que os desvios padrão são desconhecidos. [-8,58 ; -6,82]
21. Em uma pesquisa de possuidores de carros em uma universidade, entre alunos
e alunas, foram obtidos: 48 de 200 alunos possuem automóveis e 19 de 100
alunas possuem automóveis. Encontre um IC de 90% para a diferença entre
proporções. Estatisticamente existe diferença entre proporção de alunos e alu-
nas que possuem automóveis?
22. Uma amostra aleatória de 200 possuidores de cartão de crédito mostra que o
débito médio anual nesses cartões, para contas individuais, é U$ 1592, com
desvio padrão de U$ 997 (com base em dados do USA Today). Com essas
estatísticas, construa um intervalo de 95% de confiança para o débito médio
anual em cartões de crédito para a população de todas as contas.
23. Um banco pretende estimar a percentagem de clientes que passam cheques
sem cobertura. Numa amostra de 150 clientes 15 deles já tinham passado
cheques sem cobertura. Estime, a 95% de confiança a verdadeira percentagem
(ou proporção) de clientes do banco que passam cheques sem cobertura.
24. Extraída duas amostras de professores homens e mulheres, obteve-se os seguintes
resultados quantos aos salários em milhares de dólares: Construir um intervalo
de 95% de confiança para a diferença das médias entre os saláriosdos profes-
sores.
Homens Mulheres
n1 = 25 n2 = 5
x̄1 = 16, 0 x̄2 = 11, 0
S21 = 16 S
2
2 = 10
25. A média dos pesos de uma amostra de 10 embalagens de adubos (em kg) dis-
tribuídos por uma empresa foi de 46,02 kg e com desvio padrão de 0,64 kg.
a) Com 99% de confiança, estime um intervalo para a verdadeira média dos
pesos das embalagens de adubo.
b) Ao nível de 90% de confiança, determine um intervalo para verdadeira variân-
cia das embalagens de adubo.
26. A média aritmética dos gastos com livros de uma amostra de 100 estudantes do
primeiro ano de agronomia é de 70 reais com desvio padrão populacional de 15
116
reais. Construa intervalos com 95% e 99% de confiança para o gasto médio de
todos os estudantes.
27. Em uma amostra com 200 estudantes de uma universidade, verificou-se que
57% são favoráveis a um determinado projeto. Construir e interpretar um inter-
valo de 95% e 99% de confiança para a verdadeira proporção de estudantes fa-
voráveis ao determinado projeto. R: ]0:501386; 0:638614[ e ]0:4796816; 0:6603184[
28. Suponha que estejamos interessados em estimar a porcentagem de consumi-
dores de certo produto. Se a amostra de tamanho 300 forneceu 100 indivíduos
que consomem o dado produto, determine o intervalo de confiança de p, a pro-
porção de pessoas que consomem o produto, com coeficiente de 95% (interprete
o resultado).
29. Numa pesquisa sobre a opinião dos moradores de duas cidades, A e B, com
relação a um determinado projeto, obteve-se a tabela abaixo. Utilize o Intervalo
de confiança de 95% para avaliar a diferença entre os percentuais de favoráveis
nas duas cidades.
Cidade A B
Número de Entrevistados 400 600
Número de favoráveis 180 350
30. De uma população normal com média e variância desconhecidas, extrai-se uma
amostra de tamanho 15 obtendo-se x̄ = 12 e s2 = 49. Obtenha um intervalo de
confiança para a variância populacional, utilizando o nível de confiança de 95%.
31. Em duas populações de cobaias de laboratório (com comportamentos normais
e variâncias iguais), uma de animais do sexo masculino e outra de animais do
sexo feminino, foram recolhidas duas amostras com dimensões 11 e 31 respec-
tivamente. Os dados amostrais relativos aos pesos, em gramas, destas cobaias
foram os seguintes:
n1 = 11 x̄1 = 818 s1 = 40
n2 = 31 x̄2 = 715 s2 = 50
Determine um intervalo de confiança a 99% para a diferença dos pesos médios
e verifique se uma das populações é, em média, mais pesada do que a outra.
117
11 Testes de Hipóteses
11.1 Hipótese Nula e Hipótese Alternativa
Consideraremos aqui problemas estatísticos envolvendo um parâmetro θ cujo valor
é desconhecido mas deve cair dentro de um certo domínio Ω (isto é, Ω é o conjunto
de todos os possíveis valores de θ). Vamos supor que Ω possa ser particionado em
2 (dois) subconjuntos distintos Ω0 e Ω1, e que o pesquisador deva decidir se o valor
desconhecido de θ cai em Ω0 ou em Ω1.
Seja H0 a hipótese de que θ ∈ Ω0 e H1 a hipótese de que θ ∈ Ω1, isto é:
H0 : θ ∈ Ω0
H1: θ ∈ Ω1
Como Ω0 e Ω1 são disjuntos (Ω0∪Ω1 = Ω), somente uma das hipóteses é verdadeira.
O pesquisador deve decidir se aceita H0 ou se aceita H1. Um problema desse tipo é
chamado um problema de teste de hipóteses.
– H0 é denominada hipótese nula, e
– H1 é denominada hipótese alternativa
11.2 Região Crítica do teste
Antes de decidir se aceita ou não a hipótese nula, observa-se uma amostra aleatória
X1, X2, . . . , Xn. Seja S o espaço amostral, isto é, o conjunto de todos os possíveis
resultados da amostra.
118
Especifica-se um procedimento de teste que consiste em dividir o espaço amostral
em dois subconjuntos:
– Um deles consiste dos valores da amostra para o qual ele rejeita H0,
– Outro contém os valores para o qual se rejeita H1.
O subconjunto para o qual H0 será rejeitada é chamada região crítica do teste. O
complemento da região crítica contém todos os possíveis valores para qual H0 será
aceita.
11.3 Erros do Tipo I e erros do Tipo II
Quando estabelecemos um procedimento do teste, podemos incorrer em dois tipos
de erros:
– O de rejeitar H0 quando ela é de fato verdadeira. Este erro é denominado
erro do tipo I. A probabilidade (α) deste tipo de erro ocorrer é controlada pelo
pesquisador e é denominada nível de signicância do teste.
– O de aceitar H0 quando ela é falsa. Este erro é denominado erro do tipo II. A
probabilidade deste erro ocorrer é representada por β
Tabela 17: Representação dos erros do tipo I e II.
H0 é verdadeira H0 é falsa
aceita H0 1− α (coef. de confiança) β
rejeita H0 α (nível de significância) 1− β (poder do Teste)
119
11.4 Teste da hipótese para média populacional µ
11.4.1 σ conhecido
H0 : µ = µ0
H1 : µ 6= µ0 ou µ < µ0 ou µ > µ0
1 - Retira-se uma amostra de tamanho "n"e calcula-se x̄.
2 - Calcula-se o valor da estatística
Z =
x̄− µ0
σ/
√
n
3 - Sob a hipótese nula, tem-se que Z possui uma distribuição normal padrão.
Portanto,
Rejeita-se H0 se | Z |> Zα/2 (isto é, se Z < −Zα/2 ou Z > Zα/2)
Aceita-se H0 se | Z |< Zα/2 (isto é, se −Zα/2 ≤ Z ≤ Zα/2 )
em que α é o nível de significância do teste.
Exemplo: O salário médio dos empregados das indústrias siderúrgicas é de 2,5
salários mínimos, com um desvio padrão de 0,5 salários mínimos. Se uma firma par-
ticular emprega 49 operários com um salário médio de 2,3 salários mínimos, pode-
mos afirmar que essa indústria paga salários inferiores, ao nível de 5%?
11.4.2 σ desconhecido
H0 : µ = µ0
H1 : µ 6= µ0 ou µ < µ0 ou µ > µ0
120
Calcula-se a estatística
t =
x̄− µ0
S/
√
n
Sob a hipótese nula, tem-se que t possui uma distribuição t-Student com n− 1 graus
de liberdade. Portanto,
Rejeita-se H0 se | t |> tα/2;(n−1)
Aceita-se H0 se | t |≤ tα/2;(n−1)
Observação
Se os testes tiverem uma hipótese alternativa unilateral (isto é, se H1 : µ > µ0
ou H1 : µ < µ0) o teste deverá rejeitar unilateralmente (isto é, se t > tα;(n−1) ou
t < −tα;(n−1), respectivamente)
Exemplo: Um fabricante afirma que seus cigarros contém não mais que 30 mg de
nicotina. Uma amostra de 25 cigarros fornece média de 31,5 mg e desvio padrão de
3 mg. Ao nível de 5%, os dados refutam ou não a afirmação do fabricante?
11.5 Teste para Proporção
Suponha que se deseje testar a hipótese:
H0 : p = p0
H1 : p 6= p0 ou p < p0 ou p > p0
Calcula-se a estatística
Z =
p̂− p0√
p0(1−p0)
n
Rejeita-se H0 se | Z |> zα/2
121
Aceita-se H0 se | Z |≤ zα/2
Exemplo: De um grande lote de CD’s produzidos tiramos uma amostra de 240 CD’s
e observamos que 6 apresentavam problemas. Com esse resultado, pode-se con-
cluir que a proporção de CD’s com problemas no lote é inferior a 3%? (use 5% de
significância).
11.6 Teste de hipótese para variância
Suponha que uma variável seja normalmente distribuída com uma variância descon-
hecida e se deseje efetuar o seguinte teste de hipóteses:
H0 : σ
2 = σ20
H1 : σ2 6= σ20 ou σ2 < σ20 ou σ2 > σ20
Calcula-se a estatística
X2 =
(n− 1)s2
σ20
Rejeita-se H0 se X2 < χ21−α/2,[n−1] ou X
2 > χ2α/2,[n−1]
Aceita-se H0 se χ21−α/2,[n−1] ≤ X2 ≤ χ2α/2,[n−1]
Observações
1 - Se a hipótese alternativa fosse
H1 : σ
2 > σ20
H0 seria rejeitada se X2 > χ2α,[n−1]
2 - Se a hipótese alternativa fosse
H1 : σ
2 < σ20
122
H0 seria rejeitada se X2 < χ21−α,[n−1]
Exemplo: Uma das maneiras de manter sob controle a qualidade de um produto é
controlar a sua variabilidade. Uma máquina de encher pacotes de café está regulada
para enchê-los com média de 500 g e desvio padrão de 10 g. Colheu-se uma amostra
de 16 pacotes e observou-se uma variância s2 = 169g2. Supondo que o peso de cada
pacote segue uma distribuição normal, você diria que a máquina está desregulada
com relação à variância?
Solução:
Deseja-se testar:
H0 : σ
2 = 100
H1 : σ2 6= 100
A estatística a ser calculada é:
X2 =
(n− 1)s2
σ20
=
(15)(169)
100
= 25, 35
e o procedimento do teste é: Aceita-se H0 se χ21−α/2,[n−1] ≤ X2 ≤ χ2α/2,[n−1]
isto é,
Aceita-se H0 se 6, 262 ≤ X2 ≤ 27, 488,
e
Rejeita-se H0 seX2 < 27, 488 ou X2 > 27, 488
Portanto, aceita-se H0, e concluímos que a máquina não está desregulada quanto à
variância.
11.7 Teste da hipótese da igualdade de duas médias
Suponha que se tenha
123
H0 : µ1 = µ2
H1 : µ1 6= µ2 ou µ1 > µ2 ou µ1 < µ2
11.7.1 σ21 e σ
2
2 conhecidas
calcula-se a estatística
Z =
x̄1 − x̄2√
σ21
n1
+
σ22
n2
Sabe-se que, sob a hipótese H0, a variável Z possui uma distribuição normal padrão.
Portanto, o procedimento do teste consiste em:
Rejeita-se H0 se | Z |> Zα/2
Aceita-se H0 se | Z |≤ Zα/2
11.7.2 σ21 e σ
2
2 desconhecidas
Suponha que a hipótese de igualdade de variâncias não seja rejeitada. Então pode-
mos supor que σ21 = σ
2
2 , mas esta variância comum não é conhecida. Para efetuar
o teste de igualdade de médias, neste caso, procedemos da seguinte maneira:
t =
x̄1−x̄2√
1
n1
+ 1
n2√
(n1−1)S21+(n2−1)S22
n1+n2−2
124
Esta estatística possui uma distribuição t-Student com n1 +n2−2 graus de liberdade.
Portanto.
Rejeita-se H0 se | t |> tα/2;n1+n2−2
Aceita-se H0 se | t |≤≤ tα/2;n1+n2−2
11.8 Teste de hipótese da diferença entre proporções
Suponha que se tenha
H0 : p1 = p2
H1 : p1 6= p2 ou p1 > p2 ou p1 < p2
Como µp̂1−p̂2 = p1 − p2 = 0 (sob H0) e σ2p̂A−p̂B =
p1q1
n1
+ p2q2
n2
= pq
(
1
n1
+ 1
n2
)
(sob H0)
em que
P =
n1p̂1 + n2p̂2
n1 + n2
é adotado como estimativa de p. Calcula-se
Z =
p̂1 − p̂2
σp̂1−p̂2
e aceita-se H0 se | Z |≤ Zα/2
11.9 Teste da razão de variâncias
Suponha que se deseje testar:
H0 : σ
2
1 = σ
2
2
125
H1 : σ
2
1 6= σ22
ou, equivalentemente,
H0 :
σ21
σ22
= 1
H1 :
σ21
σ22
6= 1
O procedimento do teste é:
Calcula-se a estatística
f =
s21
s22
Vimos que, sob a hipótese H0, a estatística f possui uma distribuição F com n1 − 1
e n2 − 1 graus de liberdade. Portanto,
Aceita-se H0 ao nível de significância α se
1
Fα/2,[n2−1],[n1−1]
≤ f ≤ Fα/2,[n1−1],[n2−1]
Rejeita-se H0 ao nível de significância de α se
f <
1
Fα/2,[n2−1],[n1−1]
ou
f > Fα/2,[n1−1],[n2−1]
Exemplo: Uma das maneiras de medir o grau de satisfação dos empregados de
uma mesma categoria quanto à política salarial é por meio do desvio padrão de
seus salários. A fábrica A diz ser mais coerente na política salarial do que a fábrica
126
B. Para verificar essa afirmação, sorteou-se uma amostra de 10 funcionários não
especializados de A, e 15 de B, obtendo-se as variâncias s2A = 1000 reais e s
2
B =
1600 reais. Qual seria a sua conclusão ao nível de 5%?
Solução:
A hipótese a ser testada é:
H0 : σ
2
A = σ
2
B
H1 : σ
2
A < σ
2
B
Temos que:
f =
s2A
s2B
=
1000
1600
= 0, 625
Devemos aceitar H0 ao nível de significância α = 0, 05 se
f ≥ 1
F0,05,[14],[9]
ou seja, se
f ≥ 0, 33
Como este é o caso, aceitamos H0 ao nível de significância de 0,05, e concluímos
que a fábrica A não é mais coerente na política salarial do que a fábrica B..
127
11.10 Exercícios
1. Sabe-se que o consumo mensal per capita de determinado produto tem dis-
tribuição normal, com desvio padrão de 2 kg. A diretoria da empresa que fabrica
esse produto resolveu que retiraria o produto da linha deprodução se a média
de consumo per capita fosse menor do que 8 kg, caso contrário, continuaria a
fabricá-lo. Foi realizado uma pesquisa de mercado, tomando-se uma amostra
aleatória de 25 pessoas e verificou-se um consumo total de 180 kg do produto.
Construa um teste de hipótese adequado para verificar a hipótese acima a um
nível de significância de 2,5% e diga qual deve ser a decisão a ser adotada pela
empresa?
2. Ao final de 90 dias de uma dieta alimentar envolvendo 25 pessoas, constatou-se
o seguinte ganho médio de peso de 40g, e desvio padrão de 1,378g. Supondo
que o ganho de peso médio dessas pessoas é de 45g, teste a hipótese para
α = 5%, se esse valor é o mesmo.
3. Um processo de fabricação de arame de aço dá um produto com resistência
média de 200 psi. O desvio padrão é de 20 psi. O engenheiro de controle de
qualidade deseja elaborar um teste que indique se houve ou não variação na
média do processo, usando uma amostra de 25 arames obteve-se uma média
de 285 psi. Use um nível de significância de 5%.
4. Suponha que alguém tenha sugerido de experiências passadas que 60% das lar-
vas de mosquito num certo lago deveriam ser da espécie Aedes detritus. Foram
encontrados 60 desse tipo de uma amostra de 80. Os dados suportam esta
hipóteste? Use α = 5%
5. As condições de mortalidade de uma região são tais que a proporção de nasci-
dos que sobrevivem até 60 anos é de 0,6. Testar essa hipótese ao nível de
2%, se em 1000 nascimentos amostrados aleatoriamente, verificou-se 530 so-
breviventes até 60 anos.
6. Observou-se a produção mensal de uma indústria durante alguns anos e verificou-
se que ela obedecia a uma distribuição normal com variância igual a 300 u2. Foi
adotada então uma nova técnica de produção e durante um período de 24 meses
observou-se a produção mensal. Após este período constatou-se que a variân-
cia foi de 400 u2. Há motivos para se acreditar que houve alteração na variância
ao nível de 10%?
128
7. Uma amostra de dez elementos extraída de uma população suposta normal
forneceu variância igual a 12,4. Pergunta-se: esse resultado é suficiente para
se concluir, ao nível α = 5% de significância, que a variância dessa população é
inferior a 25?
8. Para verificar se a variabilidade das espessuras de um tipo de disco metálico é
inferior a 3 mm, considerou-se uma amostra de 25 desses discos e obteve-se
uma estimativa para o desvio-padrão de 1,8 mm. Com este resultado, qual seria
a conclusão a respeito da variabilidade das espessuras? (use α = 5%)
9. Uma amostra de 10 lâmpadas elétricas, da marca A, apresentou a vida média de
1400 horas e uma amostra de 20 lâmpadas elétricas, da marca B, apresentou a
vida média de 1200 horas. Suponha que os desvios padrões populacionais dos
tempos de vida das lâmpadas das duas marcas sejam conhecidos e iguais a 120
e 100, respectivamente. Teste, ao nível de significância de 1%, a hipótese que
as duas marcas produzem lâmpadas com o mesmo tempo médio de vida.
10. Sendo
Amostra 1 n1 = 60 x̄1 = 5, 71 σ21 = 43
Amostra 2 n2 = 35 x̄2 = 4, 12 σ22 = 28
Testar a igualdade das duas média usando α = 5%
11. Duas fábricas devem ser comparadas em relação ao tempo gasto por seus tra-
balhadores para executar determinada tarefa. Na fábrica A são considerados 15
trabalhadores e são obtidos um tempo médio estimado de 12 min e um desvio
padrão de 2 min. Na fábrica B são considerados 20 trabalhadores e o tempo mé-
dio obtido é de 10 min e o desvio padrão é de 3 min. Sabendo-se que o tempo de
execução da tarefa tem a mesma variabilidade nas duas fábricas, pode-se con-
siderar que os trabalhadores da fábrica B são mais rápidos que os da A?(use
α = 0, 05)
12. Duas técnicas de vendas são aplicadas por dois grupos de vendedores: a téc-
nica A, por 12 vendedores, e a técnica B, por 15 vendedores. Espera-se que
a técnica B produza melhores resultados que a técnica A. No final de um mês,
os vendedores de A venderam uma média de 68 ítens, com uma variância de
50, enquanto que os vendedores de B venderam uma média de 76 ítens com
uma variância de 75. Testar, ao nível de significância de 5%, se a técnica B é
129
realmente melhor que a técnica A.
13. Uma amostra de 370 azulejos tirados da produção de um dado dia acusou
19 azulejos com defeito. Numa amostra de 165 azulejos da produção do dia
seguinte havia 15 azulejos com defeito. Há razões estatísticas válidas para se
afirmar que nesse segundo dia a produção tenha piorado? (Use nível de 5% de
significância).
14. Uma empresa de pesquisa de opinião seleciona, aleatóriamente, 300 eleitores
de São Paulo e 400 do Rio de Janeiro, e pergunta a cada um se votará ou não
num determinado candidato nas próximas eleições. 75 eleitores de SP e 120
do RJ responderam afirmativo. Há diferença entre as proporções de eleitores
favoráveis ao candidato naqueles dois Estados? (use α = 0, 01)
15. Dois programas de treinamento de funcionários foram efetuados. Os 21 fun-
cionários treinados no programa antigo apresentaram uma variância de 146 pon-
tos em sua taxa de erro. No novo programa, 11 funcionários apresentaram uma
variância de 200. Sendo α = 10%, pode-se concluir que a variância é diferente
para os dois programas?
16. O fabricante I de um tipo especial de aço afirma que, em relação à resistência à
tração, seu produto é mais homogênio que o do fabricante II. Para verificar essa
afirmação foi considerada uma amostra de 11 cabos de aço do fabricante I e uma
de 15 do II. As estimativas dos desvios padrões obtidas foram, respectivamente,
5 kg/cm e 8 kg/cm. Com esses resultados, qual seria a conclusão a respeito da
afirmação do fabricante I? (Use nível de 2,5% de significância).
17. A Hudson Valley Boaling Company distribui um tipo de cerveja sem álcool em
garrafas que indicam o conteúdo de 32 oz. O Bureau of Weights anel Measures
seleciona aleatoriamente 26 dessas garrafas, mede seu conteúdo e obtém uma
média amostral de 31,8 oz, com desvio-padrão de 0,75 oz. Ao nível de 0,01 de
significância, teste a afirmação do Instituto de que a companhia está ludibriando
os consumidores. Deve-se formalizar uma queixa?
18. Estão em teste dois processos para fechar latas de comestíveis. Em duas se-
qüências de 1000 latas, o processo 1 gera 50 rejeições, enquanto o processo 2
acusa 200 rejeições. Pode ao nível de 5%, concluir que os dois processos sejam
diferentes?
19. Em uma pesquisa de opinião, 32 dentre 80 homens declararam apreciar certa
130
revista, acontecendo o mesmo com 26 dentre 50 mulheres. Ao nível de 5% de
significância os homens e as mulheres apreciam igualmente a revista?
20. A variabilidade de dois produtos similares deve ser comparada. Coletam-se 15
observações do produto 1 e 18 do produto 2. A amostra de produto 1 apresenta
S1 = 15, e a amostra de produto 2 apresenta S2 = 18. Teste a hipótese de que
as variâncias sejam as mesmas (considere α = 0, 10).
21. Um fornecedor de matéria-prima afirma que o teor de impureza de seu produto é
2,5%. 152 amostras são analisadas, sendo 8 delas classificadas como impuras.
Conclua a respeito da hipótese do fornecedor (use α = 0, 05).
22. Um fabricante garante que 90% das peças que fornece a um cliente estão de
acordo com as especificações exigidas. O exame de uma amostra aleatória de
200 destas peças revelou 25 fora das especificações. Verifique se aos níveis de
5% e 1% de significância se há exagero na afirmativa do fabricante.
23. Diversas políticas, em relação às filiais de uma rede de supermercados, estão
associadas ao gasto médio dos clientes em cada compra. Deseja-se comparar
estes parâmetros de duas novas filiais, através de duas amostras de 50 clientes,
selecionados ao acaso, de cada uma das novas filiais. As médias obtidas foram
62 e 71 unidades monetárias. Supondo que os desvios padrões sejam idênticos
e iguais a 20 um, teste a hipótese de que o gasto médio dos clientes não é o
mesmo nas duas filiais. Utilize uma significância de 5%?
24. Em dois anos consecutivos foi feito um levantamento de mercadosobre a prefer-
ência dos consumidores por um determinado produto. No primeiro ano o pro-
duto era anunciado com frequência semanal nos veículos de comunicação e no
segundo ano com frequência mensal. No levantamento foram utilizados duas
amostras independentes de 400 consumidores cada. No primeiro ano o per-
centual de compradores ficou em 33% e no segundo ano em 29%. Considerando
o nível de significância de 5%, teste a hipótese de que a frequência do anúncio
tem influência na manutenção da fatia de mercado.
25. Uma agência de empregos alega que os candidatos por elas colocados nos
últimos 6 meses têm salários de R$ 9.000,00 anuais, em média. Uma agência
governamental extraiu uma amostra aleatória daquele grupo, encontrando um
salário médio de R8.000,00, com desvio-padrão de R$ 1.000,00 com base em
30 empregados. Teste a afirmação da agência, contra a alternativa de que o
131
salário médio é inferior a R$ 9.000,00, ao nível de significância de 0,05.
26. Um pesquisador deseja saber se a média da ingestão calórica diária em popu-
lação rural de um país desenvolvido é menor do que 2000 calorias, valor con-
siderado como ideal. Estudando 500 pessoas, obteve média de 1985 e desvio
padrão de 210. Realize o teste de hipótese.(use α = 3%)
27. Um pesquisador quis determinar os efeitos de um programa orientado de exercí-
cios de longa duração em uma empresa. Os dados foram coletados de 13 pes-
soas que participavam voluntariamente do programa de exercícios e que prati-
cavam atividade física por uma média de 13 anos. O grupo controle foi formado
por 17 pessoas. A variável resposta medida foi o número de vezes que as pes-
soas se erguiam em 30 segundos. O grupo de exercícios teve uma média de
21.0 e um desvio padrão de 4.9. O grupo controle teve média de 12.1 e desvio
padrão de 5.6. Assumindo que as duas populações têm distribuição normal e
que as variâncias populacionais são iguais, realize o teste de hipóteses de que
as médias são iguais. (use α = 5%)
28. Estudos sobre mortalidade de homens com idade superior a 65 anos de uma
cidade mostram que 4% deles morrem dentro de um ano. Num grupo de 1000
indivíduos selecionados dessa população, 60 morreram no período de um ano.
Suspeita-se de que houve um aumento da mortalidade anual nessa população.
(use α = 5%)
29. Um restaurante compra frangos abatidos inteiros com peso médio de 3 quilos há
vários anos de um fornecedor. Outro fornecedor propõe ao gerente do restau-
rante vender frangos com peso médio maior que 3 quilos ao mesmo preço do
fornecedor antigo. Antes de mudar de fornecedor, o gerente do restaurante de-
cidiu comprar 25 frangos do novo fornecedor e pesá-los. Encontrou um peso
médio de 3,2 quilos com um desvio padrão de 0,4 quilos. (use α = 2, 5%)
30. Uma fábrica de automóveis anuncia que seus carros consomem, em média, 11
litros por 100 km, com desvio padrão de 0,8 litro. Uma revista resolve testar
essas afirmação e analisa 35 automóveis dessa marca, obtendo 11,3 litros por
100 km como consumo médio (considerar distribuição normal). O que a revista
pode concluir sobre o anuncio da fábrica, ao nível de 10%?
31. Um especialista em marketing de uma fábrica de massas acredita que 40% dos
amantes de massas preferem lasanha. Se nove de 20 amantes de massas es-
132
colhem lasanha em vez de outras massas, o que podemos concluir sobre a
afirmação? Use um nível de significância de 0,05.
32. Examinaram-se 2 classes de 14 e 15 alunos de um mesmo período de um curso.
Na primeira, o grau médio foi de 7,4 com desvio padrão de 0,8. Na segunda, a
média foi de 7,8, com desvio padrão de 0,7. Há uma diferença significativa entre
os aproveitamentos das 2 classes ao nível de 5%?
33. Em um estudo para estimar a proporção de residentes em certa cidade e seus
arredores que é a favor da construção de uma usina nuclear, descobriu-se que
63 de cem moradores da área urbana são a favor, enquanto somente 59 de
125 moradores dos arredores são a favor. Há uma diferença significante entre
a proporção de moradores da área urbana e dos arredores que são a favor da
construção da usina? (use α = 1%)
34. Deseja-se testar ao nível de 5% se duas populações têm as mesmas variâncias.
Os dados obtidos nas amostras são: n1 = 10, s21 = 5, 22, n2 = 21 e s
2
2 = 16, 9.
Qual a conclusão fornecida pelos dados?
35. A vida média das lâmpadas elétricas produzidas por uma empresa era de 1120
horas. Uma amostra de 8 lâmpadas extraída recentemente apresentou a vida
média de 1070 horas, com desvio padrão de 125 horas. Testar a hipótese de
que a vida média das lâmpadas não se alterou ao nível de 1%.
36. Uma amostra aleatória de cem registros de mortes nos Estados Unidos durante
o ano passado mostrou uma expectativa de vida é de 71,8 anos. Assumindo um
desvio padrão de 8,9 anos, isso parece indicar que a média da expectativa de
vida hoje é maior do que 70 anos? Use um nível de significância de 0,05.
133
12 Correlação e Regressão Linear
Simples
12.1 Correlação Linear Simples
12.1.1 Relação entre variáveis
Se desejarmos verificar a existência e o grau de relação entre variáveis então deve-
mos realizar o estudo da correlação entre essas variáveis.
Exemplos:
– O peso pode estar relacionado com a idade;
– O consumo das famílias pode estar relacionado com a renda;
– A demanda de um determinado produto estar relacionado com seu preço.
12.1.2 Medida de Correlação
O estudo da correlação tem por objetivo medir e avaliar o grau de relação entre as
variáveis X e Y através da disposição dos pontos (X, Y ) em torno de uma reta.
O instrumento de medida da correlação linear é dado pelo coeficiente de correlação
linear de Pearson, ou, simplesmente, coeficiente de correlação.
r =
cov(x, y)
SxSy
em que Sx e Sy são os desvios padrões das variáveis X e Y na amostra.
134
Como
Sx =
√∑n
i=1(xi − x̄)2
n− 1
e Sy =
√∑n
i=1(yi − ȳ)2
n− 1
e a covariância cov(x, y) é dada por
cov(x, y) =
∑n
i=1(xi − x̄)(yi − ȳ)
SxSy
Para Calculo direto do coeficiente de correlação linear de Pearson, tem-se a seguinte
fórmula:
r =
n
∑
xiyi −
∑
xi
∑
yi√
[n
∑
x2i − (
∑
xi)2] · [n
∑
y2i − (
∑
yi)2]
O campo de variação do coeficiente r situa-se entre −1 e +1.
−1 ≤ r ≤ 1
Sua interpretação dependerá do valor numérico e do sinal.
Figura 8: Diagramas de Dispersão.
135
Figura 9: Diagramas de Dispersão.
Figura 10: Diagramas de Dispersão.
12.2 Regressão Linear
– A análise de regressão linear apresenta como resultado uma equação matemática
que descreve um determinado relacionamento.
– A equação pode ser usada para estimar ou predizer valores de uma variável
quando se conhecem ou se supõem conhecidos valores de outra variável.
Definição: Constitui em tentativa de estabelecer uma equação matemática linear
que melhor descreva o relacionamento entre duas variáveis (uma dependente e outra
independente).
A equação de regressão tem por finalidade estimar valores de uma variável, com
base em valores conhecidos da outra.
136
Modelo de regressão linear
Yi = α + βxi + εi (12.1)
em que Yi é o valor estimado (variável dependente), xi é a variável independente, β
é o coeficiente de regressão (coeficiente angular), α é o coeficiente linear e εi é o
resíduo
Observação: Chamamos (1) de modelo linear, pois este representa uma reta. To-
davia, em casos mais gerais, o termo linear refere-se ao modo como os parâmetros
entram no modelo, ou seja, de forma linear.
12.2.1 Pressuposições
– A relação entre X e Y é linear (os acrescimos em X produzem acrescimos
proporcionais em Y e a razão de acrescimo é constante).
– Os valores de X são fixados arbitrariamente (X não é variável aleatória)
– εi é o erro aleatório, portanto uma variável aleatória com distribuição normal,
com média zero e variância constante σ2. [εi ∼ N(0, σ2)]. εi representa a
variação de Y que não é explicada pela variável independente X. Implica que
yi ∼ N(α + βxi, σ2).
– Se i 6= j, cov(εi, εj) = 0, isto é, para duas observações distintas, os erros são
não-correlacionados (oserros são considerados independentes).
Exemplo
Vendas (×1000) X Lucro (×100)
obs 1 2 3 4 5 6 7 8
Vendas 201 225 305 380 560 600 685 735
Lucro 17 20 21 23 25 24 27 27
137
Figura 11: Diagrama de Dispersão.
12.2.2 Método de estimação dos parâmetros α e β
– As estimativas dos parâmetros α e β dados por α̂ e β̂, serão dados a partir de
uma amostra de n pares de valores (xi, yi) que correspondem a n pontos no
diagrama de dispersão.
– O método mais usado para ajustar uma linha reta para um conjunto de pontos
(xi, yi), i = 1, 2, . . . , n é o Método dos Mínimos Quadrados.
– O método dos mínimos quadrados consiste em adotar como estimativa dos
parâmetros os valores que minimizam a soma dos quadrados dos desvios.
Caracteristicas:
– A soma dos desvios verticais dos pontos em relação a reta é zero;
– A soma dos quadrados desses desvios é mínima.
Os valores α̂ e β̂ da reta de regressão ŷ = α̂+ β̂x serão estimados de tal forma que
minimizam a soma dos erros, dados por
εi = yi − (α + βxi), i = 1, 2, . . . , n
Obtemos, então, a quantidade de informação perdida pelo modelo ou soma dos
quadrados dos erros (ou desvios)
138
SQ(α, β) =
n∑
i=1
ε2i =
n∑
i=1
{yi − (α + βxi)}2.
Derivando em relação a α e β e igualando a zero, observa-se que as soluções α̂ e β̂
devem satisfazer.
nα̂ + β̂
n∑
i=1
xi =
n∑
i=1
yi
α̂
n∑
i=1
xi + β̂
n∑
i=1
x2i =
n∑
i=1
xiyi
as quais produzem as soluções
α̂ = ȳ − β̂x̄ (12.2)
β̂ =
∑n
i=1 xiyi − nx̄ȳ∑n
i=1 x
2
i − nx̄2
(12.3)
Para cada par de valores (xi, yi) pode-se estabelecer o desvio εi = yi − ŷi = yi −
(α̂ + β̂xi)
Exemplo
Para facilitar os cálculos da reta de regressão, acrescenta-se três novas colunas na
tabela de dados.
obs Vendas (xi) Lucro (yi) x2i y
2
i xiyi
1 201 17 40.401 289 3.417
2 225 20 50.625 400 4.500
3 305 21 93.025 441 6.405
4 380 23 144.400 529 8.740
5 560 25 313.600 625 14.000
6 600 24 360.000 576 14.400
7 685 27 469.225 729 18.495
8 735 27 540.225 729 19.845∑
3.691 184 2.011.501 4.318 89.802
ȳ = 184
8
= 23 e x̄ = 3691
8
= 461, 38
139
β̂ =
∑
xiyi − nx̄ȳ∑
x2i − nx̄2
=
89.802− 8 · (461, 38)(23)
2.011.501− 8(461, 38)2
= 0, 0159
α̂ = ȳ − β̂x̄ = 23− (0, 0159)(461, 38) = 15, 66
Logo,
ŷ = 0, 0159x+ 15, 66
Partindo da reta de regressão pode-se afirmar que para uma venda de 400 mil pode-
se obter um lucro de ŷ = (0, 0159)(400.000) + 15, 66 = 22 mil.
Figura 12: Diagrama de Dispersão com a reta ajustada.
12.3 Decomposição da variância total
A dispersão da variação aleatória "y"pode ser medida através da soma dos quadra-
dos dos desvios em relação a sua média ȳ. Essa soma de quadrados será denomi-
nada Soma de Quadrados Total (SQTotal)
SQTotal =
n∑
i=1
(yi − ȳ)2
140
A SQTotal pode ser decomposta da seguinte forma:
n∑
i=1
(yi − ȳ)2 =
n∑
i=1
(ŷi − ȳ)2 +
n∑
i=1
(yi − ŷi)2
Assim,
SQTotal = SQRegressão + SQResíduo
Fórmulas para cálculo:
SQTotal =
n∑
i=1
(yi − ȳ)2 = n
n∑
i=1
y2i −
( n∑
i=1
yi
)2
,
com (n− 1) graus de liberdade.
SQRegressão =
n∑
i=1
(yi − ŷi)2 = β
(
n
n∑
i=1
xiyi −
n∑
i=1
xi
n∑
i=1
yi
)
,
com 1 grau de liberdade.
12.4 Análise de Variância da Regressão
A Soma de Quadrados da Regressão (SQRegressão), segue uma distribuição χ2 com
um grau de liberdade, enquanto que a Soma de Quadrados do Resíduo (SQResíduo)
segue a mesma distribuição, porém com (n − 2) graus de liberdade. Portanto, o
quociente
SQRegressão/1
SQResíduo/n− 2
=
QMRegressão
QMResíduo
,
segue uma distribuição F de Snedecor com 1 e (n− 2) graus de liberdade.
Esse fato nos permite empregar a distribuição F de Snedecor para testar a significân-
cia da regressão, através da chamada Análise de Variância, sintetizada no quadro a
seguir.
141
Tabela 18: Tabela ANOVA para modelo de regressão
C. V. g.l. SQ QM F
Regressão 1 SQReg QMReg = SQReg
1
QMReg
QMRes
= Fcalc
Resíduo n− 2 SQRes QMRes = SQRes
n−2
Total n− 1 SQTotal -
Para testar a significância da regressão, formula-se as seguintes hipóteses:
H0 : β = 0 contra H1 : β 6= 0, em que β representa o coeficiente de regressão
paramétrico.
Se o valor de F , calculado a partir do quadro anterior, superar o valor teórico de F
com 1 e (n − 2) graus de liberdade, para o nível de significância α, rejeita-se H0 e
conclui-se que a regressão é significativa.
Se Fcal > Fα,[1,(n−2)], rejeita-se H0.
Para o exemplo anterior,
ŷi = 0, 0159xi + 15, 66
SQRegressão = β
[
n
n∑
i=1
xiyi −
n∑
i=1
xi
n∑
i=1
yi
]
=
SQRegressão = 0, 0159[8(89.802)− (3.691)(184)] = 624, 42
SQTotal = n
n∑
i=1
y2i −
( n∑
i=1
yi
)2
= 8(4.318)− (184)2 = 688
Comparando o Fcal = 58, 93 com o Ftab = F0,05;(1,6) = 5, 99
Conclui-se que a regressão de y sobre x segundo o modelo ŷi = 0, 0159xi + 15, 66 é
142
Tabela 19: Tabela ANOVA para modelo de regressão
C. V. g.l. SQ QM F
Regressão 1 624,42 624,42 58,93
Resíduo 6 63,58 10,60
Total 7 688,00
siginificativa ao nível de 5%.
Uma vez estabelecida e testada a equação de regressão, a mesma pode ser us-
ada para explicar o relacionamento entre as variáveis e também fazer predições dos
valores de y para os valores fixados x.
12.5 Coeficiente de determinação
Este coeficiente é uma medida da proporção da variação da variável resposta Y que é
explicada pela equação de regressão quando está envolvida a variável independente
X.
O coeficiente de determinação é dado por
r2 =
(
n
∑n
i=1 xiyi −
∑n
i=1 xi
∑n
i=1 yi
)2
[n
∑n
i=1 x
2
i − (
∑n
i=1 xi)
2] · [n
∑n
i=1 y
2
i − (
∑n
i=1 yi)
2]
=
cov(x, y)
SxxSyy
O valor de r2 varia de 0 a 1.
No exemplo,
r2 =
[8(89.802)− (3.691)(184)]2
[8(2.011.501)− (3.691)2] · [8(4.318)− (184)2]
= 0, 908
indica que aproximadamente 91% da variação dos lucros estão relacionados com a
variação das vendas.
143
12.6 Exercícios
1. Suponha que uma cadeia de supermercados tenha financiado um estudos dos
gastos com mercadorias para famílias de 4 pessoas. O estudo se limitou a
famílias com renda líquida entre 8 e 20 salários mínimos. Obteve-se a seguinte
equação:
ŷ = −1, 20 + 0, 40x
em que ŷ despesa mensal estimada com mercadorias e x renda líquida mensal.
Estimar a despesa de uma família com renda mensal líquida de 15 s.m.
2. Complete o esquema de cálculo do coeficiente de correlação para os valores das
variáveis xi e yi. Obtenha os parâmetros α e β da reta ajustada.
xi 4 6 8 10 12
yi 12 10 8 12 14
3. Os dados abaixo forma colhidos de cinco fábricas diferentes de uma determinada
indústria:
Produção xi 12 4 6 11 8
Custo total yi 80 44 51 70 61
a) Estime uma função linear para o custo total dessa indústria.
b) Determine o valor do coeficiente de determinação r2.
c) Construa a tabela ANOVA e realize o teste de hipótese.
4. As notas de uma sala com nove estudantes em um relatório de meio de curso
(x) e em um exame final (y) são as seguintes
xi 77 50 71 72 81 94 96 99 67
yi 82 66 78 34 47 85 99 99 68
a) Estime a reta de regressão linear
b) Estime a nota do exame final de um aluno que teve uma nota 85 no relatório
de meio de curso.
c) Determine o valor de r2 e interprete o resultado.
d) Construa a tabela ANOVA e realize o teste de hipótese.
144
Referências
BUSSAB, W. O., MORETTIN, P. A., Estatística Básica, São Paulo: Saraiva 5.ed
(2003).
COSTA NETO, P. L. O., Estatística, São Paulo: Edgard Blucher 3.ed. (2002).
DEVORE, J. L. Probabilidade e Estatística para Engenharia e Ciências. São
Paulo: Pioneira Thomson Learning. (2006).
FONSECA, J. S. da; MARTINS, G. A. Curso de estatística. São Paulo: Atlas, (2009).
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de Probabilidade e Estatística. 6a Ed.
São Paulo. Editora Edusp, (2005).
MARTINS, G. de A. Estatística Geral e aplicada. São Paulo: Atlas, (2001).
MEYER, P.L. Probabilidade, Aplicações à Estatística. Rio de Janeiro; Ao Livro
Técnico S.A. (1976).
MILONE, G., Estatística: Geral e Aplicada, São Paulo: Pioneira Thomson Learning
1.ed. (2004).
MORETTIN, L. G. Estatística Básica - Probabilidade e Inferência. Volume Único.
São Paulo: : Pearson Prentice Hall. (2010).
SPIEGEL, M.R. Estatística. São Paulo: McGraw-Hill do Brasil,(1975).
TOLEDO, G. L., OVALLE, I. I., Estatística Básica, São Paulo: Atlas 2.ed. (1985).
TRIOLA, M. F. Introdução à Estatística, 9 ed. São Paulo: LTC. (2005).
WALPOLE, R. E... [et al.]. Probabilidade e Estatística para engenharia e ciências.
São Paulo: Pearson Prentice Hall, (2009).
 
 
 
 
 
 
 
 
 
 
 
 
Tabelas estatísticas 
Tabela da Distribuição Normal Padrão 
P(Z<z) 
 
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981 
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993 
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995 
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997 
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998 
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 
P(Z<z) 
 
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776 
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611 
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985 
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559 
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455 
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294 
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233 
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183 
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143 
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110 
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084 
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064 
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048 
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036 
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026 
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019 
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014 
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010 
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007 
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005 
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003 
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002 
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 
 
 
 
 
 
 
 
 
 
 
 
 Área na cauda superior 
gl 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005 
1 1,000 3,078 6,314 12,71 31,82 63,66 127,3 318,3 636,6 
2 0,816 1,886 2,920 4,303 6,965 9,925 14,09 22,33 31,60 
3 0,765 1,638 2,353 3,182 4,541 5,841 7,453 10,21 12,92 
4 0,741 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,610 
5 0,727 1,476 2,015 2,571 3,365 4,032 4,773 5,894 6,869 
6 0,718 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,959 
7 0,711 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408 
8 0,706 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,041 
9 0,703 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781 
10 0,700 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587 
11 0,697 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437 
12 0,695 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318 
13 0,694 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221 
14 0,692 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,140 
15 0,691 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073 
16 0,690 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,015 
17 0,689 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965 
18 0,688 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922 
19 0,688 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883 
20 0,687 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,850 
21 0,686 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819 
22 0,686 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792 
23 0,685 1,319 1,714 2,069 2,500 2,807 3,104 3,485 3,768 
24 0,685 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,74525 0,684 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725 
26 0,684 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707 
27 0,684 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,689 
28 0,683 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674 
29 0,683 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,660 
30 0,683 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,646 
35 0,682 1,306 1,690 2,030 2,438 2,724 2,996 3,340 3,591 
40 0,681 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551 
45 0,680 1,301 1,679 2,014 2,412 2,690 2,952 3,281 3,520 
50 0,679 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496 
z 0,674 1,282 1,645 1,960 2,326 2,576 2,807 3,090 3,291 
 Nota: A coluna em destaque é a mais usada. 
 
Tabela 5 Distribuição t de Student 
 
0 t 
Área 
indicada 
(Valor tabulado) 
BARBETTA, P. A. - Estatística aplicada às Ciências Sociais. 7 ed. 
Florianópolis: Editora da UFSC, 2010
Tabela 3 - Valores críticos (unilaterais à esquerda) da distribuição Qui-Quadrado 
P(χ2 com n graus de liberdade ≥ valor tabelado) = α 
 0,995 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01 0,005 
1 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879 
2 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597 
3 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838 
4 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860 
5 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,832 15,086 16,750 
6 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548 
7 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278 
8 1,344 1,647 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955 
9 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589 
10 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188 
11 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757 
12 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300 
13 3,565 4,107 5,009 5,892 7,041 19,812 22,362 24,736 27,688 29,819 
14 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319 
15 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801 
16 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267 
17 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718 
18 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156 
19 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582 
20 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997 
21 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401 
22 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796 
23 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181 
24 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,558 
25 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928 
26 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290 
27 11,808 12,878 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645 
28 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,994 
29 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,335 
30 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672 
31 14,458 15,655 17,539 19,281 21,434 41,422 44,985 48,232 52,191 55,002 
32 15,134 16,362 18,291 20,072 22,271 42,585 46,194 49,480 53,486 56,328 
33 15,815 17,073 19,047 20,867 23,110 43,745 47,400 50,725 54,775 57,648 
34 16,501 17,789 19,806 21,664 23,952 44,903 48,602 51,966 56,061 58,964 
35 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,275 
36 17,887 19,233 21,336 23,269 25,643 47,212 50,998 54,437 58,619 61,581 
37 18,586 19,960 22,106 24,075 26,492 48,363 52,192 55,668 59,893 62,883 
38 19,289 20,691 22,878 24,884 27,343 49,513 53,384 56,895 61,162 64,181 
39 19,996 21,426 23,654 25,695 28,196 50,660 54,572 58,120 62,428 65,475 
40 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766 
41 21,421 22,906 25,215 27,326 29,907 52,949 56,942 60,561 64,950 68,053 
42 22,138 23,650 25,999 28,144 30,765 54,090 58,124 61,777 66,206 69,336 
43 22,860 24,398 26,785 28,965 31,625 55,230 59,304 62,990 67,459 70,616 
44 23,584 25,148 27,575 29,787 32,487 56,369 60,481 64,201 68,710 71,892 
45 24,311 25,901 28,366 30,612 33,350 57,505 61,656 65,410 69,957 73,166 
46 25,041 26,657 29,160 31,439 34,215 58,641 62,830 66,616 71,201 74,437 
47 25,775 27,416 29,956 32,268 35,081 59,774 64,001 67,821 72,443 75,704 
48 26,511 28,177 30,754 33,098 35,949 60,907 65,171 69,023 73,683 76,969 
49 27,249 28,941 31,555 33,930 36,818 62,038 66,339 70,222 74,919 78,231 
50 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490 
OBS.: (1) G.L. = Graus de Liberdade 
(2) Para graus de liberdade que não estão na tabela, isto é acima de 50, 
use a aproximação: ( )p pz k2
21
2
2 1χ = + − , onde zp é o valor 
correspondente na normal padrão. 
 
 
 
 
Probabilidades da distribuição F de Snedecor – valores de p,v,v 21F , onde ( )p,v,vv,v 2121 FFPp ≥= ; %10p = 
1v 
2v 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 40 50 60 100 150 infinito 
1 39,90 49,50 53,60 55,80 57,20 58,20 58,90 59,40 59,90 60,20 60,50 60,70 60,90 61,10 61,20 61,30 61,50 61,60 61,70 61,70 62,10 62,30 62,50 62,70 62,80 63,00 63,10 63,33 
2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 9,39 9,40 9,41 9,42 9,42 9,43 9,43 9,43 9,44 9,44 9,44 9,45 9,46 9,47 9,47 9,48 9,48 9,49 9,49 
3 5,54 5,46 5,39 5,34 5,31 5,29 5,27 5,25 5,24 5,23 5,22 5,22 5,21 5,21 5,20 5,20 5,19 5,19 5,19 5,18 5,18 5,17 5,16 5,16 5,15 5,14 5,14 5,13 
4 4,55 4,33 4,19 4,11 4,05 4,01 3,98 3,96 3,94 3,92 3,91 3,90 3,89 3,88 3,87 3,86 3,86 3,85 3,85 3,84 3,83 3,82 3,80 3,80 3,79 3,78 3,77 3,76 
5 4,06 3,78 3,62 3,52 3,45 3,41 3,37 3,34 3,32 3,30 3,28 3,27 3,26 3,25 3,24 3,23 3,22 3,22 3,21 3,21 3,19 3,17 3,16 3,15 3,14 3,13 3,12 3,11 
6 3,78 3,46 3,29 3,18 3,11 3,06 3,01 2,98 2,96 2,94 2,92 2,91 2,89 2,88 2,87 2,86 2,86 2,85 2,84 2,84 2,82 2,80 2,78 2,77 2,76 2,75 2,74 2,72 
7 3,59 3,26 3,07 2,96 2,88 2,83 2,79 2,75 2,73 2,70 2,68 2,67 2,65 2,64 2,63 2,62 2,62 2,61 2,60 2,60 2,57 2,56 2,54 2,52 2,51 2,50 2,49 2,47 
8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,56 2,54 2,52 2,50 2,49 2,48 2,46 2,45 2,45 2,44 2,43 2,43 2,40 2,38 2,36 2,35 2,34 2,32 2,31 2,29 
9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,44 2,42 2,40 2,38 2,36 2,35 2,34 2,33 2,32 2,31 2,31 2,30 2,27 2,26 2,23 2,22 2,21 2,19 2,18 2,16 
10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,35 2,32 2,30 2,28 2,27 2,26 2,24 2,23 2,22 2,22 2,21 2,20 2,17 2,16 2,13 2,12 2,11 2,09 2,08 2,06 
11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,27 2,25 2,23 2,21 2,19 2,18 2,17 2,16 2,15 2,14 2,13 2,12 2,10 2,08 2,05 2,04 2,03 2,01 1,99 1,97 
12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,25 2,21 2,19 2,17 2,15 2,13 2,12 2,11 2,09 2,08 2,08 2,07 2,06 2,03 2,01 1,99 1,97 1,96 1,94 1,93 1,90 
13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,16 2,14 2,12 2,10 2,08 2,07 2,05 2,04 2,03 2,02 2,01 2,01 1,98 1,96 1,93 1,92 1,90 1,88 1,87 1,85 
14 3,10 2,73 2,52 2,40 2,31 2,24 2,19 2,15 2,12 2,10 2,07 2,05 2,04 2,02 2,01 2,00 1,99 1,98 1,97 1,96 1,93 1,91 1,89 1,87 1,86 1,83 1,82 1,80 
15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,09 2,06 2,04 2,02 2,00 1,99 1,97 1,96 1,95 1,94 1,93 1,92 1,89 1,87 1,85 1,83 1,82 1,79 1,78 1,76 
16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 2,06 2,03 2,01 1,99 1,97 1,95 1,94 1,93 1,92 1,91 1,90 1,89 1,86 1,84 1,81 1,79 1,78 1,76 1,74 1,72 
17 3,03 2,65 2,44 2,31 2,22 2,15 2,10 2,06 2,03 2,00 1,98 1,96 1,94 1,93 1,91 1,90 1,89 1,88 1,87 1,86 1,83 1,81 1,78 1,76 1,75 1,73 1,71 1,69 
18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 2,01 1,98 1,95 1,93 1,92 1,90 1,89 1,88 1,86 1,85 1,85 1,84 1,81 1,78 1,75 1,74 1,72 1,70 1,68 1,66 
19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,98 1,96 1,93 1,91 1,89 1,88 1,87 1,85 1,84 1,83 1,82 1,81 1,78 1,76 1,73 1,71 1,70 1,67 1,66 1,63 
20 2,98 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,97 1,94 1,91 1,89 1,88 1,86 1,85 1,83 1,82 1,81 1,80 1,79 1,76 1,74 1,71 1,69 1,68 1,65 1,64 1,61 
25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,931,90 1,87 1,84 1,82 1,80 1,79 1,77 1,76 1,75 1,74 1,73 1,72 1,68 1,66 1,63 1,61 1,59 1,57 1,55 1,52 
30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,85 1,82 1,79 1,77 1,75 1,74 1,72 1,71 1,70 1,69 1,68 1,67 1,63 1,61 1,57 1,55 1,54 1,51 1,49 1,46 
40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,79 1,76 1,74 1,72 1,70 1,68 1,66 1,65 1,64 1,63 1,62 1,61 1,57 1,54 1,51 1,48 1,47 1,43 1,42 1,38 
50 2,81 2,41 2,20 2,06 1,97 1,90 1,84 1,80 1,76 1,73 1,70 1,68 1,66 1,64 1,63 1,61 1,60 1,59 1,58 1,57 1,53 1,50 1,47 1,44 1,42 1,39 1,37 1,33 
60 2,79 2,39 2,18 2,04 1,95 1,88 1,82 1,78 1,74 1,71 1,68 1,66 1,64 1,62 1,60 1,59 1,58 1,56 1,55 1,54 1,50 1,48 1,44 1,41 1,40 1,36 1,34 1,29 
100 2,76 2,36 2,14 2,00 1,91 1,83 1,78 1,73 1,70 1,66 1,64 1,61 1,59 1,57 1,56 1,54 1,53 1,52 1,51 1,49 1,45 1,42 1,38 1,36 1,34 1,29 1,27 1,21 
150 2,74 2,34 2,12 1,98 1,89 1,81 1,76 1,71 1,67 1,64 1,61 1,59 1,57 1,55 1,53 1,52 1,50 1,49 1,48 1,47 1,43 1,40 1,35 1,33 1,31 1,26 1,23 1,17 
infinito 2,71 2,30 2,08 1,95 1,85 1,77 1,72 1,67 1,63 1,60 1,57 1,55 1,52 1,51 1,49 1,47 1,46 1,44 1,43 1,42 1,38 1,34 1,30 1,26 1,24 1,19 1,15 1,00 
 
 
 
Probabilidades da distribuição F de Snedecor – valores de p,v,v 21F , onde ( )p,v,vv,v 2121 FFPp ≥= ; %5p = 
1v 
2v 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 40 50 60 100 150 infinito 
1 161,40 199,50 215,70 224,60 230,20 234,00 236,80 238,90 240,50 241,90 243,00 243,90 244,70 245,40 245,90 246,50 246,90 247,30 247,70 248,00 249,30 250,10 251,10 251,80 252,20 253,00 253,50 254,31 
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,39 19,40 19,41 19,41 19,42 19,42 19,43 19,43 19,44 19,44 19,44 19,45 19,46 19,46 19,47 19,48 19,48 19,49 19,49 19,50 
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,75 8,73 8,72 8,70 8,69 8,68 8,68 8,67 8,66 8,63 8,62 8,59 8,58 8,57 8,55 8,55 8,53 
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91 5,89 5,87 5,86 5,84 5,83 5,82 5,81 5,80 5,77 5,75 5,72 5,70 5,69 5,66 5,65 5,63 
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68 4,66 4,64 4,62 4,60 4,59 4,58 4,57 4,56 4,52 4,50 4,46 4,44 4,43 4,41 4,39 4,37 
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,98 3,96 3,94 3,92 3,91 3,90 3,88 3,87 3,84 3,81 3,77 3,75 3,74 3,71 3,70 3,67 
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,58 3,55 3,53 3,51 3,49 3,48 3,47 3,46 3,45 3,40 3,38 3,34 3,32 3,30 3,28 3,26 3,23 
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,26 3,24 3,22 3,20 3,19 3,17 3,16 3,15 3,11 3,08 3,04 3,02 3,01 2,98 2,96 2,93 
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07 3,05 3,03 3,01 2,99 2,97 2,96 2,95 2,94 2,89 2,86 2,83 2,80 2,79 2,76 2,74 2,71 
10 4,97 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,89 2,87 2,85 2,83 2,81 2,80 2,79 2,77 2,73 2,70 2,66 2,64 2,62 2,59 2,57 2,54 
11 4,84 3,98 3,59 3,36 3,20 3,10 3,01 2,95 2,90 2,85 2,82 2,79 2,76 2,74 2,72 2,70 2,69 2,67 2,66 2,65 2,60 2,57 2,53 2,51 2,49 2,46 2,44 2,40 
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69 2,66 2,64 2,62 2,60 2,58 2,57 2,56 2,54 2,50 2,47 2,43 2,40 2,38 2,35 2,33 2,30 
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,64 2,60 2,58 2,55 2,53 2,52 2,50 2,48 2,47 2,46 2,41 2,38 2,34 2,31 2,30 2,26 2,24 2,21 
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53 2,51 2,48 2,46 2,45 2,43 2,41 2,40 2,39 2,34 2,31 2,27 2,24 2,22 2,19 2,17 2,13 
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48 2,45 2,42 2,40 2,39 2,37 2,35 2,34 2,33 2,28 2,25 2,20 2,18 2,16 2,12 2,11 2,07 
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,43 2,40 2,37 2,35 2,33 2,32 2,30 2,29 2,28 2,23 2,19 2,15 2,12 2,11 2,07 2,05 2,01 
17 4,45 3,59 3,20 2,97 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38 2,35 2,33 2,31 2,29 2,27 2,26 2,24 2,23 2,18 2,15 2,10 2,08 2,06 2,02 2,00 1,96 
18 4,41 3,56 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34 2,31 2,29 2,27 2,25 2,23 2,22 2,20 2,19 2,14 2,11 2,06 2,04 2,02 1,98 1,96 1,92 
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31 2,28 2,26 2,23 2,22 2,20 2,18 2,17 2,16 2,11 2,07 2,03 2,00 1,98 1,94 1,92 1,88 
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28 2,25 2,23 2,20 2,18 2,17 2,15 2,14 2,12 2,07 2,04 1,99 1,97 1,95 1,91 1,89 1,84 
25 4,24 3,39 2,99 2,76 2,60 2,49 2,41 2,34 2,28 2,24 2,20 2,17 2,14 2,11 2,09 2,07 2,05 2,04 2,02 2,01 1,96 1,92 1,87 1,84 1,82 1,78 1,76 1,71 
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,17 2,13 2,09 2,06 2,04 2,02 2,00 1,98 1,96 1,95 1,93 1,88 1,84 1,79 1,76 1,74 1,70 1,67 1,62 
40 4,09 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00 1,97 1,95 1,92 1,90 1,89 1,87 1,85 1,84 1,78 1,74 1,69 1,66 1,64 1,59 1,56 1,51 
50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,99 1,95 1,92 1,90 1,87 1,85 1,83 1,81 1,80 1,78 1,73 1,69 1,63 1,60 1,58 1,53 1,50 1,44 
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92 1,89 1,86 1,84 1,82 1,80 1,78 1,76 1,75 1,69 1,65 1,59 1,56 1,53 1,48 1,45 1,39 
100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,98 1,93 1,89 1,85 1,82 1,79 1,77 1,75 1,73 1,71 1,69 1,68 1,62 1,57 1,52 1,48 1,45 1,39 1,36 1,28 
150 3,90 3,06 2,67 2,43 2,27 2,16 2,07 2,00 1,94 1,89 1,85 1,82 1,79 1,76 1,73 1,71 1,69 1,67 1,66 1,64 1,58 1,54 1,48 1,44 1,41 1,35 1,31 1,22 
infinito 3,84 3,00 2,61 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,79 1,75 1,72 1,69 1,67 1,64 1,62 1,60 1,59 1,57 1,51 1,46 1,39 1,35 1,32 1,24 1,20 1,00 
 
 
 
Probabilidades da distribuição F de Snedecor – valores de p,v,v 21F , onde ( )p,v,vv,v 2121 FFPp ≥= ; %5,2p = 
1v 
2v 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 40 50 60 100 150 infinito 
1 647,8 799,5 864,2 899,6 921,8 937,1 948,2 956,6 963,3 968,6 973,0 976,7 979,8 982,5 984,9 986,9 988,7 990,3 991,8 993,1 998,1 1001,4 1005,6 1008,1 1009,8 1013,2 1014,9 1018,3 
2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,42 39,42 39,43 39,43 39,44 39,44 39,44 39,45 39,45 39,46 39,47 39,47 39,48 39,48 39,49 39,49 39,50 
3 17,44 16,04 15,44 15,10 14,89 14,74 14,62 14,54 14,47 14,42 14,37 14,34 14,31 14,28 14,25 14,23 14,21 14,20 14,18 14,17 14,12 14,08 14,04 14,01 13,99 13,96 13,94 13,90 
4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,91 8,84 8,79 8,75 8,72 8,68 8,66 8,63 8,61 8,59 8,58 8,56 8,50 8,46 8,41 8,38 8,36 8,32 8,30 8,26 
5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,57 6,53 6,49 6,46 6,43 6,40 6,38 6,36 6,34 6,33 6,27 6,23 6,18 6,14 6,12 6,08 6,06 6,02 
6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,41 5,37 5,33 5,30 5,27 5,24 5,22 5,20 5,18 5,17 5,11 5,07 5,01 4,98 4,96 4,92 4,89 4,85 
7 8,07 6,54 5,89 5,52 5,29 5,12 5,00 4,90 4,82 4,76 4,71 4,67 4,63 4,60 4,57 4,54 4,52 4,50 4,48 4,47 4,41 4,36 4,31 4,28 4,25 4,21 4,19 4,14 
8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,24 4,20 4,16 4,13 4,10 4,08 4,05 4,03 4,02 4,00 3,94 3,89 3,84 3,81 3,78 3,74 3,72 3,67 
9 7,21 5,72 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,91 3,87 3,83 3,80 3,77 3,74 3,72 3,70 3,68 3,67 3,60 3,56 3,51 3,47 3,45 3,40 3,38 3,33 
10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,86 3,78 3,72 3,67 3,62 3,58 3,55 3,52 3,50 3,47 3,45 3,44 3,42 3,36 3,31 3,26 3,22 3,20 3,15 3,13 3,08 
11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,47 3,43 3,39 3,36 3,33 3,30 3,28 3,26 3,24 3,23 3,16 3,12 3,06 3,03 3,00 2,96 2,93 2,88 
12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,32 3,28 3,24 3,21 3,18 3,15 3,13 3,11 3,09 3,07 3,01 2,96 2,91 2,87 2,85 2,80 2,78 2,73 
13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,20 3,15 3,12 3,08 3,05 3,03 3,00 2,98 2,97 2,95 2,88 2,84 2,78 2,74 2,72 2,67 2,65 2,60 
14 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,10 3,05 3,01 2,98 2,95 2,92 2,90 2,88 2,86 2,84 2,78 2,73 2,67 2,64 2,61 2,57 2,54 2,49 
15 6,20 4,77 4,15 3,80 3,58 3,42 3,29 3,20 3,12 3,06 3,01 2,96 2,93 2,89 2,86 2,84 2,81 2,79 2,77 2,76 2,69 2,64 2,59 2,55 2,52 2,47 2,45 2,40 
16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,13 3,05 2,99 2,93 2,89 2,85 2,82 2,79 2,76 2,742,72 2,70 2,68 2,61 2,57 2,51 2,47 2,45 2,40 2,37 2,32 
17 6,04 4,62 4,01 3,67 3,44 3,28 3,16 3,06 2,99 2,92 2,87 2,83 2,79 2,75 2,72 2,70 2,67 2,65 2,63 2,62 2,55 2,50 2,44 2,41 2,38 2,33 2,30 2,25 
18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,81 2,77 2,73 2,70 2,67 2,64 2,62 2,60 2,58 2,56 2,49 2,45 2,38 2,35 2,32 2,27 2,24 2,19 
19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,77 2,72 2,68 2,65 2,62 2,59 2,57 2,55 2,53 2,51 2,44 2,39 2,33 2,30 2,27 2,22 2,19 2,13 
20 5,87 4,46 3,86 3,52 3,29 3,13 3,01 2,91 2,84 2,77 2,72 2,68 2,64 2,60 2,57 2,55 2,52 2,50 2,48 2,46 2,40 2,35 2,29 2,25 2,22 2,17 2,14 2,09 
25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,56 2,52 2,48 2,44 2,41 2,38 2,36 2,34 2,32 2,30 2,23 2,18 2,12 2,08 2,05 2,00 1,97 1,91 
30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,58 2,51 2,46 2,41 2,37 2,34 2,31 2,28 2,26 2,23 2,21 2,20 2,12 2,07 2,01 1,97 1,94 1,88 1,85 1,79 
40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,33 2,29 2,25 2,21 2,18 2,15 2,13 2,11 2,09 2,07 1,99 1,94 1,88 1,83 1,80 1,74 1,71 1,64 
50 5,34 3,98 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32 2,26 2,22 2,18 2,14 2,11 2,08 2,06 2,03 2,01 1,99 1,92 1,87 1,80 1,75 1,72 1,66 1,62 1,55 
60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,22 2,17 2,13 2,09 2,06 2,03 2,01 1,99 1,96 1,94 1,87 1,82 1,74 1,70 1,67 1,60 1,56 1,48 
100 5,18 3,83 3,25 2,92 2,70 2,54 2,42 2,32 2,24 2,18 2,12 2,08 2,04 2,00 1,97 1,94 1,91 1,89 1,87 1,85 1,77 1,72 1,64 1,59 1,56 1,48 1,44 1,35 
150 5,13 3,78 3,20 2,87 2,65 2,49 2,37 2,28 2,20 2,14 2,08 2,03 1,99 1,96 1,92 1,89 1,87 1,84 1,82 1,80 1,72 1,67 1,59 1,54 1,50 1,42 1,38 1,27 
infinito 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,99 1,95 1,90 1,87 1,83 1,80 1,78 1,75 1,73 1,71 1,63 1,57 1,48 1,43 1,39 1,30 1,24 1,00 
 
 
 
Probabilidades da distribuição F de Snedecor – valores de p,v,v 21F , onde ( )p,v,vv,v 2121 FFPp ≥= ; %1p = 
1v 
2v 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 40 50 60 100 150 infinito 
1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107 6126 6143 6157 6170 6181 6191 6201 6209 6240 6260 6286 6302 6313 6334 6345 6366 
2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 99,41 99,42 99,42 99,43 99,43 99,44 99,44 99,44 99,45 99,45 99,46 99,47 99,48 99,48 99,48 99,49 99,49 99,50 
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,13 27,05 26,98 26,92 26,87 26,83 26,79 26,75 26,72 26,69 26,58 26,50 26,41 26,35 26,32 26,24 26,20 26,13 
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,45 14,37 14,31 14,25 14,20 14,15 14,11 14,08 14,05 14,02 13,91 13,84 13,75 13,69 13,65 13,58 13,54 13,46 
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,96 9,89 9,83 9,77 9,72 9,68 9,64 9,61 9,58 9,55 9,45 9,38 9,29 9,24 9,20 9,13 9,09 9,02 
6 13,75 10,93 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72 7,66 7,61 7,56 7,52 7,48 7,45 7,42 7,40 7,30 7,23 7,14 7,09 7,06 6,99 6,95 6,88 
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,54 6,47 6,41 6,36 6,31 6,28 6,24 6,21 6,18 6,16 6,06 5,99 5,91 5,86 5,82 5,76 5,72 5,65 
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,73 5,67 5,61 5,56 5,52 5,48 5,44 5,41 5,38 5,36 5,26 5,20 5,12 5,07 5,03 4,96 4,93 4,86 
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,18 5,11 5,06 5,01 4,96 4,92 4,89 4,86 4,83 4,81 4,71 4,65 4,57 4,52 4,48 4,42 4,38 4,31 
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,77 4,71 4,65 4,60 4,56 4,52 4,49 4,46 4,43 4,41 4,31 4,25 4,17 4,12 4,08 4,01 3,98 3,91 
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,46 4,40 4,34 4,29 4,25 4,21 4,18 4,15 4,12 4,10 4,01 3,94 3,86 3,81 3,78 3,71 3,67 3,60 
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,22 4,16 4,10 4,05 4,01 3,97 3,94 3,91 3,88 3,86 3,77 3,70 3,62 3,57 3,54 3,47 3,43 3,36 
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 4,03 3,96 3,91 3,86 3,82 3,78 3,75 3,72 3,69 3,67 3,57 3,51 3,43 3,38 3,34 3,27 3,24 3,17 
14 8,86 6,52 5,56 5,04 4,70 4,46 4,28 4,14 4,03 3,94 3,86 3,80 3,75 3,70 3,66 3,62 3,59 3,56 3,53 3,51 3,41 3,35 3,27 3,22 3,18 3,11 3,08 3,00 
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,90 3,81 3,73 3,67 3,61 3,56 3,52 3,49 3,45 3,42 3,40 3,37 3,28 3,21 3,13 3,08 3,05 2,98 2,94 2,87 
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,62 3,55 3,50 3,45 3,41 3,37 3,34 3,31 3,28 3,26 3,17 3,10 3,02 2,97 2,93 2,86 2,83 2,75 
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,46 3,40 3,35 3,31 3,28 3,24 3,21 3,19 3,16 3,07 3,00 2,92 2,87 2,84 2,76 2,73 2,65 
18 8,29 6,01 5,09 4,58 4,25 4,02 3,84 3,71 3,60 3,51 3,43 3,37 3,32 3,27 3,23 3,19 3,16 3,13 3,10 3,08 2,98 2,92 2,84 2,78 2,75 2,68 2,64 2,57 
19 8,19 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,36 3,30 3,24 3,20 3,15 3,12 3,08 3,05 3,03 3,00 2,91 2,84 2,76 2,71 2,67 2,60 2,57 2,49 
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,29 3,23 3,18 3,13 3,09 3,05 3,02 2,99 2,96 2,94 2,84 2,78 2,70 2,64 2,61 2,54 2,50 2,42 
25 7,77 5,57 4,68 4,18 3,86 3,63 3,46 3,32 3,22 3,13 3,06 2,99 2,94 2,89 2,85 2,81 2,78 2,75 2,72 2,70 2,60 2,54 2,45 2,40 2,36 2,29 2,25 2,17 
30 7,56 5,39 4,51 4,02 3,70 3,47 3,31 3,17 3,07 2,98 2,91 2,84 2,79 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,45 2,39 2,30 2,25 2,21 2,13 2,09 2,01 
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,73 2,67 2,61 2,56 2,52 2,48 2,45 2,42 2,39 2,37 2,27 2,20 2,11 2,06 2,02 1,94 1,90 1,81 
50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,79 2,70 2,63 2,56 2,51 2,46 2,42 2,38 2,35 2,32 2,29 2,27 2,17 2,10 2,01 1,95 1,91 1,83 1,78 1,68 
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,56 2,50 2,44 2,39 2,35 2,32 2,28 2,25 2,22 2,20 2,10 2,03 1,94 1,88 1,84 1,75 1,70 1,60 
100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,50 2,43 2,37 2,31 2,27 2,22 2,19 2,15 2,12 2,09 2,07 1,97 1,89 1,80 1,74 1,69 1,60 1,55 1,43 
150 6,81 4,75 3,92 3,45 3,14 2,92 2,76 2,63 2,53 2,44 2,37 2,31 2,25 2,20 2,16 2,12 2,09 2,06 2,03 2,00 1,90 1,83 1,73 1,67 1,62 1,52 1,47 1,33 
infinito 6,64 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,25 2,19 2,13 2,08 2,04 2,00 1,97 1,93 1,91 1,88 1,77 1,70 1,59 1,52 1,47 1,36 1,29 1,00 
 
 
 
Probabilidades da distribuição F de Snedecor – valores de p,v,v 21F , onde ( )p,v,vv,v 2121 FFPp ≥= ; %5,0p = 
1v 
2v 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 40 50 60 100 150 infinito 
1 16213 19997 21614 22501 23056 23440 23715 23924 24092 24222 24334 24427 24505 24572 24632 24684 24729 24766 24803 24837 24959 25041 25146 25213 25254 25339 25377 25464 
2 198,5 199,0 199,2 199,2 199,3 199,3 199,4 199,4 199,4 199,4 199,4 199,4 199,4 199,4 199,4 199,4 199,4 199,4 199,4 199,4 199,4 199,5 199,5 199,5 199,5 199,5 199,5 199,5 
3 55,55 49,80 47,47 46,20 45,39 44,84 44,43 44,13 43,88 43,69 43,53 43,39 43,27 43,17 43,09 43,01 42,94 42,88 42,83 42,78 42,59 42,47 42,31 42,21 42,15 42,02 41,96 41,83 
4 31,33 26,28 24,26 23,15 22,46 21,98 21,62 21,35 21,14 20,97 20,82 20,71 20,60 20,52 20,44 20,37 20,31 20,26 20,21 20,17 20,00 19,89 19,75 19,67 19,61 19,50 19,44 19,33 
5 22,79 18,31 16,53 15,56 14,94 14,51 14,20 13,96 13,77 13,62 13,49 13,39 13,29 13,22 13,15 13,09 13,03 12,99 12,94 12,90 12,76 12,66 12,53 12,45 12,40 12,30 12,25 12,14 
6 18,64 14,54 12,92 12,03 11,46 11,07 10,79 10,57 10,39 10,25 10,13 10,03 9,95 9,88 9,81 9,76 9,71 9,66 9,63 9,59 9,45 9,36 9,24 9,17 9,12 9,03 8,98 8,88 
7 16,24 12,40 10,88 10,05 9,52 9,16 8,89 8,68 8,51 8,38 8,27 8,18 8,10 8,03 7,97 7,92 7,87 7,83 7,79 7,75 7,62 7,53 7,42 7,35 7,31 7,22 7,17 7,08 
8 14,69 11,04 9,60 8,81 8,30 7,95 7,69 7,50 7,34 7,21 7,11 7,02 6,94 6,87 6,81 6,76 6,72 6,68 6,64 6,61 6,48 6,40 6,29 6,22 6,18 6,09 6,04 5,95 
9 13,61 10,11 8,72 7,96 7,47 7,13 6,89 6,69 6,54 6,42 6,31 6,23 6,15 6,09 6,03 5,98 5,94 5,90 5,86 5,83 5,71 5,63 5,52 5,45 5,41 5,32 5,28 5,19 
10 12,83 9,43 8,08 7,34 6,87 6,55 6,30 6,12 5,97 5,85 5,75 5,66 5,59 5,53 5,47 5,42 5,38 5,34 5,31 5,27 5,15 5,07 4,97 4,90 4,86 4,77 4,73 4,64 
11 12,23 8,91 7,60 6,88 6,42 6,10 5,87 5,68 5,545,42 5,32 5,24 5,17 5,10 5,05 5,00 4,96 4,92 4,89 4,86 4,74 4,65 4,55 4,49 4,45 4,36 4,32 4,23 
12 11,75 8,51 7,23 6,52 6,07 5,76 5,52 5,35 5,20 5,09 4,99 4,91 4,84 4,78 4,72 4,67 4,63 4,60 4,56 4,53 4,41 4,33 4,23 4,17 4,12 4,04 3,99 3,90 
13 11,37 8,19 6,93 6,23 5,79 5,48 5,25 5,08 4,94 4,82 4,72 4,64 4,57 4,51 4,46 4,41 4,37 4,33 4,30 4,27 4,15 4,07 3,97 3,91 3,87 3,78 3,74 3,65 
14 11,06 7,92 6,68 6,00 5,56 5,26 5,03 4,86 4,72 4,60 4,51 4,43 4,36 4,30 4,25 4,20 4,16 4,12 4,09 4,06 3,94 3,86 3,76 3,70 3,66 3,57 3,53 3,44 
15 10,80 7,70 6,48 5,80 5,37 5,07 4,85 4,67 4,54 4,42 4,33 4,25 4,18 4,12 4,07 4,02 3,98 3,95 3,91 3,88 3,77 3,69 3,59 3,52 3,48 3,39 3,35 3,26 
16 10,58 7,51 6,30 5,64 5,21 4,91 4,69 4,52 4,38 4,27 4,18 4,10 4,03 3,97 3,92 3,88 3,83 3,80 3,76 3,73 3,62 3,54 3,44 3,38 3,33 3,25 3,20 3,11 
17 10,38 7,35 6,16 5,50 5,08 4,78 4,56 4,39 4,25 4,14 4,05 3,97 3,90 3,84 3,79 3,75 3,71 3,67 3,64 3,61 3,49 3,41 3,31 3,25 3,21 3,12 3,08 2,98 
18 10,22 7,22 6,03 5,38 4,96 4,66 4,45 4,28 4,14 4,03 3,94 3,86 3,79 3,73 3,68 3,64 3,60 3,56 3,53 3,50 3,38 3,30 3,20 3,14 3,10 3,01 2,97 2,87 
19 10,07 7,09 5,92 5,27 4,85 4,56 4,35 4,18 4,04 3,93 3,84 3,76 3,70 3,64 3,59 3,54 3,50 3,46 3,43 3,40 3,29 3,21 3,11 3,04 3,00 2,91 2,87 2,78 
20 9,94 6,99 5,82 5,17 4,76 4,47 4,26 4,09 3,96 3,85 3,76 3,68 3,61 3,55 3,50 3,46 3,42 3,38 3,35 3,32 3,20 3,12 3,02 2,96 2,92 2,83 2,78 2,69 
25 9,48 6,60 5,46 4,84 4,43 4,15 3,94 3,78 3,65 3,54 3,45 3,37 3,30 3,25 3,20 3,15 3,11 3,08 3,04 3,01 2,90 2,82 2,72 2,65 2,61 2,52 2,47 2,38 
30 9,18 6,36 5,24 4,62 4,23 3,95 3,74 3,58 3,45 3,34 3,26 3,18 3,11 3,06 3,01 2,96 2,92 2,89 2,85 2,82 2,71 2,63 2,52 2,46 2,42 2,32 2,28 2,18 
40 8,83 6,07 4,98 4,37 3,99 3,71 3,51 3,35 3,22 3,12 3,03 2,95 2,89 2,83 2,78 2,74 2,70 2,66 2,63 2,60 2,48 2,40 2,30 2,23 2,18 2,09 2,04 1,93 
50 8,63 5,90 4,83 4,23 3,85 3,58 3,38 3,22 3,09 2,99 2,90 2,83 2,76 2,70 2,65 2,61 2,57 2,53 2,50 2,47 2,35 2,27 2,16 2,10 2,05 1,95 1,90 1,79 
60 8,50 5,80 4,73 4,14 3,76 3,49 3,29 3,13 3,01 2,90 2,82 2,74 2,68 2,62 2,57 2,53 2,49 2,45 2,42 2,39 2,27 2,19 2,08 2,01 1,96 1,86 1,81 1,69 
100 8,24 5,59 4,54 3,96 3,59 3,33 3,13 2,97 2,85 2,74 2,66 2,58 2,52 2,46 2,41 2,37 2,33 2,29 2,26 2,23 2,11 2,02 1,91 1,84 1,79 1,68 1,62 1,49 
150 8,12 5,49 4,45 3,88 3,51 3,25 3,05 2,89 2,77 2,67 2,58 2,51 2,44 2,39 2,34 2,29 2,25 2,21 2,18 2,15 2,03 1,94 1,83 1,76 1,70 1,59 1,53 1,37 
infinito 7,88 5,30 4,28 3,72 3,35 3,09 2,90 2,74 2,62 2,52 2,43 2,36 2,29 2,24 2,19 2,14 2,10 2,06 2,03 2,00 1,88 1,79 1,67 1,59 1,53 1,40 1,32 1,00 
 
 
	Introdução Geral
	A Estatística
	Estatística Descritiva
	A Natureza da Estatística (Classificação das variáveis
	Fases do Método Estatístico
	Pesquisas e Dados
	Conceitos básicos
	Tabelas Estatísticas
	Elementos de uma Tabela
	Representação esquemática
	Distribuição de Frequências
	Conceitos
	Distribuição de frequência sem intervalos de classe
	Distribuição de frequência com intervalos de classe
	Elementos de uma Distribuição de Frequência
	Método Prático para construção de uma distribuição de frequências com classe
	Tipos de Frequências
	Representação Gráfica
	Gráficos utilizados para a análise de uma distribuição de freqüência
	Histograma
	Polígono de Freqüências
	Ogivas
	Gráfico por linha
	Gráfico por colunas
	Diagrama por Superfície em Setores
	Análise Exploratória de Dados
	Medidas de Posição
	Média
	Moda
	Mediana
	Quartis, Decis e Percentis (ou Centis)
	Quartis
	Primeiro Quartil: Q1
	Segundo Quartil: Q2 ou Md
	Terceiro Quartil: Q3
	Decis Di
	Primeiro Decil: D1
	Segundo Decil: D2
	Percentis ou Centis Ci
	Vigésimo Centil: C20
	Medidas de Dispersão
	Desvio - Padrão
	Variância
	Coeficiente de Variação
	Exercícios
	Probabilidade: Espaço amostral e eventos
	Experimentos Aleatórios
	Tipos de fenômenos
	Espaço Amostral
	Eventos
	Classe dos eventos aleatórios
	Operações com eventos Aleatórios
	Propriedades das operações
	Partição de um Espaço Amostral
	Eventos Mutuamente Exclusivos ou Disjuntos
	Exercícios
	Probabilidade: Definições
	Definição Clássica de Probabilidade
	Definição Axiomática de Probabilidade
	Propriedades
	Eventos Independentes
	Probabilidade Condicional
	Probabilidade Total
	Teorema de Bayes
	Exercícios
	Variáveis Aleatórias discretas
	Variáveis Aleatórias
	Esperança de uma Variável Aleatória Discreta
	Variância de uma Variável Aleatória Discreta
	Função de Distribuição Acumulada
	Exercícios
	Distribuições Teóricas de Probabilidades de Variáveis Aleatórias Discretas
	Distribuição de Bernoulli
	Distribuição Binomial
	Média e Variância de uma v.a. com Distribuição Binomial
	Distribuição de Poisson
	Exercícios
	Variáveis Aleatórias contínuas
	Definições
	Função de Distribuição Acumulada
	Esperança de uma Variável Aleatória Contínua
	Variancia de uma Variável Aleatória Contínua
	Exercícios
	Distribuições Teóricas de Probabilidades de Variáveis Aleatórias Contínuas
	Distribuição Uniforme
	Distribuição Normal
	Média
	Distribuição Normal Padrão
	Exercícios
	Teoria da Amostragem
	Introdução
	Parâmetros e Estatísticas
	Técnicas de amostragem
	Conceitos Iniciais
	Amostragem
	As Amostras Probabilísticas
	Amostragem Aleatória Simples
	Amostragem Aleatória Estratificada
	Amostragem por Conglomerados
	Amostragem Sistemática
	Amostragem Não-probabilística
	Erros no processo de amostragem
	Distribuição Amostral da Média
	Distribuição Amostral das Proporções
	Exercícios
	Teoria da Estimação
	Introdução
	Estimação Pontual
	Propriedades dos estimadores
	Justeza e não-tedenciosidade
	Consistência
	Eficiência
	Suficiência
	Estimação Intervalar
	Intervalo de Confiança para Média com variância (populacional) conhecida
	Intervalo de Confiança para Média com variância (populacional) desconhecida
	Intervalo de Confiança para proporção populacional
	Intervalo de Confiança para Variância
	Intervalo de Confiança para a diferença de médias de duas Populações
	As variâncias 12 e 22 (populacionais) são conhecidas
	As variâncias 12 e 22 são desconhecidas mas 12 = 22
	Intervalo de Confiança para Diferença de Proporções
	Exercícios
	Testes de Hipóteses
	Hipótese Nula e Hipótese Alternativa
	Região Crítica do teste
	Erros do Tipo I e erros do Tipo II
	Teste da hipótese para média populacional 
	 conhecido
	 desconhecido
	Teste para Proporção
	Teste de hipótese para variância
	Teste da hipótese da igualdade de duas médias
	12 e 22 conhecidas
	 12 e 22 desconhecidas
	Teste de hipótese da diferença entre proporções
	Teste da razão de variâncias
	Exercícios
	Correlação e Regressão Linear Simples
	Correlação Linear Simples
	Relação entre variáveis
	Medida de Correlação
	Regressão Linear
	Pressuposições
	Método de estimação dos parâmetros e 
	Decomposição da variância total
	Análise de Variância da Regressão
	Coeficiente de determinação
	Exercícios
	Referências