Apostila Estatística Básica

Estatística II

•
UFCG

Fabrício
08.11.2017
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 154 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 154 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 154 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Estatística II

3.181 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE
CENTRO DE CIÊNCIAS E TECNOLOGIA AGROALIMENTAR - CAMPUS POMBAL
DISCIPLINA: ESTATÍSTICA BÁSICA
NOTAS DE AULA
ESTATÍSTICA BÁSICA
Prof. MSc. Carlos Sérgio Araújo dos Santos
POMBAL - PB
NOVEMBRO de 2013
Sumário
1 Introdução Geral p. 9
1.1 A Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 9
1.2 Estatística Descritiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 10
1.3 A Natureza da Estatística (Classificação das variáveis . . . . . . . . . . . p. 10
1.4 Fases do Método Estatístico . . . . . . . . . . . . . . . . . . . . . . . . . p. 11
1.5 Pesquisas e Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13
1.6 Conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13
1.7 Tabelas Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 14
1.8 Elementos de uma Tabela . . . . . . . . . . . . . . . . . . . . . . . . . . p. 14
1.9 Representação esquemática . . . . . . . . . . . . . . . . . . . . . . . . . p. 15
1.10 Distribuição de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . p. 15
1.10.1 Conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 15
1.10.2 Distribuição de frequência sem intervalos de classe . . . . . . . . p. 16
1.10.3 Distribuição de frequência com intervalos de classe . . . . . . . . p. 16
1.10.4 Elementos de uma Distribuição de Frequência . . . . . . . . . . . p. 17
1.10.5 Método Prático para construção de uma distribuição de frequências
com classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 18
1.10.6 Tipos de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . p. 18
1.11 Representação Gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 19
1.12 Gráficos utilizados para a análise de uma distribuição de freqüência . . . p. 20
1.12.1 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 20
1.12.2 Polígono de Freqüências . . . . . . . . . . . . . . . . . . . . . . . p. 20
1.12.3 Ogivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21
1.12.4 Gráfico por linha . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21
1.12.5 Gráfico por colunas . . . . . . . . . . . . . . . . . . . . . . . . . . p. 22
1.12.6 Diagrama por Superfície em Setores . . . . . . . . . . . . . . . . . p. 22
2 Análise Exploratória de Dados p. 24
2.1 Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 24
2.1.1 Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 24
2.1.2 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 26
2.1.3 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 28
2.2 Quartis, Decis e Percentis (ou Centis) . . . . . . . . . . . . . . . . . . . . p. 31
2.3 Quartis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 31
2.3.1 Primeiro Quartil: Q1 . . . . . . . . . . . . . . . . . . . . . . . . . . p. 31
2.3.2 Segundo Quartil: Q2 ou Md . . . . . . . . . . . . . . . . . . . . . p. 32
2.3.3 Terceiro Quartil: Q3 . . . . . . . . . . . . . . . . . . . . . . . . . . p. 32
2.4 Decis Di . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 33
2.4.1 Primeiro Decil: D1 . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 33
2.4.2 Segundo Decil: D2 . . . . . . . . . . . . . . . . . . . . . . . . . . p. 33
2.5 Percentis ou Centis Ci . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 34
2.5.1 Vigésimo Centil: C20 . . . . . . . . . . . . . . . . . . . . . . . . . p. 34
2.6 Medidas de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 35
2.6.1 Desvio - Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 36
2.6.2 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 37
2.6.3 Coeficiente de Variação . . . . . . . . . . . . . . . . . . . . . . . . p. 39
2.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 40
3 Probabilidade: Espaço amostral e eventos p. 45
3.1 Experimentos Aleatórios . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45
3.1.1 Tipos de fenômenos . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45
3.2 Espaço Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45
3.3 Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 46
3.4 Classe dos eventos aleatórios . . . . . . . . . . . . . . . . . . . . . . . . p. 46
3.5 Operações com eventos Aleatórios . . . . . . . . . . . . . . . . . . . . . p. 47
3.6 Propriedades das operações . . . . . . . . . . . . . . . . . . . . . . . . . p. 49
3.7 Partição de um Espaço Amostral . . . . . . . . . . . . . . . . . . . . . . . p. 50
3.8 Eventos Mutuamente Exclusivos ou Disjuntos . . . . . . . . . . . . . . . . p. 51
3.9 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 52
4 Probabilidade: Definições p. 53
4.1 Definição Clássica de Probabilidade . . . . . . . . . . . . . . . . . . . . . p. 53
4.2 Definição Axiomática de Probabilidade . . . . . . . . . . . . . . . . . . . p. 53
4.2.1 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 54
4.3 Eventos Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 55
4.4 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . p. 55
4.5 Probabilidade Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 56
4.6 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 57
4.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 59
5 Variáveis Aleatórias discretas p. 62
5.1 Variáveis Aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 62
5.2 Esperança de uma Variável Aleatória Discreta . . . . . . . . . . . . . . . . p. 64
5.3 Variância de uma Variável Aleatória Discreta . . . . . . . . . . . . . . . . p. 65
5.4 Função de Distribuição Acumulada . . . . . . . . . . . . . . . . . . . . . . p. 66
5.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 68
6 Distribuições Teóricas de Probabilidades de Variáveis Aleatórias Discre-
tas p. 70
6.1 Distribuição de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 70
6.2 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 71
6.2.1 Média e Variância de uma v.a. com Distribuição
Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 72
6.3 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 73
6.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 76
7 Variáveis Aleatórias contínuas p. 78
7.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 78
7.2 Função de Distribuição Acumulada . . . . . . . . . . . . . . . . . . . . . . p. 79
7.3 Esperança de uma Variável Aleatória Contínua . . . . . . . . . . . . . . . p. 80
7.4 Variancia de uma Variável Aleatória Contínua . . . . . . . . . . . . . . . . p. 80
7.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 81
8 Distribuições Teóricas de Probabilidades de Variáveis Aleatórias Contínuas p. 83
8.1 Distribuição Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 83
8.2 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 84
8.2.1 Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 85
8.2.2 Distribuição Normal Padrão . . . . . . . . . . . . . . . . . . . . . . p. 85
8.3 Exercícios . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . p. 88
9 Teoria da Amostragem p. 90
9.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 90
9.2 Parâmetros e Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 90
9.3 Técnicas de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 91
9.4 Conceitos Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 91
9.5 Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 92
9.5.1 As Amostras Probabilísticas . . . . . . . . . . . . . . . . . . . . . p. 92
9.5.2 Amostragem Aleatória Simples . . . . . . . . . . . . . . . . . . . . p. 93
9.5.3 Amostragem Aleatória Estratificada . . . . . . . . . . . . . . . . . p. 93
9.5.4 Amostragem por Conglomerados . . . . . . . . . . . . . . . . . . . p. 94
9.5.5 Amostragem Sistemática . . . . . . . . . . . . . . . . . . . . . . . p. 94
9.6 Amostragem Não-probabilística . . . . . . . . . . . . . . . . . . . . . . . p. 94
9.7 Erros no processo de amostragem . . . . . . . . . . . . . . . . . . . . . . p. 94
9.8 Distribuição Amostral da Média . . . . . . . . . . . . . . . . . . . . . . . . p. 95
9.9 Distribuição Amostral das Proporções . . . . . . . . . . . . . . . . . . . . p. 96
9.10 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 98
10 Teoria da Estimação p. 100
10.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 100
10.2 Estimação Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 100
10.3 Propriedades dos estimadores . . . . . . . . . . . . . . . . . . . . . . . . p. 101
10.3.1 Justeza e não-tedenciosidade . . . . . . . . . . . . . . . . . . . . p. 101
10.3.2 Consistência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 101
10.3.3 Eficiência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 102
10.3.4 Suficiência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 103
10.4 Estimação Intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 103
10.4.1 Intervalo de Confiança para Média com variância (populacional)
conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 103
10.4.2 Intervalo de Confiança para Média com variância (populacional)
desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 105
10.4.3 Intervalo de Confiança para proporção populacional . . . . . . . . p. 106
10.4.4 Intervalo de Confiança para Variância . . . . . . . . . . . . . . . . p. 107
10.5 Intervalo de Confiança para a diferença de médias de duas Populações . p. 108
10.5.1 As variâncias σ21 e σ
2
2 (populacionais) são conhecidas . . . . . . . p. 108
10.5.2 As variâncias σ21 e σ
2
2 são desconhecidas mas σ
2
1 = σ
2
2 . . . . . . . p. 109
10.6 Intervalo de Confiança para Diferença de Proporções . . . . . . . . . . . p. 110
10.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 112
11 Testes de Hipóteses p. 118
11.1 Hipótese Nula e Hipótese Alternativa . . . . . . . . . . . . . . . . . . . . . p. 118
11.2 Região Crítica do teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 118
11.3 Erros do Tipo I e erros do Tipo II . . . . . . . . . . . . . . . . . . . . . . . p. 119
11.4 Teste da hipótese para média populacional µ . . . . . . . . . . . . . . . . p. 120
11.4.1 σ conhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 120
11.4.2 σ desconhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 120
11.5 Teste para Proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 121
11.6 Teste de hipótese para variância . . . . . . . . . . . . . . . . . . . . . . . p. 122
11.7 Teste da hipótese da igualdade de duas médias . . . . . . . . . . . . . . p. 123
11.7.1 σ21 e σ
2
2 conhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . p. 124
11.7.2 σ21 e σ
2
2 desconhecidas . . . . . . . . . . . . . . . . . . . . . . . . p. 124
11.8 Teste de hipótese da diferença entre proporções . . . . . . . . . . . . . . p. 125
11.9 Teste da razão de variâncias . . . . . . . . . . . . . . . . . . . . . . . . . p. 125
11.10Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 128
12 Correlação e Regressão Linear Simples p. 134
12.1 Correlação Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . p. 134
12.1.1 Relação entre variáveis . . . . . . . . . . . . . . . . . . . . . . . . p. 134
12.1.2 Medida de Correlação . . . . . . . . . . . . . . . . . . . . . . . . . p. 134
12.2 Regressão Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 136
12.2.1 Pressuposições . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 137
12.2.2 Método de estimação dos parâmetros α e β . . . . . . . . . . . . . p. 138
12.3 Decomposição da variância total . . . . . . . . . . . . . . . . . . . . . . . p. 140
12.4 Análise de Variância da Regressão . . . . . . . . . . . . . . . . . . . . . p. 141
12.5 Coeficiente de determinação . . . . . . . . . . . . . . . . . . . . . . . . . p. 143
12.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 144
Referências p. 145
9
1 Introdução Geral
1.1 A Estatística
Para algumas pessoas, a Estatística não é senão um quadro de colunas mais ou
menos longas de números que dizem respeito à população, à indústria ou ao comércio,
como se vê frequentemente em revistas; para outras, ela dá gráficos mostrando a vari-
ação no tempo de um fato econômico ou social, a produção ou os números relativos aos
negócios de uma empresa, assim como se encontra nos escritórios de empresas privadas.
A utilização da Estatística é cada vez mais acentuada em qualquer atividade profis-
sional da vida moderna. Nos mais diversificados ramos de atuação, as pessoas estão
frequentemente expostas à Estatística, utilizando-a com maior ou menor intensidade. Isto
se deve às múltiplas aplicações que o método estatístico proporciona àqueles que dele
necessita.
A razão pela qual consideramos a Estatística uma ferramenta importante para tomada
de decisões está no fato de que ela não deve ser considerada como um fim em si própria,
mas como um instrumento fornecedor de informações que subsidiarão, em consequência,
a tomada de melhores decisões, baseadas em fatos e dados.
Podemos considerar a Estatística como a ciência que se preocupa com a coleta, or-
ganização, descrição, análise e interpretação dos dados experimentais, ou oriundos de
estudos observacionais visando a tomada de decisões.
Dentro dessa idéia, podemos considerar a Ciência Estatística como dividida basica-
mente em duas partes: A Estatística Descritiva, que se preocupa com a organização e
descrição dos dados experimentais, e a Estatística Indutiva, que cuida da sua análise e
interpretação.
10
1.2 Estatística Descritiva
Principalmente em pesquisa social, o analista defronta-se amiúde com a situação de
dispor de tantos dados que se torna difícil absorver completamente a informação que está
procurando investigar. É extremamente difícil captar intuitivamente todas as informações
que os dados contêm. É necessário, portanto, que as informações sejam reduzidas até o
ponto em que se possa interpretá-las mais claramente. Em outras palavras, é indispen-
sável resumí-las, através do uso de certas medidas-sínteses, mais comumentes conheci-
das como estatística descritiva ou simplesmente estatísticas. Por conseguinte, a estatística
descritiva é um número que sozinho descreve uma característica de um conjunto de dados.
Trata-se, portanto, de um número-resumo que possibilita reduzir os dados a proporções
mais facilmente interpretáveis.
Em um sentidomais amplo, a Estatística Descritiva pode ser interpretada como uma
função cujo objetivo é a observação de fenômenos de mesma natureza, a coleta de dados
numéricos referentes a esses fenômenos, a organização e a classificação desses dados
observados e a sua apresentação através de gráficos e tabelas, além do cálculo de coefi-
cientes (estatísticas) que permitem descrever resumidadamente os fenômenos.
1.3 A Natureza da Estatística (Classificação das variáveis
Variável é uma característica de uma unidade que será medida a partir daquela unidade
da amostra. Podemos descrever dois tipos de variáveis para estudo:
Variáveis Qualitativas: Podem ser separados em diferentes categorias, atributos, que
se distinguem por alguma característica não numérica. como nos seguintes exemplos:
a) População: alunos de uma universidade Variável: sexo (masculino ou feminino).
b) População: moradores de uma cidade Variável: tipo de habitação (casa, aparta-
mento, barraco, etc.).
c) População: peças produzidas por uma máquina Variável: qualidade (perfeita ou
defeituosa).
d) População Brasileira Variável: cor da pele (branca, preta, amarela, vermelha, parda).
11
Variáveis Quantitativas: Quando suas medidas consistem em números que repre-
sentam contagens ou medidas. Pode ser subdivida em:
1 - quantitativa discreta: pode assumir apenas valores pertences a um conjunto enu-
merável;
2 - quantitativa contínua: pode assumir qualquer valor em um certo intervalo de vari-
ação.
Alguns exemplos de variáveis quantitativas discretas são:
a) População: habitações de uma cidade. Variável: número de banheiros.
b) População: casais residentes em uma cidade. Variável: número de filhos.
c) População: aparelhos produzidos em uma linha de montagem. Variável: número de
defeitos por unidade.
d) População: Bolsa de valores de São Paulo. Variável: número de ações negociadas.
1.4 Fases do Método Estatístico
O método estatístico abrange as seguintes fases:
a) Definição do Problema
Consiste na:
- formulação correta do problema;
- examinar outros levantamentos realizados no mesmo campo (revisão da literatura);
- saber exatamente o que se pretende pesquisar definindo o problema corretamente
(variáveis, população, hipóteses, etc.)
b) Planejamento
Determinar o procedimento necessário para resolver o problema:
12
- Como levantar informações;
- Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial).
- Cronograma, Custos, etc.
c) Coleta ou levantamento dos dados
Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer.
A coleta pode ser:
Direta - diretamente da fonte;
Indireta - feita através de outras fontes. Os dados podem ser obtidos pela própria
pessoa (primários) ou se baseia no registro de terceiros (secundários).
d) Apuração dos dados ou sumarização
Consiste em resumir os dados, através de uma contagem e agrupamento. É um tra-
balho de coordenação e de tabulação.
Apuração: manual, mecânica e eletrônica.
e) Apresentação dos dados
É a fase em que vamos mostrar os resultados obtidos na coleta e na organização.
Esta apresentação pode ser:
Tabular (apresentação numérica)
Gráfica (apresentação geométrica)
f) Análise e interpretação dos dados
É a fase mais importante e também a mais delicada. Tira conclusões que auxiliam o
pesquisador a resolver seu problema.
13
1.5 Pesquisas e Dados
Antes de iniciar a análise de uma base de dados, é preciso determinar corretamente
que tipo de dados está disponível. Disso depende o tipo de análise a ser feito e a ferra-
menta a ser utilizada.
Pesquisa Estatística: É qualquer informação retirada de uma população ou amostra,
podendo ser através de Censo ou Amostragem.
Dados Estatísticos: Dados são observações documentadas ou resultados da medição.
Os dados podem ser obtidos pela percepção através dos sentidos (por exemplo obser-
vação) ou pela execução de um processo de medição.
Antes de iniciar a análise de uma base de dados, é preciso determinar corretamente
que tipo de dados está disponível. Disso depende o tipo de análise a ser feito e a ferra-
menta a ser utilizada.
Dados primários: são aqueles que não foram antes coletados, estando ainda em
posse dos pesquisados, e que são coletados com o propósito de atender às necessi-
dades específicas da pesquisa em andamento. As fontes básicas de dados primários são:
pesquisado, pessoas que tenham informações sobre o pesquisado e situações similares.
Dados secundários: são aqueles que já foram coletados, tabulados, ordenados e, às
vezes, até analisados e que estão catalogados à disposição dos interessados. As fontes
básicas de dados secundários são: a própria empresa, publicações, governos, Instituições
não governamentais e serviços padronizados de informações de marketing.
1.6 Conceitos básicos
População: Conjunto de todos os elementos relativos a um determinado fenômeno
que possuem pelo menos uma característica em comum, a população é o conjunto Uni-
verso, podendo ser finita ou infinita.
Amostra: É um subconjunto da população e deverá ser considerada finita, a amostra
14
deve ser selecionada seguindo certas regras e deve ser representativa, de modo que ela
represente todas as características da população como se fosse uma fotografia desta.
Amostragem: É o processo de retirada de informações dos "n"elementos amostrais,
no qual deve seguir um método criterioso e adequado (tipos de amostragem).
Censo: é a coleção de dados relativos a todos elementos da população.
Estatística: é uma medida numérica que descreve uma característica da amostra.
Parâmetro: é a medida numérica que descreve uma característica da população.
Estatística Descritiva: envolve a organização e sumarização dos dados através de
metodologias simples.
Estatística Inferencial: é a parte da estatística que envolve a análise e interpretação
da amostra.
1.7 Tabelas Estatísticas
Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis po-
dem assumir, para que tenhamos uma visão global da variação das mesmas.
Tabela: é uma maneira de apresentar de forma resumida um conjunto de dados
1.8 Elementos de uma Tabela
1) Título: O título deve responder as seguintes questões:
- O que? (Assunto a ser representado (Fato));
- Onde? (O lugar onde ocorreu o fenômeno (local));
- Quando? (A época em que se verificou o fenômeno (tempo)).
2) Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada
coluna.
15
3) Corpo: parte da tabela composta por linhas e colunas.
4) Linhas: parte do corpo que contém uma seqüência horizontal de informações.
5) Colunas: parte do corpo que contém uma seqüência vertical de informações.
6) Coluna Indicadora: coluna que contém as discriminações correspondentes aos
valores distribuídos pelas colunas numéricas.
7) Casa ou Célula: parte da tabela formada pelo cruzamento de uma linha com uma
coluna.
8) Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colo-
cadas as notas de natureza informativa (fonte, notas e chamadas).
9) Fonte: refere-se à entidade que organizou ou forneceu os dados expostos.
10) Notas e Chamadas: são esclarecimentos contidos na tabela (nota - conceituação
geral; chamada - esclarecer minúcias em relação a uma célula).
1.9 Representação esquemática
1.10 Distribuição de Frequências
1.10.1 Conceitos
Dados Brutos: é a relação de elementos que não foram numericamente organizados.
16
Ex : 45, 41, 42, 41, 42, 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
Rol: é uma lista em que os valores estão dispostos em uma determinada ordem, cres-
cente ou decrescente.
Ex : 41, 41, 41, 42, 42, 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Tabela de Frequências: são representaçõesnas quais os valores se apresentam em
correspondência com suas repetições.
1.10.2 Distribuição de frequência sem intervalos de classe
É a simples condensação dos dados conforme as repetições de seu valores.
Exemplo:
Tabela 1: Distribuição do número de alunos em 20 turmas da UFCG
i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total
Dados 41 42 43 44 45 46 50 51 52 54 57 58 60
∑13
i=1 fi
(fi) 3 2 1 1 1 2 2 1 1 1 1 2 2 20
A soma das frequências é sempre igual ao número total de valores observados.
k∑
i=1
fi = n
1.10.3 Distribuição de frequência com intervalos de classe
Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos
valores em vários intervalos de classe.
Exemplo:
17
Tabela 2: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi
1 41 ` 45 7
2 45 ` 49 3
3 49 ` 53 4
4 53 ` 57 1
5 57 ` 61 5
Total
∑5
i=1 fi 20
1.10.4 Elementos de uma Distribuição de Frequência
Frequência Simples Absoluta: é o número de observações correspondentes a uma
classe ou valor individual. É simbolizada por fi.
Amplitude TotalAt: É a diferença entre o maior e o menor valor observado da variável
em estudo. Ex: na tabela anterior At = 60− 41 = 19.
Classe: são os intervalos de variação da variável e é simbolizada por i e o número
total de classes simbolizada por k. Ex: na tabela anterior k = 5 e 49 ` 53 é a terceira
classe, em que i = 3.
Limites de Classe: são os extremos de cada classe. O menor número é o limite
inferior de classe (li) e o maior número, limite superior de classe(Li). Ex: em 49 ` 53,
l3 = 49 e L3 = 53. O símbolo ` representa um intervalo fechado à esquerda e aberto à
direita.
Amplitude do Intervalo de Classe: é obtida através da diferença entre o limite su-
perior e inferior da classe e é simbolizada por hi = Li − li. Ex: na tabela anterior
hi = 53− 49 = 4.
Ponto Médio de Classe xi: é o ponto que divide o intervalo de classe em duas partes
iguais. Ex: em 49 ` 53 o ponto médio x3 = (53 + 49)/2 = 51, ou seja x3 = (L3 + l3)/2.
18
1.10.5 Método Prático para construção de uma distribuição de fre-
quências com classe
1 - Organize os dados brutos em um ROL.
2 - Calcule a amplitude total At.
3 - Calcule o número de classes através da "Regra de Sturges".
k = 1 + 3, 3 log n
em que k é o número de classes e n é o número total de observações
4 - Calcule a amplitude do intervalo de classe h = At
k
.
No nosso exemplo: At = 19 e k = 5, logo h = 3, 8. Utilizaremos então h = 4
1.10.6 Tipos de Frequências
Frequência Simples Absoluta fi: é o número de repetições de um valor individual ou
de uma classe de valores da variável.
Frequência Simples Relativa fri: representa a proporção de observações de um
valor individual ou de uma classe, em relação ao número total de observações.
fri =
fi∑k
i=1 fi
=
fi
n
Em termos percentuais tem-se
fri =
fi
n
· 100
Exemplo:
Frequência Absoluta Acumulada "Abaixo de"Fi: é a soma da frequência simples
19
Tabela 3: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi fri Frequências
relativas
percentuais
1 41 ` 45 7 0,35 35%
2 45 ` 49 3 0,15 15%
3 49 ` 53 4 0,20 20%
4 53 ` 57 1 0,05 5%
5 57 ` 61 5 0,25 25%
Total
∑5
i=1 fi 20 1,00 100%
absoluta dessa classe ou desse valor com as frequências simples absolutas das classes
ou dos valores anteriores.
Exemplo:
Tabela 4: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi Fi
1 41 ` 45 7 7
2 45 ` 49 3 7 + 3 = 10
3 49 ` 53 4 7 + 3 + 4 = 14
4 53 ` 57 1 7 + 3 + 4 + 1 = 15
5 57 ` 61 5 7 + 3 + 4 + 1 + 5 = 20
Total
∑5
i=1 fi 20 −
Frequência Absoluta Acumulada "Acima de"Fi: é a soma da frequência simples
absoluta dessa classe ou desse valor com as frequências simples absolutas das classes
ou dos valores posteriores.
Exemplo:
1.11 Representação Gráfica
Os gráficos são uma forma de apresentação visual dos dados. Normalmente, contém
menos informações que as tabelas, mas são de mais fácil leitura. O tipo de gráfico depende
da variável em questão.
20
Tabela 5: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi Fi
1 41 ` 45 7 5 + 1 + 4 + 3 + 7 = 20
2 45 ` 49 3 5 + 1 + 4 + 3 = 13
3 49 ` 53 4 5 + 1 + 4 = 10
4 53 ` 57 1 5 + 1 = 6
5 57 ` 61 5 5
Total
∑5
i=1 fi 20 −
1.12 Gráficos utilizados para a análise de uma distribuição
de freqüência
1.12.1 Histograma
São os gráficos mais importantes na estatística inferencial. Quando os dados são
valores de uma variável medida numa escala intervalar/proporcional, uma tabela de fre-
quências para cada uma das classes mostra a distribuição de valores dessa variável. Esta
distribuição pode ser representada graficamente num histograma.
1.12.2 Polígono de Freqüências
Unindo por linhas retas os pontos médios das bases superiores dos retângulos do his-
tograma, obtém-se outra representação dos dados, denominada Polígono de Frequências.
21
1.12.3 Ogivas
A Ogiva tem por finalidade a representação gráfica das tabelas de frequências acumu-
ladas.
1.12.4 Gráfico por linha
É a representação gráfica de uma série estatística por meio de uma linha poligonal. é
um dos mais importantes gráficos; representa observações feitas ao longo do tempo, em
intervalos iguais ou não. Tais conjuntos de dados constituem as chamadas séries históricas
ou séries temporais. Traduzem o comportamento de um fenômeno em certo intervalo de
tempo.
22
1.12.5 Gráfico por colunas
É a representação de uma série estatística por intermédio de retângulos em posições
verticais. Este tipo de gráficos proporciona comparar grandezas.
1.12.6 Diagrama por Superfície em Setores
É a representaçao gráfica de uma série estatística por intermédio de superfícies seto-
riais. É utilizado quando se pretende comparar os valores de uma série com a sua soma
total. A representaçao é feita tomando como figura básica um círculo que é dividido em se-
23
tores. O quociente entre a soma dos valores da série e a área do círculo deve ser o mesmo
que entre cada valor da variável dependente e a respectiva área do setor representativo.
Porém em virtude da proporcionalidade das áreas dos setores de um círculo com seus
ângulos centrais, podem-se dividir os valores considerados na série proporcionalmente a
estes ângulos.
24
2 Análise Exploratória de Dados
2.1 Medidas de Posição
As medidas de posição, também chamada de medidas de tendência central, possuem
três formas diferentes para três situações distintas:
• MÉDIA
• MODA
• MEDIANA
2.1.1 Média
Existem dois tipos de média:
• POPULACIONAL, representada pela letra grega µ.
• AMOSTRAL, representada por x¯.
1 - Média: (Dados não agrupados)
Sejam os elementos x1, x2, . . . , xn de uma amostra, portanto "n"valores da variável
X. A média aritmética da variável aleatória X é definida por,
x¯ =
x1 + x2 + . . .+ xn
n
=
∑n
i=1 xi
n
25
Exemplo: Suponha o conjunto de dados que representa o peso ao nascer de bez-
erros da raça Nelore: 51, 40, 46, 48, 54, 56, 44, 43, 55 e 57. Determinar a média
aritmética simples deste conjunto de dados.
x¯ =
51 + 40 + 46 + 48 + 54 + 56 + 44 + 43 + 55 + 57
10
=
494
10
= 49, 4
2 - Média: (Dados agrupados em uma distribuição de frequência por valores simples)
Usa-se a média aritmética dos valores x1, x2, . . . , xn ponderados pelas respectivas
frequências absolutas: f1, f2, . . . , fn. Assim
x¯ =
x1f1 + x2f2 + . . .+ xnfn
n
=
∑n
i=1 xifi
n
Exemplo:
Tabela 6: Distribuição do número de alunos em 20 turmas da UFCG
i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total
Dados (xi) 41 42 43 44 45 46 50 51 52 54 57 58 60
∑13
i=1 fi
(fi) 3 2 1 1 1 2 2 1 1 1 1 2 2 20
xifi 123 84 43 44 45 92 100 51 52 54 57 116 120 981
Portanto:
x¯ =
981
20
= 49, 05
3 - Média: (Dadosagrupados em uma distribuição de frequência por classes)
Usaremos a média aritmética dos pontos médios x1, x2, . . . , xn de cada classe, pon-
derados pelas respectivas frequências absolutas: f1, f2, . . . , fn. Assim
x¯ =
x1f1 + x2f2 + . . .+ xnfn
n
=
∑n
i=1 xifi
n
Exemplo:
26
Tabela 7: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi xi xifi
1 41 ` 45 7 43 301
2 45 ` 49 3 47 141
3 49 ` 53 4 51 204
4 53 ` 57 1 55 55
5 57 ` 61 5 59 295
Total
∑5
i=1 fi 20 − 996
Portanto:
x¯ =
996
20
= 49, 80
2.1.2 Moda
É o valor mais frequente da distribuição.
1 - Moda (Mo): (Dados não agrupados)
Sejam os elementos x1, x2, . . . , xn de uma amostra, o valor da moda para este tipo
de conjunto de dados é simplesmente o valor com maior frequência.
Exemplo: Obter a moda dos seguintes conjuntos de valores:
X = {4, 5, 5, 6, 6, 6, 7, 7, 8, 8}, Moda de X: Mo = 6.
Y = {1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 6, 6}, Moda de Y : Mo1 = 2 e Mo2 = 5.
W = {1, 2, 3, 4, 5} Moda de W : amodal
2 - Moda (Mo): (Dados agrupados em uma distribuição de frequência por valores
simples)
Para este tipo de distribuição, a identificação da moda é facilitada pela simples ob-
servação do elemento que apresenta maior frequência.
27
Tabela 8: Distribuição do número de alunos em 20 turmas da UFCG
i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total
Dados (xi) 41 42 43 44 45 46 50 51 52 54 57 58 60
∑13
i=1 fi
(fi) 3 2 1 1 1 2 2 1 1 1 1 2 2 20
Exemplo:
Portanto, se a maior frequência é fi = 3, logo Mo = 41.
3 - Moda (Mo): (Dados agrupados em uma distribuição de frequência por classes)
Para dados agrupados em classes, temos diversos métodos para o cálculo da moda.
Utilizaremos aqui o Método de Czuber denotado a seguir:
Método de Czuber
Procedimento:
– Identifica-se a classe modal (aquela que possuir maior frequência) CLASSE
(Mo).
– Utiliza-se a fórmula:
Mo = li + h · ∆1
∆2 + ∆1
em que:
li = Limite inferior da classe modal.
∆1 = fmo − fant (frequência modal − frequência anterior)
∆2 = fmo − fpost (frequência modal − frequência posterior)
h = amplitude da classe modal
Exemplo:
Determinar a moda, pelo método de Czuber, usando os dados do exemplo
tem-se que:
Classe (Mo): 41 ` 45
li = 41
28
Tabela 9: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi
1 41 ` 45 7
2 45 ` 49 3
3 49 ` 53 4
4 53 ` 57 1
5 57 ` 61 5
Total
∑5
i=1 fi 20
h = 4
∆1 = fmo − fant = 7− 0 = 7
∆2 = fmo − fpost = 7− 3 = 4
Mo = 41 + 4 · 7
7 + 4
= 43, 54
2.1.3 Mediana
Construído o ROL, o valor da mediana é o elemento que ocupa a posição central, ou
seja, é o elemento que divide a distribuição em 50% de cada lado.
1 - Mediana (Md): (Dados não agrupados)
Sejam os elementos x1, x2, . . . , xn de uma amostra, portanto "n"valores da variável
X. A mediana da variável aleatória X é definida através do Elemento Mediano EMd,
– O número de observações é ímpar, então o valor da mediana será o valor local-
izado na posição EMd = n+12 ;
– O número de observações é par, então o valor da mediana será a média entre
o valor da posição EMd = n2 e o seu valor consecutivo.
Exemplo 1: Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8,
10 e 11. Determinar a mediana deste conjunto de dados.
29
Como n = 5, então o valor da mediana estará localizado na posição EMd = 5+12 = 3.
Portanto,
Md = 8
Exemplo 2: Suponha o conjunto de tempo de serviço de seis funcionários: 3, 7, 8,
10, 11 e 13. Determinar a mediana deste conjunto de dados.
Como n = 6, então o valor da mediana estará localizado na posição EMd = 62 = 3 e
na posição consecutiva obtendo uma média aritmética desses valores. Portanto,
Md =
8 + 10
2
= 9
2 - Mediana (Md): (Dados agrupados em uma distribuição de frequência por valores
simples)
Quando os valores da variável estiverem já tabulados, o procedimento a ser adotado
será praticamente idêntico ao anterior. Deve-se verificar se o número de observações
é ímpar ou par, para o cálculo do elemento mediano. Em seguida acrescenta-se uma
coluna à tabela de frequências original, onde serão determinadas as frequências
acumuladas.
Exemplo:
Tabela 10: Distribuição do número de alunos em 20 turmas da UFCG
i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total
Dados (xi) 41 42 43 44 45 46 50 51 52 54 57 58 60
∑13
i=1 fi
(fi) 3 2 1 1 1 2 2 1 1 1 1 2 2 20
(Fi) 3 5 6 7 8 10 12 13 14 15 16 18 20 -
Portanto:
EMd =
20
2
= 10, logo, Md = 46+50
2
= 48
3 - Mediana (Md): (Dados agrupados em uma distribuição de frequência por classes)
Procedimento:
– Calcula-se o elemento mediano EMd
30
– Pela Fi identifica-se a classe que contém o valor da mediana - CLASSE(Md)
– Utiliza-se a fórmula:
Md = li + h · EMd − Fant
fMd
em que:
li = Limite inferior da classe mediana;
Fant = Frequência acumulada anterior à classe mediana;
h = Amplitude da classe mediana;
fMd = Frequência absoluta simples da classe mediana.
Exemplo:
Tabela 11: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi Fi
1 41 ` 45 7 7
2 45 ` 49 3 10
3 49 ` 53 4 14
4 53 ` 57 1 15
5 57 ` 61 5 20
Total
∑5
i=1 fi 20 −
Portanto:
EMd =
20
2
= 10
CLASSE(Md) = 45 ` 49
Md = 45 + 4 · 10− 7
3
= 45 + 4 = 49
31
2.2 Quartis, Decis e Percentis (ou Centis)
Há uma série de medidas de posição semelhantes na sua concepção à mediana,
embora não sejam medidas de tendência central. Como se sabe, a mediana divide a
distribuição em duas partes iguais quanto ao número de elementos de cada parte. Já
os quartis permitem dividir a distribuição em quatro partes iguais quanto ao número
de elementos cada uma; os decis em dez partes e os centis em cem partes iguais.
Para simbolizar cada uma dessas medidas separatrizes, faremos:
Qi = quartis i = 1, 2, 3
Di = decis i = 1, 2, 3, . . . , 9
Ci = centis i = 1, 2, 3, . . . , 99
Assim, para dividir uma série ordenada de valores em quatro partes iguais, pre-
cisamos de três separatrizes (quartis); para dividi-la em dez, iremos recorrer a nove
separatrizes (decis); em cem, recorremos a noventa e nove separatrizes (centis). O
gráfico a seguir ilustra melhor o que foi dito em relação aos quartis e decis:
2.3 Quartis
2.3.1 Primeiro Quartil: Q1
Definição: Dado um conjunto ordenado (ordem crescente) de valores, o primeiro
quartil, Q1, é o valor que divide o conjunto em duas partes tais que um quarto ou
32
vinte e cinco por cento dos valores sejam menores d que ele e três quartos ou setenta
e cinco por cento dos restantes sejam maiores. O elemento que indica a ordem ou
posição do primeiro quartil é determinado, para dados agrupados em classes, pela
seguinte expressão:
EQ1 =
n
4
em que n é o número de valores do conjunto, ou número de observações.
2.3.2 Segundo Quartil: Q2 ou Md
Definição: Dado um conjunto ordenado de valores, o segundo quartil ou mediana
é o valor que divide em duas partes iguais quanto ao número de elementos, isto é,
cinquenta por cento ou dois quartos dos valores do conjunto são menores, e os dois
quartos restantes sao maiores do que ele. O elemento mediano é calculado, como
veremos, através da seguinte expressão:
EQ2 =
2n
4
=
n
2
2.3.3 Terceiro Quartil: Q3
Definição: Dado um conjunto ordenado (ordem crescente) de valores, o terceiro quar-
til é o valor que divide o conjunto em duas partes tais que setenta e cinco por cento
ou tres quartos dos valores sejam menores e vinte e cinco por cento ou um quarto
sejam maiores do que ele. O elemento que indica a ordem em que n encontra o
terceiro quartil é calculado, para dados tabulados, como segue:
EQ3 =
3n
4
Genericamente, para determinar a ordem ou posição do quartil a ser calculado, us-
aremos a seguinte expressão:33
EQi =
in
4
em que i indica o número do quartil a ser calculado e n o número de elementos ou
observações da amostra.
2.4 Decis Di
A definição dos decis obedece ao mesmo princípio da dos quartis, com a modifi-
cação da porcentagem de valores que ficam aquém e além do decil que se pretenda
clacular. Assim, por exemplo:
2.4.1 Primeiro Decil: D1
O primeiro decil de um conjunto ordenado (ordem crescente) de valores é o valor
que divide um conjunto em duas partes tais que dez por cento ou um décimo dos
valores sejam menores e nove décimos ou noventa por cento sejam maiores do que
ele. O elemento que indica a posição do segundo decil é calculado pela seguinte
expressão:
ED1 =
n
10
2.4.2 Segundo Decil: D2
Trata-se do valor que divide o conjunto em duas partes, tais que vinte por cento ou
dois décimos dos valores sejam menores e oitenta por cento ou oito décimos dos
valores sejam maiores; para saber a ordem do segundo decil, usamos a expressão:
ED2 =
2n
10
De especial interesse é o quinto decil, que divide o conjunto em duas partes, tais que
cinco décimos ou cinquenta por cento dos valores sejam menores e cinco décimos ou
cinquenta por cento dos valores restantes maiores do que ele. Assim sendo, o quinto
34
decil é igual ao segundo quartil, que por sua vez é igual à mediana. O elemento que
indica a ordem do quinto decil é igual ao elemento mediano, ou seja:
ED5 =
5n
10
=
n
2
=
2n
4
Podemos, então, afirmar que
Md = D5 = Q2
De uma forma geral, para calcular os decis, recorreremos à seguinte expressão que
define a ordem em que o decil se encontra:
EDi =
in
10
em que n indica o número de valores observados e i o número que identifica o decil
a ser calculado.
2.5 Percentis ou Centis Ci
Neste caso, cada parte em que foram subdivididos os valores do conjunto, através
dos noventa e nove centis, contará com um centésimo ou um por cento dos valores
do conjunto.
O elemento que definirá a ordem do centil, em uma distribuição de frequências de val-
ores tabulados agrupados em classes, será encontrado pelo emprego da expressão:
ECi =
in
100
em que i é o número indicador do centil e n é o número total de observações.
É oportuno lembrar que os centis englobam todos os decis e quartis. Assim, por
exemplo:
2.5.1 Vigésimo Centil: C20
O vigésimo centil é igual ao segundo decil, por que
35
EC20 =
20n
100
= 0, 2n = ED2 =
2n
10
= 0, 2n
A fórmula de cálculo dos centis será:
Ci = l + h
ECi − Fant
fCi
Exemplo:Na Tabela abaixo figuram os dados correspondentes ao consumo de elet-
ricidade de 80 usuários. Calcular as seguintes medidas:
Tabela 12: Distribuição do consumo de eletricidade
i Classes fi
1 5 ` 25 4
2 25 ` 45 6
3 45 ` 65 14
4 65 ` 85 26
5 85 ` 105 14
6 105 ` 125 8
7 125 ` 145 6
8 145 ` 165 2
Total
∑13
i=1 fi 80
a) Trigésimo centil: C30
b) Décimo quinto centil: C15
c) Nono Decil: D9
d) Septuagésimo quinto centil: C75
e) Primeiro quartil: Q1
2.6 Medidas de Dispersão
As medidas de dispersão indicam se os valores estão relativamente próximos um dos
outros, ou separados em torno de uma medida de posição: a média. Consideraremos
três medidas de dispersão:
36
– DESVIO-PADRÃO
– VARIÂNCIA
– COEFICIENTE DE VARIAÇÃO
2.6.1 Desvio - Padrão
Mede o grau de dispersão dos dados numéricos em torno de um valor médio.
1 - Desvio - padrão S: (Dados Brutos)
Seja o seguinte conjunto de números x1, x2, . . . , xn. O desvio-padrão ou média
quadrática dos desvios ou afastamentos em relação à média desse conjunto será
definido por:
S =
√∑n
i=1(xi − x¯)2
n− 1
Exemplo: Calcular o desvio-padrão do conjunto 10, 12, 13, 20, 25, 34, 45.
sabe-se que x¯ = 22, 714
S =
√√√√ 1
7− 1
7∑
i=1
(xi − 22, 714)2 =
√
1
6
[(10− 22, 714)2 + . . .+ (45− 22, 714)2]
S =
√
1
6
× 1007, 43 = 12, 958
2 - Desvio - padrão S: (Dados Tabulados)
Quando os valores vierem dispostos em uma tabela de frequências, o cálculo do
desvio-padrão se fará através da seguinte fórmula:
37
S =
√∑n
i=1(xi − x¯)2fi
n− 1
Exemplo:
Tabela 13: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi xi (xi − x¯) (xi − x¯)2 (xi − x¯)2fi
1 41 ` 45 7 43 -6,8 46,24 323,68
2 45 ` 49 3 47 -2,8 7,84 23,52
3 49 ` 53 4 51 1,2 1,44 5,76
4 53 ` 57 1 55 5,2 27,04 27,04
5 57 ` 61 5 59 9,2 84,64 423,20
Total
∑5
i=1 fi 20 − − − 803,20
como x¯ = 49, 80, portanto:
S =
√
803, 20
20− 1 =
√
42, 27 = 6, 5
2.6.2 Variância
A variância de um conjunto de dados é a média dos quadrados dos desvios dos
valores a contar da média. A fórmula da variância poderá ser calculada de duas
formas:
– POPULACIONAL, representada letra grega σ2
– AMOSTRAL, representada por S2
1- Variância: (Dados não agrupados)
σ2 =
∑n
i=1(xi − µ)2
N
ou
S2 =
∑n
i=1(xi − x¯)2
n− 1
38
Exemplo:
Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11.
Determinar a variância deste conjunto de dados.
como x¯ = 7, 8
S2 =
(3− 7, 8)2 + (7− 7, 8)2 + (8− 7, 8)2 + (10− 7, 8)2 + (11− 7, 8)2
5− 1 =
S2 =
38, 4
4
= 9, 7
2 - Variância: (Dados Tabulados)
Quando os valores vierem dispostos em uma tabela de frequências, o cálculo da
variância se fará através da seguinte fórmula:
σ2 =
∑n
i=1(xi − µ)2fi
N
ou
S2 =
∑n
i=1(xi − x¯)2fi
n− 1
Exemplo:
Tabela 14: Distribuição do número de alunos em 20 turmas da UFCG
i Classes fi xi (xi − x¯) (xi − x¯)2 (xi − x¯)2fi
1 41 ` 45 7 43 -6,8 46,24 323,68
2 45 ` 49 3 47 -2,8 7,84 23,52
3 49 ` 53 4 51 1,2 1,44 5,76
4 53 ` 57 1 55 5,2 27,04 27,04
5 57 ` 61 5 59 9,2 84,64 423,20
Total
∑5
i=1 fi 20 − − − 803,20
39
como x¯ = 49, 80 e S = 6, 5, portanto
S2 =
803, 20
19
= 42, 27
2.6.3 Coeficiente de Variação
Trata-se de uma média relativa à dispersão, útil para a comparação e observação
em termos relativos do grau de concentração em torno da média de séries distintas.É
dado por:
CV =
S
x¯
· 100
Classificação da distribuição quanto à dispersão:
– Dispersão Baixa: CV ≤ 15%
– Dispersão Média: 15% < CV < 30%
– Dispersão Alta: CV ≥ 30%
Exemplo:1
Numa empresa o salário médio dos funcionários do sexo masculino é de R$ 4.000,00,
com um desvio padrão de R$ 1.500,00, e os funcionários do sexo feminino é em
média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00. Então:
Sexo Masculino: CV = 1.500
4.000
· 100 = 37, 5%
Sexo Feminino: CV = 1.200
3.000
· 100 = 40%
40
2.7 Exercícios
1. Classifique as seguintes variáveis como Qualitativas ou Quantitativas (discretas
ou contínuas).
a) Número de computadores em um laboratório de informática
b) Renda familiar
c) Volume de Petróleo extraído por hora de uma jazida
d) Grupo Sanguíneo
e) Qualidade de uma peça produzida
f) Intenção de voto para presidente (possíveis respostas são os nomes dos can-
didatos, além de "nao sei")
g) Precipitação pluviométrica
h) Magnitude de um sismo, na escala Richter
i) Tipo de grão de híbrido de milho
j) Número de vargens por planta
2. Os dados abaixo referem-se a resistência à ferrugem de 32 híbridos de milho
recomendados para a região de Chapecó, SC, safra 1987/88
Tabela 15: Distribuição de frequências da resistência à ferrugem de 32 híbridos de milho
recomendados para a região de Chapecó, SC, safra 1987/88
Resistência à
ferrugem
fi
r 10
mr 6
ms 9
s 7
Obtenha as frequências relativas fri e construa um gráfico de barras para rep-
resentar esses dados.
3. As fases principais do método estatístico são:
a) Coleta dos dados, amostragem, apresentação tabular e apresentação gráfica
e definição dos problemas.
b) Amostragem, apresentação tabular, apuração dos dados, interpretação dosdados e planejamento.
41
c)Definição do problema, planejamento, coleta dos dados, apuração, apresen-
tação dos dados, análise e interpretação dos dados.
4. Os dados abaixo referem-se a 12 áreas plantadas de soja na safra de verão em
milhões de hectares.
9,7 11,5 13,2 10,7 13,2 9,7
11,6 9,8 13,0 10,4 11,3 13,2
Determine:
a) a média, a moda e a mediana das áreas plantadas de soja.
b) O desvio padrão, a variância e o coeficiente de variação.
5. Dada a tabela abaixo
Tabela 16: Produção agrícola na Paraíba em milhões de Reais, 2004-2009
Ano Produção em mil-
hões de R$
2004 4,5
2005 5,3
2006 4,9
2007 5,1
2008 6,8
2009 7,1
Construa um gráfico mais apropriado para os dados da tabela.
6. Os dados abaixo relacionados representam o número de focos de incêndios de-
tectados por satélite entre os Estados da Paraíba e Pernambuco nos primeiros
16 dias de Novembro de 2010.
13 18 9 10
6 11 10 14
10 11 15 12
14 8 13 7
Calcular a Média, a Moda, a Mediana, o Desvio padrão, a variância e coeficiente
de variação de forma direta (sem construir tabela) dos dados acima.
7. Os dados abaixo referem-se ao consumo de água, em m3, de 40 famílias de
baixa renda de uma determinada cidade no mês de Julho de 2011.
42
Faixa de
consumo
fri
10 ` 15 0,10
15 ` 20 0,15
20 ` 25 0,30
25 ` 30 0,25
30 ` 35 0,15
35 ` 40 0,05
a) Obtenha as frequências simples absolutas e construa o histograma.
b) Calcule a média, a variância e o desvio padrão.
c) Calcule a mediana e a moda
d) Qual o percentual de famílias que consumiram pelo menos 25 m3 de água?
8. Um estudo foi realizado por um professor em três turmas, obtendo a média e o
desvio padrão das notas de sua disciplina, conforme abaixo. Qual a turma com
menor variabilidade? Justifique adequadamente.
Turma A B C
Média 6,5 8,0 8,0
Desvio Padrao 2,2 1,7 2,0
9. Quarenta alunos da UFCG foram questionados quanto ao número de livros lidos
no ano anterior. Foram registrados os seguintes valores:
4 2 1 0 3 1 2 0 2 1
0 2 1 1 0 4 3 2 3 5
8 0 1 6 5 3 2 1 6 4
3 4 3 2 1 0 2 1 0 3
a) Organize os dados em uma tabela adequada.
b) Qual o percentual de alunos que leram menos do que 3 livros.
c) Qual o percentual de alunos que leram 4 ou mais livros.
d) Calcule a média, a moda e a mediana
e) Calcule o desvio padrão, a variância e o coeficiente de variação.
10. (UFPB - 2011)A tabela a seguir apresenta a quantidade exportada de certo
produto, em milhares de toneladas, no período de 2000 a 2009.
43
Considerando os dados apresentados na tabela, identifique as afirmativas cor-
retas:
I. A quantidade exportada, de 2006 a 2008, foi crescente.
II. A média da quantidade exportada, de 2003 a 2006, foi de 53 mil toneladas.
III. A moda da quantidade exportada, de 2000 a 2009, foi de 52 mil toneladas.
IV. A média da quantidade exportada, de 2000 a 2004, foi maior que a média de
2005 a 2008.
V. A mediana da quantidade exportada, de 2000 a 2009, foi de 51 mil toneladas.
11. (UFPB - 2002) O gráfico ao lado mostra a porcentagem de acertos nas questões
de um concurso onde havia 12000 inscritos. Com base nos dados apresen-
tados, determine a quantidade de candidatos que acertou pelo menos duas
questões.
12. Complete a tabela e indique a mediana da amostra.
44
xi fi Fi fri
1 2 0,025
2 12
3 58
4 0,2
5
13. De um exame final de Estatística, aplicado a 50 alunos da UFCG em 2011
resultaram as seguintes notas:
4,0 4,2 4,3 4,4 4,5 4,5 4,6 5,0 5,1 5,2
5,3 5,3 5,5 5,7 5,8 6,0 6,1 6,3 6,4 6,5
6,6 6,7 6,8 6,9 7,0 7,2 7,5 7,6 7,7 7,9
8,0 8,3 8,5 8,6 8,8 8,9 9,0 9,1 9,2 9,3
9,3 9,4 9,4 9,5 9,5 9,6 9,7 9,8 9,8 9,9
Construa uma tabela de distribuição de frequências com intervalo de classe
por meio da regra de Sturges. Calcule a média, a moda, a mediana, o desvio
padrão e o coeficiente de variação das notas após os dados estarem tabulados
por classe.
45
3 Probabilidade: Espaço amostral e
eventos
3.1 Experimentos Aleatórios
3.1.1 Tipos de fenômenos
Fenômenos determinísticos: são aqueles em que os resultados são sempre os mes-
mos, qualquer que seja o número de ocorrências verificadas.
Fenômenos aleatórios: são aqueles que, mesmo repetidos várias vezes sob condições
semelhantes, apresentam resultados imprevisíveis.
Exemplos:
– Lançamento de uma moeda honesta;
– Lançamento de um dado;
– Retirada de uma carta de um baralho completo com 52 cartas;
– Determinação da vida útil de um componente eletrônico.
3.2 Espaço Amostral
Define-se espaço amostral (Ω) ao conjunto de todos os resultados possíveis de um
experimento.
Nos exemplos citados anteriormente, os espaços amostrais são:
46
Ω = {c, r} ;
Ω = {1, 2, 3, 4, 5, 6} ;
Ω = {Ao, . . . , Ko, Ap, . . . , Kp, Ac, . . . , Kc, Ae, . . . , Ke} ;
Ω = {t ∈ </t ≥ 0}.
3.3 Eventos
Chamamos de evento (E) a qualquer subconjunto do espaço amostral Ω de um ex-
perimento aleatório.
Qualquer que seja o evento E, se E ⊂ Ω, então E é um evento de Ω.
– Se E = Ω, E é chamado evento certo
– Se E ⊂ Ω e E é um conjunto unitário, E é chamado evento elementar.
– Se E = φ, E é chamado evento impossível.
3.4 Classe dos eventos aleatórios
Definição: é o conjunto formado de todos os eventos (subconjuntos) do espaço
amostral. Para efeito de exemplo, consideremos o espaço amostral finito: Ω =
{e1, e2, e3, e4}. A classe dos eventos aleatórios é:
F (Ω) =

φ
{e1}, {e2}, {e3}, {e4}
{e1, e2}, {e1, e3}, {e1, e4}, {e2, e3}, {e2, e4}, {e3, e4}
{e1, e2, e3}, {e1, e2, e4}, {e1, e3, e4}, {e2, e3, e4}
{e1, e2, e3, e4}
47
Genericamente, se o número de pontos amostrais de um espaço amostral é n, então
o número de eventos de F é 2n.
3.5 Operações com eventos Aleatórios
Considere um espaço amostral finito Ω = {e1, e2, . . . , en}. Sejam A e B dois eventos
de F (Ω). As seguintes operações são definidas.
União
Definição: A∪B = {ei ∈ Ω/ei ∈ A ou ei ∈ B}, i = 1, . . . , n. Portanto, o evento união
é formado pelos pontos amostrais que pertençam a pelo menos um dos conjuntos.
Figura 1: A ∪B
Observações:
1) A ∪B = B ∪ A
2) A ∪ A = A
3) A ∪ φ = A
4) Se A ⊂ B ⇒ A ∪B = B (em particular A ∪ Ω = Ω)
48
Intersecção
Definição: A ∩ B = {ei ∈ Ω/ei ∈ A e ei ∈ B}, i = 1, . . . , n. Portanto, o evento
intersecção é formado pelos pontos amostrais que pertença simultâneamente aos
eventos A e B.
Figura 2: A ∩B
Observações:
1) A ∩B = B ∩ A
2) A ∩ A = A
3) A ∩ φ = φ
4) Se A ⊂ B ⇒ A ∩B = A (em particular A ∩ Ω = A)
5) (A ∩B) ∩ C = A ∩ (B ∩ C)
Complementação
Definição: Ω − A = A¯ = Ac = {ei ∈ Ω/ei /∈ A} , i = 1, . . . , n. O complemento de
um evento A é, portanto, o evento contendo todos os resultados no espaço amostral
Ω que não pertençam a A.
Observações:
1) (Ac)c = A
2) A ∪ Ac = Ω
3) φc = Ω
4) A ∩ Ac = φ
49
Figura 3: A¯ = Ac
5) Ωc = φ
Exemplo: Lançam-se duas moedas. Sejam A: saída de faces iguais e B: saída de
cara na primeira moeda.
Determinar os eventos: A ∪B, A ∩B, Ac, Bc, (A ∪B)c, (A ∩B)c, Ac ∩Bc, Ac ∪Bc,
B − A, A−B, Ac ∩B e Bc ∩ A.
3.6 Propriedades das operações
Sejam A, B e C eventos associados a um espaço amostral Ω. As seguintes pro-
priedades são válidas:
a) IDEMPOTENTES
A ∩ A = A
A ∪ A = A
b) COMUTATIVAS
A ∪B = B ∪ A
A ∩B = B ∩ A
c) ASSOCIATIVAS
A ∩ (B ∩ C) = (A ∩B) ∩ C
A ∪ (B ∪ C) = (A ∪B) ∪ C
50
d) DISTRIBUTIVAS
A ∪ (B ∩ C) = (A ∪B) ∩ (A ∪ C)
A ∩ (B ∪ C) = (A ∩B) ∪ (A ∩ C)
e) ABSORÇÕES
A ∪ (A ∩B) = A
A ∩ (A ∪B) = A
f) IDENTIDADES
A ∩ Ω = A
A ∪ Ω = Ω
A ∩ φ = φ
A ∪ φ = A
g) COMPLEMENTARES
Ωc = φ
φc = Ω
A ∩ Ac = φ
A ∪ Ac = Ω
(Ac)c = A
h) "LEIS DAS DUALIDADES"ou "LEIS DE MORGAN"
(A ∩B)c = Ac ∪Bc
(A ∪B)c = Ac ∩Bc
3.7 Partição de um Espaço AmostralDefinição: Dizemos que os eventos A1, A2, . . . , An formam uma partição do espaço
amostral Ω se:
a) Ai 6= φ, i = 1, . . . , n
51
Figura 4: Partição de um Espaço Amostral.
b) Ai ∩ Aj = φ para i 6= j
c) ∪ni=1Ai = Ω
3.8 Eventos Mutuamente Exclusivos ou Disjuntos
Definição: Dois eventos ditos mutuamente exclusivos ou disjuntos se A e B não
puderem ocorrer juntos, ou seja, a realização de um exclui a realização do outro.
Segue que A e B são disjuntos se A ∩B = φ.
Figura 5: Eventos Mutuamente Exclusivos ou Disjuntos.
52
3.9 Exercícios
1. Quais das seguintes relações são verdadeiras?
(a)(A ∪B) ∩ (A ∪ C) = A ∪ (B ∩ C).
(b) (A ∪B) = (A ∩B) ∪B.
(c) A ∩B = A ∪B.
(d) (A ∪B) ∩ C = A ∩B ∩ C.
(e) (A ∩B) ∩ (B ∩ C) = φ.
2. Lançam-se três moedas. Enumerar o espaço amostral e os eventos:
(a) faces iguais;
(b) cara na primeira moeda;
(c) coroa na segunda e terceira moedas.
53
4 Probabilidade: Definições
4.1 Definição Clássica de Probabilidade
Dado um experimento aleatório, sendo Ω o seu espaço amostral, vamos admitir que
todos os elementos de Ω tenham a mesma chance de acontecer, ou seja, que Ω é
um conjunto equiprovável.
Define-se probabilidade de um evento A (A ⊂ Ω) ao número real P (A), tal que:
P (A) =
número de resultados favoráveis a A
número de resultados possíveis
=
n(A)
n(Ω)
4.2 Definição Axiomática de Probabilidade
Para um dado experimento, é necessário atribuir para cada evento A no espaço
amostral Ω um número P (A) que indica a probabilidade de A ocorrer. Para satis-
fazer a definição matemática de probabilidade, este número P (A) deve satisfazer
três axiomas específicos:
Axioma 1: Para qualquer evento A, P (A) ≥ 0.
Axioma 2: P (Ω) = 1.
Axioma 3: Para qualquer sequência finita de eventos disjuntos A1, A2, . . . , An
P
(
n⋃
i=1
Ai
)
=
n∑
i=1
P (Ai)
54
4.2.1 Propriedades
P.1 - P (φ) = 0
P.2 - Para qualquer sequência infinita de eventos disjuntos A1, A2, . . .
P
( ∞⋃
i=1
Ai
)
=
∞∑
i=1
P (Ai)
P.3 - Para qualquer evento A,
P (Ac) = 1− P (A)
P.4 - Para qualquer evento A, 0 ≤ P (A) ≤ 1.
P.5 - Se A ⊂ B, então P (A) ≤ P (B).
P.6 - Para qualquer evento dois eventos A e B
P (A ∪B) = P (A) + P (B)− P (A ∩B)
P.7 - Se os eventos A1, A2, . . . , An formam uma partição do espaço amostral, então:
n∑
i=1
P (Ai) = 1
Exemplo 1: Considere o lançamento de dois dados, sendo os eventos A = {soma
dos números igual a 9}, B = {número do primeiro dado maior ou igual a 4} e C =
{soma dos números menor ou igual a 4}. Enumere os elementos de A, B, C, A∩B e
A ∩ C. Obtenha P (A ∪B) e P (A ∪ C)
55
4.3 Eventos Independentes
Suponha que dois eventos A e B ocorram independentes um do outro no sentido
que a ocorrência ou não de um deles tenha nenhuma relação e nenhuma influência
na ocorrência ou na não ocorrencia do outro. Nessas condições
P (A ∩B) = P (A) · P (B)
Definição: Dois eventos são independentes se P (A ∩B) = P (A) · P (B).
Problema
Sejam A e B eventos tais que P (A) = 0, 2, P (B) = P , P (A ∪ B) = 0, 6. Calcular P
considerando A e B:
a) Mutuamente exclusivos;
b) independentes.
Resolução
a) P (A∩B) = 0 como P (A∪B) = P (A) +P (B)−P (A∩B) vem 0, 6 = 0, 2 + p− 0
∴ P = 0, 4
b) P (A ∩B) = P (A) · P (B) = 0, 2 · P como P (A ∪B) = P (A) + P (B)− P (A ∩B)
vem 0, 6 = 0, 2 + P − 0, 2P ∴ 0, 4 = 0, 8P logo, P = 0, 5
4.4 Probabilidade Condicional
Se A e B são dois eventos, a probabilidade de A ocorrer, depois B ter aconte-
cido, é representada por P (A/B) (Probabilidade de A dado B) e é denominada
probabilidade condicional de A, depois de B ter ocorrido.
É portanto natural definir-se a probabilidade condicional P (A/B) como a proporção
56
da probabilidade total P (B) que é representada pela probabilidade P (A ∩ B). Por-
tanto, tem-se a seguinte definição
P (A/B) =
P (A ∩B)
P (B)
, dado P (B) > 0
Se P (B) = 0 a P (A/B) não é definida
ou, equivalentemente
P (B/A) =
P (A ∩B)
P (A)
, dado P (A) > 0
Se P (A) = 0 a P (B/A) não é definida.
Tiramos da definição da probabilidade condicional o chamado TEOREMA DO PRO-
DUTO: Sejam A ⊂ Ω e B ⊂ Ω. Então, P (A ∩ B) = P (B) · P (A/B) ou P (A ∩ B) =
P (A) · P (B/A).
Exemplo: Um grupo de 86 pessoas está assim formado:
Escolhendo-se, ao acaso, uma pessoa do grupo, qual a probabilidade de que seja:
a) Uma mulher que fez o curso de medicina ?
b) Uma pessoa que fez o curso de medicina ?
c) Um engenheiro dado que seja homem ?
d) Não ser médico dado que não seja homem ?
4.5 Probabilidade Total
Seja Ω o espaço amostral de um experimento, e considere K eventos A1, A2, . . . , Ak
em Ω tal que A1, A2, . . . , Ak sejam disjuntos e
⋃k
i=1 Ai = Ω. Diz-se, então, que estes
57
eventos formam uma partição de Ω.
Se os eventosA1, A2, . . . , Ak formam uma partição de Ω, eB é qualquer outro evento
em Ω, então:
B = (A1 ∩B) ∪ (A2 ∩B) ∪ . . . ∪ (Ak ∩B)
Como os K eventos do lado direito da equação anterior são disjuntos:
P (B) =
k∑
i=1
P (Ai ∩B)
Mas P (Aj ∩B) = P (Aj) · P (B/Aj) em que j = 1, 2, . . . , k. Então
P (B) =
k∑
i=1
P (Aj) · P (B/Aj)
Exemplo: Uma urna contém 3 bolas brancas e 2 amarelas. Uma segunda urna
contém 4 bolas brancas e 2 amarelas. Escolhe-se, ao acaso, uma urna e dela retira-
se, também ao acaso, uma bola. Qual a probabilidade de que seja branca?
4.6 Teorema de Bayes
Sejam os eventos j = 1, 2, . . . , k que formam uma partição do espaço amostral Ω tal
que P (Aj) > 0 para todo j = 1, 2, . . . , k e seja B qualquer evento tal que P (B) > 0.
Então, para i = 1, 2, . . . , k, temos:
P (Aj/B) =
P (Aj)P (B/Aj)∑k
i=1 P (Ai) · P (B/Ai)
(4.1)
Prova: Pela definição de probabilidade condicional,
58
P (Aj/B) =
P (Aj ∩B)
P (B)
O numerador da equação (1) é igual a P (Aj ∩ B) e o denominador é igual a P (B)
(pela fórmula para probabilidade total).
Exemplo: Em uma fábrica de parafusos, as máquinas A, B e C produzem 25, 35 e 40
por cento do total produzido, respectivamente. Da produção de cada máquina, 5, 4
e 2 por cento, respectivamente, são parafusos defeituosos. Escolhe-se ao acaso um
parafuso e se verifica ser defeituoso. Qual será a probabilidade de que o parafuso
venha da máquina A? Da B? Da C?
59
4.7 Exercícios
1. Dez fichas numeradas de 1 até 10 são misturadas em uma urna. Duas fichas,
numeradas (X, Y ), são extraídas da urna, sucessivamente e sem reposição.
Qual é a probabilidade de que seja X + Y = 10? (R= 4/45)
2. Considere o conjunto de números inteiros {1, 2, 3, . . . , 19, 20}, e, por meio de
um sorteio aleatório, retire um número. Se o número sorteado for ímpar, qual a
probabilidade de o número sorteado ser o número 13? ( R = 1/10)
3. A probabilidade de que o aluno A resolva determinado problema é 2/3 e a prob-
abilidade de que o aluno B o resolva é 4/5. Se ambos tentarem independen-
temente a resolução, qual a probabilidade do problema ser resolvido? ( R =
14/15)
4. Numa festa beneficente, foram vendidos 20 números em uma "rifa", e serão
sorteados dois prêmios. Qual a probabilidade de uma pessoa que tenha adquirido
quatro números ganhar os dois prêmios? (R = 3/95)
5. Um lote é formado por 10 animais sadios, quatro com problemas menores e dois
com problemas graves. Todos os animais são numerados e é feita a escolha de
um animal ao acaso. Ache a probabilidade de que:
a) ele não tenha problemas; (R =5/8)
b) ele não tenha problemas graves; (R = 7/8)
c) ele ou seja sadio ou tenha problemas graves. (R = 3/4)
6. Duas bolas vão ser retiradas sem reposição de uma urna que contém 2 bolas
brancas, 3 pretas e 4 verdes. Qual a probabilidade de que ambas
a) sejam verdes? (R = 1/6)
b) sejam da mesma cor? ( R = 5/18)
7. Uma urna contém 5 bolas brancas, 4 vermelhas e 3 azuis. Extraem-se 3 bolas(uma após a outra). Achar a probabilidade de que:
a) nenhuma seja vermelha. (R= 14/55)
b) exatamente uma seja vermelha. (R = 28/55)
c) todas sejam da mesma cor. (R= 4/55)
8. Numa população composta por 200 animais de duas raças X e Y , os animais
podem ser fecundos e não fecundos. Vinte por cento dos animais da raçaX são
60
fecundos; trinta por cento dos animais da raça Y sao não fecundos e setenta e
cinco por cento dos animais são da raça X. Escolhe-se um animal ao acaso.
Determine a probabilidade desse animal:
a) ser da raça Y dado que é fecundo; (R = 0,55)
b) ser não fecundo dado que é da raça Y .( R = 0,30)
9. Uma indústria produz determinado tipo de peça em três máquinas M1,M2 e
M3. A Máquina M1 produz 40% das peças, enquanto M2 e M3 produzem
30% cada uma. As porcentagens de peças defeituosas produzidas por essas
máquinas são respectivamente iguais a 1%, 4% e 3%. Se uma peça é sele-
cionada aleatóriamente da produção total, qual é a probabilidade dessa peça
ser defeituosa? (R = 0,025)
10. A urna A contém 3 fichas vermelhas e 2 azuis, e a urna B contém 2 vermelhas
e 8 azuis. Joga-se uma moeda honesta. Se a moeda der cara, extrai-se uma
ficha da urna A; se der coroa, extrai-se uma ficha da urna B. Uma ficha vermelha
é extraída. Qual a probabilidade de ter saído cara no lançamento? (R = 3
4
)
11. Num certo colégio, 4% dos homens e 1% das mulheres têm mais de 1,75 de
altura. 60% dos estudantes são mulheres. Um estudante é escolhido ao acaso
e tem mais de 1,75 m. Qual a probabilidade de que seja homem? ( R = 8
11
=
0, 7272)
12. A e B jogam 120 partidas de xadrez, das quais A ganha 60, B ganha 40 e 20
terminam empatadas. A e B concordam em jogar 3 partidas. Determinar a
probabilidade de:
a) A ganhar todas a três; (R = 1
8
)
b) duas partidas terminarem empatadas; (R = 5
72
)
c) A e B ganharem alternadamente. (R = 5
36
)
13. Em uma prova caíram dois problemas. Sabe-se que 132 alunos acertaram o
primeiro, 86 erraram o segundo, 120 acertaram os dois e 54 acertaram apenas
um problema. Qual a probabilidade de que um aluno, escolhido ao acaso:
a) não tenha acertado nenhum problema? ( R = 37
124
)
b) tenha acertado apenas o segundo problema? (R = 21
124
)
14. São retiradas, com reposição, duas cartas de um baralho com 52 cartas. Qual
a probabilidade de que as duas sejam de ouros? (R = 1
16
)
61
15. Um lote de certo tipo de peças é formado de 9 peças boas, 2 com pequenos
defeitos e uma com defeito grave. Uma dessas peças é escolhida ao acaso.
Determine a probabilidade de que a peça escolhida:
a) não tenha defeito; ( R = 3
4
)
b) não tenha defeito grave. (R = 11
12
)
16. Suponha que A e B sejam eventos independentes associados a um experi-
mento. Se a probabilidade de A ou B ocorrerem for igual a 0, 6, enquanto a
probabilidade da ocorrência de A for igual a 0, 4, determine a probabilidade da
ocorrência de B. (R = 0,33)
17. As probabilidades de que dois eventos independentes ocorram são p e q, re-
spectivamente. Qual a probabilidade:
a) de nenhum desses eventos ocorra? (R = (1− p)(1− q))
b) de que pelo menos um desses eventos ocorra? ( R = (p+ q − pq))
62
5 Variáveis Aleatórias discretas
5.1 Variáveis Aleatórias
Definição: Considere um experimento para o qual o espaço amostral é denotado por
Ω. Define-se variável aleatória como uma função que associa um valor real a cada
elemento do espaço amostral.
X : Ω −→ <
Representa-se as variáveis aleatórias por letras maiúsculas e suas ocorrências por
letras minúsculas.
Exemplo
Suponha o experimento "lançar três moedas". Seja X: número de ocorrências da
face cara . O espaço amostral do experimento é:
Ω = {(c, c, c), (c, c, r), (c, r, c), (c, r, r), (r, c, c), (r, c, r), (r, r, c), (r, r, r)}
Se X é o número de caras, X assume os valores 0, 1, 2 e 3.
63
Definição: Seja X uma variável aleatória (v.a.). Se o número de valores possíveis
de X (isto é, o seu contradomínio), for finito ou infinito enumerável, denominamos X
de variável aleatória discreta.
Definição: Seja X uma variável aleatória discreta. Portanto, o contradomínio de
X será formado por um número finito ou enumerável de valores x1, x2, . . .. A cada
possível resultado xi, associaremos um número p(xi) = P (X = xi), i = 1, 2, 3, . . .,
denominado probabilidade de xi. Os números p(xi) devem satisfazer às seguintes
condições:
a) p(xi) ≥ 0,
b)
∑∞
i=1 p(xi) = 1
A função p definida acima, é denominada função de probabilidade da variável
aleatória X. A coleção de pares [xi, p(xi)], i = 1, 2, . . ., é denominada distribuição
de probabilidade.
Exemplo
Lançam-se dois dados. Seja a v.a. X: soma das faces. Determinar a distribuição de
probabilidade da variável aleatória X.
64
5.2 Esperança de uma Variável Aleatória Discreta
Suponha que uma variável aleatória X possua uma distribuição discreta cuja função
é p(x). A esperança de X, denotada por E(X), é um número definido por:
µ = E(X) =
∑
x
x · p(x)
Exemplo: Suponha que uma v.a. X possa assumir somente quatro valores: -2, 0, 1
e 4, e que P (X = −2) = 0, 1; P (X = 0) = 0, 4; P (X = 1) = 0, 3; P (X = 4) =
0, 2.
Então:
E(X) = −2 · (0, 1) + 0 · (0, 4) + 1 · (0, 3) + 4 · (0, 2) = 0, 9
Propriedades da Esperança
P1. Se a é uma constante qualquer
E(a) = a
P2. Se a é uma constante qualquer
E(aX) = a · E(X)
P3. SeX1, X2, . . . , Xn são n variáveis aleatórias tais queE(Xi) existe (i = 1, 2, . . . , n),
então
E(X1 +X2 + . . .+Xn) = E(X1) + E(X2) + . . .+ E(Xn).
P4. Se X1, X2, . . . , Xn são n variáveis aleatórias independentes tais que E(Xi) ex-
iste (i = 1, 2, . . . , n), então
65
E
(
Πni=1Xi
)
= Πni=1E(Xi)
5.3 Variância de uma Variável Aleatória Discreta
Definição: Suponha que X é uma v.a. com média µ = E(X). A variância de x,
representada por V (X) é definida por
V (X) = E[(x− µ)2]
V (X) = E(X2)− [E(X)]2
Variáveis Aleatórias Discretas
Suponha que uma v.a. X possua uma distribuição discreta, cuja função é p(x). Então
V (X) =
∑
x
(x− µ)2 · p(x) =
∑
x
x2 · p(x)− µ2
Exemplo: Suponha que uma v.a. X possa assumir somente quatro valores: -2, 0, 1
e 4, e que P (X = −2) = 0, 1; P (X = 0) = 0, 4; P (X = 1) = 0, 3;
P (X = 4) = 0, 2.
Como visto anteriormente, E(X) = 0, 9. Então
V (X) =
∑
x(x − µ)2 · p(x) = (−2 − 0, 9)2 · (0, 1) + (0 − 0, 9)2 · (0, 4) + (1 − 0, 9)2 ·
(0, 3) + (4− 0, 9) · (0, 2) = 3, 09
Propriedades da Variância
P1. V (c) = 0 se e somente se c for uma constante.
P2. V (aX) = a2V (X). sendo a constante
66
P3. V (aX + b) = a2V (X). com a e b constantes
P4. V (X ± Y ) = V (X) + V (Y )± 2cov(X, Y ).
5.4 Função de Distribuição Acumulada
Definição: A função de distribuição da variável aleatória X, representada por Fx ou
simplesmente F , é definida por:
FX(x) = P (X ≤ x) =xi≤x P (xi)
Observações:
a) A função de distribuição de X é também frequentemente chamada de função de
distribuição acumulada de X.
b) A função FX(x) é não-decrescente quando x aumenta, isto é, se x1 < x2, então
FX(x1) ≤ FX(x2).
c) 0 ≤ F (x) ≤ 1
d) P (a < X ≤ b) = F (b)− F (a)
e) P (a ≤ X ≤ b) = F (b)− F (a) + P (X = a)
f) P (a < X < b) = F (b)− F (a)− P (X = b)
g) Para qualquer valor de x
P (X > a) = 1− F (a)
Teoremas
a) Se X for uma variável aleatória discreta,
FX(x) =
∑
j
P (xj)
67
onde o somatório é estendido a todos os índices j que satisfaçam a condição xj ≤ x
Exemplo
Suponhamos que a v.a. X tome os três valores 0,1, e 2, com probabilidades 1/3, 1/6
e 1/2, respectivamente. Então:
O gráfico de F está apresentado na Figura abaixo
68
5.5 Exercícios
1. Suponha que 0,4; 0,3; 0,2 e 0,1, respectivamente, sejam as probabilidades de
que nenhum, um dois ou três problemas com energiaafetarão certa subdivisão
durante dado ano. Determine a média e a variância da variável aleatória X que
representa o número de problemas com energia que afeta essa subdivisão.
2. As probabilidades de que haja 0, 1, 2, 3 ou 4 partes defeituosas em uma
máquina quando três partes são amostradas da linha de produção são, respec-
tivamente: 0,05; 0,20; 0,40; 0,25 e 0,10. Determinar:
a) o número médio de partes defeituosas;
b) a variância V (X) ;
c) F (X) e esboçar seu gráfico.
d) P (2 < X ≤ 4).
3. A função de probabilidades da variável aleatória X é: P (X) = 1
5
, para
X = 1, 2, 3, 4, 5.
a) Calcule E(X) e V (X)
b) Calcule P (X ≥ 2) e P (X < 4)
c) Determine F (X) e esboce seu gráfico.
4. Suponha que a duração X de uma ligação telefônica, em minutos, seja dada
pela seguinte distribuição de probabilidades:
X 1 2 3 4
P (X) 0,2 0,5 0,2 0,1
a) Determine P (X ≤ 3) e P (2 ≤ X ≤ 3).
b) Calcule E(X) e V (X).
c) Obtenha F (X) e esboçe seu gráfico.
5. Uma urna tem 4 bolas brancas e 3 pretas. Retiram-se 3 bolas sem reposição.
Seja X: número de bolas brancas, determinar a distribuição de probabilidades
de X.
6. Fazer o exercício anterior considerando extração com reposição.
69
7. Um jogo consiste em se retirar, ao acaso, uma bola de uma caixa contendo 5
bolas brancas, 3 pretas e 2 vermelhas. Se a bola selecionada for branca ganha-
se R$ 10,00 e se for preta ou vermelha perdem-se, respectivamente, R$ 5,00 e
R$ 15,00. Qual é o lucro médio do jogo?
8. Calcule a esperança e a variância de g(X) = 2X + 3, onde X é a variável
aleatória com distribuição de probabilidade
X 0 1 2 3
P (X) 1/4 1/8 1/2 1/8
70
6 Distribuições Teóricas de
Probabilidades de Variáveis
Aleatórias Discretas
6.1 Distribuição de Bernoulli
Consideremos uma única tentativa de um experimento aleatório. Podemos ter sucesso
ou fracasso nessa tentativa.
Seja p a probabilidade de sucesso e q a probabilidade de fracasso, com p + q = 1,
ou seja, q = 1− p.
Seja X : número de sucessos em uma única tentativa do experimento. X assume o
valor 0 que corresponde ao fracasso, com probabilidade q, ou o valor 1, que corre-
sponde ao sucesso, com probabilidade p.
P (X = 0) = q e P (X = 1) = p
Nessas condições a variável aleatória X tem distribuição de BERNOULLI, e sua
função de probabilidade é dada por:
P (X = x) = px · q1−x
A esperança da distribuição de Bernoulli é E(X) = p e sua variância é
V (X) = pq
Exemplo: Uma urna contém 15 bolas brancas e 25 bolas vermelhas. Uma bola é
71
retirada da urna e a variável aleatória X anota o número de bolas brancas obtidas.
Calcule a média e a variância de X e determinar P (X).
Solução:
X = 0→ q = 25
40
= 5
8
X = 1→ p = 15
40
= 3
8
P (X = x) = (3
8
)x(5
8
)1−x
E(X) = p = 3
8
V (X) = pq = 3
8
· 5
8
= 15
64
6.2 Distribuição Binomial
Consideremos n tentativas independentes de um mesmo experimento aleatório. Cada
tentativa admite apenas dois resultados: fracasso com probabilidade q e sucesso
com probabilidade p, p + q = 1. As probabilidades de sucesso e fracasso são as
mesmas para cada tentativa.
Seja X: número de sucessos em n tentativas.
Determinaremos a função de probabilidades da variável X, isto é, P (X = k).
Logo,
P (X = k) =
(
n
k
)
pkqn−k
A variável X tem distribuição binomial, com parâmetros n e p, e indicaremos pela
notação
X ∼ B(n, p)
72
Exemplo: Será extraida uma amostra de 5 indivíduos de uma grande população,
onde 60% são do sexo feminino. Qual a probabilidade de:
a) exatamente 3 dos indivíduos escolhidos ser do sexo feminino?
b) pelo menos um dos indivíduos ser do sexo feminino?
c) ao menos 3 (uma maioria) ser do sexo feminino ?
Solução: Se X é a v.a. que representa o número de indivíduos que são do sexo femi-
nino, temos que X segue uma distribuição binomial, cuja probabilidade de "sucesso"
(ser do sexo feminino) em cada tentativa é 0,60. Portanto,
a)
P (X = 3) =
(
5
3
)
(0, 6)3(0, 4)2 = 0, 3456
b) A probabilidade que pelo menos um dos indivíduos ser do sexo feminino é dada
por
1− P (X = 0) = 1−
(
5
0
)
(0, 6)0(0, 4)5 = 1− 0, 0102 = 0, 9898
c) A probabilidade que ao menos 3 (uma maioria) ser do sexo feminino é dada por
P(X = 3) +
P(X = 4) + P(X = 5), ou seja:
(
5
3
)
(0, 6)3(0, 4)2 +
(
5
4
)
(0, 6)4(0, 4)1 +
(
5
5
)
(0, 6)5(0, 4)0 = 0, 6826
6.2.1 Média e Variância de uma v.a. com Distribuição
Binomial
Se X ∼ B(n.p)→ P (X = k) = (n
k
)
pkqn−k então
E(X) = n · p e V (X) = n · p · q
Exemplo: Em 100 lances de uma moeda honesta, determeine a média e a variância
do número de caras.
73
p = 1
2
e q = 1
2
logo,
E(X) = np = 100 · 1
2
= 50
V (X) = npq = 100 · 1
2
· 1
2
= 25
6.3 Distribuição de Poisson
Seja X uma v.a. com distribuição discreta, e suponha que X assuma valores inteiros
não negativos. É dito que X possui uma distribuição de Poisson com média λ onde
(λ > 0) se a função de probabilidade de X é dada por:
P (X = k) =
e−λλk
k!
k = 0, 1, 2, 3, . . .
em que X o número de sucessos no intervalo
Observação:O símbolo e representa uma constante que é aproximadamente igual a
2,7183. O seu nome é uma homenagem ao matemático suiço I. Euler, e constitui a
base do chamado logaritmo natural.
A distribuição de Poisson é muito usada na distribuição do número de:
1. carros que passam por um cruzamento por minuto, durante uma certa hora do dia;
2. erros tipográficos por página, em um material impresso;
3. defeitos por unidade (m2, m3, m, etc.) por peça fabricada;
4. mortes por ataque de coração por ano, numa cidade. É aplicada também em
problemas de filas de espera em geral, e outros.
A esperança E(X) = λ e a variância V (X) = λ.
74
A v.a. de Poisson tem um amplo range de aplicações em uma grande variedade
de áreas, porque se emprega como uma aproximação para uma v.a. binomial com
parâmetros (n, p) quando n é grande e p é pequeno. Supondo que X é uma v.a.
binomial com parâmetros (n; p) então λ = np.
Exemplo 1: Se a probabilidade de um indivíduio sofrer uma reação nociva, resultante
de ter tomado um certo soro é 0,001, determinar a probabilidade de que, entre 2000
indivíduos:
a) exatamente três sofrerem a reação;
Solução
Seja X a v.a. que representa o número de pessoas que sofrem a reação nociva após
injerir o soro. Então,
P (X = k) =
e−λλk
k!
k = 0, 1, 2, 3, . . .
onde λ = 2000 · 0, 001 = 2. Logo,
P (X = 3) =
e−223
3!
= 0, 18
b) mais do que dois sofrerem a reação.
P (X ≥ 3) = 1− P (X ≤ 2) = 1− [P (X = 0) + P (X = 1) + P (X = 2)]
= 1− [e
−220
0!
+
e−221
1!
+
e−222
2!
] = 0, 323
Exemplo 2: Numa central telefônica chegam 300 telefonemas por hora. Qual a
probabilidade de que:
a) num minuto não haja nenhum chamado
X: número de chamadas por minuto λ = 5
75
P (X = 0) =
e−550
0!
= 0, 006738
b) em 2 minutos haja 2 chamados
dois minutos λ = 10
P (X = 2) =
e−10102
2!
= 0, 002270
76
6.4 Exercícios
1. Retira-se uma bola de uma urna contendo 30 bolas brancas e 20 verdes. Qual
a probabilidade dessa bola ser verde?
2. Seja X ∼ Bernoulli(p) Mostre que E(X) = p e V (X) = pq, q = 1− p
3. A probabilidade de que certo tipo de componente sobreviverá a um teste de
choque é de 3/4. Determine a probabilidade de que exatamente dois dos próxi-
mos quatro componentes testados sobrevivam. (R = 27/128)
4. Uma grande rede varesjista compra certo tipo de equipamento eletrônico de
um fabricante. O fabricante indica que a taxa de equipamentos com defeito é
de 3%. O inspetor da rede seleciona 20 ítens de um carregamento. Qual é a
probabilidade de que haja pelo menos um ítem defeituoso entre esses 20? (R
= 0,4562)
5. De acordo com a publicação