Buscar

Apostila de Estatistica e Probabilidade Pos Estacio

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

3 
 
Apostila de Estatística e Probabilidade
 Profª Cristiane Leitão
Capítulo I - Conceitos Iniciais
 Estatística
A Estatística está interessada nos métodos científicos para coleta, organização, resumo, apresentação e análise de dados, bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis baseadas em tais análises.
A Estatística tem por objetivo fornecer métodos e técnicas para lidarmos, racionalmente com situações sujeitas a incertezas.
 População e amostra. Estatística indutiva e descritiva
Ao coletar os dados referentes às características de um grupo de objetos ou indivíduos, tais como as alturas e pesos dos estudantes de uma universidade ou os números de parafusos defeituosos ou não produzidos por uma fábrica em certo dia, é muitas vezes impossível ou impraticável observar todo o grupo, especialmente se for muito grande. Em vez de examinar todo o grupo, denominado população ou universo, examina-se uma pequena parte chamada amostra.
 Se uma amostra é representativa de uma população, conclusões importantes sobre a população podem ser inferidas de sua análise.
 
1.3.Variáveis
Uma variável é o conjunto de resultados possíveis de um fenômeno. Tratando-se de estatística de variável, é possível distinguir duas categorias de variável:
Qualitativa – quando seus valores são expressos por atributos. Esse tipo de variável, se divide ainda em:
Variável Nominal – quando este atributo não admite uma ordenação.
Ex: Cor dos olhos (pretos, castanhos, azuis, etc)
Variável Ordinal – quando este atributo admite algum tipo de ordenação.
Ex: Classe social (alta, média ou baixa)
Quantitativa – quando seus valores são expressos por números. Esse tipo de variável, se divide ainda em:
 Variável Contínua – quando seus valores são expressos por números que podem assumir, teoricamente, qualquer valor entre dois limites.
 Ex: peso corporal, altura...
 Variável Discreta – quando seus valores são expressos por números pertencentes a um conjunto enumerável. 
 Ex: quantidade de alunos de uma turma, número de crianças de uma família.
Os dados que podem ser descritos por meio de uma variável discreta ou contínua são chamados dados discretos ou dados contínuos, respectivamente. O número de crianças em cada uma de 1.000 famílias é um exemplo de dados discretos, enquanto o peso de 100 estudantes universitários é um exemplo de dados contínuos. Em geral, as medições dão origem a dados contínuos, enquanto as enumerações ou contagens resultam em dados discretos.
ESTATÍSTICA DESCRITIVA
Vamos apresentar os principais conceitos sobre o levantamento de dados; destacar as técnicas de apresentação, por meio de tabelas e gráficos; oferecer as medidas próprias para análises e as técnicas usadas para a interpretação dos dados numéricos.
Fases do Método Estatístico
Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. O Método Estatístico usa o conjunto de meios listados abaixo, para uma tomada de decisão.
As fases dos método estatístico:
•Definição do problema;
•Planejamento;
•Coleta dos dados;
•Crítica dos dados;
•Apresentação dos dados;
•Análise e Interpretação dos dados.
A Estatística Descritiva pode ser resumida do diagrama:
Coleta de
dados
Crítica de
dados
Apresenta-ção dos dados
Tabelas
Gráficos
Análise
 
Gráficos
O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo o objetivo inicial é o de produzir em geral, uma impressão mais rápida do fenômeno em estudo. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais, para ser realmente útil:
Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, que possam levar o observador a uma análise errônea.
Clareza – o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo.
 Veracidade – o gráfico deve sempre expressar a verdade sobre o fenômeno em estudo.
Os principais gráficos indicados para a representação de uma série estatística são:
Gráfico em linhas 
Gráficos em barras verticais ou horizontais
Gráfico em setores
- Gráficos em Linhas
 
 
- Gráficos em Colunas (barras verticais)
- Gráfico em Barras (barras horizontais)
- Gráficos em Setores: É a representação gráfica de uma série estatística, em um círculo, por meio de setores. É utilizado principalmente quando se pretende comparar cada valor da série com o total. Para construir divide-se o círculo em setores, cujas áreas serão proporcionadas aos valores da série. Essa divisão pode ser obtida pela solução da regra de três.
 Total ----360 graus
Parte ---- X graus
 
 
- Cartogramas
	É a representação sobre uma carta geográfica.
	Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.
Fonte: IBGE
- Pictogramas
	São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. 
 Fonte: IBGE
Capítulo II - Distribuição de Frequências
Por se tratar do tipo de tabela mais importante para a Estatística Descritiva, faremos um estudo completo sobre as distribuições de frequências, incluindo sua construção.
Uma distribuição de frequências pode ser:
Distribuição de frequências sem intervalos de classes.
Distribuição de frequências com intervalos de classes.
Representação da Amostra
A seguir definiremos alguns procedimentos comuns para a representação das distribuições de frequências:
1. Dados brutos ou Tabela Primitiva – É o conjunto de dados numéricos obtidos após a crítica dos valores coletados não ordenados numericamente.
Ex1: Os dados abaixo representam o salário semanal dos funcionários de uma pequena empresa.
	88,5
	97,5
	80,0
	97,0
	85,0
	80,5
	88,0
	92,0
	88,5
	92,5
	94,5
	100,5
	94,0
	89,0
	85,5
	85,0
	95,0
	89,0
	87,0
	94,0
	87,5
	98,5
	84,5
	95,5
	99,0
	84,0
	93,0
	103,5
	91,0
	91,0
	86,0
	91,5
	87,0
	90,5
	86,0
	87,0
	90,0
	88,0
	89,5
	83,5
	89,5
	96,5
2. Rol – É o conjunto de dados após sua ordenação numérica. 
	80,0
	85,0
	87,0
	89,0
	91,0
	94,0
	97,0
	80,5
	85,5
	87,5
	89,0
	91,0
	94,0
	97,5
	83,5
	86,0
	88,0
	89,5
	91,5
	94,5
	98,5
	84,0
	86,0
	88,0
	89,5
	92,0
	95,0
	99,0
	84,5
	87,0
	88,5
	90,0
	92,5
	95,5
	100,5
	85,0
	87,0
	88,5
	90,5
	93,0
	96,5
	103,5
3. Amplitude total ou “range” (R) - É a diferença entre o maior e o menor valor observados. R = 103,5 – 80,0 = 23,5
4. Números de classes (K) – não há uma fórmula exata para o cálculo do número de classes. Uma boa aproximação é a Regra de Sturges:
 onde n é o tamanho da amostra
No nosso exemplo temos:
 
5. Amplitude das classes (h) – É o tamanho de classes
 
É mais apropriado que aproximamos o número de classes e a amplitude das classes para o maior número inteiro. Assim, se . Usamos
h = 4. 
6. Frequência absoluta () – É o número de vezes que o elemento aparece na amostra. 
Exemplo de uma distribuição de frequência com variável discreta.
	
	
	22
23
24
28
33
34
	2
2
2
1
1
2
	
	10
 
Obs: X representa a variável onde n = tamanho da amostra
Exemplo de distribuição de frequência para variável contínua:
	Classes
	Fi
	
	 80 |----- 84
 84 |----- 88
 88 |----- 92
 92 |----- 96
 96 |----- 100
100 |----- 104
	3
11
13
8
5
2
	
	Total (n)
	42
	
7. Frequência absolutaacumulada ( - É a soma das frequências dos valores inferiores ou iguais ao valor dado.
8. Limites das classes
 80 |----- 84 compreende todos os valores entre 80 e 84 excluindo o 84.
9. Pontos médios das classes () – É a média aritmética entre o limite superior e o inferior da classe. Assim se a classe for 80 |----- 84, teremos:
 
10. Frequência relativa - A frequência relativa de um valor é dada por , ou seja, é a porcentagem daquele valor da amostra.
Obs: 
Montando a distribuição do nosso exemplo:
	Classes
	Fi
	xi
	Fac
	fi
	 80 |----- 84
 84 |----- 88
 88 |----- 92
 92 |----- 96
 96 |----- 100
100 |----- 104
	3
11
13
8
5
2
	82
86
90
94
98
102
	3
14
27
35
40
42
	0,07
0,26
0,31
0,19
0,12
0,05
	Total (n)
	42
	----
	----
	1
11. Histograma – É a representação gráfica de uma distribuição de frequência por meio de retângulos. Polígono de frequência – É a representação da distribuição por meio de um polígono.
Polígono de frequência
Exemplo 1: As notas de 35 estudantes de uma classe estão descritas a seguir:
0,0 – 0,0 – 1,0 – 1,5 – 2,0 - 2,0 – 2,5 – 3,5 – 3,5 – 4,0
4,0 – 4,0 – 4,0 – 4,5 – 4,5 – 4,5 – 5,0 – 5,0 – 5,0 – 5,0
5,0 – 5,5 – 5,5 – 5,5 – 6,0 – 6,0 – 6,0 – 6,5 – 6,5 – 7,0
7,0 – 7,5 – 8,0 – 8,0 – 8,5 
Determinar:
a distribuição de frequência
amplitude total
qual a porcentagem dos alunos que tiveram nota menor que 4,0?
o histograma e o polígono de frequência.
Exemplo 2: Dado um rol de 50 notas, agrupar os elementos em classes:
30 – 35 – 35 – 39 – 41 – 41 – 42 – 45 – 47 - 48
50 – 52 – 53 – 54 – 55 – 55 – 57 – 59 – 60 – 60
61 – 64 – 65 – 65 – 65 – 66 – 66 – 66 – 67 – 68
69 – 71 – 73 – 73 – 74 – 74 – 76 – 77 – 77 – 78
80 – 81 – 84 – 85 – 85 – 88 – 89 – 91 – 94 – 94
Solução: Amplitude total: R = 94 – 30 = 64
 Nº de classes: 1 + 3,22 .(1,7) 
 Amplitude das classes: 
	Classes
	
	
	
	
	30 |– 40
40 |– 50
50 |– 60
60 |– 70
70 |– 80
80 |– 90
90 |– 100
	4
6
8
13
9
7
3
	4
10
18
31
40
47
50
	0,08
0,12
0,16
0,26
0,18
0,14
0,06
	35
45
55
65
75
85
95
	
	50
	
	1
	
Exemplo 3: Os pesos de 40 alunos estão relacionados a seguir:
45 – 49 – 50 – 53 – 53 – 53 – 54 – 57 – 58 – 58
59 – 60 – 60 – 60 – 62 – 63 – 63 – 64 – 64 – 65
65 – 66 – 67 –67 – 68 – 68 – 69 – 70 – 71 – 72
72 – 73 – 74 – 75 – 76 – 80 – 81– 81– 83 – 93
Construir a tabela de distribuição de frequência. Dado .
OBS: Dados não agrupados: 
Capítulo III - Medidas de Posição
O estudo que fizemos sobre distribuições de frequências, até agora, permite-nos descrever, de modo geral o comportamento de uma variável. Ocorre, todavia que trabalhar com uma distribuição de frequências completa, muitas vezes, é difícil, razão pela qual costuma-se lançar mão de determinadas medidas. Essas medidas sumarizam certas características importantes da distribuição de frequências. Há diversas medidas que possibilitam condensar as informações dentro da fase analítica da Estatística Descritiva. Dentre as medidas de posição mais importantes estão as medidas de tendência central.
3.1. Índices ou notação por índice
O símbolo (lê-se “X índice i) representa qualquer um dos N valores, . A letra i, em , pode representar qualquer dos números 1,2,3,...,N, é denominada índice. Evidentemente, pode ser usada qualquer outra letra além de i, como j, k, p ou s.
3.2. Notação de Somatório
O símbolo é usado para representar a soma de todos os desde i =1 até 
ij = N, isto é, por definição 
 = 
3.3. Medidas de Tendência Central
	As medidas de tendência central recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais.
	Dentre as medidas de tendência central, destacamos:
média ou (Ma)
moda ou (Mo)
mediana ou (Md)
A média aritmética é, de modo geral, a mais importante e mais comum de todas as mensurações numéricas descritivas.
Estas medidas podem ser calculadas, tanto para dados não agrupados em classes, quanto para dados agrupados em classes.
3.3.1. Dados não agrupados em classes
- Média Aritmética
A média aritmética, ou média, de um conjunto de N números é representado por (lê-se “x barra”) e é definida por
 = 
Ex: A média aritmética dos números 8, 3, 5,12,10 é:
 =
Propriedade da Média Aritmética
A soma algébrica dos desvios de um conjunto de números, em relação à média aritmética, é zero.
Ex: Os desvios dos números 8, 3, 5, 12, 10, em relação à sua média aritmética 7,6 são: 8 – 7,6 ; 3 –7,6; 5 – 7,6 ; 12 – 7,6 ; 10 – 7,6 ou 0,4 ; –4,6 ; –2,6 ; 4,4 ; 2,4 com soma algébrica igual a zero.
- Moda
A moda de um conjunto de números é o valor que ocorre com maior frequência, ou seja, é o valor mais comum. A moda pode não existir e, mesmo que exista pode não ser única.
Ex1: O conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 13 tem moda 9.
Ex2: O conjunto 3, 5, 8, 10, 12, 15, 17 não tem moda.
Ex3: O conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tem duas modas 4 e 7.
Uma distribuição que não tem moda é denominada amodal.
Uma distribuição que tem apenas uma moda é denominada unimodal.
- Mediana
A mediana de um conjunto de números, organizados em ordem de grandeza (isto é, em um rol) , é o valor central ou a média aritmética dos dois valores centrais.
* Quando o tamanho da amostra é ímpar, a mediana será o elemento de ordem .
Ex1: O conjunto dos números 3, 4, 5, 6, 7, 8, 8 tem mediana 6.
Pois é o elemento que ocupa a 4ª posição, basta ver que n = 7, então , ou seja, 4ª posição.
* Quando o tamanho da amostra é par, a mediana será a média dos elementos de ordens e .
Ex2: O conjunto dos números 5, 5, 7, 9, 11, 12, 15, 18 tem mediana .
Pois é a média dos elementos que ocupam a 4ª e 5ª posição, basta ver que n = 8, então = e = , ou seja 4ª e 5ª posições.
Geometricamente, a mediana é o valor de X (abscissa) correspondente à vertical que divide o histograma em duas partes de áreas iguais. Esse valor de x, é às vezes, representado por .
3.3.2. Dados agrupados em classes
- Média Aritmética 
Se estivermos trabalhando com uma distribuição de frequências com intervalos de classes, para calcularmos a média aritmética dessa distribuição, utilizaremos a seguinte fórmula:
 
- Moda
Se estivermos trabalhando com uma distribuição de frequências com intervalos de classes, para calcularmos a moda dessa distribuição, utilizaremos a seguinte fórmula:
 
Onde: - limite inferior da classe modal
 - frequência da classe modal menos frequência da classe anterior
 - frequência da classe modal menos frequência da classe posterior
 - amplitude da classe modal
Obs: Classe Modal – classe com maior frequência. 
- Mediana 
Se estivermos trabalhando com uma distribuição de frequências com intervalos de classes, para calcularmos a mediana dessa distribuição, utilizaremos a seguinte fórmula:
 
Onde: - limite inferior da classe mediana
 - frequência acumulada na classe anterior à classe mediana
 - amplitude da classe mediana
 - frequência da classe mediana
Obs: Classe Mediana – classe que contém o elemento =, chamado Elemento Mediano.
Capítulo IV - Medidas de Dispersão
Servem para verificarmos a representatividade das medidas de posição, pois é muito comum encontrarmos séries que, apesar de terem mesma média, são compostas de maneira distinta.
Assim para as séries:
a) 20, 20, 20, 20, 20
b) 15, 10, 20, 25, 30
temos .
Note que os valores da série “a” se concentram totalmente na média 20, enquanto que os valores da série “b” se dispersam em torno domesmo valor. Ou seja, a série “a” não apresenta dispersão entre os valores e os valores da série “b” estão dispersos em torno de 20. Vamos agora medir o grau de concentração ou dispersão dos dados em torno da média. 
- Desvio Médio e Variância
Desvio Médio – Neste caso considera-se o módulo de cada desvio , evitando com isso que . Assim o Desvio Médio é dado por:
Trata-se da média aritmética dos desvios considerados em módulos.
Variância – Neste caso considera-se o quadrado de cada desvio , evitando com isso que . Assim, a definição da variância é dada por:
Obs: indica variância e lê-se sigma ao quadrado e é a média da população.
Para o caso do cálculo da variância de valores amostrais é conveniente usarmos a seguinte fórmula:
Como podemos notar, as diferenças entre as fórmulas são: para o caso da variância populacional , utiliza-se a média populacional tendo como denominador o tamanho da população N. Para o cálculo da variância amostral , utiliza-se a média amostral tendo no denominador o tamanho da amostra menos um. 
Temos também outras fórmulas para o cálculo da variância:
- Desvio Padrão
O Desvio Padrão de um conjunto de dados é uma medida que nos fornece a variação dos valores em relação à média aritmética.
Para o cálculo do Desvio Padrão deve-se primeiramente determinar o valor da variância e, em seguida extrair a raiz quadrada desse resultado.
 é o desvio padrão populacional
 é o desvio padrão amostral
- Coeficiente de Variação
Trata-se de uma medida relativa de dispersão, útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. É dado por:
C.V = ou 
Obs: Geralmente multiplica-se a coeficiente de variação por 100, para darmos o resultado em porcentagem.
Para classificarmos uma distribuição em relação à sua variabilidade, usaremos o seguinte critério:
Baixa dispersão: CV 15%
Média dispersão: 15% < CV < 30%
Alta dispersão: CV 30%
Exercícios:
Dada a distribuição de frequência:
	Classes
	Fi
	 100 |----- 150
 150 |----- 200
 200 |----- 250
 250 |----- 300
 300 |----- 350 
	5
24
26
15
10
	Total (n)
	80
 De acordo com a amostra. Pede-se:
a) calcular a média (225,62)
b) calcular a mediana (205,08)
c) calcular o desvio médio (43,36)
d) determinar a variância e o desvio-padrão (S2=3.132,52 e S=55,97) 
e) o coeficiente de variação e sua classificação (24,81%)
2) Na série abaixo que representa o peso de um grupo de 440 pessoas, determinar:
	Classes
	Fi
	Fac
	60 |--- 66
66 |--- 72
72 |--- 78
78 |--- 84
 84 |---|90
	120
180
80
40
20
	120
300
380
420
440
	
 
	440
	
Média, Mediana e Moda (70,36 e 69,33 e 68,25)
A variância e o Desvio Padrão Amostral 
(S2=42,418733 e S=6,51)
O coeficiente de variação e sua classificação (9,3%)
3) Uma pesquisa realizada em uma certa comunidade, com relação a uma amostra de 500 pessoas revelou a seguinte série com relação a idade da população:
	Classes
	Fi
	Fac
	0 |--- 12
12 |--- 24
24 |--- 36
36 |--- 48
 48 |---|60
	60
140
180
80
40
	60
200
380
460
500
	
 
	500
	
Determine:
A idade média (27,6)
A idade mediana (27,33)
O Desvio Médio e sua interpretação (10,56)
O Desvio Padrão e sua interpretação (13,16)
O Coeficiente de Variação e classifique o grau de dispersão. (47,67%)
4) Dada a Distribuição abaixo:
 Tempo de auditoria de uma empresa
	Tempo de auditoria
(em Min)
	NºBalanços
Fi
	10 |-----20
20 |----- 30
30 |----- 40
40 |----- 50
50 |-----|60
	5
3
12
10
20
	Total (n)
	50
Determine:
O tempo médio dos balanços
A Mediana
O desvio médio e sua interpretação
O desvio padrão e sua interpretação
O coeficiente de variação e sua classificação
5) Uma pesquisa sobre a renda anual familiar realizada com uma amostra de 1000 pessoas na cidade de Tangará resultou na seguinte distribuição de frequência. 
	Salário Anual
(Em R$1000)
	Fi
	0,00 |---- 10,00
10,00 |---- 20,00
20,00 |---- 30,00
30,00 |---- 40,00
40,00 |---- 50,00
50,00 |---- 60,00
60,00 |---- 70,00
70,00 |---- 80,00
	250
300
200
120
60
40
20
10
	 Total
	1000
Determine:
O tempo médio dos balanços
A Mediana
O desvio padrão e sua interpretação
O coeficiente de variação e sua classificação
Capítulo VI – Correlação e Regressão Linear
6.1. Análise de Regressão Linear e de Correlação
Esta parte da Estatística, lida com uma amostra (parte de uma população) de dados emparelhados, o objetivo principal da análise de regressão é predizer o valor de uma variável (a variável dependente), dado que seja conhecido o valor de uma variável associada (variável independente). A equação de regressão é a fórmula algébrica pela qual se determina o valor previsto da variável dependente.
	
6.2. Equação de Regressão Linear para dados de uma amostra:
 
 é o valor estimado da variável dependente, dado um valor específico da variável independente X
a é o ponto de interseção da linha de regressão linear com o eixo Y (X = 0)
b é a declividade (inclinação) da linha de regressão
6.3. Método dos Mínimos Quadrados para ajustar uma linha de regressão:
Pelo critério dos mínimos quadrados, a linha (e a equação) de regressão que melhor ajusta é aquela que é mínima a soma dos quadrados dos desvios entre os valores observados e estimados da variável dependente.
As fórmulas de cálculo pelas quais os valores de a e b da equação linear podem ser determinados, de tal forma que satisfaça o critério dos mínimos quadrados é:
 
 
 
onde:
é a média aritmética dos valores da variável X, isto é, ;
é a média aritmética dos valores da variável Y, isto é, .
Uma vez formulada a equação de regressão, podemos utilizá-la para estimar o valor da variável dependente Y dado um valor da variável independente X . Contudo, tal estimação deve ser feita apenas dentro do intervalo de variações dos valores amostrais.
6.4. Coeficiente de Correlação Linear de Pearson:
O coeficiente de correlação linear de Pearson (r), mede o grau de relacionamento linear entre os valores de duas variáveis em uma amostra.
Para calcularmos o coeficiente de correlação de Pearson, entre duas variáveis (X e Y), usaremos a fórmula abaixo:
Obs.: 
Devemos arredondar o coeficiente de correlação linear (r) para três casas decimais
O valor de r poderá variar de -1 a 1, isto é, -1 r 1.
Se r = 0,10 até 0,30 (correlação fraca); 
Se r = 0,40 até 0,6 (correlação moderada); 
Se r = 0,70 até 1 (correlação forte). 
Se r 0, diremos que a correlação linear é positiva.
Se r 0, diremos que a correlação linear é negativa.
Se r = 0, diremos que não existe correlação linear entre as variáveis.
6.5. Diagrama de Dispersão:
É um gráfico no qual cada ponto plotado representa um par observado de valores para as variáveis dependente e independente.
Variável independente – X
Variável dependente – Y
A forma da relação representada pelo diagrama de dispersão pode ser curvilínea em lugar de linear, o que não trataremos aqui.
Exemplos:
 
Uma linha de regressão com uma inclinação positiva, indica uma relação direta entre as variáveis;
Uma linha de regressão com uma inclinação negativa, indica uma relação inversa entre as variáveis; e
Uma inclinação nula indica que a s variáveis não estão relacionadas.
Além disso, a extensão da dispersão dos pontos com relação à linha de regressão indica o grau de relacionamento entre as variáveis.
6.6. Erro Padrão de Estimação e intervalos de predição
	O erro padrão de estimação é uma medida das diferenças (ou distâncias) entre os valores amostrais Y observados e os valores preditos obtidos através da reta de regressão. Este erro será calculadoatravés da seguinte fórmula:
 
 
Para fins de cálculos, é mais conveniente uma versão alternativa da fórmula que não requer a determinação do desvio entre casa valor observado de Y e o valor sobre a linha de regressão , é ela:
 
O erro padrão de estimação, pode ser usado para estabelecer um intervalo de predição para a variável dependente, dado um valor específico da variável independente:
 Intervalo de predição para a variável dependente Y . Os graus de liberdade para a distribuição t são n-2 .
Quando , podemos utilizar a distribuição normal:
 
Exercícios:
1) Um analista toma uma amostra aleatória de 10 carregamentos recentes por caminhão feitos por uma companhia e anota a distância em quilômetros e o tempo de entrega ao meio-dia mais próximo:
	
Carregamento amostrado
	
1
	
2
	
3
	
4
	
5
	
6
	
7
	
8
	
9
	
10
	Distância X, em km
Tempo de Entrega Y, em dias
	825
3,5
	215
1,0
	1070
4,0
	550
2,0
	480
1,0
	920
3,0
	1350
4,5
	325
1,5
	670
3,0
	1215
5,0
Construir o diagrama de Dispersão
Determinar a Equação de regressão de mínimos quadrados 
Usando a equação de regressão desenvolvida acima, estimar o tempo de entrega para um carregamento para 1.000 Km.
 Resp: = 3,72 dias
Esta equação de regressão poderia ser usada para estimar o tempo de entrega para um carregamento de 2.500 Km?
Calcular o erro padrão de estimação para o problema de análise do tempo de entrega.
 Resp:= 0,42
Calcular o Coeficiente de Correlação
Construir um intervalo estimado de predição de 95% para o tempo de entrega, envolvendo um carregamento para 1.000 Km, sem considerar a incerteza associada com a própria posição da linha de regressão.
 Resp: = 3,72 (2,306).(0,42) = 3,72 0,96 = 2,76 a 4,68 dias 
2) A tabela abaixo apresenta dados de uma amostra referentes ao número de horas de estudo fora de classe para determinados alunos de um curso de Estatística de 3 semanas, bem como suas notas obtidas em uma prova no final do curso:
	Estudante Amostrado
	1
	2
	3
	4
	5
	6
	7
	8
	Horas de estudo, X
	20
	16
	34
	23
	27
	32
	18
	22
	Nota na prova, Y
	64
	61
	84
	70
	88
	92
	72
	77
Construir o diagrama de Dispersão
Determinar a Equação de regressão de mínimos quadrados 
 Resp:
Usando a equação de regressão desenvolvida acima, estimar a nota na prova de um aluno que estudou 30 horas fora da classe
 Resp:= 85
Esta equação de regressão poderia ser usada para estimar a nota de um aluno que estudo 40 horas fora de classe? Porquê?
Calcular o erro padrão de estimação.
Construir um intervalo estimado de predição de 90% para a nota na prova, dado que o aluno estudou 30 horas fora da classe.
Capítulo VII – Probabilidade
7.1. Exemplos de Experimentos Não-Determinísticos (aleatórios)
Experimentos Aleatórios (E) são aquelas que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis.
 Jogue um dado e observe o número mostrado na face de cima.
Jogue uma moeda quatro vezes e observe o número de caras obtido.
Jogue uma moeda quatro vezes e observe a sequência de caras e coroas.
Em uma linha de produção, fabrique peças em série e conte o número de peças defeituosas produzidas em um período de 24 horas.
7.2. O Espaço Amostral
Definição: Para cada experimento do tipo que estamos considerando, definiremos o espaço amostral como o conjunto de todos os resultados possíveis de E. Geralmente representamos esse conjunto por S.
Vamos considerar cada um dos experimentos acima e descrever um espaço amostral para cada um deles. O espaço amostral se refere ao experimento .
	
	
	
	, onde N é o número máximo que pode ser produzido em 24 horas.
A fim de descrever um espaço amostral associado a um experimento, devemos ter uma ideia bastante clara daquilo que estamos mensurando ou observando. Por isso, devemos falar de “um’ espaço amostral associado a um experimento e não de “o” espaço amostral.
7.3. Eventos
Outra noção fundamental é o com eito de evento. Um evento A (relativo a um particular espaço amostral S, associado a um experimento E) é simplesmente um conjunto de resultados possíveis. Na terminologia de conjuntos, um evento é um subconjunto de um espaço amostral. Qualquer resultado individual pode ser considerado como um evento.
.
; isto é duas caras ocorrem.
; isto é, mais caras do que coroas ocorrem.
; isto é, todas as peças são perfeitas.
Definição: Dois eventos A e B são denominados mutuamente excludentes, se eles não puderem ocorrer juntos. Escrevemos isso como , isto é, a interseção de A e B é o conjunto vazio.
7.4. Noções Fundamentais de Probabilidade
Definição: Seja E um experimento. Seja S um espaço amostral associado a E. A cada evento A associaremos um número real representado por P(A) e denominado probabilidade de A, que satisfaça as seguintes propriedades:
	(1) .
	(2) P(S) = 1.
	(3) Se A e B forem eventos mutuamente excludentes, 
	(4) Se ,.... forem dois a dois eventos mutuamente excludentes, então,
 
Teorema 1: Se for o conjunto vazio, então .
Teorema 2: Se o evento complementar de A, então .
Teorema 3: Se A e B forem dois eventos quaisquer, então 
 .
Teorema 4: Se A, B e C forem três eventos quaisquer, então .
Teorema 5: Se .
7.5. Probabilidade de um evento ocorrer:
O método de avaliar P(A) é frequentemente enunciado da seguinte maneira: .
7.6. Probabilidade Condicionada
Vamos examinar agora a diferença entre extrair peças de um lote ao acaso, com ou sem reposição.2 bolas
A = {1ª bola extraída é B}
B = {2ª bola extraída é B}
7 V
3 B
C/ reposição S/ reposição 
 
Definição: Sejam A e B dois eventos associados a um experimento. Denotaremos P(A/B) a probabilidade condicionada do evento B dado que o evento A ocorreu, e definimos como:
Teorema da Multiplicação
Ex1: Suponha que o escritório possua 100 máquinas de calcular. Algumas dessas máquinas são elétricas (E), enquanto outras manuais (M); e algumas são novas (N) e outras usadas (U). A tabela abaixo dá o número de máquina de cada categoria. Uma pessoa entra no escritório, pega uma máquina ao acaso, e descobre que é nova. Qual será a probabilidade de que seja elétrica?
P(E/N) = ?
	
	E
	M
	
	N
	40
	30
	70
	U
	20
	10
	30
	 
	60
	40
	100
Partição
Definição: Dizemos que os eventos representam uma partição do espaço amostral S quando: 
a) B1
B2
B3
B4
b) 
c) 
Por exemplo: Na jogada de um dado:
 
Representam uma partição. Como os são eventos mutuamente excludentes, podemos escrever:
Assim;
Teorema da Probabilidade Total
Ex2: Consideremos o lote de 20 peças defeituosas e 80 não defeituosas, do qual extrairemos duas peças sem reposição. Sejam A e B os eventos:
A = {a primeira peça extraída é defeituosa}
B = {a segunda peça extraída é defeituosa}
Podemos agora calcular P(B), assim:
Ex3: Uma determinada peça é manufaturada por três fábricas, digamos 1, 2 e 3. Sabe-se que 1 produz o dobro de peças que 2, e 2 e 3 produzem o mesmo número de peças. Sabe-se também que 2% das peças produzidas por 1 e 2 são defeituosas, enquanto 4% daquelas produzidas por 3 são defeituosas. Todas as peças produzidassão colocadas em um depósito, e depois uma peça é extraída ao caso. Qual é a probabilidade de que essa peça seja defeituosa?
Vamos introduzir os seguintes eventos:
D = {a peça é defeituosa}
= {a peça provém de 1}
= {a peça provém de 2}
 = {a peça provém de 3}	
Pede-se P(D), então podemos escrever:
P(D) =0,025
Suponha agora que a peça retirada é defeituosa. Calcular a probabilidade dela ter sido manufaturada pela fábrica 1?
 ?
7.7.Teorema de Bayes
Seja uma partição do espaço amostral S e seja A um evento associado a S. Aplicando a definição de probabilidade condicionada, podemos escrever:
Este resultado é conhecido como Teorema de Bayes.
Assim voltando ao problema anterior:
Exercício: Dadas 5 caixas , contendo bolas brancas e bolas pretas. Temos duas caixas do tipo I, duas caixas do tipo II e uma caixa do tipo III; a caixa do tipo I possui 2 bolas brancas e 4 bolas pretas, a caixa do tipo II possui 3 bolas brancas e 3 bolas pretas e a caixa do tipo III só possui bolas brancas. Se retirarmos ao acaso uma bola branca, qual a probabilidade dessa bola ter vindo da caixa III?
 37,5%
7.8. Eventos Independentes 
Dois eventos A e B são eventos independentes quando estão inteiramente não relacionados. Saber que B ocorreu não fornece qualquer informação sobre a ocorrência de A. 
Assim a probabilidade absoluta (ou não condicionada) P(A) é igual à probabilidade condicionada P(A/B).
Daí poderíamos dizer que A e B serão independentes se, e somente se, P(A/B) = P(A) e 
P(B/A) = P(B).
Assim:
Logo:
Definição: A e B serão eventos independentes se, e somente se, 
.
Exercícios
1) Um montagem eletrônica é formada de dois subsistemas A e B. 
De procedimentos e ensaios anteriores, as seguintes probabilidades se admitem conhecidas:
P(A falhe) = 0,20 P(A e B falhem) = 0,15 P(B falhe sozinho) = 0,15
Calcule as probabilidades:
P(A falhe/ B tenha falhado)
P(A falhe sozinho)
2) Sejam A e B dois eventos associados a um experimento. Suponha que P(A) = 0,4 P(B) = p e P(AB) = 0,7 :
Para que valores de p, A e B serão mutuamente excludentes?
Para que valores de p, A e B serão independentes?
3) Um grupo de 50 elementos apresenta a seguinte composição:
	
	Homens
	Mulheres
	Menores
	 15
	 5
	Adultos
	 18
	 12
Um elemento é escolhido ao acaso. Pergunta-se:
Sabendo-se que o elemento escolhido é adulto, qual a probabilidade de ser homem?
Dada que a escolhida é mulher, qual é a probabilidade de ser menor?
c) Qual a probabilidade de ser menor e mulher? 
 a) 60% b) 29% c) 10% 
4) Um lote é formado de 25 artigos bons, 10 com defeitos menores e 5 com defeitos graves. Um artigo é escolhido ao acaso. Ache a probabilidade de que:
ele não tenha defeitos? 62,5%
ele não tenha defeitos graves? 87,5%
ele ou seja perfeito ou tenha defeitos graves? 75%
5) Três jornais, A, B e C são publicados em uma cidade e uma recente pesquisa entre os leitores indica o seguinte:
 20% lêem A
 26% lêem B
 14% lêem C
 8% lêem A e B
 5% lêem A e C
 4% lêem B e C
 2% lêem A,B e C
Para um adulto escolhido ao acaso, calcule a probabilidade de que:
ele não leia qualquer dos jornais? 55%
ele leia exatamente um dos jornais? 32%
ele leia somente o jornal A ? 9%
ele leia pelo menos dois jornais? 13%
ele leia apenas dois jornais? 11%
f) ele leia pelo menos um jornal? 45%
 
6) Uma Faculdade tem 1000 alunos. Desses, 200 estudam Matemática, 180 estudam Física, 150 estudam Química, 20 estudam Matemática, Física e Química, 50 estudam Física e Química, 70 estudam somente Química, 50 estudam Matemática e Química, 60 estudam Matemática e Física. Um aluno dessa Faculdade foi escolhido ao acaso. Qual a probabilidade dele estudar só Matemática?
7) Uma pesquisa de mercado sobre o consumo de três marcas A, B e C de um determinado produto apresentou os seguintes resultados:
	A
	B
	C
	A e B
	A e C
	B e C
	nenhum
	48%
	45%
	50%
	18%
	15%
	25%
	5%
Para um entrevistado escolhido ao acaso
Qual é a probabilidade dele consumir as três marcas?
Qual é a probabilidade dele consumir apenas uma das três marcas?
Qual é a probabilidade dele consumir pelo menos duas das três marcas?
8) Em uma fábrica de parafusos, as máquinas A, B e C produzem 35%, 40% e 25% do total produzido, respectivamente. Da produção de cada máquina, 6%, 5% e 3%, respectivamente, são parafusos defeituosos. Escolhe-se ao acaso um parafuso e verifica-se ser defeituoso. Qual será a probabilidade de que o parafuso venha da máquina A? Da B? Da C?
 P(A/D) = 43,3% P(B/D) = 41,2% P(C/D) = 15,5%
9) Dada 6 caixas todas contendo bolas brancas e bolas pretas, temos 2 caixas do tipo I, 3 caixas do tipo II e 1 caixa do tipo III. A caixa I possui 2 bolas brancas e 4 bolas pretas, a caixa II possui 3 bolas brancas e 3 bolas pretas e a caixa III só possui bolas brancas. Se extrairmos uma bola ao acaso e verificamos que ela é preta. Qual a probabilidade dessa bola ter vindo da caixa II? 53%
10) Suponha que você tenha duas moedas em seu bolso, sabe-se que uma é honesta e a outra apresenta duas cara. Extraindo ao acaso uma moeda e jogando-a obtém-se cara. Qual a probabilidade da moeda ser honesta? 33,33%
 
11) Em um certo colégio, 5% dos homens e 2% das mulheres têm mais do que 1,80m de altura. Por outro lado, 60% dos estudantes são homens. Se um estudante é selecionado aleatoriamente e tem mais de 1,80m de altura, qual a probabilidade de que o estudante seja mulher? 21,05%
12) Suponha que 70% das pessoas com olhos castanhos, 20% das pessoas com olhos verdes e 5% das pessoas com olhos azuis tenham todas cabelos castanhos. Suponha ainda que 75% das pessoas tenham olhos castanhos, 5% tenham olhos azuis e 20% tenham olhos verdes. Qual é a probabilidade de uma pessoa de cabelos castanhos, escolhida ao acaso, ter olhos verdes?
13) Um aluno responde a um exame de múltipla escolha no qual cada questão tem quatro alternativas das quais uma resposta é correta. A probabilidade de que ele saiba a resposta correta é de 60%. Caso contrário, ele seleciona ao caso uma resposta entre as quatro possíveis. Se o aluno seleciona a resposta correta para uma questão, qual é a probabilidade de que ele realmente saiba a resposta correta? 86%
14) Uma empresa que fabrica câmeras de vídeo produz um modelo básico e um modelo de luxo. No ano passado, 40% das câmeras vendidas foram do modelo básico. Dos clientes que compraram o modelo básico, 30% compraram com garantia estendida e 50% dos compradores do modelo luxo compraram com a garantia estendida. Se você souber que um cliente selecionado aleatoriamente possui uma garantia estendida, qual a probabilidade de ele ter o modelo básico?
15) Uma clínica especializada trata de 3 tipos de moléstias; X, Y e Z. 50% dos que procuram a clínica são portadores de X, 40% são portadores de Y e 10% de Z. As probabilidades decura, nesta clínica, são:
moléstia X: 80%
moléstia Y: 90%
moléstia Z: 95%
a) Qual é a probabilidade de um doente sair curado dessa clínica? 85,5%
b) Um doente saiu curado desta clínica. Qual a probabilidade de que ele tenha sofrido a moléstia Y? 42%
16) Um investidor examina a possibilidade de comprar determinada ação de uma companhia. Ele considera três possíveis cenários: A performance esperada dessa ação com relação ao mercado poderá ser boa (B), regular (R) ou fraca (F), com probabilidades que dependem do cenário, a seguir:
.
Calcule a probabilidade de que a performance da ação seja boa. 37,5%
Se a performance esperada foi regular, qual a probabilidade de ter tido um cenário pessimista?
 
17) A probabilidade de um indivíduo de classe A comprar um carro é 60%, de classe B é 20% e de classe C é 15%, e das outras classes 5%. A probabilidade do indivíduo de classe A comprar um carro da marca D é 70%; de B comprar um carro da marca D é 60% e de C é 30%, e das outras classes 5%. 
a) Qual a probabilidade de um carro da marca D ser vendido?
b) Em certa loja comprou-se um carro da marca D. Qual a probabilidade de que o indivíduo da classe B o tenha comprado? 
18) Os analistas de acidentes de trânsito afirmam que a probabilidade de um motorista provocar um acidente vale 3/4 se ingerir alguma bebida alcoólica e 1/4, caso contrário. É sabido que no RJ (durante os fins de semana) 60% dos motoristas se servem de bebidas alcoólicas. Com essas informações:
a) Qual a probabilidade de um motorista do RJ não sofrer acidente no fim de semana? 45%
b) E sabendo que houve um acidente grave no RJ no sábado à noite, qual a probabilidade do motorista ter ingerido bebida alcoólica? 81,81%
19) Wallace, ao volante de seu conversível, encontra-se em uma encruzilhada numa zona rural. Ele sabe que uma dessas estradas leva à cidade mais próxima, para onde ele deseja ir, e que a outra leva até uma fazenda vizinha, porém não sabe qual é a correta a seguir. Na encruzilhada ele encontra quatro camponeses A, B, C e D que conhecem bem a estrada, e decide dirigir-se ao acaso a um deles para perguntar qual estrada deve seguir. O que ele não sabe é que, enquanto A fala sempre a verdade, B fala a verdade só 70% das vezes, C 50% das vezes e D sempre mente.
Determine a probabilidade de Wallace ser enviado ao caminho certo. 55%
Se ele descobrir que foi enviado ao caminho errado, qual a probabilidade de que o camponês B tenha sido o que lhe deu a informação?
Mesma pergunta para o camponês C e D.
Capítulo VIII – Distribuições de Probabilidade
Variável Discreta:
Distribuição Binomial
Trata-se de uma distribuição de probabilidades adequada aos experimentos que apresentam apenas dois resultados: sucesso ou fracasso. 
Um experimento binomial é uma experiência probabilística que precisa preencher os seguintes requisitos: 
a. O experimento é repetido n vezes, sendo cada repetição independente da outra; 
b. Há somente dois resultados possíveis: sucesso (s) ou fracasso (f); 
c. A probabilidade de sucesso P(s) e de fracasso P(f) é a mesma em cada tentativa. 
Notação utilizada: 
n – número de vezes em que o experimento é repetido 
p – P(s) – probabilidade de sucesso em cada repetição 
q – P(f) – probabilidade de fracasso em cada repetição 
x – variável aleatória que representa o número de sucesso em n tentativas 
p + q = 1 ⇒ q = 1 – p 
Probabilidade Binomial
OBS: Combinação: 
O nome binomial é porque essa fórmula nada mais é que o termo de grau x em p no desenvolvimento do Binômio de Newton (q + p)n.
Exemplos: 
1. Calcule a probabilidade de se obter duas faces 4 em três lançamentos de um dado. 
Solução: n = 3 x = 2 p = q = 
2. Um exame é constituído de 20 questões, cada uma delas com cinco respostas alternativas, das quais apenas uma é correta. Se um estudante responde as questões ao acaso, qual é a probabilidade que consiga acertar 10 questões? 
Solução: n = 20 x = 10 p = q = 
3. Uma empresa produz 10% de peças defeituosas. As peças são embaladas em caixas que contém 12 peças. Calcule a probabilidade de um cliente comprar uma caixa contendo: 
a) nenhuma peça defeituosa; 
b) Uma peça defeituosa. 
Solução: n = 12 P(D) = p = 0,1 P(ND) = q = 0,9
x = 0
x =1
4. Um levantamento efetuado na carteira de uma agência bancária indicou que 20% dos títulos eram pagos com atraso. Se em determinado dia foram pagos 20 títulos da carteira, determine a probabilidade que: 
a) No máximo dois sejam pagos com atraso; 
b) No mínimo três sejam pagos com atraso;
c) No mínimo três sejam pagos sem atraso; 
d) Mais de 70% sejam pagos sem atraso. 
Solução: 
n = 20 P(CA) = p = 0,2 P(SA) = q = 0,8
x 2
n = 20 P(CA) = p = 0,2 P(SA) = q = 0,8
x 3
 
n = 20 P(SA) = p = 0,8 P(CA) = q = 0,2
70% de 20 = 14, logo 
Média Aritmética, Valor Esperado ou Esperança
𝜇(𝑥) = 𝑛.𝑝
Variância
𝜎2(𝑥) = 𝑛.𝑝.𝑞
Desvio Padrão
𝜎(𝑥) = 
Exemplo: Uma moeda não viciada é lançada 8 vezes. Encontre a probabilidade de:
Dar 5 caras
Pelo menos uma cara
No máximo duas caras
Solução: n = 8 p = 0,5 q = 0,5
x = 5
x 1
x 2
Média Aritmética, Valor Esperado ou Esperança
𝜇(𝑥) = 𝑛.𝑝 = 8 . 0,5 = 4
Variância
𝜎2(𝑥) = 𝑛.𝑝.𝑞 = 8 . 0,5 . 0,5 = 2
Desvio Padrão
𝜎(𝑥) = = 
Variável Contínua:
Distribuição Normal
É a mais importante distribuição de probabilidade, sendo aplicada em inúmeros fenômenos. É também conhecida como distribuição de Gauss, Laplace ou Laplace-Gauss.
Seja uma variável aleatória contínua, X tem distribuição Normal se:
Função de densidade Normal de Probabilidade
Onde:
 é a média
é o desvio padrão
= 3,14159
= 2,71828
Características da Distribuição Normal
O que diferenciam as famílias de distribuições normais de probabilidade são as médias μ e os desvios-padrões . 
O ponto mais alto da curva normal é a média, que coincide com a mediana e com a moda.
A média da distribuição pode ser negativa, positiva ou nula. 
A distribuição normal de probabilidade é simétrica em relação a média. 
A largura da curva é determinada pelo desvio-padrão. Quanto maior o desvio-padrão, mais achatada é a curva.
A área total sob a curva de distribuição normal de probabilidades é 1. 
Os valores de uma variável aleatória normal têm a seguinte distribuição em torno da média: 
- 68,26% encontra-se dentro de um intervalo de um desvio padrão negativo e um desvio padrão positivo; 
- 95,44% encontra-se dentro de um intervalo de dois desvios padrões negativos e dois desvios padrões positivos; 
- 99,72% encontra-se dentro de um intervalo de três desvios padrões negativos e três desvios padrões positivos. 
Distribuição Normal Padrão ou Reduzida
Denomina-se Distribuição Normal Padrão, a distribuição Normal de média 
() igual a zero e desvio padrão () igual a 1.
As probabilidades associadas à distribuição normal padrão são facilmente obtidas em tabelas. Daí o interesse em estudar esse tipo particular de distribuição. 
Para se passar da Distribuição Normal para a Distribuição Normal Padrão, faz-se a mudança de variável:
Assim, sua função densidade será: 
 onde 
Notação: N(0, 1)
Tabela da Distribuição Normal
Para facilitar o cálculo de probabilidades, utiliza-se a tabela de distribuição normal de probabilidades.
A tabela dá a área bob a curva normal padrão entre z = 0 e qualquer valor positivo de z.
A tabela nos oferece a área entre 0 e ou 
A tabela é usada da seguinte maneira: 
a) Na coluna da esquerda entra-se com o valor de z até décimos, percorrendo a linha;b) Na linha superior entra-se com a aproximação centesimal, percorrendo a coluna; 
c) No encontro da linha dos décimos com a coluna dos centésimos obtém-se a probabilidade da variável z ocorrer; 
Vamos considerar os seguintes exemplos:
a) A área total sob a curva normal vale 1. Isto significa que a probabilidade de ocorrer qualquer valor real é 1. A curva é simétrica em torno da média zero. Então a probabilidade de ocorrer valor maior do que zero é 0,5. Mas qual seria a probabilidade de ocorrer valor entre zero e z = 1,25, por exemplo? 
Essa probabilidade é encontrada na tabela de distribuição normal. Na primeira coluna da tabela está o valor 1,2. Na primeira linha da tabela está o valor 5. O número 1,2 compõe, com o algarismo 5, o número z = 1,25. No cruzamento da linha 1,2 com a coluna 5 está o número 0,3944 = 39,44%. Esta é probabilidade de ocorrer valor entre zero e z = 1,25.
b) Qual é a probabilidade de ocorrer valor maior do que z = 1,25? 
Como a probabilidade de ocorrer valor maior do que zero é 0,5 e a probabilidade de ocorrer valor entre zero e z = 1,25 é 0,3944 a probabilidade pedida é: 0,5 – 0,3944 = 0,1056 ou 10,56%
c) Qual é a probabilidade de ocorrer valor menor do que z = – 0,5? 
Se construirmos a figura de uma distribuição normal para responder a essa pergunta, podemos verificar que a área entre zero e z = – 0,5, é igual à área entre zero e z = 0,5. Mas quanto vale essa área? Se procurarmos na primeira coluna da tabela de distribuição normal padrão, o valor 0,5 e, na primeira linha, o valor zero, para compor o número z = 0,50. No cruzamento entre a linha e a coluna está o valor 0,1915 = 19,15%, que é a probabilidade de ocorrer valor entre zero e z = 0,50.
A probabilidade de ocorrer valor menor do que z = – 0,50 é igual à probabilidade de ocorrer valor maior do que z = 0,50. Como a probabilidade de ocorrer valor maior do que a média zero é 0,5, a probabilidade pedida é dada por: 
 0,5 – 0,1915 = 0,3085 ou 30,85%
Distribuição Normal Reduzida 
z 0 0 1 2 3 4 5 6 7 8 9 
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
 
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 
0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852 
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
 
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 
1,8 0,4641 0,4648 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4818 0,4817 
2,5 0,4936 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
Exemplos:
Calcule a probabilidade do valor da variável aleatória contínua z estar entre 0 e 1.
Calcule a probabilidade do valor da variável aleatória contínua z estar entre –1 e 1 
Calcule a probabilidade do valor da variável aleatória contínua z ser maior que – 0,5
Calcule a probabilidade do valor da variável aleatória contínua z estar entre 1 e 1,58.
Determine o valor de z para que a probabilidade de se obter um valor maior que z seja 0,10.
0,10 é a área externa. A área total é 0,5, logo a área entre 0 e z é 0,5 – 0,1 = 0,4
Procuramos agora, no corpo da tabela o valor mais próximo de 0,4
O valor encontrado é 0,3997. Seguindo a linha e a coluna desse valor, encontramos z = 1,28. 
Probabilidades na Distribuição Normal
 
Suponhamos que a quantidade de álcool em 100ml de gasolina comum tem distribuição normal com média 200mg e desvio padrão 20mg. Pode existir interesse em calcular a probabilidade de a gasolina comum apresentar entre 200 e 225 mg de álcool por 100ml. 
Para calcular probabilidades associadas à distribuição normal, usa-se um artifício. Sabe-se que, se X tem distribuição normal com média e desvio padrão , a variável 
tem distribuição normal padrão. Fica então fácil obter as probabilidades associadas a qualquer distribuição normal: basta “reduzir” a distribuição e obter as probabilidades na tabela de distribuição normal padrão. 
Voltando a discussão do exemplo acima, como a quantidade de álcool tem uma distribuição normal com média = 200 e desvio padrão = 20.
Nessa distribuição a média é zero e, ao valor x = 225, corresponde:
Então a probabilidade de X assumir valor entre 200 e 225 é igual à probabilidade de Z assumir valor entre zero e z = 1,25 que é 
(valor obtido através da tabela de distribuição normal) ou 39,44%. 
Vamos considerar outro exemplo. Qual a probabilidade de a gasolina comum apresentar menos do que 190mg de álcool por 100ml de gasolina? 
Para resolver o problema, “é preciso reduzir” o valor x = 190, obtém-se então: 
A probabilidade pedida corresponde à probabilidade de Z assumir valor menor do que z = – 0,5 que é 
Exemplo1: Qual a área sob a curva normal corresponde a 95% da curva?
Z = 95% = 0,95 
0,95 / 2 = 0,475
Procurando na tabela temos 1,96
Isso significa que a probabilidade de se sortear da população de valores de x um valor contido é igual a 95%
Exemplo2: Em uma população de indivíduos normalmente distribuídos a estatura média é 1,70 m e o desvio padrão é 0,08 m. Qual é o intervalo de alturas que compreende 95% da população?
Como vimos 95% = = 
Assim 95% da população tem entre 1,54m e 1,86m de altura.
- Qual a probabilidade de se encontrar um indivíduo com estatura entre 1,60 e 1,82?
Então:
Assim a probabilidade de se encontrar alguém entre 1,60 e 1,82 é de 82,76%. 
- Qual a probabilidade de se encontrar alguém com mais de 1,75m?
Então:

Outros materiais