Buscar

2 Estatistica Inferencia

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 57 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 57 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 57 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1
Estatística
Prof. Antonio Estanislau Sanches
2014 / 1
2
Inferência Estatística
3
Inferência estatística
é o conjunto de metodologia que apoiam na formulação de 
conclusões sobre as características de uma POPULAÇÃO a 
partir de uma parte dessa população, denominada de 
AMOSTRA.
População ou Universo
É a coleção de unidades individuais com uma ou mais 
características comuns, que se pretende estudar
Exemplos
Alunos de uma escola;
Crianças de 0 à 5 anos de um orfanato;
Agregados familiar de uma província;
Carteiras dentro do campus da N Lins;
Automóveis da cidade de Manaus.
4
Introdução à Amostragem
Se uma população for muito grande, para estudá-la demandará muito 
trabalho e geralmente com resultados falhos.
Recorre–se então, a uma AMOSTRA, sendo esta uma PARTE 
representativa da POPULAÇÃO em dimensões reduzidas, porém, com as 
mesmas características.
Exemplo 1. Tendo uma escola 400 alunos, podemos colher uma amostra de 
40 alunos para estudar o comportamento da variável ALTURA, apenas 
nesses alunos.
Exemplo 2. O censo mostra a existência de 15 mil agregados familiares na 
província de Manica. Objetivando analisar a variável “número médio dos 
agregados por família”, podemos estudar o comportamento dessa variável 
em 601 agregados.
5
Uma AMOSTRA tem que ser:
Representativa →conter em proporção tudo o que a população 
possui qualitativa e quantitativamente;
Imparcial →todos os elementos da população tem igual 
oportunidade de fazer parte da amostra;
Uma AMOSTRA é a redução de uma população em dimensões 
menores, porém, sem perda de suas características.
Ao processo de definição da amostra chama-se 
AMOSTRAGEM
6
Amostragem Probabilistica e Não Probabilistica
Métodos Probablisticos (Aleatórios)
Todos os elementos da população tem uma probabilidade
conhecida, diferente de zero, de pertencer à amostra. Desta
forma, a amostragem probabilística implica um sorteio com 
regras bem determinadas.
Métodos Não Probablisticos (Não Aleatórios)
Quando não é possível designar uma probabilidade a 
cada elemento da população, dizemos que a amostragem é não
probabilística.
Amostragens Probabilísticas:
 Aleatória Simples
 Estratificada
 Por Clusters
 Multi-Etapas
7
ERRO AMOSTRAL
Não há dúvida de que uma amostra não representa perfeitamente 
uma população. Ou seja, a utilização de uma amostra implica na 
aceitação de uma margem de erro que se denomina ERRO 
AMOSTRAL.
Erro Amostral é a diferença entre um resultado amostral e o 
verdadeiro resultado populacional; tais erros resultam de 
flutuações amostrais aleatórias.
Não podemos evitar a ocorrência do ERRO AMOSTRAL, porém podemos 
limitar seu valor através da escolha de uma amostra de tamanho adequado.
Obviamente, o ERRO AMOSTRAL e o TAMANHO da AMOSTRA 
seguem sentidos contrários. Quanto maior o tamanho da amostra, menor o 
erro cometido e vice-versa.
8
ERRO AMOSTRAL
Considere uma POPULAÇÃO de média μ e uma AMOSTRA
dessa população, cuja média seja representada por Ẍ;
O ERRO AMOSTRAL, será medido pela diferença entre:
E = Ẍ - μ sendo E = Z*σ/Ѵn
e Z obtido da tabela de distribuição normal ou pela função 
INV.NORMP(α/2), quando α representa o grau de confiança
EXEMPLO: O CREA/AM deseja pesquisar o salário médio dos 
engenheiros de Manaus. Já o CONFEA informa que o desvio padrão do 
salário da categoria em âmbito nacional é de R$ 6.250,00 Entrevistados 600 
engenheiros, obteve-se uma média salarial de R$ 9.600,00 Calcular o erro 
amostral, para uma grau de confiança de 95% sendo a população infinita.
σ = 6250 ; Ẍ = 9600 ; n = 600 ; α = 0,05 e α/2 = 0,025 calcular E = ?
9
ERRO AMOSTRAL - Solução
σ = 6250 ; Ẍ = 9600 ; n = 600 ; α = 0,05 e α/2 = 0,025 calcular E = ?
Z = INV.NORMP.N(0,975) ou Z = 1,96
E = Z*σ/Ѵn  E = (1,96 * 6250) / Ѵ600 E = 500
INTERVALO DE CONFIANÇA:
P[(Ẍ-E)<μ<(Ẍ+E)] ou P[(9.600 – 500) < μ < (9.600 + 500)] ou 
Intervalo de Confiança: P[9.100 < μ < 10.100]
INTERVALO DE CONFIANÇA: Para a média populacional μ
estimada pela média amostral Ẍ é um intervalo de valores, acima e abaixo 
dessa média, dentro do qual se acredita que possa estar a verdadeira média 
populacional μ, com um grau de confiança de tantos pontos percentuais, no 
caso do exemplo: 95%, determinado por Z.
10
DETERMINAÇÃO DO TAMANHO DE UMA AMOSTRA COM BASE NA
ESTIMATIVA DA MÉDIA POPULACIONAL
A determinação do tamanho de uma amostra é problema de grande importância:
Amostras muito grandes acarretam desperdício de tempo e de dinheiro;
Amostras muito pequenas podem levar a resultados não confiáveis.
11
12
13
14
15
Fórmula para cálculo do tamanho da amostra para uma estimativa 
confiável da MÉDIA POPULACIONAL (μ):
Onde:
n → Número de indivíduos na amostra;
Z α/2 → Valor crítico que corresponde ao grau de confiança desejado;
s → Desvio-padrão populacional da variável estudada;
E → Margem de erro ou ERRO MÁXIMO DE ESTIMATIVA. Identifica 
a diferença máxima entre a MÉDIA AMOSTRAL ( Ẍ ) e a 
verdadeira MÉDIA POPULACIONAL (μ)  [Ẍ - μ ];
α → Nível de significância.
16
Os valores de confiança mais utilizados e os valores de Z correspondentes.
Valores críticos associados ao grau de confiança na amostra
17
Exemplo
Um economista deseja estimar a renda média para o primeiro ano de trabalho 
de um bacharel em direito. Quantos valores de renda devem ser tomados, se o 
economista deseja ter 95% de confiança em que a média amostral esteja a 
menos de $500,00 da verdadeira média populacional? Suponha que saibamos, 
por um estudo prévio, que para tais rendas, s = $6.250,00.
Resolução
18
Exemplo
Um economista deseja estimar a renda média para o primeiro ano de trabalho 
de um bacharel em direito. Quantos valores de renda devem ser tomados, se o 
economista deseja ter 95% de confiança em que a média amostral esteja a 
menos de $500,00 da verdadeira média populacional? Suponha que saibamos, 
por um estudo prévio, que para tais rendas, s = $6.250,00.
Resolução
Queremos determinar o tamanho n da amostra, dado que α = 0,05 (95% de 
confiança) Z α/2=1,96.
Desejamos que a média amostral seja a menos de $ 500 da média 
populacional, de forma que E = 500
Supondo S = 6.250 e aplicamos a equação, obtendo:
Com tal amostra teremos 95% de confiança em que a média amostral Ẍ difira em 
menos de R$500,00 da verdadeira média populacional μ.
19
No mesmo problema e utilizando uma margem de erro maior, 
no caso $ 1.000,00 determine o tamanho da amostra: 
Resolução:
Z α/2=1,96
S = 6.250
E = 1.000
N = ?
20
No mesmo problema e utilizando uma margem de erro maior, 
no caso $ 1.000,00 determine o tamanho da amostra: 
Resolução:
Queremos determinar o tamanho n da amostra, dado que α = 0,05 (95% de 
confiança) Z α/2=1,96.
Desejamos que a média amostral seja a menos de $ 500 da média 
populacional, de forma que E = 1.000
Supondo S = 6.250 e aplicamos a equação, obtendo:
N = ((1,96*6250)/1000)2 => N = 150
21
Quando o desvio-padrão “S” for desconhecido, devemos utilizar 
um valor preliminar obtido por : 
1. Utilizar a aproximação S = amplitude/4 ;
2. Realizar um estudo piloto, iniciando o processo de amostragem. Com 
base numa coleção de pelo menos 31 valores amostrais selecionados 
aleatoriamente, calcular o desvio-padrão amostral S e utilizá-lo num 
processo de refinado com a obtenção de mais dados amostrais.
3. Substituir o desvio padrão populacional σ (desconhecido) por um 
múltiplo ou fração desse mesmo desvio padrão. Por exemplo: 
substituindo o E (erro amostral) da fórmula, por 2σ, nesse caso, o fator σ
é automaticamente eliminado.
22
Quandoo desvio-padrão “S” for desconhecido, devemos utilizar 
um valor preliminar obtido por : 
Porém, se não existisse esse trabalho prévio, o que 
normalmente ocorre, poderia se supor o erro amostral como 
20% de σ, ou seja, E = 0,20σ. Nesse caso, quantas entrevistas 
seriam necessárias para essa pesquisa? – (Caso 3)
Para um α = 96% teremos um Z = 2,054 
23
Quando o desvio-padrão “S” for desconhecido, devemos utilizar 
um valor preliminar obtido por : 
A cadeia de lanchonetes Marreco Donaldo, MD, esta interessada em 
conhecer o gasto médio por pessoa, dos clientes de uma cadeia de 
lanchonetes concorrente. Os executivos da MD admitem que a despesa de 
um cliente possa variar entre R$ 3,00 e R$ 15,00. Eles desejam um grau de 
confiança de 98 % e admitem uma margem de erro de R$ 0,25. Pede-se 
calcular o tamanho da amostra para esta pesquisa? – (Caso 1)
Para um α = 98% teremos um Z = 2,33 
24
Quando o desvio-padrão “S” for desconhecido, devemos utilizar 
um valor preliminar obtido por : 
No problema do cálculo do erro amostral da pesquisa dos salários dos 
engenheiros na cidade de Manaus, como estimar a quantidade de entrevistas, 
sabendo que o erro amostral E=500 e grau de confiança 95%? – (Caso 2)
Como não conhecemos o desvio padrão da população, realizamos uma
pesquisa amostral entre 30 engenheiros, escolhidos randomicamente. A 
pesquisa apresentou o resultado da tabela abaixo:
Um α = 95% gera Z = 1,96 
6.592,62
25
Cálculo do tamanho da amostra quando a população for FINITA:
Nesse caso, o ERRO AMOSTRAL (E) deverá sofrer uma correção, ou seja, o 
ERRO deverá ser multiplicado pelo Coeficiente de População Finita = CPF.
Existe, uma condição a ser satisfeita: o numero de amostras colhidas, n, 
deverá ser igual a pelo menos 5 % do tamanho da população N.
O município de Arapiraca deseja fazer uma pesquisa do peso de papéis 
descartados mensalmente pelas residências da cidade, para planejamento da 
coleta de lixo. O peso médio do papel descartado em um mês, por uma 
amostra de 62 residências, foi de 9,4281 kg. e o desvio padrão dessa amostra 
foi de 4,1681 kg. Como a cidade possui 2.637 residências, deseja-se conhecer 
o intervalo de confiança para esta média, com grau de confiança de 95 %.
Um α = 95% gera Z = 1,96 
26
Cálculo do ERRO AMOSTRAL quando a população for FINITA:
INTERVALO DE CONFIANÇA:
P[(Ẍ-E)<μ<(Ẍ+E)] ou P[(9,4281 – 1,025) < μ < (9,4281 + 1,025)] ou 
Intervalo de Confiança: P[8,4031 < μ < 10,4531]
Um α = 95% gera Z = 1,96 
Cálculo do tamanho da amostra quando a população for FINITA:
gera: 
27
Um α = 95% gera Z = 1,96 
Cálculo do tamanho da amostra quando a população for FINITA:
No caso anterior o município de Arapiraca deseja fazer uma pesquisa do peso 
de papéis descartados mensalmente pelas residências da cidade, para 
planejamento da coleta de lixo. O peso médio do papel descartado, por uma 
amostra teste em 31 residências, foi de 9,4281 kg e o desvio padrão dessa 
amostra foi de 4,1681 kg. Como a cidade possui 2.637 residências, deseja-se 
calcular o tamanho da amostra a ser coletada, com grau de confiança de 95 
%.
28
Fórmula para cálculo do tamanho da amostra com base na
estimativa da proporção populacional (p):
29
Exemplo
Um assistente social deseja saber o tamanho da amostra (n) necessário para 
determinar a proporção da população atendida por uma Unidade de Saúde, 
que pertence ao município de Cariacica. Não foi feito um levantamento 
prévio da proporção amostral e, portanto, seu valor é desconhecido. Ela quer 
ter 90% de confiança que o erro máximo de estimativa (E) seja de ±5% (ou 
0,05). Quantas pessoas necessitam ser entrevistadas?.
Resolução
OBS: Quando os valores de “p” e “q” forem desconhecidos, considera-se p = q = 0,5
ou seja, p*q = 0,25
30
Exemplo
Um assistente social deseja saber o tamanho da amostra (n) necessário para 
determinar a proporção da população atendida por uma Unidade de Saúde, 
que pertence ao município de Cariacica. Não foi feito um levantamento 
prévio da proporção amostral e, portanto, seu valor é desconhecido. Ela quer 
ter 90% de confiança em sua pesquisa e um erro máximo de estimativa (E) 
de ±5% (ou 0,05). Quantas pessoas necessitam ser entrevistadas?.
Resolução
Considerando que o valor da proporção amostral de atendimentos para 
pessoas de Cariacica não é conhecida. Utilizamos a equação indicada para 
determinar o tamanho da amostra. Sabemos que, para 90% de confiança 
teremos o valor crítico (Zα/2 ) = 1,645, conforme INV.NORMP.N(0,95) = 1,645.
31
Mas se o Nível de Confiança for de 90% porque utilizar 
0,95 como argumento da função INV.NORMP ?
Resposta: fórmula, podemos obter 
INV.NORMP.N(0,95) = 1,645.
Haverá uma probabilidade de 1-α da média 
amostral conter um erro não superior a E. 
Por outro lado, haverá uma probabilidade 
α = (α/2) + (α/2) da média amostral conter 
um erro superior a E.
32
MODELOS PROBABILÍSTICOS PADRÕES
Veremos adiante alguns MODELOS
PROBABILÍSTICOS PADRÕES, que nos auxiliarão 
em diversas situações práticas. 
33
MODELOS PROBABILÍSTICOS PADRÕES
1. DISTRIBUIÇÃO BINOMIAL
Trata-se de uma distribuição de probabilidade adequada aos experimentos
que apresentam apenas dois resultados possíveis: sucesso ou fracasso. 
Fornece a base para inferências sobre proporções.
HIPÓTESES DO MODELO BINOMIAL
1. O experimento é repetido n vezes nas mesmas condições.
2. Os resultados das repetições são independentes, ou seja, uma repetição 
não interfere nas subseqüentes.
3. Cada repetição admite apenas dois resultados: sucesso ou fracasso.
4. As probabilidades de sucesso “p” e de insucesso “q” (q=1-p) se mantêm 
constantes durante as repetições.
Por exemplo:
a) Lançar uma moeda 5 vezes e observar o número de caras.
b) Numa linha de produção, observar 10 itens tomados ao acaso e verificar o número de 
defeituosos.
c) Verificar o número de bits que não estão afetados por ruído num pacote com n bits.
34
MODELOS PROBABILÍSTICOS PADRÕES
1. DISTRIBUIÇÃO BINOMIAL
Define-se a VARIÁVEL BINOMIAL X como o número de sucessos em n 
repetições do experimento. A expressão geral da Distribuição Binomial é:
NOTAS:
1. O nome BINOMIAL se deve ao fato da expressão acima corresponder ao 
termo geral do desenvolvimento do BINÔMIO DE NEWTON.
2. Para p=0,5 a distribuição é simétrica. Para P<0,5, a distribuição tem 
inclinação para a direita.
3. No caso de n grande (n  30) e p não muito pequena nem muito 
grande (valores centrais, com alguns autores recomendando np>5 e nq>5), 
a DISTRIBUIÇÃO BINOMIAL pode ser aproximada pela DISTRIBUIÇÃO
NORMAL, que será vista adiante. 
35
MODELOS PROBABILÍSTICOS PADRÕES
1. DISTRIBUIÇÃO BINOMIAL
PRINCIPAIS CARACTERÍSTICAS DA DISTRIBUIÇÃO BINOMIAL
Média μx = E{X} = np e Variância 
2
x = V{X} = npq. 
EXEMPLO: Uma moeda não viciada é lançada 5 vezes. Encontre a probabilidade de:
a) dar exatamente 3 caras
b) pelo menos uma cara
c) no máximo 2 caras
d) calcular o valor esperado e o desvio padrão
36
MODELOS PROBABILÍSTICOS PADRÕES
1. DISTRIBUIÇÃO BINOMIAL
EXEMPLO: Uma moeda não viciada é lançada 5 vezes. Encontre a probabilidade de:
a) dar exatamente 3 caras
b) pelo menos uma cara
c) no máximo 2 caras
d) calcular o valor esperado e o desvio padrão
37
MODELOS PROBABILÍSTICOS PADRÕES
2. DISTRIBUIÇÃO DE POISSON
Considere as situações em que se avalia o número de ocorrências de um 
determinado evento por unidade de tempo, de comprimento, de área ou de 
volume (genericamente denominados de área de oportunidade). Em muitos 
casos, conhece-se o número de sucessos, mas às vezes é muito difícil ou até 
mesmo impossível determinaro número de fracassos. Imagine o número de 
automóveis que passam por uma esquina: pode-se anotar o número de 
veículos que passaram num determinado intervalo de tempo, mas não se 
pode determinar quantos deixaram de passar. 
A distribuição de Poisson é aplicada nos tipos de situações em que nos 
interessa o número de vezes em que um evento pode ocorrer durante um 
intervalo de tempo ou em determinado ambiente físico (área de 
oportunidade). Tomando como referência o número de ocorrências em 
determinado intervalo de tempo, em um processo de Poisson podem ser 
observados eventos discretos num intervalo de tempo, de tal forma que, 
reduzindo suficientemente este intervalo, tenhamos:
38
MODELOS PROBABILÍSTICOS PADRÕES
2. DISTRIBUIÇÃO DE POISSON
HIPÓTESES DO MODELO DE POISSON
1. A probabilidade de observar apenas um sucesso no intervalo é estável.
2. A probabilidade de observar mais que um sucesso no intervalo é zero.
3. A ocorrência de um sucesso em qualquer intervalo é independente da 
ocorrência de sucesso em qualquer outro intervalo.
A distribuição de Poisson é caracterizada apenas pelo parâmetro λ, que 
representa o valor esperado ou média, do número de sucessos por intervalo 
t. Em outras palavras, λ é a taxa de ocorrência dos eventos no intervalo de 
tempo.
A função de probabilidade da distribuição de Poisson é:
e é uma constante (base do logarítmo neperiano) valendo 2,718...
λ é o número esperado de sucessos no intervalo considerado
x é o número de sucessos (x = 0, 1, 2, ...,∞.)
39
MODELOS PROBABILÍSTICOS PADRÕES
2. DISTRIBUIÇÃO DE POISSON
PRINCIPAIS CARACTERÍSTICAS DA DISTRIBUIÇÃO DE POISSON
Média μx = E{X} = λ e Variância 
2
x = V{X} = λ.
EXEMPLO: As consultas a um banco de dados ocorrem de forma independente 
e aleatória, à base de 3 consultas por minuto. Calcule as probabilidades:
a) no próximo minuto ocorrerem exatamente 3 consultas
b) no próximo minuto ocorrerem menos de 3 consultas
c) nos próximos dois minutos, ocorrerem mais do que 5 consultas
40
MODELOS PROBABILÍSTICOS PADRÕES
2. DISTRIBUIÇÃO DE POISSON
EXEMPLO: As consultas a um banco de dados ocorrem de forma independente e aleatória, à 
base de 3 consultas por minuto. Calcule as probabilidades:
a) no próximo minuto ocorrerem exatamente 3 consultas
b) no próximo minuto ocorrerem menos de 3 consultas
c) nos próximos dois minutos, ocorrerem mais do que 5 consultas
41
MODELOS PROBABILÍSTICOS PADRÕES
3. DISTRIBUIÇÃO EXPONENCIAL
Se o número de ocorrências de um evento por unidade de tempo seguir a 
Distribuição de Poisson, então automaticamente a distribuição do intervalo 
de tempo entre ocorrências do evento segue a DISTRIBUIÇÃO
EXPONENCIAL. Assim, se λ é a taxa à qual ocorrem eventos de Poisson, a 
distribuição do tempo entre chegadas sucessivas é expressa por: 
A distribuição exponencial também é caracterizada apenas pelo parâmetro λ, 
que representa a taxa de ocorrência dos eventos no intervalo de tempo.
A função de probabilidade acumulada da distribuição exponencial é:
onde:
e é constante de Euler (base do logarítmo neperiano) valendo 2,71828...
λ é a taxa de ocorrência do evento por unidade de tempo
x é o tempo entre chegadas sucessivas
42
MODELOS PROBABILÍSTICOS PADRÕES
3. DISTRIBUIÇÃO EXPONENCIAL
PRINCIPAIS CARACTERÍSTICAS DA DISTRIBUIÇÃO EXPONENCIAL
Média μx = E{X} = 1/λ e Variância 
2
x = V{X} = 1/λ.
EXEMPLO: Carros chegam a um posto de gasolina aleatoriamente a cada 2 
minutos em média. Determine a probabilidade de o tempo entre chegadas não 
exceder 1 minuto.
43
MODELOS PROBABILÍSTICOS PADRÕES
4. DISTRIBUIÇÃO NORMAL
É considerada a distribuição de probabilidades mais importante, pois permite 
modelar uma infinidade de fenômenos naturais, e além disso, possibilita 
realizar aproximações para calcular probabilidades de muitas variáveis 
aleatórias que têm outras distribuições, tais como a BINOMIAL (n  30, np>5
e nq>5). Também conhecida como distribuição de GAUSS, é muito importante 
também na inferência estatística.
A distribuição Normal é caracterizada por uma FUNÇÃO DE DENSIDADE DE
PROBABILIDADE cujo gráfico descreve uma curva em forma de sino, que 
evidencia maior probabilidade.
Função Densidade de Probabilidade da Distribuição NORMAL
onde:
μ = média da distribuição 
 = desvio padrão da distribuição 
π e e são constantes (3,1416... e 2,718...)
44
MODELOS PROBABILÍSTICOS PADRÕES
4. DISTRIBUIÇÃO NORMAL
PARÂMETROS DA DISTRIBUIÇÃO NORMAL
Média ou Valor Esperado μx = E{X} = μ e Variância 
2
x = V{X} = 
2
45
MODELOS PROBABILÍSTICOS PADRÕES
4. DISTRIBUIÇÃO NORMAL
46
MODELOS PROBABILÍSTICOS PADRÕES
4. DISTRIBUIÇÃO NORMAL
FUNÇÕES DO EXCEL PARA A DISTRIBUIÇÃO NORMAL
O Excel disponibiliza as unções para cálculos com a Distribuição Normal:
Função DIST.NORMP.N(z), onde, z: valor da VA Normal Padrão ou Reduzida.
Esta função retorna a probabilidade P(-∞<Z< z) = P(Z< z), p/ qualquer valor de z. 
Para um intervalo genérico P(a<z<b), pode-se aplicar F(b) – F(a) diretamente:
P(a<z<b) = DIST.NORMP.N(b) – DIST.NORMP.N(a)
Para P(z>a), usa-se 1 – P(z<a) e portanto P(z>a) = 1 – DIST.NORMP.N(a).
47
MODELOS PROBABILÍSTICOS PADRÕES
4. DISTRIBUIÇÃO NORMAL
FUNÇÕES DO EXCEL PARA A DISTRIBUIÇÃO NORMAL
Exemplos do emprego da Função DIST.NORMP.N(z):
a) Calcule P(z < 0,85) ► DIST.NORMP.N(0,85;1) ► = 0,8023 ( ou 80,23%).
b) Calcule P(0 < z < 1,25) ► DIST.NORMP.N(1,25;1)-DIST.NORMP.N(0;1) ► = 
0,3944 (ou 39,44%).
c) Calcule P(z>2,39) ► 1-DIST.NORMP.N(2,39;1) ► = 0,0084 ou 0,84%.
d) Calcule P(-2,55 < z < 1,2) ► DIST.NORMP.N(1,2;1)-DIST.NORMP.N(-2,55;1) 
► = 0,8795 ou 87,95%.
Função DIST.NORM.N( x ; média ; desv_padrão ; cumulativo),
Onde x: valor da VA Normal; média: média da VA X ; desv_padrão: desvio padrão 
da VA X ; cumulativo: um valor lógico que define o tipo de distribuição:
VERDADEIRO (1): retorna o valor da função de distribuição acumulada (FDA) 
F(x) = P(X  x) e FALSO (0): retorna o valor da função densidade de probabilidade 
(fdp) no ponto x: f(x)
Essa é a função mais completa para tratamento de distribuição normal. No caso de 
média=0, desvio=1 e cumulativo=1(verdadeiro), esta função retorna o mesmo valor 
da DIST.NORMP.N
48
MODELOS PROBABILÍSTICOS PADRÕES
FUNÇÕES DO EXCEL PARA A DISTRIBUIÇÃO NORMAL
Função INV.NORMP.N(probabilidade),
Retorna o valor z da VA Normal Padrão, abaixo do qual se tem a probabilidade 
informada. É o inverso da função DIST.NORMP.N(z)
Exemplo do emprego da Função INV.NORMP.N (p):
Sendo, P(z<a) = 0,3015 ache “a” ► INV.NORMP.N(0,3015)► = -0,524401
Função INV.NORM.N( probabilidade ; média ; desv_padrão)
Como no caso acima, é o inverso da função geral DIST.NORM.N(), aplicável a 
qualquer VA Normal X, desde que conhecidos sua média e desvio padrão.
Função PADRONIZAR( x ; média ; desv_padrão)
Retorna o desvio padrão normalizado z, considerando os argumentos x, média e 
desvio padrao, utilizando a fórmula já apresentada:
Exemplo do emprego da PADRONIZAR( x ; média ; desv_padrão):
A altura dos alunos de uma escola é normalmente distribuída com média 1,60 m e desvio 
padrão 0,30 m. Calcule a probabilidade de um aluno medir entre 1,50 m e 1,80 m. 
z1 = (1,50 – 1,60)/0,30 ► PADRONIZAR(1,5;1,6;0,3) ► = -0,33
z2 = (1,80 – 1,60)/0,30 ► PADRONIZAR(1,8;1,6;0,3) ► = 0,67
Logo: P(-0,33 < z < 0,67) ► DIST.NORMP.N(0,67;1)-DIST.NORMP.N(-0,33;1) ► = 0,3779 
ou 37,79%
49
MODELOS PROBABILÍSTICOS PADRÕES
5. DISTRIBUIÇÃO QUI-QUADRADO
É um modelo de distribuição contínua muito importante para a teoria da 
inferência estatística.
Considere x1, x2, x3 ...xp, “n” variáveis aleatórias independentes, 
normalmente distribuídas com média zero e variância 1, ou seja, “n”variáveis tipo normal padrão. 
Define-se a variável aleatória com distribuição
Qui-Quadrado como: n
2 = x1
2 + x2
2 + x3
2 + ... + xn
2 ou
onde “n” é um parâmetro da função densidade de probabilidade 
denominado grau de liberdade e geralmente denotado pela letra grega 
(lê-se fi), ou eventualmente por gl.
CARACTERÍSTICAS DA DISTRIBUIÇÃO QUI-QUADRADO
1. n
2  0 2. Média = n 3. Variância = 2n
4. A função densidade de probabilidade está representada graficamente 
para alguns valores de n:
50
MODELOS PROBABILÍSTICOS PADRÕES
5. DISTRIBUIÇÃO QUI-QUADRADO
Observe que à medida que n cresce, (ou gl), a função de densidade de 
probabilidade tende à forma da FUNÇÃO NORMAL.
51
MODELOS PROBABILÍSTICOS PADRÕES
5. DISTRIBUIÇÃO QUI-QUADRADO
TABELA QUI-QUADRADO
A tabela do Qui-Quadrado em função do grau de liberdade n (ou gl), apresenta o valor 
numérico da VA que deixa à sua direita determinada área α, ou seja α = P(X  x)
Para cálculo da probabilidade P(X  x), ou seja, área na cauda esquerda da distribuição, 
utiliza-se a propriedade P(X  x) = 1 – P(X  x) = 1 – α, conforme ilustrado abaixo.
1. O valor à direita, chamado,
qui-quadrado superior é obtido
na tabela com n =12 e α =0,025.
Logo, x2 = 23,34
ou INV.QUIQUA.CD(0,025;12)
2. O valor da abscissa à esquerda,
Chamado qui-quadrado inferior,
é obtido da tabela com n =12 e
α =1 - 0,025, portanto α =0,975.
Logo, x2 = 4,40
ou INV.QUIQUA.CD(0,975;12)
52
MODELOS PROBABILÍSTICOS PADRÕES
5. DISTRIBUIÇÃO QUI-QUADRADO
EXEMPLOS
Qual a probabilidade P(X > 18), sendo n = 25 (sendo n = gl):
Resp: DIST.QUIQUA.CD(18;25) ► = 84,24%.
Qual o valor da variável que gerou a probabilidade 0,8424 ?
Resp: INV.QUIQUA.CD(0,8424;25) ► = 18.
6. DISTRIBUIÇÃO T DE STUDENT
É um modelo de distribuição contínua que se assemelha à distribuição 
normal padrão N(0 ; 1). É utilizada para inferências estatísticas, quando se 
tem amostras com tamanhos inferiores a 30 elementos.
A distribuição t de Student, com n
graus de liberdade é dada por:
Para valores de n < 30, a distribuição apresenta maior dispersão que z 
N(0;1). À medida que n aumenta, t se aproxima cada vez mais de z.
53
MODELOS PROBABILÍSTICOS PADRÕES
6. DISTRIBUIÇÃO T DE STUDENT
CARACTERÍSTICAS DA DISTRIBUIÇÃO t DE STUDENT
1. Média = 0
2. Variância = 
3. A distribuição é simétrica
em relação à média.
4. A comparação entre t e z é
mostrada no gráfico ao lado.
Trata-se de uma distribuição bicaudal, conforme ilustrado abaixo:
54
MODELOS PROBABILÍSTICOS PADRÕES
6. DISTRIBUIÇÃO T DE STUDENT
EXEMPLOS
Qual o valor de "t" para: n = 9 e α = 5%. (sendo n = gl):
Resp: INV.T(1-0,025;9) ► =2,26216.
Se n = 9, qual o valor de "p" para um t de 2,2622 ou P(X = 2,2622) ?
Resp: 1-DIST.T(2,2622;9;1) ► = 0,02499825 ou 2,5%.
7. DISTRIBUIÇÃO F DE SNEDECOR
Considere duas distribuições , a primeira com n graus de liberdade e a 
segunda com d graus de liberdade.
A distribuição F de Snedecor, também referida como F de Fisher (Snedecor
foi o pseudônimo adotado por Fisher), é definida como:
55
MODELOS PROBABILÍSTICOS PADRÕES
7. DISTRIBUIÇÃO F DE SNEDECOR
No caso de n=20 e d=10, a Distribuição F possui a forma de sua fdp como 
mostrado abaixo.
Para fins de utilização da distribuição, na prática tabela-se, para cada par 
(n,d), o valor de F que deixa determinada área à sua direita.
56
7. DISTRIBUIÇÃO F DE SNEDECOR
EXEMPLOS
Qual o valor de P(F>x) para o gl_n=20, gl_d=10, sendo x=2,77:
Resp: DIST.F(2,774;20;10;FALSO) ► =0,0504 ou 5,04%.
Qual o valor crítico "X", para o gl_n=20, gl_d=10, sendo a probabilidade p=0,05 ?
Resp: INV.F(1-0,05;20;10) ► = 2,774
MODELOS PROBABILÍSTICOS PADRÕES
57

Outros materiais