Buscar

Apostila MAT02219 parte2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Aulas 12 a 20 – Profa. Liane MAT02219 
8. Distribuição de Probabilidade 
 
As distribuições de probabilidade são funções que representam os resultados de variáveis 
aleatórias, podem ser classificadas como: discretas (v.a.d). e contínuas (v.a.c.). 
 
 
8.1 Distribuições de probabilidade discretas 
 
8.1.1. Distribuição de Probabilidade Binomial 
 Usa-se o termo binomial para designar situações em que os resultados de uma v.a. 
podem ser agrupados em duas categorias, "sucesso" e "fracasso" que são mutuamente 
exclusivas. A distribuição binomial é útil para determinar a probabilidade de certo número 
de sucessos num conjunto de observações. 
 
*CARACTERÍSTICAS: 
• O experimento consiste em n tentativas em iguais condições. 
• Cada tentativa tem um resultado, entre dois possíveis: sucesso ou fracasso. 
• As probabilidades de sucesso p e de fracasso q = (1-p) permanecem constantes 
em todas as tentativas. 
• Os resultados são independentes uns dos outros. 
 
*CÁLCULO: 
 Para calcular uma probabilidade binomial, é necessário especificar: 
 n : número de tentativas 
 p : probabilidade de sucesso em cada tentativa 
 
e observa-se: x : número de sucessos (em n tentativas) 
 
Exemplo: Um novo hardware foi desenvolvido e tem 40% de chance de funcionar. Cinco 
protótipos foram construídos. Qual a chance de que dentre os cinco protótipos 3 
funcionem? Funcionar – F Não funcionar – N 
 
Combinações: 
1o 2o 3o 4o 5o 
F F F N N 
F F N F N 
F N F F N 
N F F F N 
F F N N F 
F N F N F 
N F F N F 
F N N F F 
N F N F F 
N N F F F 
Aulas 12 a 20 – Profa. Liane MAT02219 
 
Quantas situações ocorrem? 10 = C53 = 5! / 2!.3! 
 => Cnx = n!/ (n-x)!x! 
 
Qual a probabilidade de ocorrência da primeira combinação? 
FFFNN 
P(FFFNN) = P(F). P(F) . P(F) . P(N). P(N) = 0,4.0,4.0,4.0,6.0,6 = 
 = 0,43.0,62 = 0,02304 
 => px .(1-p)
n-x 
 
Qual a probabilidade de ocorrência de qualquer uma destas combinações/situações? 
0,02304 
 
Então : 
 P(X=3) = 10*0,02304 = C53 0,4
3.0,62 = 0,2304 
 
Generalizando: 
P(X=x) = Cxp . p
x 
.(1-p)
n-x 
 
 
 Em n tentativas, tem-se x sucessos com probabilidade p e n-x fracassos com 
probabilidade q. Como nessas n tentativas, não tem relevância a ordem de ocorrência dos x 
sucessos e n-x fracassos. Essa combinação é dada por: 
 
 C
n
x
n
n x x
=
−
!
( )! !
 
 
 De modo que: 
 P(X=x) = 
x
n
C )1(. pp
xnx
−
−
 
 
*EXEMPLO: 
 Seja p=0,1 a probabilidade de encontrar um item defeituoso. Em 15 peças que 
tomamos aleatoriamente de uma linha produtiva, temos que a probabilidade de obter x = 1 é 
dada por: 
 P(X=1) = 
141151 9,0.1,0.
!1)!115(
!15
)1,01(1,01
15
−
=−
−
C = 0,3432 
 
 
Para cada valor de X em {0,1,2, ..., 15} temos uma probabilidade, a figura abaixo mostra 
essas probabilidades graficamente. 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
 
 
distribuição binomial 
0 
0,05 
0,1 
0,15 
0,2 
0,25 
0,3 
0,35 
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 
x 
prob 
 
Como a probabilidade de ocorrer um defeituoso é baixa (p=0,1) é de se esperar que em um 
conjunto de 15 peças encontra-se probabilidades altas para valores pequenos de x. 
 
 
*PARÂMETRO DA DISTRIBUIÇÃO: 
 A distribuição a binomial tem por parâmetro p (a probabilidade de sucesso). Seja X 
é o número de sucessos, então em função deste parâmetro podemos calcular: 
 
 E[X] = n p e VAR[X] = n p ( 1 - p ) 
 
 
 No exemplo: E[X] = n p = 0,10 x 15 = 1,5 , logo temos em média 1,5 itens 
defeituosos nesta linha produtiva. 
 
 VAR[X] = n p ( 1 - p ) = 0,1 x 15 x (1 - 0,1) = 1,35 
 
8.1.2. Distribuição de Probabilidade Poisson: 
 
 É uma distribuição discreta que é útil para descrever a probabilidade do número de 
ocorrências num campo ou intervalo. 
 Exemplos de variáveis que podem ter como modelo a distribuição de Poisson: 
• defeitos por centímetro quadrado 
• chamadas de celular por hora 
 
Note que a unidade de medida é contínua, mas a variável aleatória é discreta. 
 
*CARACTERÍSTICAS: 
• A probabilidade de uma ocorrência é a mesma em todo o campo de observação. 
• A probabilidade de mais de uma ocorrência num único ponto é aproximadamente zero. 
• O número de ocorrências em qualquer intervalo é independente do número de ocorrência 
em outros intervalos. 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
*CÁLCULO: 
!
)(
x
e
xXP
xλλ−
== x = 0, 1,.... 
 
onde: x é o número de ocorrências 
 λ é o número médio de ocorrência no intervalo/espaço. 
 
*EXEMPLO: 
 Um processo mecânico produz tecido para tapetes com média de dois defeitos por 
metro quadrado. Qual a probabilidade de em um metro quadrado se encontre apenas um 
defeito? (admitindo que esse processo possa ser bem aproximado por uma distribuição de 
Poisson). 
 P x
e
( )
!
,
,
= = =
−
1
2
1
0 270
2 1
 
 
 
 x P(x) 
 0 0,135 
 1 0,270 
 2 0,270 
 3 0,180 
 4 0,090 
 5 0,036 
 6 0,012 
 Distribuição de Poisson com λ = 2 
 
 
*PARÂMETRO DA DISTRIBUIÇÃO: 
 
 A distribuição Poisson tem por parâmetro λ (número médio de ocorrências), o valor 
esperado e a variância são iguais a esse parâmetro. 
 
 E[X] = λ e VAR[X] = λ 
 
 
A distribuição de Poisson pode ser usada para 
calcular probabilidade da distribuição Binomial, 
quando n p→ ∞ → e 0 , 
mas mantendo o quociente np = λ . 
Aulas 12 a 20 – Profa. Liane MAT02219 
8.1.3.Exercícios de distribuições de probabilidade discretas 
 
 
1) Uma empresa explorada de petróleo acha que 5% dos poços de petróleo que perfura 
acusam depósito de gás natural . Se ela perfurar 6 poços, determine a probabilidade de ao 
menos um dar resultado positivo? 
 
 
2) Dos estudantes de uma universidade, 75% mudam de curso uma vez durante o primeiro 
ano, de acordo com os registros. Escolhido ao acaso 11 estudantes calouros, determine a 
probabilidade de: 
 a) todos mudarem de curso ao menos uma vez . 
 b) ao menos 9 mudarem de curso. 
 c) Mais da metade mudar de curso. 
 
 
3) Entre 2000 famílias, com 4 crianças cada uma, provavelmente, quantas terão: 
 a) pelo menos 1 menino. 
 b) nenhuma menina 
 
 
4) O número de DVD´s vendidos por dia por uma loja tem distribuição aproximadamente 
poisson com média 1,5. Qual a probabilidade da loja vender ao menos 4 DVD´s: 
 a) num período de dois dias 
 b) num período de três dias 
 
 
5) Os defeitos em rolos de tecidos ocorrem a razão de 0,1 defeito/rolo, e a distribuição dos 
defeitos é Poisson. Qual a probabilidade de um rolo particular conter um ou mais defeitos? 
 
 
6) Um certo tipo de pneu para automóveis de passeio tem média um defeito a cada 15000 
km de trajeto percorrido. Assumido que as ocorrências têm distribuição de Poisson, qual é a 
probabilidade de não observamos nenhum defeito em 15000 km? E nenhum defeito em 
20000 km? 
 
 
 
 
 
 
 
 
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
8.2. Distribuição de Probabilidade Contínua 
 
8.2.1. Distribuição de Probabilidade Normal: 
 
 A curva normal é conhecida também por curva de Gauss, pois foi ele quem 
contribuiu para a sua teorização. A curva normal está associada a histogramas similares ao 
que vemos na figura abaixo, onde temos uma grande concentração em torno de um valor 
central e a medida que nos afastamos desse valor (para ambos os lados) a freqüência (ou 
probabilidade) ocorrência do fenômeno vai diminuindo.*CARACTERÍSTICAS: 
 
• A curva normal tem forma de sino. 
• É simétrica em relação à média. 
• Prolonga-se de -∞ até +∞. 
• Cada distribuição normal é especificada por seus parâmetros média (µ) que varia 
de [-∞,+∞] e o desvio padrão (σ) que varia entre [0, +∞]. Existe uma curva normal 
distinta para cada combinação de µ,σ. 
 
Curvas com médias diferentes (e mesmo desvio padrão): 
 
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
Curvas com desvios padrões diferentes (e mesma média): 
 
 
- A área total abaixo da curva é considerada como 100%. Isto é, 
 P( -∞ < x < +∞)=1 
 
 - Como há um número infinito de valores entre -∞ e +∞, a probabilidade de uma 
variável aleatória normalmente distribuída assumir exatamente um valor X0 é zero. 
 - A área sob a curva entre dois pontos é a probabilidade de uma variável 
normalmente distribuída assumir um valor entre dois pontos. 
 
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
 Para calcular P(a ≤ x ≤ b) = 
a
b
∫ f(x) dx, é preciso conhecer f(x) ou f.unção densidade 
de probabilidade da distribuição normal. 
 
 
 * FUNÇÃO DISTRIBUIÇÃO DE PROBABILIDADE: 
 
 f x xe( ) ( )= − −
1
2
22 2
σ π
µ σ -∞ < x < +∞ 
 
 
 * FUNÇÃO DISTRIBUIÇÃO ACUMULADA: A distribuição normal acumulada é 
definida como a probabilidade que a variável normal X é menor ou igual a algum valor "a", 
ou 
 
 P( X ≤ a) = F(a) = 
−∞
∫
a
 
1
2
22 2
σ π
µ σ− −( )xe 
 
 Como a distribuição normal varia de local e forma para cada µ e σ, e não é 
possível encontrar uma solução fechada (para a integral), foi realizada uma 
padronização. A padronização consiste em transformar qualquer distribuição normal em 
uma distribuição normal com µ = 0 e σ = 1. A distribuição normal padrão foi então 
tabulada. 
 
 
 
 
 
 
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
 * DISTRIBUIÇÃO NORMAL PADRÃO: As áreas correspondentes as probabilidades 
da distribuição normal padrão estão tabeladas. A unidade da distribuição normal padrão é 
chamada escala z que significa o número de desvios a contar da média. 
 
 As distribuições com µ ≠ 0 e/ou σ ≠ 1, podem ser convertidas para a escala Z 
usando: 
 z = 
x − µ
σ 
 
 Como z expressa a localização de unidades relativo a média usando o desvio padrão. 
Obtemos então: 
 P( X < a) = P ( z < 
a − µ
σ
) = φ µ
σ
( )
a −
 
onde φ (.) é a distribuição normal acumulada e está tabelada conforme a tabela anexa. 
 
Exemplo: O diâmetro das hastes de metal de um disk drive é normalmente distribuído 
com µ = 0,2508 polegadas e σ = 0,0005 polegadas. As especificações da haste forma 
estabelecidas como sendo 0,25 ± 0,0015 polegadas. Desejamos determinar a fração de 
hastes produzidas conforme as especificações. 
 
 P( 0,2485 < x < 0,2515) = P(x < 0,2515) - P(x < 0,2485) 
 
 = φ( , , )
,
0 2515 0 2508
0 0005
−
- φ( , , )
,
0 2485 0 2508
0 0005
−
 
 = φ( , )1 40 -φ( , )−4 60 
 = 0,9192 - 0 
 = 0,9192 
 
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
 Note que 68,26% dos valores estão entre os limites definidos por µ ± σ ; 95,46% 
dos valores estão entre os limites definidos por µ ± 2σ ; e 99,73% dos valores estão entre 
os limites definidos por µ ± 3σ. 
 
 
Aproximação da Binomial pela Normal: 
 
 Muitas situações podem ser convenientemente descritas pela distribuição 
binomial. O que ocorre é que muitas vezes temos um grande número de observações (n 
grande), tornando os cálculos muito trabalhosos. 
 
 O uso da normal para aproximar a binomial apresenta dificuldade conceitual. A 
distribuição normal é contínua e, enquanto a binomial é discreta. A transição do caso 
discreto para o contínuo envolve a consideração de valores não-inteiros associados às 
variáveis contínuas, mas não a variáveis discretas. 
 
 O problema se resolve atribuindo intervalos da distribuição contínua para 
representar valores inteiros comuns as variáveis discretas. Por exemplo: os valores 
contínuos de 6,5 e 7,5 se associam ao inteiro 7. Assim para determinar a probabilidade 
binomial de exatamente 7 sucessos, deveríamos usar uma aproximação normal baseada na 
probabilidade (área abaixo da curva) entre 6,5 e 7,5. 
 
Exemplo: Numa linha produtiva a proporção de defeituosos é 0,4, em 20 itens que foram 
tomados aleatoriamente da produção. A probabilidade de 3 itens defeituosos é: 
 P(X=3) = 
3
20 3 20 3
0 4 1 0 4C , ( , )
−
− = 0,0124 
 
 Como a normal é expressa em função da média e desvio padrão, calcula-se: 
 µ = n.p = 20. 0,4 = 8 e σ = np p( )1− = 20 0 4 0 6. , . , = 2,2 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
"exatamente 3" deve ser interpretado como o intervalo de 2,5 a 3,5 na curva normal. 
 P(2,5 < X < 3,5) = P(X<3,5) - P(X<2,5) 
 = P( Z < 3,5 - 8 / 2,2 ) - P ( Z < 2,5 - 8 / 2,2) 
 = P( Z < -2,05) – P(Z < -2,5) 
 = φ ( -2,05) - φ ( -2,5) = 0,0202 – 0,0062 = 0,0140 
 
A normal fornece uma boa aproximação da binomial quando n.p > 5. 
 
8.8.2 Distribuição de Probabilidade Exponencial: 
 
O modelo da distribuição Exponencial é o seguinte: 
f x e xx( ) ;= ≥−λ λ 0 onde : λ > 0 é uma constante. 
 
A média e o desvio padrão da distribuição 
exponencial são: 
 µ
λ
=
1
 σ
λ
=
1
 
A distribuição exponencial acumulada vem 
dada por: 
 
0 
 1}{)(
0
≥
−==≤= −−∫
a
edxeaXPaF a
a x λλλ
 
A distribuição Exponencial é largamente utilizada no campo da confiabilidade, como um 
modelo para a distribuição dos tempos até a falha de componentes eletrônicos. Nessas 
aplicações o parâmetro λ representa a taxa de falha para o componente, e 1/λλλλ é o tempo 
médio até a falha. 
 
Exemplo: Suponha que uma máquina falhe em média uma vez a cada dois anos. Qual a 
probabilidade de que a máquina não falhe durante o próximo ano? 
 Ora: 1/λ = 2 assim λ =0,5. 
 P(t > 1) = 1 - P(t ≤ 1) = [ ]1 1 0 5− − −e , (1) = 0,607 
 
Observação: Na distribuição de Poisson, a variável aleatória é definida como o número de 
ocorrências em determinado período, sendo a média das ocorrências no período definida 
como λ. 
Na distribuição Exponencial a variável aleatória é definida como o tempo entre duas 
ocorrências, sendo a média de tempo entre ocorrências de 1/λ. 
Por exemplo, se a média de atendimentos no caixa bancário é de λ = 6/min, então o tempo 
médio entre atendimentos é 1/λ = 1/6 de minuto ou 10 segundos. 
Aulas 12 a 20 – Profa. Liane MAT02219 
 
8.2.3.Exercícios de distribuições de probabilidade contínuas 
 
1) Uma peça cromada resiste a um ensaio de corrosão por três dias em media, com desvio padrão 
de 5 horas. Calcule: 
a)A probabilidade de uma peça resistir a mais que 3,5 dias. 
b)A probabilidade de uma peça resistir entre 60 e 70 horas. 
c) Sabe-se que 71,9% das peças resistem menos que um certo número de horas, qual é esse valor? 
 
2) Uma pessoa tem 20 minutos para chegar ao escritório. Para tal pode escolher entre dois 
caminhos (X ou Y). Sabe-se que o tempo para percorrer o caminho X é normal com média 18 
minutos e desvio-padrão de 5 minutos e que o tempo para percorrer o caminho Y é normal com 
média 19 minutos e desvio-padrão de 2 minutos. Qual a melhor escolha? 
 
3) A nota média de um exame final foi de 72 com desvio padrão 9. Sabe-se que 10% dos melhores 
alunos receberam classificação A. Qual a nota mínima que um aluno deve obter para classificar-se 
com A? 
 
4) Numa fábrica de tintas onde o produto é acondicionado automaticamente em latas com 
aproximadamente 20 Kg. Verificou-se que 32% das latas estão com peso inferior a 20 Kg. A 
máquina de enlatar foi regulada, aumentando-se o peso médio das latas em 100g, e então a 
porcentagem delatas com peso inferior a 20 Kg caiu para 15%. De quanto deve ser novamente 
aumentado o peso médio, para que esta porcentagem se reduza a 5%? Assuma distribuição normal. 
 
5) No engarrafamento de um refrigerante, a quantidade de líquido colocado na garrafa é uma 
variável normal com média 292 cm3 e desvio-padrão de 1 cm3. Garrafas com menos de 290 cm3 
são devolvidas para completar o enchimento. Calcule: 
 a) qual a porcentagem de garrafas devolvidas. 
 b) considerando que as garrafas em que se completa o enchimento ficam com mais de 292 
cm3, qual a probabilidade, em meia dúzia de garrafas, de encontrar-se uma ou mais garrafas com 
menos de 291 cm3? 
 
6) Suponha que o tempo médio entre o pedido e o atendimento num grande restaurante seja 10 
minutos com distribuição exponencial. Calcule a probabilidade de um cliente esperar mais que 10 
minutos? Que a espera não seja superior a 3 minutos. 
 
7) O tempo de atendimento numa oficina é bem aproximado por uma distribuição exponencial com 
média de 4 minutos. Qual a probabilidade de: 
a) espera superior a 4 min b) espera inferior a 4 min c) exatamente 4 min 
 
8) Sabe-se que lâmpadas elétricas têm distribuição aproximadamente exponencial, com vida média 
de 1000 horas. Qual a probabilidade de uma lâmpada queimar antes de: 
 a) 500 horas b) 2000 horas 
 
9) Para o exercício 8, após quantas horas ter-se-ão queimado 50% das lâmpadas? 
 
 
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
9. AMOSTRAGEM 
 
9.1. Introdução 
 Na prática, raramente se sabe qual distribuição representa a variável. Obter a 
distribuição exata de alguma variável é muito dispendioso e as vezes impraticável, pois 
seria necessário ter todos elementos da população. 
 
 Por exemplo, para saber o tempo de vida (número de horas que duram em média) 
para certa marca de lâmpada, é preciso testar todas as lâmpadas até queimarem. 
 
 Assim, a solução é selecionar parte dos elementos (amostra), analisá-los e tirar 
conclusões para o todo (população). Este é o objetivo da Estatística Inferencial. Logo, 
Estatística inferencial é o ramo da estatística que se preocupa em obter informações sobre o 
todo a partir de parte deste todo, ou seja, tomar decisões com base em dados colhidos de 
uma amostra. 
 
 Por falta de tempo e recursos econômicos raras vezes estuda-se individualmente 
todos os sujeitos da população na qual se está interessado. Em lugar disso, o pesquisador 
estuda uma amostra para generalizar as conclusões para a população. Utilizando uma 
amostra tem-se uma maior confiabilidade, pois com poucos dados pode-se dar atenção aos 
casos individuais, além disto, é mais operacional, pois tem-se menos entrevistadores a 
controlar. 
 
 Para que as conclusões sejam confiáveis, é necessário que as amostras sejam obtidas 
de processos adequados que garantam a sua representatividade, ou seja, que a amostra 
reproduza as mesmas características da população no que diz respeito as variáveis de 
interesse. 
 
 Assim uma empresa que fabrica lâmpadas pode selecionar algumas unidades 
(amostra) e ao testá-las (ver quanto tempo duram até que queimem) e com base nestas 
unidades verificar o comportamento de toda a produção. 
 
 
9.2.Técnicas de amostragem 
 
 *Probabilísticas: São aquelas em que a seleção das unidades é aleatória de 
tal forma que cada elemento da população tem uma probabilidade de pertencer a amostra. 
 
 *Não Probabilísticas: São aquelas que não envolvem aleatoriedade na 
seleção dos elementos. Por exemplo: amostras intencionais, em que o pesquisador escolhe 
deliberadamente os elementos da amostra ou amostra de voluntários. 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
 Para que se possam utilizar as técnicas de inferência estatística é necessário que o 
processo de escolha da amostra seja probabilístico, pois somente neste caso é possível 
avaliar a probabilidade de erro. 
 
9.3. Técnicas de Amostragem Probabilística 
 
 *Amostragem Aleatória Simples (a.a.s): Também chamada de casual ou randômica. 
 
 A característica principal é que todos os elementos têm igual probabilidade de 
pertencer à amostra, então uma população com N elementos esta probabilidade é de 1/N. 
 
Esta característica implica que todos os elementos da população devem ser 
identificados antes da extrair a amostra, exigência preenchida mediante a obtenção 
(elaboração) de uma lista que contenha todos os elementos da população. 
 
Para garantir que a seleção dos elementos seja aleatória é necessário utilizar um 
mecanismo tal como: a tabela de números aleatórios que é desprovida de qualquer lei de 
informação (veja a seguir uma parte de uma tabela de números aleatórios) ou então extrair 
bolas de uma urna. 
 
Parte de uma tabela aleatória: 
 C O L U N A 
 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 
L 1 2 3 1 5 7 5 4 8 5 9 0 1 8 3 7 
I 2 6 2 4444 9999 7777 0 8 8 6 9 5 2 3 0 3 
N 3 0 4 5 5 5 0 4 3 1 0 5 3 7 4 3 
H 4 1 1 8 3 7 4 4 1 0 9 6 2 2 1 3 
A 5 1 6 0 3 5 0 3 2 4 0 4 3 6 2 2 
 
 Por exemplo, em uma empresa com 562 funcionários, deseja-se verificar a 
satisfação destes com relação ao refeitório local. 
 
Os funcionários desta empresa estão cadastrados funcionalmente de 1 a 562, temos 
então uma listagem (numérica) de todos os funcionários. 
 
De posse da listagem, encontra-se o tamanho da amostra n que foi calculada em 10 
funcionários (futuramente iremos verificar com procede-se com este cálculo). Passa-se 
então a utilizar a tabela de números aleatórios escolhendo quais serão os 10 funcionários 
que irão compor a amostra fazendo então a pesquisa. 
 
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
Pode-se iniciar a consulta à tabela iniciando em qualquer ponto, movendo-se em 
qualquer sentido. O início será na coluna 3 e na linha 2, andando para a direita. Como o 
valor máximo da população em questão é 562, toma-se números com três algarismos, assim 
a amostra será os funcionários que apresentem os seguintes cadastros: 
 497 => primeiro elemento da amostra 
 088 => segundo elemento da amostra 
 695 => fora do intervalo (entre 1 e 562), este valor deve ser desconsiderado 
 230 => terceiro elemento da amostra 
 304 => quarto elemento da amostra 
 555 => quinto elemento da amostra 
 043 => sexto elemento da amostra 
 105 => sétimo elemento da amostra 
 374 => oitavo elemento da amostra 
 311 => nono elemento da amostra 
 837 => fora do intervalo (entre 1 e 562), este valor deve ser desconsiderado 
 441 => décimo elemento da amostra 
Obs.: Números repetidos também devem ser desconsiderados. 
 
 *Amostragrem Aleatória Sistemática: Também requer uma listagem dos elementos 
da população, mas neste caso escolhe-se cada k-ésimo elemento da lista, onde k é obtido 
dividindo-se o tamanho da população pelo tamanho da amostra ( k=N/n) . 
 
Assim se N=200 e n=10, então k=200/10=20. Isto significa que será escolhido um 
elemento de 20 em 20 elementos. Pode-se consultar uma tabela de números aleatórios para 
determinar onde iniciar. 
 
Por exemplo, na tabela forneceu o número 09, escolhe-se o 9o elemento, 29o 
elemento, 49o elemento, 69o elemento, até completar a amostra. 
 
É preciso ter cuidado com o caráter periódico, como por exemplo, se na amostra são 
selecionadas as casas localizadas na esquina. Uma casa na esquina pode ter maior valor, 
pagar mais imposto, sofrer mais ruído, enquanto que as casas no meio do quarteirão 
apresentam características bem diferentes. 
 
 *Amostragem Aleatória Estratificada: Pode ser utilizada quando existem subgrupos 
dentro da população que são compostos de itens similares (estratos). 
 
A lógica do procedimento da amostragem aleatória estratificada é que, dispondo os 
itens da população em subgrupos homogêneos, que a variabilidade dentro dos estratos é 
menor que a população global, fazendo com não seja necessário investigar uma grande 
quantidadede itens dentro de cada estrato, isto é nos leva a um tamanho de amostra menor. 
 
Após identificarmos os estratos que devem apresentar certas diferenciações entre 
eles, realizamos uma amostragem aleatória simples em cada um dos estratos. 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
 
Um exemplo de aplicação de amostragem aleatória estratificada seria no estudo do 
tempo que os funcionários de uma empresa despendem com lazer, os nossos estratos 
poderiam ser: faxineiras, secretárias, diretores. 
 
 
 
 *Amostragem Aleatória por Conglomerados: Pode ser utilizada quando é possível 
identificar dentro da população subgrupos que representam uma miniatura da população. 
 
Estes subgrupos são chamados de conglomerados, diferenciando-se dos estratos por 
não haver homogeneidade interna (dentro de cada conglomerado os elementos são tão 
distintos quanto dentro da população). 
 
Os conglomerados são, em geral, grupos de elementos que possuem em estreito 
contato físico, tal como: casas, quarteirões, bairros. 
 
 
 
 
 
9.4. Técnicas de Amostragem Não-Probabilística 
 
 * Amostragem por Quotas: Neste procedimento, diversas 
características de uma população, tais como: idade, sexo, classe social são 
amostrados nas mesmas proporções em que figuram na população. 
 
 * Amostragem por Julgamento: A idéia é de que o senso comum 
ou um julgamento equilibrado podem ser usados na seleção da amostra. Por 
exemplo, um médico só poderá realizar um estudo com os pacientes 
disponíveis ou com os que se dispuserem a colaborar. 
 
 
 
 
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
 
9.5 Exercícios de técnicas de amostragem 
 
1) No que consiste a estatística inferencial? 
 
2) Qual a diferença entre população e amostra? 
 
3) Explique por que é mais vantajoso utilizar a amostra no lugar do censo (estudo da 
população). 
 
4) Cite três exemplos de amostragem. 
 
5) Quais os dois métodos de amostragem (esquemas de amostragem) existentes? 
 
6) Explique qual a vantagem de se utilizar um método de amostragem probabilística? 
 
7) Na sua opinião é seguro fazer inferências utilizando uma amostra não-probabilística? O 
que pode acontecer se isso for feito? 
 
8) Numere os passos necessários para compor uma a.a.s. (amostra aleatória simples ou 
amostra casual simples) sem reposição. 
 
9) Os empregados de uma empresa têm números de matrículas em seus crachás 
consecutivamente de 101 a 873. Deve-se montar um comitê de segurança de 10 pessoas. 
Descreva o procedimento para obter uma amostra aleatória simples utilizando a tabela de 
números aleatórios e qual é a amostra. (Inclua também: quantos algarismos devem ser lidos 
e qual a posição e direção utilizadas na tabela) 
 
10) Cite uma vantagem e uma desvantagem da amostragem aleatória sistemática, 
exemplificando. 
 
11) Qual a diferenciação existente entre a amostragem aleatória estratificada e a 
amostragem aleatória por conglomerados. 
 
12) Explique rapidamente cada um dos tipos de amostragem não probabilística. 
 
 
 
 
 
 
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
10. Distribuição Amostral 
 
 A finalidade da amostragem é obter uma indicação do valor de um ou mais 
parâmetros de uma população, tais como: média, variância da população ou proporção. 
 Quando extraímos aleatoriamente repetidas amostras de uma mesma população a 
estatística amostral varia de uma amostra para a outra, chamamos esta variação de 
variabilidade amostral. 
 O objetivo é saber o quão próximo está a estatística amostral do verdadeiro 
parâmetro. Para isso três fatores são importantes: 
• o estudo da distribuição de probabilidade da estatística amostral; 
• o tamanho da amostra (grandes amostras têm menor variabilidade entre as 
estatísticas do que em pequenas amostras) e ainda 
• a variabilidade na população (populações com muita variabilidade produzem 
estatísticas amostrais com maior variabilidade). 
 A variabilidade amostral pode ser expressa em uma distribuição de probabilidade 
que associa aos possíveis resultados de uma estatística amostral suas respectivas 
probabilidades. 
 
 *PARÂMETROS e ESTATÍSTICAS: 
 *Parâmetros são medidas estatísticas obtidas através do censo para 
descrever uma característica da população. 
 *Estatísticas são medidas características obtidas através de uma amostra. 
 
Medida Parâmetro Estatística 
Média µ x 
Desvio padrão σ s 
Variância σ 2 s2 
Proporção Π p 
 
 
10.1. Distribuição Amostral das Médias 
 
 Uma distribuição amostral das médias indica a probabilidade de ocorrência de uma 
média amostral. As médias amostrais tendem a agrupar-se em torno da média populacional. 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
Distribuição amostral de X - População Normal
 
 
A média das médias amostrais é igual a verdadeira média populacional. 
 E X[ ] = µ 
 
 E o desvio padrão da distribuição amostral das médias será dado por: 
 
x nσ
σ
= 
 
 
OBS.: Para a distribuição amostral das médias quando tomamos a amostra sem reposição 
de uma população finita, o desvio padrão de X necessita de uma correção: 
 
fator de correção: 
N n
N
−
−






1
 
assim o desvio padrão é dado por: σ
X
=
σ
n
N n
N
−
−






1
 
 
 * Teorema do Limite Central: 
 
- Se a população sob amostragem tem distribuição normal, a distribuição das médias 
amostrais também será normal. 
 
- Mesmo que a população não seja considerada distribuição normal, a distribuição das 
médias amostrais será aproximadamente normal para grandes amostras. 
 
 x N n≅ ( , / )µ σ Logo, Z
x
n
=
− µ
σ
 
Aulas 12 a 20 – Profa. Liane MAT02219 
 
 
Exemplo/exercício 
Suponha que uma população tenha distribuição normal e seja composta por cinco 
valores: 2; 3; 6; 8; 11. 
a) Calcule a idade média. (média da população) 
b) Calcule o desvio padrão da idade. (desvio padrão da população) 
c) Componha todas as amostras de tamanho 2 com reposição (ou seja, o valor retirado 
pode participar da amostra novamente, por exemplo, a amostra 2; 2). 
d) Calcule as médias da amostras obtidas no item c. 
e) Calcule a média das médias obtidas no item d. 
f) Compare o valor da média das médias amostrais (item e) com a média da população 
(item a). 
g) Calcule o valor do desvio padrão das médias amostrais obtidas no item d. 
h) Verifique se o valor obtido no item g (desvio padrão das médias amostrais) é igual a 
razão entre o desvio padrão da população (item b) pela raiz quadrada do tamanho da 
amostra (neste exercício igual a .......) 
i) Componha todas as amostras de tamanho 2 sem reposição (ou seja, o valor retirado 
não pode participar da amostra novamente, por exemplo, a amostra 2;2 não é uma 
amostra possível no caso sem reposição) 
j) Calcule as médias da amostras obtidas no item i. 
k) Calcule a média das médias obtidas no item j. 
l) Compare o valor da média das médias amostrais (item k) com a média da população 
(item a). 
m) Calcule o valor do desvio padrão das médias amostrais obtidas no item j. 
n) Verifique se o valor obtido no item m (desvio padrão das médias amostrais) é igual 
a razão entre o desvio padrão da população (item b) pela raiz quadrada do tamanho 
da amostra (neste exercício igual a .......) multiplicada pelo fator de correção 
1−
−
N
nN
 . 
o) Conclua sobre as análises realizadas. 
 
 
10.2. Distribuição Amostral das Médias quando σ é Desconhecido 
 
 Quando desconhecemos o desvio-padrão populacional utilizamos como estimativa o 
valor de s. Desta forma, o desvio-padrão das médias (ou erro padrão) será dado por: 
 σ
x
s
n
= , onde s = 
2
1
1
( )ix x
n
i
n
−∑
−
= 
 
 Para grandes amostras, podemos admitir que a variação dos valoresobservados na 
amostra apresente variação semelhante a da população. Porém, para pequenas amostras isso 
pode não ser verdadeiro. Neste caso, a distribuição adequada é a distribuição t-student. 
Aulas 12 a 20 – Profa. Liane MAT02219 
 Assim, a estatística: 
 
( )x
s
n
t student
−
≈ −
µ
 com n-1 graus de liberdade. 
 
 Esta distribuição é muito parecida com a distribuição normal, sendo simétrica em 
torno da média zero, porém tem maior dispersão quando comparada com a normal. 
 
 A forma da distribuição t-student depende do tamanho da amostra. Quanto menor o 
tamanho da amostra, menor serão os graus de liberdade e mais dispersa (“achatada") será a 
curva. 
 
10.3. Distribuição Amostral do Número de Sucessos na amostra e da 
Proporção da amostra 
 
 Do cálculo de probabilidades temos que a distribuição amostral do número de 
sucessos d será uma distribuição binomial de parâmetros n e π e assim: 
 E[d] = nπ e VAR[d] = nπ(1-π) 
 
A proporção p, que simplesmente é o quociente de d pelo tamanho da amostra n. 
Aplicando propriedades algébricas, temos que: 
 E[p] = π e VAR [p] = 
n
)1( ππ −
 
 
 Se a amostra n for suficientemente grande, podemos aproximar as distribuições de d 
e p por distribuições normais com as respectivas médias e desvios padrões. Em termos 
práticos, em geral, podemos considerar que a amostra será suficientemente grande, para 
efeito dessa aproximação, se np ≥ 5 e n(1-p) ≥ 5. 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
10.4. Exercícios de distribuição amostral 
 
1) Uma variável aleatória X tem distribuição normal com média 100 e desvio padrão 10. 
a) Qual a P(90 < X < 110)? 
b) Se x é a média de uma amostra de 16 elementos retirados dessa população, 
calcule P( 90< x< 110). 
c) Desenhe, num único gráfico, as distribuições de X e x . 
d) Que tamanho deveria ter a amostra para que P( 90< x< 110) = 95%. 
 
2) Certos amortecedores fabricados por uma empresa têm uma vida média de 800 dias e 
desvio padrão de 60 dias. Determine a probabilidade de que a média de uma amostra 
aleatória de 16 amortecedores: 
 a) esteja entre 770 e 830 dias 
 b) seja menor que 785 dias. 
 
 
3) Os pesos de pacotes recebidos por um depósito têm uma média de 150 Kg e um desvio 
padrão de 25 Kg. Qual a probabilidade de 25 pacotes, retirados aleatoriamente e carregados 
em um elevador, não excedem o limite de segurança deste, que é de 4.100 Kg? 
 
 
4) Calcular os valores de t para os quais a área da extremidade direita da distribuição t de 
Student é de 5%, quando o número de graus de liberdade for igual a: 
 a) 16 b) 27 c) 200 
 
 
5) Se a variável X tem distribuição t de Student com 10 gl (graus de liberdade), determinar 
a constante K de modo que: 
 a) P(X > K) = 0,05 b) P(X > K) = 0,90 
 
 
6) Uma pesquisa de opinião pública numa comunidade mostrou 46% das pessoas são 
favoráveis a um projeto de lei. Determinar a probabilidade de que a maioria das pessoas, de 
um conjunto amostral de 100 pessoas, seja favorável a tal projeto. 
 
 
7) Um fabricante faz a remessa de 1.000 lotes, de 100 parafusos cada um. Se 5% dos 
parafusos são defeituosos, em quantos lotes pode-se esperar que existam: 
 a) Menos que 90 parafusos perfeitos. 
 b) 98 ou mais parafusos perfeitos. 
 
 
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
11. Estimação 
 
 O objetivo da inferência estatística é obter conclusões a respeito de populações 
através de uma amostra extraída dessa população. 
Uma variável aleatória é caracterizada por sua distribuição de probabilidade. 
Assim, estamos interessados em fazer inferências a respeito dos parâmetros da 
distribuição de probabilidade. 
Como estes parâmetros quase sempre são desconhecidos, iremos estimá-los a partir 
dos dados de uma amostra. 
 A Estatística Inferencial compreende a Estimação e Teste de hipótese. 
 
A estimação é um processo que consiste em utilizar dados amostrais (retirados 
segundo amostragem probabilística) a fim de obter conclusões sobre os parâmetros da 
população que são desconhecidos. 
 
 É através da estatística da amostra representada por um estimador que fornece uma 
estimativa dos parâmetros populacionais que se realiza o processo de estimação. 
 
 * DEFINIÇÕES: 
 
 * Estimar: Através de dados amostrais fornecer um valor para algum 
parâmetro populacional desconhecido. 
 * Estimador: É uma função matemática obtida a partir de elementos da 
amostra que será no processo de estimação o parâmetro desejado. 
 * Estimativa: É um valor numérico particular de um estimador, obtido a 
partir de dados de uma amostra. 
 
Exemplo: Numa população de municípios do estado desejamos estimar a média de 
investimento da receita municipal na área industrial. 
 Se investigássemos todos municípios teríamos a média populacional (µ). Ao 
retirarmos uma amostra aleatória, estaríamos estimando a média populacional pela média 
amostral x . Logo, x é um estimador de µ. E uma estimativa seria o valor de x para esta 
amostra particular. 
 
Propriedade dos Estimadores: 
 
 * NÃO-TENDENCIOSO (não-viciado, justo ou não viesado): Um estimador é não 
tendencioso se sua média for igual ao parâmetro. 
 
 Ao se extrair todas as possíveis amostras de mesmo tamanho (n) de uma única 
população e calcularmos para cada uma delas os respectivos valores da estatística amostral 
e se a média aritmética destes valores coincidir com o parâmetro, estaremos diante de um 
estimador não-tendencioso. 
 
Exemplo: E(x ) = µ , isso significa dizer que x é um estimador não-tendencioso de µ . 
Aulas 12 a 20 – Profa. Liane MAT02219 
 
 * EFICIENTE: Quando comparamos dois estimadores, dizemos que é eficiente o 
que apresentar a menor variância. 
 
 * SUFICIENTE: Um estimador é suficiente se contém o máximo de informações 
com referência ao parâmetro por ele estimado, ou seja, quando consegue sumarizar, 
"condensar" a informação em uma amostra a respeito do parâmetro a ser estimado. 
 
 * CONSISTENTE: Entre dois estimadores para o mesmo parâmetro, será 
considerado consistente aquele que for não tendencioso e de variância mínima. 
 
 A estimação pode ser por ponto ou por intervalo. A estimação por ponto é um 
valor obtido pelos cálculos sobre os valores observados de uma variável que serve 
como aproximação do parâmetro. A estimação por intervalo fornece um intervalo em 
torno da estimativa por ponto, de modo que este intervalo tenha uma probabilidade 
de conter o parâmetro. 
 
 
11.1. Estimação por Ponto 
 
 Consiste em fornecer a melhor estimativa possível para o parâmetro que será 
estimado através de um único valor. 
 
Exemplos: 1) A melhor estimador da média populacional µ é x , pois é um estimador 
não tendencioso, eficiente, suficiente e consistente. 
 2) Sabendo que a variância da população σ
µ
2
2
1=
−
=
∑ ( )x
N
i
i
N
, poderíamos estimá-
la por: s
ix x
n
i
n
2 1
2
=
−
=
∑ ( )
, utilizando x , pois não conhecemos µ . Porém este estimador é 
tendencioso para σ 2, pois a média dos valores desta estatística para cada amostra possível 
de tamanho n é diferente de σ 2 . 
 
 Para tornar este estimador não tendencioso é necessário multiplicá-lo por 
n
n −1
. 
Teremos, então: s
n
n
x x
n
x x
n
i
i
n
i
i
n
2
2
1
2
1
1 1
=
−
−
=
−
−
= =
∑ ∑
.
( ) ( )
 
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
Exemplo: Um pesquisador está estudando a resistência de determinado material sob certas 
condições. Uma amostra aleatoriamente escolhida de 9 elementos forneceu os seguintes 
valores: 4,9 7,0 8,1 4,5 5,6 6,8 7,2 5,7 6,2. 
 Estime a média e o desvio-padrão da resistência deste material. 
 
 
 
 
 
 
 
11.2. Estimação por intervaloA estimação por intervalo nos fornece um intervalo de valores centrados na 
estatística amostral, no qual julgamos estar o parâmetro com uma probabilidade conhecida 
de erro. 
 Vimos que para uma população podemos retirar K amostras diferentes para um 
determinado tamanho de amostra n. Cada amostra possível tem um valor como estimativa e 
cada estimativa fornecerá um intervalo diferente para o parâmetro. 
 Assim, temos uma probabilidade (1-α) de que o valor do parâmetro esteja contido 
no intervalo estimado, chamado nível de confiança. Por esta razão, chamamos de intervalos 
de confiança. 
 O intervalo de confiança dependerá da distribuição amostral do estimador que foi 
utilizado para estimar o parâmetro. 
 
 
11.2.1. Estimação por Intervalo para a Média Populacional 
 
 Sabemos que as médias se distribuem segundo uma distribuição normal com média 
µ e desvio-padrão 
σ
n
. Quando retiramos uma amostra, a média x é uma das muitas 
médias possíveis de se obter de uma população. 
 
 Assim se adotarmos um nível de confiança de 95%, poderemos dizer que 95% das 
médias amostrais estarão dentro de 1,96 erros padrão. 
Aulas 12 a 20 – Profa. Liane MAT02219 
 
 *Erro Absoluto Máximo de Estimação: O erro absoluto máximo de 
estimação diz respeito a diferença entre a média amostral e a média populacional. 
 ε µ= −x 
 
 Sabendo que o intervalo de confiança tem centro na média amostral, é determinado 
da seguinte maneira: 
 x ± ε onde: ε
σ
= z
n
 
 
 Quando n < 30 e σ desconhecido, usamos a distribuição t-student com n-1 graus de 
liberdade, sendo ε = t
s
n
. 
 
 
*CASO 1: INTERVALO DE CONFIANÇA PARA MÉDIA COM VARIÂNCIA 
POPULACIONAL CONHECIDA. 
 
 Para uma variável aleatória X , com média desconhecida e variância conhecida σ 2, 
uma amostra aleatória é retirada e calcula-se x . O intervalo de confiança com nível de 
confiança 1− α é dado por: 
 
 x Z
n
x Z
n
− ≤ ≤ +α α
σ
µ
σ
2 2
. . 
 
Exemplo: Uma máquina enche pacotes de café com uma variância igual a 100 g 2 . Ela 
estava regulada para enchê-los com 500g, em média. Agora ela se desregulou, e queremos 
saber qual a nova média µ . Uma amostra de 25 pacotes apresentou média igual a 485g. 
Estime a média por intervalo ao nível de 95% de confiança: 
 
 
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
*CASO 2: INTERVALO DE CONFIANÇA PARA MÉDIA DE UMA DISTRIBUIÇÃO 
NORMAL COM VARIÂNCIA σ 2 DESCONHECIDA. 
 
 Suponha que X seja uma variável aleatória de uma distribuição normal com média 
µ desconhecida e variância σ 2 desconhecida, retira-se um amostra aleatória e calcula-se a 
média amostral x e a variância amostral s2 . Utilizando a distribuição t-student: 
 x t
s
n
x t
s
nn n
− ≤ ≤ +− −α αµ2 1 2 1, ,
. . 
 
OBS: Quando n > 30, se pode utilizar a distribuição normal ou a distribuição t-student. 
 
Exemplo: Um pesquisador está estudando a resistência de um determinado material sob 
determinadas condições. Ele sabe que essa variável é normalmente distribuída. Foi retirado 
uma amostra de 9 unidades 4,9 ; 7,0 ; 8,1; 4,5 ; 5,6; 6,8 ; 7,2 ; 5,7; 6,2. 
 
a) Determine um intervalo de 90% de confiança para a resistência média populacional. 
b) Determine um intervalo de 95% de confiança para a resistência média populacional. 
c) Verifique os resultados de (a) e (b), e conclua a respeito do erro de estimação e o nível de 
confiança? 
 
 
 
 
 
 
 
 
 
 
11.2.2. Estimação por Intervalo para a Proporção Populacional: 
 
 *Intervalo de confiança para a proporção: A distribuição de proporções 
amostrais indica o quão provável é determinado conjunto de proporções amostrais. 
 Seja, Π: proporção populacional de determinada característica e 
 p: proporção amostral de dessa característica 
então o parâmetro Π de uma distribuição binomial, por exemplo, a proporção de peças 
defeituosas, poderá ter em uma amostra de n elementos tomada, "x" observações são 
possuidoras de determinada característica, a proporção de defeituosos na amostra estimado 
por p
x
n
= . 
 Para n<30 utilizaríamos a distribuição Binomial, lembrando que a distribuição 
amostral das proporções segue uma distribuição binomial. 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
Quando n>30 e p>0,1, poderemos usar a distribuição normal como aproximação da 
binomial resultando no intervalo de confiança: 
 
 p Z
p p
n
p Z
p p
n
−
−
≤ ≤ +
−
α α
2 2
1 1( ) ( )
Π 
 
Exemplo: Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre determinado 
produto e 60% destas pessoas preferiam a marca A. Estime um intervalo de 95% de 
confiança para a proporção populacional das pessoas que preferem a marca A. 
 
 
 
 
 
11.3. Tamanho mínimo da amostra 
 
 *PARA ESTIMAR MÉDIA POPULACIONAL: Para determinarmos o tamanho da 
amostra, dependemos dos seguintes fatores: 
� O nível de confiança a ser utilizado na estimação; 
� O valor da variância absoluta da variável; 
� O erro absoluto máximo de estimação: 
� O custo financeiro de pesquisa 
 
 Quando conhecemos a variância populacional, podemos usar a seguinte fórmula: 
 n
Z
=
2 2
2
σ
ε
 
 
Exemplo: Qual o tamanho da amostra necessário para estimar a média de uma população 
cujo desvio-padrão é aproximadamente 4 mm, com 98% de confiança e precisão de 0,5 
mm? 
 
 
 
 
 
 Sem conhecimento da variabilidade populacional estimamos a variância 
populacional através de uma amostra piloto de tamanho arbitrário. Assim: 
 n
tn S= −
( ' , . )1 2
2 2
2
α
ε
 
 
Aulas 12 a 20 – Profa. Liane MAT02219 
Exemplo: Foram realizadas 20 medidas do tempo gasto (em minutos) para se fabricar um 
componente industrial como uma amostra piloto, com o objetivo de estimarmos o tempo 
médio de produção(populacional), obtendo-se: 
 
13 15 12 14 17 15 16 15 14 16 
17 14 16 15 15 13 14 15 16 15 
 
 Verifique se estes dados são suficientes para estimar a média populacional com 95 
% de confiança e precisão de 30 seg. Caso a amostra não seja suficiente, qual é o tamanho 
de amostra complementar? 
 
 
 
 
 
 
 
 *PARA ESTIMAR A PROPORÇÃO POPULACIONAL: Analogamente ao caso da 
média têm-se: 
 n
Z
=
α
ε
2
2
2
. p
^
. (1- p
^
) 
onde, p
^
 é a proporção populacional ou alguma idéia da mesma obtida em estudos 
anteriores similares. Caso não se saiba o valor de p
^
, podemos estimá-lo através de uma 
amostra piloto n' ou usar p = 0,5. 
 
Exemplo: Numa pesquisa de mercado, 57 das 150 pessoas entrevistadas afirmam que 
seriam compradoras de certo produto a ser lançado. Essa amostra é suficiente para estimar a 
proporção real de futuros compradores, com uma precisão de 0,08 e confiança 95%?

Outros materiais