Buscar

APOSTILA DE ESTATÍSTICA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

19 
 
Variável Aleatória Discreta 
 
Uma função X, definida sobre o espaço amostral e assumindo valores num conjunto 
enumerável de pontos é dita uma variável aleatória discreta. 
Uma variável aleatória X do tipo discreto estará bem caracterizada se indicarmos os 
possíveis valores x1, x2, …, xk que ela pode assumir e as respectivas probabilidades f(x1), f(x2), …, 
f(xk), ou seja, se conhecemos a sua função de probabilidade (x; f(x)), sendo f(x) = P(X = x). O 
conjunto de pares ordenados (x; f(x)) é a função de probabilidade ou distribuição de probabilidade 
da v.a. discreta X se: 
 
i) ( ) 0, para todo if x i ; ii) 
1
( ) 1i
i
f x


 
Exemplo 1: Se um experimento consiste em verificar o número de circuitos defeituosos num 
sistema formado por quatro circuitos, a função: X = “número de circuitos defeituosos”, define uma 
variável aleatória discreta, que pode assumir cinco valores possíveis: 0, 1, 2, 3 ou 4. 
 
Função de distribuição acumulada F(x) 
A função de distribuição acumulada fornece a probabilidade de que a variável em questão 
esteja abaixo de um determinado valor. Em geral, ela é representada por     ou F x x e assim: 
           1 2
1
k
k k k i
i
F x P X X P X x P X x P X x P X x

           . 
Exemplo 2: Considere a variável aleatória discreta X com a seguinte função de probabilidade: 
X 0 1 2 3 4 
P[X = x] 0,1 0,3 0,4 0,1 0,1 1,0 
 
Então, sua função distribuição acumulada é: 
X 0 1 2 3 4 
F(x) 0,1 0,4 0,8 0,9 1,0 
 
A distribuição de probabilidade da variável aleatória X pode ser representada graficamente por: 
 
 
 
Figura – Gráfico da função distribuição acumulada da variável aleatória X. 
 
 
20 
 
Exemplo 3: Se uma agência vende 50% de seu estoque de carro importado com “airbag”, 
determine a função de probabilidade e a função de distribuição acumulada para a variável número 
de carros com “airbags” entre os próximos 4 carros vendidos na agência. 
Resolução: Seja A carro vendido tem “airbag” e S o carro vendido sem “airbag”. Como 50% dos 
carros vendidos tem airbag, então P(A) = P(S) = 0,5. O espaço amostral possui 24 = 16 pontos. A 
v.a. número de carros com “airbag” entre os 4 vendidos pode assumir os valores 0, 1, 2, 3, 4. O 
numero de maneiras de se obter cada valor no espaço amostral é: 
 
 
A função de probabilidade pode ser apresentada pela fórmula 4( ) ; x = 0,1,2,3,4
16
xCf x  
ou na tabela, 
 
Tabela: Função de probabilidade para a v.a. número de carros com airbag. 
 
X 0 1 2 3 4  
5
1
i
i
P X x

 
P[X = x] 1/16 4/16 6/16 4/16 1/16 1 
 
 
 
 
 
Observa-se que a distribuição de probabilidade acima é uma função de probabilidade pois, 
as condições (i) e (ii) foram satisfeitas, isto é, todas as probabilidades são maiores que zero e, a 
soma das probabilidades é igual a um. 
Exercício: Representar graficamente a função de probabilidade. Obter a função de 
distribuição acumulada e representar graficamente. 
 
 
 
 
 
Variável aleatória contínua 
 
Uma variável aleatória cujos valores são expressos em uma escala contínua é dita uma 
variável aleatória contínua. Uma v.a. contínua tem probabilidade zero de assumir exatamente um 
valor P(X = x ) = 0. As probabilidades são calculadas em intervalos como P(a < X < b ). Exemplos 
de v.a. contínuas são, o peso de recém-nascidos, a altura dos alunos, a temperatura ambiente, o 
diâmetro de peças. 
 
Função de densidade de probabilidade de uma v.a. contínua: 
 
A função f(x) é uma função densidade de probabilidade (fdp) da v.a. X se: 
0
4
1
4
2
4
3
4
4
4
0 1
1 4
2 6
3 4
4 1
C
C
C
C
C
 
 
 
 
 
 maneira
 maneiras
 maneiras
 maneiras
 maneira
21 
 
 
i)   0, f x x   ; 
ii)   1f x dx


 . 
 
Observação: 
       
      
b
a
P a x b P a x b P X a P X b
P a x b P a x b f x dx
         
       
. 
 
Função de distribuição acumulada F(x) de uma v.a. contínua X. 
    ( )
x
F x P X x f t dt

    . 
Na função de distribuição acumulada tem-se: 
a)  F x 0 1; 
b) se x x1 2 , então,    F x F x1 2 ; 
c)   ( ) ( )P a X b F b F a    
d) ( )( ) '( )dF xf x F x
dx
  
e)  F   0 
f)  F   1 
g) F(x) é uma função não decrescente. 
 
 
Exemplo: Suponha que o erro na temperatura de reação (em °C) para um experimento de 
laboratório seja a v.a. X com fdp dada por: 
 
2
, -1< x < 2( ) 3
0, caso contrario 
x
f x

 

 
 
a) Verifique a condição (ii) 
b) Determine P(o < X < 1 ). 
c) Determine F(x) e use-a para determinar P(o < X < 1 ). Esboce o gráfico. 
 
 
 
Esperança matemática ou valor esperado de uma variável aleatória 
 
Em uma distribuição de probabilidade, ou função de densidade de probabilidade, existem 
valores numéricos muito importantes, chamados de parâmetros da distribuição, que são a 
esperança matemática, a variância e o desvio padrão. 
A esperança matemática da variável aleatória X - E(X) - é também chamada de valor 
esperado, e representa a média (aritmética) ou valor médio da variável. 
 
22 
 
Definição: Esperança matemática: 
Seja X uma variável aleatória com distribuição de probabilidade f(x). A média ou 
esperança matemática de X é dada por: 
 
 
xx
xxpxxfXE )()()( , se X for discreta; e 
dxxxfXE 


 )()( , se X for contínua. 
 
Propriedades da Esperança Matemática 
Supondo k uma constante e X e Y variáveis aleatórias, podemos definir as seguintes propriedades 
da esperança matemática: 
i) E(k) = k 
ii) E(kX) = kE(X) 
iii) E(X  Y) = E(X)  E(Y) 
iv) E(X  k) = E(X)  k 
v) Se X e Y são variáveis aleatórias independentes, então: E(XY) = E(X). E(Y) 
Exemplos: 1) Para o exemplo do carro com “airbag”, calcular a esperança de X. 
 
2) Em um jogo de azar, um homem recebe $5 se consegue três caras ou três coroas, quando três 
moedas são jogadas, e paga $3 quando uma ou duas caras são obtidas. Qual é o seu ganho 
esperado? O jogo pode ser considerado justo? 
 
 
3) Seja X a variável que denota a vida, em horas, de certo equipamento eletrônico, com fdp: 
3
20.000 , x > 100
f (x) x
0 , caso contrário 

 

 
Qual o tempo médio de duração do equipamento? 
 
 
Variância e desvio padrão de uma variável aleatória X. 
 
A variância da variável aleatória X - Var(X) – é uma medida de dispersão (ou 
concentração) de probabilidades em torno da média. O desvio padrão - DP(X)- é a raiz quadrada 
da variância. 
 
Definição: Seja X uma variável aleatória com distribuição de probabilidade f(x). A variância 
Var(X) = 2 de X é: 
 
i) Se X for discreta, com 
x
xfxXE )()( 22 : 
23 
 
 22 2 2( ) ( ) ( ) ( ) ( )
x
Var X f x x E X E X       ; e 
 
ii) Se X for contínua com 


 )()( 22 xfxXE : 
 22 2 2( ) ( ) ( ) ( ) ( )Var X x f x dx E X E X 


     , 
 
Desvio padrão ( ) ( )xDP X Var X  
 
 
Exemplos: 
1) Seja X a variável aleatória discreta número de automóveis usados com propósitos comerciais 
durante um dia de trabalho. A distribuição de probabilidades para as empresas A e B estão nas 
tabelas a seguir. 
 
 Empresa A EmpresaB 
x 1 2 3 x 0 1 2 3 4 
f(x) 0,3 0,4 0,3 f(x) 0,2 0,1 0,3 0,3 0,1 
 
Mostre que a variância da distribuição de probabilidade da empresa B é maior do que a da empresa 
A. Represente graficamente as distribuições. 
 
 
 
 
 
2) A demanda semanal por refrigerante, em milhares de litros, de uma loja de conveniência é a 
variável aleatória contínua X, que tem como densidade de probabilidade: 
 
2(x 1), 1<x <2
f (x)0 , caso contrário 

 

 
Determine a média e a variância de X. 
 
 
 
 
 
 
 
 
 
 
 
 
 
24 
 
Modelos probabilísticos para variáveis aleatórias discretas 
 
 As observações geradas por diferentes experimentos podem, por vezes, apresentar o 
mesmo tipo geral de comportamento. As variáveis aleatórias associadas a esses experimentos 
podem então ser descritas pela mesma distribuição de probabilidade, ou representadas por uma 
única fórmula. 
 Para descrever o comportamento de muitas das variáveis aleatórias, existem importantes 
distribuições de probabilidade, também chamadas de modelos probabilísticos. 
 Alguns dos principais modelos probabilísticos discretos são: 
- Distribuição uniforme discreta; - Distribuição de Bernoulli; - Distribuição Binomial 
- Distribuição Poisson; - Distribuição Geométrica; - Distribuição Hipergeométrica; 
- Distribuição Binomial negativa (Pascal); - Distribuição Polinomial. 
 
1. Distribuição uniforme discreta 
É a mais simples das distribuições de probabilidades discretas. A variável aleatória assume cada 
um de seus valores com igual probabilidade. 
 
Definição: Considere uma v.a. X cujos valores são x1, x2, ..., xk, todos têm igual probabilidade de 
ocorrência  1k . Então, a v. a. X tem distribuição de probabilidade uniforme discreta dada por: 
  1f (x;k) P X x
k
   ; x = x1, x2, ..., xk. 
A notação f(x;k) indica que a distribuição depende do parâmetro k. 
 
Exemplos. 
1) Quando selecionamos aleatoriamente uma lâmpada, em uma caixa com 4 lâmpadas, sendo uma 
de 40, uma de 60, uma de 75 e uma de 100 watts, cada elemento do espaço amostral ocorre com 
probabilidade de  14 . Portanto, temos a variável aleatória X com distribuição uniforme: 
   1f (x;4) P X x
4
   ; x = 40, 60, 75, 100. 
 
2) No lançamento de um dado:   1f (x;6) P X x
6
   
x 1 2 3 4 5 6 
f (x)  16  16  16  16  16  16 
 
Representação gráfica: (exemplo) 
 
Média e variância da distribuição uniforme (parâmetros característicos da distribuição): 
x
1E(X) x
k
  ou 1( ) 2


kE X e 
x
1Var(X) (x )
k
  ou 
2 1( )
12


kVar X 
 
 
 
 
25 
 
2. Distribuição de Bernoulli 
 
 Considere uma única realização de um experimento aleatório, no qual se pode obter 
sucesso, com probabilidade p ou fracasso com probabilidade q, sendo p + q = 1. Seja a v.a. X igual 
ao número de sucessos em uma única tentativa. Então: 
 
O, fracasso com P(X 0) q
X
1, sucesso com P(X 1) p
 
 
 
 
Nessas condições a v. a. X tem distribuição de Bernoulli e sua função de probabilidade é dada por: 
 
x 1 xP(X x) p q   ; sendo q = 1- p. 
Os parâmetros da distribuição de Bernoulli são: 
1
0
( ) ( ) 0 1 ( )

     
x
E X xP X x q p E X p e ( ) (1 )  Var X p p pq 
 
Exemplos de variáveis de Bernoulli: 
Em uma linha de montagem, uma peça selecionada pode ser defeituosa (sucesso) ou não 
defeituosa (fracasso). 
No lançamento de uma moeda, cara (sucesso) ou coroa (fracasso). 
Uma semente avaliada pode germinar (sucesso) ou não germinar (fracasso). 
 
Exemplo: 1) Considere um experimento que consiste no lançamento de um dado e verifique a 
ocorrência da face 5 (sucesso) ou não. Determine a função de probabilidade e a distribuição 
acumulada. 
 
 
 
 
 
2) Uma urna contém 4 bolas vermelhas e 6 brancas. Uma bola é extraída, observada sua cor e 
reposta na urna. Numa única extração somente dois resultados podem ocorrer: bola vermelha ou 
bola branca. 
a) Defina uma variável aleatória X neste experimento e indique o modelo de distribuição de 
probabilidades mais adequado para descrever seu comportamento. 
b) Determine a função de probabilidade de X e seu respectivo gráfico. 
c) Determine a função de distribuição de X e seu respectivo gráfico. 
d) Determine a esperança matemática e a variância de X. Interprete essas medidas. 
 
 
 
 
 
 
 
 
 
 
 
26 
 
3. Distribuição Binomial 
 
É uma generalização da distribuição de Bernoulli. É a mais importante das distribuições teóricas 
de probabilidade para variáveis discretas. São realizados n ensaios independentes de Bernoulli. A 
probabilidade de sucesso em cada ensaio é constante. Como as probabilidades p de sucesso se 
mantêm constantes em cada ensaio, a distribuição binomial é indicada para os casos em que a 
amostragem é feita com reposição. 
 
Definição: Seja a variável aleatória X que conta o número total de sucessos obtidos numa 
seqüência de n ensaios independentes de Bernoulli. A variável X segue uma distribuição binomial 
com parâmetros n e p, denotada por X ~ b(x; n, p), e tem função de probabilidade: 
 
n x n x x x n x
x nb(x; n,p) P(X x) ( )p q C p q , x = 0, 1, 2, ..., n
     
 
n é o nº de repetições do experimento; 
x é o nº desejado de sucessos; 
n - x é o nº esperado de fracassos; 
p é a probabilidade de sucesso num ensaio individual; 
1 – p é a probabilidade de fracasso num ensaio individual; 
 
Exemplos: 
1. A probabilidade de um produto fabricado não atender as especificações de projeto é igual a 5% 
(produto não-conforme). São selecionadas ao acaso 8 unidades deste produto. 
a) Defina uma variável aleatória X neste experimento e indique o modelo de distribuição de 
probabilidades mais adequado para descrever seu comportamento probabilístico. 
b) Determine a função de probabilidade de X e seu respectivo gráfico. 
c) Determine a função de distribuição de X e seu respectivo gráfico. 
d) Determine a esperança matemática e a variância de X. Interprete essas medidas. 
e) Qual a probabilidade de no máximo 5 não atenderem as especificações? 
f) Qual a probabilidade de pelo menos 3 não atenderem as especificações? 
 
 
 
 
 
 
 
 
2. A probabilidade de que certo tipo de componente sobreviva a um teste de choque é de ¾. 
Determine a probabilidade de que dos próximos quatro componentes testados, 
a) exatamente 2 sobrevivam. 
b) pelo menos 2 sobrevivam. 
c) no máximo 2 sobrevivam. 
 
 
 
Os parâmetros da distribuição Binomial são: 
( ) E X np e 2 ( ) Var X npq 
 
27 
 
4. Distribuição Poisson 
 
 A distribuição Poisson ocorre quando se deseja contar o número de eventos de um certo 
tipo, verificados em um intervalo de tempo, de superfície (área) ou volume. Uma variável aleatória 
X com distribuição Poisson pode assumir infinitos valores no conjunto dos inteiros positivos (v.a. 
discreta). 
Exemplos de variáveis de Poisson: 
- Número de telefonemas recebidos por hora em um escritório. 
- Número de bactérias por unidade de área em uma lâmina. 
- Número de erros de digitação por página. 
- Numero de falhas de um computador em um dia de operação. 
 
 Uma variável aleatória X com distribuição Poisson tem: 
 
 função de probabilidade: 
xef (x; ) P(X x)
x!
 
    
 
parâmetros: x E(X) Var(X)      
 
 A distribuição Poisson tem aplicação também nos casos em que os parâmetros n e p da 
distribuição binomial dificultam o cálculo por esta distribuição (eventos raros). Nesses casos, a 
Poisson é usada como aproximação da binomial, sendo a aproximação considerada adequada 
quando n é “grande” e p é “pequeno” n 50 e p 0,10  . Neste caso a media da Poisson será:  = 
 = n.p. 
 
Exemplos. 
1) Durante um experimento de laboratório, o número médio de partículas que passam por um 
contador em um milésimo de segundo é quatro. 
a) Qual é a probabilidade de que seis partículas entrem em um dado contador, em um específico 
milésimo de segundo? R: 0,1042 
b) Qual é a probabilidade de que 10 partículas entrem no contador, em 5 milésimos de segundo? 
c) Qual é a probabilidade de que no mínimo uma partícula entre em um dado contador, em dois 
milésimos desegundo? 
 
 
 
2) Em certa instalação industrial, acidentes ocorrem com baixa freqüência. Sabe-se que a 
probabilidade de um acidente em certo dia é de 0,005, e os acidentes são independentes uns dos 
outros. 
a) Qual é a probabilidade de que, em qualquer período de 400 dias, haja 1 acidente em um dia? 
0,271 
b) Qual é a probabilidade de que haja no máximo três dias com acidente? R. 0,857 
 
 
 
4. Distribuição Geométrica 
 
 É aplicada nas mesmas condições da binomial exceto pelo fato de que o número de 
tentativas não é fixo. Utilizada quando desejamos saber a probabilidade que o primeiro evento de 
28 
 
sucesso ocorra na tentativa de número x. Desta forma, antes do evento x (sucesso) com 
probabilidade p, tivemos (x-1) fracassos, com probabilidade q = 1 – p. 
A v.a. X, definida como sendo o número de tentativas necessárias para se obter o primeiro sucesso, 
segue a distribuição geométrica, e sua função de probabilidade será: 
 
x 1P(X x) pq   Parâmetros: 2
1 qE(X) Var(x)
p p
    
 
Observe que quanto menor for o valor de p (probabilidade de sucesso), maior será o número de 
experiências até o primeiro sucesso. 
Essa distribuição é muito utilizada em processos de controle de qualidade, e a variável é, muitas 
vezes, denominada de v.a. discreta de tempo de espera, pois representa a espera, em termos do 
número de falhas, até que ocorra o primeiro sucesso. 
 
Exemplos 
 
1) Um rapaz está numa festa e sabe que a probabilidade de uma menina aceitar um convite para 
dançar é 0,2. Quantas recusas ele espera receber antes de conseguir uma parceira de dança? 
 
A probabilidade de sucesso é p = 0,2 e a probabilidade de falha, q = 1 − 0,2 = 0,8. A média é 
dada por: E(X) = 1/ p = 1/0,2 = 5. Portanto, ele pode esperar 4 negativas antes de achar uma 
parceira. 
 
 
2) Um casal recorreu a uma técnica de inseminação artificial, cuja eficiência é de 20% e o custo de 
cada inseminação de U$ 2000. 
a) Qual a probabilidade de o casal ter êxito na primeira inseminação? 
b) Qual o custo esperado para se engravidar por este método? 
 
 
 
 
5. Distribuição binomial negativa (Pascal) 
 
 É uma generalização da distribuição Geométrica. Consiste em determinar a probabilidade 
de ocorrer o sucesso de número r da v. a.. 
Se x conta o número de eventos até que o r – ésimo sucesso ocorra, então, a v.a. X tem 
distribuição binomial negativa, e sua função de probabilidade é: 
r 1 r x r
x 1P(X x) C p q
 
  Parâmetros: 
2
r rqE(X) Var(X)
p p
 
 
Exemplo: Um vendedor de uma loja de eletrodomésticos tem por cota realizar 3 vendas por dia. 
Cada cliente, atendido por esse vendedor tem probabilidade 0,25 de efetuar uma compra qualquer. 
Qual a probabilidade do vendedor ter que atender a 5 clientes para completar sua cota? 0,0527 
Em média quantos clientes ele deve atender para cumprir sua cota? 12 
X=5 r=3 p=0,25 
 
 
 
 
 
29 
 
6. Distribuição hipergeométrica 
 
 Aplicada em situações onde se vai proceder extrações casuais sem reposição, de uma 
população que apresenta dois atributos (sucesso e fracasso). É muito utilizada em testes de 
amostragem por aceitação (de produtos), testes eletrônicos e garantia de qualidade, em que o item 
testado é destruído e não pode ser reposto. 
 Considere uma população de N objetos, r dos quais tem o atributo A e N – r tem o atributo 
B. Um grupo de n elementos é selecionado ao acaso sem reposição. Estamos interessados em 
calcular a probabilidade de que este grupo contenha X elementos com o atributo A. Esta 
probabilidade será dada por: 
x n x
r N r
n
N
C CP(X x)
C

  Parâmetros: ; ( ) ; V ( )
1

   

r N np E X np ar X npq
N N
 
 
N = tamanho da população, n = tamanho da amostra, r = número de sucessos na população, x = 
numero de sucessos na amostra 
 
Exemplo 1: Em um determinado processo de produção a cada 100 peças produzidas 5 são 
selecionadas e destruídas para análises. Espera-se que 10% das peças apresentem problemas na 
inspeção. 
a) Qual a probabilidade de que em um teste não ocorra peças com problemas 
b) Qual a probabilidade de obter pelo menos 2 com problemas 
c) Determinar o número médio e o desvio padrão de peças com problemas por inspeção. 
N = 100. n = 5; r = 10 
0 5
10 90
5
100
) ( 0) 0,5837  C Ca P X
C
; 
1 4
10 90
5
100
) ( 1) 1 (0,5837 ) 0,0769    C Cb P X
C
 
 
) ( ) . 5.0,1 0,5
100 5( ) . . . 5.0,1.0,9. 10,68
1 5 1
3, 27
   
 
 
 

c E X n p
N nVar X n p q
n
Desvio padrão

 
 
Exemplo 2: Uma remessa de 800 estabilizadores de tensão é adquirida por uma Empresa. São 
inspecionados 20 aparelhos da remessa, que será aceita se ocorrer no máximo um defeituoso. Há 
80 defeituosos no lote. Qual a probabilidade do lote ser aceito? 0,3884 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
30 
 
Modelos probabilísticos para variáveis aleatórias contínuas 
 
1. Distribuição uniforme contínua 
 
Na distribuição uniforme, a probabilidade de se gerar qualquer ponto em um intervalo contido no 
espaço amostral é proporcional ao tamanho do intervalo. 
 Uma variável aleatória contínua X tem distribuição uniforme no intervalo [a,b] se sua 
função densidade de probabilidade é dada por: 
 
1 a x b
f (x) b a
0 caso contrário
   

 
2( )( ) ; ( )
2 12
 
 
a b b aE X Var X ; ( ) 1
b
a
f x (área do retângulo) 
 f(x) 
 
 
 1/(b-a) 
 
 
 a b x 
Figura 1– Função Densidade de Probabilidade para a Distribuição Uniforme 
 
 F(x) 
 
 
 
 
 
Figura 2 – Função de distribuição acumulada Uniforme 
 
 
2. Distribuição normal 
 
A distribuição normal ou de Gauss ou Gaussiana é uma das mais importantes distribuições 
da estatística. Além de descrever uma série de fenômenos físicos, naturais, financeiros, nas 
indústrias e nas pesquisas em geral, possui grande uso na estatística inferencial. É inteiramente 
descrita por seus parâmetros média  e desvio padrão , ou seja, conhecendo-se estes é possível 
determinar qualquer probabilidade em uma distribuição Normal. 
 
- Seu gráfico tem a forma campanular (sino) 
 
 - É uma distribuição simétrica em relação à média 
 
- É duplamente assintótica em relação ao eixo das abscissas 
 
- Tem dois pontos de inflexão que correspondem à media ± desvio padrão. 
 
31 
 
Uma variável aleatória contínua X tem uma distribuição normal ou gaussiana se a função 
densidade de probabilidade for dada por: 
2
2
(x )
21f (x) e
2




 para - < x <  , - <  <  e 2 > 0 
 
Notação: X~N( , 2): X tem distribuição normal com média  =E(X) e variância Var(X) = 2. 
 
Probabilidades (áreas) especiais: 
 ( ) 0,68    P x x   ; ( 2 2 ) 0,95    P x x   ; ( 3 3 ) 0,99    P x x   
 
 
 
Função de distribuição acumulada: 
x
F(x) P(X x) f (x)dx

    
Cálculo de probabilidades: Suponha a v.a. X~N( , 2) 
 
2
2
(x )b b
2
a a
1P(a x b) f (x)dx e dx
2


   
 
 
A integral não pode ser resolvida analiticamente. 
 
 
Distribuição normal padrão (padronizada ou reduzida) 
 
Seja 2~ ( , )X N   . Subtraímos de x a média, dividimos pelo desvio padrão e obtemos a variável 
Z, que tem média zero e variância 1, sendo chamada de distribuição normal padronizada;~ (0,1)Z N cuja fdp é 
2(Z)
21f (Z) e
2



 ; sendo  XZ 

. 
 
Com esta densidade, é possível resolver a integral e calcular probabilidades de intervalos, que 
podem ser tabelados para a variável Z. A variável X é transformada na variável Z, já que a 
transformação preserva a área abaixo da curva, ou seja, 1 2 1 2P(x x x ) P(z Z z )     , 
sendo 11
XZ 


 e 22
XZ 


 . 
 
 
A tabela de probabilidade Z, e o gráfico. 
 
 
 (0 ) P Z z 
 
( ) 1f x dx



32 
 
 
Exemplo de uso da tabela: P(0 < Z < 1,64)= 0,4495 
 
Calcular as seguintes probabilidades: 
a) P(0 < Z < 1,28) b) P(Z>1,96) 
c) P(Z< 2,57) d) P(Z< - 1,33) 
e) P(Z> -1,00) f) P( -1,00 < Z < 1,45) 
g) P( 1,00< Z < 1,96) 
 
Determinar os valores de k para: 
a) P(Z> k) = 0,0505 b) P( Z < k) = 0,9949 
c) P( Z < k) = 0,0505 d) P(Z> K) = 0,8997 
e) P(-1,00 < Z < k) = 0,6826 
 
 
 
 
Exemplo1. Os registros indicam que o tempo médio para se fazer um teste é aproximadamente 
normal, com média de 50 min e variância 20 min2. Nestas condições, determinar: 
a) a porcentagem de candidatos que levam menos de 45 min. 
b) se o tempo concedido é de 1h, que porcentagem não conseguirá terminar o teste. 
 
 
 
 
 
 
 
Exemplo 2. Em um processo industrial, as especificações exigem que o diâmetro de um rolamento 
tenha medida de 3 0,01 cm . Sabe-se que a medida do diâmetro tem distribuição normal com 
média 3cm e desvio padrão de 0,005. Qual a porcentagem de peças que será inutilizada por estar 
fora das especificações? R: 0,0456 
 
 
 
 
 
 
Exemplo 3. A nota média em um exame é 74, e o desvio padrão é 7. Se 12% da classe recebe A e 
as notas seguem uma distribuição normal, qual é o A mais baixo possível, e o B mais baixo 
possível (inteiros)? R: 83 e82 
 
 
 
 
 
 
 
 
 
 
33 
 
3. Distribuição exponencial 
 
A distribuição exponencial tem ampla aplicação em engenharia. É muito usada para 
modelar o tempo e o espaço entre ocorrências de um evento Poisson. 
- Exemplo: v.a. X número de veículos que passam por um cruzamento (X ~Poisson); 
 v.a. T tempo entre as chegadas desses veículos no cruzamento (T ~ exponencial). 
Usada para calcular tempo de falhas. 
- Exemplo: intervalo de tempo entre o instante em que uma peça foi sujeita a esforço mecânico e o 
instante em que ocorreu a falha. 
 
 Uma v.a. contínua tem X tem distribuição exponencial com parâmetro  se sua fdp é dada 
por, 
 
 
1 ; x 0,
0; caso contrário 
x
e sef x

 


 


 
 
 
Média e variância: 2 2( ) ; V ( )X XE X ar X       . 
 
Exemplo 1. A duração em horas de certo equipamento segue a distribuição exponencial com fdp 
 
 
5001 ; x 0
500
0; x < 0 
x
e sef x


 


 
 
Calcular a duração média e o desvio padrão. 
Calcule a probabilidade de um equipamento durar mais que 500 horas. 
 
500
P(X 500) f (x)dx

   = (R: 0,3678) 
 
 
 
 
 
Exemplo 2. Um sistema possui certo tipo de componente, cujo tempo, em anos, até a falha é 
modelado pela distribuição exponencial, com tempo médio até a falha de 5  . Se cinco desses 
componentes são instalados em sistemas diferentes, calcule a probabilidade de que pelo menos 
dois ainda estejam funcionando após 8 anos, sendo que o número de componentes funcionando 
segue a distribuição binomial. R : 0,2627 
 
 
 
 
 
 
 
34 
 
Amostragem e distribuições amostrais 
 
População ou Universo: é o conjunto de indivíduos ou elementos que apresentam uma ou mais 
características em comum (universo sob investigação). 
Amostra: é um subconjunto finito de uma população, que preserva as características dessa 
população (representatividade). 
Amostragem: é o ato de tomar amostras da população. Pode ser com ou sem reposição. 
Censo: Estudo de todos os elementos da população. 
Parâmetro: Medida usada para descrever uma característica populacional. Seu valor é geralmente 
desconhecido. 
Estimador: é uma variável que é função dos dados amostrais. Permite estimar o valor de um 
parâmetro. 
Estimativa: é o valor numérico obtido a partir do estimador. 
 
Exemplos: 
1) Estudar a proporção de indivíduos, em uma cidade, que são favoráveis a certo projeto 
governamental. Uma amostra de 200 pessoas é sorteada, e a opinião de cada uma é registrada 
como sendo a favor ou contra o projeto; 
2) Investigar a duração de vida de um novo tipo de lâmpada: 100 lâmpadas do novo tio são 
deixadas acesas até queimarem. A duração em horas de cada lâmpada é registrada. 
3) a escolha de jogadores de futebol para fazer o exame de antidoping. 
 
 Amostragem probabilística: Quando todos os elementos da população tiveram uma 
probabilidade conhecida e diferente de zero, de pertencer à amostra. 
 Amostragem não probabilística: Quando não se conhece a probabilidade de um elemento da 
população pertencer à amostra. A amostragem é restrita aos elementos que se tem acesso 
(exemplos, usuários de drogas, voluntários em testes de remédios ou vacinas). 
 
 O objetivo da amostragem é determinar métodos para estudar as populações por meio de 
amostras. A amostragem nos possibilita concluir (inferir) sobre um todo a partir de apenas uma 
parte. 
 
Razões para se amostrar: redução de custo e material, rapidez nos resultados, redução do 
trabalho, facilidade no treinamento de pessoal, o ato de observar pode ser destrutivo. 
Quando o uso de amostragem não é interessante? População pequena; necessidade de alta 
precisão. 
 
Principais técnicas de Amostragem: 
 
1. Amostragem Simples ao Acaso ou Amostragem Aleatória Simples (AAS). É a técnica de 
amostragem mais simples e é utilizada quando a população é homogênea e finita. Pode ser feita 
com ou sem reposição. São sorteados n elementos de uma população de tamanho N. A 
probabilidade de selecionar um indivíduo específico da população para uma amostra é 1/N. O 
sorteio pode ser feito por qualquer método aleatório, como papéis ou bolas numeradas, calculadora 
computador, tabela de números aleatórios ou outros. 
Exemplo: a) escolher 10 funcionários no setor de produção de uma empresa para estudar o 
aumento de produtividade. AAS. 
b) escolher 10 funcionários de toda a empresa para estudar o aumento de produtividade. Deve-se 
usar outro tipo de amostragem (estratificada). 
 
2. Amostragem Estratificada: 
35 
 
 
A população heterogênea é dividida em sub-populações homogêneas (estratos), e em seguida é 
feita a AAS em cada estrato. 
Suponha que uma população heterogênea de tamanho N seja dividida em L estratos de tamanhos 
1 2 1 2
1
, , , e 
L
L L h
h
N N N N N N N N

     
. 
L amostras (AAS) são retiradas (uma amostra de cada estrato) de tamanhos : 1 2, , , Ln n n e 
1 2
1
L
L h
h
n n n n n

     (em que n é o tamanho da amostra). 
 
A amostragem estratificada pode ser classificada quanto ao tipo de estratificação, em : 
estratificação uniforme: cada estrato possui o mesmo número de elementos. O tamanho de 
amostra de cada estrato é n/L . 
estratificação proporcional : No critério proporcional extrai-se de cada estrato uma quantidade 
de elementos hn proporcional ao tamanho hN do respectivo estrato. Este critério é recomendado 
quando o tamanho dos estratos são distintos e a variabilidade dos estratos é homogênea. O 
tamanho da amostra do estrato hL é hn : h h
n N
n N 
 
estratificaçãoótima ( Partilha Ótima): O número de elementos hn é proporcional ao tamanho 
hN e ao desvio padrão h do respectivo estrato. 
1
 



h h
L
h
h h
h
n N
n
N


 
 
 
Exemplo: Suponha que uma empresa hoteleira deseja realizar uma pesquisa com os seus 84 
funcionários, em que 25 pessoas são do sexo feminino (F) e as 59 restantes do sexo masculino 
(M). Estabelecendo 9n (10% no mínimo), encontre o número de mulheres e de homens que 
devem ser entrevistados. 
 
 
 
 
 
3. Amostragem Sistemática 
 
Enumeram-se todos os elementos da população  1, 2, , N e sorteia-se um primeiro 
elemento “ i ” para formar parte da amostra. Os demais são retirados em uma progressão 
aritmética, saltando “ r ” elementos, até completar o total da amostra (n). O valor “ r ” é chamado 
passos de amostragem e é determinado por: r = N/n. O primeiro elemento deve ser sorteado entre 
os r primeiros. 
Exemplo: Uma rua contém 1000 prédios, dos quais desejamos obter uma amostra sistemática 
formada por 100 deles. 
 
 
 
 
36 
 
 
4. Amostragem por Conglomerados 
 
Um Conglomerado é um subgrupo de elementos da população, que deve representar bem 
toda a população. A população é dividida em sub-populações (conglomerados) distintas 
(quarteirões, residências, famílias, bairros, estados, etc.). Alguns dos conglomerados são 
selecionados segundo a AAS e todos os indivíduos nos conglomerados selecionados são 
observados. Em geral, é menos eficiente que a AAS ou AE, mas é também mais econômica. 
Dentro de cada conglomerado há muita heterogeneidade, Entre os conglomerados há uma pequena 
variabilidade. 
 
 
 
 
Distribuições amostrais 
 
Considerem-se todas as amostras possíveis de tamanho “n” que podem ser retiradas de uma 
população de tamanho “N” (com ou sem reposição). Para cada amostra pode-se calcular uma 
grandeza estatística, como a média, o desvio padrão etc., que varia de amostra para amostra. Com 
os valores obtidos para determinada grandeza, podemos construir uma distribuição de 
probabilidades, que será denominada de distribuição amostral. 
 
Exemplo: Suponha uma v.a. X uniforme, com possíveis valores 1, 2, 3 (N=3). Retirar todas as 
amostras possíveis de tamanho n = 2, com reposição, e calcular a média em cada uma delas. Obter 
a distribuição amostral da média e a distribuição de x. Fazer os gráficos e comparar. 
 
Distribuição de X. 
 
x 1 2 3 
p (x)  13  13  13 
 
 
 
 
 
 
 
 
Distribuição amostral da média – Teorema do limite central (TLC) 
 
Se a v.a. X tem uma distribuição qualquer, com média X e variância 
2
X , então a média 
amostral x , baseada em uma amostra de tamanho n, terá distribuição normal aproximada, com 
média   XXE X    e variância 
2
2 X
X n

  . 
 
Assim, a variável Z definida a seguir tem distribuição aproximadamente normal padrão, ou seja, 
 
37 
 
 0,1X X a
X
X XZ N
n
 

 
   . 
 
A aproximação é adequada para amostras maiores ou iguais a 30  n 30 . Quanto maior o 
tamanho da amostra, melhor será a aproximação. 
 
Para amostragem sem reposição, em população finita, fazer a correção a seguir, 
 
  XE X    e 1X
N n
Nn





. 
 
Se a v.a. X tem distribuição normal tem-se, 
 2, XXX N    
2
2, XXXX N n

  
 
   
 
  0,1XXZ N
n



  
 
 
 
Distribuição t de Student – Distribuição amostral da média em pequenas amostras (n < 30) 
 
Se a v.a. X tem uma distribuição qualquer, com média X e variância 
2
X , então a média 
amostral x , baseada em uma amostra de tamanho n < 30, terá distribuição aproximada t de 
Student, ou seja, 
2
2, XXX
SX t S
n
 
 
  
 
 ; X X
X
X Xt SS
n
  
  , em que S é o desvio padrão amostral. 
 O valor de t associado às probabilidades pode ser obtido na tabela t de Student, em função 
do número de graus de liberdade v, sendo v = n – 1gl. 
 
 
Exemplo de uso da tabela. 
a) se v = 10,  P t 1,093  
b) se n = 16,  P 1,34 t 2,131   
c) se v = 20,  P t 2,086   
d) se n = 17,  P 1,071 t 1,071    
 
 
Exemplo 2. Encontre os valores de to: 
a) P(t > t0) = 0,10; com v = 13 
b) P( t < t0) = 0,95 ; com v = 15 
c) P( t0 < t < - 1,761) = 0,045; com n = 15 
 
 
 
 
38 
 
Distribuição amostral da diferença entre médias (amostras grandes 1 2n e n 30 ) 
 
Considerando duas variáveis aleatórias: 
- População 1: 1X com média X1 e variância 
2
X1 , amostra de tamanho 1n . 
- População 2: 2X com média X2 e variância 
2
X 2 , amostra de tamanho 2n . 
 
A distribuição amostral da diferença entre as médias, 1 2x x é, 
 
1 2
2 2
2
1 2 1 21 2
1 2
X xX XX Xx x N n n
 
    
 
    
 
 - , ; 
 
   1 2 1 2
2 2
1 2
0,1X X a
x x
Z N
n n
 
 
  


 . 
 
 
Exemplo: Um tratamento químico A garante duração média de 1400h para um peça, com desvio 
padrão de 200h.Um tratamento B garante duração média de 1200h com desvio padrão de 100h. Se 
forem amostradas 125 unidades de peças de cada tratamento, determine as probabilidades. 
a) de um elemento de cada tratamento durar mais que 1600h. 
b) da média da amostra A durar mais que 1420h. 
c) de os elementos da amostra A terem vida média superior aos de B em pelo menos 160h. 
 
 
 
 
 
 
 
Distribuição amostral da variância – Distribuição qui-quadrado  2 
 
Se 2S é a variância de uma amostra aleatória (aa) de tamanho n, retirada de uma população 
normal, com variância 2 então a estatística 2 tem distribuição qui-quadrado com v = n-1 graus 
de liberdade (gl), sendo, 
 
2
2
2
(n 1)S


 

 e  2 2P      . 
 
A distribuição 2 não é simétrica e parte sempre da origem. 
 
Exemplo de uso da tabela. 
a) se n = 12,  2P 17, 275   
b) se v = 3,  2P 11,345   
 
39 
 
Exemplo: Uma máquina está regulada para empacotar um produto com média de 500g e desvio 
padrão de 10g. Em uma amostra de 16 pacotes, qual a probabilidade da variância ser, 
a) maior que 48,407? 
b) menor que 121,63? 
 
 
 
 
 
 
Distribuição amostral de duas variâncias – Distribuição F – Snedecor. 
 
Se 21S e 
2
1S são variâncias de amostras aleatórias independentes, de tamanhos 1n e 2n , 
retiradas de populações normais, com variâncias 21 e 
2
2 , então a estatística F tem distribuição F 
– Snedecor, com 1 1 1v n  e 2 2 1v n  graus de liberdade, sendo, 
 
2
1
2 2 2
1 1 2
2 2 2
2 1 2
2
2
S
SF
S S
 
 


 e  1 2P F F (v , v )   (área acima) 
 
Se 1 2F (v , v ) é o valor de F com 1v e 2v gl, (valor que deixa uma área acima dele), então, 
 
1 1 2
2 1
1F (v , v )
F (v , v ) 
 ( valor que deixa uma área (1  ) acima dele). 
 
 
A distribuição F não é simétrica e parte sempre da origem. Para cada probabilidade  
existe uma tabela. 
 
 
Exemplo de uso da tabela. 
a) sendo 1 9v  e 2 15v   P F 3,12 0,025  
b) sendo 1 13n  e 2 7n     P F 4,0 1 P F 4,0 1 0,05 0,95       
 
Exemplo. Se 21S e 
2
1S representam variâncias de amostras aleatórias de tamanhos 1 21n  e 2 31n  , 
cujas populações têm variâncias 21 35  e 
2
2 25  , encontre. 
a) 
2
1
2
2
SP 2,702
S
 
  
 
 
 
 
b) 
2
1
2
2
SP 0,594 3,094
S
 
   
 
 
 
 
 
40 
 
Distribuição amostral da proporção 
 
Considere uma população com N elementos, dos quais, B são portadores de uma 
característica e N-B são não portadores. A proporção de elementos portadores da característica na 
população é Bp
N
 . Retirando-se umaamostra aleatória de tamanho n, e sendo Y o número de 
indivíduos portadores da característica na amostra, Y tem distribuição binomial com probabilidade 
de sucesso p. 
Usando a aproximação normal para a binomial, a proporção pˆ de indivíduos com a 
característica na amostra terá distribuição aproximadamente normal, 
 
 
ˆ
2
ˆ
(1 )ˆ , pp
p pp N p
n
 
   
 
 e a estatística  ˆ
ˆ
ˆ ˆ
^ 0,1
(1 )
p
a
p
p p pZ N
p p
n


 
 

 
 
 
Exemplo. Suponha que 30% dos alunos de um curso da ufu sejam mulheres. Em uma amostra 
aleatória de 10 alunos desse curso, calcula-se a proporção pˆ de mulheres. Calcule a probabilidade 
de que pˆ seja diferente de p em pelo menos 0,01. R: 0,056 
 
 
 
 
 
 
 
Determinação do tamanho da amostra 
 
Suponha que a média populacional esteja sendo estimada por x e que o tamanho da 
amostra deve ser determinado de forma que o erro de estimação seja igual a um valor pré-fixado 
 , com confiança  dada. Assim, deseja-se determinar n tal que 
 
 P x      
 
O valor de n encontrado é 
2 2
2
Z
n 



. A variância 2 pode ser estimada com uma amostra piloto. 
 
 
Exemplo. Suponha que uma amostra piloto de n = 10 seja extraída de uma população, fornecendo 
x 15 e 2S 16 . Determine o tamanho da amostra para que se tenha 0,5  e 0,95  . 
 
 
 
 
 
 
 
41 
 
Teoria da estimação 
 
A teoria da estimação baseia-se na estimação por ponto e estimação intervalar. 
Estimação por ponto (estimação pontual): um único valor numérico é usado como estimativa 
pontual do parâmetro populacional. Um estimador, qˆ , do parâmetro q é uma função qualquer dos 
elementos da amostra. Estimativa é o valor numérico assumido pelo estimador quando os valores 
observados são considerados. Assim, 
n
i
i
X
X
n


, é um estimador da média populacional m , e 50 cmX  é uma estimativa da média 
populacional. 
 
Estimação intervalar (intervalos de confiança): Um intervalo de valores é usado para estimar o 
parâmetro populacional desconhecido. Atribui-se uma confiança (ou probabilidade) de que o 
verdadeiro valor do parâmetro esteja contido nesse intervalo, que é determinado com base na 
distribuição amostral do estimador. 
 
Intervalos de confiança (IC) 
Com uma confiança  1  determina-se um limite inferior e um limite superior entre os quais se 
espera que o verdadeiro valor do parâmetro esteja contido. 
 
Intervalo de confiança para a média populacional  . 
Estima-se com uma confiança  1  que  esteja contida no intervalo  ;x e x e  , ou seja, 
   1P x e x e       . 
 
Para amostras grandes  30n  : 
 
2 2 2
 IC ;(1 ) ; S S Se Z x Z x Z
n n n  
 
 
      
 
. 
O tamanho da amostra para se estimar  com uma confiança dada e um erro prefixado é: 
 
2
2
0
Z S
n


 
 
 
 
 e 0
01
nn n
N


. 
 
Para amostras pequenas  30n  : 
 
 
2 2 2
 IC ; (1 ) ; S S Se t x t x t
n n n  
 
 
      
 
. 
 
Dimensionamento da amostra: 
2
2
0
t S
n


 
   
 
 
 e 0
01
nn n
N


. 
 
 
42 
 
Exemplos 
1. A concentração de zinco em uma amostra de material de36 locais diferentes é 2,6 gramas por 
mililitro com desvio padrão de 0,3 gramas. 
a) Determine intervalos de confiança de 95% e 99% para a verdadeira concentração média de 
zinco. 
b) Se desejamos estar 95% confiantes de que a estimativa de  esteja distante por menos de 0,05, 
qual deve ser o tamanho da amostra.? 
 
 
 
 
 
2. Os conteúdos de ácido sulfúrico em 7 contêineres similares são: 9,8; 10,2;10,4; 9,8; 10; 10,2; 
9,6, em litros. Determine um IC de 95% de confiança para a verdadeira média de todos os 
contêineres. 
 
 
 
 
Intervalo de Confiança para diferença entre duas médias (amostras independentes): 
 
Amostras grandes , A Bn n 30 
Estima-se com uma confiança  1  que A B  esteja contida no intervalo 
    ;A B A Bx x e x x e    , ou seja,       1A B A B A BP x x e x x e           . 
 
2 2
2
A B
A B
e Z
n n
 
  
 
 e A BX X são médias amostrais, isto é, são as estimativas pontuais das médias das populações, 
 e A B  respectivamente; 
 e A B
2 2s s as variâncias populacionais 
 e A Bn n tamanho das amostras retiradas das populações a e b, respectivamente; 
 
Se as variâncias populacionais forem desconhecidas, podem ser substituídas pelas variâncias 
amostrais. 
 
 
Amostras pequenas , A Bn n 30 (variâncias populacionais iguais, desconhcecidas) 
 
Sendo as populações homocedásticas  A B2 2 2s s s  , assim, e A BS S2 2 são duas estimativas para 
um mesmo parâmetro  2s então o intervalo de confiança para a diferença entre duas médias é 
dado por: 
     2; 2
100(1 )%
1 1:
A BA B A B pn n
A B
X X t SIC
n n

   

    
com 2ta com 2A Bv n n   graus de liberdade em que: 
43 
 
   A A B B
p
A B
n S n S
S
n n
2 21 1
2
     . 
 
 
 
 
Intervalo de Confiança para proporção (amostras grandes n>30): 
   2
100(1 )%
ˆ ˆˆ: pqP p zIC
n

 
 
 
Intervalo de Confiança para a diferença entre duas proporções 
 
     2
100(1 )%
ˆ ˆ ˆ ˆˆ ˆ: A A B BA B A B
A B
p q p qP P p p zIC
n n

    
 
 
 
 
 
Regras de decisão envolvendo Intervalo de Confiança (IC) para diferença entre duas médias 
ou duas proporções. 
i) Se o IC incluir o zero, então, A B  ou A Bp p . 
ii) Se os extremos do intervalo forem negativos, então, A B  ou A Bp p . 
iv) Se os extremos do intervalo forem positivos, então, A B  ou A Bp p . 
 
 
Exemplos. 
 
1) Dois motores A e B foram comparados. O motor A, em 50 experimentos, apresentou milhagem 
média de 36 milhas/galão de combustível, com desvio padrão de 6 milhas. O motor B, em 75 
experimentos apresentou milhagem média de 42 milhas/galão, com desvio padrão de 8. Determine 
um intervalo de confiança de 96% para B A  . Decida com base no IC se existe diferença entre 
as médias. 
 
 
2) Um novo processo de fabricação de um componente está sendo testado e comparado com o 
antigo. No antigo processo, 75 de 1500 itens são considerados defeituosos. No novo processo, 80 
de 2000 itens são considerados defeituosos. 
a) Determine um IC de 90% para a proporção de defeituosos no antigo processo. 
b) Determine um IC de 90% para a proporção de defeituosos no novo processo. 
c) Determine um IC de 90% para a real diferença na proporção de defeituosos entre o antigo 
processo e o novo processo, e decida se o antigo processo deve ser substituído pelo novo. 
 
 
 
 
44 
 
Intervalo de confiança para variância ( 2 ) de uma população normal 
 
 
     
2 2
2
2 2
; 1 1 ; 1
2 2
1 1
;(1 ) : ; 
v n v n
n S n S
IC
 
 
 
          
   
 
  
  
 
 
 ; considerando uma amostra de tamanho n. 
 
 
Exemplo Sabe-se que o tempo de vida de certo aparelho tem distribuição aproximadamente 
normal. Uma amostra de 25 aparelhos forneceu uma média de 500 horas e desvio padrão de 50 
horas. Construa um intervalo com confiança de 98% para 2 . R: (1,396; 5,527) 
 
Intervalo de confiança para a razão entre duas variâncias 2 21 2  . 
 
Se 21S e 
2
2S são as variâncias de amostras aleatórias de tamanhos n1 e n2, respectivamente, 
provenientes de duas populações normais independentes, com variâncias desconhecidas 21 e 
2
2 , 
então um intervalo de confiança de 100(1 - α)% para o quociente (razão) de variâncias é dado por: 
 
 
  2 1
1 2
2 2
2 2 1 1
1 2 2; , 2 2
2 22; , 
1;(1 ) : ; v v
v v
S SIC F
S F S 
  
 
  
  
 
 
 
Regra de decisão envolvendo o intervalo de confiança (IC) para o quociente 2 21 2  : 
1º) Se IC inclui 1 em sua extensão, então, estatisticamente 2 21 2  . 
2º) Se IC > 1, então, estatisticamente 2 21 2  . 
3º) Se IC < 1, então, estatisticamente 2 21 2  . 
 
Exemplo 1: De duas populações normais levantaram-se amostras de tamanho 9 e 11 
respectivamente, obtendo-se 2 21 27,14 e 3,21S S  . Construa um intervalo de confiança para o 
quociente das variâncias das duas populações ao nível de significância de 10% e verifique se as 
variâncias populacionais podem ser consideradas estatisticamente iguais. (0,72; 7,44) 
 
Exemplo 2: Uma companhia fabrica propulsores para uso em motores de turbinas de avião. Uma 
das operações envolve esmerilhar o acabamento de uma superfície particular para um componente 
de liga de titânio. Dois processos diferentes para esmerilhar podem ser usados, podendo produzir 
peças com iguais rugosidades médias na superfície. Uma amostra aleatória de 1 11n  peças, 
proveniente do primeiro processo, resulta em um desvio padrão de 1 5,1S  micro polegadas. Uma 
amostra aleatória de 2 16n  peças, proveniente do segundo processo, resulta em um desvio padrão 
de 2 4,7S  micro polegadas. Considerando que os dois processos sejam independentes e que a 
rugosidade na superfície seja normalmente distribuída, encontre um intervalo de confiança de 90% 
para a razão de duas variâncias. Existe diferença na variabilidade da rugosidade da superfície para 
os dois processos? R: (0,46; 3,35). 
 
 
 
45 
 
Teoria da decisão 
 
Teste de Hipóteses 
 
O teste de hipótese é uma regra de decisão para que permita aceitar ou rejeitar uma 
hipótese estatística, com base nos dados amostrais. O objetivo é verificar se os dados amostrais 
trazem evidência que apóiem ou não uma hipótese formulada. 
 
Definições 
 
Hipótese estatística: suposição quanto ao valor de um parâmetro populacional, ou quanto à 
natureza da distribuição de probabilidade de uma variável populacional. 
Exemplos: O peso médio é 50. ( 50)  
O número de pacientes atendidos segue uma distribuição de Poisson. 
A proporção de eleitores favoráveis a um candidato é 0,70. ( 0,70)p 
 
Tipos de Hipóteses 
a) Hipótese nula ou de nulidade 0H : geralmente é uma igualdade ou afirmação positiva com 
relação ao parâmetro populacional. 
b) Hipótese alternativa aH ou 1H : afirmação que geralmente envolve a desigualdade e contradiz 
0H . 
Com base em 1H define-se a região crítica (RC) do teste ou região de rejeição de 0H (RR 0H ). 
 
Tipos de testes 
Supondo que o parâmetro de interesse seja a média (testar o valor 50kg ) 
a) Teste de hipótese bilateral 
0
1
: 50
: 50




H
H
 
 
 
b) Teste de hipótese unilateral à esquerda 
0
1
: 50
: 50




H
H
 
 
 
c) Teste de hipótese unilateral à direita 
0
1
: 50
: 50




H
H
 
 
Tipos de erros 
a) Erro tipo I: Rejeitar uma hipótese nula quando ela é verdadeira. A probabilidade do erro tipo I 
é denotada por  (nível de significância) 
b) Erro tipo II: Aceitar uma hipótese nula quando ela é falsa. A probabilidade do erro tipo II é 
denotada por  . 
 
46 
 
Regra de decisão: Se o valor calculado da estatística do teste estiver na região crítica, deve-se 
rejeitar a hipótese nula. Se o valor calculado da estatística estiver na região de aceitação de H0, não 
se pode rejeitar a hipótese nula. 
 
Testes de hipóteses para a média 
a) Teste de hipótese para média μ de uma população Normal. 
 
H
H
 
 



0 0
1 0
:
:
 ou 
 
 



H
H
0 0
1 0
:
:
 ou 
 
 



H
H
0 0
1 0
:
:
; Estatística do teste : calc
XZ
n



 0 
Variância desconhecida: usar o desvio padrão amostral. 
 
População não normal 
i) amostras grandes ( 30)n usar distribuição Z. 
ii) amostras pequenas ( 30)n usar distribuição t de Student. 
 
Exemplo 1. Uma fábrica anuncia que o índice de nicotina dos cigarros da marca X apresenta-se 
abaixo de 26 mg por cigarro. Um laboratório realiza 10 análises do índice obtendo: 26, 24, 23, 22, 
28, 25, 27, 26, 28, 24. Sabe-se que o índice de nicotina dos cigarros da marca X se distribui 
normalmente com variância 5,36 mg2. Pode-se aceitar a afirmação do fabricante, ao nível de 5%? 
 
 
 
 
 
Teste de hipótese para diferença entre médias de populações Normais com variâncias 
populacionais conhecidas. 
Estatística do teste:    1 2 1 2
2 2
1 2
1 2
calc
X X
Z
n n
 
 
  


. Variância desconhecida usar S. 
0 1 2
1 1 2
:
:
H
H
 
 



 ou 0 1 2
1 1 2
:
:
H
H
 
 



 ou 0 1 2
1 1 2
:
:
H
H
 
 



 
 
 
Amostra pequena (n1, n2 ≤ 30) e variâncias populacionais iguais: 
1 2 1 2
c
p 1 2
(X X ) ( )t
s 1 / n 1 / n
   


;    A A B B
p
A B
n S n S
S
n n
2 21 1
2
    
; 1 2v n n 2   
 
 
 
47 
 
Teste de hipótese para a proporção 
 
Exemplo 2. Um fabricante de lentes intra-oculares está qualificando uma nova máquina 
de moagem. Ele qualificará a máquina se a porcentagem de lentes polidas que contenha defeitos na 
superfície não exceder 2%. Uma amostra aleatória de 250 lentes contém seis lentes defeituosas. 
Formule e teste a hipótese ao nível de 5% de significância. 
 
 
 
 
 
 
 
 
Teste de hipótese para a diferença entre duas médias. 
 
Exemplo 3. Ao estudar os efeitos de certa anomalia na estatura de recém-nascidos do sexo 
feminino, verificou-se, numa amostra de 30 crianças com anomalia, estatura média de 46,8 cm e 
desvio padrão de 3,44 cm e de 50 crianças normais, estatura média de 48,0 cm e desvio padrão de 
2,99 cm. Teste a hipótese que a média dos anômalos e estatisticamente igual à média dos normais. 
Use nível de significância de 5%. 
 
 
 
 
 
 
 
 
 
Teste não paramétrico: Teste de qui-quadrado (χ2) 
 
O teste de χ2 mede a discrepância existente entre freqüências observadas e freqüências esperadas 
em um conjunto de dados, podendo ser utilizado como teste de aderência ou de independência 
 
Teste de aderência: é utilizado para verificar se as diferenças entre as freqüências esperadas e 
observadas são estatisticamente significativas. 
Procedimento: 
a) determinar o modelo teórico 
b) calcular as freqüências esperadas (fe) para cada classe. 
c) Comparar as freqüências esperadas e observadas (fo) com a estatística do teste: 
 i i
i
2
k
o e2
c
i 1 e
f f
f



 ; k é o número de classes, o número de graus de liberdade é v = k-1. 
 
Regra de decisão: Se 2 2, c v deve-se rejeitar H0 (o modelo teórico não se ajusta à distribuição 
observada). 
 
 
 
Teste de independência 
48 
 
H0: variável linha independe da variável coluna 
H1: variável linha e coluna são dependentes 
 
A estatística do teste é a mesma 2c , e a frequência esperada de cada classe é calculada por: 
e
(total da linha)(total da coluna)f
total
 . 
O número de graus de liberdade é v = (h-1)(k-1), sendo h o número de linhas e k o número de 
colunas. 
 
Exemplo 4. Verificar se a opinião dos moradores de uma cidade quanto a uma nova política de 
saúde é diferente, em várias classes sociais, ou seja, verificar se a opinião é dependente da classe 
social. Foi levantada uma amostra aleatória de 1000 pessoas estratificadas por classe a seguir: 
 
 
opinião 
classes 
baixa média alta total 
a favor 182 213 203 598 
contra154 138 110 402 
total 336 351 313 1000 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
49 
 
REGRESSÃO LINEAR SIMPLES E CORRELAÇÃO 
 
 
 Em problemas de engenharia e ciências, frequentemente existe interesse em encontrar modelos que 
permitam explorar a relação entre duas ou mais variáveis. A análise de regressão e correlação é uma técnica 
utilizada para esse fim. 
Na análise de regressão e correlação tem-se a classificação: 
- Análise de correlação; 
- Análise de regressão: Regressão Linear Simples; 
 Regressão Linear Múltipla; 
 Regressão não Linear; 
 
Com o objetivo de investigar a presença ou ausência de relação linear entre as variáveis, tem-se os passos: 
a) Inspeção visual: diagrama de dispersão 
b) Quantificando a força dessa relação: coeficiente de correlação. 
c) Explicitando a forma dessa relação: ajuste de uma reta de regressão. 
 
Análise de correlação: Verificar evidências de correlação entre as variáveis, e tentar medir sua intensidade 
(“força”). O diagrama de dispersão nos possibilita observar os dados graficamente e tirar conclusões 
prévias sobre a possível relação entre as variáveis. 
 
Exemplos: 
X idade de um automóvel e Y o seu valor de revenda. 
X temperatura ambiente e Y consumo de cerveja 
 
Exemplos de diagramas de dispersão e tipos de correlação: 
 
 
 
 
 
 
Coeficiente de correlação linear de Pearson   
O coeficiente de correlação mede o grau de associação linear entre duas variáveis, x e y, ou seja, 
mede a força e a direção do relacionamento linear entre as duas variáveis: 
O estimador do coeficiente de correlação linear populacional de Pearson   é o coeficiente de 
correlação linear amostral, denotado por r (- 1  r  +1). 
 
r = - 1: correlação linear negativa perfeita (reta decrescente). 
r = 1: correlação linear positiva perfeita (reta crescente). 
r = 0: não há correlação linear. 
O valor do coeficiente de correlação pode ser calculado por: 
 
SPxyr
Sxx Syy
 ; em que, 
50 
 
 1 1
1
n n
i in
i i
i i
i
x y
SPxy x y
n
 

  
  
   
 
 ; 
2
12
1
n
in
i
i
i
x
Sxx x
n


 
 
  

 ; 
2
12
1
n
in
i
i
i
y
Syy y
n


 
 
  

 
MODELO DE REGRESSÃO LINEAR SIMPLES 
 Quando existe uma relação linear entre uma variável dependente (variável resposta) e uma 
variável independente (preditora ou explicativa), ajusta-se um modelo de regressão linear simples. 
Caso exista uma relação linear entre uma variável dependente e duas ou mais variáveis 
independentes, ajusta-se um modelo de regressão linear múltipla. 
 Havendo relação linear entre as variáveis, o modelo de regressão linear tem o objetivo de 
descrever essa relação, podendo ser usado para fazer inferências sobre valores não observados. A 
estimação (previsão) de valores de y não deve ser feita para valores de x que estejam fora do 
intervalo considerado na regressão. 
 
O modelo estatístico de uma regressão linear simples é: 
0 1i i iy xb b e   
iy : representa o i-ésimo valor observado; 
ix : representa a variável independente, i = 1, 2, ..., n; 
i : é o erro não observável associado a i-ésima observação; 
0 1 e   : são os parâmetros do modelo, que são o intercepto ou coeficiente linear e o coeficiente 
angular de regressão. 
 
Ao estabelecer o modelo de regressão linear simples, pressupomos que: 
i) A relação entre x e y é linear; 
ii) Os valores de x são fixos, isto é, x não é uma variável aleatória; 
iii) A média do erro é zero, isto é,   0, 1,2, ,   iE i n ; 
iv) Para um dado valor de x, a variância do erro é sempre constante, isto é, 
   2 2 , 1,2, ,i iV E i n       
v) os erros são independentes e tem distribuição Normal 
 
 
Estimação dos parâmetros: Método dos mínimos quadrados 
A reta que apresenta o melhor ajuste aos dados é aquela que minimiza a soma dos quadrados dos 
desvios entre os valores observados e os previstos pela própria reta (minimização dos quadrados 
dos resíduos). 
 
Equação da reta de regressão estimada: 0 1i iy b b x 
 
b1, inclinação da reta na amostra e pode ser usada para estimar 1. 
b0, intercepto do eixo Y na amostra e pode ser usado para estimar 0. 
 
Os estimadores de mínimos quadrados para 0 1 e   são, respectivamente: 
 
0 0 1
ˆ ˆb y x    e 1 1ˆ
SPxyb
Sxx
   
51 
 
 
 
Interpretação do coeficiente da regressão linear simples: Na regressão linear simples, 
interpreta-se 1ˆ como uma estimativa da alteração em y correspondente à alteração de uma 
unidade na variável independente. 
 
 
 
 
Exemplo 1: Com os dados a seguir, desenvolva uma equação de regressão estimada que possa ser 
usada para prever o custo total de determinado volume de produção. 
 
Volume de produção (unidades) Custos totais 
400 4.000 
450 5.000 
550 5.400 
600 5.900 
700 6.400 
750 7.000 
 
 
 
 
 
 
 
 
 
Teste de significância da regressão linear simples 
 
A significância da regressão (do parâmetro 1 ) pode ser testada por meio da Análise de 
Variância (ANAVA). O objetivo é determinar se existe uma relação linear entre a variável de 
resposta y e a variável regressora x. Nessas, condições a hipótese testada é: 
H0: β1 = 0 
 H1: β1 ≠ 0 
Se H0 for rejeitada, o teste nos dá evidências estatísticas para concluirmos que o parâmetro β1 não 
é igual a zero e, assim, a relação entre y e a variável independente x é significativa. Mas, se H0 não 
puder ser rejeitada, não se pode concluir que existe uma relação significativa. O procedimento da 
análise de variância é descrito a seguir, sendo p o número de parâmetros do modelo, n o número de 
observações da variável resposta (variável dependente), FV fontes de variação, GL graus de 
liberdade, SQ soma de quadrados, QM quadrado médio. 
 
Tabela 1 – Esquema da Análise de Variância de um modelo de regressão linear simples. 
FV GL SQ QM Fc 
Regressão p – 1 = 1 SQReg SQReg/( p - 1 ) = QMReg QMReg/QME 
Erro n – p = n - 2 SQErro SQErro/(n - 2)= QME 
Total n - 1 SQTotal 
 
 
Relação entre as somas de quadrados : SQTotal = SQReg + SQErro 
52 
 
 22 2
1 1
( )
n n
i
i i
i i
y
SQTotal y y y Syy
n 
      ;  
2
2
1
ˆRe ( )
n
i
i
SPxy
SQ g y y
Sxx
   ; 
2
1
ˆ( )
n
i i
i
SQErro y y

  = SQTotal – SQReg 
Regra de decisão do teste. 
Critério do valor crítico: Rejeita-se H0 se Fc ≥ Fα em que Fα é obtido na tabela da distribuição F 
com 1 grau de liberdade no numerador e n – 2 graus de liberdade no denominador. 
 
 
Coeficiente de determinação (r2): porcentagem da variação total que é “explicada” pela 
regressão. 
 
2 ReSQ gr
SQtotal
 ; 20 1r  
 
 
Teste de hipótese para os parâmetros da regressão 0 1 e   
Outra forma de testar a significância da regressão é por meio do teste de hipótese do 
coeficiente angular  1 . A hipótese nula H0: β1 = 0 contra H1: β1 ≠ 0, é testada usando a 
distribuição t com n - 2 graus de liberdade. 
Estatística do teste: 1ˆct QME Sxx
b . 
 
Pode-se testar também o parâmetro β0. Mas, o fato de β0 ser significativo não implica que existirá 
uma relação linear significativa entre x e y. 
Estatística do teste: 0
2
1
ˆ
c n
i
i
t
QME x nSxx
b



 Hipóteses: 0 0
1 0
: 0
: 0
H
H
b
b
  
 
 
Regra de Decisão: Rejeita-se H0 se  2; 2c nt t a  ou  2; 2c nt t a  (se tc pertencer a região crítica). 
 
 
 
Teste de Hipóteses para a correlação linear 
21
2
c
rt
r
n



 0
1
: 0
: 0
H
H
r
r
 
 
 
Regra de decisão: rejeitar a hipótese nula ρ = 0 se o valor absoluto da estatística de teste excede 
os valores críticos (Tabela de t com n - 2 gl). 
 
 
Exemplo 2. Testar a significância da regressão estabelecida no exemplo 1.

Outros materiais