Buscar

Unidade II - Probabilidade

Prévia do material em texto

PROBABILIDADE
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE CIÊNCIAS EXATAS E DA TERRA
DEPARTAMENTO DE ESTATÍSTICA
DOCENTE: Mariana Oliveira Cedraz
Preliminares
 Nas aulas anteriores, vimos como caracterizar um
conjunto de dados. Nas próximas aulas será apresentada a
teoria matemática que dá a base teórica para o
desenvolvimento de técnicas estatísticas.
Preliminares
 Para se aprender estatística, é necessário um bom
entendimento do conceito de probabilidade. O termo
probabilidade refere-se ao estudo da aleatoriedade e da
incerteza.
Preliminares
 A probabilidade se faz presente no dia-a-dia de maneira
informal em vários contextos escritos ou falados, por
exemplo:
“É provável que a média Dow-Jones cresça no final do ano”;
“Há 50% de chance do titular buscar a reeleição”;
“As chances favorecem um acordo rápido para o fim da greve”;
“Espera-se que pelo menos 20 mil ingressos sejam vendidos
para o show”.
Probabilidade
 Os fenômenos que iremos estudar podem ser de duas
naturezas.
• Experimentos Determinísticos;
• Experimentos Aleatórios (ou não determinísticos).
Probabilidade
 Experimentos Determinísticos:
Por essa expressão pretendemos nos referir a um
modelo que estipule que as condições sob as quais um
experimento seja executado determinem o resultado do
experimento.
Por exemplo, vamos supor que irá ser selecionada uma
pessoa aleatoriamente em uma turma de mulheres, e
vamos observar o sexo da pessoa escolhida. Qual é sexo da
pessoa escolhida? Se repetirmos esse experimento varias
vezes sob as mesmas condições, saberemos do resultado
antes que ele seja executado?
F = m.a
Probabilidade
 Experimentos Aleatórios ou não determinísticos:
São experimentos que ao serem repetidos nas
mesmas condições não produzem sempre o mesmo
resultado, ou seja, exibem variação nos seus resultados.
Embora não sejamos capazes de afirmar qual o particular
resultado deste experimento, poderemos descrever o conjunto
de todo os seus possíveis resultados.
Probabilidade
Exemplo 1. Considere alguns exemplos de experimentos
aleatórios, denotados aqui por ε.
•ε1: Número de itens defeituosos em uma linha de
produção em um período de 24 horas;
•ε2: Ocorrência ou não de hipertensão em um paciente;
•ε3: A sequência de caras e coroas verificada no
lançamento de uma moeda 4 vezes;
•ε4: Lançamento de um moeda até que apareça cara pela
primeira vez.
Probabilidade
ESPAÇO AMOSTRAL: Denotado por S ou Ω, é definido
como o conjunto de todos os possíveis resultados de um
experimento aleatório.
Exemplo 2. Consideramos a seguir o espaço amostral
associado a cada um dos experimentos citados no exemplo 1.
•Ocorrência ou não de hipertensão em um paciente;
 Ω3 = { sim , não }
• Número de itens defeituosos em uma linha de produção
em um período de 24 horas;
 Ω2 = {0, 1, ..., n}; sendo n o número máximo de itens
produzidos em 1 dia.
Probabilidade
• A sequência de caras e coroas verificada no lançamento
de uma moeda 4 vezes;
 Ω4 = {cccc, ccck, cckc, ckcc, kccc, kkkk, kkkc, kkck, kckk,
ckkk, cckk, ckck, kckc, kkcc, ckkc, kcck}
• Lançamento de um moeda até que apareça cara pela
primeira vez.
 Ω5 = {c, kc, kkc, kkkc, kkkkc, ...}
Probabilidade
EVENTO: É um subconjunto de um espaço amostral.
Exemplo 3. Os eventos Ai a seguir referem-se aos espaços 
amostrais dados no exemplo 2.
• Número de itens defeituosos em uma linha de produção 
em um período de 24 horas;
A2 = {“ menos de 5 itens defeituosos ”} A2 = { 0, 1, 2, 3, 
4 };
•Ocorrência ou não de hipertensão em um paciente; 
A3 = {“ individuo hipertenso ”}  A3 = { sim };
Probabilidade
• A sequência de caras e coroas verificada no lançamento 
de uma moeda 4 vezes;
A4 = {“ somente caras ”}  A4 = { cccc };
• Lançamento de um moeda até que apareça cara pela 
primeira vez.
A5 = {“ apareça cara em até 3 lançamentos ”}  A5 = { c, 
kc, kkc }.
Também são eventos: O próprio Ω, o conjunto vazio Ø, ou 
qualquer resultado individual de Ω. 
Podemos usar as propriedades de conjuntos para combinar e 
obter novos eventos como mostram as propriedades a seguir.
Probabilidade
Propriedades: Sejam A, B e Ai , i = 1, 2, ..., n, eventos.
1. A B representa o evento em que A OU B (ou ambos) ocorrem;
2. A ∩ B representa o evento em que A E B ocorrem;
3. Ā representa o evento em que A não ocorre;
4. representa o evento em que ao menos um dos Ai ocorre;
5. representa o evento em todos os Ai ocorrem.
Propriedades: Sejam A, B e Ai , i = 1, 2, ..., n, eventos.
1. A B representa o evento em que A OU B (ou ambos) ocorrem;
2. A ∩ B representa o evento em que A E B ocorrem;
3. Ā representa o evento em que A não ocorre;
4. representa o evento em que ao menos um dos Ai ocorre;
5. representa o evento em todos os Ai ocorrem.

n
i
iA
1

n
i
iA
1
A
Ā
BA
A B

Probabilidade
EVENTOS DISJUNTOS OU EXCLUDENTES:
Dois eventos A e B são disjuntos, ou mutuamente excludentes,
se não podem ocorrer simultaneamente, ou seja, A ∩ B =Ø.
Exemplo 4:
Considere os seguintes eventos:
A = {1, 2, 3} B = {3, 4, 5} C = {5, 6, 7} 
Calcule:
a) A  B
b) A  B
c) A  C
Probabilidade
Exemplo 5. Considere um experimento feito para avaliar a
durabilidade de uma lâmpada. O espaço amostral associado é
Ω = {t; t ≥ 0}. Sejam A, B e C os eventos:
A = {t; t < 100}, B = {t; 50 ≤ t ≤ 200} e C = {t; t > 150}.
Obtenha:
a) A U B = {t; t ≤ 200}.
b) A ∩ B = {t; 50 ≤ t < 100}.
c) A ∩ C = Ø. (A e B são disjuntos)
d) Ā = {t; t ≥ 100}.
Probabilidade
EVENTO
EXPAÇO AMOSTRAL = 
Conjunto de todos
os possíveis resultados
de um experimento
aleatório.
Probabilidade
ABORDAGEM CLÁSSICA:
Seja Ω um espaço amostral finito, formado por n
eventos elementares, igualmente prováveis (equiprováveis).
Seja A um evento de Ω com m destes elementos. Então a
probabilidade de A é a fração,
º 
( )
º 
n de pontos de favoráveis a A
P A
n de pontos de



Probabilidade
Exemplo 6. Considere o lançamento de um dado “honesto”.
Queremos obter a probabilidade da ocorrência de um número
par.
O espaço amostral associado é Ω = {1, 2, 3, 4, 5, 6}.
Se definirmos A = {“número par”} = {2, 4, 6}, a
probabilidade deste evento é dada por:
P(A) = 3/6 = 1/2.
Probabilidade
Exemplo 7. Considere o lançamento de duas moedas.
Queremos saber a probabilidade do evento A = {“duas
caras”}.
Considere o espaço amostral Ω1 = {“duas caras”, “duas
coroas”, “uma cara e uma coroa”}.
Se usamos a definição acima com este espaço amostral,
diríamos que P(A) = 1/3. Esta resposta é falsa, pois os
elementos de Ω1 não são equiprováveis.
O espaço amostral equiprovável seria Ω = {cc, ck, kc, kk} e
como A = {cc} temos que P(A) = 1/4.
Probabilidade
Suponha que lançamos um dado conhecido por
favorecer a ocorrência do número 3.
• Os 6 eventos elementares do espaço amostral são
igualmente prováveis? NÃO !!!
• Qual a probabilidade da ocorrência do número 1? A
definição clássica não nos ajuda neste caso.
Limitações da definição clássica: Só se aplica a espaços
amostrais finito e equiprováveis, levaram a considerar
outra forma de calcular probabilidade de um evento partindo
da frequência relativa do evento ao se repetir o experimento, n
vezes, sob as mesmas condições.
Probabilidade
ABORDAGEM FREQUENTISTA: Podemos definir P(A)
como o limite da frequência relativa da ocorrência de A em n
repetições independentes de um experimento, com n
tendendo ao infinito, ou seja, se n(A) é o número de vezes em
que o evento A ocorreu nas n repetições independentes de um
experimento, dizemos então que
Na prática a probabilidade de A é aproximada pela 
frequência relativa do evento emum certo número de 
repetições com um erro desprezível. 
( )
( ) lim
n
n A
P A
n

Probabilidade
 Conde de Buffon, realizou 4040 lançamentos de uma
moeda e observou a ocorrência de 2048 caras, obtendo uma
frequência relativa de 0,5064.
No início do século passado, por volta de 1900, o inglês Karl
Pearson realizou 24000 lançamentos de moedas, obtendo
12012 caras e uma frequência relativa de 0,5005.
A abordagem frequentista da probabilidade é
bastante utilizada por estatísticos aplicados e demais
profissionais que trabalham com dados em geral.
Probabilidade
Exemplo 8. Considere uma certa moeda cuja probabilidade de
ocorrência de “cara” é desconhecida. Para se obter essa
probabilidade, esta moeda é submetida a n repetições
independentes de cada lançamento em um software estatístico. A
Tabela 1 e a Figura 1 a seguir mostram os resultados obtidos.
Número de lançamentos
F
r
e
q
u
ê
n
c
ia
 r
e
la
ti
v
a
 d
o
 e
v
e
n
to
Figura 1: Frequência relativa de “cara”
n 10 100 200 300 ... 1600 1800 2000 2300 2600
F(A) 0,800 0,520 0,595 0,5000 ... 0,506 0,509 0,501 0,496 0,499
Tabela 1: Frequência relativa de “cara”
Probabilidade
ABORDAGEM AXIOMÁTICA: Seja ε um experimento aleatório e Ω o
espaço amostral associado a este experimento. Associamos a cada evento A
, um número real representado por P(A) e denominado
“probabilidade de A”, satisfazendo as seguintes condições:
1. 0 ≤ P(A) ≤ 1;
2. P(Ω) = 1;
3. P(AUB) = P(A) + P(B), se A∩B=Ø
4. Se A1, A2, ..., forem eventos excludentes, isto é, (Ai∩Aj)=Ø, ,
então
 1 2 1 2
11
( ) ( ) ( )i i
ii
P A A P A P A P A P A
 

 
       
 

i j 
 A
Probabilidade
PRINCIPAIS CONSEQUÊNCIAS DA ABORDAGEM AXIOMÁTICA.
1. P(Ø) = 0
2. P( A ) = 1 – P(A)
3. Se A e B são dois eventos quaisquer então:
4. Se A, B e C são eventos quaisquer então:
5. Se então P(A) P(B)
( ) ( ) ( ) ( )P A B P A P B P A B    
( ) ( ) ( ) ( ) ( ) ( ) ( )
( )
P A B C P A P B P C P A B P A C P B C
P A B C
          
  
A B 
Probabilidade
Exemplo 9:
Observou-se em dois estacionamentos de uma cidade 13 carros pretos e 37
vermelhos. Dos pretos, 5 são do estacionamento A e dos vermelhos 21 são
do estacionamento A. Os resultados estão na tabela a seguir:
Seleciona-se carros aleatoriamente, pergunta-se:
a) Qual a probabilidade de um carro ser preto?
b) Qual a probabilidade do carro ser vermelho?
c) Qual a probabilidade do carro ser vermelho ou do estacionamento A?
d) Qual a probabilidade do carro ser preto ou do estacionamento B?
Carros
Estacionamento 
A
Estacionamento 
B
Total
Preto 5 8 13
Vermelho 21 16 37
Total 26 24 50
Probabilidade Condicional
 Em muitas situações práticas, o fenômeno aleatório com o qual
trabalhamos pode ser separado em etapas. A informação do que
ocorreu em uma determinada etapa pode influenciar nas
probabilidades de ocorrência das etapas sucessivas.
Nesse caso podemos “recalcular” as probabilidades de interesse. Essas
probabilidades “recalculadas” recebem o nome de probabilidade
condicional, cuja definição apresentamos a seguir.
Probabilidade Condicional 
Podemos estar interessados em responder a seguinte pergunta:
Considere o exemplo aseguir:
 Verificou-se que o carro escolhido é vermelho, qual a probabilidade
desse carro ser do estacionamento A ?
P(do carro ser do estacionamento A dada informação que ele é
vermelho) =
Carros Estacionamento 
A
Estacionamento 
B
Total
P 5 8 13
V 21 16 37
Total 26 24 50
 
 
 
n de carros do estacionamento A dentre os vermelhos
n total de carros vermelhos



Probabilidade Condicional 
 De maneira geral para dois eventos quaisquer A e B, sendo P(B) > 0,
definimos a probabilidade condicional de A, dado que ocorreu o evento B,
denotado por P(A|B), como sendo:
 Então o exemplo pode ser resolvido da seguinte forma. Considere os
seguintes eventos:
Evento A: O carro é do estacionamento A .
Evento B: O carro é vermelho.
( )
( | ) .
( )
P A B
P A B
P B


21
2150( | ) 0,567
37 37
50
P A B   
Probabilidade Condicional 
Exemplo 2: No curso de Ed. Física homens e mulheres praticam duas modalidades
esportivas, ou vôlei ou futebol. Quarenta pessoas praticam vôlei, enquanto trinta
pessoas praticam futebol. Sendo que, dos que praticam vôlei, 21 pessoas são
mulheres e que praticam futebol, 12 pessoas são mulheres.
Pergunta-se:
a) Qual a probabilidade da pessoa ser mulher?
b) Qual a probabilidade da pessoa ser mulher ou da pessoa praticar futebol?
c) Dado que a pessoa é mulher qual a probabilidade dela praticar vôlei?
Sexo/Modalidade Vôlei Futebol Total
Homens 19 18 37
Mulheres 21 12 33
Total 40 30 70
Probabilidade Condicional
Solução:
Eventos
A: Praticar vôlei.
B: Praticar futebol.
H: A pessoa é homem.
M: A pessoa é mulher.
Probabilidade Condicional 
 Solução:
a) b)
c)
33
( ) 0,4714
70
P M  
( ) ( ) ( ) ( )
33 30 12
( )
70 70 70
51
( ) 0,7286
50
P M B P M P B P M B
P M B
P M B
    
   
  
21
( ) 2170 ( | ) 0,6364( | )
33( ) 33
70
P A M
A M P A MP
P M

   
Probabilidade Condicional 
Propriedades:1) 0 ( | ) 1
2) ( | ) 1
3) , ( | ) ( | ) ( | )
P A B
P A
Se A B P A B C P A C P B C
 
 
    
Independência
 Se as probabilidades condicionais representam atualizações na avaliação
de riscos, independência significa que saber se B ocorreu não altera a
avaliação de riscos de A, ou seja, um evento é independente quando a sua
ocorrência não afeta a de outro e vice-versa.
Dizemos que o evento A é independente do evento B se:
 Se A é independente B, então:
OBS: Se A é independente de B, então B é independente de A.
.
( | ) ( ), ( ) 0P A B P A P B 
( )
( ) ( ) ( ). ( )
( )
P A B
P A P A B P A P B
P B

   
Independência
Exemplo: Os dados de uma empresa, referentes a participação dos
funcionários em planos de aposentadoria, vejamos a tabela a seguir:
Verifique se os eventos Plano da empresa (E) e plano pessoal (P) são
independentes.
Plano Pessoal
Total
Sim Não
Plano da 
empresa
Sim 200 200 400
Não 0 100 100
Total 200 300 500
Independência
Solução:
Resposta: Como a probabilidade da interseção entre os eventos “P” e “E”
não pode ser decomposta no produto das probabilidades, então os eventos
não são independentes.
2
( )
5
4
( )
5
2
( )
5
( ) ( ). ( )
P P
P E
P P E
P P E P P P E


 
 
Teorema de Bayes
Exemplo:
Em uma linha de produção de uma certa fábrica, determinada peça é
produzida em duas máquinas. A máquina 1, mais antiga, é responsável por
35% da produção e os 65% restantes vêm da máquina 2. A partir dos
dados passados e das informações do fabricante das máquinas, estima-se
em 5% a proporção de peças defeituosas produzidas pela máquina 1 e em
2,5% a proporção de defeituosas produzidas pela máquina 2. As peças
produzidas pelas duas máquinas seguem para o departamento de
armazenamento e embalagem, para venda posterior, sem distinção de qual
máquina a produziu.
1. Qual é a proporção de peças defeituosas colocadas no mercado por essa 
fábrica?
2. Se um cliente identifica uma peça defeituosa, qual é a probabilidade de 
que ela tenha sido produzida pela máquina 2?
Teorema de Bayes
 Partindo do conceito de probabilidade condicional temos,
 Agora Considerando o segundo e o último termo na expressão anterior
podemos escrever:
Esse é um resultado útil que nos capacita a resolver P(A|B) em termos de
P(B|A).
() ( | ). ( ) ( ) ( | ). ( )P A B P A B P B P B A P B A P A    
( | ). ( )
( | ) , para ( ) 0
( )
P B A P A
P A B P B
P B
 
( )
( | ) .
( )
P A B
P A B
P B


Teorema de Bayes
Solução:
M1: A peça é produzida pela máquina 1.
M2: A peça é produzida pela máquina 2.
D: A peça é defeituosa.
1
2
( ) 0,35
( ) 0,65
P M
P M


1
2
( | ) 0,05
( | ) 0,025
P D M
P D M


1 2
1 2
1 2
1 1 2 2
( ) ( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( | ) ( ) ( | )
( ) 0,35 0,05 0,65 0,025
( ) 0,03375
D D M D M
P D P D M P D M
P D P D M P D M
P D P M P D M P M P D M
P D
P D
   
   
   
 
   

Teorema de Bayes
Note que a probabilidade de uma peça ser defeituosa é uma média
ponderada das probabilidades de defeito em cada máquina; os pesos são
definidos de acordo com o nível de produção de cada máquina.
Na segunda parte do exemplo, temos uma informação sobre a peça: ela é
defeituosa, ou seja, sabemos que ocorreu o evento D. O que o problema
pede é que, com essa informação, reavaliemos a probabilidade de a peça ter
sido produzida pela máquina 2. Essa probabilidade é chamada
probabilidade a posteriori, ou seja, é a probabilidade que calculamos
depois de realizado o experimento de sorteio e teste da peça. Em
notação matemática, temos que calcular .
Por definição, temos:
2( | )P M D
2 2
2
( | ). ( )
( | )
( )
P D M P M
P M D
P D

Teorema de Bayes
Solução:
Comparando os resultados: sem qualquer informação sobre o resultado do
experimento, nossa estimativa para a probabilidade de ocorrência de
M2−peça ser produzida pela máquina 2 − era 0,65; com a informação de
que a peça é defeituosa, a probabilidade de ter sido produzida pela
máquina 2 diminui para 0,4815
2 2
2
2
2
( | ). ( )
( | )
( )
0,65 0,025
( | )
0,35 0,05 0,65 0,025
0,01625
( | ) 0,4815
0,03375
P M D P M
P M D
P D
P M D
P M D



  
 
Teorema de Bayes
Exercício:
Certo professor 4/5 das vezes vai trabalhar usando um fusca e nas demais
vezes usa um carro importado. Quando ele usa o fusca, 75% das vezes ele
chega em casa antes das 23 horas e quando usa o carro importado só chega
em casa antes das 23 horas em 60% das vezes. Ontem o professor chegou
em casa após às 23 horas. Qual a probabilidade de que ele, no dia de
ontem, tenha usado o fusca?
Teorema de Bayes
Solução:
B1: Usar o fusca
B2: Usar carro importado
A: Chegar em casa após 23 horas
P(B1) = 4/5 =0,80
P(B2) = 1/5 =0,20
P( A | B1) = 1 - 0,75 =0,25
P( A | B2) = 1 - 0,60 =0,40
P (B1 | A)= P (B1) . P( A | B1) / P (B1) . P( A | B1) + P (B2) . P( A | B2)
P (B1 | A)= 0,80 x 0,25 /(0,80 x 0,25) + (0,20 x 0,40) =
P (B1 | A)= 0,20 / (0,20 + 0,08) =0,7143 ou 71,43 %
 Na formalização que faremos a seguir, nos ocuparemos apenas das
variáveis quantitativas, contudo as variáveis qualitativas podem
ser, em algumas ocasiões e com o devido cuidado, tratadas como
discretas na atribuição de probabilidade.
 Vimos nas aulas anteriores que, utilizando uma tabela de
frequências, podemos representar, sem grande perda de informação e
evitando repetições, as vezes muito grande, os valores de uma
variável.
Analogamente, vamos formalizar, com a ajuda das Teorias das
Probabilidade, o comportamento da variável na população
associando a cada valor possível sua respectiva probabilidade de
ocorrência.
Variável Aleatória 
 Exemplo:
Em um processo de fabricação de um semicondutor, pastilhas de um lote
são testadas. Cada pastilha é classificada como condutora (C) e não
condutora (Ñc). O dono da fabrica deseja saber o número de pastilhas
condutoras em duas retiradas. Suponha independência nas retiradas.
Variável Aleatória 
 Solução:
 Vamos primeiramente definir o evento. Seja o evento X definido como:
X= Número de pastilhas testadas que são condutoras.
 Nesse caso vamos obter a seguinte tabela:
Variável Aleatória 
Tabela 1 - Número de pastilhas condutoras
Resultados 
Possíveis (Ω) 
Probabilidades Valor de X
CC 1/4 2
CÑc 1/4 1
ÑcC 1/4 1
ÑcÑc 1/4 0
 As variáveis aleatórias (v.a.) podem ser classificadas em discretas e
contínuas.
 Uma v.a. discreta é aquela que assume valores inteiros e finitos,
dentro de um intervalo, não podendo apresentar, entre seus possíveis
valores números decimais ou não inteiros.
Uma v.a. contínua, por outro lado, é aquela que pode assumir
diversos valores em um intervalo de números reais.
Variável Aleatória 
 Seja X é uma v.a. discreta e x1, x2, ..., xn seus diferentes valores, a
função discreta de probabilidade, ou função de probabilidade ou
simplesmente FP.
Definição: Função de probabilidade é a função que atribui a cada
valor da variável aleatória sua probabilidade. A notação utilizada é:
P(X=xi) = p(xi) = pi, i= 1, 2, ...
ou ainda,
Em uma função de probabilidade verifica-se 0 < pi < 1 e
Variável Aleatória 
Tabela 3 - Distribuição de probabilidade
X x1 x2 x3 .... Σ
P(X=x) p1 p2 p3 .... 1
ip 1.
i

 No exemplo anterior, percebam que X =1, irá ocorre nos eventos CÑc
e ÑcC, enquanto X =2 e X = 0, tem apenas um evento associado a eles,
respectivamente CC e ÑcÑc.
Segue então que as probabilidades associadas aos valores de X são as
seguintes:
Com esse exemplo podemos ver que, para descrever um experimento
aleatório é interessante que o pesquisador associe valores numéricos aos
respectivos resultados. Uma variável aleatória (v.a.) pode ser
caracterizada como uma variável que representa um valor único para
cada resultado de um experimento.
Variável Aleatória 
Tabela 2 - Função de distribuição do número de pastilhas condutoras
X 0 1 2 Σ
P(X=x) 1/4 1/2 1/4 1
 Exemplo:
Há uma chance de que seguros sejam compensados em uma certa
seguradora. Seja X o número de riscos compensados. A probabilidade de
que nenhum seguro seja compensado nessa seguradora é igual a 0,032; a
de apenas um seguro ser compensado é igual 0,065; de dois seguros
serem compensados é igual a 0,129; de três seguros serem compensados é
igual a 0,258 e a de quatro seguros serem compensados é igual a 0,515.
Baseado no exemplo anterior construa a função de probabilidade.
Variável Aleatória 
 Solução:
P(X = 0) = 0,032
P(X = 1) = 0,065
P(X = 2) = 0,129
P(X = 3) = 0,258
P(X = 4) = 0,516
Variável Aleatória 
Tabela 4 - Distribuição de probabilidade dos bits transmitidos
X 0 1 2 3 4 Σ
P(X=xi) 0,032 0,065 0,129 0,258 0,516 1
 Não basta, apenas, conhecer a distribuição de probabilidade de uma
variável aleatória, precisamos também conhecer valores que sejam
característicos dessa distribuição, por exemplo um valor que esteja no
centro dessa distribuição. Para isso iremos definir o valor esperado ou
valor médio de uma variável aleatória discreta.
Definição: Se X é uma variável aleatória discreta, sendo x1, x2, ..., xn seus
possíveis valores, então o valor esperado (ou esperança matemática ou
valor médio) de X é definido como:
Esperança de Variáveis Aleatória 
1
( ) ( )
n
i i
i
E X x P X x

 
 Propriedades da esperança:
1. E(a) = a
2. E(bX) = bE(X)
3. E(X+a) = E(X)+a
4. E(a+bX) = a+bE(X)
Esperança de Variáveis Aleatória 
 Exemplo: Calcule a esperança.
Vamos atribui números as possibilidades, 1 para pé direito e 0 para pé
esquerdo.
 Utilizando a formula temos:
Esperança de Variáveis Aleatória 
Tabela 2 - Função de distribuição do número de pastilhas condutoras
X 1 0
P(X=x) 7/11 4/11
7 4
( ) 1. 0. 0,64
11 11
E X   
1
( ) ( )
n
i i
i
E X x P X x

 
 Exemplo: Calcule a esperança.
Esperança de Variáveis Aleatória 
Tabela 2 - Função de distribuição do número de pastilhas condutorasX 0 1 2
P(X=x) 1/4 1/2 1/4
1 1 1
( ) 0. 1. 2. 1
4 2 4
E X    
1
( ) ( )
n
i i
i
E X x P X x

 
 Utilizando a formula temos:
 Exemplo: Calcule a esperança.
Esperança de Variáveis Aleatória 
Tabela 4 - Distribuição de probabilidade dos bits transmitidos
X 0 1 2 3 4 Σ
P(X=xi) 0,032 0,065 0,129 0,258 0,516 1
( ) 0 0,032 1 0,065 2 0,129 3 0,258 4 0,516 3,161E X           
1
( ) ( )
n
i i
i
E X x P X x

 
 Da mesma forma que caracterizamos uma variável aleatória com relação
ao centro da sua distribuição, também precisamos de um valor que
caracterize a dispersão de X em torno do seu valor esperado. Para isso
definimos a variância:
Definição: Seja X uma variável discreta. Definimos a variância de X,
denotada por V(X) ou , da seguinte maneira:
Variância de Variáveis Aleatória 
2
X
 
22 2( ) ( ) ( ) ( )V X X E X E X  
 Propriedades da Variância:
Variância de Variáveis Aleatória
2
2
1. ( ) 0
2. ( ) ( )
3. ( ) ( )
4. ( ) ( )
V X
V X a V X
V bX b V X
V a bX b V X

 

 
Exercício calcule a variância dos 
exemplos anteriores.
Variância de Variáveis Aleatória
 Função de distribuição acumulada:
A função de distribuição de probabilidade ou função acumulada de
probabilidade de uma v.a. discreta X é definida para qualquer número real
x, pela seguinte expressão:
Exemplo: Considere novamente o exemplo 2.
Suponha que quatro bits foram observados aleatoriamente, qual a
probabilidade de dois bits serem transmitidos com erro?
Variável Aleatória 
( ) ( )F x P X x 
 Solução: Ao observar a distribuição de probabilidade dessa variável fica
fácil responder essa pergunta.
Verifica-se que a probabilidade de dois bits serem transmitidos com erro é
igual a 0,129.
Agora vamos supor que queremos verificar a probabilidade de até dois
serem transmitidos com erro. É preciso obter a função de distribuição
acumulada no ponto 2.
Função de Distribuição Acumulada
Tabela 4 - Distribuição de probabilidade dos bits transmitidos
X 0 1 2 3 4 Σ
P(X=xi) 0,032 0,065 0,129 0,258 0,516 1
 Solução:
Função de Distribuição Acumulada
( ) ( )
(2) ( 2) ( 0) ( 1) ( 2)
(2) ( 2) 0,032 0,065 0,129
F x P X x
F P X P X P X P X
F P X
 
       
    
 Os valores completos da distribuição são:
Como exercício calcule a distribuição acumulada do exemplo 1.
Função de Distribuição Acumulada
 Quando o conjunto dos possíveis valores de uma v.a X é não
enumerável, ou seja um intervalo, dizemos que X é uma v.a. contínua.
 Ao invés de atribuirmos probabilidades aos valores possíveis da
variável, como ocorre com as v.a. discretas, aqui se atribui
probabilidades aos intervalos, por meio de uma função f(x) (função
densidade de probabilidade).
 A função f(x) é chamada de função densidade de probabilidade
(fdp) da v.a contínua X, de modo que:
Variável Aleatória (Não será cobrado na avaliação)
( ) 1, ( ) 0f x dx f x


 
 Para a função densidade de probabilidade (fdp) verifica-se as seguintes
propriedades:
Variável Aleatória (Não será cobrado na avaliação)
1) ( ) 0
2) ( ) 1
3) ( ) ( ) ( ), 
 .
b
a
f x
f x dx
P a X b f x dx área sob f x de a e b para
qualquer a e b




   


 O ponto importante é que a fdp é usada para calcular uma área que
representa a probabilidade de X ser um valor no intervalo [a,b], por
esse fato a probabilidade de X em qualquer ponto é zero.
 Uma vez que a probabilidade de cada ponto é zero:
Variável Aleatória (Não será cobrado na avaliação)
P(a<X<b)
( ) ( ) ( ) ( )P a X b P a X b P a X b P a X b          
 A esperança matemática de uma variável aleatória contínua X com
função densidade de probabilidade f(x) é dada por:
A variância de uma variável aleatória contínua X é calculada da seguinte
maneira:
Variável Aleatória (Não será cobrado na avaliação)
( ) . ( ) E X x f x dx


 
`
2 2 2( ) ( ( )) ( ) ( ( ))V X x E X dx x f x dx E X
 
 
    
EXERCÍCIO PARA SER FEITO EM SALA
Sabe-se que a chegada de clientes a uma loja de material
computacional, durante intervalos aleatoriamente escolhidos de 10
minutos, segue uma distribuição de probabilidade dada na tabela
abaixo.
Calcule:
a) O número esperado de chegada de clientes por intervalo de 10
minutos;
b) A variabilidade das chegadas;
c) Calcule E(3X)
d) Calcule E(5X + 2)
e) Var(X+2)
f) Var(3X – 2)
Número de chegadas X 0 1 2 3 4 5
Probabilidade P(X) 0,15 0,25 0,25 0,2 0,1 0,05
EXERCÍCIO PARA SER FEITO EM SALA
Seja a variável W o número de voltas concluídas em uma quadra e
P(W=w) a probabilidade de cada um dos eventos. W tem função de
probabilidade dada por:
Calcule:
a) A esperança e a variância da variável W.
b) A probabilidade de existirem 4 voltas concluídas.
c) A probabilidade de existirem no máximo 3 voltas concluídas.
W 1 2 3 4 5 
P(W=w) 1/21 2/21 ? 4/21 5/21 1
Distribuições de Probabilidade Discretas: Uniforme
Distribuição Uniforme Discreta.
Se X é uma v.a. cujo os possíveis valores são representados
por x1, x2, ..., xn. Dizemos que X seque uma distribuição
Uniforme Discreta se atribui a mesma probabilidade 1/n a
cada um desse n valores, isto é, a sua função de probabilidade
é dada por:
Então,
1
( )if x
n

1
( ) , 1, 2, ..., .iP X x i n
n
   
Distribuições de Probabilidade Discretas: Uniforme
 Exemplo 1: Uma rifa tem 100 bilhetes numerados de 1 a
100. Apenas um bilhete é premiado. Qual a probabilidade de
Dona Jurema que comprou um bilhete, de número 43, ser
sorteada?
Distribuições de Probabilidade Discretas: Uniforme
 Exemplo 2: Considere agora que Juca tem os bilhetes de
números de 21 a 25 e o seu colega Peter tem os bilhetes com
os números 1, 11, 29, 68, 93. Quem tem maior possibilidade
de escolher o bilhete premiado?
Distribuições de Probabilidade Discretas: Bernoulli 
Distribuição de Bernoulli
Suponha que o experimento, ou tentativa cujo, resultado
possa ser classificado como sucesso ou fracasso. Se X=1
quando o resultado é sucesso e X=0 quando o resultado é
fracasso, então a sua distribuição de probabilidade, com p
representando a probabilidade de sucesso, 0 < p <1, é dada
por:
Então temos:
X 0 1
P(X=xi) 1-p p
Distribuições de Probabilidade Discretas: Bernoulli
 Exemplo 2: Suponha que Geraldo tem uma gaiola com
pássaros amarelos e verdes, ele pede para Juca escolher um
pássaro. Geraldo está interessado em saber qual a
probabilidade de Juca escolher um pássaro verde. Sabe-se que
a probabilidade do pássaro ser verde é igual a 0,87.
Resposta: A probabilidade do pássaro ser verde é igual a 
0,87. 
Distribuições de Probabilidade Discretas: Bernoulli
Exemplo 3: Uma moeda é jogada uma vez, seja X definida
por:
1, ;
0, .
se ocorrer cara
X
se ocorrer coroa

 

Aqui a distribuição de X é:
X 0 1
P(X=xi) 1/2 1/2
Distribuições de Probabilidade Discretas: Bernoulli
 Exemplo 4: Suponha que a probabilidade de uma pessoa
levar um choque ao manusear um equipamento é igual a 0,01.
Se definimos:
1, ;
0, .
se pessoa leva choque
Y
se a pessoa não leva choque

 

Y 0 1
P(Y=yi) 0,99 0,01
 Como exercício calcule a esperança e a variância da
distribuição de Bernoulli, para os exemplos 2, 3, 4.
X~Bernoulli(p)
E(X) = p
Var(X)= p(1- p)
Distribuições de Probabilidade Discretas: Bernoulli
Distribuições de Probabilidade Discretas: Binomial
Distribuição Binomial
Se um experimento consiste de n repetiçõesindependentes
de Bernoulli, sendo constante e igual a p a probabilidade de
sucesso em cada repetição, então, que esse é um experimento
de binomial.
Se X corresponde ao número de sucessos em n repetições,
então pode-se dizer que X tem distribuição Binomial com
parâmetros n e p. Costuma-se escrever X~Bin(n,p). Sua
distribuição de probabilidade é dada por:
( ) (1 ) , 0, 1 , 2, ..., x n x
n
P X x p p x n
x
     
 
Distribuições de Probabilidade Discretas : Binomial
 Exemplo 5: Suponha que o Geraldo tem uma caixa com 8
bolas, ele deseja saber qual a probabilidade do Joca escolher
pelo menos 2 bolas em perfeito estado. Sabe-se de antemão,
que a probabilidade de uma bola, dessa caixa, em perfeito
estado é igual a 0,5.
Solução: X = Número de bolas perfeitas na caixa.
0 8 0 1 8 1
8
( 2) 1 ( 2) 1 [ ( 0) ( 1)
8 8
( 2) 1 .(0,5) .(1 0,5) .(0,5) (1 0,5)
0 1
( 2) 1 9(0,5) 0,9648
P X P X P X P X
P X
P X
 
        
    
         
    
   
Distribuições de Probabilidade Discretas : Binomial
 Exemplo 6: Em 10 lançamentos de uma moeda, qual será a
probabilidade de ocorrerem 3 caras?
Solução: X = Número de caras nos 10 lançamentos.
3 10 3
10 1 1
( 3) . . 1
3 2 2
( 3) 0,1172
P X
P X

     
       
    
 
Resposta: A probabilidade de que em 10 lançamentos ocorram 3 
caras é igual a 0,1172.
Distribuições de Probabilidade Discretas : Binomial
 Exemplo 7: Considere o exemplo 4.
Suponha que 20 pessoas utilizaram o tal equipamento. Qual a
probabilidade de que 14 levem choque ao manusear o
equipamento.
Solução: X = Número de pessoas que levam choque.
14 20 14
10
20
( 14) .(0,1) (1 0.1)
14
( 14) 2,0599 10
P X
P X


 
   
 
  
Resposta: A probabilidade de que em 20 pessoas 14 levem choque ao 
manusear o equipamento é igual a 2,0599x10-10.
 Como exercício calcule a esperança e a variância da
distribuição binomial, , para os exemplos 5, 6, 7.
X~Bin(n,p)
E(X) = np
Var(X)= np(1-p)
Distribuições de Probabilidade Discretas: Binomial
Distribuição Hipergeométrica
Considere uma população com N elementos, dos quais, r tem
a característica A. Se retiramos, sem reposição, uma amostra
de tamanho n e definimos X = número de elementos com a
característica A, temos que a distribuição de probabilidade de
X é dada por:
Dizemos que X~Hiper(N,n,r).
( ) , 0 
r N r
x n x
P X x x n
N
n
  
  
     
 
 
 
Distribuições de Probabilidade Discretas: Hipergeométrica
 Exemplo 8: Pequenos motores são guardados em caixas de
50 unidades. Um inspetor de qualidade examina cada caixa
antes da posterior remessa, testando 5 motores. Se nenhum
motor for defeituoso, a caixa é aceita. Se pelo menos um deles
for defeituoso, todos os 50 motores são testados. Dado que
existem 6 motores defeituosos numa caixa, qual a
probabilidade de que seja necessário todos os motores serem
examinados?
Distribuições de Probabilidade Discretas: Hipergeométrica
 Solução:
X = Número de motores defeituosos na amostra de 5 motores.
N = 50 (total de motores)
r = 6 (total de motores defeituosos)
n = 5 (tamanho da amostra)
6 44
0 5
( 1) 1 ( 0) 1 1 0,51 0,49
50
5
P X P X
  
  
          
 
 
 
Resposta: A probabilidade de que todos os motores sejam 
examinados é igual a 0,49
Distribuições de Probabilidade Discretas: Hipergeométrica
 Exemplo 9: Considere o experimento, retiram-se 3
bolas da urna (sem reposição). Define-se uma v.a. X
cujos valores representam o número total de bolas
vermelhas dentre as 3 escolhidas.
N = 7 (total de bolas)
r = 5 (total de bolas vermelhas)
n = 3 (número de bolas retiradas, amostra)
Solução:
5 7 5
3 3 3
( 3) 0,2857
7
3
P X
  
  
    
 
 
 
Resposta: A probabilidade
de 3 bolas retiradas, sem
reposição, dessa urna, ser
vermelha é igual a 0,2857.
Distribuições de Probabilidade Discretas: Hipergeométrica
 Como exercício calcule a Esperança e a Variância do
exemplo 8 e 9.
E(X) = np
Var(X) = np(1-p) .
( )
( 1)
N n
N


Distribuições de Probabilidade Discretas: Hipergeométrica
Distribuições de Probabilidade Discretas: Poisson
Distribuição de Poisson
Uma variável aleatória X tem distribuição de Poisson com
parâmetro λ se:
Dizemos que X~Poisson(λ)
.
( ) , 0, 1 , 2, ...
!
xe
P X x x
x
 
  
 Exemplo 10: Falhas ocorrem ao acaso ao longo do
comprimento de um fio delgado de cobre. Seja X a variável
aleatória que conta o número de falhas em um comprimento
de 1 milímetro. Qual a probabilidade de existirem exatamente
2 falhas? Considere um taxa média de 2,3 falhas por
milímetro.
2,3 22,3
( 2) 0,265
2!
e
P X

  
Distribuições de Probabilidade Discretas: Poisson
 Exemplo 11: A emissão de partículas radioativas tem sido modelas
através de uma distribuição de Poisson. Suponha que o número de
partículas alfa, emitidas por minuto seja uma variável aleatória seguindo o
modelo de Poisson com parâmetro 5, isto é, a taxa média de ocorrência é
de 5 emissões a cada minuto. Calculemos a probabilidade de haver mais
de 2 emissões em um minuto.
Solução: A = Número de partículas alfa emitidas por minuto.
 
5 0 5 1 5 2
( 2) 1 ( 2) 1 ( 0) ( 1) ( 2)
5 5 5
( 2) 1
0! 1! 2!
( 2) 1 0,125 0,875
P X P X P X P X P X
e e e
P X
P X
  
          
 
     
 
   
Distribuições de Probabilidade Discretas: Poisson
Distribuições de Probabilidade Contínuas: Normal
Distribuição Normal ou Gaussiana
Essa distribuição foi desenvolvida pelo matemático francês
Abraham DeMoivre e foi estendida posteriormente por
Laplace e por Gauss. Hoje essa distribuição está incorporada
em um teorema probabilístico conhecido como teorema do
limite central.
A distribuição normal e comumente utilizada em situações
que incluem características populacionais, tais como a
altura de pessoas, velocidade de uma molécula de gás,
corrente elétrica em um fio, entre varias outras.
Distribuições de Probabilidade Contínuas: Normal
 Dizemos que X é uma v.a. normal, ou simplesmente que X
é normalmente distribuída, com parâmetros µ e σ², se a
função densidade de X é dada por:
A esperança e a variância de uma v.a. X com distribuição
Normal , são dadas por:
A notação utilizada será a seguinte X~N(µ, σ²)
2
2
( )
2
1
( ) , 
2
x
f x e x





    
2( ) ( )E X V X  
Distribuições de Probabilidade Contínuas: Normal
Algumas características da distribuição normal:
i) f(x) é simétrica em relação à µ;
ii) f(x) → 0 quando x →
iii) o valor máximo de f(x) se dá para x = µ

x
f(x)
Distribuições de Probabilidade Contínuas: Normal
 Esse gráfico nos mostra que:
 99,74% das observações estão entre a média e ± 3 desvios-
padrões;
 95,44% das observações estão entre a média e ± 2 desvios-
padrões;
 68,26% das observações estão entre a média e ± 1 desvio-padrão.
Distribuições de Probabilidade Contínuas: Normal
Exemplo 4: Suponha que o tempo que um atleta gasta para
dar uma volta completa em um circuito siga a distribuição
normal, com média de 10 minutos e uma variância de 4
(minutos)². Qual a probabilidade de que o tempo que o atleta
gaste para concluir exceda 13 minutos?
Solução:
2
2
( )
2
13
1
( 13)
2
x
P x e dx





  
Distribuições de Probabilidade Contínuas: Normal
Obs.: No cálculo de probabilidadepara variáveis contínuas,
devemos resolver a integral da função densidade no intervalo
de interesse. Entretanto, a integral da distribuição densidade
da Normal só é resolvida de modo aproximado e por
métodos numéricos. Por essa razão as probabilidades para a
distribuição Normal são calculadas com o auxílio de uma
tabela.
Para o uso da tabela da distribuição normal é necessário
padronizar a variável.
Distribuições de Probabilidade Contínuas: Normal
 Para padronizar a variável utilizaremos a seguinte fórmula:
A padronização não afeta a normalidade da variável. Após
padronizar a variável terá distribuição N(0,1), e será
denominada de Normal Padrão ou Normal Reduzida.
X
Z




98
Distribuições de Probabilidade Contínuas: Normal
Distribuições de Probabilidade Contínuas: Normal
Exemplo 5: Considere o exemplo 4. Em que a variável tem
média de 10 minutos e uma variância de 4 (minutos)² e
perguntava-se qual a probabilidade de que o tempo que o
atleta gaste para concluir exceda 13 minutos?
Solução:
10 13 10 13 10
( 13)
2 2 2
( 1,5)
X
P X P P Z
P Z
     
       
   

100
Distribuições de Probabilidade Contínuas: Normal
Distribuições de Probabilidade Contínuas: Normal
.Conclusão: A probabilidade de que tempo que o atleta gaste para
concluir exceda 13 minutos é igual a 0,5 - 0,43319 = 0,06681.
INTERVALO DE CONFIANÇA
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE CIÊNCIAS EXATAS E DA TERRA
DEPARTAMENTO DE ESTATÍSTICA
DOCENTE: Mariana Oliveira Cedraz
 A estimação, por pontos, de um parâmetro não possui
uma medida do possível erro cometido na estimação.
Uma maneira de expressar a precisão da estimação é
estabelecer limites, que com certa probabilidade
incluam o verdadeiro valor do parâmetro da população.
Esses limites são chamados de limites de confiança.
Logo, a estimação, por intervalos, consiste na fixação
de dois valores tais que 1-α seja a probabilidade de que o
intervalo de confiança, determinados pelos dois
valores, contenha o verdadeiro valor do parâmetro .
Intervalo de confiança
 Possíveis:
1) Para média populacional, com variância conhecida;
2) Para média populacional, com variância desconhecida;
3) Para a proporção.
OBS: Qual o tamanho da amostra? Essa informação vai 
influenciar no cálculo!
Intervalo de confiança
 Procedimentos para a construção do intervalo de
confiança:
1) Retirar uma amostra aleatória simples de n elementos;
2) Calcular a média amostral (ou proporção – p);
3) Calcular o desvio padrão (quando necessário) associado
a cada tipo de medida;
4) Fixar um nível de significância α, e com ele
determinar zα ou tα .
1-α
2

2

 Perceba que α nos dá a medida de incerteza. Como 
temos um intervalo, o α tem que ser dividido por dois.
-z z
Intervalo de confiança para média populacional
Intervalo de confiança para média populacional: Com variância 
conhecida
Considerando uma população normal com média
desconhecida, que desejamos estimar, e σ² conhecida,
isto é, temos informações da variância populacional.
Então para determinarmos os valores do intervalo de
confiança para estimarmos a média utilizaremos a
seguinte fórmula:
ou
 ( ,1 ) . xIC x z     
( . . ) 1x xP x z x z         
Você determina!
Intervalo de confiança para média populacional: Com variância 
desconhecida
Considerando que NÃO temos informações da
variância populacional, isto é, σ² desconhecida e além
do mais o tamanho da amostra (n) é menor que 30,
utilizaremos a distribuição t-Student para encontrar o
quantil da distribuição.
Então para determinarmos os valores do intervalo de
confiança para estimarmos a média utilizaremos a
seguinte fórmula:
ou
 ( ,1 ) . xIC x t s    
( . . ) 1x xP x t s x t s       
1
2( )
1
n
i
ix xs
n





Você determina!
Intervalo de confiança para proporção
Quando temos interesse na proporção de uma
determinada característica da população, utilizaremos a
seguinte fórmula:
ou
Intervalo de confiança
 Procedimentos para encontrar o valor na tabela:
1. Distribuição normal (n>30):
Qual a área de interesse? Supondo ser 95%
Dividirá a área por 2 e irá procurar no corpo da tabela o
valor correspondente.
Ex: 0,95/2 = 0,475 --> A partir dessa área acha o valor
(1,96)
2. Distribuição t-Student (n≤30):
Encontrar quantos graus de liberdade: n-1
Qual o valor de  (alfa)?
Supondo n=10, portanto temos 9 graus de liberdade e
=5% --> A partir dessas duas informações, o valor é:
2,262
Intervalo de confiança
Exercício:
O projetista de uma indústria tomou uma amostra de 36
funcionários para verificar o tempo médio gasto para
montar um determinado brinquedo. Lembrando que foi
verificado que uma média de 19,9 minutos e desvio padrão
de 5,73.
Qual o intervalo de confiança, com nível de significância de
5%? E com nível de significância de 10%?
Intervalo de confiança
Exercício:
As notas na disciplina de estatística dos alunos de uma
turma segue distribuição normal com σ²= 2. Uma amostra
de 9 alunos foi selecionada obtendo-se as seguintes notas:
Construa, ao nível de significância de 5%, o intervalo de
confiança para média.
5,5 7,9 8,3 6,4 5,7 6,6 7,0 8,8 7,1
Intervalo de confiança
Exercício:
Uma amostra de 10 alunos foi escolhida, a idade deles está
descrita na tabela abaixo, construa um intervalo de
confiança para a média com 98% de confiança.
9 8 12 7 9 6 11 6 10 9
Intervalo de confiança
Exercício:
Sabe-se que dentre 400 pessoas que tomaram vacina
contra a gripe, 136 sentiram algum efeito colateral.
Construa um intervalo de 90% de confiança para a
verdadeira proporção dos que sofreram efeito colateral com
a referida vacina.
Intervalo de confiança
Cálculo para determinar o tamanho da amostra ideal:
•Média:
•Proporção:
2
2/ . 






E
sZ
n 
2
2)1.(











p
Z
ppn


Erro!
Erro!
Intervalo de confiança
Exercício:
Em um estudo para a determinação do perfil dos alunos da
Faculdade Pitágoras, a característica de maior interesse tem s =
0,3. Qual deve ser o tamanho da amostra para que tenhamos 95%
de confiança em que o erro da estimativa da  correspondente a
esta característica não supere 0,05?
Intervalo de confiança
Exercício:
Suponha que se deseja estudar uma população de
idosos com diabetes. Sabe-se de pesquisas anteriores que a
probabilidade de ser diabéticos é de 42%.Calcule o tamanho
da amostra necessário para ter uma margem de erro de 3%?
e para 6%? Usando um nível de significância de 95%.
TESTE DE HIPÓTESES
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE CIÊNCIAS EXATAS E DA TERRA
DEPARTAMENTO DE ESTATÍSTICA
DOCENTE: Mariana Oliveira Cedraz
Teste de hipóteses
Técnica para se fazer inferência estatística sobre uma 
população a partir de uma amostra
HIPÓTESE ESTATÍSTICA
Trata-se de uma suposição quanto ao valor de um
parâmetro populacional, ou quanto à natureza da
distribuição de probabilidade de uma variável populacional.
TESTE DE HIPÓTESE
É uma regra de decisão para aceitar ou rejeitar uma
hipótese estatística com base nos elementos amostrais.
Teste de hipóteses
HIPÓTESE NULA (H0): É representada por uma
igualdade, o que é convencional a ser usado.
HIPÓTESE ALTERNATIVA (H1): É o que deverá ser
testado, o que você está interessado.
Ex:
H0: =70 Kg
H1: ≠70 Kg
Ex:
H0: =1.65 m
H1: ≠1.65 m
Teste de hipóteses
TIPOS DE ERRO
Ao se testar H0 contra H1, podem ocorrer dois tipos de
erro:
Erro do tipo I: Rejeitar H0, quando H0 é verdadeira
P(Rejeitar H0 | H0 verdadeira)= P(Erro tipo I) = 
Erro do tipo II: Não rejeitar H0, quando H0 é falta
P(Não rejeitar H0 | H0 falsa) = P(erro tipo II) = 
Teste de hipóteses
EXEMPLO DE ERRO
Uma pessoa é acusada de ter cometido um delito, até que se
prove o contrário, a pessoa é considerada inocente
Criando as hipóteses:
H0: O réu é inocente.
H1: O réu é culpado.
A acusação tem que apresentar provas para culpar o
suspeito, se essas não forem suficientes o juiz não pode
acusar o réu, ou seja, não pode rejeitar H0.
Quais erros podem acontecer?
Aceitar H0 Rejeitar H0
H0 verdadeira Acerto!! Erro do tipo I
H0 falsa Erro do tipo II Acerto!!
Condenar 
um 
inocente
Não 
condenar 
um culpado
Teste de hipóteses
COMO PLANEJAR UM TESTE DE HIPÓTESES?
1) Definir as hipóteses a serem testadas;
2) Fixar a probabilidade de erro (Geralmente usa =0.01,
0.05 ou 0.10);
OBS: Quanto menor o , maior a confiança ao decidir
rejeitar H0.
Teste de hipóteses
COMO PLANEJAR UM TESTE DE HIPÓTESES?
3) Determinar a região crítica em função da variável
tabelada:
4) Calcular o valor da variável do teste obtido na amostra;
5) Concluir sobre a rejeição das hipóteses, com base na
comparação do valor calculado e do tabelado;
Tabela o1 - Valores de Z para distribuição N(0,1)
Teste de hipóteses
LÓGICA DO TESTE DE SIGNIFICÂNCIA
1) Atribuem-se baixos valores para , geralmente entre 1 e
10%;
2) Formula-se H0 com a pretensão de rejeitá-la, daí o nome
de hipótese nula;
3) Se o teste indicar a rejeição de H0 tem-se um indicador
mais seguro da decisão;
4) Caso o teste indique a aceitação de H0, diz-se que, com o
nível de significância , não se pode rejeitar H0.
Teste de hipóteses
TESTE DE HIPÓTESES PARA MÉDIA
Podem ser divididos em:
Testes para média:
Variância populacional conhecida
Variância populacional desconhecida
Teste para diferença entre médias:
Variância populacional conhecida
Variância populacional desconhecida e iguais
Variância populacional desconhecida e diferentes
Observações emparelhadas
Teste de hipóteses
TESTE DE HIPÓTESE PARA MÉDIA COM 
VARIÂNCIA POPULACIONAL CONHECIDA
Rejeita-se H0 (hipótese nula) se o valor de Z calculado da
expressão acima for:
(i) Maior do que Zα (no teste unilateral à direita);
(ii) Menor do -Zα (no teste unilateral à esquerda) e
(iii) Maior que Zα/2 ou menor que -zα/2 (no teste bilateral).
Teste de hipóteses
TESTE DE HIPÓTESE PARA MÉDIA COM 
VARIÂNCIA POPULACIONAL DESCONHECIDA
Rejeita-se H0 (hipótese nula) se o valor de t calculado da
expressão acima for:
(i) Maior do que tα (no teste unilateral à direita);
(ii) Menor do -tα (no teste unilateral à esquerda) e
(iii) Maior que tα/2 ou menor que -tα/2 (no teste bilateral).
Como o desvio padrão é
desconhecido é necessário
estima-lo, passando a ter uma
distribuição t de Student.
Teste de hipóteses
ÁREA DE REJEIÇÃO DO TESTE
Teste de hipóteses
APLICAÇÃO
A empresa de Queijo de Coalho compra leite de
diversos fornecedores. O leite é uma matéria-prima essencial
para a fabricação do queijo. O gerente de produção Titico,
muito experiente, suspeita de que os fornecedores estejam
adicionando água ao leite para aumentarem o seu lucro.
Titico sabe que a temperatura média de congelamento do
leite puro é de μ = -0,545o ºC com desvio padrão σ = 0,008o
ºC. Além disso, Titico está ciente de que a adição de água
eleva a temperatura de congelamento do leite em direção a
zero grau Celsius. Assim Titico resolve fazer um teste de
qualidade com algumas amostras de leite. Para tanto, ele
mede a temperatura de congelamento de cinco lotes de leites
de um determinado fornecedor. A média amostral
encontrada foi de -0,538.
Teste de hipóteses
APLICAÇÃO
Temos alguma evidência de que o determinado
fornecedor está adicionando água?
Para responder essa pergunta, iremos realizar um teste de
hipóteses.
1) Criando as hipóteses:
H0: Temperatura média de congelamento do leite é igual a -
0,545
H1: Temperatura média de congelamento do leite é maior a -
0,545
H0: μ = -0,545
H1: μ > -0,545
Teste de hipóteses
APLICAÇÃO
Sob H0, μ0 = -0,545 e Zc é igual:
Como o valor calculado encontra-se na área de rejeição,
iremos rejeitar H0, ou seja, há indícios de que o fornecedor
esteja adicionando água ao leite.
 
.96,1
5/008,0
545,0538,0
/
0 




n
x
z 

Teste de hipóteses
TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS 
POPULACIONAIS COM VARIÂNCIAS CONHECIDAS
Teste de hipóteses
TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS 
POPULACIONAIS COM VARIÂNCIAS DESCONHECIDAS E 
IGUAIS
g.L: n1 + n2 - 2
Teste de hipóteses
TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS 
POPULACIONAIS COM VARIÂNCIAS DESCONHECIDAS E 
DIFERENTES
com
Teste de hipóteses
TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS 
POPULACIONAIS COM OBSERVAÇÕES EMPARELHADAS
Um caso especial de testes t para duas amostras
ocorre quando as observações nas duas populações de
interesse são coletados em pares. Cada par de observações,
como (X1j, X2j), é tomado sob condições homogêneas, mas
essas condições podem mudar de um par para outro.
Para observações emparelhadas, o teste consiste em
determinar primeiro a diferença “d” entre cada par de
valores e então testar a hipótese nula de que a média das
diferenças na população é igual a zero. Então, do ponto de
vista de cálculo, o teste é aplicado a uma única amostra de
valores d.
Teste de hipóteses
TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS 
POPULACIONAIS COM OBSERVAÇÕES EMPARELHADAS
A média, desvio padrão e erro padrão da amostra de
valores “d” são obtidos pelas fórmulas:
Teste de hipóteses
TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS 
POPULACIONAIS COM OBSERVAÇÕES EMPARELHADAS
Continuação:
Uma vez que o erro padrão da diferença média é
calculado com base nas diferenças observadas em amostras
emparelhadas (logo σ é desconhecido) e os valores de d
geralmente podem ser admitidos como tendo distribuição
Normal, as distribuições t são apropriadas para testar a
hipótese nula de que μd= 0.
A estatística de teste, então, será dada por:
Com:
gl = n - 1
Teste de hipóteses
APLICAÇÃO
Estuda-se o conteúdo de nicotina de duas marcas de cigarros
(A e B), obtendo-se os seguintes resultados.
A: 17; 20; 23; 20
B: 18; 20; 21; 22; 24
Admitindo que o conteúdo de nicotinas das duas marcas tem
distribuição normal e que as variâncias populacionais são
iguais, com α=0,05, pode-se afirmar que existe alguma
diferença significativa no conteúdo médio de nicotina nas
duas marcas?
Teste de hipóteses
APLICAÇÃO
Sejam
X: O conteúdo de nicotina da marca A
Y: O conteúdo de nicotina da marca B
•Nosso interesse é testar as seguintes hipóteses:
H0: A média do conteúdo de nicotina presente na marca A é
igual ao presente na marca B.
H1: A média do conteúdo de nicotina presente na marca A é
diferente ao presente na marca B.
OU
Teste de hipóteses 
da diferença entre 
duas médias 
populacionais 
com variâncias 
desconhecidas e 
iguais
A: 17; 20; 23; 20
B: 18; 20; 21; 22; 24
APLICAÇÃO
APLICAÇÃO
 Sendo assim temos:
 A estatística calculada é:
APLICAÇÃO
 A região critica da distribuição t-Student, para α=0,05 e 
gl= n1 + n2 – 2 = 4+5-2=7

Continue navegando