Probabilidade_e_Estatisticas_Avancado_Te

breadcrumb-separator

UFF

em 17/03/2025

Conteúdos escolhidos para você

SIMULADO Matemática e Raciocínio Lógico para Agente de Pesquisas e Mapeamento (IBGE) 2023

SIMULADO Matemática e Raciocínio Lógico para Agente de Pesquisas e Mapeamento (IBGE) 2023

Matemática no Ensino Médio

Matemática no Ensino Médio

Morettin_e_Bussab_cap 5 - Probabilidades

Morettin_e_Bussab_cap 5 - Probabilidades

FAMA

Modelos Probabilísticos

Modelos Probabilísticos

Apostila Probabilidade e estatística

Apostila Probabilidade e estatística

UNIFTEC

Perguntas dessa disciplina

Desafio Prazo para envio: 31/12/25 23:59 Liberação do feedback: 01/01/26 00:00 Avaliar se existe algum tipo de associação entre duas variáveis qu...

Questão 04 Grande parte das aplicações em computação exige operações do tipo inserção, remoção e consulta de dados. Essas operações demando tempo c...

Única

Desafio Prazo para envio: 31/12/25 23:59 Liberação do feedback: 01/01/26 00:00 As medidas de tendência central, como a média, a mediana e a moda,...

Ler em voz alta - Há um sentimento subjacente de que o aumento da quantidade de informações faz com tenhamos de nos desfazer de muitas delas. Por caus

O ser humano pode ser representado por diversos estímulos, externos e internos, que geram seucomportamento e sensações. Dessa forma, há a subdivisão d

Uniasselvi

Material

Conteúdos escolhidos para você

SIMULADO Matemática e Raciocínio Lógico para Agente de Pesquisas e Mapeamento (IBGE) 2023

SIMULADO Matemática e Raciocínio Lógico para Agente de Pesquisas e Mapeamento (IBGE) 2023

Matemática no Ensino Médio

Matemática no Ensino Médio

Morettin_e_Bussab_cap 5 - Probabilidades

Morettin_e_Bussab_cap 5 - Probabilidades

FAMA

Modelos Probabilísticos

Modelos Probabilísticos

Apostila Probabilidade e estatística

Apostila Probabilidade e estatística

UNIFTEC

Perguntas dessa disciplina

Desafio Prazo para envio: 31/12/25 23:59 Liberação do feedback: 01/01/26 00:00 Avaliar se existe algum tipo de associação entre duas variáveis qu...

Questão 04 Grande parte das aplicações em computação exige operações do tipo inserção, remoção e consulta de dados. Essas operações demando tempo c...

Única

Desafio Prazo para envio: 31/12/25 23:59 Liberação do feedback: 01/01/26 00:00 As medidas de tendência central, como a média, a mediana e a moda,...

Ler em voz alta - Há um sentimento subjacente de que o aumento da quantidade de informações faz com tenhamos de nos desfazer de muitas delas. Por caus

O ser humano pode ser representado por diversos estímulos, externos e internos, que geram seucomportamento e sensações. Dessa forma, há a subdivisão d

Uniasselvi

Prévia do material em texto

Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 1/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Probabilidades e Estatística 2009/ 2010 
 
 
 
 
 
 
 
 
 
 
 
 
 Para a 1ª Frequência 
 Teoria 2 
 Frequências 2000-01-12 102 
 Frequências 2000-01-26 118 
 Frequências 2000-07-10 134 
 Frequências 2003-06-18 (1ª parte) 144 
 Frequências 2007-12-06 155 
 Frequências 2008-06-21 (1ª parte) 163 
 Frequências 2008-11-06 176 
 Frequências 2009-02-02 196 
 
 
 
 Para a 2ª Frequência 
 Teoria 202 
 Frequências 2003-06-18 (2ª parte) 286 
 Frequências 2008-06-21 (2ª parte) 289 
 Frequências 2009-01-14 293 
 
 
 
 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 2/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
 
Regra do Produto 
 
Definição: Seja S um conjunto de resultados associado a uma experiência aleatória. 
Sejam A e B dois acontecimentos, com ( ) 0p B ≠ . A probabilidade para que A se realize, 
sabendo-se que B se realizou, designa-se por ( )|p A B e define-se pelo quociente, 
 
( ) ( )
( )
p A B
p A B
p B
∩
= 
 
A probabilidade de A, condicionada pela realização de B (ou a probabilidade de A 
sabendo se B), que acaba de definir-se, representa a reavaliação da probabilidade de A 
em face da informação de que B se realizou. 
 
Definição: Seja S um conjunto de resultados associado a uma experiência aleatória e 
sejam A e B dois acontecimentos. Dizemos que A e B são independentes se e só se 
 
( ) ( ) ( ) x p A B p A p B∩ = 
 
 
Consequência: Invertendo a expressão 
( ) ( )
( )
p A B
p A B
p B
∩
= 
 
Obtém-se a regra do produto: 
( ) ( ) ( ) x |p A B p B p B A∩ = 
 
 
Teorema: De um modo geral, a regra do produto é dada por: 
 
( ) ( ) ( ) ( ) ( )1 2 3 1 2 1 3 1 2 1 2 3... x | x | x ... x | ...n n np A A A A p A p A A p A A A p A A A A A∩ ∩ ∩ ∩ = ∩ ∩ ∩ ∩ ∩
 
 
Teorema da Probabilidade Total: Seja Ω um espaço amostral associado a uma 
experiência aleatória qualquer. Se os n acontecimentos 1 2 3, , ,..., nB B B B de ( )P Ω são 
incompatíveis dois a dois, isto é, não existem dois que sejam compatíveis, e 
1 2 3 ... nB B B B = Ω� � � � então para qualquer acontecimento A de ( )P Ω tem-se que: 
 
( ) ( ) ( ) ( ) ( )1 2 3 ... + np A p B A p B A p B A p B A= ∩ + ∩ + ∩ + ∩ 
 
1 - No lançamento de um dado perfeito, qual é a probabilidade de o número obtido ser 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 3/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
6, sabendo que se obteve um 
 
1.1. Número par? 
1.2. Número ímpar? 
1.3. Múltiplo de 3? 
 
Resolução: 
 
1.1 - ( ) ( ) 1 numero 6 1ser o numero 6 | sendo par |
3 numeros pares 3
p p A B= = = 
 
1.2 - ( ) ( ) 1 numero 6ser o numero 6 | sendo impar | 0
não é impar
p p A B= = = 
 
1.3 ( ) ( ) 1 numero 6 1ser o numero 6 | sendo multiplo de 3 |
3 ou 6 2
p p A B= = = 
 
 
 
2 - Uma urna contém duas bolas verdes e três azuis. Tiram-se sucessivamente duas 
bolas sem reposição. Sabendo que a primeira bola é azul, qual é a probabilidade de que 
a segunda bola seja: 
 
2.1. Verde? 
2.2. Azul? 
 
Resolução: 
 
Nota: 1V representa a 1ª vez que é retirado uma bola, e 2V a 2ª vez. 
 
2.1 - ( )1 2
2 (numeros possiveis de sair a bola certa) 1
4 (numero totais de bolas ainda existentes) 2
p V V = = 
 
2.2 - ( )1 2
2 (numeros possiveis de sair a bola certa) 1
4 (numero totais de bolas ainda existentes) 2
p V V = = (é igual!) 
 
 
 
 
3 - Extrai-se, ao acaso, uma bola de uma caixa que contém vinte bolas numeradas de 1 
a 20. Considere os acontecimentos: 
 
A: "a bola extraída tem um número par"; 
B: "a bola extraída tem um número múltiplo de 5". Indique o valor da probabilidade 
condicionada ( )|p B A . 
 
Sugestão: nos exercícios 1, 2 e 3 utilize a regra de Laplace. 
Resolução: 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 4/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
( )p B A , em que o B representa os números múltiplos de 5, mas do lote de A, e o A 
representa os números pares. 
 
Ora de 1 a 20, tem se 10 números pares, e destes apenas dois são múltiplos de 5. Assim fica: 
 
( ) 2 1 0,2
10 5
p B A = = = 
 
 
4 - Dos acontecimentos A e B sabe-se que: 
 
( ) 3
10
p A = e ( ) 7
10
p A B =� 
 
Calcule sabendo ( )p B que A e B são independentes. 
 
Resolução: 
 
Vou recordar algumas regras: 
 
 A e B são incompatíveis se, e só se, (conjunto vazio)A B = ∅� 
 A e B são contrários se, e só se, (Universo)A B S=� 
 A e B são independentes se, e só se, ( ) ( ) ( ) x p A B p A p B=� 
 
 ( ) ( ) ( ) ( ) + - p A B p A p B p A B=� � 
 
 
 
A azul está representando elementos que entra nos dois grupos, e é por isso que existe o 3º 
termo do 2º membro. Ou seja para anular a repetição da contagem dos elementos que já 
foram contados. 
 
( ) ( ) ( ) - p A B p A p A B− = � 
 
 
Quando afirmo que são independentes, significa que a 2ª vez não depende do resultado obtido 
da 1ª, e assim escrever a seguinte equação: 
 
( ) ( ) ( ) x p A B p A p B∩ = 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 5/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Assim para resolver o exercício, e depois de analisar as três pistas dadas: 
 
- ( ) 3
10
p A = , ( ) 7
10
p A B =� , e A e B serem independentes. 
 
 
 
( ) ( ) ( ) ( )7 7 + - 
10 10
p A B p A p B p A B= ⇔ = ⇔� � 
 
Sei o valor de ( )p A , e como são independentes, então ( ) ( ) ( ) x p A B p A p B=� , fica: 
 
( )
�
( ) ( ) ( )
( )
( ) ( ) ( ) 3 73 7 + - x + - x
110 10 010
p A B
p A
p B p Bp B p A p B p A⇔ = ⇔ = ⇔
�
�������
 
 
( ) ( )� ( )
3
10
7 3 4
 
10 10 1
 . 1
3
10 0
 . p Ap B p B
� �
� �
⇔ − = ⇔ = ⇔� �
� �
−
� �� �
 
 
( ) 4
7
p B = 
 
5 - Prove que: Se A e B são acontecimentos independentes então A e B também o são. 
 
Resolução: 
( ) ( ) ( ) x p A B p A p B∩ = 
 
Para provar que ( ) ( ) ( ) x p A B p A p B∩ = , sabendo a representação do Universo: ( ) 1p s =
. 
 
( ) ( ) ( ) ( ) ( )
( )
( )
�1
p S
p A A
p A A p S p A p A p A A= ⇔ + − = ⇔
�
� �
�����������
 
 
( ) ( ) ( ) ( )0 1 1p A p A p A p A⇔ + − = ⇔ = − 
 
Assim: ( ) ( ) ( ) ( ) ( ) ( )1 1p A B p A B p A B p A p B p A B∩ = = − = − + − =� �� �� � � 
 
( ) ( ) ( )1 p A p B p A B= − − + � como são independentes ( ) ( ) ( ) x p A B p A p B∩ = 
 
( ) ( ) ( ) ( )1 x p A p B p A p B= − − + = 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 6/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Aqui tenho que recordar da regra: ( )( )1 1 1a b ab a b− − + = − − , e assim fica: 
 
( ) ( ) ( ) ( ) ( )( ) ( )( )1 1 1p B p A p A p B p A p B− − + = − − 
 
Como sei que ( ) ( )1p A p A= − e ( ) ( )1p B p B= − 
 
Posso então afirmar que ( ) ( ) ( ) x p A B p A p B∩ = c.q.d. 
 
 
 
 
6 - Numa amostra constituída por 100 indivíduos obtiveram-se os resultados 
apresentados no quadro seguinte e aleatoriamente seleccionou-se um indivíduo ao 
acaso:Com Bronquite Sem Bronquite 
Fumadores 40 20 
Não fumadores 10 30 
 
 
6.1. Diga, justificando, se os acontecimentos «ser fumador» e «ter bronquite» são 
independentes. 
 
6.2. Calcule a probabilidade de um indivíduo que é fumador ter bronquite. 
 
 
Resolução: 
 
6.1 - Para este exercício vou utilizar a regra dos abraços (expressão que se usa na gíria, pois 
matematicamente não dá para provar nada). Consiste em verificar se A x D = B x C. Se for 
verdade posso antever que são variáveis independentes. 
 
 
40x30 = 20x10 
 
É falso, não são independentes. Mas esta afirmação não tem qualquer significado 
matemático, apenas me ajuda a antever a resposta. Vou agora passar a provar 
matematicamente: 
 
Sei que ( ) ( ) ( ) x p F B p F p B=� , se forem independentes. 
Sei que ( ) 40 0,4
100
p F B = =� 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 7/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Sei que ( ) 60 0,6
100
p F = = 
Sei que ( ) 50 0,5
100
p B = = 
 
( ) ( ) ( ) ( ) ( ) x 0,6 x 0,5 0,3p F B p F p B p F B p F B= ⇔ = ⇔ =� � � 
 
Posso então concluir que ( ) ( ) ( ) x p F B p F p B≠� (não são independentes). 
 
 
6.2 - ( ) ter bronquite sendo fumadorp B F → : 
 
( ) ( )
( )
0,4 3
0,6 2
p B F
p B F
p F
= = =
�
 
 
 
 
7 - A probabilidade de um indivíduo A estar vivo daqui a 30 anos é 0.6 e a 
probabilidade de um outro indivíduo B estar vivo daqui a 30 anos é 0.7. Determine a 
probabilidade de daqui a 30 anos: 
 
7.1. Estarem vivos os indivíduos A e B; 
7.2. Não estarem vivos os indivíduos A e B; 
7.3. Estar vivo pelo menos um dos indivíduos. 
 
Resolução: 
 
Sei então que ( ) 0,6p A = e ( ) 0,7p B = , 
 
7.1 - ( ) ( ) ( ) x 0,6 0,7 0,42Xp A B p A p B= = =� 
7.2 - ( ) ( ) ( ) ( ) ( ) x 1 0,6 1 0,7 0,12Xp A B p A p B= = − − =� 
7.3 - ( ) ( ) ( ) ( ) + - 0,6 0,7 0,42 0,88p A B p A p B p A B= = + − =� � 
 
 
 
8 - O João frequenta a Escola Secundária da cidade próxima do local onde vive. 
Diariamente, tem duas possibilidades para ir às aulas: de comboio ou de autocarro. 
Como prefere o autocarro, 60% das vezes escolhe esse meio de transporte. 
Sabendo que a probabilidade de chegar atrasado às aulas é 22% e que a probabilidade 
de ir de autocarro e chegar atrasado é 12%, calcule a probabilidade de: 
 
8.1. Chegar atrasado sabendo que veio de autocarro; 
8.2. Chegar atrasado ou ir de autocarro; 
8.3. Não chegar atrasado e não ir de autocarro; 8.4. ir de autocarro dado que chegou 
atrasado. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 8/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução: 
 
Sei então que ( ) 0,6p Auto = ( ) 0,4p Comboio = 
( ) 0,22p Atrasado = ( ) 0,12p Auto Atrasado =� 
 
 
8.1 - ( ) ( )
( )
0,12
/ 0,2
0,6
p Atrasado Auto
p Atrasado Auto
p Atrasado
= = =
�
 
 
8.2 - ( ) ( ) ( ) ( ) + - p Atrasado Auto p Atrasado p Auto p Atrasado Auto= − =� 
 
0, 22 0,6 0,12 0,7= + − = 
 
 
8.3 - ( ) ( ) ( )1 - 1 0,7 0,3p Atrasado Auto p Atrasado Auto p Atrasado Auto= = = − =� � � 
 
 
 
8.4 - ( ) ( )
( )
0,12 6
/
0, 22 11
p Auto Atrasado
p Auto Atrasado
p Auto
= = =
�
 
 
 
 
9 - A distribuição dos 200 passageiros num avião é: 
 
 Homens Mulheres Crianças 
Portugueses 15 8 12 
Espanhóis 21 5 17 
Franceses 54 22 46 
 
 
Sai uma pessoa do avião. Qual é a probabilidade de: 
 
9.1. Ser uma criança espanhola? 
9.2. Ser portuguesa sabendo que é uma criança? 
9.3. Não ser portuguesa sabendo que é uma criança? 
 
Resolução: 
 
9.1 - ( ) ( ) 17
200
p Crianças Espanhola p C E= =� � 
 
Nota: não pode ser ( ) ( ) ( ) x p C E p C p E=� , pois não são independentes. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 9/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
9.2 - ( ) ( )
( )
12
12 16200 0,16
75 75 100
200
Condicionada
p P C
p P C
p C
= = = = =
�
�����
 
 
9.3 - ( ) ( )( )
75 12
63 21 84200 0,84
12 17 46 75 25 100
200Condicionada
p P C
p P C
p C
−
= = = = = =
+ +
�
�����
 
 
 
 
 
 
10 - Supondo que a probabilidade de uma pessoa ser morena é 0,65 e a probabilidade 
de ter os olhos verdes é 0,15. Determine a probabilidade de: 
10.1. Ser morena e ter olhos verdes; 
10.2. Ser morena ou ter olhos verdes; 
10.3. Três pessoas serem morenas. 
 
Observação: Neste exercício vai ter que considerar que os acontecimentos "ser 
moreno/a" e "ter olhos verdes" são independentes... 
 
Resolução: 
( ) 0,65 ( ) 0,15p M p V= ∧ = 
 
 
10.1 - 
( )
( ) ( ) x ( ) 0,65 x 0,15 0,0975
Acontecimento independente
está no enunciado
p M V p M p V∩ = = =������� 
 
10.2 - ( ) ( ) ( ) ( ) 0,65 0,15 0,0975 0,7025p M V p M p V p M V∪ = + − ∩ = + − = 
 
 
10.3 - 1 2 3 1 2 3( ) ( ) x ( ) x ( ) 0,65 x 0,65 x 0,65 0,27p M M M p M p M p M∩ ∩ = = ≈ 
 
 (são independente) 
 
 
 
 
11 - Num determinado país, 65% dos habitantes têm automóvel, 42% têm telemóvel e 
23% têm automóvel e telemóvel. 
 
Resolução: 
( ) 0,65 ( ) 0,42 ( ) 0,023p A p T p A T= = ∩ = 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 10/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
11.1. Escolhido ao acaso um habitante deste país, qual é a probabilidade de ele não ter 
telemóvel nem automóvel? 
 
11.2. Um determinado habitante tem telemóvel. Qual é a probabilidade de ele ter 
também automóvel? 
 
Resolução: 
 
 
11.1 - ( ) ( ) 1 ( ) 1 ( ) ( ) ( )p A T p A T p A T p A p T p A T∩ = ∪ = − ∪ = − − + ∩ = 
 
 1 ( ) ( ) ( ) 1 0,65 0, 42 0, 23 0,16p A p T p A T= − − + ∩ = − − + = 
 
 
 
11.2 – ( ) ( ) 0,23 23
( ) 0, 42 42
p A T
p A T
p T
∩
= = = 
 
 
 
12 - Interrogaram-se os funcionários de uma empresa e concluiu-se que: 
• 80% têm telefone de rede fixa; 
• 60% têm telemóvel; 
• 5% não têm qualquer tipo de telefone. 
 
12.1. Seleccionando ao acaso um trabalhador daquela empresa, qual é a probabilidade 
de ele ter telefone de rede fixa e telemóvel? 
12.2. Encontrou-se um funcionário que tinha telemóvel. Qual é a probabilidade de ele 
ter telefone de rede fixa? 
 
Resolução: 
( ) 0,8 ( ) 0,6 ( ) 0,05p F p M p F M= = ∩ = 
 
12.1 - ( ) ( ) ( ) ( ) ( ) ( ) 1 (p F M p F p M p F M p F p M p F M� �∩ = + − ∪ = + − − ∪ =� � 
 
( ) ( ) 1 ( ) 0,8 0,6 1 0,05 0, 45p F p M p F M= + − + ∩ = + − + = 
 
 
12.2 - 
( ) 0, 45 3
( / ) 0,75
( ) 0,6 4
p F M
p F M
p M
∩
= = = = 
 
 
 
 
13 - Sendo A e C dois acontecimentos tais que ( ) 0p C ≠ , prove que: 
( ) ( )| | 1.p A C p A C+ = 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 11/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução: 
 
( ) ( )
( ) ( ) 1 1
( ) ( )
p A C p A C
p A C p A C
p C p C
∩ ∩
+ = ⇔ + = ⇔ 
 
 
 
( ) x ( )p A p C
⇔
( )p C
( ) x ( )p A p C
+
( )p C
1 ( ) ( ) 1 . . .p A p A c q d= ⇔ + =
 
 
 
Nota: de ( ) ( ) 1p A C p A C+ =
 
tira-se: ( ) ( )| 1 |p A C p A C= − 
 
 
 
 
14 - Dos acontecimentos A e B sabe-se que são independentes, ( ) ( )0 ,p A p B< < 
 
( ) 12
49
p A B =� e ( ) ( )| | 1.p A B p B A+ = 
Determine ( ).p B 
 
 
Resolução: 
( ) (
( ) ( ) 1
)
(
1
) )(
p A B
p
p A B p
B A
B
p
A
A B
p
∩∩
+ = ⇔ + = ⇔
 
 
Aqui é preciso ter cuidado, pois o que se pretendesaber é o p(B), e como não sei o valor de 
p(A) vou fazer “desaparece-lo”: 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 12/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
( )
( )
( )p A B
p B
p A
⇔ +
∩ x ( )
( )
p B
p A
1= ⇔
 
 
Agora fazer “desaparecer” a fracção: 
[ ]2 x( ) ( ) ( ) ( ) ( ) (( ) )p A B p B p p A BB B Bp B p p⇔ + = ⇔ ∩ + =∩ ⇔ 
 
Como sei o valor de ( )p A B∩ , pois este é me dado no enunciado: 
( ) ( )
2
12
1 1 4. 1
12 490 ( )
49 2
p B p B p B
± − +
⇔ + − = ⇔ = ⇔� �� � 
 
1 11 1 4 349 7( ) ( ) ( )
2 2 7 7
p B p B p B
± ±
⇔ = = ⇔ = ∨ = 
 
Agora tem se que analisar e validar os valores obtidos: 
12 12
( ) ( ) ( )
49 49
p A B p A p B∩ = ⇔ = 
Assim: 
4 12 3 12 12 12
( ). ( ). ( ) ( )
7 49 7 49 28 21
p A p A p A p A= ∨ = ⇔ = ∨ =
 
 
 
!!
3 4
( ) ( )
7 7
Falso
p A p A= ∨ =
�����
 
 
 
Porque que é que 
4
( )
7
p A = é falso? Porque no enunciado é me dito que ( ) ( )0 .p A p B< < 
Ora para ter 
4
( )
7
p A = , 
3
( )
7
p B = . Pode não parecer mas 
3 4
( ) ( ) .
7 7
p B p A= < = 
 
 
 
Resposta.: 
3 4
( ) ( )
7 7
p A p B= ∧ =
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 13/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
15 - Sejam A, B e C três acontecimentos possíveis de um mesmo espaço de resultados. 
Prove que se A e C são incompatíveis, então ( ) ( )| |p A B C p B C=� �� �� . 
Resolução: 
 
Sabe-se que, para A e C serem incompatíveis, então A C∩ = ∅ , isto é, ( )p A C∩ = ∅ . 
Tenho que provar: ( ) ( )p A B C p B C� ∪ � =� � 
 
Recordar a regra da distributiva em relação a união: ( )*a b c ab ac+ = + . Assim: 
( )
( )
( )
( ) ( )
( )
p A B C p A C B C
p C p
B
C
p A C
∩ ∪ ∩� � � �� � � �=� � =� =�
� �
�
 
 
( )( ) ( )
( )
( ) .
(
./
)
.
p B C p B C
p C p C
p B C c q d
∅ ∪ ∩ ∩
== = 
 
 
16 - Num teste de avaliação de Matemática, feito por 28 alunos de uma turma do 12.0 ano, 
verificou-se que 75% das raparigas tiveram positiva e 3 raparigas tiveram negativa. Sabendo 
que neste teste ter nota positiva é independente do sexo, determine o número de rapazes que 
tiveram positivas no teste. 
 
 
Resolução: 
( )
( ) 0,75 0,75
( )
p P M
p P M
p M
∩
= ⇔ = ⇔
 
( ) x (p P p M
⇔
)
( )p M
0,75 ( ) 0,75p P= ⇔ =
 
 
Ora se ouve 75% de positivas, de um total de 28 alunos, significa que houve 0,75 X 28 = 21 
positivas. 
Já consigo introduzir valores na tabela: 
 
 H M T 
P 21 
N 3 
T 28 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 14/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Logo, com os valores que já sei, consigo calcular mais alguns valores. Houve 7 negativas 
(28-21). 
 
Se sei o total das negativas, e quantas mulheres tiveram negativas, também já consigo saber 
quantos homens tiveram negativa: 4 (7-3). 
 
Agora tenho dúvidas nas positivas! 
 
Sei que são independentes, caso contrario o enunciado teria que dizer que não o eram. Vou 
criar duas variáveis para os valores que não sei, e utilizar a regra dos abraços. 
 
 H M T 
P a b 21 
N 4 3 7 
T 28 
 
 
 
Só se usa a regra dos abraços quando são independentes. 
4
4 4 9
3 4 3
3 3
21 4
7 63 921
3
Xa b
a b a b a
a b
b bb b
� = � ��= = =� � � �
⇔ ⇔ ⇔ ⇔	 	 	 	
+ =
 � � �= =+ = 
 
�
 
36
12
3
9
9
aa
b
b
� == ��
⇔ ⇔	 	
=
� =
 
 
 H M T 
P 12 9 21 
N 4 3 7 
T 28 
 
Resposta: 12 rapazes tiveram positivas. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 15/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Provar a Regra dos Abraços: 
 A A 
B ( )p A B∩ ( )p A B∩ 
B ( )p A B∩ ( )p A B∩ 
 
( ) ( ) ( ) ( ). . ?p A B p A B p A B p A B∩ ∩ = ∩ ∩ = 
 
Como são independentes: ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )p A p B p A p B p A p B p A p B=
 
 c.q.d. 
 
 
17-Dos alunos de uma escola secundária, sabe-se que: 
 
40% São raparigas 15% Fumam 60% Dos fumadores são rapazes 
 
 
17.1. Escolhido aleatoriamente um dos alunos da escola, determine a probabilidade de ser: 
a) Uma rapariga que não fuma. 
b) Ser fumador sabendo que é rapariga. 
 
17.2. Os acontecimentos "ser rapariga" e "ser fumador" são independentes? Justifique a 
resposta 
 
 
Resolução: 
 
 ( ) ( ) ( )0, 4 0,15 0,6p M p F p H F= = = 
 
Neste exercício a dificuldade estava em conseguir escrever esta equação: ( ) 0,6p H F = 
Neste tipo de exercício, convém primeiro tentar preencher a tabela. 
Construindo a tabela: 
 H M T 
F 0,15 
F 
T 0,4 1 
 
Aqui o segredo estava no total! No enunciado não é dito que é um, mas deduz-se. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 16/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Consigo calcular o total de homens, que é 1-0,4=0,6, e o total de não fumadores: 0,85. 
 
 H M T 
F 0,15 
F 0,85 
T 0,6 0,4 1 
 
 
Agora vou calcular ( )p H F� : 
 
( ) ( )
( )
( ) ( )0,6 0,6 0,6
p H F
p H F p H F p F
p F
= ⇔ = ⇔ = ⇔
�
� 
 
( ) ( )0,6 0,15 0,09Xp H F p H F⇔ = ⇔ =� � 
 
 
Ao saber ( )p H F� , consigo calcular ( )p M F� , e é ( ) ( )1 0,06p M F p H F= − =� � 
 
 H M T 
F 0,09 0,06 0,15 
F 0,85 
T 0,6 0,4 1 
 
 
Agora já se consegue calcular os valores em falta: 
 
 H M T 
F 0,09 0,06 0,15 
F 0,51 0,34 0,85 
T 0,6 0,4 1 
 
Agora, com a tabela preenchida, já consigo responder. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 17/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
17.1 - a) ( ) 0,34p M F∩ = 
b) ( ) ( )
( )
0,6
0,15
0, 4
p F M
p F M
p M
∩
= = = 
 
 
17.2 - 0,09*0,34 0,51*0,06
Regra do abraço
=����������� 
 
Como é uma preposição verdadeira, posso concluir que M e F são independentes. 
 
 
 
18 - De um baralho de 52 cartas, extraem-se duas cartas. Calcule a probabilidade de obter 
duas damas. 
 
 
Resolução - tirar ao mesmo tempo ou separado é igual, pois não há reposição. 
 
 (As Cartas Damas não são independentes) 
 
Como se pretende calcular a probabilidade de duas Damas consecutivas, tem se que a noção 
que então a primeira carta a sair é Dama. 
 
( ) ( )1 2
4 3
52 51
p D e p D= = 
 
( )1 2
4 3 1
*
52 51 221
p D D∩ = = 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 18/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Nota: se A e B são independentes 
 
( ) ( )
( )
( )
p A B
p A B p A
p B
probabilidade de A sabendo B
∩
= =
↓
 
 
É ( )p A , pois é indiferente o valor de B, pois são independentes. 
 
 
 
19 - Lancei um dado duas vezes. Determine a probabilidade de ter saído dois números pares. 
 
 
Resolução: ( )1 2p P P∩ Já sei que o 1º é par 
( )1 para a 2ª vez não interressa.p P 
( )1 2
3 3 1
*
6 6 4
p P P∩ = = 
20 - Uma caixa contém 5 lápis pretos e 9 lápis brancos. Tiram-se sucessivamente, sem 
reposição, dois lápis da caixa. Determine a probabilidade de seremda mesma cor. 
 
 
Resolução: 5 pretos e 9 brancos 
 
Vou usar a convenção: 
 
 
� � ( ) ( ) ( )1 2 1 2 1 2 1 2 1 2 1 2. .
Pretos Brancos Cuidado que esta é a
parte de intersecção
p PP B B p P P p B B p PP B B
� �
= ∪ = + −
 �

 �
� �
�����
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 19/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Mas trata-se de uma condição impossível!!! 
Pois estou a dizer que da 1ª vez vou tirar um lápis, este é preto e branco (o índice 1 
representa a 1ª vez, e o 2, a 2ª vez). Ora como só tiro um lápis de cada vez, não podem sair 2. 
Assim, 
( ) ( ) ( )1 2 1 2 1 2 1 2. . 0p PP B B p P P p B B= ∪ = + − =
 
( ) ( ) ( ) ( )1 2 1 1 2 1
5 4 9 8 46
. * *
14 13 14 13 91
p P p P P p B p B B= + = + = 
 
 
 
21 - Considere um grupo de 10 pessoas, sendo 6 mulheres e 4 homens. Escolhe-se um grupo 
de duas pessoas. Determine a probabilidade de o grupo ser formado por um homem e por uma 
mulher. 
 
Resolução: 6M 4H 
 
( ) ( ) ( ) ( )1 2 1 2 1 2 1 2 1 2 1 2p H M M H p H M p M H p H M M H∪ = + − ∩ = 
( ) ( ) ( ) ( ) ( )1 2 1 1 2 1 0p H p M H p M p H M p= + − =
 
4 6 6 4 8
* *
10 9 10 9 15
= + =
 
 
 
 
22 - Qual é a probabilidade de o Pedro e o João terem nascido no mês de Dezembro? 
 
Resolução: 
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 2
1 1 1
. . *
12 12 144
independentes
p D D p D p D D p D p D= = = =
�����
 
 
 
 
 
23 - Atirei ao ar duas moedas. Determine a probabilidade de ter saído duas faces coroas. 
 
Resolução: 
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 2
1 1 1
. . *
2 2 4
p C C p C p C C p C p C= = = = 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 20/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
24 - Considere um lançamento simultâneo de dois dados equilibrados. Qual é a probabilidade 
do produto dos números das faces que ficam voltadas para cima ser par? 
 
Resolução - tem que haver pelo menos um par. O segredo está aqui: 
 Excluir as situações dos dois serem ímpares 
 
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 2
1 1 1 3
1 1 . 1 1 * 1
2 2 4 4
p I I p I p I I p I p I= − = − = − = − = − = 
 
 
25 - Uma caixa contém 12 lâmpadas coloridas, das quais 5 estão fundidas. Determine a 
probabilidade de tirar ao acaso três lâmpadas e estarem todas boas. 
 
Resolução - 7B 5F 
 
( ) ( ) ( ) ( )1 2 3 1 2 2 1 21
7 6 5 210 7
. . * *
12 11 10 1320 44
p B B B p B p B B p B B B= = = = 
 
 
 
26 - A ementa de um restaurante tem 4 sobremesas diferentes. Três clientes escolhem a 
sobremesa. Qual é a probabilidade de escolherem sobremesas iguais? 
 
Resolução - ( ) ( ) ( ) ( )11 21 31 12 22 32 13 23 33 14 24 34
A B C D
p S S S p S S S p S S S p S S S+ + +
����� ������� ������� �������
 
 
A, B, C e D são incompatíveis dois a dois. 
 
Significa que a união é vazio: 0A B∩ = 
 
Assim ( ) ( ) ( )p A B p A p B∪ = + 
 
� � �
3 3 3
1 1 1 1 1 1 4 1
* *
4 4 4 4 4 4 16*4 16
B C DA
= + + + = =
�����
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 21/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
27 - Numa terra há só 3 médicos. Numa noite, adoecem 5 habitantes. Cada um deles escolhe, 
ao acaso, um dos médicos e chama-o por telefone. Qual é a probabilidade de que chamem 
todos o mesmo médico? 
 
Resolução: ( )11 21 31 41 51 12 22 32 42 52 13 23 33 43 53p D D D D D D D D D D D D D D D∪ ∪ = 
 
( )11 21 31 41 51 12 22 32 42 52 13 23 33 43 53) ( ) (p D D D D D p D D D D D p D D D D D= + + = 
 
5 5 5 4 4
1 1 1 3 1 1
3 3 3 3.3 3 81
= + + = = = 
 
 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 22/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Probabilidade – Ficha 3 
 
 
2 - Num determinado canal de televisão fez-se publicidade a um detergente X. Pretendia-se 
saber se este facto teria influência na compra desse detergente. Fez-se uma sondagem e 
concluiu-se que: 
65% das pessoas viram o anúncio na televisão; 
45% compraram o detergente; 
30% viram o anúncio na televisão e compraram o detergente X. 
 
a) Com os dados, construa um diagrama de Venn para melhor interpretação da situação 
descrita (A = "ver o anúncio na televisão"; B = "comprar o detergente X") 
b) Qual a percentagem de pessoas que nem viram o anúncio na televisão nem compraram o 
detergente X? 
c) Qual a percentagem de pessoas que apenas compraram o detergente X? 
d) Qual a probabilidade de uma pessoa comprar o detergente X, quando viu o anúncio na 
televisão? 
 
Resolução: 
 
a) ( ) ( ) ( )0,65 0,45 0,3P A P B P A B= ∧ = ∧ =� 
 
 
 
b) ( ) 0,2P C = - 20% 
 
c) 0,45 – 0,30 = 0,15=15% 
 
d) Aqui o universo é o total dos que viram o anúncio. O acontecimento é o facto de terem 
comprado. 
( ) 0,3| 0, 462
0,65
P B A = =
 
4 - Uma empresa tem 500 empregados: 380 licenciados, 412 com estágio na empresa e 50 
com estágio na sucursal estrangeira. Só há um grupo de empregados que têm dois tipos de 
formação no seu CV: 357 empregados são licenciados e estagiaram na empresa. 
Qual a probabilidade de um empregado ao acaso 
 
a) ter pelo menos um tipo de formação? 
b) ser licenciado ou ter estagiado na empresa? 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 23/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
( ) 380 0,76
500
P A = ≈ , ser licenciado. 
 
( ) 412 0,82
500
P B = ≈ , ter estagio na empresa. 
 
( ) 50 0,1
500
P C = = , ter estagiado na sucursal no estrangeiro. 
 
( ) 357 0,71
500
P A B = ≈� , Licenciado com estagio. 
 
 
 
 
 
( )) 1– 1 0,046 0,714 0,11 0,1 1 0,03 0,97a A B C∪ ∪ = − − − − = − = 
) 0,046 0,714 0,11 0,87b A B∪ = + + = 
 
 
 
5. Os alunos de Engenharia do sexo masculino de uma dada universidade praticam desporto 
nas seguintes percentagens: 
Futebol - 30%; Andebol - 20%; Ténis de Mesa - 20%; 
Futebol e Andebol - 5%; Futebol e Ténis de Mesa-10%; Andebol e Ténis de Mesa - 5%; 
Todos os 3 desportos - 2%. 
 
Determine a probabilidade de um aluno, escolhido aleatoriamente 
a) praticar desporto; 
b) jogar somente futebol; 
c) jogar futebol ou ténis de mesa. 
Se o escolhido praticar desporto, qual a probabilidade de 
d) jogar somente futebol? 
e) jogar andebol? 
f) jogar futebol ou ténis de mesa? 
 
Resolução - acontecimentos: 
 
F= “praticar futebol”, A= “praticar andebol”, T= “praticar ténis”- 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 24/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
( ) ( ) ( )0,3 0,2 0,2P F P A P T= ∧ = ∧ = 
 
( ) ( ) ( ) ( )0,05 0,1 0,05 0,02P F A P F T P A T P F A T= ∧ = ∧ = ∧ =� � � � � 
 
 
 
1 0,17 2 0,07 3 0,12 4 0,08= ∧ = ∧ = ∧ = 
 
5 0,02 6 0,03 7 0,03 8 0,48= ∧ = ∧ = ∧ = 
 
 
a) ( ) 0,17 0,07 0,12 0,08 0,02 0,03 0,03 0,52P D F T A= = + + + + + + =� � 
 
b) ( ) 0,3 (0,08 0,02 0,03) 0,17P E = − + + = - joga somente futebol 
 
c) ( ) ( )0,17 0,03 0,08 0,07 0,03 0,4P B = + + + + = 
 
d) O universo máximo agora é de 52%, conforme visto na alínea a). 
 
 
( ) ( )
( )
0,17
|
0,52
P E
P E D
P D
= = 
 
e) ( ) ( )
( )
0, 2
| 0,385
0,52
P AP A D
P D
= = = 
 
f) 
( )
( )
0, 4
0,52
P B
P D
= 
6 - Na tabela seguinte apresenta-se a composição por género e destreza da população de um 
país. 
Género 
Masculino Feminino 
Destreza 
Destro 1.726.348 2.110.253 
Esquerdino 638.309 753.125 
Outra 15.239 7.435 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 25/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Admita que se selecciona ao acaso um indivíduo desta população. 
a) Qual a probabilidade de o indivíduo seleccionado ser destra? 
b) E a de ser esquerdino? 
c) E a de ser uma mulher destra? 
d) Qual a probabilidade de o indivíduo seleccionado ser destro, admitindo que é uma mulher? 
 
 
Resolução – 1º é necessário fazer as somas laterais: 
 
Género 
Masculino Feminino Total 
Destreza 
Destro 1.726.348 2.110.253 3.836.601 
Esquerdino 638.309 753.125 1.391.434 
Outra 15.239 7.435 22.674 
Total 2.379.896 2.870.813 5.250.709 
 
 
 
( ) Total destro . . 0,731
Total de individuos . .
P A = = ≈
3 836 601
5 250 709
 
 
 
( ) . . 0, 265
. .
P B = ≈
1 391 434
5 250 709
 
 
 
( ) 2.110.253 0,402
. .
P C = ≈
5 250 709
 
 
 
( ) 2.110.253 0,75
. .
P D = ≈
2 870 813
 
 
 
 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 26/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Probabilidade – Ficha 4 
 
 
 
4 - O mercado do serviço de telemóvel reparte-se por três empresas: empresa A com uma 
quota de 41%, empresa B com 38% e empresa C com 21%. Um estudo levado a cabo por uma 
associação de consumidores revelou que havia utilizadores do serviço insatisfeitos: 35% dos 
clientes da empresa A, 35% dos clientes da empresa de B e 30% dos clientes da empresa C. 
Calcule a probabilidade de um cliente satisfeito estar ligado à rede da empresa B. 
 
Resolução – 1º vou identificar os acontecimentos: 
 
A – “ser cliente da empresa A”. 
B – “ser cliente da empresa B”. 
C – “ser cliente da empresa C”. 
 
S – “estar satisfeito”. 
 
( ) ( ) ( )0,41 0,38 0,21P A P B P C= ∧ = ∧ = 
 
( ) ( ) ( )| 0,35 | 0,35 | 0,30P S A P S B P S C= ∧ = ∧ = 
 
Pretende se ( )| ?P B S = , em que o “B” é o que se pretende saber, e “S” condição que já sei. 
 
Para resolver este exercício, preciso de saber alguma teoria: 
 
Partição { } 1i iA ≥ é uma partição de Ω . 
 ( )
disjunto
, os acontecimentos são todos diferentesi jA A i j= ∅ ≠������
. 
 
 ( )
1
todo reunidos, temos de voltar ao qie se tinha no inicioi
i
A
≥
= Ω� . 
 
 
Teorema da probabilidade total. 
 B um acontecimento. 
{ } 1i iA ≥ uma partição de Ω . 
 ( ) ( ) ( )
1
|
n
i i
i
P B P B A P A
≥
=� 
 
 
Teorema de Bayes 
 
 A, B acontecimentos de Ω . 
 ( ) ( ) ( )
( )
|
|
P A B P B
P B A
P A
= 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 27/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
{ } 1i iD ≥ uma partição de Ω . 
A um acontecimento Ω . 
 
 
 
( )
�
( )
�
( ) ( )
( ) ( )
Envolvendo uma
 partição
Acontecimentoelemento da
 partição 
1
|
|
|
i i
i n
S i iB
i
P A D P D
P D A
P A D P D
≥
� �

 �
=
 �

 �
� � �
����	���
 
 
 
 
( ) ( ) ( )
( ) ( )
1
|
|
|
i i
i n
i i
i
P A D P D
P D A
P A D P D
≥
=
�
 
 
 
Voltando ao exercício, vou elaborar uma arvore: 
 
 
 
 
Pretende-se ( ) ( )
( )
( ) ( )|
|
 " "
P B S P S B P B
P B S
P S Três ramos com S
= = =
�
 
 
( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
|
|
| | |
P S B P B
P B S
P S A P A P S B P B P S C P C
⇔ = ⇔
+ +
 
 
( ) 0,65 x 0,38|
0,65 x 0, 41 0,65 x 0,38 0,70 x 0,21
P B S⇔ = ⇔
+ +
 
 
( )| 0,374P B S = 
 
A, B, C são partições. Os três formam o universo. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 28/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
( ) ( ) ( ) 1P A P B P C+ + = 
 
 
 
 
Ou então, bem mais simples poderia ter elaborado uma tabela: 
 
 S S Total 
 A 14,35 26,65 41 
 B 13,30 24,7 38 
 C 6,30 14,7 21 
 Total 33,95 66,05 100 
 
( ) 24,7| 0,374
66,05
P B S = = 
 
7 - Uma companhia vende aparelhos de telefone. Cada telefone é, antes de ser vendido, 
inspeccionado por dois inspectores. Quando aparece um telefone com defeito, o primeiro, o 
Sr. Pereira, detecta-o com probabilidade 0,3 e coloca-o no caixote de telefones “a reparar”. 
Dos telefones defeituosos que passam sem ser detectados pelo primeiro inspector, o segundo 
encontra, em média, 6 em cada 10. 
 
a) Qual a fracção de telefones com defeito que são detectados (por algum dos inspectores)? 
b) Se um telefone foi parar ao caixote dos telefones a reparar qual a probabilidade de que 
tenha sido lá colocado pelo primeiro inspector? 
(Normal, 1 de Fevereiro de 2003, adaptado) 
 
 
( ) ( )0,3 2º 0,6P PERREIRA P= ∧ = 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 29/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
1D = telefone com defeito que é detectado pelo Sr. Pereira. 
2D = telefone com defeito que é detectado pelo 2º inspector. 
D = foi para o caixote. 
 
 
a) Telefone com defeito a ser detectado: ( ) ( )( )11 2P D P D D D= ⇔� � 
 
( ) ( ) ( ) ( ) ( ) ( ) ( )1 1 11 2 1 2
0,3 0,6 0,7
|P D P D P D D P D P D P D D P D⇔ = + ⇔ = + ⇔�
��� ��������
 
 
( ) 0,72P D = 
 
b) ( ) ( ) ( )
( )
( )1 11 1
| 1 x 0,3
| |
0,72
P D D P D
P D D P D D
P D
⇔ = ⇔ = ⇔ 
 
( )1 | 0,417P D D ≈ 
 
 
 
 
 
 
8. No passado dia 19 de Outubro foi lançado a partir do cosmódromo de Baikonur, no 
Cazaquistão, o primeiro de três satélites de órbita polar do programa MetOp (Meteorological 
Operational Satellite Programme). Suponha que a parte eléctrica do satélite foi produzida por 
3 companhias diferentes (designemo-las por companhia A, B e C), nas proporções
0,5, 0,3 e 0, 2 . Suponha ainda que as probabilidades de avaria das componentes eléctricas, 
nas primeiras 24 horas em órbitas são, na mesma ordem, de 0,02, 0,05 e 0,01. 
 
a) Qual a probabilidade de uma componente avariar nas primeiras 24 horas em órbita? 
b) Passadas 24 horas verificou-se a avaria de uma componente. Qual a probabilidade de esta 
componente ter sido fabricada pela companhia B? 
c) Considere o mecanismo apresentado. 
 
Os pequenos rectângulos são componentes cuja origem está identificada pela letra que 
contêm. O mecanismo funciona se existir um caminho entre as extremidades E1 e E2 
contendo componentes em bom estado. Supondo que as componentes funcionam 
independentemente umas das outras, qual a probabilidade do mecanismo funcionar? 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 30/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 (Especial, 28 de Outubro de 2006) 
 
 
Resolução 
 
A – componente a ser produzido pela companhia A. 
B – componente a ser produzido pela companhia B. 
C – componente a ser produzido pela companhia C. 
D – componente avariado nas primeiras 24 horas. 
 
 
( ) ( ) ( )0,5 0,3 0,2P A P B P C= ∧ = ∧ = 
 
( ) ( ) ( )| 0,02 | 0,05 | 0,01P D A P D B P D C= ∧ = ∧ = 
 
a) ( ) ( ) ( ) ( ) ( ) ( ) ( )
0,02 x 0,5 0,05 x 0,3 0,01 x 0,2
| | | 0,027P D P D AP A P D B P B P D C P C= + + =
������� ������� �������
 
 
 
b) ( ) ( ) ( )
( )
| 0,05 x 0,3
| 0,556
0,027
P D B P B
P B D
P D
= = ≈ 
 
 
c) F – mecanismo funciona? 
 
1A - 1º componente a utilizar fabricado em A e estar em bom estado. 
2A - 2º componente a utilizar fabricado em A e estar em bom estado. 
1B - 1º componente a utilizar fabricado em B e estar em bom estado. 
2B - 2º componente a utilizar fabricado em B e estar em bom estado. 
1C - 1º componente a utilizar fabricado em C e estar em bom estado. 
 
 
( ) ( ) ( ) ( )1 2 1 2 2 1 2P F P A A P B B A P C A= ⇔� � � � � � 
 
( ) ( )( )( )2 1 1 2 1P F P A A B B C⇔ = ⇔� � � � 
 
( ) ( ) ( )( )2 1 1 2 1
Reunião de 3 acontecimentos
P F P A P A B B C⇔ = ⇔� � �
�����������
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 31/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
Observação: 
 
 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
Na figura é o 4 e 5 Na figura é o 5 e 6 Na figura é o Na figura é o5 e 7 5
P A B C P A P B P C P A B CP A B P A C P B C− − − += + + � � �
��������������
� �
����
�
�
�
���
 
( ) ( ) ( ) ( ) ( ) ( )( )
( ) ( ) ( )
( )
( ) ( )1 11 1 2
2 1 11 12 1 2 11 x ... 
P A P CP A P B P B
P A B B P A CP F P A P A P B B P C
�
�⇔ = + +
�
�
− −
�
� � �
����������
�
����
 
( )
( ) ( )
( )( )
( ) ( ) ( )
( )( )
( ) ( ) ( ) ( )1 1 1 1 2 11 12
1 1 1 1 12 1 1 2...
P A P C P B P B P P A P B P B P CC
P A C P B B C P A B B C
�
�
�
�
− +
�
−� � �
����� ���������
� � �
�����������
 
 
 
 
 
( )2 0,98P A = 
( ) ( )2 1 0,95P B P B= = 
( )1 0,99P C = 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 32/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Probabilidade – Ficha 5 
 
 
1 - Um exame de escolha múltipla é composto por 20 questões. Cada questão tem 5 opções de 
resposta, das quais apenas uma está correcta. Um estudante que passou o semestre assistindo 
ao World Wide Wrestling em casa e ouvindo músicas da Ágata ao auricular na aula, e por isso 
não sabe nada da matéria, decide responder ao calha. 
 
a) Qual é a probabilidade de o estudante responder certo a uma única questão? 
b) Qual é o número de respostas correctas que ele pode esperar obter? 
c) Qual é a probabilidade de responder correctamente a um número de questões entre duas e 
cinco (inclusive)? 
d) Qual é a probabilidade de responder correctamente a mais de metade das questões? 
e) Se todas as questões tiverem igual cotação, como devem ser cotadas as respostas erradas, 
para que a classificação média de um estudante desta categoria no exame seja zero? 
 
Resolução: X é o número de respostas certas em 20 perguntas. 
 
São 21 possibilidades, pois o zero também conta. 
 
Como é um conjunto de Bernouille, é uma Binomial. 
 
1
0, 2
5
p = = , em que o 20n = e o 0,2p = . 
 
Assim representa se matematicamente ( ) ( )~ ; ~ 20 ; 0,2 .X Bin n p X Bin= 
Agora vou responder as alíneas: 
a) ( ) ( ) ( ) ( ) ( )( )10 921 1 1
202
1 0, 2 1 0,2 0,2 0,8 0,0 81
1
0
5
n xxP X p p
x
C
n − −� � � �
= = − = − = ≈
 � 
 �
� � � �
 
Recordar que 
( )1
20 19! x
1! 1 1
 
20
! x 19
20! 2
! 1!
0 0
2 !
2
0
C = = = =
−
 (na calculadora é nCr ). 
 
 
 
 
Se me socorrer da Tabela da Binomial, tenho que ter cuidado, pois os valores 
são cumulativos, logo não é para = mas sim para ≥ . 
 
Assim se quiser para 1X = , faço para 1X ≥ , e subtraio 2X ≥ . É evidente 
perceber o porquê, mas mesmo assim vou explicar: 
 
1X ≥ , são todos os números para cima de um, assim que 2X ≥ são todos 
para cima de dois. Os número para cima de dois são comuns aos para cima 
de 1, tirando o um. Assim faz se: 
( ) ( ) ( )1 1 2P X P X P X= = ≥ − ≥ . Consultando a tabela, sei que: 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 33/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
( )1P X ≥ é 0,988 e ( )2P X ≥ é 0,931. Assim 
 
( ) ( ) ( )1 2 0,988 0,931 0 051 , 7P X P X P X= = ≥ − ≥ = − = , valor que é muito 
próximo do calculado. A diferença deve-se ao arredondamento dos valores 
da tabela. 
 
 
Como se consulta a tabela? É necessário saber “M”, que é o nosso “n” e o 
“r” que é o nosso “p”. 
 
Como é uma Binomial, uso a Tabela da Distribuição Binomial (obvio!). 
 
Uso como se fosse o jogo da “Batalha Naval”, ou seja uso as coordenadas 
“M/r” que são o nosso “n/p”. 
 
 
Para ( )~ 20 ; 0,2X Bin e ( )1P X ≥ (cuidado com o sinal – maior ou igual) 
 
 
 
Para ( )~ 20 ; 0,2X Bin e ( )2P X ≥ (cuidado com o sinal – maior ou igual) 
 
 
 
b) [ ] ( ) ( ) x 20 x 0,2 4E X n p= = = 
 
 
 
c) ( ) ( ) ( )2 5 2 5 Errado!P X P X P X≤ ≤ = ≥ − ≥ 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 34/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Pois, o “X” tem que estar no intervalo de 2 e 5. A tabela é só para maior ou 
igual. Ao se fazer “retirar” (que é o que o menos faz), retira-se também o 5, e 
o 5 tem que ficar. Assim escolhe-se o numero a seguir, que aqui é 6. 
 
( ) ( ) ( )2 5 2 6 0,931- 0,196 0,735P X P X P X Usar a tabela≤ ≤ = ≥ − ≥ = = = 
 
 
d) ( )11 0,001P X ≥ = 
 
 
 
e) Y Cotação Total= . Vou utilizar para a cotação certa o “C” e errada o “D”. 
 
Assim x ___ - x ___ Y C D= Quais devem ser os valores? É preciso ter 
cuidado. 
 
( )
pois as que acerta não falha!
 x - 20 xX XY C D= −
�����
 
 
( ). - . . 2020Y C D DX X C D X D= + = + − 
 
 
Como sei que [ ]� � [ ] �
20C D D
Y
y ax b E Y a E X b
+ −
= + → = + 
 
 
Como o valor de X é [ ] [ ]4 0E X E Y= ∧ = , então fica: 
 
 
[ ]� ( ) ( ) [ ]�
0 4
20 0 20E Y E C D X D C D E X D
= =
= + − ⇔ = + − ⇔� �� � 
 
1
0 4 4 20
4
C D D C D⇔ = + − ⇔ = . 
 
 
O seja é preciso respeitar esta igualdade para que o valor médio seja zero. 
 
 
 
 
 
6 a) Mostre que, para quaisquer acontecimentos A e B num espaço de probabilidade (�, �, P) 
 
( ) ( ) ( ) ( )P A B P A P B P A B= + −� � 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 35/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução: 
 
 
( ) ( ) ( )
tanh Az Vermelhos o ulCa
AA B B B AA B= − −�
������ ��� �
�
�
� �
����
 
 
Assim: 
( ) ( ) ( ) ( )AA B AP P BB BA = � �� − − ��� � � 
 
Recordar o axioma 3 ( )3a - se (A e B são incompatíveis) então a probabilidade da reunião de 
A com B é igual à soma das probabilidades de A e de B» , pois se os acontecimentos A e B 
são incompatíveis não têm resultados comuns, a frequência relativa de AUB é a frequência 
relativa de A mais a frequência relativa de B e o limite da soma das duas sucessões é a soma 
dos limites. 
 
Assim, e pelo axioma 3 ( )3a , ( ) ( ) ( )3
R k
R k
R k
a P A P A
∈
∈
=�� , para qualquer sucessão de 
acontecimentos disjuntos. 
 
( ) ( )
( ) ( )
A B A B
A B B A
− = ∅��
�
− = ∅��
� �
� �
, logo são disjuntos, posso aplicar o teorema ( )3a . 
 
Assim ( ) ( ) ( ) ( )
( )
( ) ( ) ( )
3a
A B A BB AA BP A B P P P PA BB A= = + +� �−� �− −−� � �� � 
 
Probabilidade de acontecimento 4 (P4) => ( - ) ( ) - ( )P A B P A P A B= ∩ , continuando, 
 
( )
4
( ) - ( )
P
P A B P A P A B=� � ( )P A B+ �
Tem propriedade comutativa
( ) - ( )P B P B A+ ������ 
 
( )
4
( ) ( ) - ( )
P
P A B P A P B P A B=+� � c.q.d. 
 
 
 
 
 
6.b) Por uma cidade passam três rios, o Azul, o Branco e o Castanho. Dos registos de anos 
anteriores estima-se que, em cada Inverno: 
- ( ) P A = probabilidade de transbordar o rio Azul = 0,20; 
- ( ) P B = probabilidade de transbordar o rio Branco = 0,10; 
- ( ) P C = probabilidade de transbordar o rio Castanho = 0,05; 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 36/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
- ( )| P A B = 0,03, ( )| P A C = 0,02 e ( )| P B C = 0,02; 
- ( )| | P A B C = 0,01. 
 
Mostre que a probabilidade de que pelo menos um dos rios transborde, num ano ao acaso, é 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )P A B C P A P B P C P A B P A C P B C P A B C= + + − − − +� � � � � � � e 
calcule-a. (2ª frequência, 14 de Janeiro de 2009) 
 
Resolução: 
( ) 0,20 0,10 0,05 0,03 0,02 0,02 0,01 0,29P A B C = + + − − − + =� � 
 
Demonstração (prova): 
Sejam A, B, C acontecimentos quaisquer: ( )P A B C =� � , vou usar a regra que utilizei no 
exercício 6a), 
( )
( )
( ) ( ) ( )
3a
P A B C P A B P C P A B C= + − =� �� �� � � � � 
 
( ) ( ) ( ) ( ) ( )
 com a troca de com Cuidado
P A P B P A B P C P A B C= + − + − =� �� �
� �
� � �
�������
 
 
Utilizar a propriedade distributiva: 
 
( ) ( ) ( ) ( ) ( ) ( )C CP A P B P A B P C P A B= + − + − =� �� ��� �� 
 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )P A P B P A B P C P A P B C A C B CC P−� �= + − � �� �+ − + =� �� �� � �� 
 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
 Vou socorrer me de um calculo auxiliar
P A P B P A B P C P A C P B C P A C B C= + − + − =� �� �− +� � � � � ����������
 
 
 
Calculo auxiliar: ( ) ( )A C B C� � � , e utilizando a regra da comutatividade, fica. 
 
( ) ( ) ( ) ( ) ( )BA C B C A C A C C B CC A B= = =� � � � � � � � � � � 
 
 
Agora vou substituir no cálculo: 
 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )P A B C P A P B P C P A B P A C P B C P A B C= + + − − − +� � � � � � � 
c.q.d 
6 c) Generalize os resultados das alíneas anteriores, demonstrando a Fórmula da Inclusão –
Exclusão para a probabilidade de uma reunião: 
 
( ) ( ) ( ) ( )
1 2 1 2 3
1 2 1 2 3
1
1 1 1
 ... 1
nn n nn
n
k k k k k k k k
k k k k k k k k
P A P A P A A P A A A P AU
+
= = < < < =
� �� �
= − 
 �
 �
�
+ +
� � �
− −� � �� � � � 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 37/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
quaisquer que sejam os acontecimentos 1 2, , ..., nA A A num espaço de probabilidade. 
 
 
Resolução: 
 
Nota: ( ) 11 n++ − é que dá o sinal! 
 
Se regressarmos ao exercício 6a), ( )
4
( ) ( ) - ( )
P
P A B P A P B P A B= +� � , é 
 
( ) ( )
1 2
1 21 1
n nn
k k k k
k k k k
P A P A P A AU
= = <
� �
�
� �
−=
 � � � 
 
( )
( ) ( )1 2
1 1 2
1 2 1 2 1 2
1
( ) ( ) - ( )
nn
k kk
k kk
P A AP A
n
k
k
P A P A A P A P A P A AU
<=
−
=
��
� �
= = +
 �
� �
�
���	��
��	�
� � 
 
 
 
 
 
 
E o 6b) é 
 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )P A B C P A P B P C P A B P A C P B C P A B C= + + − − − +� � � � � � � 
 
( )1 2 3
1
n
k
k
P A P A A AU
=
� �
= ⇔
 �
� �
� � 
 
( ) ( )
( )
( )1 2 31 2
1 2 31 1 2
1 2 1 2 1 2 1 2 3
1 2 3 1 2 1 3 2 3 1 2 3
1
( ) ( ) ( ) - ( ) - ( ) - ( )
nnn
k k kk kk
k k kk kk
P A A AP A AP A
n
k
k
k k k k k k k k k
P A P A P A P A P A A P A A P A A P A A AU
< <<=
=
< < < <
− +
<
���
� �
= + + +
 �
� �
� ��
����	���
����	���
��������	�������
� � � � �
����� ����� ����� �������
 
 
 
Nota: sem saber o valor dos termos, sei que o 1º termo será sempre maior do que o 2º, que por 
sua vez será maior do que o 3º, e por ai adiante. 
 
( ) ( ) ( )
1 2 1 2 3
1 2 1 2 31
n n n
k k k k k k
k k k k k k
P A P A A P A A A
= < < <
> >� � �� � � 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 38/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
16. Demonstre a Desigualdade de Bonferroni (cuidado com o sinal, pois aqui é AND): 
 
( ) ( )
11
1
n n
i i
ii
P A P A n
=≥
� �
≥ − −
 �
� �
�� 
 
Resolução – 
( )
1 1
nn
k k
k k
P A P AU
= =
� �
=
 �
� �
� , e é igual se forem DISJUNTOS! 
 
Se não forem é ( )
1 1
nn
k k
k k
P A P AU
= =
� �
≤
 �
� �
� , que é a desigualdade de Boole, e é valida para qualquer 
um. 
 
Aplica se a desigualdade ( )
1 1
nn
k k
k k
P A P AU
= =
� �
≤
 �
� �
� , aos acontecimentos complementares 
1 2, , ..., nA A A . 
 
Assim ( )
1 1
nn
k k
k k
P A P AU
= =
� �
≤
 �
� �
� . Sei que 
 
1 2 1 2
1
Generalizando as Leis de Morgan
 ... ... 
n
k n n
k
A A A A A A A
=
= =� � � � � �
����������
 
 
( ) ( )1k kP A P A= − , para qualquer { }1, 2,...,k n∈ 
 
Ficando assim: ( )( )
11
1
n n
k k
kk
P A P A
==
� �
≤ −
 �
 �
� �
�� , e como 1 é uma constante, vem para fora do 
somatório, ficando: 
( )
1 11
1
n n n
k k
k kk
P A P A
= ==
� �
≤ −
 �
 �
� �
� �� 
 
E como sei que 
1
1
n
k =
� é a soma de “n” uns, fica 
1
1
n
k
n
=
=� . 
 
E também sei que 
1 1
1
n n
k k
k k
P A P A
= =
� � � �
= −
 � 
 �
 � � �� �
� � , ficando tudo 
 
( ) ( ) ( )
1 11 1
1 1
n nn n
k k k k
k kk k
P A n P A P A P A n
= == =
� � � �
− ≤ − ⇔ ≤ − −
 � 
 �
� � � �
� �� � 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 39/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
Estatística - Diagramas Caixa com Bigodes 
 
 
Exemplo: Os dados seguintes referem-se aos pesos do coração, em gramas, de 39 
ratos: 
 
25 27 28 29 31 32 34 35 36 37 37 38 38 
39 40 40 42 43 44 45 46 47 47 48 49 50 
51 52 53 54 54 59 59 62 63 63 63 65 68 
 
Construa o diagrama caixa com bigodes referente a esta amostra. 
 
 
 
Resolução: 
 
1 - Dimensão da amostra: n = 39. 
 
 
2 - Cálculo da mediana: 
2.1 - ( ) 1 39 1 20
2 2
n
proj med
+ +
= = = . 
 
2.2 - 20:39 45med X= = . Cuidado, pois é preciso ordenar. Neste exercício já 
está ordenado. 
 
 
 
3 - Cálculo dos quartos (nota usa se � �� � para indicar característica inferior): 
 
3.1 - ( )
( )Proj 1 20 1
Prof = 10,5
2 2
med
quartos
+� � +� �� � � �= = 
 
 
3.2 - Quarto inferior: lO:39 ll:39L
X X 37 37 
F 37 
2 2
+ +
= = = 
 
25 27 28 29 31 32 34 35 36 37 37 38 38 
39 40 40 42 43 44 45 46 47 47 48 49 50 
51 52 53 54 54 59 59 62 63 63 63 65 68 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 40/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
3.3 - Quarto superior: lO:39 ll:39U
' 'X X 54 53 
F 53,5 
2 2
+ +
= = =
 
 
 
25 27 28 29 31 32 34 35 36 37 37 38 38 
39 40 40 42 43 44 45 46 47 47 48 49 50 
51 52 53 54 54 59 59 62 63 63 63 65 68 
 
Pois o FU é do fim para trás, por isso é que é “X” linha! 
 
 
Nota 1: quarto ≠ quartis. 
 
Nota 2: para ler este numero 12,2� �� � e 12,8� �� � é 12. É sempre o inteiro mais baixo. 
 
Cuidado com os números negativos, pois: 4,9� �� � , não é -4, mas sim -5. De facto o 
número inteiro -5 é menor do que -4,9. 
 
Nota 3: FL = Fourth Lower ; FU = Fourth Upper ; Prof = profundidade. 
 
 
 
 
 
 
 
4 - Dispersão quartal: 53,5 37 16,5dF Fu FL= − = − = . 
 
 
 
5 - Barreirasde Outliers: 
 
5.1. Barreira inferior: 1,5 37 1,5 16,5 12,25X XFL dF− −= = . 
5.2. Barreira superior: + 1,5 53,5 1,5 16,5 78,25X XFU dF −= = . 
5.3. Conclusão: Qualquer valor da amostra pertence ao intervalo 
] [12,25;78,25 , pelo que não existem outliers. Ou seja o número mais pequeno (25) e 
o maior (68) pertencem ao domínio ] [12,25;78,25 . 
 
 
6 - Construção da caixa com bigodes: 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 41/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
 
 
 
 
 
Exercícios de resumo: 
 
 
Determinar a mediana (M) e os quartos (F), da seguinte lista: 
 
4, 5, 10, 12, 12, 14, 15, 16 
 
 
1º passo, determinar a dimensão da amostra. 8n = . 
 
2º passo, determinar a profundidade da mediana. ( ) 1 8 1 4,5
2 2
n
prof M
+ +
= = = . 
 
3º passo, determinar a mediana. ( )
4 5 12
2prof M
x x
M x
+
= = = . 
 
4º passo, determinar a profundidade do quarto. ( )
( ) 1 5 1
3
2 2
prof M
prof F
+� � +� �� � � �= = = . 
Cuidado aqui pois 5� �� � , lê se característica inferior de 5, e é o inteiro imediatamente 
abaixo. 
 
5º passo, determinar o 1º LF e ultimo UF quarto. 
 
 3 10.LF x= = 
 '3 14.UF x= = Cuidado aqui, pois a contagem é feita da direita para a esquerda 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 42/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Determinar a mediana (M) e os quartos (F), da seguinte lista: 
 
2, 5, 8, 10, 12, 15, 20, 23, 34, 37 
 
 
1º passo, determinar a dimensão da amostra. 10n = . 
 
2º passo, determinar a profundidade da mediana. ( ) 1 10 1 5,5
2 2
n
prof M
+ +
= = = . 
 
3º passo, determinar a mediana. ( )
5 6 12 15 13,5
2 2prof M
x x
M x
+ +
= = = = . 
 
4º passo, determinar a profundidade do quarto. ( )
( ) 1 5,5 1
3
2 2
prof M
prof F
+� � +� �� � � �= = =
. 
Cuidado aqui pois 5,5� �� � , lê se característica de 5,5, e é o inteiro imediatamente 
abaixo. 
 
5º passo, determinar o 1º LF e ultimo UF quarto. 
 
3 8.LF x= = 
'
3 23.UF x= = 
 
 
 
 
 
 
 
 
Nota: Moda: é a que tem maior frequência ( ).in 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 43/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Construção de Histogramas 
 
 
Regra de Sturges 
 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
 
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por 
 
: :* n n l n
x x
h
N
−
= 
 
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é 
dado por 
( ) ( ): : .n n l nXN h x xε = − − 
 
 
 
 
 
Exemplo: Determine N, um possível h e ε , para o seguinte conjunto de dados: 
 
 
 
 
Que devidamente arrumado, fica: 
 
 
 
 
1º - ( ) ( )
( )2
ln 42
log 1 1 6.
ln 2
N n N N
� �
= + ⇔ = + ⇔ =� � � �� �
� �
 
 
2º - ( ): : 52 38* * * 2, 3 .
6
n n l nx xh h h
N
− −
= ⇔ = ⇔ = Logo posso considerar: 2,4.h = 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 44/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
3º - ( ) ( ) ( ) ( ): : 6 2, 4 52 38 0,4.n n l nX XN h x xε ε ε= − − ⇔ = − − ⇔ = 
 
 
Assim as classes a considerar são: 
 
] ] ] ] ] ] 37,8 ; 40, 2 , 40,2 ; 42,6 , 42,6 ; 45,0 , 
 
] ] ] ] ] ] 45,0 ; 47,4 , 47, 4 ; 49,8 e 49,8 ; 52, 2 . 
 
 
ix in iN if iF 
 ] ] 37,8 ; 40,2 12 12 0,29 0,29 
 ] ] 40, 2 ; 42,6 8 20 0,19 0,48 
 ] ] 42,6 ; 45,0 8 28 0,19 0,67 
 ] ] 45,0 ; 47,4 4 32 0,10 0,76 
 ] ] 47, 4 ; 49,8 6 38 0,14 0,90 
 ] ] 49,8 ; 52, 2 4 42 0,10 1,00 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 45/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Exercícios 
 
 
 
1 - Um dos boletins mensais do I.N.E. publicou os seguintes resultados do 
Observatório da Serra do Pilar, no Porto, em cada um dos meses de 1989. 
 
Meses do Ano Números de dias com nevoeiro 
Janeiro 2 
Fevereiro 1 
Março 7 
Abril 2 
Maio 6 
Junho 7 
Julho 4 
Agosto 7 
Setembro 3 
Outubro 2 
Novembro 2 
Dezembro 3 
 
a) Em quantos meses do ano se registaram 7 dias de nevoeiro? 
b) Escreva uma tabela de frequências completa para o número de dias de 
nevoeiro por mês, com as indicações mais usuais. Discuta se esta será uma boa 
forma de representar dados deste tipo. 
c) Indique o número de meses em que se verificaram 4 ou menos dias de 
nevoeiro. A que percentagem do total correspondem esses meses? 
 
 
 
Resolução a) : tem se 3 dias com nevoeiro. 
 
b) 
 - Frequencia Absoluta - Frequencia Absoluta Cumulativa
 - Frequencia Relativa - Frequencia Relativa Cumulativa
i i
i i
n N
f F 
 
 
 
ix in iN if iF 
 1 1 1 1/12 1/12 
 2 4 5 1/3 5/12 
 3 2 7 1/6 7/12 
 4 1 8 1/12 2/3 
 6 1 9 1/12 3/4 
 7 3 12 1/4 1 
 n = 12 
 
“n” – dimensão da amostra. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 46/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 = = ii i
n
n n f
n�
 
 
 
c) O número de meses em que se verificaram 4 ou menos dias de nevoeiro foram de 
8, o que representa 66,7%. 
 
 
Conclusão: esta tabela, onde foram excluídos os dados da tabela dada, peca por 
ter apenas uma variável (a da “dias com nevoeiro”). Pois na tabela dada continha 
a informação temporal, ou seja definia qual era os meses que tinha mais nevoeiro. 
 
 
 
 
 
2 - Para cada um dos seguintes conjuntos de dados, faça uma representação gráfica adequada: 
 
a) No âmbito de um estudo realizado com o objectivo de caracterizar o comportamento dos 
clientes de um hipermercado, analisou-se o número de ocupantes por veículo para 1000 
veículos que entraram no parque automóvel do referido hipermercado, num sábado. 
 
 
 
 
b) A Tabaqueira, SA faz um apertado controlo da qualidade dos cigarros que produz; o peso é 
uma das características rigorosamente acompanhadas. Com os pesos de uma amostra de 500 
cigarros de uma das marcas produzidas construiu-se o seguinte quadro: 
 
 
Peso (mg) 
Classes Quantidade Proporção 
] ]760; 780 4 0,008 
] ]780; 800 43 0,086 
] ]800; 820 118 0,236 
] ]820; 840 168 0,336 
] ]840; 860 117 0,234 
] ]860; 880 39 0,078 
] ]880; 900 11 0,022 
Total 500 1 
 
 
Resolução: os gráficos serão diferentes uma vez que em a) as variáveis são discretas, e em b) 
as variáveis são continuas. Quando as variáveis são discretas, usa se um gráfico de barras, e 
quando são continuas, usa se um histograma. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 47/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Assim, para o exercício a): 
 
 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-201048/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Na 1ª figura tem se o gráfico dos dados. Na 2ª figura compara se o gráfico dos dados com o 
modelo normal (modelo Gaussiano). Nota que não coincidem. Existe uma assimetria. 
Na 3ª figura confirma se que o gráfico é assimétrico e “foge” para a direita. 
 
 
Resolução da b): a quantidade é a frequência absoluta e a proporção a frequência relativa. 
 
Peso (mg) 
Classes 
if iF 
] ]760; 780 4 0,008 
] ]780; 800 43 0,086 
] ]800; 820 118 0,236 
] ]820; 840 168 0,336 
] ]840; 860 117 0,234 
] ]860; 880 39 0,078 
] ]880; 900 11 0,022 
Total 500 1 
 
 
 
 
Na 1º figura do exercício b) é o gráfico dos dados. 
Na 2º figura do exercício confirma se que o gráfico é simétrico, pois ao se sobrepor o Modelo 
Gausiano, nota-se coincidências. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 49/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
c) Escolheu-se ao acaso uma amostra de 100 homens e uma amostra de 200 mulheres numa 
população, a fim de averiguar se a cor do cabelo estaria relacionada com o sexo. Os resultados 
foram os seguintes: 
 
 Preto Castanho Louro Ruivo 
Masculino 32 43 16 9 
Feminino 55 65 64 16 
 
 
Fica: Homens – Preto 32/100; Castanho 43/100; Louro 16/100; Ruivo 9/100 
Mulheres – Preto 55/200; Castanho 65/200; Louro 64/200; Ruivo 16/200. 
 
 
 
 
 
 
3 - Complete a tabela e indique a mediana da amostra. 
 
ix in iN if iF 
1 2 0,025 
2 12 
3 58 
4 
5 
 
 
Resolução - sem fazer muitas contas consigo descobrir os seguintes valores: 
 
ix in iN if iF 
1 2 2 0,025 0,025 
2 12 14 
3 44 58 
4 
5 1 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 50/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Pois o total de iF é um. 
Na 1ª linha sei que do valor 2 e do valor 0,025. 
Na 2ª linha, sei que é 14, pois é 2 + 12. 
Na 3ª linha, sei que é 44, pois é 58 - 14. 
 
Agora, também consigo calcular a dimensão da amostra: 
 
X2 1
80
0,025
n n= ⇔ = 
Sabendo a dimensão da amostra, posso calcular os valores de if , quando sei iN : 
 
ix in iN if iF 
1 2 2 0,025 0,025 
2 12 14 0,15 0,175 
3 44 58 0,55 0,725 
4 
5 80 1 
 
Agora consigo calcular os valores da linha 4, pois sei o ultimo valor e o penúltimo 
da coluna iF : 
ix in iN if iF 
1 2 2 0,025 0,025 
2 12 14 0,15 0,175 
3 44 58 0,55 0,725 
4 16 74 0,2 0,925 
5 80 1 
Só falta preencher os dois últimos da linha 5: 
 
ix in iN if iF 
1 2 2 0,025 0,025 
2 12 14 0,15 0,175 
3 44 58 0,55 0,725 
4 16 74 0,2 0,925 
5 6 80 0,075 1 
 
Cuidado que a pergunta ainda não acabou! Também me é pedido o valor da 
mediana: 
 
Sei que tenho 2 uns, 12 dois, 44 três, 16 quatros e 6 cincos. Como a dimensão da 
amostra é de 80, a mediana será o 40º número + 41º número, a dividir por dois: 
 
: 1:
40:80 41:802 2 3 3 3
2 2 2
n n
n n
x x
x x
M M M M
+
+
+ +
= ⇔ = ⇔ = ⇔ = 
 
Se a dimensão da amostra fosse impar, seria 
1:
2
n
n
M x
+
= . 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 51/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
4 - Em seguida, apresentam-se seis "manchas" de histogramas, quatro das quais 
apresentam os resultados do estudo, numa pequena cidade, das características 
seguintes: 
 
a) altura dos elementos das famílias nucleares cujos membros do casal têm idade 
inferior a 24 anos; 
b) altura dos elementos do casal; 
c) altura dos indivíduos da cidade; 
d) altura dos automóveis ligeiros. 
 
Quais dos histogramas podem representar cada uma das variáveis anteriores? 
Justifique a sua resposta. 
 
 
 
 
 
 
Resolução: 
 
Os gráficos 3 e 6 estão fora do contexto, pois nas quatros afirmações só é feita 
referencia a altura. No gráfico 3 tem se o peso, e no 6 o rendimento. 
 
A a) está relacionado com o gráfico 2, pois apresenta dois “picos”. O 1º diz 
respeito a altura das crianças e o 2º diz respeito a altura dos pais. A altura dos filhos 
nunca será próxima da altura dos pais, pois é me dito que a idade máxima dos pais 
é de 24 anos (este pormenor é importante para se excluir os outros gráficos). 
 
A b) está relacionado com o gráfico 4, pois se olharmos para o segundo pico do 
gráfico 2, é igual. Como conclui em que o gráfico 2 pertencia ao a). Obviamente, 
numa situação dita normal, os pais terão uma altura superior a 1,5 metros e menos 
de 2 (alturas típicas portuguesas). 
 
A c) está relacionado com o gráfico 5, pois não existe descontinuidade tanto na 
linha de subida como na de descida, e começa com a altura das crianças até a 
população adulta. 
 
A d) está relacionado com o gráfico 1, por exclusão, e por ser os valores típicos das 
alturas dos mais diferentes automóveis existentes. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 52/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
5 - O Vicente, que admitiu ser um veterano nas cantorias no chuveiro, comprou um 
novo esquentador, porque lhe disseram que este era mais rápido a aquecer a água. 
Recordando que com o seu velho esquentador no Inverno tinha de esperar em 
média 20 segundos para poder começar o seu banho, começou a tomar nota dos 
tempos relativos ao novo esquentador: 
 
15,6 16,7 17,2 18,3 19,6 20,3 
15,7 16,8 17,2 18,3 19,7 20,5 
15,7 16,8 17,5 18,3 19,8 20,5 
15,8 16,8 17,6 18,4 19,9 20,6 
16,0 16,9 17,7 18,5 19,9 20,7 
16,3 17,0 17,8 18,5 19,9 20,7 
16,5 17,0 18,0 19,3 20,0 21,0 
16,6 17,1 18,1 19,4 20,1 21,2 
16,7 17,1 18,1 19,4 20,2 21,2 
16,7 17,2 18,2 19,5 20,3 21,4 
 
21 103,9 20 477
ii
x x= ∧ =� � 
 
a) Calcule as características de localização e de dispersão mais usuais, e baseando-
se nelas discuta se o Vicente tem razões objectivas para estar satisfeito com a 
compra que fez. 
 
b) Faça uma representação gráfica dos dados e refira-se à simetria da variável 
registada pelo Vicente. 
 
 
 
Resolução: As características de localização mais usuais são: 
 
Media; Moda; Mediana; Mínima; Máxima; 1º (FL) e 3º (FU) Quarto (o 2º é a Mediana). 
 
 
 
Depois existem as medidas de Dispersão, que são: 
 
Desvio Padrão; Variância; Dispersão Quartal; Amplitude (Range). 
 
 
 
A Media é calculada pela fórmula 1
1103,9
18,4
60
n
i
i
X
X X X
n
== ⇔ = ⇔ =
�
 
 
A Media Aparada a 10% (por exemplo) retira-se de AMBAS as extremidades 10% dos 
dados da amostra, e usa se depois a mesma formula, mas já com o “n” reduzido. Nota que se 
retira “n” de ambos os lados! 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 53/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
A Variância é calculada peça fórmula: 
 
2
2
2 2 21
1 1
( )
1 1
.
1 1
n
i n n
i
X X i i
i i
X X
s s X X
n n n
=
= =
− � �� �
= ∨ = −� �
 �− − � �� �� �
�
� �
 
 
 
Vou utilizar a 2ª formula, pois é me dado o 21 103,9 20 477
ii
x x= ∧ =� � : 
 
( )
2
22 2 2
1 1
1 1 1 1
. 20477 . 1103,9
1 60 1 60
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
 � � �− − � �� �� �� �
� � 
 
Cuidado para não trocar as variáveis 
2
1
n
i
i
X
=
� com 
1
n
i
i
X
=
� , pois confunde, uma vez que ambas 
tem potencia elevado ao quadrado.Assim 
 
2 2,8319Xs = . 
 
O Desvio Padrão é calculado pela fórmula 2 1,68X X Xs s s= ⇔ = . 
 
O Coeficiente de Variância é calculado pela fórmula Xcv
X
σ
= . 
 
 
 
6 - Considere a amostra que se segue, correspondente às perdas diárias da Telecom devido a 
chamadas internacionais feitas via Internet e por isso pagas como chamadas locais, em 100 
dias escolhidos ao acaso em 1996. 
 
0,0 0,5 1,0 1,4 1,7 2,0 2,3 2,8 3,1 3,4 
0,1 0,5 1,0 1,4 1,8 2,0 2,3 2,8 3,2 3,4 
0,1 0,5 1,1 1,4 1,8 2,0 2,4 2,8 3,2 3,4 
0,1 0,6 1,1 1,5 1,8 2,0 2,4 2,8 3,2 3,5 
0,2 0,6 1,1 1,5 1,8 2,0 2,4 2,8 3,2 3,5 
0,2 0,7 1,2 1,6 1,8 2,0 2,4 2,9 3,2 3,5 
0,3 0,7 1,2 1,6 1,9 2,1 2,4 2,9 3,3 3,6 
0,3 0,8 1,2 1,6 1,9 2,1 2,5 3,0 3,3 3,6 
0,4 0,9 1,2 1,6 1,9 2,1 2,7 3,0 3,3 3,6 
0,5 0,9 1,3 1,6 1,9 2,1 2,7 3,1 3,4 3,7 
 
 
100 100
2
1 1
195,2 489,2i i
i i
x X
= =
= ∧ =� � 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 54/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
a) Construa histogramas apropriados para representar os dados, usando a Regra de Sturges e a 
regra do desvio-padrão. 
 
 
b) Proponha um modelo para a distribuição de frequências desta variável. 
 
 
 
 
Resolução a): É preciso ter cuidado com “Construa histogramas apropriados … “ pois não 
me é dito como deverei proceder, uma vez que tanto posso utilizar a Regra de 
Sturges, como a do Desvio Padrão. 
 
A do Desvio Padrão só posso utilizar se o gráfico for simétrico. Como ainda não fiz 
o gráfico, não consigo utilizar este critério. Então uso o diagrama de Caule e Folha: 
 
Assim, ( )2log 100 1 7N ≈ + ≈� �� � . Ou seja vou tentar ter 7 linhas de “arrumação” dos 
dados. Agora tenho que tentar saber qual o melhor tipo que se enquadra nesta 
exercício. 
 
Tipo de forma 1, não se enquadra. O do tipo ½ vai me dar 8 linhas. Como N = 7, 
dá. Assim fica: 
 
 0
1
100 ; X 10
2
 
 
 
Como se pode ver não é bem simétrico, falha ligeiramente, mas no enunciado é me 
“pedido” par ir por este processo, pois dão me 
100 100
2
1 1
i i
i i
x X
= =
∧� � . Assim, o 1º passo é 
 
100
1 1 195,2 1,952
100 100
n
i i
i i
X X
X X X X
n
= == ⇔ = ⇔ = ⇔ =
� �
 
 
( )
2
22 2 2
1 1
1 1 1 1
489,72 195, 2
1 100 1 100
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
 � � �− − � �� �� �� �
� � 
 
2 1,0979Xs = 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 55/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Cuidado aqui para não trocar o 2
1
n
i
i
X
=
� com o 
2
1
n
i
i
X
=
� �

 �
� �
� . 
 
Logo 2 1,05X X Xs s s= ⇔ � . 
 
 
O 2º passo é 
 
] [1,05 1,05 ; ; 0,35 ; 0,525
3 2 3 2
X Xh h h
σ σ� � � �∉ ⇔ ∉ ⇔ ∉� � � �� �� �
 
 
 
Pode ser qualquer número neste intervalo, como por exemplo: 
 
 
 
 
 
Vou escolher o h = 0,4: 
 
 
 
 
 
3º passo, a Classe central: 
 ; 
2 2
h h
X X� �− +� �� � 
 
 
Assim é: ] [0,4 0,41,95 ; 1,95 1,75 ; 2,15
2 2
� �− + ⇔� �� � 
 
 
Esta é a central. Como sei que o mínimo é 0,0 e o máximo é 3,7, vou criando as 
classes até PASSAR esses números. 
 
Antes - [ ] ] ] ] ] ] ] ] ]0, 25 ; 0,15 , 0,15 ; 0,55 , 0,55 ; 0,95 , 0,95 ; 1,35 , 1,35 ; 1,75− 
 
Central - ] ]1,75 ; 2,15 
 
Depois - ] ] ] ] ] ] ] ]2,15 ; 2,55 , 2,55 ; 2,95 , 2,95 ; 3,35 , 3,35 ; 3,75 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 56/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
in iN if iF 
] ]0,25 ; 0,15− 4 4 0,04 0,04 
] ]0,15 ; 0,55 10 14 0,10 0,14 
] ]0,55 ; 0,95 7 21 0,07 0,21 
] ]0,95 ; 1,35 10 31 0,10 0,31 
] ]1,35 ; 1,75 11 42 0,11 0,42 
] ]1,75 ; 2,15 19 61 0,19 0,60 
] ]2,15 ; 2,55 8 69 0,08 0,68 
] ]2,55 ; 2,95 9 78 0,09 0,77 
] ]2,95 ; 3,35 12 90 0,12 0,89 
] ]3,35 ; 3,75 11 101 0,11 1 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 57/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
8 - Um estudo sobre os atrasos nos voas europeus durante o Verão de 1999, 
realizado em determinado aeroporto, conduziu aos seguintes resultados: 
 
 
 
a) Construa uma tabela de frequências (acumuladas e não acumuladas). 
b) Represente os dados graficamente. 
 
 
Resolução - pequena introdução: 
 
im = marca da classe, ou seja o ponto médio da classe. 
in = frequência absoluta. 
iN = frequência absoluta acumulada. 
if = frequência relativa (ou seja, in a dividir pela dimensão da amostra). 
iF = frequência relativa acumulada. 
 
Nota: as chavetas tanto podem estar abertas para o lado esquerdo como para o lado direito. 
 
Assim sendo: 
 
Classes 
im in iN if iF 
[ ]0;10 5 29 29 0,29 0,29 
] ]10;20 15 23 52 0,23 0,52 
] ]20;30 25 17 69 0,17 0,69 
] ]30;40 35 14 83 0,14 0,83 
] ]40;50 45 11 91 0,11 0,91 
] ]50;60 55 6 100 0,06 1 
 n = 100 
 
 
Para representar graficamente, e se nada me é dito, coloco no eixo dos “y” qualquer 
uma das colunas. Mas é me dito para representar os dados. Os dados são os da 
tabela dada no enunciado. 
Assim sendo vou utilizar os dados da tabela: 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 58/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
No eixo dos “x” é representado SEMPRE a classe. 
 
 
 
Histograma 
 
 
 
 
Quando se usa as classes (variáveis continuas) num gráfico, designa-se por 
histograma, barras coladas umas as outras. 
 
 
 
 
 
 
 
11 - Pretende-se conhecer a relação entre o rendimento familiar e o nível 
educacional do proprietário de habitação própria. O nível educacional aparece nos 
registos oficiais como uma variável categorizada com os seguintes níveis: 
 
A - até 4 anos de escolaridade 
B - até 9 anos de escolaridade 
C - curso do ensino secundário 
D - 1 a 2 anos da Universidade 
E - Licenciatura 
F - estudos de pós-graduação. 
 
 
Optou-se, numa primeira abordagem aos dados, por apresentar as caixas de bigodes 
para cada um destes níveis, Baseando-se na interpretação da figura seguinte, 
forneça o máximo de informação relativamente à questão em análise. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 59/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
Uma possível comparação das amostras representadas: 
O rendimento familiar mediano aumenta com o nível de escolaridade do 
proprietário de habitação própria. Observamos o maior "salto" na passagem da 
categoria E (Licenciatura) para a categoria F (Estudos de pós-graduação). O mesmo 
acontece para os quartos e para o rendimento familiar mínimo. O rendimento 
familiar máximo também aumenta com o nível de escolaridade apesar desse 
aumento ser pouco significativo na passagem da categoria D (1 a 2 anos de 
escolaridade) para a categoria E. Os 25% maiores rendimentos na categoria A (até 
4 anos de escolaridade) são superiores a alguns dos 25% menores rendimentos 
familiares na categoria F. 
A categoria D apresenta a maior amplitude amostral apesar de ser pouco maior do 
que a apresentada nas categorias E e F. Observamos a maior dispersão quartal na 
categoria F. Não há grandes diferenças entre as categorias A e B (até9 anos de 
escolaridade) e entre as categorias B e C. No entanto, as diferenças entre as 
categorias B e C são mais acentuadas a nível da dispersão. A dispersão dos 25% 
menores rendimentos familiares ( )( )1LF x− aumenta com o nível de escolaridade do 
proprietário de habitação própria. A dispersão dos 25% maiores rendimentos 
familiares é menor na categoria F. 
Observamos em todas as caixas de bigodes uma assimetria à direita apesar de mais 
ligeira na caixa de bigodes correspondente à categoria F. 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 60/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Exercício – 1: Os dados seguintes referem-se aos pesos do coração, em gramas, de 
39 ratos: 
 
 
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M) 
e os quartos (F). 
 
 
 
Resolução - 1: Sendo na dimensão da amostra, vamos usar um número de caules N 
tão próximo quanto possível de ( )2log 1n +� �� � , isto é, ( )2log 1N n≈ +� �� � . 
 
 
Observação: No caso dos diagramas de Caule e Folhas, conhecida por regra de 
Sturges, devo de ter alguma flexibilidade, pois existe 3 tipos diferentes de fazer o 
diagrama. Existe o designado por: Tipo de forma 1, ½ e 1/5. Escolhe se a mais 
adequada. 
 
 
Assim, ( )2log 39 1 6N ≈ + ≈� �� � . 
Nota: ( ) ( )
( )2
ln 39
log 39 5,3
ln 2
= = . 
 
Folhas não ordenadas: 
 
 
 
 
 
Como é que se preenche este quadro? É fácil, só se ter que ter em conta que a folha 
é a divisão logo abaixo do caule. Exemplo, 0 1º é o 40. Assim no caule fica o 
número quatro, e na folha fica o zero: 
 
 
 
 
O 2º número é o 29. No caule é dois e na folha é nove. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 61/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
O 3º numero é o 54, cinco e quatro: 
 
 
 
E assim por diante. 
 
 
Depois deste passo, segue se o Diagrama final, que consiste em ordenar os 
números, por ordem crescente e colocar no topo referencias importantes: 
 
139; lx10 
Diagrama final: 
 
 
 
139; lx10 , significa que o campo amostral tem 39 elementos, “1x” significa que se 
está a usar o formato tipo um (ou seja não existe factores multiplicativos), e o 1"10 "
, significa que o caule é dezenas, ou seja o dois é na realidade vinte. 
 
Assim sendo: o primeiro valor 2 || 5 representa 1 02x10 5x10 25+ = . 
 
Outra nota a se ter em conta, é que o ( )2log 39 1 6N ≈ + ≈� �� � . E na realidade usou se 5 
linhas. É esta flexibilidade que é preciso ter. Pois existe mais três formas de 
representar o gráfico, e esta é a opção mais correcta, visto 6 - 5 ser 1. Um é um 
valor aceitável. 
 
A outra informação que é necessária acrescentar a tabela. É o valor acumulado, 
tanto de cima para baixo, com de baixo para cima. A ter se em conta que a linha 
onde se encontra a ( )prof M fica entre parênteses. Como ( ) 1 20.
2
n
prof M
+
= = 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 62/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
20 5M x= = 
 
 
Nota 1: a repetição do acumulado 14 é apenas coincidência! 
Nota 2: se conta a partir do fim, é da direita para a esquerda! (aqui na 3 linha). 
 
 
Agora vou determinar a mediana (M) e os quartos (F): 
 
1º passo, determinar a dimensão da amostra. 39n = . 
 
2º passo, determinar a profundidade da mediana. ( ) 1 39 1 20
2 2
n
prof M
+ +
= = = . 
 
3º passo, determinar a mediana. ( ) 20 45prof MM x x= = = . 
 
4º passo, determinar a profundidade do quarto. ( )
( ) 1 20 1
10,5
2 2
prof M
prof F
+� � +� �� � � �= = = . 
 
5º passo, determinar o 1º LF e ultimo UF quarto. 
 
 10 11
37 37
37.
2 2L
x x
F
+ +
= = = 
 
' '
10 11 54 53 53,5.
2 2U
x x
F
+ +
= = = 
 
 
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
 
Dispersão Quartal - 53,5 37 16,5U LdF F F= − = − = . 
Barreiras de Outliers Inferior - X X 1,5 37 1,5 16,5 12,25LF dF = =− − 
Barreiras de Outliers Superior - X X 1,5 53,5 1,5 16,5 78,25UF dF = + =+ 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (78,25): 0 
Dados inferior a barreira inferior (12,25): 0 
Posso concluir que não existe Outliers. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 63/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Agora Diagrama Caixa com Bigodes: 
 
 
 
 
Caixa com 5 letras resumo: 
 
 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números 25 e 37, assim 
como os últimos 25% estão compreendidos entre os 53,5 e os 68. As dispersões 
acontecem mais (ligeiramente) no 4º quartal. Não tem Outliers. 
 
 
 
Construção de Histogramas/Barras - Regra de Sturges 
 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
 
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
 
 
Assim, ( )2log 39 1 6N ≈ + =� �� � (já visto anteriormente). 
 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
( ): : 68 25* * * 7,1 6
6
n n l nx xh h h
N
− −
= ⇔ = ⇔ =
 
 
Logo posso considerar h = 7,2 (poderia ser 8!, a regra não é rigida). 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 64/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é 
dado por 
( ) ( ): : .n n l nXN h x xε = − − 
 
Assim ( ) ( ) 6 7, 2 68 25 0, 2Xε ε= − − ⇔ = , e como o inicio da classe é: 
 
:
0,2
25 24,9
2 2l n
x
ε
− = − = . 
 
Assim as classes a considerar são: 
 
] ] ] ] ] ]24,9 ; 32,1 , 32,1 ; 39,3 , 39,3 ; 46,5 , 
 
] ] ] ] ] ] 46,5 ; 53,7 , 53,7 ; 60,9 e 60,9 ; 68,1 . 
 
 
ix in iN if iF 
 ] ]24,9 ; 32,1 6 6 0,15 0,15 
 ] ] 32,1 ; 39,3 8 14 0,19 0,36 
 ] ] 39,3 ; 46,5 7 21 0,19 0,54 
 ] ] 46,5 ; 53,7 8 29 0,10 0,74 
 ] ] 53,7 ; 60,9 4 33 0,14 0,85 
 ] ] 60,9 ; 68,1 6 39 0,10 1 
 n = 39 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 65/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
Na 1º figura do exercício é o gráfico dos dados. 
Na 2º figura do exercício confirma se que o gráfico é assimétrico, pois ao se sobrepor o 
Modelo Gausiano, não se nota coincidências. 
 
 
 
 
 
 
Exercício – 2: Os dados seguintes representam os 26 pesos de cada um dos 26 
alunos de uma turma de 11º ano de uma determinada escola: 
 
 
 
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M) 
e os quartos (F). 
 
 
 
Resolução - 2: Sendo na dimensão da amostra, vamos usar um número de caules N 
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 26 1 = 5N ≈ +� �� � . 
 
Aqui é necessário tomar se uma decisão, pois os números são composto pela parte 
inteira e fraccionaria. Como nas folha só se pode ter um algarismo, vai se “truncar” 
(apagar) a parte decimal. Mas este “truncagem” só se realiza na arrumação dos 
dados, poisnos cálculos é necessário respeitar o número com a sua parte decimal. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 66/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Folhas não ordenadas: 
 
 
 
Como é que este quadro foi preenchido? É fácil, só se aproveitou a parte inteira. A 
parte decimal foi APAGADA. Não confundir com arredondado. 
 
 
Diagrama final: 
 
 
 
 
Assim sendo: o primeiro valor 4 || 1 representa 1 04x10 1x10 41+ = 
(seria então 41,75). 
 
 
A outra informação que é necessária acrescentar a tabela. É o valor acumulado, 
tanto de cima para baixo, com de baixo para cima. A ter se em conta que a linha 
onde se encontra a ( )prof M fica entre parênteses. 
 
Como ( ) 26 1 13,5.
2
prof M
+
= = 
 
13 14 60 61 60,5
2 2
!
x
ER
x
M RADO
+ +
= = = 
 
Não esquecer que os verdadeiros valores são (inclui-se os decimais!): 
 
13 14 60,43 61,15 60,79
2 2
x x
M
+ +
= = =
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 67/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou determinar a mediana (M) e os quartos (F): 
 
 
1º passo, determinar a dimensão da amostra. 26n = . 
 
2º passo, determinar a profundidade da mediana. ( ) 1 26 1 13,5
2 2
n
prof M
+ +
= = = . 
 
 
3º passo, determinar a mediana. ( )
13 14 60, 43 61,15 60,79
2 2prof M
x x
M x
+ +
= = = = . 
 
 
4º passo, determinar a profundidade do quarto. 
( )
( ) 1 13,5 1 13 1
7
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = . 
 
5º passo, determinar o 1º LF e ultimo UF quarto. 
 
 7 50,92.LF x= = 
 '7 67,81.UF x= = 
 
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
 
Dispersão Quartal - 67,81 50,92 16,89U LdF F F= − = − = . 
Barreiras de Outliers Inferior - X X 1,5 50,92 1,5 16,89 25,59LF dF = − =− 
Barreiras de Outliers Superior - X X 1,5 67,81 1,5 16,5 93,15UF dF = + =+ 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (93,145): 0 
Dados inferior a barreira inferior (25,585): 0 
 
Posso concluir que não existe Outliers. 
 
Agora Diagrama Caixa com Bigodes: 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 68/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Caixa com 5 letras resumo: 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números 41,5 e 50,92, 
assim como os últimos 25% estão compreendidos entre os 67,81 e 72,73. As 
dispersões acontecem mais (ligeiramente) no 1º quartal. Não tem Outliers. 
 
 
 
Construção de Histogramas/Barras - Regra de Sturges 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
 
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
 
 
Assim, ( )2log 26 1 = 5N ≈ +� �� � (já visto anteriormente). 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
: : 72,73 41,75* * * 6,196
5
n n l nx xh h h
N
− −
= ⇔ = ⇔ = 
 
Logo posso considerar h = 6,2. O limite inferior da primeira classe deverá ser 
: ,2l n
x
ε
− em que ε é o excesso, e é dado por: 
 ( ) ( ): : .n n l nXN h x xε = − − 
 
Assim ( ) ( ) 5 6,2 72,73 41,75 0,02Xε ε= − − ⇔ = , e como o inicio da classe é: 
 
:
0,02
41,75 41,74
2 2l n
x
ε
− = − = . 
 
 
Assim as classes a considerar são: 
 
] ] ] ] ] ]41,74 ; 47,94 , 47,94 ; 54,14 , 54,14 ; 60,34 , 
 
] ] ] ] 60,34 ; 66,54 e 66,54 ; 72,74 . 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 69/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
ix in iN if iF 
 ] ]41,74 ; 47,94 5 5 0,19 0,19 
 ] ] 47,94 ; 54,14 5 10 0,19 0,38 
 ] ] 54,14 ; 60,34 3 13 0,12 0,50 
 ] ] 60,34 ; 66,54 4 17 0,15 0,65 
 ] ] 66,54 ; 72,74 9 26 0,35 1 
 n = 26 
 
 
 
 
Na 1º figura do exercício é o gráfico dos dados. 
Na 2º figura do exercício confirma se que o gráfico é assimétrico. 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 70/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Exercício – 3: Na tabela em baixo encontra-se o número mensal de passageiros 
(em centenas) referente ao período 1998-2001 da companhia EntreAsNuvens. 
 
 
 
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M) 
e os quartos (F). 
 
 
Resolução - 2: Sendo na dimensão da amostra, vamos usar um número de caules N 
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 48 1 = 6N ≈ +� �� � . 
 
Aqui é necessário tomar se uma decisão, pois os números são de 4 algarismos, 
ficando três no caule. Assim sendo seria necessário arranjar 100 linhas para 
conseguir arrumar os dados. Além de ser um valor absurdo, só podemos utilizar 6 
(este 6 não é uma obrigatoriedade, mas sim uma orientação). Vou então utilizar 
uma forma do tipo ½. Vou definir conjuntos dos primeiros 50 como “Lower” e os 
restantes 50 como “Upper”. E o número é o das centenas, por isso utilizo 2
1
x10
2
 na 
característica do diagrama caule e folhas. 
 
Folhas não ordenadas: 
 
 
 
 
Diagrama final: 
 
 
 
Assim sendo: o 2º da 2ª linha valor 9U || 6 representa 2 19x10 6x10 960+ = . Ter em 
atenção as potências. Como não se tem o 960, é na realidade o 968. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 71/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 A outra informação que é necessária acrescentar a tabela. É o valor acumulado, 
tanto de cima para baixo, com de baixo para cima. A ter se em conta que a linha 
onde se encontra a ( )prof M fica entre parênteses. 
 
Como ( ) 48 1 24,5.
2
prof M
+
= = 
 
 
 
 
Agora vou determinar a mediana (M) e os quartos (F): 
 
1º passo, determinar a dimensão da amostra. 48n = . 
 
2º passo, determinar a profundidade da mediana. ( ) 1 48 1 24,5
2 2
n
prof M
+ +
= = = . 
 
3º passo, determinar a mediana. 
 
( )
24 25 1 ?06 106 106 106 10 2
2 2
2
2
2
6
?
prof M
x x
M x
+ + +
= = = = = . 
 
4º passo, determinar a profundidade do quarto. 
 
( )
( ) 1 24,5 1 24 1
12,5
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = . 
 
5º passo, determinar o 1º LF e ultimo UF quarto. 
 
 12 13
996 1009
1 002,5.
2 2L
x x
F
+ +
= = = 
 
' '
12 13 1 111 1 105 1 108.
2 2U
x x
F
+ +
= = = Cuidado com este. Lê se da direita para a 
esquerda, e na 4ª fila. 
 
 
É errado fazer 
' '
12 13 1 147 1 147
2 2U
x x
F
+ +
= = = . A contagem foi realizada da esquerda 
para a direita. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 72/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
 
Dispersão Quartal - 1 108 1 002,5 105,5U LdF F F= − = − = . 
Barreiras de Outliers Inferior - X X 1,5 1 002,5 1,5 105,5 844, 25LF dF = − =− 
Barreiras de OutliersSuperior - X X 1,5 1 108 1,5 105,5 1 266, 25UF dF = + =+ 
 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior moderado (1 266,25): 0 
Dados inferior a barreira inferior moderado (844,25): 0 
 
 
Posso concluir que não existe Outliers. 
 
 
 
Agora Diagrama Caixa com Bigodes: 
 
 
 
 
Caixa com 5 letras resumo: 
 
 
 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números 940 e 1 002,5, 
assim como os últimos 25% estão compreendidos entre os 1 108 e 1 196. As 
dispersões acontecem mais (ligeiramente) no 4º quartal. Não tem Outliers. 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 73/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Construção de Histogramas/Barras - Regra de Sturges 
 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
 
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
 
 
Assim, ( )2log 48 1 = 6N ≈ +� �� � (já visto anteriormente). 
 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
( ): : 1196 940* * * 42, 6
6
n n l nx xh h h
N
− −
= ⇔ = ⇔ = 
 
 
Logo posso considerar h = 43. 
 
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é 
dado por 
( ) ( ): : .n n l nXN h x xε = − − 
 
Assim ( ) ( ) 6 43 1196 940 2Xε ε= − − ⇔ = , e como o inicio da classe é: 
 
:
2
940 939
2 2l n
x
ε
− = − = . 
 
Assim as classes a considerar são: 
 
] ] ] ] ] ]939 ; 982 , 982 ; 1025 , 1025 ; 1068 , 
 
] ] ] ] ] ] 1068 ; 1111 , 1111 ; 1154 e 1154 ; 1197 . 
 
 
ix in iN if iF 
 ] ]939 ; 982 5 5 0,10 0,10 
 ] ] 982 ; 1025 11 16 0,23 0,33 
 ] ] 1025 ; 1068 8 24 0,17 0,50 
 ] ] 1068 ; 1111 13 37 0,27 0,77 
 ] ] 1111 ; 1154 7 44 0,15 0,92 
 ] ] 1154 ; 1197 7 48 0,08 1 
 
 n = 48 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 74/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
Na 1º figura do exercício é o gráfico dos dados. 
Na 2º figura do exercício confirma se que o gráfico é assimétrico. 
 
 
 
 
 
 
 
 
Exercício – 4: Os dados seguintes indicam a largura, em mm, do siso superior 
direito de 78 indivíduos: 
 
 
 
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M) 
e os quartos (F). 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 75/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução - 4: Sendo na dimensão da amostra, vamos usar um número de caules N 
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 78 1 = 7N ≈ +� �� � . 
 
Aqui é necessário tomar se uma decisão, pois os números são composto pela parte 
inteira e fraccionaria. Como nas folha só se pode ter um algarismo, vai se “truncar” 
(apagar) a parte inteira. Mas este “truncagem” só se realiza na arrumação dos 
dados, pois nos cálculos é necessário respeitar o número com completo. 
 
Aqui vou utilizar o formato do tipo 1/5. Consiste em agrupar as dezenas (10 
números) em apenas 5. Usa se a terminologia inglesa para os números. 
 
Porque não utilizar o tipo de formato do exemplo 3? Pois teria poucos caules (dois) 
e o ideal seria ( )2log 78 1 = 7N ≈ +� �� � , logo tive que ir a procura de outro tipo de 
forma. O que se encaixa nesta tabela é então a de 1/5. 
 
T – Two e Tree; F – Four e Five; S – Six e Seven. 
L – Lower para os números zero e um, e U – Upper para os números oito e nove. 
 
 
Folhas não ordenadas: 
 
 
 
 
Diagrama final: 
 
 
 
Assim sendo: o 1º da 2ª linha valor 5F || 4 representa 1 25x10 4x10 0,54− −+ = 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 76/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 A outra informação que é necessária acrescentar a tabela. É o valor acumulado, 
tanto de cima para baixo, com de baixo para cima. A ter se em conta que a linha 
onde se encontra a ( )prof M fica entre parênteses. 
Como ( ) 78 1 39,5.
2
prof M
+
= = 
 
 
 
 
Agora vou determinar a mediana (M) e os quartos (F): 
 
1º passo, determinar a dimensão da amostra. 78n = . 
 
2º passo, determinar a profundidade da mediana. ( ) 1 78 1 39,5
2 2
n
prof M
+ +
= = = . 
 
3º passo, determinar a mediana. 
( )
39 40 0,60 0,61 0,605
2 2prof M
x x
M x
+ +
= = = = . 
4º passo, determinar a profundidade do quarto. 
 
( )
( ) 1 39,5 1 39 1
20
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = . 
 
5º passo, determinar o 1º LF e ultimo UF quarto. 
 
 20 0,57.LF x= = 
 '20 0,64.UF x= = Cuidado com este. Lê se da direita para a esquerda, e na 5ª 
fila. 
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
 
Dispersão Quartal - 0,64 0,57 0,07U LdF F F= − = − = . 
Barreiras de Outliers Inferior - X X 1,5 0,57 1,5 0,07 0, 465LF dF = − =− 
Barreiras de Outliers Superior - X X 1,5 0,64 1,5 0,07 0,745UF dF = + =+ 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 77/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (0,745): 0 
Dados inferior a barreira inferior (0,465): 0 
 
Posso concluir que não existe Outliers. 
 
 
Agora Diagrama Caixa com Bigodes: 
 
 
 
 
Caixa com 5 letras resumo: 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números 0,52 e 0,57, 
assim como os últimos 25% estão compreendidos entre os 0,64 e os 0,69. As 
dispersões são uniformes, tanto para a esquerda como para a direita. Não tem 
Outliers. 
 
 
 
 
Construção de Histogramas/Barras - Regra de Sturges 
 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
 
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 78/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Assim, ( )log 2 78 1 = 7N ≈ +� �� � (já visto anteriormente). 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
 
: : 0,69 0,52* * * 0,0243
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ = 
 
 
Logo posso considerar h = 0,025. 
 
 
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é 
dado por 
( ) ( ): : .n n l nXN h x xε = − − 
 
 
Assim ( ) ( ) 7 0,025 0,69 0,52 0,005Xε ε= − − ⇔ = , e como o inicio da classe é: 
 
:
0,005
0,52 0,518
2 2l n
x
ε
− = − = . 
 
 
Assim as classes a considerar são: 
 
] ] ] ] ] ] ] ]0,518 ; 0,543 , 0,543 ; 0,568 , 0,568 ; 0,593 , 0,593 ; 0,618 , 
 
] ] ] ] ] ] 0,618 ; 0,643 , 0,643 ; 0,668 e 0,668 ; 0,693 . 
 
 
 
 
ix in iN if iF 
 ] ]0,518 ; 0,543 8 8 0,10 0,10 
 ] ] 0,543 ; 0,568 9 17 0,12 0,22 
 ] ] 0,568 ; 0,593 18 35 0,23 0,45 
 ] ] 0,593 ; 0,618 10 45 0,13 0,58 
 ] ] 0,618 ; 0,643 15 60 0,19 0,78 
 ] ] 0,643 ; 0,668 7 67 0,09 0,87] ] 0,668 ; 0,693 10 77 0,13 1 
 n = 77 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 79/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
Na 1º figura do exercício é o gráfico dos dados. 
Na 2º figura do exercício confirma se que o gráfico é assimétrico. 
 
 
 
 
 
 
 
 
 
Exercício – 5: Os dados seguintes indicam a Fosfoquinase de creatina (U/Litro) em 
54 adultos de sexo masculino. 
 
 
 
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M) 
e os quartos (F). 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 80/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução - 5: Sendo na dimensão da amostra, vamos usar um número de caules N 
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 54 1 = 6N ≈ +� �� � . 
 
Arrumados os tabela fica: 
 
 
 
Folhas não ordenadas: 
 
2154; x 10
2
 
 
Agora vou determinar a mediana (M) e os quartos (F): 
 
1º passo, determinar a dimensão da amostra. 54n = . 
 
2º passo, determinar a profundidade da mediana. ( ) 1 54 1 27,5
2 2
n
prof M
+ +
= = = . 
 
3º passo, determinar a mediana. 
( )
27 28 87 87 87
2 2prof M
x x
M x
+ +
= = = = . 
 
4º passo, determinar a profundidade do quarto. 
( )
( ) 1 27,5 1 27 1
14
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = . 
 
5º passo, determinar o 1º LF e ultimo UF quarto. 
 
 14 67.LF x= = 
'
14 113.UF x= = 
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 113 67 46U LdF F F= − = − = . 
Barreiras de Outliers Inferior - X 1,5 67 69 2LF dF = − = −− 
Barreiras de Outliers Superior - X 1,5 113 69 182UF dF = + =+ 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 81/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (182): 204 e 207. 
Dados inferior a barreira inferior (-2): 0 
 
Agora Diagrama Caixa com Bigodes: 
 
 
 
De notar que os Outliers não estão na caixa do diagrama. O último mas abaixo da 
barreira superior (abaixo do numero 182). 
 
Caixa com 5 letras resumo: 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números 27 a 67, assim 
como os últimos 25% estão compreendidos entre os 113 a 176. As dispersões nota 
se mais a direita. Tem 2 Outliers moderados a direita, que são o 204 e 207. 
 
 
 
 
Exercício – 6: Os dados seguintes indicam o número de dendritos em células 
cerebrais de porcos da Índia. 
 
 
 
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M) 
e os quartos (F). 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 82/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução - 6: Sendo na dimensão da amostra, vamos usar um número de caules N 
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 64 1 = 7N ≈ +� �� � . 
 
Arrumados os tabela fica: 
 
 
Folhas ordenadas: 
 
164; 1 x 10 
 
 
 
 
Agora vou determinar a mediana (M) e os quartos (F): 
 
1º passo, determinar a dimensão da amostra. 64n = . 
 
2º passo, determinar a profundidade da mediana. ( ) 1 64 1 32,5
2 2
n
prof M
+ +
= = = . 
 
3º passo, determinar a mediana. 
( )
32 33 31 32 31,5
2 2prof M
x x
M x
+ +
= = = = . 
 
4º passo, determinar a profundidade do quarto. 
( )
( ) 1 32,5 1 32 1
16,5
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = . 
 
5º passo, determinar o 1º LF e ultimo UF quarto. 
 
 16 17
14 15
14,5.
2 2L
x x
F
+ +
= = =
 
' '
16 17 44 43 43,5.
2 2U
x x
F
+ +
= = = 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 83/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 43,5 14,5 29U LdF F F= − = − = . 
Barreiras de Outliers Inferior - X 1,5 14,5 43,5 29LF dF = − = −− 
Barreiras de Outliers Superior - X 1,5 43,5 43,5 87UF dF = + =+ 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (87): 0. 
Dados inferior a barreira inferior (-29): 0. 
Agora Diagrama Caixa com Bigodes: 
 
 
 
De notar que os Outliers não estão na caixa do diagrama. O último mas abaixo da 
barreira superior (abaixo do numero 182). 
 
 
Caixa com 5 letras resumo: 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números 0 e 14,5, 
assim como os últimos 25% estão compreendidos entre os 43,5 e 50. As dispersões 
nota se mais (ligeiramente) a esquerda. Não tem Outliers. 
 
 
 
 
Construção de Histogramas/Barras - Regra de Sturges 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
 
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 84/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Assim, ( )2log 64 1 = 7N ≈ +� �� � (já visto anteriormente). 
 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
 
: : 50 0* * * 7,14
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ = 
 
 
Logo posso considerar h = 7,2. 
 
 
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é 
dado por 
( ) ( ): : .n n l nXN h x xε = − − 
 
 
Assim ( ) ( ) 7 7, 2 50 0 0,4Xε ε= − − ⇔ = , e como o inicio da classe é: 
 
:
0,4
0 0, 2
2 2l n
x
ε
− = − = − . 
 
 
Assim as classes a considerar são: 
 
] ] ] ] ] ] ] ]0, 2 ; 7,0 , 7,0 ; 14,2 , 14,2 ; 21,4 , 21, 4 ; 28,6 , − 
 
] ] ] ] ] ] 28,6 ; 35,8 , 35,8 ; 43,0 e 43,0 ; 50,2 . 
 
 
 
ix in iN if iF 
 ] ]0, 2 ; 7,0− 5 5 0,08 0,08 
 ] ] 7,0 ; 14, 2 11 16 0,17 0,25 
 ] ] 14,2 ; 21,4 7 23 0,11 0,36 
 ] ] 21, 4 ; 28,6 5 28 0,08 0,44 
 ] ] 28,6 ; 35,8 9 37 0,14 0,58 
 ] ] 35,8 ; 43,0 11 48 0,17 0,75 
 ] ] 43,0 ; 50,2 16 64 0,25 1 
 n = 64 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 85/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
Na 1º figura do exercício é o gráfico dos dados. 
Na 2º figura do exercício confirma se que o gráfico é assimétrico. 
 
 
 
 
Exercício – 7: Os dados seguintes indicam o número de escaravelhos em 144 
círculos de um campo de trigo. 
 
 
 
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M) 
e os quartos (F). 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 86/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução - 7: Sendo na dimensão da amostra, vamos usar um número de caules N 
tãopróximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 144 1 = 8N ≈ +� �� � . 
 
 
Arrumados os tabela fica: 
 
 
 
 
 
Folhas não ordenadas: 
 
11144; x 10
2
 
 
 
 
Mas também poderia ser 1
1
144; x 10
5
, pois distam a mesma distância: 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 87/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou determinar a mediana (M) e os quartos (F): 
 
1º passo, determinar a dimensão da amostra. 144n = . 
 
2º passo, determinar a profundidade da mediana. ( ) 1 144 1 72,5
2 2
n
prof M
+ +
= = = . 
 
3º passo, determinar a mediana. 
 
( )
72 73 9 9 9
2 2prof M
x x
M x
+ +
= = = = . 
 
4º passo, determinar a profundidade do quarto. 
( )
( ) 1 72,5 1 72 1
36,5
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = . 
 
5º passo, determinar o 1º LF e ultimo UF quarto. 
 
 36 37
5 5
5.
2 2L
x x
F
+ +
= = =
 
 
' '
36 37 15 15 15.
2 2U
x x
F
+ +
= = = 
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
 
Dispersão Quartal - 15 5 10U LdF F F= − = − = . 
Barreiras de Outliers Inferior - X X 1,5 5 1,5 10 10LF dF = − = −− 
Barreiras de Outliers Superior - X X 1,5 15 1,5 10 30UF dF+ = + = 
 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (30): 0 
Dados inferior a barreira inferior (-10): 0 
 
Posso concluir que não existe Outliers. 
 
 
Agora Diagrama Caixa com Bigodes: 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 88/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Caixa com 5 letras resumo: 
 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números 0 e 5, assim 
como os últimos 25% estão compreendidos entre os 15 e 20. As dispersões são 
uniformes. Pode se afirmar que existe uma simetria quase perfeita. Não tem 
Outliers. 
 
 
 
Construção de Histogramas/Barras - Regra de Sturges 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
 
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
 
 
Assim, ( )2log 144 1 = 8N ≈ +� �� � (já visto anteriormente). 
 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
: : 20 0* * * 2,5
8
n n l nx xh h h
N
− −
= ⇔ = ⇔ = 
 
 
Logo posso considerar h = 2,5. 
 
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é 
dado por 
( ) ( ): : .n n l nXN h x xε = − − 
 
 
Assim ( ) ( ) 8 2,5 20 0 0Xε ε= − − ⇔ = , e como o inicio da classe é: 
:
0
0 0
2 2l n
x
ε
− = − = . 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 89/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Assim as classes a considerar são: 
 
] ] ] ] ] ] ] ]0,0 ; 2,5 , 2,5 ; 5,0 , 5,0 ; 7,5 , 7,5 ; 10,0 , 
 
] ] ] ] ] ] ] ] 10,0 ; 12,5 , 12,5 ; 15,0 , 15,0 ; 17,5 e 17,5 ; 20,0 . 
 
 
 
ix in iN if iF 
 ] ]0,0 ; 2,5 17 17 0,12 0,12 
 ] ] 2,5 ; 5,0 23 40 0,16 0,28 
 ] ] 5,0 ; 7,5 17 57 0,12 0,4 
 ] ] 7,5 ; 10,0 27 84 0,19 0,58 
 ] ] 10,0 ; 12,5 6 90 0,04 0,63 
 ] ] 12,5 ; 15,0 22 112 0,15 0,78 
 ] ] 15,0 ; 17,5 18 130 0,13 0,9 
 ] ] 17,5 ; 20,0 14 144 0,1 1 
 n = 144 
 
 
 
 
Na 1º figura do exercício é o gráfico dos dados. 
Na 2º figura do exercício confirma se que o gráfico é assimétrico. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 90/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Exercício – 8: Os dados seguintes indicam a duração (em minutos) das canções 
nupciais de grilos. 
 
 
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M) 
e os quartos (F). 
 
 
Resolução - 8: Sendo na dimensão da amostra, vamos usar um número de caules N 
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 80 1 = 7N ≈ +� �� � . 
 
Arrumados os tabela fica: 
 
 
080; 1 x 10 
 
 
Neste gráfico, e sem precisar de fazer cálculos, rapidamente detecto que o dado 
11,41 é um Outliers Severo. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 91/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou determinar a mediana (M) e os quartos (F): 
 
1º passo, determinar a dimensão da amostra. 80n = . 
 
2º passo, determinar a profundidade da mediana. ( ) 1 80 1 40,5
2 2
n
prof M
+ +
= = = . 
 
3º passo, determinar a mediana. 
 
( )
40 41 1,64 1,67 1,655
2 2prof M
x x
M x
+ +
= = = = . 
 
4º passo, determinar a profundidade do quarto. 
 
( )
( ) 1 40,5 1 40 1
20,5
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = . 
 
5º passo, determinar o 1º LF e ultimo UF quarto. 
 
 20 21
1,24 1,25
1, 245.
2 2L
x x
F
+ +
= = = 
 
' '
20 21 2,31 2, 24 2, 275.
2 2U
x x
F
+ +
= = = 
 
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
 
Dispersão Quartal - 2, 275 1, 245 1,03U LdF F F= − = − = . 
Barreiras de Outliers Inferior - X X 1,5 1, 245 1,5 1,03 0,30LF dF = − = −− 
Barreiras de Outliers Superior - X X 1,5 2,275 1,5 1,03 3,82UF dF+ = + = 
 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (3,82): 3,95 ; 3,95 ; 4,16 ; 4,23 ; 4,26 ; 5,31 ; 
6,01 ; 11,41. Ou seja, existem 8 Outliers. 
 
Dados inferior a barreira inferior (-0,30): 0 
 
 
Vou verificar se existem Outliers Severos (só vou a procura do lado direito): 
Barreiras de Outliers Severo Superior - X X 1,5 2, 275 3 1,03 5,37UF dF =+ + = 
Dados superior a barreira superior (5,37): 6,01 ; 11,41. Ou seja, existem 3 
Outliers Severos. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 92/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora Diagrama Caixa com Bigodes: 
 
 
 
 
Este diagrama com bigodes tem algumas particularidades: 
 
 1º o ultimo dado não é o dado 11,41, mas sim o dado 3,53, pois é o dado 
imediatamente abaixo do Outlier moderado (3,82). 
 
 2º a representação dos dados Outliers Moderados é feita com uma cruz (aqui 
a verde, mas a cor não interessa, é só para ajudar a visualizar melhor). 
 
 3º a representação dos dados Outliers Severo é feita com um circulo (aqui a 
vermelho, mas a cor não interessa, é só para ajudar a visualizar melhor). 
 
 4º a recta das abcissas está interrompida, pois senão ficaria um gráfico 
demasiado comprido. 
 
 
 
Caixa com 5 letras resumo: 
 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números 1,02 e 1,25, 
assim como os últimos 25% estão compreendidos entre os 2,28 e 3,53. 
As dispersões acontecem mais a direita. 
Tem 6 Outliers Moderados (3,95;4,16;4,23;4,26;5,31) e 2 Severos (6,01;11,41). 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 93/305 
Sugestões: jrvalente@netmadeira.comProbabilidades e Estatística 
Construção de Histogramas/Barras - Regra de Sturges 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
 
 
Assim, ( )2log 80 1 = 7N ≈ +� �� � (já visto anteriormente). 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
: : 3,53 1,02* * * 0,358
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ = 
 
Logo posso considerar h = 0,36. 
 
 
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é 
dado por 
( ) ( ): : .n n l nXN h x xε = − − 
 
 
Assim ( ) ( ) 7 0,36 3,53 1,02 0,01Xε ε= − − ⇔ = , e como o inicio da classe é: 
 
:
0,01
1,02 1,015
2 2l n
x
ε
− = − = . 
 
Assim as classes a considerar são: 
 
] ] ] ] ] ] ] ]1,015 ; 1,375 , 1,375 ; 1,735 , 1,735 ; 2,095 , 2,095 ; 2,455 , 
 
] ] ] ] ] ] 2,455 ; 2,815 , 2,815 ; 3,175 e 3,175 ; 3,535 . 
 
 
ix in iN if iF 
 ] ]1,015 ; 1,375 26 26 0,36 0,36 
 ] ] 1,375 ; 1,735 16 42 0,22 0,58 
 ] ] 1,735 ; 2,095 9 51 0,13 0,71 
 ] ] 2,095 ; 2,455 11 62 0,15 0,86 
 ] ] 2, 455 ; 2,815 7 69 0,10 0,96 
 ] ] 2,815 ; 3,175 0 69 0,00 0,96 
 ] ] 3,175 ; 3,535 3 72 0,04 1 
 n = 72 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 94/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
 
Na 1º figura do exercício é o gráfico dos dados. 
Na 2º figura do exercício confirma se que o gráfico é assimétrico. 
 
 
 
 
 
Exercício – 9: Os dados seguintes indicam a aminotransferase de alanina (U/Litros) 
em voluntários adultos. 
 
 
 
 
 
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M) 
e os quartos (F). 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 95/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução - 9: Sendo na dimensão da amostra, vamos usar um número de caules N 
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 77 1 = 7N ≈ +� �� � . 
 
Arrumados os tabela fica: 
 
 
 
 
 177; 1 x 10 
 
 
 
 
 
Agora vou determinar a mediana (M) e os quartos (F): 
 
1º passo, determinar a dimensão da amostra. 77n = . 
 
 
2º passo, determinar a profundidade da mediana. ( ) 1 77 1 39
2 2
n
prof M
+ +
= = = . 
 
 
3º passo, determinar a mediana. ( ) 39 27prof MM x x= = = . 
 
 
4º passo, determinar a profundidade do quarto. 
( )
( ) 1 39 1 39 1
20
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = . 
 
 
5º passo, determinar o 1º LF e ultimo UF quarto. 
 
 20 20.LF x= = 
'
20 37.UF x= = 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 96/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Dispersão Quartal - 37 20 17U LdF F F= − = − = . 
Barreiras de Outliers Inferior - X X 1,5 20 1,5 17 5,5LF dF = − = −− 
Barreiras de Outliers Superior - X X 1,5 37 1,5 17 62,5UF dF = + =+ 
 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (62,5): 0 
Dados inferior a barreira inferior (-5,5): 0 
 
Posso concluir que não existe Outliers. 
 
 
 
Agora Diagrama Caixa com Bigodes: 
 
 
 
 
 
 
Caixa com 5 letras resumo: 
 
 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números 6 e 20, assim 
como os últimos 25% estão compreendidos entre os 37 e 48. As dispersões são 
uniformes. Não tem Outliers. 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 97/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Construção de Histogramas/Barras - Regra de Sturges 
 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
 
 
Assim, ( )2log 77 1 = 7N ≈ +� �� � (já visto anteriormente). 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
: : 48 6* * * 6
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ = 
 
Logo posso considerar h = 6. 
 
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é 
dado por: ( ) ( ): : .n n l nXN h x xε = − − 
 
 
Assim ( ) ( ) 7 6 48 6 0,0Xε ε= − − ⇔ = , e como o inicio da classe é: 
 
:
0,0
6 6
2 2l n
x
ε
− = − = . 
 
 
Assim as classes a considerar são: 
 
[ ] ] ] ] ] ] ]6 ; 12 , 12 ; 18 , 18 ; 24 , 24 ; 30 , 
 
] ] ] ] ] ] 30 ; 36 , 36 ; 42 e 42 ; 48 . 
 
 
ix in iN if iF 
 [ ]6 ; 12 6 6 0,08 0,08 
 ] ] 12 ; 18 12 18 0,16 0,23 
 ] ] 18 ; 24 13 31 0,17 0,4 
 ] ] 24 ; 30 13 44 0,17 0,57 
 ] ] 30 ; 36 13 57 0,17 0,74 
 ] ] 36 ; 42 13 70 0,17 0,91 
 ] ] 42 ; 48 7 77 0,09 1 
 n = 77 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 98/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
Na 1º figura do exercício é o gráfico dos dados. 
Na 2º figura do exercício confirma se que o gráfico é assimétrico. 
 
 
 
 
 
 
Folha de Exercício 2 – Exercício 4 e 8 
 
 
4. Considere a amostra bivariada 
 
1 1 2 2( , ), ( , ) , ... , ( 1 , 1) , ( , ) , ( 1 , 1) , ... , ( , )i i i i i i n nx y x y x y x y x y x y− − + + 
 
Suponha que há um erro na ordenada do par ( , )i ix y , que passa de iy a ´i i iy y y= + ∆ . Mostre 
que o erro provocado por esta alteração no declive da recta dos mínimos quadrados é dado por 
 
( )
( ) 2
´
1
i i
x
x x y
a a a
n s
− ∆
∆ = − =
−
 
 
onde a é o declive sem erro e ´a o declive com erro. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 99/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução - ´a é o declive com erro e a é o declive sem erro. 
 
Ou seja tenho o seguinte: 
 
 
Deste modo consigo calcular o “a”: 
 
 
Como houve um erro, vou obter um ´a : 
 
 
 
 
Nota: 
( )
( )
1
1
1
n
n
−
=
−
 
 
( )
( )
1 1
2 2
1 1
( )
´
( )
1
1
(
(
( ) (
)
) )
n n
K K
n
K
n
i
K
i
K K
KKKX X X X X X
a
X X X
Y Y Y
X
n
n
Y
= =
= =
− −
= = =
−
− −
−
−
−
−� �
� �
 
Nota: acrescentei ( )1n − , pois preciso para chegar a igualdade pedida. 
 
 
Também sei que 
( )
2
21
( )
1
n
i
K
X
X X
s
n
=
−
=
−
�
 
 
 
( )
( )
( )
1 1 1
2
2 2
1 1
( ) ( ) ( )( ) ( ) ( )
´
1
( )
1
)
1
(
n n n
K K K
K K K
n n
X
i i
K
K K KK
K
KX X X X X X Y X X Y
a
n s
X X
n
n
Y Y
X
Y X X Y
X
= = =
= =
− − − − −
= = = =
− − −
−
−
−
− −
� � �
� �
 
 
 
Nota, como é bivariada, tenho que indicar que a variância diz respeito ao “x” , 2Xs . 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 100/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora tenho que me ver livre do 2º termo “
1
( )
n
K
K
X X Y
=
− −� ”. Ora as constantessaem do 
somatório: 
1
0!!
( )
n
K
K
Y X X
=
=
− −�
�������
 
 
O somatório é zero, pois todos os erros KX (afastamentos da media) anulam se com a media. 
Assim fica: 
( ) ( )
1 1
2 2
( ) ( ) ( )
´
1 1
n n
K K K K K
K K
X X
X X Y X X Y X X Y
a
n s n s
= =
− − − −
= = =
− −
� �
 
 
O somatório vai do primeiro até ao “n”, passando pelo erro. 
 
 
( )
( )
( )
fEsta parcela fica do somatorio.
 
1
1
2 2
ra
 
o
( ) ( )( )
( )
´
1 1
n
n
K K
KK
K i
i i i
K i
K
K
X X
X X Y X X Y Y
X X Y
a
n s n s
=
=
≠
≠
− + − + ∆
−
= = =
− −
��
����	���
 
 
 
( ) ( )
Desenvolvi!
1 1
2 2
(( ) ( ) (( ) ( )
´
))
1 1
i i
n n
K K Ki i i iK
K K
K i K
i
i
X X
X X X XX X Y X XY Y Y YY
a
n n s
X
s
X
= =
≠ ≠
+ ∆ + ∆− + − +
= =
−
− −
−
−
=
� �
�����	����
 
 
 
 
Mas deste termo “ ( ) ( )i i i iX X Y X X Y− + − ∆ ”, há uma parte que pode voltar a integrar o 
somatório, que é ( )iX X− . 
 
( ) ( ) ( )
'
1 1
2 2 2
( ) ( ) ( )
( )
´
1 1 1
a
a
n n
K K i i K K
i iK K
X X X
X X Y X X Y X X Y
X X Y
a
n s n s n s
=
=
= =
− + − ∆ −
− ∆
= = +
− − −
� �
������	�����
���	��
 
 
 
 
Sendo assim posso fazer esta igualdade: 
 
 
( ) 2
( )
´
1
i i
X
X X Y
a a
n s
− ∆
= +
−
 c.q.d. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 101/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
8 - Dada uma amostra 1 2( , , .... , )nx x x , a ordem (rank) ascendente ir de uma observação ix é a 
sua posição na amostra ordenada crescente (número de observações desde o mínimo até ix ), e a 
ordem descendente 'ir é a sua posição na amostra ordenada decrescente (número de observações 
desde ix até o máximo). Justifique que a ordem ascendente e a ordem descendente estão 
relacionadas pela equação: 
' 1i ir r n+ = + 
 
Resolução: 
Exemplo: 
 
 
 
' 1i ir r n+ = + 
Esquematizando: 
 
 
{ }' 1 1,...,i ir r n i n∴ + = + ∀ ∈ 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 102/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Frequência: 2000/01/17 
 
Duração: 3 horas (cada grupo vale 3,5 valores). 
 
 
Num estudo comparativo entre dois sistemas operativos registam-se os tempos de execução de 
80 programas de simulação. Esses registos constam da tabela abaixo: X refere o tempo de 
execução usando o sistema operativo I, Y o tempo de execução com o sistema operativo II,
W X Y= − . 
 
Por comodidade fornecem-se ainda as seguintes somas: 
 
80 80
2
1 1
2 301,4 68 634,72i i
i i
X X
= =
= ∧ =� � 
 
80 80
2
1 1
2 483,9 80 566,37i i
i i
Y Y
= =
= ∧ =� � 
 
80
1
71 711,43i i
i
X Y
=
=� 
 
80 80
2
1 1
182,5 5 778,23i i
i i
W W
= =
= − ∧ =� � 
 
 
 
 
Grupo I 
 
a) Calcule as características amostrais da amostra x que lhe parecerem relevantes. 
b) Desenhe a caixa com bigodes correspondente à amostra x. 
c) Média, mediana e máximo são características de localização interessantes, desvio padrão e 
dispersão quartal características de escala também muito comuns. Comente as qualidades e 
defeitos daquelas características. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 103/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 Vou 1º pôr por ordem: 
 
 
 
Resolução a) - pequena introdução: 
 
Quando se pede “Calcule as características amostrais…” tem se que responder a Media, 
Mediana, Mínimo, Máximo, Moda, Desvio Padrão, Quartis e Outliers. 
Mediana: 1
n
i
i
X
X
n
==
�
 Média: ( )prof MM x= 
 
Moda: o número mais vezes repetido (pode não haver moda), Desvio Padrão da Amostra 
( )xs é diferente do Desvio Padrão da População ( ).xσ 
 
Quartil - ( ) ( )
'
L Uprof F prof FF x F x= ∧ = 
 
 
Assim: 
80
1 1 2301,4 28,7675
80 80
n
i i
i i
X X
X X X X
n
= == ⇔ = ⇔ = ⇔ =
� �
 
 
 
( )
40 41 26,7 26,8 26,75
2 2prof M
x x
M x M M M
+ +
= ⇔ = ⇔ = ⇔ =
 
 
Variância: 
( )
2
22 2 2
1 1
1 1 1 1
68 634,72 2 301,4
1 80 1 80
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
 � � �− − � �� �� �� �
� �
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 104/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
[ ] ( )2 2 21 168 634,72 66 205,53 2 429,2 30,75
79 79X X X
s s s⇔ = − ⇔ = ⇔ =
 
 
Desvio Padrão:
2 30,75 5,5X X X Xs s s s= ⇔ = ⇔ = 
 
 
Quartis: 
( )
20 21 25,0 25,1 25,05
2 2L L L Lprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
 
( )
' '
' 20 21 30,4 31,2 30,8
2 2U U U Uprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 30,8 25,05 5,75U LdF F F= − = − = . 
 
Barreiras de Outliers Inferior - X X 1,5 25,05 1,5 5,75 16, 425LF dF = − =− 
Barreiras de Outliers Superior - X X 1,5 30,8 1,5 5,75 39,425UF dF = + =+ 
 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (39,425): 4 (43,2 ; 45,9 ; 47,8 ; 48,3) 
Dados inferior a barreira inferior (16,425): 0 
 
Vou verificar se existem Outliers Severos (só vou a procura do lado direito): 
 
Barreiras de Outliers Severo Superior - X X 3 30,8 3 5,75 48,05UF dF = + =+ 
Dados superior a barreira superior (48,05): 48,3. Ou seja, existem 1 Outliers 
Severos. 
 
 
Resolução b) - Diagrama Caixa com Bigodes: 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 105/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Este diagrama com bigodes tem algumas particularidades: 
 
 1º o dado máximo não é o 48,3, mas sim o dado 38,8, pois é o dado 
imediatamente abaixo do Outlier moderado (43,2). 
 
 2º a representação dos dados Outliers Moderados é feita com uma cruz (aqui 
a verde, mas a cor não interessa, é só para ajudar a visualizar melhor). 
 
 3º a representação dos dados Outliers Severo é feita com um circulo (aqui a 
vermelho, mas a cor não interessa, é só para ajudar a visualizar melhor). 
 
 
 
Não é pedido, para por uma questão de praticar exercícios vou fazer Caixa com 5 
letras resumo: 
 
 
 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números 23,3 e 25,1, 
assim como os últimos 25% estão compreendidos entre os 30,8 e 38,8. 
As dispersões acontecem mais a direita. 
Tem 3 Outliers Moderados (43,2;45,9;38,8) e 1 Severos (48,3). 
 
A Media e o Desvio Padrão (medidas de localização) são eficiente, mas pouco 
resistentes (sensíveis aos outliers), pois se não considerássemos os outliers, o valor 
da Media seria mais correcto e com um valor mais baixo. 
 
A Mediana e a dispersão Quartal (são medidas de dispersão), são resistentes, mas 
menos eficiente (dão nos pouca informação). 
 
Nota: o número máximo e mínimo são pouco informativos sobre a amostra global 
(nada eficiente), por isso não se devem de utilizar estes dois dados para chegar a 
conclusões. 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 106/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou fazer para a variável “y”, que nãoé pedido no exercício. 
 
 
 
Assim: 
 
80
1 1 2483,9 31,0375
80 80
n
i i
i i
Y Y
Y Y Y Y
n
= == ⇔ = ⇔ = ⇔ =
� �
 
 
 
( )
40 41 29,5 29,5 29,5
2 2prof M
y y
M y M M M
+ +
= ⇔ = ⇔ = ⇔ =
 
 
 
Variância: 
( )
2
22 2 2
1 1
1 1 1 1
80 566,37 2 483,9
1 80 1 80
n n
Y i i Y
i i
s Y Y s
n n= =
� �� � � �= − ⇔ = −� �
 � � �− − � �� �� �� �
� �
 
[ ] ( )2 2 21 180 566,37 77 121,99 3 444,38 43,60
79 79Y Y Y
s s s⇔ = − ⇔ = ⇔ =
 
Desvio Padrão:
2 43,60 6,6Y Y Y Ys s s s= ⇔ = ⇔ = 
 
 
Quartis: 
( )
20 21 26,2 26,4 26,3
2 2L L L Lprof F
y y
F y F F F
+ +
= ⇔ = ⇔ = ⇔ =
 
( )
' '
' 20 21 35,0 33,3 34,15
2 2U U U Uprof F
y y
F y F F F
+ +
= ⇔ = ⇔ = ⇔ =
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 107/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 34,15 26,3 7,85U LdF F F= − = − = . 
 
Barreiras de Outliers Inferior - X X 1,5 26,3 1,5 7,85 14,525LF dF = − =− 
Barreiras de Outliers Superior - X X 1,5 34,15 1,5 7,85 45,925UF dF = + =+ 
 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (45,925): 3 (48,4 ; 50,6 ; 58,7) 
Dados inferior a barreira inferior (14,525): 0 
 
Vou verificar se existem Outliers Severos (só vou a procura do lado direito): 
Barreiras de Outliers Severo Superior - X X 3 34,15 3 7,85 57,7UF dF =+ + = 
 
Dados superior a barreira superior (57,7): 58,7. Ou seja, existem 1 Outliers 
Severos. 
 
 
 
Resolução b) - Diagrama Caixa com Bigodes: 
 
 
 
 
 
 
 
Este diagrama com bigodes tem algumas particularidades: 
 
 1º o dado máximo não é o 48,3, mas sim o dado 38,8, pois é o dado 
imediatamente abaixo do Outlier moderado (43,2). 
 
 2º a representação dos dados Outliers Moderados é feita com uma cruz (aqui 
a verde, mas a cor não interessa, é só para ajudar a visualizar melhor). 
 
 3º a representação dos dados Outliers Severo é feita com um circulo (aqui a 
vermelho, mas a cor não interessa, é só para ajudar a visualizar melhor). 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 108/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Não é pedido, para por uma questão de praticar exercícios vou fazer Caixa com 5 
letras resumo: 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números 24,4 e 26,3, 
assim como os últimos 25% estão compreendidos entre os 34,15 e 45,3. 
As dispersões acontecem mais a direita. 
Tem 2 Outliers Moderados (48,4 e o 50,6) e 1 Severos (58,7). 
A Media e o Desvio Padrão (medidas de localização) são eficiente, mas pouco 
resistentes (sensíveis aos outliers), pois se não considerássemos os outliers, o valor 
da Media seria mais correcto e com um valor mais baixo. 
A Mediana e a dispersão Quartal (são medidas de dispersão), são resistentes, mas 
menos eficiente (dão nos pouca informação). 
Nota: o número máximo e mínimo são pouco informativos sobre a amostra global 
(nada eficiente), por isso não se devem de utilizar estes dois dados para chegar a 
conclusões. 
 
 
 
 
Agora vou fazer para a variável “W”, que também não é pedido no exercício. 
 
 
 
Assim: 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 109/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
80
1 1 182,5 2, 2813
80 80
n
i i
i i
W W
W W W W
n
= = −= ⇔ = ⇔ = ⇔ = −
� �
 
 
 
( )
40 41 1,7 1,6 1,65
2 2prof M
w w
M w M M M
+ − −
= ⇔ = ⇔ = ⇔ = −
 
 
 
 
Variância: 
 
( )
2
22 2 2
1 1
1 1 1 1
5 778, 23 182,5
1 80 1 80
n n
W i i W
i i
s W W s
n n= =
� �� � � �= − ⇔ = − −� �
 � � �− − � �� �� �� �
� �
 
 
( )2 2 21 1 15 778, 23 .33 306,25 5 361,9 67,87
79 80 79W W W
s s s� �⇔ = − ⇔ = ⇔ =� �� �
 
 
Desvio Padrão:
2 67,87 8,24W W W Ws s s s= ⇔ = ⇔ = 
 
 
 
Quartis: 
( )
20 21 5,6 4,7 5,15
2 2L L L Lprof F
w w
F w F F F
+ − −
= ⇔ = ⇔ = ⇔ = −
( )
' '
' 20 21 1,9 1,8 1,85
2 2U U U Uprof F
w w
F w F F F
+ +
= ⇔ = ⇔ = ⇔ =
 
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 1,85 5,15 7U LdF F F= − = + = . 
 
Barreiras de Outliers Inferior - X X 1,5 5,15 1,5 7 15,65LF dF = −− = − − 
Barreiras de Outliers Superior - X X 1,5 1,85 1,5 7 12,35UF dF =+ = + 
 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (12,35): 4 (13,3 ; 14,7 ; 15,2 ; 19,6) 
Dados inferior a barreira inferior (-15,65): 4 (-32,9 ; -22,7 ; -18,7 ; -17,0) 
Vou verificar se existem Outliers Severos: 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 110/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Barreiras de Outliers Severo Superior - X X 3 1,85 3 7 38,85UF dF+ = + = 
Barreiras de Outliers Severo Inferior - X X 3 5,15 3 7 26,15UF dF− = − + = − 
 
Dados superior a barreira superior (38,85): 0 
Dados superior a barreira superior (-26,15): -32,9. Ou seja, existem 1 Outliers 
Severos Inferior. 
 
 
Resolução b) - Diagrama Caixa com Bigodes: 
 
 
 
 
Este diagrama com bigodes tem algumas particularidades: 
 
 1º o dado máximo não é o 19,6, mas sim o dado 11,3, pois é o dado 
imediatamente abaixo do Outlier moderado (13,3). 
 
2º o dado mínimo não é o -32,9, mas sim o dado -15,6, pois é o dado 
imediatamente abaixo do Outlier moderado (-17,0). 
 
 3º a representação dos dados Outliers Moderados é feita com uma cruz (aqui 
a verde, mas a cor não interessa, é só para ajudar a visualizar melhor). 
 
 
 
Não é pedido, para por uma questão de praticar exercícios vou fazer Caixa com 5 
letras resumo (note se que o tempo é negativo por ser uma diferença): 
 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números -15,6 e -5,15, 
assim como os últimos 25% estão compreendidos entre os 1,85 e 11,3. 
As dispersões acontecem mais a direita. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 111/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Tem 8 Outliers Moderados (a esquerda: -32,9 ; -22,7 ; -18,9 ; -17,0 e a direita: 
13,3 ; 14,7 ; 15,2 ; 19,6). 
A Media e o Desvio Padrão (medidas de localização) são eficiente, mas pouco 
resistentes (sensíveis aos outliers), pois se não considerássemos os outliers, o valor 
da Media seria mais correcto e com um valor mais baixo. 
A Mediana e a dispersão Quartal (são medidas de dispersão), são resistentes, mas 
menos eficiente (dão nos pouca informação). 
Nota: o número máximo e mínimo são pouco informativos sobre a amostra global 
(nada eficiente), por isso não se devem de utilizar estes dois dados para chegar a 
conclusões. 
 
 
 
 
 
 
 
 
Grupo II 
 
a) Construa um histograma apropriado para representar x. 
b) Determine a recta dos mínimos quadrados que exprime y como função de x. Face à 
correlação entre aquelas variáveis o ajustamento será bom? 
 
 
 
Resolução GII - a) Construção de Histogramas/Barras - Regra de Sturges. 
 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
 
( ) ( )
( )2
ln 80
log 80 1 1.
ln 2
N N
� �
= + ⇔ = +� � � �� �
� �
 
Assim, ( )2log 80 1 = 7N≈ +� �� � 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
: : 48,3 23,3* * * 3,57
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ = 
 
Logo posso considerar h = 3,6. 
 
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é 
dado por: ( ) ( ): : .n n l nXN h x xε = − − 
 
Assim ( ) ( ) 7 3,6 48,3 23,3 0,2Xε ε= − − ⇔ = , e como o inicio da classe é: 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 112/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
:
0, 2
23,3 23,2
2 2l n
x
ε
− = − = . 
 
 
Assim as classes a considerar são: 
 
] ] ] ] ] ] ] ]23,2 ; 26,8 , 26,8 ; 30,4 , 30,4 ; 34,0 , 34,0 ; 37,6 , 
 
] ] ] ] ] ] 37,6 ; 41,2 , 41,2 ; 44,8 e 44,8 ; 48,4 . 
 
 
Classe ix in iN if iF 
 
 ] ]23,2 ; 26,8 41 41 0,51 0,51 
 ] ] 26,8 ; 30,4 19 60 0,24 0,75 
 ] ] 30,4 ; 34,0 10 70 0,13 0,88 
 ] ] 34,0 ; 37,6 2 72 0,03 0,9 
 ] ] 37,6 ; 41,2 4 76 0,05 0,95 
 ] ] 41,2 ; 44,8 1 77 0,01 0,96 
 ] ] 44,8 ; 48,4 3 80 0,04 1 
 n = 80 
 
 
 
 
Histograma do “X” 
 
Tem uma assimetria direita prenunciada (evidente, e basta analisar os Outliers). 
Assim não é de esperar que os dados analisados não sejam Gausianos (ou seja, 
estes dados não foram dados numa distribuição Gausianos), e que não faz sentido 
usar a regra do desvio padrão para a elaboração do gráfico. Usa se por isso a regra 
de Struges. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 113/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou fazer para a variável “y”, que não é pedido no exercício. 
 
Resolução GII - a) Construção de Histogramas/Barras - Regra de Sturges 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
 
( ) ( )
( )
( )2 2
ln 80
log 80 1 1 log 80 1 = 7
ln 2
N N N
� �
= + ⇔ = + ⇔ ≈ +� � � �� �� � � �
� �
 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
: 1: 58,7 24, 4* * * 4,9
7
n n nx xh h h
N
− −
= ⇔ = ⇔ =
 
 
 
Logo posso considerar h = 5. 
 
O limite inferior da primeira classe deverá ser 1: ,2n
x
ε
− em que ε é o excesso, e é 
dado por: ( ) ( ): 1: .n n nXN h x xε = − − 
 
 
Assim ( ) ( ) 7 5 58,7 24,4 0,7Xε ε= − − ⇔ = , e como o inicio da classe é: 
 
1:
0,7
24, 4 24,1
2 2n
x
ε
− = − = . 
 
 
Assim as classes a considerar são: 
 
] ] ] ] ] ] ] ]24,1 ; 29,1 , 29,1 ; 34,1 , 34,1 ; 39,1 , 39,1 ; 44,1 , 
 
] ] ] ] ] ] 44,1 ; 49,1 , 49,1 ; 54,1 e 54,1 ; 59,1 . 
 
 
Classe ix in iN if iF 
 
 ] ]24,1 ; 29,1 39 39 0,49 0,49 
 ] ] 29,1 ; 34,1 21 60 0,26 0,75 
 ] ] 34,1 ; 39,1 11 71 0,14 0,89 
 ] ] 39,1 ; 44,1 5 76 0,06 0,95 
 ] ] 44,1 ; 49,1 2 78 0,03 0,98 
 ] ] 49,1 ; 54,1 1 79 0,01 0,99 
 ] ] 54,1 ; 59,1 1 80 0,01 1 
 n = 80 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 114/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
Histograma do “Y” 
 
 
 
Tem uma assimetria direita prenunciada (evidente, e basta analisar os Outliers). 
Assim não é de esperar que os dados analisados sejam Gausianos (ou seja, estes 
dados não foram dados numa distribuição Gausianos), e que não faz sentido usar a 
regra do desvio padrão para a elaboração do gráfico. Usa se por isso a regra de 
Struges. 
 
 
 
 
Agora vou fazer para a variável “w”, que também não é pedido no exercício. 
 
Resolução GII - a) Construção de Histogramas/Barras - Regra de Sturges 
 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
 
( ) ( )
( )2
ln 80
log 80 1 1.
ln 2
N N
� �
= + ⇔ = +� � � �� �
� � 
 
Assim, ( )2log 80 1 = 7N ≈ +� �� � 
 
 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
: 1: 32,9 19,6* * * 7,5
7
n n nx xh h h
N
− − −
= ⇔ = ⇔ =
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 115/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Logo posso considerar h = 8. 
 
O limite inferior da primeira classe deverá ser 1: ,2n
x
ε
− em que ε é o excesso, e é 
dado por: ( ) ( ): 1: .n n nXN h x xε = − − 
 
 
Assim ( ) ( ) 7 8 32,9 19,6 3,5Xε ε= − − − ⇔ = , e como o inicio da classe é: 
 
1:
3,5
32,9 34,6
2 2n
x
ε
− = − − = − . 
 
 
Assim as classes a considerar são: 
 
] ] ] ] ] ] ] ]34,6 ; -26,6 , 26,6 ; 18,6 , 18,6 ; -10,6 , -10,6 ; 2,6 , − − − − − 
 
] ] ] ] ] ] 2,6 ; 5, 4 , 5,4 ; 13,4 e 13,4 ; 21,4 − . 
 
 
Classe ix in iN if iF 
 
 ] ]34,6 ; -26,6− 1 1 0,01 0,01 
 ] ] 26,6 ; 18,6 − − 2 3 0,03 0,04 
 ] ] 18,6 ; -10,6 − 10 13 0,13 0,16 
 ] ] -10,6 ; 2,6 − 25 38 0,31 0,48 
 ] ] 2,6 ; 5, 4 − 33 71 0,41 0,89 
 ] ] 5, 4 ; 13,4 6 77 0,08 0,96 
 ] ] 13,4 ; 21,4 3 80 0,04 1 
 n = 80 
 
 
 
Histograma do “W”. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 116/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Tem uma assimetria a direita e a esquerda (tem Outliers de ambos os lados). Assim 
não é de esperar que os dados analisados sejam Gausianos (ou seja, estes dados não 
foram dados numa distribuição Gausianos), e que não faz sentido usar a regra do 
desvio padrão para a elaboração do gráfico. Usa se por isso a regra de Struges. 
 
 
 
Resolução GII - b) recordar os valores dados: 
 
80 80
2
1 1
2 301,4 68 634,72i i
i i
X X
= =
= ∧ =� � 
 
80 80
2
1 1
2 483,9 80 566,37i i
i i
Y Y
= =
= ∧ =� � 
80
1
71 711,43i i
i
X Y
=
=� 
 
 
Assim o que é pedido, é se é possível prever “Y” a partir de “X”, através da relação linear. 
 
� �Y aX b= + 
 
 
 
 
Vou recordar teoria - Coeficiente de Correlação Linear: O coeficiente de correlação linear é 
uma medida do grau de associação entre variáveis. Esta medida toma valores entre -1 e 1. 
Quando se mede a correlação entre variáveis, 1 significa uma relação linear perfeita e positiva, 
enquanto -1 é também uma relação linear perfeita mas negativa. Valores próximos do zero 
para o coeficiente de correlação linear indicam uma associação linear pobre entre variáveis. 
O coeficiente de correlação amostraI de Pearson r da amostra bivariada ( ){ }
1
;
n
i i i
x y
=
 é: 
 
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
 � 
 �
� � � �� � � �� � � �
� � �
� � � �
 
 
 
 
 
Teorema Recta dos Mínimos Quadrados (RMQ): Se os pontos da amostra bivariada 
( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a recta dos mínimos quadrados que modela essa 
relação é � �Y aX b= + , com: 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 117/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
 
Assim no exercício faz-se: 
 
( ) ( )( )
( ) ( )2
80. 71 711,43 2 301, 4 . 2 483,9
0,10531748
80. 68 634,72 2 301, 4
a a
−
= ⇔ =
−
 
 
 
( ) ( ) ( ) ( )
( ) ( )2
68 634,72 . 22 860 2 483,9 . 71 711,43
28,0190293
80. 68 634,72 2 301, 4
b b
−
= ⇔ =
−
 
 
� � ( ) ( )0,10531748 28,0190293Y aX b Y X= + ⇔ = + 
 
Vou então verificar a correlação linear: 
80 80 80
1 1 1 1 1 1
2 2 2 280 80 80 80
2 2 2 2
1 1 1 1 1 1 1 1
80
80 80
n n n
i i i i i i i i
i i i i i i
n n n n
i i i i i i i i
i i i i i i i i
n X Y X Y X Y X Y
r r
n X X n Y Y X X Y Y
= = = = = =
= = = = = = = =
− −
= ⇔ =
� � � � � � � �� � � � � � � �
− − − −� � � � � � � �
 � 
 � 
 � 
 �
� � � � � � � �� � � � � � � �� � � � � � � �
� � � � � �
� � � � � � � �
 
 
 
 
( ) ( ) ( )
( ) ( ) ( ) ( )2 2
80. 71 711,43 2 301,4 . 2 483,9
80. 68 634,72 2 301,4 80. 80 566,37 2 483,9
r
−
=
� � � �− −
� � � �
 
 
( )( )
5 736 914, 4 5 716 447,46
194 335,64 275 550,39
r
−
= 
 
 
0,08844558r = 
 
 
Tendo obtido um 0,08844558r = , posso concluir que não existe uma correlação entre as 
variáveis, pois o seu coeficiente está muito próximo do zero (o ajustamento não é bom).
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 118/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Frequência: 2000/01/26 
 
 
Responda a 5 das seguintes 6 perguntas: 
 
Exercício 1 - Num estudo sobre o dimensionamento de urgências hospitalares registou-se o 
tempo X durante o qual 80 doentes, escolhidos ao acaso (isto é, amostragem aleatória simples 
sem reposição) estiveram na sala de cuidados intensivos (tempo medido em horas). Por outro 
lado registou-se também o preço Y que cada um desses doentes custou ao orçamento 
hospitalar. Para sua comodidade, a amostra X está já ordenada, e sabe-se que: 
 
80 80
2
1 1
73,66 88,146i i
i i
X X
= =
= ∧ =� � 
 
80 80
2
1 1
1 475,72 27 367,7456i i
i i
Y Y
= =
= ∧ =� � 
 
80
1
1 406,6846i i
i
X Y
=
=�
 
 
X Y X Y X Y X Y 
0,43 18,44 0,57 17,95 0,76 17,74 1,09 18,16 
0,43 18,44 0,58 17,94 0,78 17,74 1,12 18,23 
0,45 18,34 0,60 17,88 0,78 17,74 1,17 18,36 
0,46 18,30 0,60 17,89 0,81 17,75 1,18 18,38 
0,47 18,28 0,60 17,88 0,82 17,75 1,18 18,39 
0,47 18,27 0,61 17,87 0,88 17,80 1,19 18,42 
0,47 18,28 0,62 17,84 0,88 17,80 1,28 18,66 
0,48 18,24 0,62 17,85 0,88 17,81 1,35 18,89 
0,49 18,18 0,62 17,85 0,89 17,81 1,39 19,02 
0,50 18,16 0,64 17,82 0,90 17,83 1,44 19,20 
0,50 18,14 0,65 17,81 0,92 17,85 1,48 19,32 
0,51 18,12 0,65 17,80 0,94 17,88 1,60 19,75 
0,51 18,14 0,69 17,77 0,95 17,89 1,61 19,78 
0,52 18,08 0,70 17,76 0,96 17,91 1,64 19,88 
0,53 18,04 0,72 17,75 0,99 17,96 1,65 19,94 
0,54 18,03 0,73 17,75 1,01 17,99 1,78 20,42 
0,55 18,00 0,73 17,74 1,03 18,04 1,95 21,11 
0,55 18,00 0,74 17,74 1,07 18,11 2,18 22,06 
0,56 17,97 0,74 17,74 1,08 18,14 2,52 23,46 
0,56 17,96 0,75 17,74 1,08 18,14 3,31 26,83 
 
 
a) Determine a média e o desvio-padrão, mediana e dispersão quartal da amostra ~. 
b) Represente a caixa com bigodes correspondente à referida amostra. 
c) Construa um histograma apropriado para representar a amostra. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 119/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução a) - vou arrumar pela mesma variável: 
 
 
 
 
80
1 1 73,66 0,92075
80 80
n
i i
i i
X X
X X X X
n
= == ⇔ = ⇔ = ⇔ =
� �
 
 
Variância: 
 
( )
2
22 2 2
1 1
1 1 1 1
88,146 73,66
1 80 1 80
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
 � � �− − � �� �� �� �
� �
 
 
2 0, 2572601899Xs =
 
 
Desvio Padrão: 
 
2 0,2572601899 0,507208313X X X Xs s s s= ⇔ = ⇔ = 
 
 
( ) 1Média Prof 40,5
2
n
M
+
→ = =
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 120/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
( )
40 41 0,75 0,76 0,755
2 2prof M
x x
M x M M M
+ +
= ⇔ = ⇔ = ⇔ =
 
 
 
 
( )
( )Prof 1
Quartis Prof 20,5
2
M
Q
+� �� �→ = =
 
 
( )
20 21 0,56 0,57 0,565
2 2L L L Lprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
 
( )
' '
' 20 21 1,09 1,08 1,085
2 2U U U Uprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
 
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 1,085 0,565 0,52U LdF F F= − = − = . 
 
Barreiras de Outliers Inferior - X X 1,5 0,565 1,5 0,52 0,215LF dF = − = −− 
Barreiras de Outliers Superior - X X 1,5 1,085 1,5 0,52 1,865UF dF = + =+ 
 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (1,865): 4 (1,95 ; 2,18 ; 2,52 ; 3,31) 
Dados inferior a barreira inferior (-0,215): 0 
 
 
Vou verificar se existem Outliers Severos (só vou a procura do lado direito): 
 
Barreiras de Outliers Severo Superior - X X 3 1,085 3 0,52 2,645UF dF = + =+ 
Dados superior a barreira superior (2,645): 3,31. Ou seja, existem 1 Outliers 
Severos. 
 
 
Resolução b) - Diagrama Caixa com Bigodes: 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 121/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Este diagrama com bigodes tem algumas particularidades: 
 
 1º o dado máximo não é o 3,31, mas sim o dado 1,78, pois é o dado 
imediatamente abaixo do Outlier moderado (1,95). 
 
 2º a representação dos dados Outliers Moderados é feita com uma cruz (aqui 
a verde, mas a cor não interessa, é só para ajudar a visualizar melhor). 
 
 3º a representação dos dados Outliers Severo é feita com um circulo (aqui a 
vermelho, mas a cor não interessa, é só para ajudar a visualizar melhor). 
 
 
 
Caixa com 5 letras resumo: 
 
 
 
 
 
Conclusão: os primeiros 25% estão compreendidos entre os números 0,43 e 0,565, 
assim como os últimos 25% estão compreendidos entre os 1,085 e 1,78. 
As dispersões acontecem mais a direita. 
Tem 3 Outliers Moderados (1,95 ; 2,18 ; 2,52) e 1 Severos (3,31). 
 
A Media e o Desvio Padrão (medidas de localização) são eficiente, mas pouco 
resistentes (sensíveis aos outliers), pois se não considerássemos os outliers, o valor 
da Media seria mais correcto e com um valor mais baixo. 
 
A Mediana e a dispersão Quartal (são medidas de dispersão), são resistentes, mas 
menos eficiente (dão nos pouca informação). 
 
Nota: o número máximo e mínimo são pouco informativos sobre a amostra global 
(nada eficiente), por isso não se devem de utilizar estes dois dados para chegar a 
conclusões. 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 122/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução c) - Construção de Histogramas/Barras (Regra de Sturges): 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
 
( ) ( )
( )2
ln 80
log 80 1 1.
ln 2
N N
� �
= + ⇔ = +� � � �� �
� �
 
Assim, ( )2log 80 1 = 7N ≈ +� �� � 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
: : 3,31 0,43* * * 0,4114
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ = 
 
Logo posso considerar h = 0,42. 
 
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é 
dado por: ( ) ( ): : .n n l nXN h x xε = − − 
 
Assim ( ) ( ) 7 0,42 3,31 0,43 0,06Xε ε= − − ⇔ = , e como o inicio da classe é: 
 
:
0,06
0, 43 0, 4
2 2ln
x
ε
− = − = . 
 
 
Assim as classes a considerar são: 
 
] ] ] ] ] ] ] ]0,40 ; 0,82 , 0,82 ; 1, 24 , 1, 24 ; 1,66 , 1,66 ; 2,08 , 
 
] ] ] ] ] ] 2,08 ; 2,50 , 2,50 ; 2,92 e 2,92 ; 3,34 . 
 
 
Classe ix in iN if iF 
 
(1) ] ]0,40 ; 0,82 44 44 0,55 0,55 
(2) ] ] 0,82 ; 1,24 22 66 0,28 0,83 
(3) ] ] 1,24 ; 1,66 9 75 0,11 0,94 
(4) ] ] 1,66 ; 2,08 2 77 0,03 0,96 
(5) ] ] 2,08 ; 2,50 1 78 0,01 0,98 
(6) ] ] 2,50 ; 2,92 1 79 0,01 0,99 
(7) ] ] 2,92 ; 3,34 1 80 0,01 1 
 n = 80 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 123/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
Histograma do “X” 
 
Tem uma assimetria direita prenunciada (evidente, e basta analisar os Outliers). 
Assim não é de esperar que os dados analisados não sejam Gausianos (ou seja, 
estes dados não foram dados numa distribuição Gausianos), e que não faz sentido 
usar a regra do desvio padrão para a elaboração do gráfico. Usa se por isso a regra 
de Struges. 
 
 
 
 
 
 
 
 
 
Resolução a) - Não é pedido, mas vou fazer também para o “Y”: 
 
80
1 1 1475,72 18,4465
80 80
n
i i
i i
Y Y
Y Y Y Y
n
= == ⇔ = ⇔ = ⇔ =
� �
 
 
Variância: 
 
( )
2
22 2 2
1 1
1 1 1 1
27367,7456 1475,72
1 80 1 80
n n
Y i i X
i i
s Y Y s
n n= =
� �� � � �= − ⇔ = −� �
 � � �− − � �� �� �� �
� �
 
 
2 1,8465394Ys =
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 124/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Desvio Padrão: 
 
2 1,8465394 1,3588743Y Y Y Ys s s s= ⇔ = ⇔ = 
 
 
Cuidado, pois a tabela do “Y” não está ordenada!! 
 
 
 
 
( ) 1Média Prof 40,5
2
n
M
+
→ = =
 
 
( )
40 41 18,00 18,03 18,015
2 2prof M
x x
M x M M M
+ +
= ⇔ = ⇔ = ⇔ =
 
 
 
( )
( )Prof 1
Quartis Prof 20,5
2
M
Q
+� �� �→ = =
 
 
( )
20 21 17,82 17,83 17,825
2 2L L L Lprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
 
 
( )
' '
' 20 21 18,36 18,34 18,35
2 2U U U Uprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 18,35 17,825 0,525U LdF F F= − = − = . 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 125/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Barreiras de Outliers Inferior - X X 1,5 17,825 1,5 0,525 17,0375LF dF = − =− 
Barreiras de Outliers Superior - X X 1,5 18,35 1,5 0,525 19,1375UF dF = + =+ 
 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (19,1375): 12 (19,02 ; 19,20 ; 19,32 ; 19,75 ; 
19,78 ; 19,88 ; 19,94 ; 20,42 ; 21,11 ; 22,06 ; 23,46 ; 26,83) 
Dados inferior a barreira inferior (17,0375): 0 
 
 
Vou verificar se existem Outliers Severos (só vou a procura do lado direito): 
 
Barreiras de Outliers Severo Superior - X X 3 18,35 3 0,525 19,925UF dF = + =+ 
Dados superior a barreira superior (19,925): 6 (19,94 ; 20,42 ; 21,11 ; 22,06 ; 
23,46 ; 26,83). Ou seja, existem 6 Outliers Severos. 
 
 
Resolução b) - Diagrama Caixa com Bigodes: 
 
 
 
Este diagrama com bigodes tem algumas particularidades: 
 1º o dado máximo não é o 26,83, mas sim o dado 19,02, pois é o dado 
imediatamente abaixo do Outlier moderado (19,2). 
 2º a representação dos dados Outliers Moderados é feita com uma cruz (aqui 
a verde, mas a cor não interessa, é só para ajudar a visualizar melhor). 
 3º a representação dos dados Outliers Severo é feita com um circulo (aqui a 
vermelho, mas a cor não interessa, é só para ajudar a visualizar melhor). 
 
 
Caixa com 5 letras resumo: 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 126/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Conclusão: os primeiros 25% estão compreendidos entre os números 17,74 e 
17,825, assim como os últimos 25% estão compreendidos entre os 18,35 e 19,02. 
As dispersões acontecem mais a direita. 
Tem 5 Outliers Moderados (19,2 ; 19,32 ; 19,75 ; 19,78 ; 19,88) e 6 Severos (19,94 
; 20,42 ; 21,11 ; 22,06 ; 23,46 ; 26,83). 
 
A Media e o Desvio Padrão (medidas de localização) são eficiente, mas pouco 
resistentes (sensíveis aos outliers), pois se não considerássemos os outliers, o valor 
da Media seria mais correcto e com um valor mais baixo. 
A Mediana e a dispersão Quartal (são medidas de dispersão), são resistentes, mas 
menos eficiente (dão nos pouca informação). 
 
Nota: o número máximo e mínimo são pouco informativos sobre a amostra global 
(nada eficiente), por isso não se devem de utilizar estes dois dados para chegar a 
conclusões. 
 
 
 
Resolução c) - Construção de Histogramas/Barras (Regra de Sturges): 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
 
( ) ( )
( )2
ln 80
log 80 1 1.
ln 2
N N
� �
= + ⇔ = +� � � �� �
� �
 
Assim, ( )2log 80 1 = 7N ≈ +� �� � 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por: 
 
: : 26,83 17,74* * * 1,298571429
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ = 
 
Logo posso considerar h = 1,3. 
 
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é 
dado por: ( ) ( ): : .n n l nXN h x xε = − − 
 
Assim ( ) ( ) 7 1,3 26,83 17,74 0,01Xε ε= − − ⇔ = , e como o inicio da classe é: 
:
0,01
17,74 17,735
2 2l n
x
ε
− = − = . 
 
 
Assim as classes a considerar são: 
 
] ] ] ] ] ] ] ]17,735 ; 19,035 , 19,035 ; 20,335 , 20,335 ; 21,635 , 21,635 ; 22,935 , 
] ] ] ] ] ] 22,935 ; 24,235 , 24,235 ; 25,535 e 25,535 ; 26,835 . 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 127/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Classe ix in iN if iF 
 
(1) ] ]17,735 ; 19,035 69 69 0,86 0,86 
(2) ] ] 19,035 ; 20,335 6 75 0,08 0,94 
(3) ] ] 20,335 ; 21,635 2 77 0,03 0,96 
(4) ] ] 21,635 ; 22,935 1 78 0,01 0,98 
(5) ] ] 22,935 ; 24,235 1 79 0,01 0,99 
(6) ] ] 24,235 ; 25,535 0 79 0 0,99 
(7) ] ] 25,535 ; 26,835 1 80 0,01 1 
 n = 80 
 
 
 
Histograma do “Y” 
 
Tem uma assimetria direita prenunciada (evidente, e basta analisar os Outliers). 
Assim não é de esperar que os dados analisados não sejam Gausianos (ou seja, 
estes dados não foram dados numa distribuição Gausianos), e que não faz sentido 
usar a regra do desvio padrão para a elaboração do gráfico. Usa se por isso a regra 
de Struges. 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 128/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Exercício 2 - Use os dados do exercício anterior. 
a) Determine o coeficiente de correlação do par (x y). 
b) Determine a recta dos mínimos quadrados que se ajusta àquela nuvem de pontos. 
c) O ajustamento linear parece-lhe aceitável? 
 
Como investigaria de forma mais objectiva se a recta dos mínimos quadrados é ou não 
adequada a este conjunto de pares de observações? 
 
 
Resolução a) - recordar os valores dados: 
 
80 80
2
1 1
73,66 88,146i i
i i
X X
= =
= ∧ =� � 
80 80
2
1 1
1475,72 27 367,7456i i
i i
Y Y
= =
= ∧ =� � 
80
1
1 406,6846i i
i
X Y
=
=�
 
 
Assim o que é pedido, é se é possível prever “Y” a partir de “X”, através da relação linear. 
 
�Y aX b= + 
 
 
 
Vou recordar teoria - Coeficiente de Correlação Linear: O coeficiente de correlação linear é 
uma medida do grau de associação entre variáveis. Esta medida toma valores entre -1 e 1. 
Quando se mede a correlação entre variáveis, 1 significa uma relação linear perfeita e positiva, 
enquanto -1 é também uma relação linear perfeita mas negativa. Valores próximos do zero 
para o coeficiente de correlação linear indicam uma associação linear pobre entre variáveis. 
O coeficiente de correlação amostral de Pearson r da amostra bivariada ( ){ }
1
;
n
i i i
x y
=
 é: 
 
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
 � 
 �
� � � �� � � �� � � �
� � �
� � � �
 
Assim: 
 
80 80 80
1 1 1
2 280 80 80 80
2 2
1 1 1 1
80
80 80
i i i i
i i i
i i i i
i i i i
X Y X Y
r
X X Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
 � 
 �
� � � �� � � �� � � �
� � �
� � � �
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 129/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
( ) ( )( )
( ) ( ) ( ) ( )2 2
80 1 406,6846 73,66 1 475,72
80 88,146 73,66 80 27 367,7456 1 475,72
r
−
=
� � � �− −
� � � �
 
 
 
0,87999969r = 
 
 
Tendo obtido um 0,87999969r = , posso concluir que ajustamento é razoável, uma vez que o 
coeficiente de correlação é relativamente próximo de 1 
 
 
 
 
Resolução b) - Teorema Recta dos Mínimos Quadrados (RMQ): Se os pontos da amostra 
bivariada ( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a recta dos mínimos quadrados que modela 
essa relação é � �Y aX b= + , com: 
 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
Observação: Para calcular o coeficiente de correlação e a recta dos mínimos quadrados, basta 
dispor em colunas 
 
Abcissas Ordenadas 
Quadrados 
das abcissas 
Quadrados das 
ordenadas 
Abcissas X 
Ordenadas 
ix iy 
2
ix 
2
iy i ix y 
 
e no fim somar. 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 130/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
 
Vou recordar os somatórios dados: 
 
80 80
2
1 1
73,66 88,146i i
i i
X X
= =
= ∧ =� � 
80 80
2
1 1
1 475,72 27 367,7456i i
i i
Y Y
= =
= ∧ =� � 
80
1
1 406,6846i i
i
X Y
=
=� 
Assim no exercício faz-se: 
 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
( ) ( ) ( )
( ) ( )2
80. 1 406,6846 73,66 . 1 475,72
2,35762936
80. 88,146 73,66
a a
−
= ⇔ =
−
 
 
( ) ( ) ( ) ( )
( ) ( )2
88,146 . 1 475,72 73,66 . 1 406,6846
16,2757127
80. 88,146 73,66
b b
−
= ⇔ =
−
 
 
� � ( ) ( )2,35762936 16,2757127Y aX b Y X= + ⇔ = + 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 131/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
c) O ajustamento é razoável, uma vez que o coeficiente de correlação é relativamente 
próximo de 1. Também se poderia ter ido pelo estudo dos resíduos. 
 
 
Poderia estudar os resíduos quadráticos, pois é a partir deles que se define a regra dos 
mínimos quadrados (RMQ). 
 
Breve explicação sobre os resíduos - o resíduo de ordem iε representa a diferença entre o da 
variável dependente e cada valor previsto pelo modelo de variável dependente: 
 
�
�
valor observado valor previsto
i iy y−
 
 
 
Ou seja, os resíduos são definidos através da diferença entre cada valor iy (i-ésimo valor 
observado da variável dependente) e 
 iy (i-ésimo valor esperado, pelo modelo 

 ( )y f x= , da 
variável dependente). 
Assim, para cada { }1,...,i n∈ , o resíduo de ordem i é dado por 
i iy y− , isto é, 
i i iy yε = − . 
 
O modelo adoptado é considerado bom se os resíduos iε forem desprezáveis, isto é, 0iε � . 
Os resíduos devem flutuar moderadamente em torno de zero, sem padrão definido. 
 
 
 
Ou seja veja se graficamente (com desenhos a cores!): 
 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 132/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
Aqui, as rectas a vermelho, são as distanciam a que os dados estão da recta. 
 
O ideal seria ter os pontos sobre a recta (aqui a verde): 
 
 
 
 
 
Assim sendo a essa distancia é designada por resíduo ( )ε . 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 133/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
i iiy y ε= + , em que iε é o resíduo. Assim 
i i iy yε = − 
 
iε é positivo, pois esta acima da recta. O ideal seria 0iε = . Se os valores de iε forem muito 
alto, o modelo da recta não é o mais indicado. Para contornar este problema, utiliza se o RMQ, 
que tem por finalidade a de minimizar o erro. 
 
Representa se a soma de TODOS os erros por .δ 
 
Assim 2 2 2 2 21 2 3 4 ... nδ ε ε ε ε ε= + + + + + 
 
Se 1nε + aumentar gradualmente, isto significa que a recta não é a ideal, deverá ser corrigida. 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 134/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Frequência: 2000/07/10 
Exame de recurso 
 
 
Duração: 3 horas. 
 
Responda às perguntas 3 e 5 e a mais três à sua escolha. 
 
1 - Num estudo feito com rãs, registou-se a voltagem necessária para provocar a morte de cada 
animal, obtendo os seguintes dados: 
 
 
129 216 112 161 273 173 116 81 208 205 
208 157 239 164 90 127 129 206 145 142 
138 203 147 206 177 151 226 174 181 89 
140 95 78 191 212 140 102 150 131 180 
153 131 185 181 125 263 221 157 215 177 
136 203 100 208 79 106 189 79 162 249 
182 146 158 126 177 142 191 200 212 156 
 
155 
 
74 
 
227 
 
188 
 
185 
 
 
A Soma dos dados é 12 230, e a Soma dos seus Quadrados é 2 153 792. 
Não confundir a Soma dos Quadrados: 
2
1
n
i
i
X
=
� e o Quadrado das somas é 
2
1
n
i
i
X
=
� �

 �
� �
� . 
 
 
1.1. Organize os dados em diagrama de caule e folhas. e calcule as medidas de localização e 
dispersão mais usuais. 
 
1.2. É preferível usar (média. desvio padrão) ou (mediana, dispersão quartal)? 
 
1.3. No modelo Gaussiano, que relação existe entre o desvio padrão e a dispersão quartal? 
 
1.4. Construa um histograma apropriado para representar aqueles dados. 
 
1.5. Desenhe também a caixa com bigodes correspondente aos dados. 
 
1.6. Com base nesta caixa com bigodes.que pode inferir sobre o modelo subjacente aos 
dados? 
 
 
 
Resolução 1.1 – recordar: 
Medidas de localização mais usuais: mediana ( )X e média ( )M . 
Medidas de dispersão mais usuais: dF e desvio padrão (s). 
 
(Na pergunta 1.2 já está indicado quais é que o prof considera os mais usuais!) 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 135/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 2
1
75; x 10
2
n = 
 
 
 
Arrumado: 
74 100 129 142 155 173 182 203 212 249 
78 102 129 142 156 174 185 203 212 263 
79 106 131 145 157 177 185 205 215 273 
79 112 131 146 157 177 188 206 216 
 81 116 136 147 158 177 189 206 221 
 89 125 138 150 161 180 191 208 226 
 90 126 140 151 162 181 191 208 227 
 95 127 140 153 164 181 200 208 239 
 
 
Mínimo Máximo Mediana M 
74 273 163,07 161 
 
1 163,07
n
i
i
X
X
n
== =
�
 
 
[ ] 1Prof 38
2
n
M
+
= =
 
 e [ ]
[ ]Prof 1
Prof 19,5
2
M
F
� � +� �= = 
 
 
[ ]
19 20
Prof 1312L F
x x
F x
+
= = = e [ ]
' 19 20
Prof
' '
201,5
2U F
x x
F x
+
= = = 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 70,5U LdF F F= − = . 
 
Barreiras de Outliers Inferior - X X 1,5 131 1,5 70,5 25, 25LF dF = =− − 
Barreiras de Outliers Superior - X X 1,5 201,5 1,5 70,5 307,25UF dF = + =+ 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (307,25): 0. 
Dados inferior a barreira inferior (25,25): 0. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 136/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Variância: 
 
( )
2
22 2 2
1 1
1 1 1 1
2 153 792 12 230
1 75 1 75
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
 � � �− − � �� �� �� �
� �
 
 
( )2 21 159 486,67 2 155, 23
74X X
s s⇔ = ⇔ =
 
 
Desvio Padrão:
2 2 155,23X X Xs s s= ⇔ = ⇔ 
46, 42 46X Xs s⇔ = ⇔ ≈ 
 
 
 
 
 
 
 
 
Resolução 1.2 – o que se pretende é saber qual é que é a mais credível para esta amostra. 
 
X e s são sensíveis a Outlier, sendo adequado a distribuições simétricas (comportam se bem, 
os valores obtidos são de confiança). 
A média ( )M e a dispersão Quartal (dF) são mais resistentes aos Outliers, portanto são 
aconselháveis para a distribuição assimétricas. 
Ou seja o que se pretende é saber se a amostra é simétrica. Na pergunta 1.3 irei fazer essa 
demonstração. 
 
 
Resoluções 1.3 – na distribuição normal (Gaussiana), a média e a mediana são iguais. 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 137/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Posso concluir que L UM s F M s F− < ∧ + > . 
 
Se multiplicar por -1: 
 
0 2
 2
L
U
U L
M s F
M s F
s F F
s dF
− + > −
+ >
+ > −
>
 
 
Como 2s dF> , não existem outliers, a média e a mediana são praticamente iguais, e os dados 
aparentam ser simétricos, então existem razões validas para deduzir que esta amostra tenha 
sido extraída de uma população normal (distribuição é normal). 
 
 
 
 
Recordar: 
 
 
 
Vou extrair amostras que me permitem concluir algo sobre a população: 
 
 
 
Os gráficos e os diagramas que se elabora ajudam a interpretarem se os dados extraídos são 
verdadeiramente representativos da população. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 138/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resoluções 1.4 – agora vou construir o histograma “apropriado”. Aqui, na pergunta, está uma 
ratoeira, pois a tendência é usar a regra de Sturges, mas aqui não! Pois quando sei de antemão 
de que se trata de uma distribuição normal (conclusão a que cheguei ao resolver a questão 1.1, 
1.2 e 1.3) vou pelo processo do desvio padrão. Ou seja, sei pelo diagrama de caule e folhas 
que nada de anormal se passa, sei que não tem outliers, e é simétrico. São pistas que me 
permite utilizar este processo.Vou então criar as classes, e começo pela classe central, pois é 
regra quando se utiliza o processo do desvio padrão: 
 
Ora a minha classe central é me dado pela equação: ; 
3 2
s s
h � �∈ � �� �
. 
 
] [46,42 46,42 ; 15,47 ; 23,21 
3 2
h h� �∈ ⇔ ∈� �� �
 
 
 
Ou seja vou escolher aleatoriamente um número (h) compreendido neste intervalo. Vou optar 
pelo numero 20. 
 
Assim h = 20. 
 
 
Assim a minha classe central é 
20 20
 ; 163,07 ; 163,07 
2 2 2 2
h h
X X� � � �− + = − +� � � �� � � �
. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ix in iN if iF 
1 ] ] 73,07 ; 93,07 7 7 0,09 0,09 
 
2 ] ] 93,07 ; 113,07 5 12 0,07 0,16 
 
3 ] ] 113,07 ; 133,07 8 20 0,11 0,27 
4 ] ] 133,07 ; 153,07 12 32 0,16 0,43 
5 ] ] 153,07 ; 173,07 9 41 0,12 0,55 
6 ] ] 173,07 ; 193,07 14 55 0,19 0,73 
 
7 ] ] 193,07 ; 213,07 11 66 0,15 0,88 
8 ] ] 213,07 ; 233,07 5 71 0,07 0,95 
9 ] ] 233,07 ; 253,07 2 73 0,03 0,97 
10 ] ] 253,07 ; 273,07 2 75 0,03 1 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 139/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
 
2 - Suponha que no mesmo estudo se pretende estabelecer uma relação log-linear 
( )* lny y ax b= = + entre a voltagem necessária e o peso da rã. 
 
2.1. Usando a seguinte amostra bivariada, estabeleça a relação pretendida usando a 
metodologia dos mínimos quadrados. 
 
Peso 53 55 57 58 61 63 64 
Voltagem 171 179 174 176 186 188 165 
 
 
2.2. Qual é o coeficiente de determinação entre as duas variáveis, e que Interpretação tem? 
 
 
 
Resoluções 2.1 – Teorema Recta dos Mínimos Quadrados (RMQ): Se os pontos da amostra 
bivariada ( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a recta dos mínimos quadrados que modela 
essa relação é � �Y aX b= + , com: 
 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
Observação: Para calcular o coeficiente de correlação e a recta dos mínimos quadrados, basta 
dispor em colunas 
 
Abcissas Ordenadas 
Quadrados 
das abcissas 
Quadrados das 
ordenadas 
Abcissas X 
Ordenadas 
ix iy 
2
ix 
2
iy i ix y 
 
e no fim somar. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 140/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
 
 
 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
Vou então elaborar uma tabela, pois preciso dos somatórios: 
 
 x y *y 2x ( )2*y *xy 
 53 171 5,1417 2809 26,4367 272,508 
 55 179 5,1874 3025 26,9090 285,306 
 57 174 5,1591 3249 26,6159 294,066 
 58 176 5,1705 3364 26,7339 299,888 
 61 186 5,2257 3721 27,3084 318,771 
 63 188 5,2364 3969 27,4203 329,896 
 64 165 5,1059 4096 26,0707 326,781 
 411 1.239,00 36,2267 24.233 187,4949 2.127,216Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 141/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Nota, não esquecer que ( )* lny y= . 
 
Agora o que se pretende é �*y , e não o 
y . Assim sendo 
*
y aX b= + . 
 
Nota: os dados da tabela podem não parecer tão evidente, mas na realidade é: 
 
*
1 1
2.127,216
n n
i i i i
i i
X Y X Y
= =
= =� � *
1 1
36, 2267
n n
i i
i i
Y Y
= =
= =� � 
 
 
 
Assim sendo, fica: 
 
7 7 7
1 1 1 1 1 1
2 27 7
2 2
1 1 1 1
7
7
n n n
i i i i i i i i
i i i i i i
n n
i i i i
i i i i
n X Y X Y X Y X Y
a a
n X X X X
= = = = = =
= = = =
− −
= ⇔ = ⇔
� � � �
− −
 � 
 �
� � � �
� � � � � �
� � � �
 
 
 
( ) ( )( )
( ) ( )
3
2
7 , ,
1,88 x 10
7 
a a −
−
⇔ = ⇔ =
−
2 127 216 411 36 2267
24 233 411
 
 
 
7 7 7 7
2 2
1 1 1 1 1 1 1 1
2 27 7
2 2
1 1 1 1
7
n n n n
i i i i i i i i i i
i i i i i i i i
n n
i i i i
i i i i
X Y X X Y X Y X X Y
b b
n X X X X
= = = = = = = =
= = = =
− −
= ⇔ = ⇔
� � � �
− −
 � 
 �
� � � �
� � � � � � � �
� � � �
 
 
 
( ) ( ) ( )( )
( ) ( )2
24 233 36,2267 411 2 127, 216
5,07
7 24 233 411
b b
−
⇔ = ⇔ =
−
 
 
 
 
Assim, a recta dos mínimos quadrados que modela essa relação é: 
 
� ( ) ( )
*
31,88 x 10 5,07Y X−= + 
 
Sei que � �( ) �( ) ( ) ( )* 3ln ln 1,88 x 10 5,07Y Y Y X−= → = + ⇔ 
 
� ( ) ( )31,88 x 10 5,07XY e
− +
= 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 142/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resoluções 2.2 – Coeficiente de determinação: há diferenças entre linear e não linear: 
Na regressão múltipla, a medida relativa de adequação do ajuste é chamada de coeficiente de 
determinação múltipla e é designada pelo símbolo R2. É a relação entre a variação explicada pela 
equação de regressão múltipla e a variação total da variável dependente. Assim, R2=0,75 significa 
que 75% de variância é explicada pelo modelo. O coeficiente de determinação (R2) é um número no 
intervalo [0;1], calculado conforme a fórmula a seguir: 
�
�
2
212
2 1
2
2 2
1 1
( )
( )
Variação explicita1
Variação total( ) ( )
1
n
i n
i i
y i
n n
y
i i
i i
Y Y
Y Ys nR
s
Y Y Y Y
n
=
=
= =
−
−
−= = = =
− −
−
�
�
� �
 
 
Onde Y é o valor médio dos Yi constantes da amostra e � iY é o correspondente valor estimado 
através da equação ( � iY =β0 + β1X1i + β2X2i + ... + βkXki), para o elemento i da amostra. 
Alguns autores recomendam o uso do coeficiente de determinação "ajustado" (Ra
2), que leva em 
conta o número de variáveis explicatórias em relação ao número de observações. O propósito desta 
medida é facilitar a comparação de diversos modelos de regressão, quando há alteração no número 
de variáveis ou na quantidade de dados, de um modelo para outro. Tal coeficiente é determinado da 
seguinte forma: 
( )2 211 . 1
1a
n
R R
n k
−� �= − −
 �− −� �
 
Onde Ra
2 é o coeficiente ajustado, R2 é o coeficiente de determinação normal, k é o número de 
regressores e n é o tamanho da amostra. O coeficiente de determinação é empregado como um 
indicador inicial da precisão das regressões, para a selecção dos modelos mais ajustados. 
 
Vou elaborar uma tabela: 
 
iY ( )
2
iY Y− 
�
iY �( )
2
iY Y− 
 
 171 
 179 
 174 
 176 
 186 
 188 
 165 
 1.239,00 
 
Sei que 1 177
n
i
i
Y
Y
n
== =
�
: 
 
iY ( )
2
iY Y− 
�
iY �( )
2
iY Y− 
 
 171 36 
 179 4 
 174 9 
 176 1 
 186 81 
 188 121 
 165 144 
 1.239,00 396 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 143/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
Sei que � ( )
( )31,884929577 x 10 5,07X
Y e
− +
= (resultado obtido no exercício 2.1): 
 
iY ( )
2
iY Y− 
�
iY �( )
2
iY Y− 
 
 171 36 175,897 1,22 
 179 4 176,562 0,19 
 174 9 177,229 0,05 
 176 1 177,563 0,32 
 186 81 178,570 2,46 
 188 121 179,244 5,04 
 165 144 179,583 6,67 
 1.239,00 396 1.244,648 15,95 
Assim: 
�
�
2
212
2 1
2
2 2
1 1
( )
( )
15,951 0,04 4%
396( ) ( )
1
n
i n
i i
y i
n n
y
i i
i i
Y Y
Y Ys nR
s
Y Y Y Y
n
=
=
= =
−
−
−= = = = = =
− −
−
�
�
� �
 
 
Valor muito baixo, pois deveria de andar acima dos 95%. 5% da variância total é explicada pelo 
modelo. 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 144/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Frequência: 2003/06/18 
 
 
 
 
 
 
Duração: 3 horas 
 
 
Exercícios 1 – Na tabela abaixo registam-se os comprimentos, em cm, das asas direitas de 
priolos (ave endémica dos Açores) de três ilhas. 
 
 
São Miguel Terceira Pico 
1 11,01 11,46 11,01 
2 11,04 11,46 11,17 
3 11,18 11,85 11,35 
4 11,22 11,96 11,52 
5 11,74 12,34 11,52 
6 11,82 12,37 11,96 
7 11,96 12,48 12,10 
8 12,24 12,57 12,31 
9 12,34 12,62 12,40 
10 12,49 12,78 12,40 
11 12,60 12,91 12,85 
12 12,64 13,19 13,14 
13 12,98 13,25 13,21 
13
1
i
i
X
=
� 155,26 161,24 156,94 
13
2
1
i
i
X
=
� 1.859,6674 2.003,9746 1.901,6877 
 
 
 
(a) Calcule média, mediana, desvio padrão, dispersão quartal e coeficiente de variação de 
cada uma das amostras. 
 
(b) Apoiando-se nas caixas com 5 letras resumo, desenhe as caixas de bigodes paralelas 
correspondentes às três subamostras. Que comentários considera haver a fazer? 
 
(c) O que são outliers e como podem ser detectados? 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 145/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução a) São Miguel 
 
13
1 1 155,259Mediana 11,943
13 13
n
i i
i i
X X
X X X X
n
= =→ = ⇔ = ⇔ = ⇔ =
� �
 
 
 
 
( ) 13 1Média Prof 7
2
M
+
→ = =
 
 
( ) 7 11,96prof MM x M x M= ⇔ = ⇔ = 
 
 
 
Dispersão quartal: 
( )
( )Prof 1
Quartis Prof 4
2
M
Q
+� �� �→ = =
 
 
( ) 4 11,22L L Lprof FF x F x F= ⇔ = ⇔ = 
( ) 4
' ' 12,49U U Uprof FF x F x F= ⇔ = ⇔ = 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 12, 49 11, 22 1, 27U LdF F F= − = − = . 
 
 
Variância: 
 
( )
2
22 2 2
1 1
1 1 1 1
1.859,6674 155, 26
1 13 1 13
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
 � � �− − � �� �� �� �
� �
 
 
2 0, 4487730769Xs =
 
 
Desvio Padrão: 
 
2 0,4487730769 0,6699052746X X X Xs s s s= ⇔ = ⇔ = 
 
 
Coeficiente de variação 
0,6699052746
11,943
Xscv cv
X
→ = ⇔ = ⇔
 
 
 
0,005609187596 5,6%cv cv⇔ = ⇔ =
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 146/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução a) Terceira 
 
13
1 1 161, 24Mediana 12,403
13 13
n
i i
i i
X X
X X X X
n
= =→ = ⇔ = ⇔ = ⇔ =
� �
 
 
 
 
( ) 13 1Média Prof 7
2
M
+
→ = =
 
 
( ) 7 12,48prof MM x M x M= ⇔ = ⇔ = 
 
 
 
Dispersão quartal: 
( )
( )Prof 1
Quartis Prof 4
2
M
Q
+� �� �→ = =
 
 
( ) 4 11,96L L Lprof FF x F x F= ⇔ = ⇔ = 
( ) 4
' ' 12,78U U Uprof FF x F x F= ⇔ = ⇔ = 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 12,78 11,96 0,82U LdF F F=− = − = . 
 
 
Variância: 
 
( )
2
22 2 2
1 1
1 1 1 1
2.003,9746 161, 24
1 13 1 13
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
 � � �− − � �� �� �� �
� �
 
 
2 0,3418730769Xs =
 
 
Desvio Padrão: 
 
2 0,3418730769 0,5846991337X X X Xs s s s= ⇔ = ⇔ = 
 
 
Coeficiente de variação 
0,5846991337
12, 403
Xscv cv
X
→ = ⇔ = ⇔
 
 
 
0,04895747582 4,9%cv cv⇔ = ⇔ =
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 147/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução a) Pico 
 
13
1 1 156,97Mediana 12,075
13 13
n
i i
i i
X X
X X X X
n
= =→ = ⇔ = ⇔ = ⇔ =
� �
 
 
 
 
( ) 13 1Média Prof 7
2
M
+
→ = =
 
 
( ) 7 12,10prof MM x M x M= ⇔ = ⇔ = 
 
 
 
Dispersão quartal: 
( )
( )Prof 1
Quartis Prof 4
2
M
Q
+� �� �→ = =
 
 
( ) 4 11,52L L Lprof FF x F x F= ⇔ = ⇔ = 
( ) 4
' ' 12,40U U Uprof FF x F x F= ⇔ = ⇔ = 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 12, 40 11,52 0,88U LdF F F= − = − = . 
 
 
Variância: 
 
( )
2
22 2 2
1 1
1 1 1 1
1.901,6877 156,97
1 13 1 13
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
 � � �− − � �� �� �� �
� �
 
 
2 0,5279435897Xs =
 
 
Desvio Padrão: 
 
2 0,5279435897 0,7265972679X X X Xs s s s= ⇔ = ⇔ = 
 
 
Coeficiente de variação 
0,7265972679
12,075
Xscv cv
X
→ = ⇔ = ⇔
 
 
 
0,06017368678 6,0%cv cv⇔ = ⇔ =
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 148/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução b) 5 letras resumo: 
 
 
São Miguel 
 
 
 
 
Terceira 
 
 
 
 
Pico 
 
 
 
 
 
 
 
Caixa de bigodes comparada: 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 149/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Uma análise sobre estes gráficos, permite fazer três comentários relativamente aos 
comprimentos das asas direitas de priolos: 
1º, quanto a dispersão, não parece haver diferenças nas três ilhas. 
2º, quanto a localização, parece que o comprimento das asas é um pouco superior na Ilha da 
Terceira. 
3º, quanto a simetria, a distribuição parece simétrica nos três casos. 
Em conclusão, esta variável parece ser uma candidata a uma distribuição normal (Gausiana). 
 
 
 
 
Resolução c) - As observações que apresentam um grande afastamento das restantes ou são 
inconsistentes com elas são habitualmente designadas por outliers. 
Estas observações são também designadas por observações “anormais”, contaminantes, 
estranhas, extremas ou aberrantes. Podem ser detectados verificando se os dados estão fora 
do intervalo: 
[ ]1,5 ; 1,5 L UF X dF F X dF− + 
 
 
 
 
 
 
 
 
 
 
2. Na tabela abaixo registam-se comprimentos do corpo e da asa direita dos 13 priolos da ilha 
de São Miguel: 
13 13
2
1 1
143,61 1600,9725i i
i i
X X
= =
= ∧ =� � 
13 13
2
1 1
155,26 1859,6674i i
i i
Y Y
= =
= ∧ =� � 
13
1
1722,5972i i
i
X Y
=
=�
 
 
(a) Determine a recta dos mínimos quadrados que exprime y como função linear de x. 
(b) O que são os resíduos? Que propriedades devem ter para considerarmos que o modelo 
adaptado é bom? 
 
 
 
Resolução 2a) - �Y → valor previsto pelo modelo. 
 
 
Assim o que é pedido, é se é possível prever “Y” a partir de “X”, através da relação linear. 
 
�Y aX b= + 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 150/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Teorema RMQ: Se os pontos da amostra bivariada ( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a 
recta dos mínimos quadrados que modela essa relação é �Y aX b= + , com: 
 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
Observação: Para calcular o coeficiente de correlação e a recta dos mínimos quadrados, basta 
dispor em colunas 
 
Abcissas Ordenadas 
Quadrados 
das abcissas 
Quadrados das 
ordenadas 
Abcissas X 
Ordenadas 
ix iy 
2
ix 
2
iy i ix y 
 
e no fim somar. 
 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 151/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Assim no exercício faz-se: 
 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
( ) ( ) ( )
( ) ( )2
13 1722,5972 143,61 155,26
0,513
13 1600,9725 143,61
a a
−
= ⇔ =
−
 
 
( )( ) ( )( )
( ) ( )2
1600,9725 155,26 143,61 1722,5972
6, 275
13 1600,9725 143,61
b b
−
= ⇔ =
−
 
 
� � 0,513. 6, 275Y aX b Y X= + ⇔ = +
 
 
 
Ter em atenção, que esta recta obtida não me diz que é fiável, pois é preciso fazer a correlação 
linear, ou o estudo dos resíduos, a fim de confirmar se é fiável ou não (vou explicar no 
exercício 2b). 
 
 
 
 
Resolução 2b) - breve explicação sobre os resíduos: O resíduo de ordem iε representa a 
diferença entre o da variável dependente e cada valor previsto pelo modelo de variável 
dependente: 
 
�
�
valor observado valor previsto
i iy y−
 
 
 
Ou seja, os resíduos são definidos através da diferença entre cada valor iy (i-ésimo valor 
observado da variável dependente) e 
 iy (i-ésimo valor esperado, pelo modelo 

 ( )y f x= , da 
variável dependente). 
Assim, para cada { }1,...,i n∈ , o resíduo de ordem i é dado por 
i iy y− , isto é, 
i i iy yε = − . 
 
O modelo adoptado é considerado bom se os resíduos iε forem desprezáveis, isto é, 0iε � . 
Os resíduos devem flutuar moderadamente em torno de zero, sem padrão definido. 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 152/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
 
 
 
Aqui, as rectas a vermelho, são as distanciam a que os dados estão da recta. 
 
 
O ideal seria ter os pontos sobre a recta (aqui a verde): 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 153/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Na figura pode se notar de que existe uma distância entre os ponto (valores lidos) e a recta 
azul (valor esperado). Essa distância é designada por resíduo ( )ε . 
 
 
 
i iiy y ε= + , em que iε é o resíduo. Assim 
i i iy yε = − 
 
Neste exemplo: 
iε é positivo, pois esta acima da recta. O ideal seria 0iε = , ou seja os resíduos deveram 
“flutuar” moderadamente em torno do valor zero (sem obrigar a um padrão). Se os valores de 
iε forem muito alto, o modelo da recta não é o mais indicado. Para contornar este problema, 
utiliza se o MMQ, que tem por finalidade a de minimizar o erro. 
 
Representa se a soma de TODOS os erros por .δ 
 
Assim 2 2 2 2 21 2 3 4 ... nδ ε ε ε ε ε= + + + + + 
 
Se 1nε + aumentar gradualmente, isto significa que arecta não é a ideal, deverá ser corrigida. 
 
 
 
 
 
 
 
Agora vou explicar um outro pressuposto que me diz se a recta obtida no exercício 2a) é de 
confiança ou não. 
 
Vou recordar teoria do Coeficiente de Correlação Linear: o coeficiente de correlação linear 
é uma medida do grau de associação entre variáveis. Esta medida toma valores entre -1 e 1. 
Quando se mede a correlação entre variáveis, 1 significa uma relação linear perfeita e positiva, 
enquanto -1 é também uma relação linear perfeita mas negativa. Valores próximos do zero 
para o coeficiente de correlação linear indicam uma associação linear pobre entre variáveis. 
O coeficiente de correlação amostral de Pearson r da amostra bivariada ( ){ }
1
;
n
i i i
x y
=
 é: 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 154/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
 � 
 �
� � � �� � � �� � � �
� � �
� � � �
 
Assim: 
 
13 13 13
1 1 1
2 213 13 13 13
2 2
1 1 1 1
13
13 13
i i i i
i i i
i i i i
i i i i
X Y X Y
r
X X Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
 � 
 �
� � � �� � � �� � � �
� � �
� � � �
 
( ) ( ) ( )
( ) ( ) ( ) ( )2 2
13 1722,5972 143,61 155,26
13 1600,9725 143,61 13 1859,6674 155, 26
r
−
=
� � � �− −
� � � �
 
 
 
0,084260312r = 
 
Tendo obtido um 0,084260312r = , posso concluir que não existe uma correlação entre as 
variáveis, pois o seu coeficiente está muito próximo do zero (o ajustamento não é bom). 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 155/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Frequência: 2007/12/06 
 
Duração: 2 horas. 
 
 
1 – Os valores que se seguem referem se a um estudo sobre como os estímulos ambientais 
afectam a capacidade de concentração, e representam o tempo, em segundos, que 36 
voluntários demoram a fazer uma serie de cálculos aritméticos simples, em três condições 
distintas: com televisão ligada (A), com o rádio ligado (B), e em silêncio (C). 
 
 A B C 
 31,47 33,32 32,78 
 37,72 34,72 26,45 
 34,90 28,41 29,90 
 31,86 41,96 32,08 
 35,78 37,10 28,55 
 29,93 27,73 36,25 
 36,38 26,37 30,74 
 29,57 34,43 25,68 
 36,38 24,75 29,04 
 34,77 30,71 32,65 
 24,10 35,81 27,21 
 32,71 28,94 32,58 
 
Soma 395,57 384,25 363,91 
Soma quadrática 13203,3429 12585,1815 11142,0269 
 
 
1.1 – Trace diagramas de extremos e quartis paralelos para os três grupos. 
1.2 – Faça um histograma para o conjunto de todos os dados (sem distinguir entre grupos). 
1.3 – Face às respostas que deu às alíneas anteriores, qual lhe parece ser o efeito dos estímulos 
ambientais visuais e auditivos na capacidade de conversão? 
1.4 – O que é que o histograma sugere acerca da simetria da variável considerada? Compare 
com a indicação fornecida pelos diagramas de extremos e quartis, e comente. 
1.5 – Qual das medidas de dispersão é mais sensível a Outliers, a amplitude interquartis ou a 
amplitude? Justifique a sua resposta. 
 
 
 
 
 
Faço mais tarte, pois é sempre a mesma coisa….. 
 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 156/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
2 - Noutra experiência do mesmo tipo, os voluntários tiveram de fazer contas com o rádio 
como som de fundo, mas desta vez os períodos de som foram intercalados com períodos 
de silêncio. Por outro lado, o tempo de execução da uma tarefa não é certamente o único 
factor a levar em conta. Também importa a qualidade da execução, por isso registou-se o 
número de erros que cada voluntário cometeu ao fazer as contas. 
 
Silencio (x) 15 15 17 17 20 20 20 22 22 
Tempo (y) 21,82 22,94 15,90 13,26 14,51 21,01 14,02 21,37 21,24 
Nº erros (z) 1 1 3 5 0 2 0 3 3 
 
 x y 2y xy 2xy 
Soma 168 166,07 3187,3287 3095,34 59264,5102 
Soma quadrado 3 196 3 187,3287 1 288 337,339 1 128 196,824 451 290 945,5 
 
Determine a equação de recta de regressão dos mínimos quadrados que dá o tempo que o 
voluntário demorou a realizar a tarefa, y, como função da duração total dos silêncios, x. 
 
 
Resolução 2 - �Y → valor previsto pelo modelo (pois o previsto é diferente do observado). 
 
 
Assim o que é pedido, é se é possível prever “Y” a partir de “X”, através da relação linear. 
 
�Y aX b= + 
 
 
 
Teorema Recta dos Mínimos Quadrados (RMQ): Se os pontos da amostra bivariada 
( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a recta dos mínimos quadrados que modela essa 
relação é � �Y aX b= + , com: 
 
 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
Observação: Para calcular o coeficiente de correlação e a recta dos mínimos quadrados, basta 
dispor em colunas 
 
Abcissas Ordenadas 
Quadrados 
das abcissas 
Quadrados das 
ordenadas 
Abcissas X 
Ordenadas 
ix iy 
2
ix 
2
iy i ix y 
 
e no fim somar. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 157/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
 
 
 
 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
 
 
 
 
Assim no exercício faz-se: 
 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 158/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
( ) ( )( )
( ) ( )2
9 3095,34 168 166,07
0,077222
9 3196 168
a a
−
= ⇔ = −
−
 
 
( )( ) ( ) ( )
( ) ( )2
3196 166,07 168 3095,34
19,8937037
9 3196 168
b b
−
= ⇔ =
−
 
 
� � ( )0,077222 . 19,8937037Y aX b Y X= + ⇔ = − + 
 
Mas está errado! 
 
 
 
 
Pois é, o que é pedido é estimar o valor de “x”, se souber o valor de “y”, e a fórmula é: 
 
�X aY b= + 
 
 
E na formula geral troca se o “x” pelo “y”: 
 
1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n
i i i i i i i i
i i i i i i
n n n n
i i i i
i i i i
n X Y X Y n X Y X Y
a a
n X X Y Yn
= = = = = =
= = = =
− −
= → =
� � � �
− −
 � 
 �
� � � �
� � � � � �
� � � �
 
 
2 2
1 1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n n
i i i i i i i i i i
i i i i i i i i
n n n n
i i i i
i i i i
X Y X Y X Y
X X
X Y X Y
b b
n Y Yn
= = = = = = = =
= = = =
− −
= → =
� � � �
− −
 � 
 �
� � � �
� � � � � � � �
� � � �
 
Assim: 
 
( ) ( )( )
( ) ( )
1 1 1
2 2
2
1 1
9 3095,34 168 166,07
0,03767913174
9 3187,3287 166,07
n n n
i i i i
i i i
n n
i i
i i
n X Y X Y
a a a
n Y Y
= = =
= =
−
−
= ⇔ = ⇔ = −
−� �
− 
 �
� �
� � �
� �
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 159/305 
Sugestões: jrvalente@netmadeira.comProbabilidades e Estatística 
( ) ( ) ( )( )
( ) ( )
2
1 1 1 1
2 2
2
1 1
3187,3287 168 166,07 3095,34
19,36193
9 3187,3287 166,07
n n n n
i i i i i
i i i i
n n
i i
i i
X Y
b b b
n
Y X Y
Y Y
= = = =
= =
−
−
= ⇔ = ⇔ =
−� �
− 
 �
� �
� � � �
� �
 
 
� ( )0,03767913174 . 19,36193X Y= − + 
 
 
 
 
 
 
3 - Responda a apenas uma das alíneas que se seguem. 
a) Para os dados da pergunta 2, ache o coeficiente de correlação entre x e y. 
 
 
b) Suponha que para calcular a variância dos dados da primeira coluna, na pergunta I, se 
fez a seguinte tabela no Excel. 
 
A Desvios 
31,47 -1,49 
37,72 25,72 
34,90 34,90 
31,86 31,86 
35,78 35,78 
29,93 29,93 
36,38 36,38 
29,57 29,57 
36,38 36,38 
34,77 34,77 
24,10 24,10 
32,71 32,71 
Soma quad. 11.453,934040 
Variância 1.041,266731 
 
 
Só que o valor a que se chegou está errado. Onde é que terá sido cometido o erro? 
 
 
 
c) Para os dados da pergunta 2, admita que por observação do diagrama de dispersão e análise 
dos resíduos se chegou à conclusão de que era mais adequada uma relação parabólica do tipo
 y ax b= + . Linearize esta relação, e use o método dos mínimos quadrados para achar 
valores apropriados para os coeficientes a e b. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 160/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução 3a) - Vou recordar teoria do Coeficiente de Correlação Linear: o coeficiente de 
correlação linear é uma medida do grau de associação entre variáveis. Esta medida toma 
valores entre -1 e 1. Quando se mede a correlação entre variáveis, 1 significa uma relação 
linear perfeita e positiva, enquanto -1 é também uma relação linear perfeita mas negativa. 
Valores próximos do zero para o coeficiente de correlação linear indicam uma associação 
linear pobre entre variáveis. O coeficiente de correlação amostral de Pearson r da amostra 
bivariada ( ){ }
1
;
n
i i i
x y
=
 é: 
 
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
 � 
 �
� � � �� � � �� � � �
� � �
� � � �
 
 
2r - coeficiente de determinação. 
cv - coeficiente de variação 
s
cv
X
� �=
 �
� �
. 
Assim: 
 
( ) ( ) ( )
( ) ( ) ( ) ( )
9 9 9
1 1 1
2 29 9 9 9
2 2
1 1 1 1
2 2
9
9 9
9 3095,34 168 166,07
9 3196 168 9 3187,3287 166,07
0,054
i i i i
i i i
i i i i
i i i i
X Y X Y
r
X X Y Y
r
r
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
 � 
 �
� � � �� � � �� � � �
−
=
� � � �− −
� � � �
= −
� � �
� � � �
 
 
Tendo obtido um 0,054r = − , posso concluir que não existe uma correlação entre as 
variáveis, pois o seu coeficiente está muito próximo do zero (o ajustamento não é bom). 
 
 
 
 
Resolução 3b) o que nos é pedido é a de verificar se a segunda coluna (desvios) está correcta. 
Desvio: 
1
( )
n
i
i
X X
=
−� , e a seu resultado é zero! É por isso que não se usa, e se usa o seu 
quadrado. Assim, o desvio quadrático é 2
1
( )
n
i
i
X X
=
−� . 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 161/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
A variância é 
2
2 1
( )
1
n
i
i
X X
s
n
=
−
=
−
�
 
 
 
A Desvios 
31,47 -1,49 
37,72 25,72 
34,90 34,90 
31,86 31,86 
35,78 35,78 
29,93 29,93 
36,38 36,38 
29,57 29,57 
36,38 36,38 
34,77 34,77 
24,10 24,10 
32,71 32,71 
 
 
Ora como sei a mediana: 1
395,57
32,964
12
n
i
i
X
X X X
n
== ⇔ = ⇔ =
�
. 
 
 
Assim fica: 
A X Desvios 
31,47 32,96 -1,49 
37,72 32,96 4,76 
34,90 32,96 1,94 
31,86 32,96 -1,10 
35,78 32,96 2,82 
29,93 32,96 -3,03 
36,38 32,96 3,42 
29,57 32,96 -3,39 
36,38 32,96 3,42 
34,77 32,96 1,81 
24,10 32,96 -8,86 
32,71 32,96 -0,25 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 162/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução 3c) para linearizar: ( )
2
2 2 y ax b y ax b= + ⇔ = + . Já esta, já tenho 
o " "ax b+ , também tenho o 2" "y , que não pretendo. Então baptizo o 2 y por .z 
 
 
 
Assim .z ax b= + O objectivo é transformar o que é dado até se chegar ao " "ax b+ . 
 
Por exemplo se fosse 
1
 
y
ax b
=
+
, então faria 
1
 ax b
y
= + , e faria 
1
 .z z ax b
y
= → = + 
 
Voltando ao exercício: 
 
1 1 1 1 1 1
2 2
2 2
2 2
1 1 1 1
n n n n n n
i i i i i i i
i i i i i i
n n n n
i i i i
i i i i
in X X n X X
a a
n
Z Y
X X X X
Z
n
Y
= = = = = =
= = = =
− −
= ⇔ = ⇔
� � � �
− −
 � 
 �
� � � �
� � � � � �
� � � �
 
 
( ) ( ) ( )
( ) ( )2
9 59264,5102 168 . 3187,3287
3,872
9. 3196 168
a a
−
= ⇔ = −
−
 
 
� �
2 2
1 1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
2 2
i i
n n n n n n n n
i i i i i i i i i i
i i
Z Z
i i i i i i
n n n n
i i i i
i i i i
X X X X X X
b b
n X X n X
Z Z Y Y
X
= = = = = = = =
= = = =
− −
= ⇔ = ⇔
� � � �
− −
 � 
 �
� � � �
� � � � � � � �
� � � �
 
 
( ) ( ) ( ) ( )
( ) ( )2
3196 . 3187,3289 168 . 59264,5102
426, 416317
9. 3196 168
b b
−
⇔ = ⇔ =
−
 
 
� ( )3,872 . 426,416317Z X= − + 
 
 
Logo: 
( )3,872 . 426, 416317Y X= − + 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 163/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Frequência: 2008/06/21 
 
Duração: 3 horas. 
 
Primeira parte: responda às perguntas 1 e 2 na sua totalidade. 
 
1 - O quadro seguinte dá as taxas de emprego por nível de escolaridade, em 10 zonas do país. 
 
Nível de escolaridade 
 
 
1.1 - Com base nestes 30 valores, parece-lhe que se pode considerar que a taxa de emprego 
tem uma distribuição aproximadamente normal? Justifique a sua resposta fazendo 
representações gráficas adequadas. 
 
1.2 - O que é que os dados sugerem acerca da relação entre a taxa de emprego e o nível de 
escolaridade? Justifique a sua resposta com base em características amostrais descritivas 
pertinentes. 
 
 
Resolução 1.1 – 
A variável é contínua, e é a taxa de emprego que está em estudo neste exercício. 
 
São necessárias 3 características para se poder afirmar se os dados pertencem a uma 
distribuição normal. 
 
 1º - o 1ºQ>2ºQ e o 4ºQ>3ºQ. 
 2º - o formato do gráfico ser parecido com um sino: 
 
 
 
 3º - a probabilidade de “X” estar dentro dos seguintes parâmetros: 
 
( ) 0,68p X s X X s− < < + ≈ 
( ) 0 952 2 ,p X s X X s− < < + ≈ 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 164/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Existe também as designadas por distribuição uniforme: 
 
1º - o 1ºQ=2ºQ=3º Q=4ºQ. 
 
 2º - o formato do gráfico ser parecido com uma recta paralela ao eixo dos “X”: 
 
 
 
 
 
Existe também as designadas por distribuição Qui-quadrada: 
 
1º - o 1ºQ<2ºQ<3º Q<4ºQ. 
 
 2º - o formato do gráfico ser parecido com uma recta paralela ao eixo dos “X”: 
 
 
 
 
 
Agora regressando ao exercício, vou primeiro ordenar os dados, utilizando o diagrama de 
caules (tenho que ser capaz de saber interpretar qual a variável a analisar de que é a taxa de 
emprego). 
 
 
030; 1 x 10 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 165/305 
Sugestões: jrvalente@netmadeira.comProbabilidades e Estatística 
Assim fica: 
 
 
 
 
 
Mínimo Máximo Média Moda 
48,6 87,8 64,4 84,3 
 
 
 
[ ] 1Prof 15,5
2
n
M
+
= = e [ ]
[ ]Prof 1
Prof 8
2
M
F
� � +� �= = 
 
 
[ ] 8Prof 56,5L FF x x= = = e [ ]
' '
8Prof 83,1U FF x x= = = 
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 26,6U LdF F F= − = . 
 
Barreiras de Outliers Inferior - X X 1,5 56,5 1,5 26,6 16,6LF dF = − =− 
Barreiras de Outliers Superior - X X 1,5 83,1 1,5 26,6 123UF dF+ = + = 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (123): 0 
Dados inferior a barreira inferior (16,6): 0 
 
Agora Diagrama Caixa com Bigodes: 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 166/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Histograma - 
 
Nota: quando não se tem pistas, para representar o histograma, usa se a regra de Sturges. Pois 
se eu soubesse de que se tratava de uma distribuição normal, iria pelo processo do desvio 
padrão. 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
( ) ( )
( )2
ln 30
log 1 1 5.
ln 2
N n N N
� �
= + ⇔ = + ⇔ =� � � �� �
� �
 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por 
60:60 1:60 87,8 48,6* * * 7,84
5
x x
h h h
N
− −
= ⇔ = ⇔ = 
 
Logo posso considerar: 8.h = 
 
 
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é 
dado por: 
 
( ) ( ) ( ) ( ): : 5 8 87,8 48,6 0,8.n n l nX XN h x xε ε ε= − − ⇔ = − − ⇔ = 
 
 
O limite inferior da primeira classe é 
0,8
48,6 48, 2
2
− =
 
 
 
 
 
ix in iN if iF 
1 ] ] 48,2 ; 56,2 7 7 0,2 0,2 
2 ] ] 56,2 ; 64,2 8 15 0,3 0,5 
3 ] ] 64,2 ; 72,2 5 20 0,2 0,7 
4 ] ] 72,2 ; 80,2 0 20 0,0 0,7 
5 ] ] 80,2 ; 88,2 10 30 0,3 1 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 167/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Com base na análise do histograma, pode se concluir que existe uma assimetria à direita. 
Analisando o diagrama da caixa de bigode, pode se concluir que existe uma ligeira dispersão 
no intervalo [ ]64,4 ; 83,1 , quando seria de esperar uma certa concentração dos dados. 
 
Quanto as medidas de localização, tem se 67,56 ; 84,3 ; 64, 4oX M M= = = , são bem 
diferentes. 
 
Assim se pode concluir que existem fortes razões para afirmar que os dados não têm uma 
distribuição normal. 
 
 
Resolução 1.2 – Tenho que realizar um estudo individualizado. A variável é contínua, e é a o 
nível de formação que está em estudo neste exercício. 
 
Assim fica, para o 3º ciclo: 
 
 
Mínimo Máximo Média 
48,6 60,4 55,65 
 
[ ] 1Prof 5,5
2
n
M
+
= = e [ ]
[ ]Prof 1
Prof 3
2
M
F
� � +� �= = 
 
[ ] 3Prof 52,1L FF x x= = = e [ ]
' '
3Prof 56,5U FF x x= = = 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 168/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 4, 4U LdF F F= − = . 
 
Barreiras de Outliers Inferior - X X 1,5 52,1 1,5 4,4 45,5LF dF− = − = 
Barreiras de Outliers Superior - X X 1,5 56,5 1,5 4, 4 63,1UF dF+ = + = 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (63,1): 0. 
Dados inferior a barreira inferior (45,5): 0. 
 
Assim fica, para o Secundário: 
 
 
 
 
Mínimo Máximo Média 
59,8 67,6 64,4 
 
 
[ ] 1Prof 5,5
2
n
M
+
= = e [ ]
[ ]Prof 1
Prof 3
2
M
F
� � +� �= = 
 
 
[ ] 3Prof 62,1L FF x x= = = e [ ]
' '
3Prof 65,0U FF x x= = = 
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
 
Dispersão Quartal - 2,9U LdF F F= − = . 
 
Barreiras de Outliers Inferior - X X 1,5 62,1 1,5 2,9 57,75LF dF = − =− 
Barreiras de Outliers Superior - X X 1,5 65,0 1,5 2,9 69,35UF dF = + =+ 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 169/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (69,35): 0. 
Dados inferior a barreira inferior (57,75): 0. 
 
 
Assim fica, para o Superior: 
 
 
Mínimo Máximo Média 
81,3 87,8 84,05 
 
[ ] 1Prof 5,5
2
n
M
+
= = e [ ]
[ ]Prof 1
Prof 3
2
M
F
� � +� �= = 
 
[ ] 3Prof 83,1L FF x x= = = e [ ]
' '
3Prof 84,8U FF x x= = = 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
Dispersão Quartal - 1,7U LdF F F= − = . 
 
Barreiras de Outliers Inferior - X X 1,5 83,1 1,5 1,7 80,55LF dF = − =− 
Barreiras de Outliers Superior - X X 1,5 84,8 1,5 1,7 87,35UF dF = + =+ 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (87,35): 1, e é o numero 87,8. 
Dados inferior a barreira inferior (80,55): 0. 
 
 
 
(Falta a conclusão, mas estou sem pachorra…) 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 170/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
2 - O quadro seguinte dá as taxas de desemprego numa região do país, nos dois primeiros 
trimestres de dois anos consecutivos, junto com as respectivas somas, somas de quadrados e 
somas de produtos (brutas). 
 
 
 
 
2.1 - Ajuste uma recta aos valores homólogos da taxa de desemprego nos dois anos, pelo 
método dos mínimos quadrados. 
 
2.2 - Admita que a recta que achou na alínea anterior se mantém um modelo válido para a 
segunda metade do ano. Sabendo que a taxa de desemprego “x” nesta região em Julho de 
2006 foi de 5,8%, ache uma estimativa da taxa de desemprego “y” no mesmo mês do ano 
seguinte. 
 
2.3 - A sua resposta à alínea anterior pressupõe que a recta ajustada permite fazer uma boa 
previsão de “y” a partir de “x”. Explique como é que este pressuposto poderia falhar. O que 
é que se pode fazer para avaliar se o referido pressuposto é válido? 
 
 
 
 
Resolução 2.1 - Teorema Recta dos Mínimos Quadrados (RMQ): Se os pontos da amostra 
bivariada ( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a recta dos mínimos quadrados que modela 
essa relação é � �Y aX b= + , com: 
 
 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 171/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Observação: Para calcular o coeficiente de correlação e a recta dos mínimos quadrados, basta 
dispor em colunas 
 
Abcissas Ordenadas 
Quadrados 
das abcissas 
Quadrados das 
ordenadas 
Abcissas X 
Ordenadas 
ix iy 
2
ix 
2
iy i ix y 
 
e no fim somar. 
 
 
 
 
 
 
 
 
21 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 172/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
Assim sendo, fica: 
 
6 6 6
1 1 1 1 1 1
2 26 6
2 2
1 1 1 1
6
6
n n n
i i i i i i i i
i i i i i i
n n
i i i i
i i i i
n X Y X Y X Y X Y
a a
n X X X X
= = = = = =
= = = =
− −
= ⇔ = ⇔
� � � �
− −
 � 
 �
� � � �
� � � � � �
� � � �
 
 
 
( ) ( )( )
( ) ( )2
6 457,13 48,30 56,50
1,77992277
6 390,11 48,30
a a
−
⇔ = ⇔ =
−
 
 
 
6 6 6 6
2 2
1 1 1 1 1 1 1 1
2 26 6
2 2
1 1 1 1
6
n n n n
i i i i i i i i i i
i i i i i i i i
n n
i i i i
i i i i
X Y X X Y X Y X X Y
b b
n X X X X
= = = = = = = =
= = = =
− −
= ⇔ = ⇔
� � � �
− −
 � 
 �
� � � �
� � � � � � � �
� � � �
 
 
 
( )( ) ( )( )
( ) ( )2
390,11 56,50 48,30 457,13
4,911711712
6 390,11 48,30
b b
−
⇔ = ⇔ = −
−
 
 
 
Assim, a recta dos mínimos quadrados (RMQ) que modela essa relação é: 
 
� ( ) ( )1,77992277 4,911711712Y X= + − 
 
 
 
Resolução 2.1 – é para projectar “y” a partir de “x”, e como sei que “x” é 5,8%, é só substituir 
na recta do RMQ: 
 
� ( )( ) ( )5,81,77992277 4,911711712Y = + − 
 
� 5,41Y = 
 
Posso então concluir que é 5,41%. 
 
 
 
(Ter em atenção, que esta recta obtida não me diz que é fiável, pois é preciso fazer a 
correlação linear, ou o estudo dos resíduos, a fim de confirmar se é fiável ou não. Mas é algo 
que irei responder no exercício seguinte). 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 173/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução 2.3 - Vou recordar teoria do Coeficiente de Correlação Linear: o coeficiente de 
correlação linear é uma medida do grau de associação entre variáveis. Esta medida toma 
valores entre -1 e 1. 
Quando se mede a correlação entre variáveis, 1 significa uma relação linear perfeita e positiva, 
enquanto -1 é também uma relação linear perfeita mas negativa. Valores próximos do zero 
para o coeficiente de correlação linear indicam uma associação linear pobre entre variáveis. 
O coeficiente de correlação amostral de Pearson r da amostra bivariada ( ){ }
1
;
n
i i i
x y
=
 é: 
 
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
 � 
 �
� � � �� � � �� � � �
� � �
� � � �
 
 
 
Nota: não confundir com o coeficiente de determinação, que é 2.r 
 
 
 
Assim um dos pressuposto do Coeficiente de Correlação Linear, é o facto de 1r = . 
 
6 6 6
1 1 1
2 26 6 6 6
2 2
1 1 1 1
6
6 6
i i i i
i i i
i i i i
i i i i
X Y X Y
r
X X Y Y
= = =
= = = =
−
= ⇔
� � � �� � � �
− −� � � �
 � 
 �
� � � �� � � �� � � �
� � �
� � � �
 
 
( ) ( )( )
( ) ( ) ( ) ( )2 2
6 457,13 48,30 56,50
0,99931684 1
6 390,11 48,30 6 536,15 56,50
r r r
−
⇔ = ⇔ = ⇔ ≈
� � � �− −
� � � �
 
 
 
Face ao resultado obtido, posso afirmar que o valor de “y” estimado na alínea 2.2 é bom. 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 174/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Poderia ter ido pela pelo pressuposto do erro. É o facto de os resíduos oscilarem em torno de 
zero sem nenhum padrão definido. 
 
 
Breve explicação sobre os resíduos: O resíduo de ordem iε representa a diferença entre o da 
variável dependente e cada valor previsto pelo modelo de variável dependente: 
 
�
�
valor observado valor previsto
i iy y−
 
 
Ou seja, os resíduos são definidos através da diferença entre cada valor iy (i-ésimo valor 
observado da variável dependente) e 
 iy (i-ésimo valor esperado, pelo modelo 

 ( )y f x= , da 
variável dependente). 
Assim, para cada { }1,...,i n∈ , o resíduo de ordem i é dado por 
i iy y− , isto é, 
i i iy yε = − . 
 
O modelo adoptado é considerado bom se os resíduos iε forem desprezáveis, isto é, 0iε � . 
Os resíduos devem flutuar moderadamente em torno de zero, sem padrão definido. 
 
 
 
Vou agora fazer uma analisar os resíduos: 
 
Sei que 
ix iy 
iy ε 
7,90 9,10 
 9,00 11,10 
 8,20 9,70 
 7,70 8,80 
 7,60 8,60 
 7,90 9,20 
 
 
 
Também sei que: � ( ) ( )1,77992277 4,911711712Y X= + − 
 
ix iy 
iy ε 
7,90 9,10 9,15 
 9,00 11,10 11,11 
 8,20 9,70 9,68 
 7,70 8,80 8,79 
 7,60 8,60 8,62 
 7,90 9,20 9,15 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 175/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Também sei que: 
i iy yε = − 
 
ix iy 
iy ε 
7,90 9,10 9,15 -0,05 
9,00 11,10 11,11 -0,01 
8,20 9,70 9,68 0,02 
7,70 8,80 8,79 0,01 
7,60 8,60 8,62 -0,02 
7,90 9,20 9,15 0,05 
 
 
Este parâmetro ,ε informa se a recta está bem ajustada. Se houver divergência ou no inicio, 
no meio, ou no fim, posso concluir que os resíduos não são perturbações amostrais. 
Mas como tal não sucede, pois andam muito próximo do valor de zero, sem nenhum padrão 
definido, posso então afirmar que os resíduos são perturbações amostrais de zero. 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 176/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Frequência: 2008/11/06 
 
Duração: 2 horas. 
 
 
Grupo I: responda a ambas as perguntas 1 e 2. 
 
1 - A tabela seguinte contém os tempos de vida de 100 lâmpadas de incandescência, em horas, 
bem como algumas somas calculadas a partir destes. Os valores dos tempos já foram 
ordenados. 
 
Por comodidade fornecem-se ainda as seguintes somas: 
 
100 100
2
1 1
98 928 100 432 622i i
i i
X X
= =
= ∧ =� � 
 
 
 
 
Pretende se saber se se pode admitir uma distribuição normal para esta variável. Procure 
responder a esta questão: 
 
1.1 (4,5 valores) Representando os dados num histograma. 
1.2 (4,5 valores) Fazendo a caixa com bigodes. (Identifique eventuais outliers.) 
1.3 (4,5 valores) Através da média e do desvio padrão. Como referência, note que no modelo 
normal 68% das observações estão a um desvio padrão ou menos de distância da média, e 
95% das observações estão a dois desvios padrões ou menos de distância da média. Compare 
estas proporções com as que existem na amostra. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 177/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resoluções1.1 - já estão por ordem crescente. 
 
Nota 1: ter se muito cuidado com a interpretação das perguntas. Por exemplo na alínea c) é me 
dito que “… 68% das observações estão a um desvio padrão…” significa que 68% dos dados 
pertencem ao intervalo ;X s X s� �− +� � . 
 
Nota 2: quando não se tem pistas, para representar o histograma, usa se a regra de Sturges. 
Pois se eu soubesse de que se tratava de uma distribuição normal, iria pelo processo do desvio 
padrão. 
 
A regra de Sturges aconselha que se use um número de classes N dado por: 
( ) ( )
( )2
ln
log 1 1 7.
ln 2
n
N n N N
� �
= + ⇔ = + ⇔ =� � � �� �
��
 
 
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por 
: : 1340 521* * * 117
7
n n i nx xh h h
N
− −
= ⇔ = ⇔ = 
 
Logo posso considerar: 120.h = 
 
O limite inferior da primeira classe deverá ser : ,2i n
x
ε
− em que ε é o excesso, e é 
dado por 
 
( ) ( ) ( ) ( ): : 7 120 1340 521 21.n n i nX XN h x xε ε ε= − − ⇔ = − − ⇔ = 
 
 
O limite inferior da primeira classe é 
21
521 510,5
2
− = 
 
 
Assim as classes a considerar são, que começa com : : - ; - 2 2i n i n
x x h
ε ε� �� � � �+
 � 
 �� �
� � � �� �
: 
 
] ] ] ] ] ] ] ] 510,5 ; 630,5 , 630,5 ; 750,5 , 750,5 ; 870,5 , 870,5 ; 990,5 , 
 
] ] ] ] ] ] 990,5 ; 1110,5 , 1110,5 ; 1230,5 e 1230,5 ; 1350,5 . 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 178/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
 
 
 
 
Não esquecer de por legendas nos eixos. 
 
 
 
 
 
ix in iN if iF 
1 ] ] 510,5 ; 630,5 2 2 0,02 0,02 
2 ] ] 630,5 ; 750,5 4 6 0,04 0,06 
3 ] ] 750,5 ; 870,5 17 23 0,17 0,23 
4 ] ] 870,5 ; 990,5 26 49 0,26 0,49 
5 ] ] 990,5 ; 1110,5 26 75 0,26 0,75 
6 ] ] 1110,5 ; 1230,5 20 95 0,2 0,95 
7 ] ] 1230,5 ; 1350,5 5 100 0,05 1 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 179/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resoluções1.2 
 
1º passo, determinar a dimensão da amostra. 100n = . 
 
2º passo, determinar a profundidade da mediana. ( ) 1 100 1 50,5
2 2
n
prof M
+ +
= = = . 
 
3º passo, determinar a mediana. ( )
50 51 996 996 996
2 2prof M
x x
M x
+ +
= = = = . 
 
4º passo, determinar os quartis: 
 
( )
( ) 1 50 1
25,5
2 2
prof M
prof F
+� � +� �= = =
 
 
( )
25 26 883 895 889
2 2L L L Lprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
 
( )
' '
' 25 26 1118 1106 1112
2 2U U U Uprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
 
 
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
 
Dispersão Quartal - 1112 889 223U LdF F F= − = − = . 
 
Barreiras de Outliers Inferior - X X 1,5 889 1,5 223 554,5LF dF = − =− 
Barreiras de Outliers Superior - X X 1,5 1112 1,5 223 1446,5UF dF = + =+ 
 
 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (1 446,5): 0 
Dados inferior a barreira inferior (554,5): 1, e é 521 
 
 
 
Vou verificar se o Outliers existente se é Moderado ou Severo (só vou a procura do 
lado inferior): 
 
Barreiras de Outliers Severo Inferior - X X 1,5 889 3 223 220LF dF− = =− 
 
Dados Outliers Severo Inferior (220): 0 Ou seja, existem 1 Outliers mas é 
Moderado. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 180/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Agora Diagrama Caixa com Bigodes: 
 
 
 
 
 
 
Resoluções1.3 – 
Nota: não confundir a soma dos quadrados e o quadrado das somas. 
 
 
Soma dos Quadrados: 
2
1
n
i
i
X
=
� e o Quadrado das somas é 
2
1
n
i
i
X
=
� �

 �
� �
� . 
 
Variância: 
 
( )
2
22 2 2
1 1
1 1 1 1
100 432 622 98 928
1 100 1 100
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
 � � �− − � �� �� �� �
� �
 
 
( )2 21 2 565 130,16 25 910, 41
99X X
s s⇔ = ⇔ =
 
 
Desvio Padrão:
2 25 910,41X X Xs s s= ⇔ = ⇔ 
160,97 161X Xs s⇔ = ⇔ ≈ 
 
 
Agora vou elaborar uma tabela que me vai ajudar a tirar conclusões. Vou fazer 
como diz no enunciado para um desvio padrão e para dois desvios padrão. 
 
 
 
 
Aqui representei os dados do enunciado. Na 1ª linha tenho um desvio padrão e na 
2ª, tenho dois desvio padrão. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 181/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
Calculei depois o intervalo para cada um dos casos. Ou seja 990 161 829xX s− = − = 
 
Assim para um desvio padrão, os dados são: 
 
 
 
Com 1 desvio padrão 
 
 
Com 2 desvios padrões 
 
 
 
Assim acabo de preencher o resto da tabela: 
 
 
 
 
 
Conclusão: Como os valores obtidos são próximos das proporções esperadas, pode 
se concluir que os dados foram obtidos num modelo normal (Gausiano). 
Se observarmos o histograma e a caixa de bigodes, também se conclui que é 
bastante compatível com o modelo normal. A ligeira assimetria observada é devido 
a existência de um outliers. 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 182/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
2 - (4,5 valores) A determinação da resistência à ruptura de pedaços de soldadura é 
relativamente difícil, ao passo que é relativamente simples medir o diâmetro de uma secção de 
soldadura. Assim sendo, seria vantajoso se a resistência à ruptura de um pedaço de soldadura 
pudesse ser prevista a partir do seu diâmetro. Com base nos dados que se seguem, parece-lhe 
viável esta estratégia? 
 
Justifique com cálculos adequados. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1010 10
2
1 1 0
22 860 67 719 400 68 722 500i i i
i i i
X X X
= = =
= ∧ = ∧ =� � ∏
 
 
10 10
2
1 1
23 250 69 742 500i i
i i
Y Y
= =
= ∧ =� �
 
 
 
 
 
 
 
Resolução – cuidado com a leitura, pois o “X” está trocado com o “Y”! A troca foi 
propositada, para aumentar o grau de dificuldade. 
 
 “ … seria vantajoso se a resistência à ruptura (y) de um pedaço de soldadura pudesse 
ser prevista a partir do seu diâmetro.” 
 
 
Deve se ler: “ … seria vantajoso se a resistência … pudesse ser prevista a partir do seu 
diâmetro (x).” 
Resistência à 
ruptura 
 
(X) 
 
Diâmetro 
 
 
(Y) 
 
370 400 
780 800 
1210 1250 
1560 1600 
1980 2000 
2450 2500 
3070 3100 
3550 3600 
3940 4000 
3950 4000 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 183/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Assim os dados estão trocados: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
10 10
2
1 1
22 860 67 719 400i i
i i
Y Y
= =
= ∧ =� �
 
 
10 10
2
1 1
23 250 69 742 500i i
i i
X X
= =
= ∧ =� �
 
 
( )
1
Soma dos Produtos 68 722 500
n
i i
i
X Y
=
→ =�
 
 
 
Assim o que é pedido: é possível prever “Y” a partir de “X”, através da relação linear? 
 
�Y aX b= + 
 
 
 
O que me é perguntado na realidade se a equação da recta (RMQ) é de confiança. Para poder 
responder existe dois pressupostos de diferente resolução, mas que provam o mesmo, que é ou 
pelo Coeficiente de Correlação Linear ou pelo resíduo. Vou começar pelo primeiro: 
 
 
Vou recordar teoria do Coeficiente de Correlação Linear: o coeficiente de correlação linear 
é uma medida do grau de associação entre variáveis. Esta medida toma valores entre -1 e 1. 
Quando se mede a correlação entre variáveis, 1 significa uma relação linear perfeita e positiva, 
enquanto -1 é também uma relação linear perfeita mas negativa. Valores próximos do zero 
para o coeficiente de correlação linear indicam uma associação linear pobre entre variáveis. 
O coeficiente de correlação amostral de Pearson r da amostra bivariada ( ){ }
1
;
n
i i i
x y
=
 é: 
 
Resistência à 
ruptura 
 
(Y) 
 
Diâmetro(X) 
 
370 400 
780 800 
1210 1250 
1560 1600 
1980 2000 
2450 2500 
3070 3100 
3550 3600 
3940 4000 
3950 4000 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 184/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
 � 
 �
� � � �� � � �� � � �
� � �
� � � �
 
 
 
 
Assim no exercício faz-se: 
 
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
 � 
 �
� � � �� � � �� � � �
� � �
� � � �
 
 
 
10 10 10
1 1 1
2 210 10 10 10
2 2
1 1 1 1
10
10 10
i i i i
i i i
i i i i
i i i i
X Y X Y
r
X X Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
 � 
 �
� � � �� � � �� � � �
� � �
� � � �
 
 
 
( ) ( ) ( )
( ) ( ) ( ) ( )2 2
10. 68 722 500 23 250 . 22 860
10. 69 742 500 23 250 10. 67 719 400 22 860
r
−
=
� � � �− −
� � � � 
 
 
[ ][ ]
687 225 000 531 495 000
687 225 000 540 562 500 677 194 000 522 579 600
r
−
=
− −
 
 
 
 
0,9999717885r = 
 
 
 
Tendo obtido um 0,9999717885r = , posso concluir que existe uma correlação quase perfeita 
entre as variáveis, pelo que os dados são muito encorajadores quanto a possibilidade de se 
poder estimar a resistência dos pedaços de soldadura com base no seu diâmetro. 
 
 
 
Assim é possível prever “Y” a partir de “X”, através da relação linear. 
 
�Y aX b= + 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 185/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Teorema Recta dos Mínimos Quadrados (RMQ): Se os pontos da amostra bivariada 
( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a recta dos mínimos quadrados que modela essa 
relação é � �Y aX b= + , com: 
 
 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
Observação: Para calcular o coeficiente de correlação e a recta dos mínimos quadrados, basta 
dispor em colunas 
 
Abcissas Ordenadas 
Quadrados 
das abcissas 
Quadrados das 
ordenadas 
Abcissas X 
Ordenadas 
ix iy 
2
ix 
2
iy i ix y 
 
e no fim somar. 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 186/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
 � 
 �
� � � �
� � � � � � �
� � � �
 
 
 
 
( ) ( ) ( )
( ) ( )2
10. 68 722 500 23 250 . 22 860
1,00721536
10. 69 742 500 23 250
a a
−
= ⇔ =
−
 
 
 
( ) ( ) ( ) ( )
( ) ( )2
69 742 500 . 22 860 22 860 . 68 722 500
22,5056657
10. 69 742 500 23 250
b b
−
= ⇔ =
−
 
 
 
 
 
� � ( ) ( )1,00721536 22,5056657Y aX b Y X= + ⇔ = + 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 187/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Grupo II 
 
Responda a apenas uma das perguntas seguintes, 3 ou 4. 
 
3 - (3 valores) Suponha que ao transcrever uma amostra de números ( )1 2, ,..., nx x x x= ocorre 
um erro no primeiro valor, passando-se à amostra alterada ( )1 1 2' , ,..., nx x x xx+ ∆= . 
Escrevendo a nova variância como 2 2' ,s s= + ∆ mostre que o erro ∆ produzido pela alteração 
será de: 
( ) ( )
2
11
12 . 1
xx
x X
n n
∆∆
∆ = − +
−
 
 
 (Sugestão: desenvolva o numerador da variância, pondo de parte o termo correspondente à 
observação que foi alterada.) 
 
 
Resolução – quer-se provar que 2 2' .s s∆ = − 
 
( )1 2, ,... nX x x x= 
( )1 21,' ,... nX x x x x+= ∆ 
 
 
Calculo Auxiliar 1: 
É necessário perceber se que 
1
( ) 0
n
i
i
X X
=
− =� , pois os valores (somados) que estão acima de 
X é o mesmo que estão abaixo. Logo a sua soma dá zero. 
Não é pedido no exercício, mas vou tentar explicar o porquê de se usar a variância para depois 
se calcular o valo do desvio padrão. 
 
1 1 1
( )
n n n
i i
i i i
X X X X
= = =
− = −� � � 
 
Sei que X é uma constante, logo pode sair de dentro do somatório, pois não irá contribuir 
para o somatório, e aproveito para multiplicar o 1º termo por um 1
n
n
� �

 �
� �
= : 
 
1
1 1
( ) 1
n
in n
i
i
i i
X
X X
n
n
X=
= =
− = −
�
� � 
Sei que: 1
n
i
i
X
X
n
==
�
, e a soma continua de 1 é 
1
1
n
i
n
=
=� , logo, 
1
( )
n
i
i
X X nX Xn
=
− = −� 
 
1
( ) 0 c.q.d.
n
i
i
X X
=
− =� 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 188/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Poderia ter ido pelo fim, que também dava: 
 
1 1 1
( )
n n n
i i
i i i
X X X X
= = =
− = −� � � 
 
1 11
( 1)
n n
i i
i i
n
i
X X X X
= ==
− = −� � � 
 
Nota que 
1
1
n
i
X
=
� , é igual a somar “n” uns seguidos, o que vai dar “n”.
 
 
1
1 1
( )
n
in n
i
i i
i i
X
X X X
n
=
= =
− = −
�
� � .n
1 1
( )
n n
i i
i i
X X X
= =
⇔ − =� �
1
n
i
i
X
=
−� 
 
1
( ) 0 c.q.d.
n
i
i
X X
=
− =� 
 
 
Essa é a razão pela qual se utiliza a variância para se calcular o desvio padrão, pois é sempre 
um número positivo. 
2
2 1
( )
1
n
i
i
X X
s
n
=
−
=
−
�
 
 
 
 
Nota: a multiplicação pelo coeficiente 
1
1n −
 serve para anular a repetição pela técnica 
utilizada de se elevar ao quadrado, por ser 2( )iX X− 
 
 
 
 
 
 
Calculo Auxiliar 2: 
Agora vou demonstrar que 
2
2
2 1
1 1
( )
1
.
1
1 1
n
in n
i
i i
i i
X X
X X
n nn
=
= =
−� �� �
− =� �
 � −� �� �� �−
�
� � . 
 
( )
Desenvolvimento do binómio
2 2 2
1
2
1
1
( ) 2
( )
1 1
. .
1 1 1
n n
i i
n
i
i
i
i
i
X X
X X X
n n n
X X X
=
=
=
− � �
� �= = =
− − − � �
�
− − +
�
�
�
�
��������������
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 189/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
( ) ( ) ( )2 2
1 1 1
1
. 2
1
n n n
i i
i i i
X X X X
n = = =
� �
= + − + =� �− � �
� � � 
 
 
Sei que X é uma constante, logo pode sair de dentro do somatório, pois não irá contribuir 
para o somatório: 
( ) ( ) ( )2 2
11 1
1
. 2
1
1
n n
i i
i i
n
i
X X X X
n = ==
� �
= − + =� �− � �
� �� 
 
A soma continua de 1 é 
1
1
n
i
n
=
=� , assim: 
 
( )
( )
2 21
1
1
2
1
.. .
n
in
i
i
i
n
n
X
X X X n
n
=
=
� �
� �
� �= − + =
− � �
� �� �
�
� 
 
Sei que 1
n
i
i
X
X
n
==
�
, 
 
( ) ( )2 2 2 2
1
2
1
1 1
. 2 . .
1
. 2 .
1
n n
i i
i i
XnX X X n X X X
n
n n
n = =
� � � �
= − + = − + =� � � �− −� � � �
� � 
 
 
( ) ( )2 2
1 1
sei que ...
1 1
2
21 1. .
1 1
n n
i i
i
n
i
n
i i
i i
X X X n
X X
nn n
X n
n
=
= =
=
� �� � � �
� �
 � 
 �� � � �
 � 
 �= → = → − =� � � �− −
 � 
 �� �
� �
 � 
 �
� � � �
−
� �
� �
� �
�������
 
 
 
( ) ( )
2 2
2 2
1 1 1 1
2
1 1 1
. . c.q.d.
1 1
n n n n
i i i i
i i i i
n
X X X X
n n nn= = = =
� � � �� � � �
= − = −� � � �
 ��− −� � � �� � � �� � � �
� � � � 
 
 
 
Ter em atenção de que o “n” quando sai para fora do quadrado, traz o quadrado. 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 190/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Calculo Auxiliar 3: 
 
1 1
1 1
2
1
12
1
1
' ' ' '
'
' '
i i
n n n n n
i i i i
i i i
iX X X X X X X
X
n n n n n
X
X
n
X
= == ==
+ + +
= = = = = +
+ ∆ ∆
∆
=
� � � � �
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1'
X
X X
n
∆
= +
 
 
 
Agora com este conceitos recordados, vou resolver o exercício: 
 
( ) ( )2
2 112
2
'
1 1
' '
n n
ii
ii
X XX X
s s
n n
==∆ = − =
−−
= −
− −
��
 
 
( ) ( ) ( ) ( )2
2
2
1
2
2
1
2
' ' '
1 1
'
n
i
ii
n
iX X X X X X X
n n
X
= =
− − − −
∆ = − =
−
+ +
−
� �
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 191/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
No calculo auxiliar 3, fiquei a saber que 1 1 1'X X X= + ∆ , 
1'
X
X X
n
∆
= + 
 
( ) ( )
2 2
2 2
1
2 2
1
1
1
1
1 1
n n
i i
i i
X X
X X
X X X X
n n
X XX
n n= =
∆ ∆� � � �+ +
 � 
� � � �
− + − − + −
 � 
 �
�
�
� �� � �∆ = − =
−
�
∆
�
+
−
� �
 
 
 
Agora, muito cuidado com os sinais: 
 
( ) ( )
2 2
2 2
1 1
1 1 1
2 2
1
n n
i i
i i
X X
X X X X X X X X X
n n
n
= =
∆ ∆� � � �+ ∆ − + − − − −
 �− 
 �
� � � �∆
−
= =
−
−
� �
 
 
 
Agora vou agrupar de modo a me dar jeito: 
 
( ) ( ) ( ) ( )
2
1
1 1
1
2
2
2
2
2
1
1
n n
i
i
i
i
XX
X X X
n
X X X X X
n
n
X
= =
� ∆ �� �− + ∆ −
 �
 �
�
−+ − −
∆
∆� �− −
 �
�=
−
�� � =�
−
��
 
 
 
Agora vou desenvolver os quadrados: 
 
( )21X X
∆ =
− ( )
2
1 1
1 1 1 ...
1
2
X X
X
n n
n
X X X
∆ ∆� � � �+ − ∆ − + ∆ −
 �
�
+
 �
� �
−
� 
 
( ) ( ) ( )
2
2 2
1
1 1
2
... 2
n
i i
i
X X
X XX X X X
n n=
� �∆ ∆� �− − − +
 �
 �
 ��
+ −
� �
−
�
� ( )
2
2
1
n
i
i
X X
n
=
−−
−
�
 
 
 
 
Agora vou desenvolver o somatório a azul: 
 
( )
2
1 1
1 1 12 ...
1
X X
X X X X
n n
n
∆ ∆� � � �− ∆ − + ∆ − +
 � 
 �
� � � �∆ =
−
 
 
( )2
2
...
n
i
i
X X
=
−+ � ( ) ( )
2
1 1
2
2 22
2
n
i
i
n n
i
i i
X X
X X
n n
X X
== =
∆ ∆� � � �+ − − +
 � 
 �
� �
− −
� �
� � �
1n −
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 192/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou desenvolver os produtos e os quadrados: 
 
( ) ( ) ( )
22
1
1 1
2
1
11
1
1
2 2
1
12 2
1
2 2
n n
i
i i
X X
X X
n n
XX X
X
n
X XX
n
n
X X X
n = =
� � � �∆ ∆� � � � � �+ + − − +� � � �
 � 
 �� �� � � � � ��
∆
− ∆∆
� � �� � � �∆
∆
− −
∆� �+
 �
� �
=
∆
−
− � �
 
 
 
Vou pôr fora dos somatórios as constantes: 
 
( ) ( ) ( )
2 2
21 1 1 1
1 1 1 1 1
22
12 22 2
1
n
i
i
n
i
X X X X
X X X X X X X
n
X
X
n n n
X
n
n = =
∆ ∆ ∆ ∆� � � �− ∆ − − + ∆ − ∆ + +
 � 
 �
�
∆
−
�
−
� �∆ =
−
� �
 
 
 
Calculo auxiliar: 
( ) ( ) ( ) ( ) ( )1
1 2 2
10 0
n
i
n n
i i
i ii
X X X XX X X X X X
= ==
− = ⇔ − + = ⇔ =− − − −�� �
 
 
Então fica: 
 
( ) ( ) ( )( )
2 2
21 1 1 1 1
1 1 1 1 1
2
12 2 2 2
1
n
i
X X X X X
X X X X X X X
n n n
X
n
n
X
n =
∆ ∆ ∆ ∆ ∆� � � �− ∆ − − + ∆ − ∆ + − +
 � 
 �
� �
−
� �
−
∆ =
−
�
 
 
 
( ) ( ) 11 1 12 2
X
X X X X X
n
∆
− ∆ − −
∆ =
( )
2
2 1 1 1
1 1 12 2
X X X
X X X X
n n n
∆ ∆ ∆� �+ ∆ − ∆ + 
�
+ −�
�
2
1
2
1
n
i
X
n
n
=
∆� �+ 
 �
� �
−
�
 
 
( )
2 2
2 1 1 1
1 1 1 1
2
2 2
1
n
i
X X X
X X X X X
n n n
n
=
∆ ∆ ∆� � � �− ∆ + ∆ − ∆ + +
 � 
 �
� � � �∆ =
−
�
 
 
Sei que ( ) ( ) ( )
22 2
11 1
2
2
1 1
n
i
XX X
n n
n n n=
∆∆ ∆� � � �
= − = −
 � 
 �
� � � �
� 
 
 
Assim: 
( ) ( ) ( )11
2
1
1 1
2
1
2
2
1 22
1
1
X
n
n
X
X
n n
X X X X
X
n
− ∆ + ∆ +
∆� �

 � +
∆
∆
� �
∆
−− ∆
=
−
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 193/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
( )
2
1
2
1
1 2
2
1 12 2
nX
n
X
n
X X
X
X
∆
−− ∆ + ∆ +
∆
∆
+
=
( )21
2
X
n
∆ ( )21
2
1
X
n
n
−
−
∆
 
 
( )
2
2
1
1
1 2
2
1
1 22
X
X X
n
X X
n
X∆
−
∆
− ∆ + ∆ +
∆ =
2
1
2
2
1X
n
X
n
∆
−
∆
+
1n −
 
 
( ) ( )
2
22 1
1 11 1 11
22
1
1
1
1
X XX
nn
X X XX X X
n n
− ∆ +− ∆ +
∆ = ⇔ ∆ =
� �∆ ∆ −∆ − 
 �
� �
− −
 
 
( ) ( )
2 2
1 1
1 1 1 12 2
1 1 1 1
1 1
X XX X X X X X
n n n n
n n
n n n
∆ ∆− ∆ − ∆
⇔ ∆ = + ⇔
−� � � �−
 � 
 �
� � �∆ = + ⇔
− − − −
� 
 
 
 
( )
( )211
1
1
2
1
X nX
X X
n
∆ −∆
⇔ ∆ = − +
− ( )1n n −
( ) ( )
2
11
12 . 1
. . .
xx
x X
n n
c q d
∆∆
∆ = − +
−
⇔ 
 
 
 
 
 
 
4.1 - (1 valor) Escolhe-se ao acaso um dos primeiros inteiros, { }0, 1, ... , , n com igual 
frequência para todos, 0 1 np p ... p p.= = = = Qual tem de ser a probabilidade p? 
 
4.2 - (2 valores) Discuta se será possível escolher ao acaso um elemento do conjunto de todos 
os números naturais, { }, 2, ... , , ... ,N l n= de modo que cada um tenha igual probabilidade p 
de ser o valor escolhido. (Sugestão: Procure perceber qual teria de ser o valor de p, nestas 
condições). 
 
 
Resolução 4.1 – cuidado com a leitura, pois se for mal interpretado, começa se logo mal! 
É n+1. Vai se ver. 
Teoria: 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 194/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
 
 
 
 
Usando o axiomática de Kolmogorov, tem se que: 
 
( ) ( )1 Axioma 1 1p AΩ = → 
( ) ( )0 Axioma 2 2p A A≥ → 
( ) ( ) ( ) ( ) 3 3p A B p A p B se A B Axioma A∪ = + ∪ = ∅ → 
 
Assim: { }( ) { } { } { } { }( )0,1,2,..., 1 0 1 2 ... 1p n p n= ⇔ = ⇔� � � 
 
Usando o axioma 3 (A3) { }( ) { }( ) { }( ) { }( )0 1 2 ... 1p p p p n⇔ + + + + = ⇔ 
 
0 1 2 ... 1 ... 1np p p p p p p p⇔ + + + + = ⇔ + + + + = 
 
Assim tenho 
1
1
p
n
=
+
 
Resolução 4.2 – o valor de p deveria ser zero, mas também por outro lado: ( ) 1.p =� 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 195/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
{ }( ) { } { } { }( )1,2,..., 1 1 2 ... 1p n p n= ⇔ = ⇔� � 
 
Usando o axioma 3 (A3) { }( ) { }( ) { }( )1 2 ... 1p p p n⇔ + + + = ⇔ 
 
0 1 2 ... 1 0 0 0 ... 0 1 . .np p p p P F⇔ + + + + = ⇔ + + + + = 
 
 
. .P F - Preposição Falsa. 
 
 
Se ,p a= com “a” muito próximo de zero (mas diferente de zero), então poderia afirmar
( ) 1.p =� Pois se tiver “a” muito próximo de zero, mas diferente de zero teria: 
 
... 1 . .a a a a PV+ + + + = 
 
Também sei que 
1
1
n
a
+∞
=
= →� como é 0,≠ é porque é divergente. 
 
Logo não existe, pois por mais pequeno que seja o número, a sua continua soma, é maior do 
que um. Não é possível escolher um elemento do conjunto � de modo a que cada um tenha a 
mesma probabilidade de p de ser o valor escolhido. 
 
 
 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 196/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Frequência: 2009/02/02 
 
Duração:2 horas. 
 
Se vem fazer exame da 1ª parte, responda a três das quatro alíneas. 
Se vem fazer exame da 2ª parte, responda a quatro das cinco alíneas. 
Se vem fazer exame completo, responda a duas alíneas da 1ª parte e a três da 2ª 
Nas perguntas de escolha múltipla, indique apenas a opção correcta. 
 
 
1ª Parte 
 
1 - Os diagramas de caule e folhas seguintes representam as notas que os alunos que já 
passaram em Probabilidade e Estatística este ano tiveram nas duas frequências. Os valores 
foram primeiro arredondados às unidades e depois ordenados. 
 
1ª Frequência: 
1155 ; x 10
5
n = 
2 0U 8 9 
7 1L 0 1 1 1 1 
15 1T 2 2 2 2 2 3 3 3 
(16) 1F 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5 
24 1S 6 6 6 7 7 7 7 7 7 7 7 
13 1U 8 8 8 8 9 9 9 9 9 9 9 
2 2L 0 1 
 
 
 
2ª Frequência: 
1155 ; x 10
5
n = 
14 0U 8 8 8 8 8 8 8 8 8 8 9 9 9 9 
23 1L 0 0 0 0 0 1 1 1 1 
(12) 1T 2 2 2 2 2 2 2 2 2 3 3 3 
20 1F 4 4 4 4 4 4 4 5 5 
11 1S 6 6 7 7 7 
6 1U 8 9 9 9 9 
1 2L 0 
 
 
 
1.1 Faça caixas com cinco letras resumo para as notas em cada frequência e identifique 
eventuais outliers. Comente a distribuição desta variável nas duas situações, referindo-se à 
localização, à dispersão e à simetria. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 197/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
1.2 Encarando cada linha do diagrama corno uma classe [ [(1ª 7,5; 9,5 ,= [ [2ª 9,5;11,5 ,= 
[ [ )3ª 11,5; 13,5 , . ,etc= escreva a tabela de frequências completa para os dados agrupados da 
2ª prova, e aproveite-a para calcular a média e o desvio padrão agrupados. 
 
 
 
 
Resolução 1.1 - ( ) 55 1Média Prof 28
2
M
+
→ = =
 
 
( ) 28 15prof MM x M x M= ⇔ = ⇔ = 
 
Dispersão quartal: 
( )
( )Prof 1
Quartis Prof 14,5
2
M
Q
+� �� �→ = =
 
 
( )
14 15 13
2L L Lprof F
x x
F x F F
+
= ⇔ = ⇔ =
 
( )
' 14 15' ' 17
2U U Uprof F
x x
F x F F
+
= ⇔ = ⇔ =
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
 
Dispersão Quartal - 17 13 4U LdF F F= − = − = . 
 
Barreiras de Outliers Inferior - X X 1,5 13 1,5 4 7LF dF− = − = 
Barreiras de Outliers Superior - X X 1,5 17 1,5 4 23UF dF+ = + = 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (23): 0 
Dados inferior a barreira inferior (7): 0. 
 
Posso concluir que não tem outliers. 
 
Agora Diagrama 5 letras: 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 198/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Para 2ª Frequencia – 
 
( ) 55 1Média Prof 28
2
M
+
→ = =
 
 
( ) 28 12prof MM x M x M= ⇔ = ⇔ = 
 
 
 
Dispersão quartal: 
( )
( )Prof 1
Quartis Prof 14,5
2
M
Q
+� �� �→ = =
 
 
( )
14 15 9 10 9,5
2 2L L L Lprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
 
( )
' 14 15' ' 14
2U U Uprof F
x x
F x F F
+
= ⇔ = ⇔ =
 
 
 
Agora vou determinar a dispersão quartal e as barreiras de Outliers: 
 
Dispersão Quartal - 14 9,5 4,5U LdF F F= − = − = . 
 
Barreiras de Outliers Inferior - X X 1,5 9,5 1,5 4,5 2,75LF dF = − =− 
Barreiras de Outliers Superior - X X 1,5 14 1,5 4,5 20,75UF dF = =+ + 
 
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados 
inferior a barreira inferior: 
 
Dados superior a barreira superior (20,75): 0 
Dados inferior a barreira inferior (2,75): 0. 
 
 
Posso concluir que não tem outliers. 
 
 
 
(Falta os diagramas de caixa de bigodes e comentar, mas estou sem vontade…) 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 199/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Resolução 1.2 – Cuidado, pois aqui é a Mediana Agrupada. Usa o meio da Classe (mi): 
 
O símbolo desta Mediana Agrupada, tem um til, e o ideal é ser o mais próximo da Mediana. 
 
� .i im nX
n
≈ � , e para poder continuar, vou precisar de fazer a respectiva tabela: 
 
 
 
Cuidado, pois o “ im ” só interessa para o calculo e não para a contagem. Para a contagem é o 
intervalo da classe. 
 
 
� �. 14.8,5 9.10,5 12.12,5 9.14,5 5.16,5 5.18,5 1.20,5
55
i im nX X
n
+ + + + + +
≈ ⇔ ≈ ⇔�
 
� 12,54X ≈ 
 
 
Como se pode verificar no exercício 1.1 é muito próximo de ( )12,4X . 
1 682 12,4
55
n
i
i
X
X X X
n
== ⇔ ⇔ = ⇔ =
�
 
 
 
( ) ( )
2
22 2 2
1 1
1 1 1 1
9263,75 989,5
1 54 55
n n
i i i i
i i
s m n m n s
n n= =
� �� � � �= − ⇔ = − ⇔� �
 � � �− � �� �� �� �
� � 
 
2 11,48 3,388s s⇔ = → = 
 
 
ix im in iN if iF 
 
1 ] ] 7,5 ; 9,5 8,5 14 14 0,25 0,25 
2 ] ] 9,5 ; 11,5 10,5 9 23 0,16 0,42 
3 ] ] 11,5 ; 13,5 12,5 12 35 0,22 0,64 
4 ] ] 13,5 ; 15,5 14,5 9 44 0,16 0,80 
5 ] ] 15,5 ; 17,5 16,5 5 49 0,09 0,89 
6 ] ] 17,5 ; 19,5 18,5 5 54 0,09 0,98 
7 ] ] 19,5 ; 21,5 20,5 1 55 0,02 1 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 200/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
2 - Abaixo está um diagrama de dispersão com os resultados dos 48 n = alunos que fizeram 
ambas as provas, tendo ou não sido aprovados. 
 
 
 
 
Que género de relação lhe parece haver entre as notas nas duas frequências? Baseie a sua 
resposta numa análise do gráfico, e quantifique-a também calculando uma medida de 
associação adequada. 
 
 
Use as seguintes somas: 
1
1 945
n
i
i
X
=
=� ; 
1
1 065
n
i
i
Y
=
=� ; 
1
15 131,14
n
i i
i
X Y
=
=� ; 
 
 
2
1
27 448,73
n
i
i
X
=
=� ; 2
1
11 025,35
n
i
i
Y
=
=� . 
 
 
 
O facto de a maioria dos pontos se encontrarem abaixo da diagonal tem uma interpretação 
pertinente, neste caso - qual? 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 201/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
1º - Interpretar o gráfico: 
 
 
 
No ponto “A”, o aluno tirou 3,5 valores na 1ª frequência, e 11 valores na 2ª. 
 
 
 
Se eu traçar uma diagonal, 
 
 
 
 
 
Pronto agora estou pronto para interpretar o gráfico: 
Não é do género linear, nem logaritmica. Medida de associação inadequada: r = 0,45 (o ideal é 
1). Posso por isso afirmar que existe uma fraca associação entre as duas variáveis. 
 
 
 
Está ainda incompleto, pois estou sem pachorra… 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 202/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
Regra do Produto 
 
 
Definição: Seja S um conjunto de resultados associado a uma experiência aleatória. 
Sejam A e B dois acontecimentos, com ( ) 0p B ≠ . A probabilidade para que A se realize, 
sabendo-se que B se realizou, designa-se por ( )|p A B e define-se pelo quociente, 
 
( ) ( )
( )
p A B
p A B
p B
∩
= 
 
A probabilidade de A, condicionada pela realização de B (ou a probabilidade de A 
sabendo se B), que acaba de definir-se, representa a reavaliação da probabilidade de A 
em face da informação de que B se realizou. 
 
Definição: Seja S um conjunto de resultados associado a uma experiência aleatória e 
sejam A e B dois acontecimentos. Dizemosque A e B são independentes se e só se 
 
( ) ( ) ( ) x p A B p A p B∩ = 
 
 
Consequência: Invertendo a expressão 
( ) ( )
( )
p A B
p A B
p B
∩
= 
 
Obtém-se a regra do produto: 
( ) ( ) ( ) x |p A B p B p B A∩ = 
 
 
 
 
Teorema: De um modo geral, a regra do produto é dada por: 
 
 
( ) ( ) ( ) ( ) ( )1 2 3 1 2 1 3 1 2 1 2 3... x | x | x ... x | ...n n np A A A A p A p A A p A A A p A A A A A∩ ∩ ∩ ∩ = ∩ ∩ ∩ ∩ ∩
 
 
 
Teorema da Probabilidade Total: Seja Ω um espaço amostral associado a uma 
experiência aleatória qualquer. Se os n acontecimentos 1 2 3, , ,..., nB B B B de ( )P Ω são 
incompatíveis dois a dois, isto é, não existem dois que sejam compatíveis, e 
1 2 3 ... nB B B B = Ω� � � � então para qualquer acontecimento A de ( )P Ω tem-se que: 
 
( ) ( ) ( ) ( ) ( )1 2 3 ... + np A p B A p B A p B A p B A= ∩ + ∩ + ∩ + ∩ 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 203/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
Exercícios sobre a Regra do Produto 
 
 
 
 
1 - No lançamento de um dado perfeito, qual é a probabilidade de o número obtido ser 
6, sabendo que se obteve um 
 
1.1. Número par? 
1.2. Número ímpar? 
1.3. Múltiplo de 3? 
 
 
Resolução: 
 
1.4 - ( ) ( ) 1 numero 6 1ser o numero 6 | sendo par |
3 numeros pares 3
p p A B= = = 
 
1.5 - ( ) ( ) 1 numero 6ser o numero 6 | sendo impar | 0
não é impar
p p A B= = = 
 
1.6 ( ) ( ) 1 numero 6 1ser o numero 6 | sendo multiplo de 3 |
3 ou 6 2
p p A B= = = 
 
 
 
 
2 - Uma urna contém duas bolas verdes e três azuis. Tiram-se sucessivamente duas 
bolas sem reposição. Sabendo que a primeira bola é azul, qual é a probabilidade de que 
a segunda bola seja: 
 
2.1. Verde? 
2.2. Azul? 
 
Resolução: 
 
Nota: 1V representa a 1ª vez que é retirado uma bola, e 2V a 2ª vez. 
 
2.1 - ( )1 2
2 (numeros possiveis de sair a bola certa) 1
4 (numero totais de bolas ainda existentes) 2
p V V = = 
 
2.2 - ( )1 2
2 (numeros possiveis de sair a bola certa) 1
4 (numero totais de bolas ainda existentes) 2
p V V = = (é igual!) 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 204/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
3 - Extrai-se, ao acaso, uma bola de uma caixa que contém vinte bolas numeradas de 1 
a 20. Considere os acontecimentos: 
 
A: "a bola extraída tem um número par"; 
B: "a bola extraída tem um número múltiplo de 5". 
 
Indique o valor da probabilidade condicionada ( )|p B A . 
 
Sugestão: nos exercícios 1, 2 e 3 utilize a regra de Laplace. 
 
 
Resolução: 
 
( )p B A , em que o B representa os números múltiplos de 5, mas do lote de A, e o A 
representa os números pares. 
 
Ora de 1 a 20, tem se 10 números pares, e destes apenas dois são múltiplos de 5. Assim fica: 
 
( ) 2 1 0,2
10 5
p B A = = = 
 
 
 
 
4 - Dos acontecimentos A e B sabe-se que: 
 
( ) 3
10
p A = e ( ) 7
10
p A B =� 
 
Calcule ( )p B sabendo que A e B são independentes. 
 
 
Resolução: vou recordar algumas regras: 
 
 A e B são incompatíveis se, e só se, (conjunto vazio)A B = ∅� 
 A e B são contrários se, e só se, (Universo)A B S=� 
 A e B são independentes se, e só se, ( ) ( ) ( ) x p A B p A p B=� 
 
( ) ( ) ( ) ( ) + - p A B p A p B p A B=� � 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 205/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
A azul está representando elementos que entra nos dois grupos, e é por isso que existe o 3º 
termo do 2º membro. Ou seja para anular a repetição da contagem dos elementos que já 
foram contados. 
 
( ) ( ) ( ) - p A B p A p A B− = � 
 
 
Quando afirmo que são independentes, significa que o 2º resultado não depende do resultado 
obtido da 1ª, e assim escrever a seguinte equação: 
 
( ) ( ) ( ) x p A B p A p B∩ = 
 
Assim para resolver o exercício, e depois de analisar as três pistas dadas: 
 
- ( ) 3
10
p A = , ( ) 7
10
p A B =� , e A e B serem independentes. 
 
 
( ) ( ) ( ) ( )7 7 + - 
10 10
p A B p A p B p A B= ⇔ = ⇔� �
 
 
 
Sei o valor de ( )p A , e como são independentes, então ( ) ( ) ( ) x p A B p A p B=� , fica: 
 
( )
�
( ) ( ) ( )
( )
3 7
 + - x 
10 10
p A B
p A
p B p A p B⇔ = ⇔
�
�������
 
 
( ) ( ) ( ) + - x 3 7
10 10
p B p Bp A⇔ = ⇔
 
 
 
( ) ( )� ( )
3
10
7 3 4
 
10 10 1
 . 1
3
10 0
 . p Ap B p B
� �
� �
⇔ − = ⇔ = ⇔� �
� �
−
� �� � 
 
 
( ) 4
7
p B = 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 206/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
5 - Prove que: Se A e B são acontecimentos independentes então A e B também o são. 
 
Resolução: 
( ) ( ) ( ) x p A B p A p B∩ = 
 
Para provar que ( ) ( ) ( ) x p A B p A p B∩ = , sabendo a representação do Universo: ( ) 1p s = . 
 
( ) ( ) ( ) ( ) ( )
( )
( )
�1
p S
p A A
p A A p S p A p A p A A= ⇔ + − = ⇔
�
� �
�����������
 
 
( ) ( ) ( ) ( )0 1 1p A p A p A p A⇔ + − = ⇔ = − 
 
Assim: ( ) ( ) ( ) ( ) ( ) ( )1 1p A B p A B p A B p A p B p A B∩ = = − = − + − =� �� �� � � 
 
( ) ( ) ( )1 p A p B p A B= − − + � como são independentes ( ) ( ) ( ) x p A B p A p B∩ = 
 
( ) ( ) ( ) ( )1 x p A p B p A p B= − − + = 
 
Aqui tenho que recordar da regra: ( )( )1 1 1a b ab a b− − + = − − , e assim fica: 
 
( ) ( ) ( ) ( ) ( )( ) ( )( )1 1 1p B p A p A p B p A p B− − + = − − 
 
Como sei que ( ) ( )1p A p A= − e ( ) ( )1p B p B= − 
 
Posso então afirmar que ( ) ( ) ( ) x p A B p A p B∩ = c.q.d. 
 
 
 
 
6 - Numa amostra constituída por 100 indivíduos obtiveram-se os resultados 
apresentados no quadro seguinte e aleatoriamente seleccionou-se um indivíduo ao 
acaso: 
 
 Com Bronquite Sem Bronquite 
Fumadores 40 20 
Não fumadores 10 30 
 
 
6.1. Diga, justificando, se os acontecimentos «ser fumador» e «ter bronquite» são 
independentes. 
 
6.2. Calcule a probabilidade de um indivíduo que é fumador ter bronquite. 
Resolução: 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 207/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução: 
 
6.1 - Para este exercício vou utilizar a regra dos abraços (expressão que se usa na gíria, pois 
matematicamente não dá para provar nada). Consiste em verificar se A x D = B x C. Se for 
verdade posso antever que são variáveis independentes. 
 
 
40x30 = 20x10 
 
É falso, não são independentes. Mas esta afirmação não tem qualquer significado 
matemático, apenas me ajuda a antever a resposta. Vou agora passar a provar 
matematicamente: 
 
Sei que ( ) ( ) ( ) x p F B p F p B=� , se forem independentes. 
Sei que ( ) 40 0,4
100
p F = = 
Sei que ( ) 60 0,6
100
p F = = 
Sei que ( ) 50 0,5
100
p B = = 
 
( ) ( ) ( ) ( ) ( ) x 0,6 x 0,5 0,3p F B p F p B p F B p F B= ⇔ = ⇔ =� � � 
 
Posso então concluir que ( ) ( ) ( ) x p F B p F p B≠� (não são independentes). 
 
 
 
6.2 - ( ) ter bronquite sendo fumadorp B F → : 
 
( ) ( )
( )
0,4 2
0,6 3
p B F
p B F
p F
= = =
�
 
 
 
 
 
 
 
7 - A probabilidade de um indivíduo A estar vivo daqui a 30 anos é 0.6 e a 
probabilidade de um outro indivíduo B estar vivo daqui a 30 anos é 0.7. Determine a 
probabilidade de daqui a 30 anos: 
 
7.1. Estarem vivos os indivíduos A eB; 
7.2. Não estarem vivos os indivíduos A e B; 
7.3. Estar vivo pelo menos um dos indivíduos. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 208/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução: 
 
Sei então que ( ) 0,6p A = e ( ) 0,7p B = , 
 
7.1 - ( ) ( ) ( ) x 0,6 0,7 0,42Xp A B p A p B= = =� 
7.2 - ( ) ( ) ( ) ( ) ( ) x 1 0,6 1 0,7 0,12Xp A B p A p B= = − − =� 
7.3 - ( ) ( ) ( ) ( ) + - 0,6 0,7 0,42 0,88p A B p A p B p A B= = + − =� � 
 
 
 
8 - O João frequenta a Escola Secundária da cidade próxima do local onde vive. 
Diariamente, tem duas possibilidades para ir às aulas: de comboio ou de autocarro. 
Como prefere o autocarro, 60% das vezes escolhe esse meio de transporte. 
Sabendo que a probabilidade de chegar atrasado às aulas é 22% e que a probabilidade 
de ir de autocarro e chegar atrasado é 12%, calcule a probabilidade de: 
 
8.1. Chegar atrasado sabendo que veio de autocarro; 
8.2. Chegar atrasado ou ir de autocarro; 
8.3. Não chegar atrasado e não ir de autocarro; 
8.4. Ir de autocarro dado que chegou atrasado. 
 
 
 
Resolução: 
 
Sei então que ( ) 0,6p Auto = ( ) 0,4p Comboio = 
( ) 0,22p Atrasado = ( ) 0,12p Auto Atrasado =� 
 
 
8.1 - ( ) ( )
( )
0,12
/ 0,2
0,6
p Atrasado Auto
p Atrasado Auto
p Atrasado
= = =
�
 
 
8.2 - ( ) ( ) ( ) ( ) + - p Atrasado Auto p Atrasado p Auto p Atrasado Auto= − =� 
 
0,22 0,6 0,12 0,7= + − = 
 
 
8.3 - ( ) ( ) ( )1 - 1 0,7 0,3p Atrasado Auto p Atrasado Auto p Atrasado Auto= = = − =� � � 
 
 
 
8.4 - ( ) ( )
( )
0,12 6
/
0, 22 11
p Auto Atrasado
p Auto Atrasado
p Auto
= = =
�
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 209/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
9 - A distribuição dos 200 passageiros num avião é: 
 
 Homens Mulheres Crianças Total 
Portugueses 15 8 12 35 
Espanhóis 21 5 17 43 
Franceses 54 22 46 122 
Total 90 35 75 200 
 
Sai uma pessoa do avião. Qual é a probabilidade de: 
 
9.1. Ser uma criança espanhola? 
9.2. Ser portuguesa sabendo que é uma criança? 
9.3. Não ser portuguesa sabendo que é uma criança? 
 
 
Resolução: 
 
9.1 - ( ) ( ) 17
200
p Crianças Espanhola p C E= =� � 
 
Nota: não pode ser ( ) ( ) ( ) x p C E p C p E=� , pois não são independentes. 
 
9.2 - ( ) ( )
( )
12
12 16200 0,16
75 75 100
200
Condicionada
p P C
p P C
p C
= = = = =
�
�����
 
 
9.3 - ( ) ( )( )
75 12
63 21 84200 0,84
12 17 46 75 25 100
200Condicionada
p P C
p P C
p C
−
= = = = = =
+ +
�
�����
 
 
 
 
 
 
10 - Supondo que a probabilidade de uma pessoa ser morena é 0,65 e a probabilidade 
de ter os olhos verdes é 0,15. Determine a probabilidade de: 
 
10.1. Ser morena e ter olhos verdes; 
10.2. Ser morena ou ter olhos verdes; 
10.3. Três pessoas serem morenas. 
 
 
Observação: Neste exercício vai ter que considerar que os acontecimentos "ser 
moreno/a" e "ter olhos verdes" são independentes... 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 210/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Resolução: 
( ) 0,65 ( ) 0,15p M p V= ∧ = 
 
 
10.1 - 
( )
( ) ( ) x ( ) 0,65 x 0,15 0,0975
Acontecimento independente
está no enunciado
p M V p M p V∩ = = =������� 
 
10.2 - ( ) ( ) ( ) ( ) 0,65 0,15 0,0975 0,7025p M V p M p V p M V∪ = + − ∩ = + − = 
 
 
10.3 - 1 2 3 1 2 3( ) ( ) x ( ) x ( ) 0,65 x 0,65 x 0,65 0,27p M M M p M p M p M∩ ∩ = = ≈ 
 
 (são independente) 
 
 
 
11 - Num determinado país, 65% dos habitantes têm automóvel, 42% têm telemóvel e 
23% têm automóvel e telemóvel. 
 
Resolução: 
( ) 0,65 ( ) 0,42 ( ) 0,023p A p T p A T= = ∩ = 
 
 
11.1. Escolhido ao acaso um habitante deste país, qual é a probabilidade de ele não ter 
telemóvel nem automóvel? 
 
11.2. Um determinado habitante tem telemóvel. Qual é a probabilidade de ele ter 
também automóvel? 
 
Resolução: 
 
11.1 - ( ) ( ) 1 ( ) 1 ( ) ( ) ( )p A T p A T p A T p A p T p A T∩ = ∪ = − ∪ = − − + ∩ = 
 
( )1 ( ) ( ) ( ) 1 0,65 0, 42 0, 23 0,16 16%p A p T p A T= − − + ∩ = − − + = 
 
 
11.2 – ( ) ( )( ) 0, 23 23 0,548 55%
( ) 0,42 42
p A T
p A T
p T
∩
= = = = ≈ 
 
 
 
 
12 - Interrogaram-se os funcionários de uma empresa e concluiu-se que: 
• 80% têm telefone de rede fixa; 
• 60% têm telemóvel; 
• 5% não têm qualquer tipo de telefone. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 211/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
12.1. Seleccionando ao acaso um trabalhador daquela empresa, qual é a probabilidade 
de ele ter telefone de rede fixa e telemóvel? 
12.2. Encontrou-se um funcionário que tinha telemóvel. Qual é a probabilidade de ele 
ter telefone de rede fixa? 
 
Resolução: 
( ) 0,8 ( ) 0,6 ( ) 0,05p F p M p F M= = ∩ = 
 
12.1 - ( ) ( ) ( ) ( ) ( ) ( ) 1 (p F M p F p M p F M p F p M p F M� �∩ = + − ∪ = + − − ∪ =� � 
 
( )( ) ( ) 1 ( ) 0,8 0,6 1 0,05 0,45 45%p F p M p F M= + − + ∩ = + − + = 
 
 
12.2 - ( )( ) 0,45 3( / ) 0,75 75%
( ) 0,6 4
p F M
p F M
p M
∩
= = = =
 
 
 
 
13 - Sendo A e C dois acontecimentos tais que ( ) 0p C ≠ , prove que: 
( ) ( )| | 1.p A C p A C+ = 
Resolução: 
 
( ) ( )
( ) ( ) 1 1
( ) ( )
p A C p A C
p A C p A C
p C p C
∩ ∩
+ = ⇔ + = ⇔ 
 
 
 
( ) x ( )p A p C
⇔
( )p C
( ) x ( )p A p C
+
( )p C
1 ( ) ( ) 1 . . .p A p A c q d= ⇔ + =
 
 
Nota: de ( ) ( ) 1p A C p A C+ =
 
tira-se: ( ) ( )| 1 |p A C p A C= − 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 212/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
14 - Dos acontecimentos A e B sabe-se que são independentes, ( ) ( )0 ,p A p B< < 
( ) 12
49
p A B =� e ( ) ( )| | 1.p A B p B A+ = 
Determine ( ).p B 
 
 
Resolução: 
( ) (
( ) ( ) 1
)
(
1
) )(
p A B
p
p A B p
B A
B
p
A
A B
p
∩∩
+ = ⇔ + = ⇔
 
Aqui é preciso ter cuidado, pois o que se pretende saber é o p(B), e como não sei o valor de 
p(A) vou fazer “desaparece-lo”: 
( )
( )
( )p A B
p B
p A
⇔ +
∩ x ( )
( )
p B
p A
1= ⇔
 
Agora fazer “desaparecer” a fracção: 
 
[ ]2 x( ) ( ) ( ) ( ) ( ) (( ) )p A B p B p p A BB B Bp B p p⇔ + = ⇔ ∩ + =∩ ⇔ 
 
Como sei o valor de ( )p A B∩ , pois este é me dado no enunciado: 
( ) ( )
2
12
1 1 4. 1
12 490 ( )
49 2
p B p B p B
± − +
⇔ + − = ⇔ = ⇔� �� � 
 
1 11 1 4 349 7( ) ( ) ( )
2 2 7 7
p B p B p B
± ±
⇔ = = ⇔ = ∨ = 
 
Agora tem se que analisar e validar os valores obtidos: 
12 12
( ) ( ) ( )
49 49
p A B p A p B∩ = ⇔ = 
Assim: 
4 12 3 12 12 12
( ). ( ). ( ) ( )
7 49 7 49 28 21
p A p A p A p A= ∨ = ⇔ = ∨ =
 
 
 
!!
3 4
( ) ( )
7 7
Falso
p A p A= ∨ =
�����
 
 
Porque que é que 
4
( )
7
p A = é falso? Porque no enunciado é me dito que ( ) ( )0 .p A p B< < 
Ora para ter 
4
( )
7
p A = , 
3
( )
7
p B = . Pode não parecer mas 
3 4
( ) ( ) .
7 7
p B p A= < = 
Resposta.: 
3 4
( ) ( )
7 7
p A p B= ∧ =
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 213/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
15 - Sejam A, B e C três acontecimentos possíveisde um mesmo espaço de resultados. 
Prove que se A e C são incompatíveis, então ( ) ( )| |p A B C p B C=� �� �� . 
 
 
Resolução: 
 
Sabe-se que, para A e C serem incompatíveis, então A C∩ = ∅ , isto é, ( )p A C∩ = ∅ . 
Tenho que provar: ( ) ( )p A B C p B C� ∪ � =� � 
 
Recordar a regra da distributiva em relação a união: ( )*a b c ab ac+ = + . Assim: 
 
( )
( )
( )
( ) ( )
( )
p A B C p A C B C
p C p
B
C
p A C
∩ ∪ ∩� � � �� � � �=� � =� =�
� �
�
 
 
( )( ) ( )
( )
( ) .
(
./
)
.
p B C p B C
p C p C
p B C c q d
∅ ∪ ∩ ∩
== =
 
 
 
16 - Num teste de avaliação de Matemática, feito por 28 alunos de uma turma do 12º 
ano, verificou-se que 75% tiveram positiva e 3 raparigas tiveram “negativa”. Sabendo 
que neste teste ter nota positiva é independente do sexo, determine o número de rapazes 
que tiveram “positiva” no teste. 
 
 
Resolução: 
( )
( ) 0,75 0,75
( )
p P M
p P M
p M
∩
= ⇔ = ⇔
 
( ) x (p P p M
⇔
)
( )p M
0,75 ( ) 0,75p P= ⇔ =
 
Ora se ouve 75% de positivas, de um total de 28 alunos, significa que houve 0,75 X 28 = 21 
positivas. 
Já consigo introduzir valores na tabela: 
 
 H M T 
P 21 
N 3 
T 28 
 
Logo, com os valores que já sei, consigo calcular mais alguns valores. Houve 7 negativas 
(28-21). 
 
Se sei o total das negativas, e quantas mulheres tiveram negativas, também já consigo saber 
quantos homens tiveram negativa: 4 (7-3). 
 
Agora tenho dúvidas nas positivas! 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 214/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Sei que são independentes, caso contrario o enunciado teria que dizer que não o eram. Vou 
criar duas variáveis para os valores que não sei, e utilizar a regra dos abraços. 
 
 H M T 
P a b 21 
N 4 3 7 
T 28 
 
 
 
Só se usa a regra dos abraços quando são independentes. 
 
4
4 4 9
3 4 3
3 3
21 4
7 63 921
3
Xa b
a b a b a
a b
b bb b
� = � ��= = =� � � �
⇔ ⇔ ⇔ ⇔	 	 	 	
+ =
 � � �= =+ = 
 
�
 
 
36
12
3
9
9
aa
b
b
� == ��
⇔ ⇔	 	
=
� =
 
 
 H M T 
P 12 9 21 
N 4 3 7 
T 28 
 
Resposta: 12 rapazes tiveram positivas. 
 
 
 
Provar a Regra dos Abraços: 
 
 A A 
B ( )p A B∩ ( )p A B∩ 
B ( )p A B∩ ( )p A B∩ 
 
 
( ) ( ) ( ) ( ). . ? Vou ver...p A B p A B p A B p A B será∩ ∩ = ∩ ∩ = 
 
 
Como são independentes: ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )p A p B p A p B p A p B p A p B=
 
 c.q.d. 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 215/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
17 - Dos alunos de uma escola secundária, sabe-se que: 
 
40% São raparigas 15% Fumam 60% Dos fumadores são rapazes 
 
 
17.1. Escolhido aleatoriamente um dos alunos da escola, determine a probabilidade de ser: 
a) Uma rapariga que não fuma. 
b) Ser fumador sabendo que é rapariga. 
 
17.2. Os acontecimentos "ser rapariga" e "ser fumador" são independentes? Justifique a 
resposta 
 
 
Resolução: 
 
( ) ( ) ( )0, 4 0,15 0,6p M p F p H F= = = 
 
Neste exercício a dificuldade estava em conseguir escrever esta equação: ( ) 0,6p H F = 
Neste tipo de exercício, convém primeiro tentar preencher a tabela. 
 
Construindo a tabela: 
 
 H M T 
F 0,15 
F 
T 0,4 1 
 
Aqui o segredo estava no total! No enunciado não é dito que é um, mas deduz-se. 
 
Consigo calcular o total de homens, que é 1-0,4=0,6, e o total de não fumadores: 0,85. 
 
 H M T 
F 0,15 
F 0,85 
T 0,6 0,4 1 
 
 
Agora vou calcular ( )p H F� : 
 
( ) ( )
( )
( ) ( )0,6 0,6 0,6
p H F
p H F p H F p F
p F
= ⇔ = ⇔ = ⇔
�
� 
 
( ) ( )0,6 0,15 0,09Xp H F p H F⇔ = ⇔ =� � 
 
 
Ao saber ( )p H F� , consigo calcular ( )p M F� , e é ( ) ( )1 0,06p M F p H F= − =� � 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 216/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 H M T 
F 0,09 0,06 0,15 
F 0,85 
T 0,6 0,4 1 
 
 
Agora já se consegue calcular os valores em falta: 
 
 H M T 
F 0,09 0,06 0,15 
F 0,51 0,34 0,85 
T 0,6 0,4 1 
 
Agora, com a tabela preenchida, já consigo responder. 
 
 
17.1 - a) ( ) 0,34p M F∩ =
 
 
b) ( ) ( )
( )
0,6
0,15
0, 4
p F M
p F M
p M
∩
= = = 
 
 
17.2 - 0,09*0,34 0,51*0,06
Regra do abraço
=����������� 
 
Como é uma preposição verdadeira, posso concluir que M e F são independentes. 
 
 
 
 
 
18 - De um baralho de 52 cartas, extraem-se duas cartas. Calcule a probabilidade de obter 
duas damas. 
 
 
Resolução - tirar ao mesmo tempo ou separado é igual, pois não há reposição. 
 
 (As Cartas Damas não são independentes) 
 
 
Como se pretende calcular a probabilidade de duas Damas consecutivas, tem se que a noção 
que então a primeira carta a sair é Dama. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 217/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
( ) ( )1 2
4 3
52 51
p D e p D= = 
 
( )1 2
4 3 1
*
52 51 221
p D D∩ = =
 
 
Nota: se A e B são independentes 
( ) ( )
( )
( )
p A B
p A B p A
p B
probabilidade de A sabendo B
∩
= =
↓
 
 
É ( )p A , pois é indiferente o valor de B, pois são independentes. 
 
 
 
 
 
19 - Lancei um dado duas vezes. Determine a probabilidade de ter saído dois números pares. 
 
 
Resolução: ( )1 2p P P∩ Já sei que o 1º é par 
( )1 para a 2ª vez não interressa.p P 
 
( )1 2
3 3 1
*
6 6 4
p P P∩ = =
 
 
 
 
20 - Uma caixa contém 5 lápis pretos e 9 lápis brancos. Tiram-se sucessivamente, sem 
reposição, dois lápis da caixa. Determine a probabilidade de serem da mesma cor. 
 
 
Resolução: 5 pretos e 9 brancos 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 218/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Vou usar a convenção: 
 
� � ( ) ( ) ( )1 2 1 2 1 2 1 2 1 2 1 2. .
Pretos Brancos Cuidado que esta é a
parte de intersecção
p PP B B p P P p B B p PP B B
� �
= ∪ = + −
 �

 �
� �
�����
 
Mas trata-se de uma condição impossível!!! 
 
Pois estou a dizer que da 1ª vez vou tirar um lápis, este é preto e branco (o índice 1 
representa a 1ª vez, e o 2, a 2ª vez). Ora como só tiro um lápis de cada vez, não podem sair 2. 
Assim, 
 
( ) ( ) ( )1 2 1 2 1 2 1 2. . 0p PP B B p P P p B B= ∪ = + − =
 
( ) ( ) ( ) ( )1 2 1 1 2 1
5 4 9 8 46
. * *
14 13 14 13 91
p P p P P p B p B B= + = + = 
 
 
 
21 - Considere um grupo de 10 pessoas, sendo 6 mulheres e 4 homens. Escolhe-se um grupo 
de duas pessoas. Determine a probabilidade de o grupo ser formado por um homem e por uma 
mulher. 
 
 
Resolução: 6M 4H 
 
( ) ( ) ( ) ( )1 2 1 2 1 2 1 2 1 2 1 2p H M M H p H M p M H p H M M H∪ = + − ∩ = 
 
( ) ( ) ( ) ( ) ( )1 2 1 1 2 1 0
4 6 6 4 8
* *
10 9 10 9 15
p H p M H p M p H M p= + − =
= + =
 
 
 
 
 
 
22 - Qual é a probabilidade de o Pedro e o João terem nascido no mês de Dezembro? 
 
 
Resolução: 
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 2
1 1 1
. . *
12 12 144
independentes
p D D p D p D D p D p D= = = =
�����
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 219/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
23 - Atirei ao ar duas moedas. Determine a probabilidade de ter saído duas faces coroas.Resolução: 
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 2
1 1 1
. . *
2 2 4
p C C p C p C C p C p C= = = = 
 
 
 
24 - Considere um lançamento simultâneo de dois dados equilibrados. Qual é a probabilidade 
do produto dos números das faces que ficam voltadas para cima ser par? 
 
 
Resolução - tem que haver pelo menos um par. O segredo está aqui: 
 Excluir as situações dos dois serem ímpares 
 
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 2
1 1 1 3
1 1 . 1 1 * 1
2 2 4 4
p I I p I p I I p I p I= − = − = − = − = − = 
 
 
 
25 - Uma caixa contém 12 lâmpadas coloridas, das quais 5 estão fundidas. Determine a 
probabilidade de tirar ao acaso três lâmpadas e estarem todas boas. 
 
 
Resolução - 7B 5F 
( ) ( ) ( ) ( )1 2 3 1 2 2 1 21
7 6 5 210 7
. . * *
12 11 10 1320 44
p B B B p B p B B p B B B= = = = 
 
 
 
26 - A ementa de um restaurante tem 4 sobremesas diferentes. Três clientes escolhem a 
sobremesa. Qual é a probabilidade de escolherem sobremesas iguais? 
 
 
Resolução - ( ) ( ) ( ) ( )11 21 31 12 22 32 13 23 33 14 24 34
A B C D
p S S S p S S S p S S S p S S S+ + +
����� ������� ������� �������
 
 
A, B, C e D são incompatíveis dois a dois. 
 
Significa que a união é vazio: 0A B∩ = 
 
Assim ( ) ( ) ( )p A B p A p B∪ = + 
� � �
3 3 3
1 1 1 1 1 1 4 1
* *
4 4 4 4 4 4 16*4 16
B C DA
= + + + = =
�����
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 220/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
27 - Numa terra há só 3 médicos. Numa noite, adoecem 5 habitantes. Cada um deles escolhe, 
ao acaso, um dos médicos e chama-o por telefone. Qual é a probabilidade de que chamem 
todos o mesmo médico? 
 
Resolução: ( )11 21 31 41 51 12 22 32 42 52 13 23 33 43 53p D D D D D D D D D D D D D D D∪ ∪ = 
 
( )11 21 31 41 51 12 22 32 42 52 13 23 33 43 53) ( ) (p D D D D D p D D D D D p D D D D D= + + = 
 
5 5 5 4 4
1 1 1 3 1 1
3 3 3 3.3 3 81
= + + = = =
 
 
 
 
 
 
 
 
Teoria 
 
 
 
Variável aleatória: lançamento de 2 dados, tem um espaço amostral de 36 ( )# 36 .S = 
 
:X S R→ , X é a função de S para R. 
 
Assim X=”A soma dos números das faces que ficam voltadas para cima ser igual a 4”. 
(X é uma variável aleatória). 
( ) { }� { }� { }�
1 3 4 2 2 4 3 1 4
Quantidades possiveis 3 1
4 1,3 , 2,2 , 3,1
 36 12
P X P
Espaço a mostral
+ = + = + =
� �

 �= = = = =

 �
� �
 
 
Nota: ( )4P X = , significa: qual é a possibilidade da soma dos pares de dados somarem 4. 
 
( )13P X = = ∅ 
 
( )12 1P X ≤ = , obviamente, qualquer que seja os números que saem, será SEMPRE inferior 
ou igual a 12 (1=100%). 
 
( )0 20 1P X≤ ≤ = 
 
( )20 30P X≤ ≤ = ∅ 
 
( ) 11 12
36
P X X≤ ∨ ≥ =
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 221/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Caso 1 – Experiencia aleatória de lançamento de um dado. 
 
 
{ } com uma pinta ; duas ; ; ; ; face três quatro cinco seisΩ = 
 
 
Que por habito se diz: { }1 ; 2 ; 3 ; 4 ; 5 ; 6 Ω = , que não está errado, mas de facto não é o que 
se observa. 
 
 
X é a variável aleatória (v.a.) e que é o numero de pontos da face do dados. 
 
 
Nota: X é sempre um numero real, ou seja é sempre “…é o numero de ...”. 
 
 
f.m.p é a Função Massa de Probabilidade. 
 
Assim a f.m.p. do lançamento de um dado é: 
 
 
( ) ( ) ( ) ( )
Regra Geral
1 2 3
1 2 3
... ...
... ...
n
n
x x x x
X
f x f x f x f x
�
= 	
�����������	����������
 
 
 
 
nx caso possíveis, com probabilidade diferente de zero. 
( )nf x probabilidade de acontecer, e tem que ser diferente de zero. Pois a seguir ao 6, tem se 
o 7, 8, 9, … e estes não se representam, pois não existe possibilidades de acontecer, uma vez 
que é só com um dado. 
 
 
Do exercício
1 2 3 4 5 6
1 1 1 1 1 1
6 6 6 6 6 6
X
�
�
= 	
�
��������	�������
 
 
 
{ }Uniforme 1 ; 2 ; 3 ; 4 ; 5 ; 6 X � , lê se: X segue uma distribuição uniforme. 
 
Quando as variáveis são pontos, que são o caso, são designadas de discretas. 
Quando são variáveis de um domínio, são contínuas. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 222/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
f.m.p uniforme 
{ }
Regra Geral
; 1 ; 2 ; 3 ; ... ; 
i
i n
X i
n
�
∈�
= 	
�
�������	������
 
 
f.m.p não uniforme 
Regra Geral
; 
i
i i I
X
p
∈�
= 	
����	���
, em que I é o conjunto. 
 
1i
i I
p
∈
=� 
 
 
 
 
 
Caso 2 – Bernouille - Uma urna com 4 bolas vermelhas (V) e 6 brancas (B). 
 
Esta experiencia aleatória tem o seguinte universo amostral: { } ; V B e não { }4 ; 6V B . Pois é 
vermelha ou é branca. 
Ou é vermelha ou não é vermelha. 
Ou é branca ou não é branca. 
{ } ; V BΩ = 
 
Para continuarmos o nosso raciocínio, vai se escolher uma bola preferida, aleatoriamente. Ou 
seja vai se escolher as bolas vermelhas como sendo o acontecimento. 
 
X é o número de bolas vermelhas na extracção de uma bola da urna. 
Só há duas possibilidades: ou sai ou não sai, que matematicamente se representa por: 
 
0X = ou 1X = 
 
Agora vai se analisar a probabilidade de êxito de cada uma das situações: 
 
( )0 0,6P X = = e ( )1 0,4P X = = 
 
f.m.p não uniforme ( )BernouilleX p� 
Regra Geral
; 
i
i i I
X
p
∈�
= 	
����	���
, em que I é o conjunto. 
 
1i
i I
p
∈
=�
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 223/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
( )Neste caso fica : BernouilleX p� 
 
0 1
0,6 0, 4
X
�
= 	
 
 
0,6 1 0,4p p= ∧ − =
 
A característica (de ter sucesso) deste caso é “Bola vermelha” 
 
( )Bernouille 0,4X � 
 
 
 
Caso 3 – Binomial - Experiencia aleatória: 5 extracções com reposição, de uma bola da urna. 
 
1ª 2ª 3ª 4ª 5ª
0, 4 0, 4 0,4 0,4 0, 4
X
p p p p p
�
= 	
= = = = =
 
 
Nota: não há erro de escrita na escolha de “p” minúsculo, pois é assim que se representa. 
 
X é o número de bolas vermelhas, em 5 extracções de uma bola da urna. 
 
0 - representa: nunca sair vermelho (sairam todas brancas).
5 - representa: sairam todas vermelhas.
X BBBBB
X VVVVV
= →
= →
�
 
 
 
f.m.p Binomial - ( )Binomial ; X n p� 
 
( )
{ }
Regra Geral
; 1 ; 2 ; 3 ; ... ; 
1
n ii
i
n
X n
p p
i
−
�
∈�
= � �	
−
 ��
� �
����������	���������
 
 
 
 
Em que o “p” é a probabilidade de sucesso e “n” o numero de provas. 
 
 
No exerc cio : 0, 4 5í p n= ∧ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 224/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Exemplificando: 
 
Considere uma caixa com 7 bolas, 2 amarelas (A), e 5 verdes (V). Tiram se três bolas, uma de 
cada vez e sem reposição, da caixa. Seja X a variável aleatória (v.a.) que representa o numero 
de bolas amarelas retiradas. 
 
a) Calcule ( )2 .P X = 
b) Determine a função massa de probabilidade. 
c) Determinar a função cumulativa de distribuição. 
d) Calcule o valor esperado de X. 
 
 
Resolução: 
 
a) 
2 1 5 2 5 1 5 2 1
 x x x x x x 
7 6 5 7 6 5 7 6 5
 x x x x x x A A V ou A V A ou V A A����� ����� ����� 
 
2 1 5 2 5 1 5 2 1 1
 x x x x x x 
7 6 5 7 6 5 7 6 5 7
� � � � � �+ + =
 � 
 � 
 �
� � � � � �
 
 
 
 
b) Função densidade (massa), e é discreta.Uma representação usual das variáveis 
aleatórias discretas é escrever na primeira linha os valores que a variável aleatória (v.a.) pode 
ter, e na segunda linha as respectivas probabilidades: 
 
( ) ( ) ( ) ( )
1 2 3
1 2 3
... ...
... ...
n
n
x x x x
X
f x f x f x f x
� �
= 	 �
 �
 
 
 
Assim: 
0 2
2 1
1
1
7 7
X
� �
� �
= 	 �
=� �
 �
. Temos a probabilidade para zero e 2, mas não se tem para 1. 
 
( ) 5 4 3 20 0 amarelas: x x x x 
7 6 5 7
P X V V V= = = = 
( ) 5 4 2 41 1 amarelas: x x x x 
7 6 5 7
P X V V A= = = = 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 225/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
c) Função distribuição: ( ) ( ) 0 0F x P X x se x= ≤ = < 
( ) ( ) 2 0 1
7
F x P X x se x= ≤ = ≤ < 
( ) ( ) 6 1 2, aqui são considerados as probabilidades de 0 e 1.
7
F x P X x se x= ≤ = ≤ < 
( ) ( ) 1 2, ou seja são considerados TODAS as probabilidades.F x P X x se x= ≤ = ≥ 
 
Nota: ( ) ( ) 2 4 61 0
7 7 7
F x P X= ≤ = + + = . 
 
 
Recordar – de uma variável aleatória, teorema: se F é uma função de distribuição então F goza 
das seguintes propriedades: 
 
1) ( ), 0 1. A probabilidade oscila entre zero e um.x R F x∀ ∈ ≤ ≤ 
2) F é crescente: ( ) ( ), , . Isto é verdade, pois é comulativo.x y R x y F x F y∀ ∈ < � ≤ 
3) ( ) ( ) ( ) ( ): lim 0 e : lim 1;
x x
F F x F F x
→−∞ →+∞
−∞ = = +∞ = = 
4) ( ) ( ) ( ) ( ), , . Este índice é o mais importante!a b R a b P a X b F b F a∀ ∈ < � = −< ≤ 
5) F é contínua à direita: ( ) ( ) ( ), : lim .
x a
a R F a F x F a
+
+
→
∀ ∈ = = 
6) ( ) ( ) ( ), .a R P X a F a F a−∀ ∈ = = − 
 
Variável continua 
 
 
( ) ( ) ( ) �
 
3 4 4 3 1 1 0 (alinea 4 do teorema 3)
Imagrm
Objecto x
P X F F< ≤ = − = − =
�������
 
 
 
 
d) ( ) ( )
2
0
2 4 1 6
0 x 1 x 2 x 
7 7 7 7i ii
E x x f x
=
= = + + =� . Este valor é COMULATIVO. 
 
Assim: 
0 2
2 1
7
1
4
7
1
7
X
� �
� �
= 	 �
=� �
 �
. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 226/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
A variável aleatória Bernoulli: seja ( )~ .X Ber p Como o contradomínio de X é um conjunto 
contável então X é uma variável aleatória discreta. 
 
Variável aleatória binomial é com reposição (se assim não fosse, não seria uma serie de 
Bernoulli). A variável aleatória X que representa o número de sucessos em “n” provas de 
Bernoulli, com probabilidade de sucesso em cada prova “p”, é conhecida como variável 
aleatória binomial. Por comodidade denota-se por ( )~ ; .X Bin n p 
 
Em que “n” é o número de provas de Bernoulli, e “p” é a probabilidade de sucesso. 
 
~X Bin é a distribuição binomial. 
 
Se ( )~ ; X Bin n p então a função massa de probabilidade de X é dada por: 
( )
( ) { }
{ }
1 se 0,1,2,...,
: , tal que 
0 se \ 0,1, 2,...,
n xxn p p x n
xf R R f x
x R n
−�� �
− ∈�
 �
→ = � �	
� ∈
 
 
Nota : 
n
x
� �

 �
� �
 é uma combinação, que na pratica representa se por , combinações de n, p a p.n pC 
 
7
2
7
, combinações de sete, dois a dois.
2
C
� �
→
 �
� �
 
 
 
 
Exercícios 
 
Exercício 1: Determine a probabilidade de obter 4 e só 4 "cincos" no lançamento de um dado 
15 vezes. 
 
 
Resolução: X é número observado de faces “5”, quando se lança um dado 15 vezes. 
 
Distribuição Binomial de X: 
1
~ 15 ; .
6
X Bin � �
 �
� �
 
15 é o número de vezes que o dado foi lançado. 
 
1
 
6
p = → é a probabilidade de sair “5” num lançamento de um dado. 
 
É nos pedido ( )4P X = , probabilidade do acontecimento “X” ocorrer 4 vezes. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 227/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Bernoulli ( )
( ) { }
{ }
1 se 0,1,2,...,
: , tal que 
0 se \ 0,1, 2,...,
n xxn p p x n
xf R R f x
x R n
−�� �
− ∈�
 �
→ = � �	
� ∈
 
( )
15
15
114 4
4
15 1 1 1 5
1 1
6 6 1296 64
x n x
x
n
p p C
−
−� � � �� � � � � �� �
− = − =
 � 
 �
 � 
 � 
 �
 �
� � � � � �� �� � � � 
 
( ) ( ) ( )1365 0,00849 0,134588 0,142= ≈ 
 
Nota: A variável aleatória de Bernouille só permite avaliar o sucesso ou o não-sucesso. 
 
 
 
 
 
Exercício 2: Estudos estatísticos mostram que sempre que se dá um nascimento de um bebé a 
probabilidade de ser rapaz é 51%. Considere uma família com 5 filhos não gémeos. 
Determine a probabilidade de que esta família tenha 3 e só 3 meninos. 
 
 
Resolução: ( )rapaz 0,51p P= = 
 
X (o acontecimento) é o numero de meninos. 
n (provas) “… num total de 5 filhos … “ (poderá ser 0,1,2,…). 
 
( ) ( )~ ; ~ 5 ; 0,51 .X Bin n p X Bin= 
 
A variável aleatória X que representa o número de sucessos em n provas de Bernoulli, com 
probabilidade de sucesso em cada prova p, é conhecida como variável aleatória binomial. Por 
comodidade denota-se por ( )~ ; .X Bin n p 
 
Se ( )~ ; X Bin n p então a função massa de probabilidade de X é dada por: 
 
( )
( ) { }
{ }
1 se 0,1,2,...,
: , tal que 
0 se \ 0,1, 2,...,
n xxn p p x n
xf R R f x
x R n
−�� �
− ∈�
 �
→ = � �	
� ∈
 
 
 
( ) ( ) ( ) ( ) ( ) ( )25 53 3 31 0,51 1 0,51 0,13265 0,43
5
93
n xxP X p C
n
p
x
− −� � � �
= = − = − =
 � 
 �
� � � �
 
( )( ) ( )10 0,13265 0,2401 0,3185= ≈ 
 
Nota: quando nada nos é dito, utiliza se a binomial, pois quando é para se utilizar a equação 
do Poisson é nos pedido. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 228/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Exercício 3: Se a probabilidade de um casal se divorciar nos primeiros 20 anos de casamento é 
0.60, qual é a probabilidade que em 6 pares, agora casados, nos próximos 20 anos: 
3.1. Nenhum se divorcie? 
3.2. Todos se divorciem? 
3.3. Exactamente 2 se divorciem? 
3.4. Pelo menos 2 se divorciem? 
 
 
 
Resolução 3.1: o 20 não tem qualquer utilidade! É para enganar. 
 
X (o acontecimento) é o número de divórcio num conjunto de 6 casais (número de provas). 
 
( ) ( ) ( ) ( ) ( )( )06 606
0
0 1 0,6 1 0,6 1 0
0
6
, 4
n xxP X p C
n
x
p
− −� � � �
= = − = − =
 � 
 �
� � � � 
 
( ) ( )( )1 1 0,004096 0,004096= = 
 
 
Resolução 3.2: 
( ) ( ) ( ) ( ) ( ) ( )6 66
66
6
6 1 0,6 1 0,6 0, 6656 1
6
04
n xxP
n
x
X p p C
− −� � � �
= = − = − =
 � 
 �
� � � � 
 
( ) ( ) ( )1 0,046656 1 0,046656= = 
 
 
Resolução 3.3: 
( ) ( ) ( ) ( ) ( ) ( )26 62 22 1 2
 0,6 1 0,6 0,36 0,025
6
6
n xxP X p p C
n
x
− −� � � �
= = − = − =
 � 
 �
� � � � 
 
( )( )( )15 0,36 0,0256 0,13824= = 
 
 
 
Resolução 3.4: cuidado aqui, pois é pelo menos 2. Logo pode ser 3, 4, 5, … 
 
( ) ( )
Tenho 4 hipoteses! Tenho 2 hipoteses!
2 1 2P X P X≥ = − <
����� �����
. 
 
Logo é mais fácil de calcular de até 2, e depois subtraiu a 1 este valor: 
 
( ) ( ) ( )1 2 1 0 1P X P X P X− < = − = − = ⇔ 
 
( ) ( ) ( ) ( ) ( )0 1606 11 2 1 0,6 1 0,6 0,6 1 0,6
1
6 6
0
P X
− −� � � �� � � �
⇔ − < = − − − − ⇔� � � �
 � 
 �
� � � �� � � �
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 229/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
( ) ( )( ) ( )( )66 160
5
1 2 1 1 0,4 0,6 0,4P X C C� � � �⇔ − < = − − ⇔
� � � �
 
 
( ) ( )( )( ) ( ) ( ) ( )1 2 1 1 1 0,004096 6 0,6 0,01024P X⇔ − < = − − ⇔� � � �� � � � 
 
( )( )1 2 0,95904 2 0,95904P X P X− < = ⇔ ≥ = 
 
 
 
 
 
7 - Um estudo encomendado por uma empresa permitiu apurar que aproximadamente 60% dos 
seus trabalhadores mantinham uma atitude cooperativa face à empresa, 30% uma atitude hostil 
e 10% uma atitude não definida. 
 
7.1 Qual é a probabilidade de num grupo de 12 trabalhadores pelo menos 6 adoptarem uma 
atitude hostil face à empresa? 
7.2 Qual é a probabilidade de num grupo de 20 trabalhadores no mínimo 2 terem uma atitude 
bem definida? 
7.3 Qual é o número esperado de trabalhadores, num grupo de 50, com uma atitude 
cooperativa? 
 
 
Resolução 7.1: Cuidado com o “…pelo menos …” e ( ) ( )~ ; ~ 12 ; 0,3 .X Bin n p X Bin= 
X é o numero de trabalhadores num grupo de 12, que mantêm uma atitude hostil. 
 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
pelo menos 
6 6 7 8 9 10 11 12P X P X P X P X P X P X P X P X≥ = = + = + = + = + = + = + =
�����
 
Vou fazer só o arranque, pois é massador: 
( ) ( ) ( ) ( )1212 6 666 1 0,3 1 0,3
xx nP X p p
x
C
n − −� �
= = − = −
 �
� �
 
( ) ( ) ( ) ( )1212 7 777 1 0,3 1 0,3
xx nP X p p
x
C
n − −� �
= = − = −
 �
� �
 
( ) ( ) ( ) ( )1212 8 888 1 0,3 1 0,3
xx nP X p p
x
C
n − −� �
= = − = −
 �
� �
 
( ) ( ) ( ) ( )1212 9 999 1 0,3 1 0,3
xx nP X p p
x
C
n − −� �
= = − = −
 �
� �
 
( ) ( ) ( ) ( )10 101
1212
010 1 0,3 1 0,3
xx nP X p p
x
C
n − −� �
= = − = −
 �
� �
, pronto não faço mais… 
 Mas deve de dar perto dos 11,8%. 
 
 
É mais fácil usar a tabela da binomial Cumulativa, com n = 12, r = 6, e p = 0.3! 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 230/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução 7.2: ( ) ( )~ ; ~ 20 ; 0,9 .Y Bin n p Y Bin= 
 
Cuidado, pois o 0,9 é de facto 0,6+0,3! 
 
Y é o numero (de sucessos) de trabalhadores num grupo de 20 (número de provas), que 
mantêm uma atitude bem definida. 
 
( ) ( ) ( ) ( )2 1 2 1 0 1P Y P Y P Y P Y≥ = − < = − = − = 
 
( ) ( ) ( ) ( )2020 0 000 1 0,9 1 0,9
yy nP Y p p
y
C
n − −� �
= = − = −
 �
� �
 
( ) ( ) ( ) ( )2020 1 111 1 0,9 1 0,9
yy nP Y p p
y
C
n − −� �
= = − = −
 �
� � 
 
( ) ( ) ( )20 192 1 1 x 1 x 0,1 20 x 0,9 x 0,1 1P Y ≥ = − − ≈ 
 
É mais fácil usar a tabela da binomial Cumulativa, com n = 20, r = 2, e p = 0.9! 
 
 
 
 
 
Resolução 7.3: como se perante uma Binomial, então ( )E X np= e ( ) ( )1 .Var X np p= − 
 
Não confundir este X com o exercício anterior, por isso vou utilizar o “Z”. 
 
 
E ~=� . Numa Binomial, a média esperada é dada pela fórmula: 
 
( ) x 50 x 0,6 30E Z n p= = = . 
 
 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 231/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Variável Aleatória Binomial Negativa 
 
 
Foi já estudada a distribuição binomial como o modelo probabilístico adequado para descrever 
os resultados associados a uma sucessão de provas de Bernoulli. A distribuição binomial 
supõe a realização de “n” provas de Bernoulli, sendo aleatório o número de sucessos 
observados nessas “n” provas. Se, pelo contrário se fixa o número de sucessos, digamos “r”, e 
pretendemos considerar o número de provas de Bernoulli necessárias até se obter aqueles “r” 
sucessos, temos uma outra variável aleatória (v.a.) definida. Neste caso o número de provas é 
aleatório. 
Definição - l: Considere uma sucessão de provas de Bernoulli, sendo “p” a probabilidade de 
ocorrer sucesso em cada prova. A variável aleatória X que representa o número de provas 
de Bernoulli necessárias até atingir “r” sucessos é conhecida por variável aleatória binomial 
negativa. Podemos denotar essa variável por ( )~ r ; .X Bne p 
 
Observação: Se ( )~ r ; .X Bne p então { }, 1, 2,...xCD r r r= + + . Como { }, 1, 2,...r r r+ + é 
um conjunto contável, podemos afirmar que X é uma variável aleatória discreta. 
 
Definição: Seja ( )~ r ; .X Bne p Diz-se que X é uma variável aleatória geométrica se e só se 
r =1. 
 
Observação 1: Se ( )~ r ; X Bne p então a função massa de probabilidade de X é dada por: 
 
( )
( ) { }
{ }
1
1 se , 1, 2,...
1: , tal que 
0 se \ , 1, 2,...
x rrx p p x r r r
rf R R f x
x R r r r
−� −� �
− ∈ + +�
 �−→ = � �	
� ∈ + +
 
 
 
Observação 2: Se ( )~ r ; X Bne p então ( ) rE X
p
= e ( ) 2
1 p
Var X r
p
−
= . 
 
 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 232/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Exercícios sobre Variável Aleatória Binomial Negativa 
 
 
1 - A probabilidade de um atirador acertar no alvo é 0,6. Considere a variável aleatória (v.a.): 
 
X: número de tiros que o atirador tem de efectuar até acertar pela terceira vez. Calcule: 
 
1.1 ( )3P X = ; 
1.2 ( )10P X = ; 
1.3 O valor médio e a variância de X 
 
 
 
Resolução: “…até acertar pela terceira vez.” é o número de provas a realizar (neste caso é 3). 
 
Enunciando matematicamente é ( ) ( )~ r ; 3 ; 0,6 .X Bne p X Bne= � 
 
( )
( ) { }
{ }
1
1 se , 1, 2,...
1: , tal que 
0 se \ , 1, 2,...
x rrx p p x r r r
rf R R f x
x R r r r
−� −� �
− ∈ + +�
 �−→ = � �	
� ∈ + +
 
1.1 - Por coincidência, o “r” é igual ao “x”, e o “x” (3) é o número de sucessos pretendidos. 
 
( ) ( ) ( ) ( ) ( )( )3 33
1 1
1 0,6 1
3
3 3 0,6
1 3 1
x rrP f p p
r
x
X
−−� − � −� � � �
= = − = − ⇔	 	
 � 
 �− −� � � �
 
=
 
 
( ) ( ) ( ) ( ) ( ) ( )
3 3 0
13
1 . 0,6 . 0, 4 0,3 2163P f CX − −= = = =
 
( )
( ) { }
{ }
1
1 se , 1, 2,...
11.2 : , tal que 
0 se \ , 1, 2,...
x rrx p p x r r r
rf R R f x
x R r r r
−� −� �
− ∈ + +�
 �−→ = � �	
� ∈ + +
 
 
( ) ( ) ( ) ( ) ( )( )10 33
1 1
1 0,6 1 0
10
10 10 ,
1 3
6
1
rr xX p
r
p
x
P f
−−� − � −� � � �
= = − = − ⇔	 	
 � 
 �− −� � � �
 
=
 
 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
3
3
7 3 71 9
21
10 . 0,6 . 0,4 . 0,1 6 . 0,4 0,010 1 270 4P f CX C− −= = = = ≈ 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 233/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
( ) ( )
( )
( )22
3 1 1 0,6
1.3 5 3 3, 3
0,6 0,6
r p
E X Var X r
p p
− −
= = = ∧ = = =
 
 
 
2 - Um jovem casal deseja ter exactamente duas filhas. Considere que o casal terá filhos 
(rapazes ou raparigas) até realizar o desejo. Qual é a probabilidade de o casal vir a ter 4 
crianças? 
 
( ) ( ): ~ r ; 2 ; 0,5 .Resolução X Bne p X Bne= � 
 
( )
( ) { }
{ }
1
1 se , 1, 2,...
1: , tal que 
0 se \ , 1, 2,...
x rrx p p x r r r
rf R R f x
x R r r r
−� −� �
− ∈ + +�
 �−→ = � �	
� ∈ + +
 
 
( ) ( ) ( ) ( ) ( )( )4 22
1 1
1 0,5 1
4
4 4 0,5
1 2 1
x rrP f p p
r
x
X
−−� − � −� � � �
= = − = − ⇔	 	
 � 
 �− −� � � �
 
=
 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
4 22
2
2 21 3
11
3
. 0,5 . 0,54 . 0,5 .4 0,5 0,1875.
16
P fX C C− −= = = = ==
 
 
 
 
 
3 - Um indivíduo que faz anos em Janeiro dispõe-se a inquirir pessoas ao acaso até encontrar 
uma que faça anos também no mesmo mês. 
3.1. Qual é a probabilidade de inquirir menos de 6 pessoas? 
3.2. Qual é o número médio de inquirições que tem de fazer até ter sucesso? 
 
( ) 1
"... at enc
1
3.1: ~ r ; ~
ontrar uma .
 ; 
"... inquirir menos ..
.
1
.
.
"
2
.
"
Resolução X Bne p
é
X Bne
� �∧ = 
 �
� �
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 234/305 
Sugestões: jrvalente@netmadeira.comProbabilidades e Estatística 
 
( )
( ) { }
{ }
1
1 se , 1, 2,...
1: , tal que 
0 se \ , 1, 2,...
x rrx p p x r r r
rf R R f x
x R r r r
−� −� �
− ∈ + +�
 �−→ = � �	
� ∈ + +
 
 
� ( ) ( ) ( ) ( ) ( ) ( )
inquirir menos
6 1 2 3 4 5 6X X X XP P P PX XP P P X≤ =
� �
= + + + + +
 � =
�
= =
�
= =
 
 
 
Vou decompor, pois é mais simples: 
 
( ) ( ) ( )
11 11 1 1 1
1 1
1 1 12 12
1
1 1
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =	 	
 � 
 �
 � 
 �
 �− − � � � �� �� � � �
 �
=
 
( ) ( ) ( ) ( )
1
0
1
1 1
1 11 1 1
. . 1. .1 0,08333333
12 12 12
1
12
1P f CX − −
� �= = = = =
 �
� �
=
 
 
( ) ( ) ( )
11 21 1 1 1
1 1
1 1 12 12
2
2 2
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =	 	
 � 
 �
 � 
 �
 �− − � � � �� �� � � �
 �
=
 
( ) ( ) ( ) ( )
1
1
1
2
21
1 11 1 11 11
. . 1. . 0,0764.
12 12 12
2 2
12 12
P fX C− −
� �= = = = =
 �
� �
=
 
 
( ) ( ) ( )
11 31 1 1 1
1 1
1 1 12 12
3
3 3
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =	 	
 � 
 �
 � 
 �
 �− − � � � �� �� � � �
 �
=
 
( ) ( ) ( ) ( )
2 2 2
1
1 2 31
3 1 11 1 11 11. . 1. . 0,07002
12 12
3 3
12 12 12
P X f C− −
� �= = = = =
 �
� �
=
 
 
( ) ( ) ( )
11 41 1 1 1
1 1
1 1 12 12
4
4 4
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =	 	
 � 
 �
 � 
 �
 �− − � � � �� �� � � �
 �
=
 
( ) ( ) ( ) ( )
4
3 3 3
1
11 3 4
1 11 1 11 11
. . 1. . 0,0642
12 12
4
12 12
4
12
P f CX − −
� �= = = = =
 �
� �
=
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 235/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
( ) ( ) ( )
11 51 1 1 1
1 1
1 1 12 12
5
5 5
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =	 	
 � 
 �
 � 
 �
 �− − � � � �� �� � � �
 �
=
 
( ) ( ) ( ) ( )
4 4 4
1
1 4 51
5 1 11 1 11 11. . 1. . 0,05884.
12 12 12 12 1
5
2
5P f CX − −
� �= = = = =
 �
� �
=
 
 
( ) ( ) ( )
11 61 1 1 1
1 1
1 1 12 12
6
6 6
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =	 	
 � 
 �
 � 
 �
 �− − � � � �� �� � � �
 �
=
 
( ) ( ) ( ) ( )
5 5 5
1
1 5 61
6 1 11 1 11 11. . 1. . 0,05394.
12 12 12 12 1
6
2
6P f CX − −
� �= = = = =
 �
� �
=
 
 
Agora tudo junto: 
 
( ) ( ) ( ) ( ) ( ) ( ) ( )6 1 2 3 4 5 6X X X XP X X XP P P P P P≤ = = == + + + + += = = 
 
( )
2 3 4 5
2 3 4 5 6
1 11 11 11 11 11
12 12 12 12 2 12
6
1
XP
� � � � � � � �� � � �
= + + + + +
 � 
 � 
 � 
 �
 � 
 �
� � � � � � � � � � � �
≤
 
 
( ) 2
1 11 11 11 11 11
1 1 1 1 0,40673.
12 12 12 12 2 12
6
1
XP
� �� �� �� � � �= + + + + + =
 �
 �
 � 
 �
 �
 �� � � �� �� �� �
≤
 
 
 
( ) 1 3.2 : "Qual o n mero m dio ..." 12 (Valor médio).
1
12
r
Resolução é ú é E X
p
→ = = =
 
 
 
4 - Um homem tem 10 chaves, das quais apenas uma abre um cofre. Calcule a probabilidade 
do homem abrir o cofre somente na quinta tentativa sabendo que o homem está embriagado e 
que este não separa as chaves a cada tentativa infrutífera. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 236/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Resolução – é sem reposição! 
 
Recordar a definição: Seja ( )~ r ; .X Bne p Diz-se que X é uma variável aleatória geométrica 
se e só se r =1. 
 
( ) 1~ r ; ~ 1 ; .
10
Geometrica
X Bne p X Bne
� �
= 
 �
� ����������������
 
 
 
 
( )
( ) { }
{ }
1
1 se , 1, 2,...
1: , tal que 
0 se \ , 1, 2,...
x rrx p p x r r r
rf R R f x
x R r r r
−� −� �
− ∈ + +�
 �−→ = � �	
� ∈ + +
 
 
 
( ) ( ) ( )
11 51 1 1 1
1 1
1 1 10 10
5
5 5
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =	 	
 � 
 �
 � 
 �
 �− − � � � �� �� � � �
 �
=
 
 
( ) ( ) ( ) ( )
5
4
11
1 1 9. . 1 x 0,1 x 6,561 0,6561
10 1
5 5
0
fXP C− −
� �= = = ≈
 �
� �
=
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 237/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Variável Aleatória Hipergeométrica 
 
 
 
Definição: Suponha-se que uma população tem um total de N elementos, k dos quais 
apresentam a característica S. Consideremos a experiência aleatória que consiste em extrair ao 
acaso e sem reposição “n” desses elementos e seja X o número de elementos com a 
característica S entre os “n” extraídos. Dizemos que X é uma variável aleatória 
hipergeométrica e representamos por 
( )~ N ; ; .X Hip n k 
 
( ) ( ) ( ){ } 1: Se ~ N ; ; ent o max 0, , ... ,min , . xX Hip n k ã CD n N k n k− = − +Observação
 Como um conjunto finito ent o X uma vari vel aleat ria discreta. xCD é ã é á ó 
 
( ) 2 : Se ~ N ; ; ent o a fun o massa de probabilidade de X :X Hip n k ã çã é−Observação 
 
( )
 se 
: , tal que 
0 se \
x
x
k N k
x n x
x CD
Nf R R f x
n
x R CD
� −� �� �
�
 �
 �−� �� �� ∈�
→ = � �	

 ��
� ��
∈�
 
 
( ) ( ) ( ) ( )( )
( )2
 3 : Se ~ N ; ; ent o e .
1
nk N k N nnk
X Hip n k ã E X Var X
N N N
− −
− = =
−
Observação
 
 
 
“N” é o total, “n” é a quantidade extraída sem reposição, e “k” a quantidade existente. 
 
 
 
 
 
 
 
Exercícios sobre Variável Aleatória Hipergeométrica 
 
 
1 - Considere-se a variável aleatória X que representa o número de cartas de copas em quatro 
retiradas aleatoriamente sem reposição de um baralho vulgar de 52 cartas. 
 
1.1. Construa a tabela de distribuição de probabilidades da variável X. 
1.2. Calcule a média e a variância de X. 
1.3. Qual é a probabilidade de serem todas de copas? 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 238/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução 1.1: 
 
( ) ( )
13 13 1352
52
0 0
39
4 4
4
52
0
4
 x x x 
0,303820 0 x x
k kN
n
N
n
n C C C C C C
P f
C C C
n
X
k
x x
N
N
k
− −
− −
−� �� �

 �
 �−� �� �= = = = = =
�

 �
� �
=
�
 
 
( ) ( ) 1
1352
52 5
313 1
1
2
9
34
4 4
3
1 x x x 0,438841 81 x x
N
N
k k
n
n
k
n C C C CC C
P
x x
X f
C C C
n
N
kN
− −
− −
−� �� �

 �
 �−� �� �= = = = = =
� �

 �
�
=
� 
 
( ) ( ) 2 2 2
13 13 152
52
3
5
9
2
3
4
2
4 4
 x x x 
0,2134932 2 x x
N
N
k k
n
n
k
n C C C C C C
P f
C C C
n
N k
x
N
x
X
− −
− −
−� �� �

 �
 �−� �� �= = = = = =
� �

 �
�
=
� 
 
( ) ( )
13 13 1352
52
3 3
39
4 1
4
52
3
4
 x x x 
0,041023 3 x x
k kN
n
N
n
n C C C C C C
P f
C C C
n
X
k
x x
N
N
k
− −
− −
−� �� �

 �
 �−� �� �= = = = = =
�

 �
� �
=
�
 
 
( ) ( ) 4
1352
52 5
313 1
4
2
9
04
4 4
3
4 x x x 0,002644 14 x x
N
N
k k
n
n
k
n C C C CC C
P
x x
X f
C C C
n
N
kN
− −
− −
−� �� �

 �
 �−� �� �= = = = = =
� �

 �
�
=
� 
 
 
Tabela de probabilidade 
 
0 1 2 3 4
0,304 0,439 0, 213 0,041 0,003 A soma é 1
X
�
= 	
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 239/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução 1.2: 
( ) ( ) ( ) ( )( )
( )2
Se ~ ; ; .
1
n nn N N
N
k
Hip n E
kk
VkX
N N
XarX
N
− −
� = ∧ =
− 
 
( ) 4 x 1
52
13
 X
kn
E
N
= = =
 
 
( ) ( ) ( )
( )
( ) ( ) ( )( )
( ) ( )22
5213 524 4
0,706
1 52 52 1
13n n
XV
k
r
N N
N N
a
k− − − −
= = =
− − 
 
 
 
 
 
Resolução 1.3: N=52, X=4, e k=13. 
 
( )Se ~ N ; ; X Hip n k � 
 
( ) ( ) 4
1352
52 5
313 1
4
2
9
04
44
3
4 x x x 0,002644 14 x x
N
N
k k
n
n
k
n C C C CC C
P
x x
X f
C C C
n
N
kN
− −
− −
−� �� �

 �
 �−� �� �= = = = = =
� �

 �
�
=
� 
 
 
 
 
 
2 - Numa remessa de 440 iogurtes de diversos sabores 20% são de sabor a morango. 
Qual é a probabilidade de, escolhendo 10 ao acaso, 6 serem de sabor a morango? 
 
 
Resolução: 
440 440 x 0, 2 88 10
cuidado
N k n= ∧ = = ∧ =��������� 
 
( ) ( )~ ; ; ~ 4 ; 104 ; 880NX Xp n HipkHi ⇔ 
 
 
( ) ( )
440
440
6 6
352
10
88 88
440
6
1
8
4
0 10
8
6 4
 x x x x xn
k N
n
k
N
x
N
N
k k
n x
X
C C C C C C
P f
C C C
n
− −
− −
−� �� �

 �
 �−� �� �= = = = = =
� �

 �
=
� � 
 
( ) 0,005046XP = =
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 240/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 3 - Considere uma lotaria que vende 100 bilhetes dos quais 5 contém um prémio. Suponha 
que compra 7 bilhetes. Qual a probabilidade de ganhar pelo menos um prémio? 
 
 
Resolução: 
100 5 7N k n= ∧ = ∧ = 
 
( ) ( )~ ; ; ~ ; 57 ;1 00X XHip n k pN Hi⇔ 
 
( ) ( ) ( )1 11 1 0X X XP P P≥ <− = − ==
 
 
( ) ( ) 0 0 0
5 5 5100
100
95
7 7
100
7 7
 x x x 
0,690300 0 x xn
k N
n
k
N
k
n C C C C C C
P f
C C
x x
X
C
n
N
kN
− −
− −
−� �� �

 �
 �−� �� �= = = = = =
�

 �
� �
=
�
 
Mas o que se pretende é: 
 
( ) ( ) ( )1 1 1 0,69030 0,30961 0 61 9X X XP P P= − = − = − =≥ < = 
 
 
 
 
 
 
 
 
 
Variável Aleatória de Poisson 
 
 
 
Definição: Uma variável aleatória X com função massa de probabilidade dada por 
 
( ) 0
0
 se 
: , tal que , com 0,!
0 se \
xe
x N
f R R f x x
x R N
λλ
λ
−�
∈�
→ = >	
� ∈
 
 
é designada por variável aleatória de Poisson de parâmetro λ . Simbolicamente representa-se 
 por ( )~ .X Poi λ 
 
Observação: Se ( )~ X Poi λ então X é uma variável aleatória discreta porque é contável 
o conjunto 0.xCD N= 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 241/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Suponha-se que nos era pedido um modelo para o número de ambulâncias que chega ao 
serviço de urgências do Hospital de Santa Maria, ou o número de automóveis que pára num 
posto de abastecimento de gasolina na auto-estrada, o número de chamadas telefónicas que 
chega a um posto de atendimento de pedidos de táxis, o número de espectadores de um jogo 
de futebol que entra para o estádio, ou de participantes que chegam a uma manifestação, o 
número de linfócitos 4T num volume de sangue, o número de peixes que se encontra num 
dado volume de água, o número de moléculas de anidrido sulfuroso num determinado volume 
de ar junto de uma via de acesso a Lisboa, ou o número de ninhos de grifos que são avistados 
por um observador quando desce o Douro. 
Representando por ( )N t o número de chegadas no intervalo ] ]0 ; ,t a família de variáveis 
aleatórias ( ){ }: 0 N t t ≥ é um processo estocástico, isto é, depende do acaso; é um processo 
de contagem, que assume os valores inteiros 0,1, 2, ... k = , considerando, como é natural, 
( )0 0. N = 
O processo que vamos estudar, chamado processo de Poisson, presta-se tão bem a modelar a 
homogeneidade temporal quanto a homogeneidade espacial. 
As simplificações que vamos fazer para modelar de forma simples um processo de contagem 
do número de observações no intervalo ] ]0 ; t são três. 
 
 
 
Axiomática do Processo de Poisson: 
 
P1: O processo de chegadas é "regular", no sentido de homogéneo no tempo, isto é, se 
fizermos uma translação no tempo isso não deve alterar a essência do processo. 
Assim, P1 afirma que ( ) ( ) ( ) ( )2 1 2 1P N t N t k P N t h N t h k− = = + − + =� � � �� � � � , com 
0,1,2, ...k = Por exemplo: estudar o processo entre as 9h e as 10h deve ser idêntico a estudá-
lo entre as 9h23m e as 10h23m. 
 
 
P2: O que se passa num intervalo não é informativo sobre o que se passa num outro intervalo 
disjunto do primeiro, para além da homogeneidade atrás postulada. 
 
Assim, se ] ] ] ]1 2 3 4, , ,t t t t = ∅� então 
 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )2 1 4 3 2 1 4 3 x P
Intervalo Intervalo
P N t N t k N t N t j P N t N t k N t N t j
� �
� �− = − = = − = − =� � � �� � � �
� �� �
�
��������� ���������
 
 
Se soubermos que foram pedidos 6 táxis a uma central entre as 9h12m e as 9h23m, isso não 
nos diz nada sobre quantos vão ser pedidos entre as 9h42m e as 10h28m e também não nos diz 
nada sobre quantos vão ser pedidos entre as 9h34m e as 9h45m. 
 
 
P3: Não há chegadas (exactamente) simultâneas, isto é, ( ) ( ) ( )2 ,P N t dt N t o dt+ − ≥ =� �� � e a 
probabilidade de se observar uma chegada cresce regularmente, linearmente, com a amplitude 
do intervalo de observação, em intervalos muito pequenos. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 242/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Mais precisamente, vamos supor que o processo é grosseiramente linear, que a menos de um 
valor muito baixo e em certo sentido irrelevante e desprezável, a probabilidade de observar 
uma ocorrência num intervalo muito curto ] ],t t dt+ é proporcional ao comprimento dt do 
intervalo, isto é, ( ) ( ) ( )1 = . P N t dt N t dt o dtλ+ − = +� �� � (A constante de proporcionalidade, 
chamada taxa de chegadas, é denotada por λ ). 
 
Teorema: Seja ( ){ }:N t t O≥ um processo de contagem que verifique os postulados P1, P2 e 
P3. Então, para cada 0 h ≥ e 0 t > fixos, ( ) ( ) ( )~ . N t h N h Poi tλ+ − 
 
Corolário: Caso particular no caso de 0h = . ( ) ( )~N t Poi tλ 
 
Observação: Por esta razão um Processo Estocástico de contagem ( ){ }: 0N t t ≥ que 
verifique os postulados P1, P2 e P3 é denominado processo de Poisson de taxa λ . 
 
 
 
 
 
 
 
 
Exercícios Variável Aleatória de Poisson 
 
 
1 - Entre as 14 e as 16 horas, o número médio de chamadas telefónicas por minuto, atendidas 
no centro, de comunicações de uma empresa é 2,5. Sabendo que o número de chamadas 
sugere uma distribuição de Poisson, calcule a probabilidade de, durante um determinado 
minuto haver: 
 
1.1 – Zero chamadas telefónicas. 
1.2 – Duas chamadas telefónicas. 
1.3 – Quatro ou menos chamadas telefónicas. 
1.4 – Mais de 6 chamadas telefónicas. 
 
 
Resolução: vou utilizar o teorema (na realidade da teoria toda, o que realmente interessa é este 
teorema). 
 
( )~ X Poi λ , em que λ é a taxa. ( )�
processo
N t é o número de chegadas no intervalo ] ]0 ; .t 
 
2,5 é o numero de chamadas por minuto, 2,5λ = . 
 
Seja ( )1N , o “um” é de um minuto, ou seja o número de chamadas recebida no intervalo 
] ]0 ; 1 . 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 243/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução 1.1: probabilidade de, num minuto, não se receber chamadas. 
 
( )( ) ( )
02,5 2,5
2,5 x 2,5 x x 11 0 0,082
! 0! 1
x ee e
P N e
x
λ λ −− − −= = = = = ≈
 
 
Pode se usar a tabela de Poisson Individual, com m = 2,5, x = 0. 
 
( )( )Nota : a probabilidade de se receber zero chamada nota se matematicamen 0te 1 .P N =
 
 
 
 
 
Resolução 1.2: probabilidade de, num minuto recebeu 2 chamadas. 
 
( )( ) ( )
22,5 2,5 x 2,5 x x 6,25
1 2 0, 257.
! 2! 2
x ee e
P N
x
λ λ −− −
= = = = ≈ 
 
Pode se usar a tabela de Poisson Individual, com m = 2,5, x = 2. 
 
 
 
 
 
Resolução 1.3: probabilidade de, num minuto, receber menos de 4 chamadas. 
 
 
( ) ( )() ( )( ) ( )( ) ( )( ) ( )( )4 1 0 1 1 1 2 1 3 1 4P X P N P N P N P N P N≤ = = + = + = + = + = = 
 
Já calculei para ( )( )1 0P N = e para ( )( )1 2 .P N = 
 
( )( ) ( )
12,5 2,5 x 2,5 x 2,5
1 1 0, 20521
1! 1
e e
P N
− −
= = = ≈ 
( )( ) ( )
32,5 2,5 x 2,5 x 15,625
1 3 0,21376
3! 6
e e
P N
− −
= = = ≈ 
( )( ) ( )
42,5 2,5 x 2,5 x 39,0625
1 4 0,1336
4! 24
e e
P N
− −
= = = ≈ 
 
( ) ( ) ( ) ( ) ( ) ( )4 0,082 0,20521 0,257 0,21376 0,1336 0,8916P X ≤ = + + + + = 
 
 
 
É mais fácil usar a tabela de Poisson cumulado, com m = 2,5, x = 5. Depois é subtrair a 1 o 
valor da tabela, pois a tabela dá me os valores da direita, e pretende se da esquerda. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 244/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução 1.4: probabilidade de, num minuto, receber mais de 6 chamadas (logo não leva o 
sinal de igual, mas só o sinal de maior). 
 
( ) ( )( )6 1 1 6P X P N> = − ≤ ⇔ 
 
( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( )6 1 1 0 1 1 1 2 1 3 1 4 1 5 1 6P X P N P N P N P N P N P N P N� �> = − = + = + = + = + = + = + =� �
 
Já calculei para ( )( )1 0P N = até ( )( )1 4 .P N = 
 
( )( ) ( )
52,5 2,5 x 2,5 x 97,65625
1 5 0,0668
5! 120
e e
P N
− −
= = = ≈ 
 
( )( ) ( )
62,5 2,5 x 2,5 x 244,140
1 6 0,02783
6! 720
e e
P N
− −
= = = ≈ 
 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )6 1 0,082 0, 20521 0, 257 0,21376 0,1336 0,0668 0,02783P X > = − + + + + + +� �� �
 
 
( ) ( )6 1 0,9862 6 0,0138P X P X> = − ⇔ > = 
 
 
 
 
 
2 - O número diário de doentes com complicações cardiovasculares que chegam a 
determinada unidade de cuidados intensivos segue uma lei de Poisson com média 6. Qual é a 
probabilidade de num certo dia, o número de doentes chegados àquela unidade ser, quando 
muito, 3. 
 
Resolução - Ora é me dito que 6λ = e o X é o número de doentes diários (X=3). 
 
Cuidado com a palavra escolhida “… ser, quando muito, 3.” 
 
Matematicamente é ( )3P X ≤ . Vou a tabela de distribuição de Poisson (INDIVIDUAL): 
 
 
 
 
Mas é me dito menor ou igual (ou seja estão me a impor um valor máximo!), e a tabela só me 
dá para valores “iguais” e não “menor ou igual”. É preciso SOMAR todos os menores: 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 245/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
Assim fica: ( ) ( ) ( ) ( ) ( )3 0 1 2 3P X P X P X P X P X≤ = = + = + = + = . 
 
( ) ( ) ( ) ( ) ( )3 0,002 0,015 0,045 0,089 0,151P X ≤ = + + + = 
 
Poderia ter ido pela tabela de distribuição de Poisson (CUMULATIVA): 
 
( ) ( )3 1 3P X P X≤ = − > , E como na tabela não tenho ( )3P X > vou ter que ir por ( )4P X ≥ 
 
Nota: não tenho ( )3P X > , porque falta o IGUAL. Só tenho maior! Logo o próximo é o 4. 
 
Assim fica ( ) ( ) ( )3 1 4 1 Valor da P X P X Tabela≤ = − ≥ = − . Vou utilizar a tabela dos 
Cumulativos: 
 
 
( ) ( )3 1 4 1 0,847 0,153P X P X≤ = − ≥ = − = 
 
Obviamente os valores não coincidem devido aos arredondamentos. 
 
Neste exercício, o grau de dificuldade está no facto do valor cumulativo das tabelas fornecidas 
estão para “maior de que”, e nos exercícios é sempre (ou quase sempre) para “menor de que”. 
Por isso é necessário realizar estes passos todos. Calcula-se para cima, e depois subtrai se a 
um. 
Nota: se em vez de ser ( )3P X ≤ , fosse ( )3P X = , então seria ( )3 0,089P X = = 
 
 
 
3 - Uma loja tem uma média de 6 clientes por dia, e é razoável admitir que o número de 
clientes diários segue uma distribuição de Poisson. 
3.1 Qual é a probabilidade de aparecerem menos de 2 clientes num certo dia? 
3.2 Qual é a probabilidade de aparecerem no total de 2 dias seguidos, 2 ou menos clientes? 
3.3 Qual é a probabilidade de num dia aparecer exactamente 1 cliente e no dia seguinte 
aparecer também só 1 cliente? 
3.4 Qual é a probabilidade de aparecerem 4 clientes num dia, sabendo que no dia anterior 
apareceu dois clientes? 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 246/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução: X é o número de clientes por dia, que neste caso é 6. Nota sempre que no 
enunciado falar em “média” ou “taxa”, usa se SEMPRE a distribuição de Poisson. 
 
 “…uma média de 6 clientes…” 
 
( ) ( )~ ~ 6X Poi X Poiλ = 
 
 
 
3.1 – “…menos de 2…” representa-se assim: ( ) ( ) ( )2 0 1P X P X P X< = = + = 
 
Para usar a “Tabela de três decimais para a distribuição de Poisson (termo CUMULATIVO) ” 
tenho que reescrever a equação, mas numa igualdade (obviamente): 
 
( ) ( )2 1 2 1 0,981 0,019P X P X< = − ≥ = − = 
 
 
 
3.2 – “…total de 2 dias seguidos ou menos …”, cuidado, pois já não é a mesma variável. Vou 
por isso usar o .Y Assim Y é o numero de clientes por cada dois dias seguido, e representa se 
matematicamente por: 
( ) ( )~ ~ 12X Poi X Poiλ = 
 
É 12 , pois é dois dias seguidos, e como sei que em cada dia é seis, é só somar (!). 
 
( ) ( )2 1 2P X P Y Cuidado≤ = − > = , pois tem que ser ( )3P Y ≥ , ficando assim: 
 
( ) ( ) ( )2 1 2 1 3P X P Y P Y≤ = − > = − ≥ 
 
Agora vou a tabela: 
 
 
 
Fica ( ) ( )2 1 2 1 0,998 0,002P X P Y≤ = − > = − = . 
 
 
 
3.3 – “…exactamente 1…” 1 número de clientes no dia 1.X → 
O dia 1 não é o primeiro dia do mês, mas sim o primeiro dia da contagem! 
 
2 número de clientes no dia 2.X → 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 247/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
A distribuição de Poisson de parâmetro 6, que se representa por ( ) ( )1~ ~ 6X Poi X Poiλ = 
 
E o 2º dia é ( ) ( )2~ ~ 6X Poi X Poiλ = 
 
( )1 21 1P X X= ∧ = são variáveis independentes. Por isso posso fazer: 
 
( ) ( ) ( ) ( )1 21 x 1 0,015 x 0,015 0,000225P X P X= = = = 
 
 
Na tabela, em que λ é “m” e X é x. 
 
 
 
 
Nota: � � � �
1 2 1 21 1 1 1
x
X X X X
P A B P A P B
= = = =
� � � � � �
=
 � 
 � 
 �
� � � � � �
� , se “A” e “B” forem independentes. 
 
 
Como se sabe se são independentes, é impor a condição “se”: 
 
� �
� �
1 2
1 2
1 1
1 1
x
|
X X
X X
P A P B
P A B
= =
= =
� � � �

 � 
 �
� � � � � �
=
 �
� �
�
2 1X
P B
=
� �

 �
� �
�
1 1X
P A
=
� �
= 
 �
� �
 
 
Para �
1 1X
P A
=
� �

 �
� �
, não é preciso saber o que ocorreu em �
2 1X
P B
=
� �

 �
� �
. 
 
 
 
 
 
3.4 – ( ) ( )2 1 24 | 2 4 !P X X P X= = = = ,são variáveis independentes, como se viu no alínea 3.3. 
 
Na tabela fico a saber que ( )2 4P X = é 0,134 (usando a tabela INDIVIDUAL, pois é igual e 
não maior ou igual). 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 248/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Tabela de três decimais para a distribuição de Poisson (termo INDIVIDUAL) 
 
 
Observação: no processo de Poisson a fórmula é 
 
( )
6 4. .6
0,1339
! 4!
xe e
P X x
x
λ λ− −
= = = = . 
 
 
 
 
 
4 - Na linha de atendimento a clientes de um centro comercial recebe-se em média quatro 
chamadas de reclamações por dia. 
4.1 Calcule a percentagem de dias em que não há reclamações. 
4.2 Qual a probabilidade de num dia se receber de três a seis queixas? 
4.3 Qual a probabilidade de numa semana (2.a a 6.a feira) se receberem exactamente 15 
reclamações? 
4.4 Qual a probabilidade de se receber pelomenos uma reclamação em todos os dias de uma 
semana? 
 
Resolução: cuidado, pois apesar de não ser explicito o método da distribuição a usar, ela é 
implícita (palavras caras, mas não encontrei outras!). Ou seja, não me é dito directamente para 
usar o processo Poisson, mas é me dito indirectamente pois vem a palavra “… média…”. 
 
 
4.1 “…não há reclamações …” é para X=0. A média é 4.λ = 
 
( ) ( )~ ~ 4X Poi X Poiλ→ = 
 
Em que X é o número de reclamações por dia. 
 
( ) ( )
04. .
! !
4
0
0
xe e
P X Px
x
X
λ λ− −
= = → = = ⇔ 
 
( ) ( ) ( )
4
0 0
.1
0,018 1,0 8%
1
e
P X P X P X
−
⇔ = = ⇔ = = ⇔ = = 
 
 
Pode se usar a tabela de Poisson Individual, com m = 4, e x = 0. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 249/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
4.2 ( ) ( ) ( )3 6 3 6 P X P X P X≤ ≤ = ≥ − ≥ 
 
( )Errado!, pois " 6" . O sinal menos é para retirar ao todos os que têm o 6 7 .X X X= ∈ > ≥ 
 
 
 
Pretende se o intervalo de 3 a 6. Calcula-se para maiores do que 3, e retira-se os maiores do 
que 7. Não é 6, pois 6 ainda pertence ao intervalo. E como são variáveis discretas, escolhe-se 
o numero a seguir. Correcto é assim: 
 
( ) ( ) ( )3 6 3 7 3,4,5,6, 7P X P X P X≤ ≤ = ≥ − ≥ = , 8 , 9 , 10{ }
3
,... 7
X ≥
−
�����������
, 8 , 9 , 10{ } { }
3 67
,... 3, 4,5,6
XX ≤ ≤≥
=
������������
 
 
Este raciocínio é feito pelo simples facto da tabela cumulativa ser feita para “cima” (maior ou 
igual) e o que se pretende é para “baixo” (menor ou igual). Como se pretende até ao 6, retira 
se a partir do 7: 
( ) ( ) ( ) ( ) ( )3 6 3 7 0,762 0,111 0,651P X P X P X≤ ≤ = ≥ − ≥ = − = 
 
 
 
Tabela de três decimais para a distribuição de Poisson (termo CUMULATIVO) 
 
 
4.3 Vou utilizar outra variável pois o meu λ é diferente. É 20! Porquê? 
Porque se é de 2ª a 6ª, perfaz 5 dias, e a média diária não altera por se escolher um 
determinado período mais alargado, logo mantém se os 4 diários. 
 
Assim ( ) ( )~ ~ 20Y Poi Y Poiλ→ = 
 
( ) ( ) ( )
20 15. .
015 15 ,05165
! !
15
15
20xe e
P Y P Y Y
x
P
λ λ− −
= = → = = ⇔ = = 
 
 
 
Não posso utilizar a tabela, pois esta só vai até a 14.λ = 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 250/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Mas o Excel não tem limites (!), e aqui está a confirmação de que a formula nos dá o valor 
correcto: 
 
 
 
 
4.4 ( ) ( ) ( ) ( ) ( ) ( ) ( )Domingo 2ª 3ª 4ª 5ª 6ª Sabado1 1 1 1 1 1 1P X P X P X P X P X P X P X≥ ∧ ≥ ∧ ≥ ∧ ≥ ∧ ≥ ∧ ≥ ∧ ≥ 
 
( ) ( )
7 7
1 0,982 0,88P X= ≥ = =� �� � 
 
 
 
 
5 - O número de golos marcados por uma equipa de futebol até às t horas de jogo segue um 
processo de Poisson de taxa 1,8.λ = 
5.1 Qual é a probabilidade se ser marcado um golo durante a primeira meia hora de jogo? 
5.2 Qual é a probabilidade de ser marcado 1 golo nos primeiros 15 minutos de jogo e 2 golos 
nos últimos 40 minutos do jogo? 
 
 
Resolução – para facilitar a interpretação do exercício, vou recordar a teoria (tem que ser!). 
 
 
Axiomática do Processo de Poisson: 
 
P1: O processo de chegadas é "regular", no sentido de homogéneo no tempo, isto é, se 
fizermos uma translação no tempo isso não deve alterar a essência do processo. 
Assim, P1 afirma que ( ) ( ) ( ) ( )2 1 2 1P N t N t k P N t h N t h k− = = + − + =� � � �� � � � , com 
0,1,2, ...k = Por exemplo: estudar o processo entre as 9h e as 10h deve ser idêntico a estudá-
lo entre as 9h23m e as 10h23m. 
 
 
 
P2: O que se passa num intervalo não é informativo sobre o que se passa num outro intervalo 
disjunto do primeiro, para além da homogeneidade atrás postulada. 
 
Assim, se ] ] ] ]1 2 3 4, , ,t t t t = ∅� então 
 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )2 1 4 3 2 1 4 3 x PP N t N t k N t N t j P N t N t k N t N t j− = − = = − = − =� � � � � �� � � � � �� 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 251/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Se soubermos que foram pedidos 6 táxis a uma central entre as 9h12m e as 9h23m, isso não 
nos diz nada sobre quantos vão ser pedidos entre as 9h42m e as 10h28m e também não nos diz 
nada sobre quantos vão ser pedidos entre as 9h34m e as 9h45m. 
 
 
P3: Não há chegadas (exactamente) simultâneas, isto é, ( ) ( ) ( )2 ,P N t dt N t o dt+ − ≥ =� �� � e a 
probabilidade de se observar uma chegada cresce regularmente, linearmente, com a amplitude 
do intervalo de observação, em intervalos muito pequenos. 
Mais precisamente, vamos supor que o processo é grosseiramente linear, que a menos de um 
valor muito baixo e em certo sentido irrelevante e desprezável, a probabilidade de observar 
uma ocorrência num intervalo muito curto ] ],t t dt+ é proporcional ao comprimento dt do 
intervalo, isto é, ( ) ( ) ( )1 = . P N t dt N t dt o dtλ+ − = +� �� � (A constante de proporcionalidade, 
chamada taxa de chegadas, é denotada por λ ). 
 
Trata se de uma família de v.a. Para cada t tem se uma variável de Poisson. 
 
( )X t - é o numero de golos marcados no intervalo de tempo ] ]0 ; ,t com t em horas. 
 
 
Teorema: Seja ( ){ }:N t t O≥ um processo de contagem que verifique os postulados P1, P2 e 
P3. Então, para cada 0 h ≥ e 0 t > fixos, ( ) ( ) ( )~ . N t h N h Poi tλ+ − 
 
( ) ( )~X t Poi tλ 
 
Para o h tenho a liberdade de lhe atribuir um numero qualquer. Vou escolher o zero. 0.h = 
 
 
Corolário: Caso particular no caso de 0h = . ( ) ( )~N t Poi tλ 
 
 
Observação: Por esta razão um processo estocástico de contagem ( ){ }: 0N t t ≥ que verifique 
os postulados P1, P2 e P3 é denominado processo de Poisson de taxa λ . 
 
 
Assim continuando o raciocínio o e sabendo de que 1,8λ = : 
 
( ) ( ) ( ) ( )( )~ ~ 1,8N t Poi t N t Poi tλ → 
 
Nota: “…de taxa 1,8.λ = ” é uma frequência, logo usa se o Processo Poisson. 
 
 
 
 
Agora que já pus as ideias em ordem, vou finalmente resolver o exercício. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 252/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
5.1 
1
1
2
P X
� �� � =
 �
 �
� �� �
, em que 
1
2
 é a meia hora de tempo (não confundir com meio jogo). 
 
( ) ( ) ( ) ( )
Processo Poisson
Agora já se tem uma
Variavel Aleatoria de Poisson
1 1 1
~ ~ 1,8 ~ 0,9
2 2 2
N t Poi t N Poi N Poiλ
� �� � � � � �
→ ⇔
 � 
 � 
 �
 �
� � � � � �� �������� ��������� 
 
 
Agora vou a “Tabela de três decimais para a distribuição de Poisson (termo INDIVIDUAL) ”, 
com 0,9λ = e 1X = . 
 
 
Tabela de três decimais para a distribuição de Poisson (termo INDIVIDUAL) 
 
( ) ( )1 1 1~ 1,8 ~ 0,9 0,366
2 2 2
N Poi N Poi
� �� � � � � �= =
 � 
 � 
 �
 �
� � � � � �� �
 
 
 
Ou seja 
1
1 0,366
2
P X
� �� � = =
 �
 �
� �� �
. 
 
 
 
5.2 Vou primeiro representar a escala do tempo para ser mais fácil perceber donde vem os 
valores: 
 
 
muito importante perceber este termo!
 são os ULTIMOS 40 minutos.
1 3 5
1 2
4 2 6
Pois
P X X X
� �

 �
� � � � � �
 �= ∧ − =
 � 
 � 
 �
 �� � � � � �
 �

 �
� �
�������
 
 
( )1 3 50 1 2
4 2 6
Intervalo Intervalo
P X X X X
� �

 �� � � � � �
− = ∧ − =
 �
 � 
 � 
 �
� � � � � �
 �
� �
��������� ���������
 e os intervalos são disjuntos. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 253/305 
Sugestões: jrvalente@netmadeira.comProbabilidades e Estatística 
 
Aqui usei o axioma P2: 
 
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )2 1 4 3 2 1 4 3 x P
Intervalo Intervalo
P N t N t k N t N t j P N t N t k N t N t j
� �
� �− = − = = − = − =� � � �� � � �
� �� �
�
��������� ���������
 
 
 
( )1 3 50 1 x P 2
4 2 6
P X X X X
� � � �� � � � � �− = − =
 � 
 � 
 �
 � 
 �
� � � � � �� � � �
 
 
Teoria: 
P1: O processo de chegadas é "regular", no sentido de homogéneo no tempo, isto é, se 
fizermos uma translação no tempo isso não deve alterar a essência do processo. 
 
Assim, P1 afirma que ( ) ( ) ( ) ( )2 1 2 1P N t N t k P N t h N t h k− = = + − + =� � � �� � � � , com 
0,1,2, ...k = Por exemplo: estudar o processo entre as 9h e as 10h deve ser idêntico a estudá-
lo entre as 9h23m e as 10h23m. 
 
Ou seja no axioma P1, é dito que posso somar (ou subtrair) uma unidade, assim: 
 
3 9 5 4 2 5
0
2 6 6
5
6
5
6 63
−
= = −= ∧ =− 
 
 
Substituindo na minha equação, fica: 
 
( ) ( )1 20 1 x P 0 2
4 3
P X X X X
� � � �� � � �− = − =
 � 
 �
 � 
 �
� � � �� � � �
 
 
 
Agora usando o axioma P1: 
1 2
1 x P 2
4 3
P X X
� � � �� � � �= =
 � 
 �
 � 
 �
� � � �� � � �
, vou ter que usar um C.A. 
 
 
 
Calculo Auxiliar: ( ) ( )1 1 1~ 1,8 ~ 0, 45 .
4 4 4
X Poi X Poi
� �� � � � � �=
 � 
 � 
 �
 �
� � � � � �� �
 
 
 E ( ) ( )2 2 2~ 1,8 ~ 1, 2 .
3 3 3
X Poi X Poi
� �� � � � � �=
 � 
 � 
 �
 �
� � � � � �� �
 
 
 
 
Como os valores não estão na tabela, vou ter de os calcular. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 254/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
( )0,45 1.1 . 1 1
0, 28693
4
0, 45
1
4
1
1! 4 !
x ee
P X X P Xx
x
P
λ λ −−� � � � � �� � � � � �= = → = = ⇔ = =
 � 
 � 
 �
 � 
 � 
 �
� � � � � �� � � � � �
 
 
( )21,2.2 . 2 2
0,21686
3 ! 3
2 2
2! 3
1, 2x
x
x
ee
P X P X P X
λ λ −−� � � � � �� � � � � �= = → = = ⇔ = =
 � 
 � 
 �
 � 
 � 
 �
� � � � � �� � � � � �
 
 
 
Assim, tudo completo fica: 
 
( ) ( )1 21 x P 2 0, 28693 x 0, 21686 0,062279
4 3
P X X
� � � �� � � �= = = =
 � 
 �
 � 
 �
� � � �� � � � 
 
 
 
 
 
 
 
 
 
 
A Distribuição Normal 
 
A distribuição normal é a mais importante das distribuições contínuas. Com efeito, do ponto 
de vista das aplicações empíricas, tem-se comprovado que muitos atributos observáveis de 
determinada população são bem representados por variáveis aleatórias que seguem uma 
distribuição normal. Por exemplo, a distribuição normal pode constituir uma boa aproximação 
da distribuição das alturas (ou dos pesos) dos indivíduos em populaçoes razoavelmente 
homogéneas, ou a distribuição dos erros de medida de determinadas grandezas físicas. 
 
Definicão: Dizemos que X é uma variável aleatória normal (ou gaussiana) com 
( )parâmetros , e 0, e escrevemos ~ ; se e só se a correspondente funçãoR X Norµ σ µ σ∈ >
 
densidade de probabilidade for : 
( )
2
1 1
: , tal que exp .
22
x
f R R f x
µ
σπσ
� �−� �→ = −� �
 �
� �� �� � 
 
( )Observac o : Se ~ ; , então é uma v.a. absolutamente con .t u ín aã X Nor Xµ σ
 
 
( ) [ ] ( ) 2Proposicão: Se ~ ; , então e .X Nor E X Var Xµ σ µ σ= =
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 255/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Exemplo que vai ajudar a compreensão: 
 
 
 
A figura a seguir mostra uma curva normal típica, com seus parâmetros descritos 
graficamente. 
 
O valor de uma variável tem ocorrência normal quando está entre 95% da área sob a curva 
em forma de sino, que tem a variável frequência no eixo dos Y, cujas extremidades ocupam 
2,5% cada. Ou seja, algum valor é considerado normal se está na em qualquer ponto entre 
0,025 e 0,975 (2,5 e 97,5%) da área sob a curva. 
 
De ter em conta que as areas de 0 a 2,5% é a mesma do que de 97,5 a 100%. Isto é importante 
uma vez que a tabela dada só dá valores superiores, e as vezes pretenden se inferior. 
 
 
( 
É muito importante entender como a curva é afetada pelos valores numéricos de µ e �. 
Assim, como se vê na figura anterior, em que x corresponde ao número de desvios padrão e Y 
demonstra a frequência, quanto maior a média, mais à direita está a curva. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 256/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Note-se que, se diferentes amostras apresentarem o mesmo valor de média µ e diferentes 
valores de desvios padrão �, a distribuição que tiver o maior desvio padrão se apresentará 
mais achatada (c), com maior dispersão em torno da média. Aquela que tiver o menor desvio 
padrão apresentará o maior valor de frequência e acentuada concentração de indivíduos em 
valores próximos à média (a). 
 
Já, distribuições normais com valores de médias diferentes e o mesmo valor de desvio padrão 
possuem a mesma dispersão, mas diferem quanto à localização no eixo dos X. 
 
 
 
 
( )P Z z Area≥ =
 
 
 
Como consultar a tabela fornecida para um valor de 0,53 :z =
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 257/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Vou a tabela e procuro por 0,50 e 0,03 (=0,53): 
 
 
 
( )A tabela para ser única é necessário padronizar os dados dos exercícios para ~ 0 ; 1Z N
 
 
O significado desta fórmula é a seguinte: uma média de zero, e um desvio padrão é um. 
 
 
 
Exercício: 
 
1 - Sabe-se que a v.a. X tem distribuição normal com parâmetros µ = 3 e � = 2. Calcule: 
( )1.1 5 ; P X <
 ( )1.2 0 ; P X ≥
 ( )1.3 1 4 ; P X− ≤ ≤
 ( )1.4 2 3 . P X≤ ≤
 
 
 
Resolução: 
 
( )1.1 5 ?P X < = na tabela não se tem 5!! (pois a tabela só vai até 0,9) 
Ok, é aqui que entra a estandardização. Ou seja vai se “transportar” de modo a se poder 
utilizar a tabela. 
 
( )
( )
� ( )
~ 0 ; 1
5 5 5
5
2
1
2
3
2 Z
Z
N
X
P X P P Z P Z P Z P Z
µ µ µ
σ σ σ
=
� �
� �− − − −
 � � � � �
< = < = < = < = < = <
 �
 � 
 �
 � 
 �� � � � � �
 �
� �
���
 
 
Já está! Parece que já consigo utilizar a tabela. Disse “parece”!? 
 
Pois é, tem mais um problema, a tabela é para “maior do que”. 
 
( ) ( ) ( )
Aqui está a Aqui "converto" o 
standarização "maior de que" em 
"menor de que".
15 1 1P X P Z P Z< = < = − ≥
����� �����
 
 
Aqui também há novidade! Pois está-se a lidar com variáveis contínuas, logo é indiferente 
colocar o igual. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 258/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
( )
( ) ( )
( ) ( )
0 é por ser zero que é indiferente colocar o igual.P Z a
P Z a P Z a
P Z a P Z a
= =
≥ = >
≤ = <
 
 
Nas variáveis aleatórias de Poisson ou Binomial, por serem discretas, não se pode desprezar o 
igual! 
 
O porquê? É fácil, pois nas variáveis continuas o intervalo de números entre zero e um, por 
exemplo, é infinito! Por isso mais um menos um é indiferente. Nas variáveis discretas, já não 
se podem desprezar numero nenhum. 
 
Assim voltando ao exercício, obtive então: ( ) ( )1 15P X P Z< = − > . Agora vou a tabela, mas 
“separando” o número obtido, pois para ser exacto, o resultado é na realidade “1.00”. Pois na 
tabela, nas linhas tenho “1.0” e nas colunas tenho “0,00”. 
 
Baralhado!? Vou então socorrer me da tabela, poiscom o primeiro exemplo fica tudo mais 
fácil de entender. 
 
 
( ) ( )1 1 1 05 ,1587 0,8413P X P Z< = − ≥ = − = 
 
Qual o significado deste valor calculado? 
É a área! Em que a área total é 1, então neste caso seria 84,13% do total. 
 
 
 
( )
( )
�
~ 0 ; 1
0 0 0 3
1.2
2
0
3
 
2
Z
Z N
X
P X P P Z P Z P Z
σ σ
µ µ µ
σ
=
� �
� �− − − −
 � � � � �
≥ = ≥ = ≥ = ≥ = ≥ −
 �
 � 
 �
 � 
 �� � � � � �
 �
� �
���
 
 
Mais um problema, a tabela não tem números negativos! É preciso ser se criativo, pois se 
Maomé não vai a montanha, vem a montanha a Maomé. Ou seja vou inverter o sinal: 
 
( ) 30
2
P X P Z� �≥ = <
 �
� �
. 
 
Parece que resolvi um problema e criei outro. Mas não, pois este ultimo já sei resolver: 
 
( ) ( ) ( )3 1 1,5
2
0 0P X P Z P X P Z� �≥ = < ⇔ ≥ = − >
 �
� �
, mas na tabela não há números 
fraccionários (!). 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 259/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Agora vou a tabela, mas “separando” o número obtido, pois para ser exacto, o resultado é na 
realidade “1.50”. Pois na tabela, nas linhas tenho “1.5” e nas colunas tenho “0,00”. 
 
( ) ( ) ( ) ( )3 1 1,5 1 0,06680
2
0 0P X P Z P X P Z P X� �≥ = < ⇔ ≥ = − > ⇔ ≥ = − ⇔
 �
� �
 
 
( ) 0, 30 9 32P X ≥ = 
 
 
( ) ( )41.3 23 3 0,4 51 41 1
2 2
Z
X
P X P P Z P Z
σ σ σ
µ µ µ
=
� �
− − − − −
 � � �
≤ ≤ = ≤ ≤ = ≤ ≤ = − ≤ ≤
 �
 � � �
−
�
−
�
�
−
���
 
 
Agora vou ter que recordar a teoria: 
 
De uma variável aleatória, o seu teorema diz me que: se F é uma função de distribuição então 
F goza das seguintes propriedades: 
 
1) ( ), 0 1.x R F x∀ ∈ ≤ ≤ 
2) F é crescente: ( ) ( ), , .x y R x y F x F y∀ ∈ < � ≤ 
3) ( ) ( ) ( ) ( ): lim 0 e : lim 1;
x x
F F x F F x
→−∞ →+∞
−∞ = = +∞ = = 
4) ( ) ( ) ( ) ( ), , , esta a que interessa .a b R a b P a X b F b F a É∀ ∈ = −≤<< � 
5) F é contínua à direita: ( ) ( ) ( ), : lim .
x a
a R F a F x F a
+
+
→
∀ ∈ = = 
6) ( ) ( ) ( ), .a R P X a F a F a−∀ ∈ = = − 
 
 
Adaptado ao exercício: 
( )
�
( )
� ( )
( )
( )
( )
2 0,5 0,5 2 (alinea 4 do teorema 3)
F a F b F b F a
P Z F F
� �

 �− ≤ ≤ = − − =

 �
� �
����� ���
 
 
( ) , o cuidado com o sinal das inequações só interessa para as variáveis discretas!P a X b≤<
 
O que não é o caso com as variáveis aleatórias normais. 
 
( )
�
( )
�Assim: 0,5 2
F aF b
P Z P Z
� � � �

 �≤ − − ≤
 �
 �
 � � �� �
!Errado
 
 
( )Como fiz , tenho que ter o cuidado com a inequação.F a− 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 260/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Assim fica na realidade 
( )
�
( )
� ( ) ( )0,5 2 0,5 2
F aF b
P Z P Z P Z P Z− ≥
� � � �

 �≤ − = ≤ −
 −�
 �
 � � ��
≤
�
, mas agora 
tenho outro problema. O “-2”, como é um número negativo, não está na tabela. Assim fica: 
 
( ) ( ) ( ) ( )0,5 2 0,5 2P Z P Z P Z P Z≤ − = ≤ −≥ ≥− = 
 
Falta resolver este ( )0,5P Z ≤ , pois a tabela é para “maior do que”. 
 
( ) ( ) ( ) ( )10,5 2 0,5 2P Z P Z P Z P Z−≤ − − −>≥ = ≥ = 
 
Agora vou a tabela e sei que: 
 
 
( ) ( ) ( ) ( )0,5 2 0,5 2 1 0,3085 0,0228 0,66871P Z P Z P Z P Z≤ − − ≥ = − ≥ = − − =− >
 
 
 
( ) ( )3 331.4 2 22
2 2
 0,
3 3
5 0
Z
X
P X P P Z P Z
µ µ µ
σ σ σ
=
� �
− − − − −
 � � �
≤ ≤ = ≤ ≤ = ≤ ≤ = − ≤ ≤
 �
 � � �
 �
� �
��� 
 
( )
�
( )
� ( )
( )
� ( )
( )
0,5 0 0 0,5 (alinea 4 do teorema 3)
F bF a F b F a
P Z F F
� �

 �− ≤ ≤ = − − =

 �
� �
�����
 
 
( )
�
( )
� ( ) ( )0 0,5 0 0,5
F b F a
P Z P Z P Z P Z− ≥
� �� �

 �≤ − = ≤ −
 � − ≤
 � 
 �� � � �
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 261/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
( )
�
( )
� ( ) ( ) � ( )
0 Inverti o sinal
0 0,5 0 0,5 0,5 0,5 0,5 0,3085 0,1915
F b zF a
P Z P Z P Z P Z P Z
=
� �� �

 �≤ − = ≤ − = − > = − =
 �
 � 
−
�� � �
− ≤
�
≥
�����
 
 
2 - O tempo requerido para executar certa tarefa é uma variável aleatória com distribuição 
normal de µ = 72 minutos e � = 12 minutos. Calcule a probabilidade de a tarefa: 
 
2.1 Demorar mais de 93 minutos a ser executada; 
2.2 Não demorar mais de 65 minutos a ser executada; 
2.3 Demorar entre 63 e 78 minutos a ser executada. 
 
Resolução: 
X é uma variável aleatória normal. Em que: 
 
( ) ( )~ ; ~ 72 ; 12X Nor X Norµ σ ⇔
 
 
( )
( )
�
~ 0 ; 1
93 93
12
2.1 1,75 0,04013
72
9
N
Z
Z
X
P X P P Z P Z
µ µ
σ σ
=
� �
� �− − −
 � � �
≥ = ≥ = ≥ = ≥ =
 �
 �
 � 
 �� � � �
 �
� �
��� 
 
( )
( )
� ( ) ( )
~ 0 ; 1
2.2 
65 6
0,58 0,58 0,281
5
6 0
7
1
5
2
2Z N
Z
X
P X P P Z P Z P Z
µ µ
σ σ
=
� �
� �− − −
 �
≤ = ≤ = ≤ = ≤ − = ≥ =
 �
 � 
 �
� �
 �
� �
���
 
( ) ( )2.3 0,75 0,578 7878
12 12
72 763 6 23
63
Z
X
P X P P Z P Z
σ σ σ
µ µ µ
=
� �
− − − − −
 � � �
≤ ≤ = ≤ ≤ = ≤ ≤ = − ≤ ≤
 �
 � � �
 �
� �
���
( )
�
( )
� ( )
( )
( )
( )
0,75 0,5 0,5 0,75 (alinea 4 do teorema)
F a F b F b F a
P Z F F
� �

 �− ≤ ≤ = − − =

 �
� �
����� �����
 
 
( )
( )
�
( )
� ( ) ( )0,5 0,75 0,63 5 08 ,757
F b F a
P X P Z P Z P Z P Z
� � � �

 � 
 �≤ ≤ = ≤ − = ≤ − ⇔

 � 
 �
� � � �
− ≥ − ≤ 
 
( ) ( ) ( )0,5 0,71 15 0,3086 5 0,2266 0,4643 78 9P X P Z P Z− ≥ −⇔ ≤ = − =≥≤ = − 
 
Como se pode ver no gráfico quando 0, a área é metade do total.z =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 262/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
Variável Aleatória Exponencial 
 
A distribuição exponencial tem a sua génese associada ao processo de Poisson, muito embora 
a sua utilização na modelação estatística seja bastante mais ampla, aplicando-se, para além do 
tempo de espera entre eventos originados por um processo de Poisson, a fenómenos como o 
tempo de vida de equipamentos, montantes de indemnizações, etc. 
 
Definição - 1: A variável aleatória X com função densidade 
 
( )
0 0
: , tal que ,
0x
se x
f R R f x
e se xλλ −
≤�
→ = 	
>
 
 
diz-se que tem distribuição exponencial ou que X é uma variável aleatória exponencial e X -- 
( )simbolicamente representamos por ~ .X Exp λ
 
 
( ) 2 : Se ~ ,então X é uma v.a. absolutamente contínua. Observação X Exp λ−
 
Teorema - 3: O tempo de espera X entre duas chegadas consecutivas (ou entre dois eventos 
consecutivos) num processo de Poisson com taxa � tem distribuição exponencial com
( )parâmetro , isto é, ~ .X Expλ λ
 
 
( ) ( ) ( ) 2
1 1
 4 : Se ~ então e .Proposição X Exp E X Var Xλ
λ λ
− = =
 
 
 
 
Exercícios 
 
1 - A chegada de clientes a uma loja segue um processo de Poisson em que o ritmo médio de 
afluência é de 20 clientes por hora. Após abrir a loja qual é a probabilidade de o comerciante 
ter de esperar mais do que 5 minutos pela chegada do primeiro cliente? 
 
 
Resolução – chegam consecutivamente 20 clientes por hora! Muito cuidado com a unidade 
de tempo utilizada no enunciado. 
� = 20 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 263/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
A variável é contínua, pois o tempo é contínuo. Assim, X é o tempo que decorre entre a 
chegada de dois clientes. 
 
( )Apetece fazer 5 minutos , mas a variavel hora.P X é>( )
0 0
Tenho que recordar a defini o 1 : , tal que 
0x
se x
çã f R R f x
e se xλλ −
≤�
− → = 	
>
 
 
( )
( )
� ( ) ( )
( )
20
1 1 1
12 12 12
2
1
1
0
2
xx
f x
f x
P X f x dx e dx e dxλλ
+∞ +∞ +∞ −−� �> = = =
 �
� �
� � � �����
 
 
Para poder integrar preciso do sinal, como não o tenho, coloco um dentro do integral (pois é 
necessário para se poder fazer a integração, e outro fora do integral para não alterar o valor da 
equação). Assim fica: 
 
( )
( )
� ( ) ( )
( )
( ) ( )
( )
2
1 1 1 1
12 12 12 1
0 2
2
01
12
20 20
f x
f x
x xx
f x
P X f x dx e dx e dx e dxλλ
+∞ +∞ +∞ − −+∞−� �> = = = = ⇔
 �
� �
− −� � � ������ �����
 
 
( ) ( )
( )
( ) ( )( ) ( )
1
12
1 1
12 12
20
20 20 2020
1
12
x x
f x
P X e dx e e e
� �
+∞+∞ 
 �−− �− − +∞ �
� �� �� �> = = − =− − − − ⇔
 �
 �
 � 
 �� � � � � �
� �����
 
 
( )( )20Ora sei que 0, assim substituindo, fica:e e∞− −∞+ = =
 
( )( ) ( ) ( )
1 20 20
1
2
20 12
0
2 2 1
1
0 0,1889 18,89%
12
P X e e e e
� �

 �+∞ �
− − −− �
� � � �� �> = − − = − − = ≈
 � 
 �
 � 
 �� � � �� � 
 
 
( ) 1 1Quanto ao tempo m dio que decorre entre duas chegadas 0,05.
20
é é E X
λ
= = =
 
 
Mas cuidado! Qual é a unidade!? 
 
É a HORA. Ou seja é 0,05 horas, que é na prática 3 minutos. 
 
Mas que tempo é este!? 
 
É o tempo entre duas chegadas.
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 264/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
Estatística Intuitiva 
 
 
 
Inferência Estatística 
 
 
 
 
 
Representação matemática: 
 
 
 
 
 
Parâmetros: 
 
População Amostra 
 Média µ X 
 Variância 2σ 
2s 
 Desvio Padrão σ s 
 Proporção p ^
p 
 
 
 
 
Como se distinguir “População” e “Amostra”: 
 
População é a totalidade de pessoas, animais, plantas ou objectos, da qual se podem recolher 
dados. É um grupo de interesse que se deseja descrever ou acerca do qual se deseja tirar 
conclusões. A média existe mas nunca se consegue saber o valor exacto, apenas se consegue 
até a um intervalo de confiança de 95% (pois os valores variam instantaneamente ao longo do 
tempo). Teoricamente (para estudo) a população é infinita. 
Amostra é um subconjunto de uma população ou universo. A amostra deve ser obtida de uma 
população específica e homogénea por um processo aleatório. A aleatorização é condição 
necessária para que a amostra seja representativa da população. Depois de se calcular para a 
amostra, extrapola se valores para a população. 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 265/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Formulário de Hipóteses: 
 
 
 
0H Estatística de teste 1H Região de rejeição 
 
 
1.1 
 
0p p= 
 
0
0 0
X np
T
np q
−
= 
0p p> 
0p p< 
0p p≠ 
T zα> 
T zα< − 
2
T zα< − ou 
2
T zα> 
 
 
1.2 
 
0µ µ= 
 
0XT
n
µ
σ
−
= 
0µ µ> 
0µ µ< 
0µ µ≠ 
T zα> 
T zα< − 
2
T zα< − ou 
2
T zα> 
 
 
1.3 
 
0µ µ= 
 
0XT
s n
µ−
= 
0µ µ> 
0µ µ< 
0µ µ≠ 
T zα> 
T zα< − 
2
T zα< − ou 
2
T zα> 
 
 
1.4 
 
0µ µ= 
 
0XT
s n
µ−
= 
0µ µ> 
0µ µ< 
0µ µ≠ 
( ) ; 1nT t α −> 
( ) ; 1nT t α −< − 
 ; 1
2
n
T t α� �−
 �
� �
< − ou 
 ; 1
2
n
T t α� �−
 �
� �
> 
 
 
 
2.1 
 
 
 
1 2p p= 
^ ^
1 2
^ ^
1 2
1 1
p p
T
p q
n n
−
=
� �
+
 �
� �
 
Onde 
^
1 2
1 2
X X
p
n n
+
=
+
 
 
1 2p p> 
 
1 2p p< 
 
1 2p p≠ 
 
T zα> 
 
T zα< − 
 
2
T zα< − ou 
2
T zα> 
 
 
2.2 
 
 
1 2 0dµ µ− = 
 
( )1 2 0
2 2
1 1 2 2
X X d
T
n nσ σ
− −
=
+
 
1 2 0dµ µ− > 
1 2 0dµ µ− < 
1 2 0dµ µ− ≠ 
T zα> 
T zα< − 
2
T zα< − ou 
2
T zα> 
 
 
2.3 
 
1 2 0dµ µ− = 
 
( )1 2 0
2 2
1 1 2 2
X X d
T
s n s n
− −
=
+
 
1 2 0dµ µ− > 
1 2 0dµ µ− < 
1 2 0dµ µ− ≠ 
T zα> 
T zα< − 
2
T zα< − ou 
2
T zα> 
 
 
2.4 
 
0d dµ = 
 
0
d
d d
T
s n
−
= 
0d dµ > 
0d dµ < 
0d dµ ≠ 
( ) ; 1nT t α −> 
( ) ; 1nT t α −< − 
 ; 1
2
n
T t α� �−
 �
� �
< − ou 
 ; 1
2
n
T t α� �−
 �
� �
> 
 
 
0p é a probabilidade NULA. 
0µ é a media 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 266/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Formulário de Intervalos de confiança: 
 
 
 
Intervalo de confiança para 1 população – 
 
 
1.1 - Proporção - 
^ ^ ^ ^
^ ^
2 2
. .Z p Z
n n
pq pq
p pα α− < < + 
 
1.2 - Média, conhecendo o desvio padrão - 
2 2
. .X Z X Z
n n
α α
σ σ
µ− < < +
 
 
 
1.3 - Média, desconhecendo o desvio padrão e “n” grande - 
2 2
. .
s s
X Z X Z
n n
α αµ− < < + 
 
 
 
1.7 - Média, desconhecendo o desvio padrão e “n” pequeno – 
 
; 1 ; 1
2 2
. .
n n
s s
X t X t
n n
α αµ� � � �
− −
 � 
 �
� � � �
− < < + 
 
 
 
Ou seja no cálculo dos pontos 1.1, 1.2 e 1.3 usa se a tabela de distribuição (da curva) normal, 
e para o ponto 1.4 usa se a tabela da distribuição “t”. 
 
Nota: não é regra, mas distingue se “n” pequeno e “n” grande assim: pequeno < 30 < grande. 
 
 
 
 
 
 
 
Intervalo de confiança para 2 população – 
 
 
2.1 - Proporção – 
 
^ ^ ^ ^ ^ ^ ^ ^
^ ^ ^ ^
1 2 1 22 2
1 1 2 2 1 1 2 2. .1 2 1 2 1 2Z Zn n n n
p q p q p q p q
p p p p p pα α
� � � �
− − + < − < − + +
 � 
 �
� � � �
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 267/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
2.2 - Média, conhecendo o desvio padrão – 
 
( ) ( )
2 2 2 2
1 2 1 2
1 2 1 2 1 2
1 2 1 22 2
. .X X Z X X Z
n n n nα α
σ σ σ σ
µ µ− − + < − < − + + 
2.3 - Média, desconhecendo o desvio padrão e “n” grande – 
 
( ) ( )
2 2 2 2
1 2 1 2
1 2 1 2 1 2
1 2 1 22 2
. .
s s s s
X X Z X X Z
n n n nα α
µ µ− − + < − < − + + 
 
 
2.4 - Média, desconhecendo o desvio padrão e “n” pequeno – 
 
; 1 ; 1
2 2
. .D DD
n n
s s
D t D t
n n
α αµ� � � �
− −
 � 
 �
� � � �
− < < + 
 
 
 
Ou seja no cálculo dos pontos 2.1, 2.2 e 2.3 usa se a tabela de distribuição (da curva) normal, 
e para o ponto 2.4 usa se a tabela da distribuição “t”. 
 
 
 
 
 
 
 
Exercício sobre Inferência Estatística 
 
 
 
1 - Realizou-se uma experiência com objectivo de estudar as práticas de saúde dentária e 
atitudes de uma certa população adulta de uma determinada cidade. Dos 300 adultos 
intervenientes 123 afirmaram que com regularidade fazem um “chek-up” dentário 2 vezes por 
ano. 
Determine o intervalo de 95 % de confiança para a verdadeira proporção dos adultos que têm 
cuidados dentários. 
 
 
Resolução – primeiro vou organizar os dados fornecidos. 
 
^ ^ ^123 177
300 1 0,95 1 0,05
300 300
n p q p c cα= ∧ = ∧ = − = ∧ = ∧ = − = 
 
Nota: α é o nível de significância e “c” é o nível (ou intervalo) de confiança. 
 
 
Se me socorrer do formulário, vou utilizar a fórmula 1.1 (do Intervalo de Confiança). Porquê? 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 268/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Porque é apenas uma população, logo começa por “1.?”. Agora das quatro como sei que é a 
primeira? Pois é a única que me calcula a proporção! Assim fica: 
 
 
^ ^ ^ ^
^ ^
0,05 0,05
2 2 2 2
123 177 123 177
. .123 123300 300 300 300. . . .
300 300 300 300
Z p Z Z p Z
n n
pq pq
p pα α− < < + = − < < + =
 
 
0,025 0,0250,41.0,59 0,41.0,59
0,41 . 0,41 .
300 300
Z p Z= − < < + = 
 
 
Agora como sei o valor de 0,025Z ? Vou me socorrer da tabela da distribuição normal, mas 
desta vez, sei o resultado, vou é a procura das coordenadas: 
 
 
 
Assim o meu valor está nas coordenadas do resultado 0,025, que é 1,9 + 0,06. 
 
Assim 0,025 1,96.Z = 
Continuando o meu cálculo, fica: 
 
0, 41.0,59 0,41.0,59
0, 41 1,96. 0,41 1,96. 0,354 0,466
300 300
p p= − < < + = < < 
 
 
] [0,354 ; 0,466p∴ ∈ 
 
Posso por isso concluir (e afirmar) que a proporção de adultos que têm cuidados dentários está 
entre 35,4 e 46,6 %, com um grau de confiança de 95%. 
 
 
Nota a parte: o valor de Z depende da tabela usada, e nesta faculdade é esta formula (é apenas 
uma opção aleatória em duas possibilidade). A tabela fornecida é para a situação de maior ou 
igual. Se fosse menor ou igual seria 0,975
1
2
.Z Zα
−
= 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 269/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
2 - Mediu-se a pressão sistólica numa amostra representativa com 36 indivíduos de uma 
população e obteve-se uma média de 137 mm de Hg. De estudos anteriores, leva-se a supor 
que nesta população a pressão arterial sistólica segue uma distribuição Normal de valor médio 
e desvio padrão 9 mm de Hg. 
Encontre um intervalo de confiança de 95% para a média da pressão arterial sistólica na 
população. 
 
Resolução – primeiro vou organizar os dados fornecidos. 
 
36 137 9 0,95 1 0,05n X c cσ α= ∧ = ∧ = ∧ = ∧ = − = 
 
Nota: α é o nível de significância e “c” é o nível (ou intervalo) de confiança. 
 
Se me socorrer do formulário, vou utilizar a fórmula 1.2 (do Intervalo de Confiança). Porquê? 
 
Porque é apenas uma população, logo começa por “1.?”. Agora das quatro como sei que é a 
segunda? Pois é sei o valor do desvio padrão ( )9σ = ! Assim fica: 
 
2 2
9 9
. . 137 1,96. 137 1,96.
36 36
X Z X Z
n n
α α
σ σ
µ µ− < < + = − < < + = 
 
134,06 139,94µ< < 
 
] [134,06 ; 139,94µ∴ ∈ 
 
Nota: já sabia, do exercício 1, o valor de 
2
Zα , pois o intervalo de confiança é o mesmo! 
Posso afirmar, com uma confiança de 95%, que a média de pressão arterial sistólical da 
população é um valor entre 134,06 e 139,94. 
 
 
 
3 - Num estudo, foi medido o comprimento de 100 folhas de uma certa variedade de arroz. 
Essas medições permitiram calcular 28 cmX = e 2 22,09 .s cm= 
Determine um intervalo a 90 % de confiança para o comprimento médio das folhas. 
 
Resolução – primeiro vou organizar os dados fornecidos. 
 
2 2100 28 cm 2,09 0,9 0 10 1 ,0cn X s cm cα= ∧ = ∧ = ∧ = − ==∧ 
 
Nota: α é o nível de significância e “c” é o nível (ou intervalo) de confiança, e aqui é de 90%! 
 
Se me socorrer do formulário, vou utilizar a fórmula 1.3 (do Intervalo de Confiança). Porquê? 
 
Porque é apenas uma população, logo começa por “1.?”. Agora das quatro como sei que é a 
segunda? Pois não sei o valor do desvio padrão e “n” é grande! Assim fica: 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 270/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
2 2 2 2
2,09 2,09
. . 28 . 28 .
100 100
s s
X Z X Z Z Z
n n
α α α αµ µ− < < + = − < < + = 
 
É preciso ter cuidado, pois é nos dado o valor de 
2 22,09 s cm= , e o que se pretende é de “s”. 
 
Também aqui o valor do nível de confiança é de 90%, logo como é um valor novo, é 
necessário ir a tabela da distribuição normal: 
 
0,1 0,05
2 2
Z Z Zα = = 
 
 
 
Como não existe um valor igual, vou calcular a media dos dois valores próximos. 
 
0,1 0,05
2 2
1,64 1,65
1,645
2
Z Z Zα
+
= = = =
 
 
1, 45 1, 45
28 1,645. 28 1,645. 27,76 28,24
10 10
µ µ= − < < + = < < 
 
] [27,76 ; 28,24µ∴ ∈ 
 
Posso afirmar, com uma confiança de 95%, que o comprimento médio das folhas (da 
população) está compreendido entre 27,76 e 28,24. 
 
 
 
 
 
4 - Num hospital observaram-se 23 doentes com hepatite, tendo-se determinado para cada um 
a relação: 
 
 
globulina
X
total de proteínas
β
= 
 
Sabendo que 15,5X = e 2 18,25s = , determine um intervalo de confiança para a média da 
população correspondente. 
 
 
Resolução – primeiro vou organizar os dados fornecidos. 
 
223 15,5 18, 25 18,25 4, 27n X s s= ∧ = ∧ = → = = 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 271/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Não me é dado o intervalo de confiança, e quando é omisso, então é de 95% (é regra). 
 
0,95 1 0,05c cα= ∧ = − = 
 
Se me socorrer do formulário, vou utilizar a fórmula 1.4 (do Intervalo de Confiança). Porquê? 
 
Porque é apenas uma população, logo começa por “1.?”. Agora das quatro como sei que é a 
segunda? Pois não sei o valor do desvio padrão e “n” é pequeno! Assim fica: 
 
; 1 ; 1
2 2
. .
n n
s s
X t X t
n n
α αµ� � � �
− −
 � 
 �
� � � �
− < < + 
 
Aqui temos duas novidades, a primeira para se calcular o valor do “t” usa-se a tabela da 
“Distribuição-t”, e a procura do valor também é diferente, pois é nos dado as coordenadas, e 
só temos que encontrar o valor no centro.
 
 
A distribuição t (de “Student”) é uma distribuição de probabilidade teórica. É simétrica, 
campaniforme, e semelhante à curva normal padrão, porém com caudas mais largas, ou seja, 
uma simulação da t de Student pode gerar valores mais extremos que uma simulação da 
normal. O único parâmetro v que a define e caracteriza a sua forma é o número de graus de 
liberdade. Quanto maior for esse parâmetro, mais próxima da normal ela será. 
Mas já lá vou, vou fazer o que é obvio: 
 
( ) ( )0,025 ; 23 1 0,025 ; 23 1
; 1 ; 1
2 2
4,27 4, 27
. . 15,5 . 15,5 .
23 23n n
s s
X t X t t t
n n
α αµ µ− −� � � �
− −
 � 
 �
� � � �
− < < + = − < < +
 
Agora vou me socorrer da tabela para calcular o valor de ( )0,025 ; 22t : 
 
 
 
Assim ( )0,025 ; 22 2,074. Continuando, fica :t = 
 
15,5 2,074.0,89 15,5 2,074.0,89 13,65 17,35µ µ= − < < − = < < 
 
] [13,65 ; 17,35µ∴ ∈ 
 
Posso afirmar, com uma confiança de 95%, que num hospital, os doentes com hepatite (da 
população) está compreendido entre 13,65 e 17,35. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 272/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
5 – A taxa de desemprego de um determinado país é 7,8%. Num dado distrito desse país 
foram contabilidade 96 desempregados em 1.600 indivíduos pertencentes a população activa. 
Ao nível de significância de 0,01, existe evidência de que a taxa de desemprego no distrito é 
inferior a do país? 
 
 
Resolução – X é o número de pessoas desempregadas. 
 
“A taxa de desemprego…”, é uma proporção. Assim na estatística de teste (passo 3) é o ponto 
1.1. 
 
“…é inferior…” é a pista para o teste de hipótese 1H , assim no passo 4, escolho “T<”. 
 
 
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso 
formular-se as seguintes hipóteses 
 
 0 1
 sempre igual
: 0,078 : 0,078
É
H p vs H p= <����� 
 
 
Segundo passo: nível de significância 0,01α = . 
 
 
Terceiro passo: estatística de teste 0
0 0
X np
T
np q
−
= (do formulário, o ponto 1.1) 
 
 
Quarto passo: região de rejeição T zα< − 
 
Em que ( )0,01 2,3263 na realidade é -2,3263, pois é para z z T zα α= = < − 
 
 
 
 
Quinto passo: calculo 
( )
0 0
0
0 0
1
 x 
2,6848
 x 1 0,
1600
078
0,078
0,070 
9
860
6
1
p q
p
p
t
n q
nX
= −
− −
= = ≈ −
−�����
 
 
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 273/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
2,6848 2,3263t T≈ − ∧ < − 
 
 
 
Sexto passo: conclusão – Como o valor observado da estatística de teste pertence à região de 
rejeição 0H , então rejeita-se a hipótese nula ( )0H e aceita-se a hipótese alternativa ( )1H . 
Posso concluir, com uma confiança de 99%, que a taxa de desemprego no distrito é inferior a 
do país. 
 
 
 
 
6 – Uma amostra aleatória de 1785 adultos foi inquirida relativamente à seguinte questão: 
assistiu a algum serviço religioso nos últimos 7 dias? 980 pessoas responderam “Sim”. 
Ao nível de significância de 0,01, podemos considerar que os dados fornecem evidência 
suficiente de que mais de metade da população adulta assistiu a um serviço religioso? 
 
Resolução – X é o número de pessoas que foram a um serviço religioso. 
 
“… metade …”, é uma proporção. Assim na estatística de teste (passo 3) é o ponto 1.1. 
 
“…mais de metade …” é a pista para o teste de hipótese 1H , assim no passo 4, escolho “T>”. 
 
 
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso 
formular-se as seguintes hipóteses 
 
 0 1
 sempre igual
: 0,5 : 0,5
É
H p vs H p >=����� 
 
 
Segundo passo: nível de significância 0,01α = . 
 
 
Terceiro passo: estatística de teste 0
0 0
X np
T
np q
−
= (do formulário, o ponto 1.1) 
 
 
Quarto passo: região de rejeição T zα> 
Em que 0,01 2,3263z zα = = 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 274/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
Quinto passo: calculo 
( )
0 0
0
0 0
1
1785
1785 1
 x 
4,1421
 x
980
0,
0,5
0,5 5
p q
t
n
p q
X
n
p
= −
−
− −
= = ≈
�����
 
 
 
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição. 
 
4,1421 2,3263t T≈ ∧ > 
 
 
 
Sexto passo: conclusão – Como o valor observado da estatística de teste pertence à região de 
rejeição de 0H , então rejeita-se a hipótese nula ( )0H e aceita-se a hipótese alternativa ( )1H . 
Posso concluir, com uma confiança de 99%, que os dados fornecem evidência suficiente de 
que mais de metade da população adulta assistiu a um serviço religioso. 
 
 
 
 
 
7 – O rótulo dos maços de uma dada marca de cigarros apresenta o valor 0,60 mg para 
quantidade média de nicotina por cigarro. Num controlo, é analisado uma amostra aleatória de 
100 desses cigarros. A quantidade média de nicotina e o desvio padrão obtido foi de 0,63 mg e 
0,11 mg, respectivamente. Considerando, teste se estes resultados evidenciam uma quantidade 
média de nicotina superior a especificada. 
 
Resolução – Como tem o desvio padrão (amostra e não populacional!), e “n” é maior do que 
30 (é 100). A fórmula a se escolher no passo 3 (estatística de teste) é o ponto 1.3. 
 
A média ( )µ é de 0,60 mg e tenho evidência para desconfiar que é de 0,63 mg (“…superior a 
especificada…”), é a pista para o teste de hipótese 1H , assim no passo 4, escolho “T>”. 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 275/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso 
formular-se as seguintes hipóteses 
 
 0 1
 sempre igual
: 0,60 : 0,60
É
H vs Hµ µ >=����� 
 
 
Segundo passo: nível de significância 0,05α = , pois quando nada me é dito, é porque o 
intervalo de confiança é de 95%. 
 
Terceiro passo: estatística de teste 0
X
T
s n
µ−
= (do formulário, o ponto 1.3) 
 
Quarto passo: região de rejeição T zα> em que 0,05 1,6449.z zα = = 
 
 
 
Quinto passo: calculo 0
0,6
0
2,72
0
10
0,63
73
0,11n
t
X
s
µ− −
= = ≈ 
 
 
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição. 
 
2,7273 1,6449t T≈ ∧ > 
 
 
 
 
Sexto passo: conclusão – Como ] [2,7273 1,6449 ; ,∈ + ∞ então o valor observado da 
estatística de teste pertence à região de rejeição de 0H , então rejeita-se a hipótese nula ( )0H e 
aceita-se a hipótese alternativa ( )1H . Posso concluir, com uma confiança de 95%, que os 
resultados evidenciam uma quantidade média de nicotina superior a 0,60 mg. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 276/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
8 – O rótulo de uma marca de aspirina (comprimidos) diz que eles têm uma média de 75 mg 
de concentração. Vinte desses comprimidos foram testados para ver se a concentração está de 
acordo, e os resultados foram: 
 
 
 75,1 73,9 76,6 75,3 76,0 78,0 77,4 75,3 76,5 74,4 
 75,7 74,2 76,8 75,1 78,0 74,6 76,9 76,6 76,7 74,9 
 
 
Este dados apresentam evidência de a concentração ser diferente de 75 mg? 
 
 
 
Resolução – Com estas duas pistas do enunciado: “…uma média…” e “n” é menor do que 30 
(é 20), consigo escolher a fórmula para o passo 3 (estatística de teste), que é o ponto 1.4 
(apesar de ser igual a 1.3, difere da “região de rejeição”). 
 
“…ser diferente de …” é uma avaliação bilateral ( )0µ µ≠ , logo a formula que irei escolher 
para a “região de rejeição” é a 3ª 
 ; 1
2
n
T t α� �−
 �
� �
< − ou 
 ; 1
2
n
T t α� �−
 �
� �
> (a usar no passo 4). 
 
 
 
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso 
formular-se as seguintes hipóteses 
 
 0 1
 sempre igual
: 75 : 75
É
H vs Hµ µ ≠=��� 
 
 
 
Segundo passo: nível de significância 0,05α = , pois quando nada me é dito, é porque o 
intervalo de confiança é de 95%. 
 
 
Terceiro passo: estatística de teste 0
X
T
s n
µ−
= (do formulário, o ponto 1.4) 
 
 
Quarto passo: região de rejeição, para 0µ µ≠ , 
 ; 1
2
n
T t α� �−
 �
� �
< − ou 
 ; 1
2
n
T t α� �−
 �
� �
> (basta calcular 
uma delas, pois a outra é simétrica). 
 
Em que ( )0,05 0,025 ; 19 ; 1 ; 20 1
2 2
n
T t T t T tα� � � �− −
 � 
 �
� � � �
> = > = > = 
 
 
Vou me socorrer da tabela t-Distribuição: 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 277/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
 
 
 
Quinto passo: calculo 0
75
1, 2
3, 2726
75,
9
9
2029
X
t
s n
µ− −
= = ≈ 
 
Nota: tive que calcular a média ( )X e o desvio padrão ( )s . 
 
( )
2
2
1 11 75,9 1, 2299
1
n nn
i ii
i ii
n X XX
n
s
n
X
n
= ==
� �
− 
 �
� �= = ∧ = =
−
� ��
 
 
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição. 
 
3,2726 2,0930t T≈ ∧ > 
 
 
Sexto passo: conclusão – Como o valor observado da estatística de teste pertence à região 
critica, então rejeita-se a hipótese nula ( )0H e aceita-se a hipótese alternativa ( )1H . Posso 
concluir, com uma confiança de 95%, que os dados apresentam evidência de que a 
concentração média das aspirinas é diferente de 75 mg. 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 278/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
9 – Foirealizada uma consulta a 300 eleitores do distrito A e a 200 eleitores do distrito B. A 
percentagem calculada de votos a favor de determinado candidato nos distritos A e B de 56% 
e 48%, respectivamente. Ao nível de significância de 0,05, teste se 
a) Não há diferença entre os dois distritos. 
b) O candidato tem preferência no distrito A. 
 
 
 
Resolução a) – cuidado com a leitura, pois o candidato é o mesmo, os eleitores é que mudam. 
 
“A percentagem calculada …” é uma proporção, é sobre 2 populações, e “n” é maior do que 
30 (é de facto 300). A fórmula a se escolher no passo 3 (estatística de teste) é o ponto 2.1. 
 
Não há diferença entre os dois distritos” é uma avaliação bilateral ( )0µ µ≠ , logo a formula 
que irei escolher para a “região de rejeição” é a 3ª 
2
T zα< − ou 
2
T zα> (passo 4). 
 
 
 
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso 
formular-se as seguintes hipóteses 
 
 0 1
 sempre igual
: :A B A B
É
H p p vs H p p≠=
�����
 
 
Sendo Ap a “verdadeira” proporção de eleitores dos distrito A a favor de um determinado 
candidato. 
 
 
Segundo passo: nível de significância 0,05α = , pois quando nada me é dito, é porque o 
intervalo de confiança é de 95%. 
 
 
Terceiro passo: estatística de teste 
^ ^
^ ^ 1 1
A B
A B
p p
T
p q
n n
−
=
� �
+
 �
� �
 com 
^
A B
A B
X X
p
n n
+
=
+
 
(do formulário, o ponto 2.1) 
 
 
Quarto passo: região de rejeição, para 0µ µ≠ , 
2
T zα< − ou 
2
T zα> (basta calcular uma delas, 
pois a outra é simétrica). 
 
 
Em que 0,05 0,025
2 2
1,96T z z zα= = = = 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 279/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
 
Quinto passo: calculo 
^
^ ^
^
0,48
1,7555
1 11 1 0,52 0, 472
300 2
0,56
0
x
0
8 
A B
BA
n n
p
t
p
qp
− −
= = ≈
� � � �++ 
 �
 � � �� �
 
 
 
 
Tive que realizar um calculo auxiliar, 
^
A B
A B
X X
p
n n
+
= ⇔
+
 
 
^ ^0,56 x 300 0,48 x200 
0,528
300 200
p p
+
⇔ = ⇔ =
+
 
 
 
E o 
^^ ^ ^
1 1 0,528 0,472q q qp−= =⇔ ⇔= − 
 
 
 
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição. 
 
 
1,7555 1,96t T≈ ∧ > 
 
 
 
Sexto passo: conclusão – Como o valor observado da estatística de teste não pertence à região 
rejeição, então rejeita-se a hipótese 1H e aceita-se a hipótese alternativa ( )0H , com uma 
confiança de 95%. Isto é, não se pode afirmar que os eleitores dos dois distritos tenham 
opiniões diferentes em relação ao apoio do candidato em questão. 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 280/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução b) – “O candidato tem preferência no distrito A”, que posso representar por
A Bp p> , logo a formula que irei escolher para a “região de rejeição” é a 1ª T zα> (passo 4). 
 
 
 
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso 
formular-se as seguintes hipóteses 
 
 0 1
 sempre igual
: :A B A B
É
H p p vs H p p>=
�����
 
 
 
 
Segundo passo: nível de significância 0,05α = , pois quando nada me é dito, é porque o 
intervalo de confiança é de 95%. 
 
 
Terceiro passo: estatística de teste 
^ ^
^ ^ 1 1
A B
A B
p p
T
p q
n n
−
=
� �
+
 �
� �
 com 
^
A B
A B
X X
p
n n
+
=
+
 
(do formulário, o ponto 2.1) 
 
 
Quarto passo: região de rejeição, para 0µ µ> , T zα> . Aqui é diferente do alínea a)! 
 
 
Em que 0,05 1,6449z zα = = 
 
 
 
 
 
Quinto passo: calculo 
^
^ ^
^
0, 48
1,7555
1 11 1 0,52 0,472
300 2
0,56
0
x
0
8 
A B
BA
n n
p
t
p
qp
− −
= = ≈
� � � �++ 
 �
 � � �� �
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 281/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
Tive que realizar um calculo auxiliar, 
^
A B
A B
X X
p
n n
+
= ⇔
+
 
 
^ ^0,56 x 300 0,48 x200 
0,528
300 200
p p
+
⇔ = ⇔ =
+
 
 
 
E o 
^^ ^ ^
1 1 0,528 0,472q q qp−= =⇔ ⇔= − 
 
 
 
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição. 
 
1,7555 1,645t T≈ ∧ > 
 
 
 
 
Sexto passo: conclusão – Como o valor observado da estatística de teste pertence à região 
rejeição de 0H , então rejeita-se a hipótese 0H e aceita-se a hipótese alternativa ( )1H , ao nível 
de significância de 0,05. Nesta perspectiva já posso afirmar, com uma confiança de 95%, que 
o candidato em questão é mais popular no distrito A do que no distrito B. 
 
 
 
 
 
10 – Em Junho de 1975, foram obtidos 85 amostras de água de diferentes zonas de um lago de 
uma dada cidade. Com o objectivo de estudar o nível médio de concentração de cloro foram 
efectuados análises químicas a essas amostras. Dois anos depois, foram analisadas 110 
amostras, tendo se obtido os seguintes: 
 
 1975 1977 
 Média 18,3 17,8 
 Desvio Padrão 1,2 1,3 
 
Os dados evidenciam a diminuição do nível médio de concentração de cloro nas aguas do lago 
em 1977, em relação ao nível médio obtido em 1975? (usar 0,01α = ). 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 282/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Resolução – Vou utilizar 1µ para 1975 e 2µ para 1977. 
 
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso 
formular-se as seguintes hipóteses 
 
 0 1 2 1 1 2
 sempre igual
: :
É
H vs Hµ µ µ µ= >
�����
 
 
Sendo iµ o nível médio de concentração de cloro no lago no ano “i”. 
 
 
Segundo passo: nível de significância 0,01α = . 
 
 
Terceiro passo: estatística de teste 
( )1 2 0
2 2
1 1 2 2
X X d
T
s n s n
− −
=
+
 
(do formulário, o ponto 2.3) 
 
Quarto passo: região de rejeição, para 1 2µ µ> , T zα> . 
 
Em que 0,01 2,3263z zα = = 
 
 
 
 
Quinto passo: calculo 
( ) ( )1 2 0
2 2 2 2
1 1 2 2
18,3 17,8 0
2,7819
1,2 85 1,3 110
X X d
t
s n s n
− − − −
= = ≈
+ +
 
 
 
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição. 
 
2,7819 2,3263t T≈ ∧ > 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 283/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Sexto passo: conclusão – Como o valor observado da estatística de teste pertence à região 
rejeição, então rejeita-se a hipótese 0H e aceita-se a hipótese alternativa ( )1H , com um nível 
de significância de 0,01. Posso afirmar com uma confiança de 99%, que os dados evidenciam 
a diminuição do nível médio de concentração de cloro nas aguas do lago em 1977, em relação 
ao nível médio do ano 1975. 
 
 
 
 
 
11 – Um investigador pretende averiguar se uma determinada pílula tem como efeito 
secundário o aumento da pressão arterial. Inicialmente, são efectuadas medições da pressão a 
15 mulheres. Após 6 meses de utilização regular da pílula, são efectuados novas medições da 
pressão arterial. As medições obtidas foram: 
 
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 
Antes 70 80 72 76 76 76 76 72 82 64 74 92 74 68 84 
Depois 68 72 62 70 58 66 68 52 64 72 74 60 74 72 74 
Diferença 2 8 10 6 18 10 8 20 18 -8 0 32 0 -4 10 
 
 
Levam-nos os dados a crer, com uma confiança de 95%, de que o uso desta pílula reduz a 
pressão arterial? 
 
 
 
Resolução– Estes dados são DEPENDENTES, por terem sido realizadas (a 2ª volta) as 
mesmas mulheres. Logo a fórmula que irei utilizar no passo 3 (estatística de teste) é o do 
ponto 2.4 (os pontos 2.2 e 2.3 é para situações em que são independentes). 
 
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso 
formular-se as seguintes hipóteses 
 
 0 1
 sempre igual
: 0 : 0d d
É
H vs Hµ µ >=
���
 
 
Sendo dµ a media das diferenças entre a pressão arterial ao inicio de 6 meses e a pressão 
arterial no fim. 
 
 
Segundo passo: nível de significância 0,05α = , porque o intervalo de confiança é de 95%. 
 
 
Terceiro passo: estatística de teste 0
d
d d
T
s n
−
= (do formulário, o ponto 2.4) 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 284/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Quarto passo: região de rejeição, para 0d dµ > , ( ) ; 1nT t α −> . 
 
Em que ( ) ( ) ( ) ; 1 0,05 ; 15 1 0,05 ; 14 1,761nT t T t T tα − −> = > = > = 
 
 
Vou me socorrer da tabela t-Distribuição: 
 
 
 
 
Quinto passo: calculo 0
8,6667
10, 13
3 5
5
,
8
0
2
2
ds n
d
t
d− −
= = ≈ 
 
 
Nota: tive que calcular a média ( )d e o desvio padrão ( )ds . 
 
( )
2
2
1 11 8,6667 10,328
1
n n
d
n
i ii
i ii
n d d
n
s
n n
d
d
= ==
� �
− 
 �
� �= = ∧ = =
−
� ��
 
 
 
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição. 
 
3,25 1,761t T≈ ∧ > 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 285/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
 
 
Sexto passo: conclusão – Como o valor observado da estatística de teste pertence à região 
critica, então rejeita-se a hipótese nula ( )0H e aceita-se a hipótese alternativa ( )1H . Posso 
concluir, com uma confiança de 95%, e com um nível de significância de 0,05, que o uso 
desta pílula reduz a pressão arterial. 
 
 
 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 286/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Frequência: 2003/06/18 
 
Parte II 
 
 
Exercícios 3 – 
 
 
Resolução 
 
( )
( )
( ) ( ) ( )
 Vir das Furnas 0,32
 Sete Cidades 0,54
 Candelaria 1 0,14
P F
P S
P C P F P S
= =
= =
= = − − =
 
 
( )
( )
( )
5,4 | 0,12
5,4 | 0,17
5,4 | 0,06
P pH F
P pH S
P pH C
< =
< =
< =
 
Nota: 5,4 é uma variável contínua! Assim 5 ou Z 5Z > ≥ . 
 
 
Pretende se calcular ( )| 5, 4 ?P F pH => 
 
 
Vou utilizar o Teorema da totalidade Total e o de Bayes. 
 
( ) ( )
( )
5,4
| 5, 4 
5,4
P F pH
P F pH
P pH
>
> =
>
�
 
 
Pelo Teorema da Probabilidade total vou calcular para 5,4pH < , pois é mais fácil. 
 
Esquema de orientação: 
 
( ) ( ) ( )5,4 5,4 5,4P F pH P S pH P C pH< < <� � � � � 
 
 
 
Calculo auxiliar – fórmula da Probabilidade Total: 
 
( ) ( ) ( ) ( ) ( ) ( ) ( )5,4 x 5,4 | + x 5,4 | + x 5,4 |P F pH P F P pH F P S P pH S P C P pH C< = < < <�
 
( ) ( ) ( ) ( ) ( ) ( ) ( )5,4 0,32 x 0,12 + 0,54 x 0,17 + 0,14 x 0,06P F pH < =� 
 
( )5,4 0,1386P F pH < =� - fim do Calculo Auxiliar. 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 287/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Mas o que se pretende é para ser maior: 
 
( ) ( )5,4 1 5,4 1 0,1386 0,8614P pH P pH> = − > = − = . 
 
O cálculo auxiliar é porque é mais fácil, uma vez que tenho os dados para o simétrico. 
 
Assim: ( ) ( )
( )
( ) ( )
( )
5, 4 x 5,4
| 5,4 
5, 4 5,4
P F pH P F P pH
P F pH
P pH P pH
> >
> = =
> >
�
 
 
Recordar a fórmula ( ) ( )
( )
( ) ( )
( )
 
Pr 
 x 
|
|
regra do produto
obabilidade Condicional
P A B
P
PP
B A
B A
P B
A
P A
= =
��	�
��	�
 �
, adaptado ao exercício: 
 
( ) ( )
( )
( )
( )�
( )
( )
( )
|
5, 4 x 5, 4 |
| 5, 4 
5, 4 5,4
P A P B A
P F pH P F P pH F
P F pH
P pH P pH
> >
> = = ⇔
> >
���	��
�
 
 
( ) ( )
0,32 x 1 0,12
| 5, 4 0,327
0,8614
Cuidado
P F pH
−
> = ≈
��	�
 
 
 
 
 
Exercícios 4 – 
 
 
Resolução – Variável aleatória Binomial. 
 
Uma sucessão de provas de Bernoulli é uma sequência de n experiências aleatórias em que: 
• Em cada prova apenas interessa se o resultado é um sucesso (S) ou um insucesso (S); 
• A probabilidade de sucesso mantém-se de prova para prova; 
• O resultado de cada prova é independente do resultado de qualquer das provas anteriores. 
 
a) • Sim. 
• As “provas” são os 254 genes observados. Um “sucesso” corresponde a ocorrência 
de mutação. 
• Há independência (não depende um do outro, como se jogássemos uma moeda ao ar) 
entre as provas, e as probabilidade de sucesso mantém se constante. 
 
Podemos fazer a correspondência com a definição, ponto por ponto. 
 
 
b) É necessário perceber o que é o X. Vou socorrer me da definição: 
A variável aleatória X que representa o número de sucessos em n provas de Bernoulli, com 
probabilidade de sucesso em cada prova p, é conhecida como variável aleatória binomial. Por 
comodidade denota-se por ( )~ ; .X Bin n p 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 288/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Seja X o numero de mutação quando se irradia 254 genes. Assim ( )~ 254 ; 0,007 .X Bin 
 
( ) ( ) ( )~ 254 ; 0,007 0 1 x n x
n
X Bi P
x
n X p p
−� �
→ = = − ⇔
 �
� � 
( ) ( ) ( ) ( )( )25 2540 25404 00 0,007 1 0,007 1
25
0
0,
4
993 0,168P X C
−� �
= = − = =
 �
� � 
 
c) ( ) ( ) ( ) ( )2 1 2 1 1 0P X P X P X P X= = − < = − = − = 
 
Só me falta calcular o ( )1P X = : 
 
( ) ( ) ( ) ( )( )2541 1 253254 11 0,007 1 0,007 0,007 0,993 0,300671
254
1
P X C
−� �
= = − = =
 �
� �
 
 
( ) ( )2 1 2 1 0,300671 0,168 0,53133P X P X= = − < = − − ≈ 
 
 
d) ( ) x 254 x 0,007 1,778E X n p= = = 
 
( )( ) ( ) ( )1,778 2 0,531P X E X P X P X> = > = ≥ = 
 
Nota para os mais distraídos: 2 1,778 !> 
 
 
 
 
 
 
 
 
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 289/305 
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística 
Frequência: 2008/06/21 
 
Parte II 
 
 
 
3 - Suponha que a probabilidade de haver motins durante ou após um jogo de futebol é de 
10%, independentemente do que sucede em qualquer outro jogo. Se um campeonato for 
composto por 20 jogos, responda: 
3.1 Qual é a probabilidade de haver dois motins ou mais durante esse campeonato? 
3.2 Qual é a probabilidade de o número de motins durante o campeonato ser maior do que 
cinco? 
3.3 Qual é o número médio de motins que se pode esperar por campeonato? 
 
 
Resolução: As variáveis são independentes, logo é uma distribuição Binomial. 
Seja X o número de motins por campeonato (em que o campeonato é composto por 20 jogos). 
 
� �
~ 20 ; 0,1
pn
X Bin
� �

 �

 �
� �
, em que “n” é o numero de jogos que compõem um campeonato, e 0,1 é 
os 10%. 
 
Agora vou responder as alíneas. 
 
3.1 - � �
Cuidado que o igual Na tabela é o "r"
não é indiferente, pois 
uma variavel continua.
2P X
� �

 �

 �≥

 �

 �
� �
, assim fica ( )2 0,608P X ≥ = . 
 
 
 
 
Poderia ter ido através do cálculo, que seria: 
 
( ) ( )