Prévia do material em texto
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 1/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Probabilidades e Estatística 2009/ 2010
Para a 1ª Frequência
Teoria 2
Frequências 2000-01-12 102
Frequências 2000-01-26 118
Frequências 2000-07-10 134
Frequências 2003-06-18 (1ª parte) 144
Frequências 2007-12-06 155
Frequências 2008-06-21 (1ª parte) 163
Frequências 2008-11-06 176
Frequências 2009-02-02 196
Para a 2ª Frequência
Teoria 202
Frequências 2003-06-18 (2ª parte) 286
Frequências 2008-06-21 (2ª parte) 289
Frequências 2009-01-14 293
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 2/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Regra do Produto
Definição: Seja S um conjunto de resultados associado a uma experiência aleatória.
Sejam A e B dois acontecimentos, com ( ) 0p B ≠ . A probabilidade para que A se realize,
sabendo-se que B se realizou, designa-se por ( )|p A B e define-se pelo quociente,
( ) ( )
( )
p A B
p A B
p B
∩
=
A probabilidade de A, condicionada pela realização de B (ou a probabilidade de A
sabendo se B), que acaba de definir-se, representa a reavaliação da probabilidade de A
em face da informação de que B se realizou.
Definição: Seja S um conjunto de resultados associado a uma experiência aleatória e
sejam A e B dois acontecimentos. Dizemos que A e B são independentes se e só se
( ) ( ) ( ) x p A B p A p B∩ =
Consequência: Invertendo a expressão
( ) ( )
( )
p A B
p A B
p B
∩
=
Obtém-se a regra do produto:
( ) ( ) ( ) x |p A B p B p B A∩ =
Teorema: De um modo geral, a regra do produto é dada por:
( ) ( ) ( ) ( ) ( )1 2 3 1 2 1 3 1 2 1 2 3... x | x | x ... x | ...n n np A A A A p A p A A p A A A p A A A A A∩ ∩ ∩ ∩ = ∩ ∩ ∩ ∩ ∩
Teorema da Probabilidade Total: Seja Ω um espaço amostral associado a uma
experiência aleatória qualquer. Se os n acontecimentos 1 2 3, , ,..., nB B B B de ( )P Ω são
incompatíveis dois a dois, isto é, não existem dois que sejam compatíveis, e
1 2 3 ... nB B B B = Ω� � � � então para qualquer acontecimento A de ( )P Ω tem-se que:
( ) ( ) ( ) ( ) ( )1 2 3 ... + np A p B A p B A p B A p B A= ∩ + ∩ + ∩ + ∩
1 - No lançamento de um dado perfeito, qual é a probabilidade de o número obtido ser
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 3/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
6, sabendo que se obteve um
1.1. Número par?
1.2. Número ímpar?
1.3. Múltiplo de 3?
Resolução:
1.1 - ( ) ( ) 1 numero 6 1ser o numero 6 | sendo par |
3 numeros pares 3
p p A B= = =
1.2 - ( ) ( ) 1 numero 6ser o numero 6 | sendo impar | 0
não é impar
p p A B= = =
1.3 ( ) ( ) 1 numero 6 1ser o numero 6 | sendo multiplo de 3 |
3 ou 6 2
p p A B= = =
2 - Uma urna contém duas bolas verdes e três azuis. Tiram-se sucessivamente duas
bolas sem reposição. Sabendo que a primeira bola é azul, qual é a probabilidade de que
a segunda bola seja:
2.1. Verde?
2.2. Azul?
Resolução:
Nota: 1V representa a 1ª vez que é retirado uma bola, e 2V a 2ª vez.
2.1 - ( )1 2
2 (numeros possiveis de sair a bola certa) 1
4 (numero totais de bolas ainda existentes) 2
p V V = =
2.2 - ( )1 2
2 (numeros possiveis de sair a bola certa) 1
4 (numero totais de bolas ainda existentes) 2
p V V = = (é igual!)
3 - Extrai-se, ao acaso, uma bola de uma caixa que contém vinte bolas numeradas de 1
a 20. Considere os acontecimentos:
A: "a bola extraída tem um número par";
B: "a bola extraída tem um número múltiplo de 5". Indique o valor da probabilidade
condicionada ( )|p B A .
Sugestão: nos exercícios 1, 2 e 3 utilize a regra de Laplace.
Resolução:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 4/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( )p B A , em que o B representa os números múltiplos de 5, mas do lote de A, e o A
representa os números pares.
Ora de 1 a 20, tem se 10 números pares, e destes apenas dois são múltiplos de 5. Assim fica:
( ) 2 1 0,2
10 5
p B A = = =
4 - Dos acontecimentos A e B sabe-se que:
( ) 3
10
p A = e ( ) 7
10
p A B =�
Calcule sabendo ( )p B que A e B são independentes.
Resolução:
Vou recordar algumas regras:
A e B são incompatíveis se, e só se, (conjunto vazio)A B = ∅�
A e B são contrários se, e só se, (Universo)A B S=�
A e B são independentes se, e só se, ( ) ( ) ( ) x p A B p A p B=�
( ) ( ) ( ) ( ) + - p A B p A p B p A B=� �
A azul está representando elementos que entra nos dois grupos, e é por isso que existe o 3º
termo do 2º membro. Ou seja para anular a repetição da contagem dos elementos que já
foram contados.
( ) ( ) ( ) - p A B p A p A B− = �
Quando afirmo que são independentes, significa que a 2ª vez não depende do resultado obtido
da 1ª, e assim escrever a seguinte equação:
( ) ( ) ( ) x p A B p A p B∩ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 5/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Assim para resolver o exercício, e depois de analisar as três pistas dadas:
- ( ) 3
10
p A = , ( ) 7
10
p A B =� , e A e B serem independentes.
( ) ( ) ( ) ( )7 7 + -
10 10
p A B p A p B p A B= ⇔ = ⇔� �
Sei o valor de ( )p A , e como são independentes, então ( ) ( ) ( ) x p A B p A p B=� , fica:
( )
�
( ) ( ) ( )
( )
( ) ( ) ( ) 3 73 7 + - x + - x
110 10 010
p A B
p A
p B p Bp B p A p B p A⇔ = ⇔ = ⇔
�
�������
( ) ( )� ( )
3
10
7 3 4
10 10 1
. 1
3
10 0
. p Ap B p B
� �
� �
⇔ − = ⇔ = ⇔� �
� �
−
� �� �
( ) 4
7
p B =
5 - Prove que: Se A e B são acontecimentos independentes então A e B também o são.
Resolução:
( ) ( ) ( ) x p A B p A p B∩ =
Para provar que ( ) ( ) ( ) x p A B p A p B∩ = , sabendo a representação do Universo: ( ) 1p s =
.
( ) ( ) ( ) ( ) ( )
( )
( )
�1
p S
p A A
p A A p S p A p A p A A= ⇔ + − = ⇔
�
� �
�����������
( ) ( ) ( ) ( )0 1 1p A p A p A p A⇔ + − = ⇔ = −
Assim: ( ) ( ) ( ) ( ) ( ) ( )1 1p A B p A B p A B p A p B p A B∩ = = − = − + − =� �� �� � �
( ) ( ) ( )1 p A p B p A B= − − + � como são independentes ( ) ( ) ( ) x p A B p A p B∩ =
( ) ( ) ( ) ( )1 x p A p B p A p B= − − + =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 6/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Aqui tenho que recordar da regra: ( )( )1 1 1a b ab a b− − + = − − , e assim fica:
( ) ( ) ( ) ( ) ( )( ) ( )( )1 1 1p B p A p A p B p A p B− − + = − −
Como sei que ( ) ( )1p A p A= − e ( ) ( )1p B p B= −
Posso então afirmar que ( ) ( ) ( ) x p A B p A p B∩ = c.q.d.
6 - Numa amostra constituída por 100 indivíduos obtiveram-se os resultados
apresentados no quadro seguinte e aleatoriamente seleccionou-se um indivíduo ao
acaso:Com Bronquite Sem Bronquite
Fumadores 40 20
Não fumadores 10 30
6.1. Diga, justificando, se os acontecimentos «ser fumador» e «ter bronquite» são
independentes.
6.2. Calcule a probabilidade de um indivíduo que é fumador ter bronquite.
Resolução:
6.1 - Para este exercício vou utilizar a regra dos abraços (expressão que se usa na gíria, pois
matematicamente não dá para provar nada). Consiste em verificar se A x D = B x C. Se for
verdade posso antever que são variáveis independentes.
40x30 = 20x10
É falso, não são independentes. Mas esta afirmação não tem qualquer significado
matemático, apenas me ajuda a antever a resposta. Vou agora passar a provar
matematicamente:
Sei que ( ) ( ) ( ) x p F B p F p B=� , se forem independentes.
Sei que ( ) 40 0,4
100
p F B = =�
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 7/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Sei que ( ) 60 0,6
100
p F = =
Sei que ( ) 50 0,5
100
p B = =
( ) ( ) ( ) ( ) ( ) x 0,6 x 0,5 0,3p F B p F p B p F B p F B= ⇔ = ⇔ =� � �
Posso então concluir que ( ) ( ) ( ) x p F B p F p B≠� (não são independentes).
6.2 - ( ) ter bronquite sendo fumadorp B F → :
( ) ( )
( )
0,4 3
0,6 2
p B F
p B F
p F
= = =
�
7 - A probabilidade de um indivíduo A estar vivo daqui a 30 anos é 0.6 e a
probabilidade de um outro indivíduo B estar vivo daqui a 30 anos é 0.7. Determine a
probabilidade de daqui a 30 anos:
7.1. Estarem vivos os indivíduos A e B;
7.2. Não estarem vivos os indivíduos A e B;
7.3. Estar vivo pelo menos um dos indivíduos.
Resolução:
Sei então que ( ) 0,6p A = e ( ) 0,7p B = ,
7.1 - ( ) ( ) ( ) x 0,6 0,7 0,42Xp A B p A p B= = =�
7.2 - ( ) ( ) ( ) ( ) ( ) x 1 0,6 1 0,7 0,12Xp A B p A p B= = − − =�
7.3 - ( ) ( ) ( ) ( ) + - 0,6 0,7 0,42 0,88p A B p A p B p A B= = + − =� �
8 - O João frequenta a Escola Secundária da cidade próxima do local onde vive.
Diariamente, tem duas possibilidades para ir às aulas: de comboio ou de autocarro.
Como prefere o autocarro, 60% das vezes escolhe esse meio de transporte.
Sabendo que a probabilidade de chegar atrasado às aulas é 22% e que a probabilidade
de ir de autocarro e chegar atrasado é 12%, calcule a probabilidade de:
8.1. Chegar atrasado sabendo que veio de autocarro;
8.2. Chegar atrasado ou ir de autocarro;
8.3. Não chegar atrasado e não ir de autocarro; 8.4. ir de autocarro dado que chegou
atrasado.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 8/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução:
Sei então que ( ) 0,6p Auto = ( ) 0,4p Comboio =
( ) 0,22p Atrasado = ( ) 0,12p Auto Atrasado =�
8.1 - ( ) ( )
( )
0,12
/ 0,2
0,6
p Atrasado Auto
p Atrasado Auto
p Atrasado
= = =
�
8.2 - ( ) ( ) ( ) ( ) + - p Atrasado Auto p Atrasado p Auto p Atrasado Auto= − =�
0, 22 0,6 0,12 0,7= + − =
8.3 - ( ) ( ) ( )1 - 1 0,7 0,3p Atrasado Auto p Atrasado Auto p Atrasado Auto= = = − =� � �
8.4 - ( ) ( )
( )
0,12 6
/
0, 22 11
p Auto Atrasado
p Auto Atrasado
p Auto
= = =
�
9 - A distribuição dos 200 passageiros num avião é:
Homens Mulheres Crianças
Portugueses 15 8 12
Espanhóis 21 5 17
Franceses 54 22 46
Sai uma pessoa do avião. Qual é a probabilidade de:
9.1. Ser uma criança espanhola?
9.2. Ser portuguesa sabendo que é uma criança?
9.3. Não ser portuguesa sabendo que é uma criança?
Resolução:
9.1 - ( ) ( ) 17
200
p Crianças Espanhola p C E= =� �
Nota: não pode ser ( ) ( ) ( ) x p C E p C p E=� , pois não são independentes.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 9/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
9.2 - ( ) ( )
( )
12
12 16200 0,16
75 75 100
200
Condicionada
p P C
p P C
p C
= = = = =
�
�����
9.3 - ( ) ( )( )
75 12
63 21 84200 0,84
12 17 46 75 25 100
200Condicionada
p P C
p P C
p C
−
= = = = = =
+ +
�
�����
10 - Supondo que a probabilidade de uma pessoa ser morena é 0,65 e a probabilidade
de ter os olhos verdes é 0,15. Determine a probabilidade de:
10.1. Ser morena e ter olhos verdes;
10.2. Ser morena ou ter olhos verdes;
10.3. Três pessoas serem morenas.
Observação: Neste exercício vai ter que considerar que os acontecimentos "ser
moreno/a" e "ter olhos verdes" são independentes...
Resolução:
( ) 0,65 ( ) 0,15p M p V= ∧ =
10.1 -
( )
( ) ( ) x ( ) 0,65 x 0,15 0,0975
Acontecimento independente
está no enunciado
p M V p M p V∩ = = =�������
10.2 - ( ) ( ) ( ) ( ) 0,65 0,15 0,0975 0,7025p M V p M p V p M V∪ = + − ∩ = + − =
10.3 - 1 2 3 1 2 3( ) ( ) x ( ) x ( ) 0,65 x 0,65 x 0,65 0,27p M M M p M p M p M∩ ∩ = = ≈
(são independente)
11 - Num determinado país, 65% dos habitantes têm automóvel, 42% têm telemóvel e
23% têm automóvel e telemóvel.
Resolução:
( ) 0,65 ( ) 0,42 ( ) 0,023p A p T p A T= = ∩ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 10/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
11.1. Escolhido ao acaso um habitante deste país, qual é a probabilidade de ele não ter
telemóvel nem automóvel?
11.2. Um determinado habitante tem telemóvel. Qual é a probabilidade de ele ter
também automóvel?
Resolução:
11.1 - ( ) ( ) 1 ( ) 1 ( ) ( ) ( )p A T p A T p A T p A p T p A T∩ = ∪ = − ∪ = − − + ∩ =
1 ( ) ( ) ( ) 1 0,65 0, 42 0, 23 0,16p A p T p A T= − − + ∩ = − − + =
11.2 – ( ) ( ) 0,23 23
( ) 0, 42 42
p A T
p A T
p T
∩
= = =
12 - Interrogaram-se os funcionários de uma empresa e concluiu-se que:
• 80% têm telefone de rede fixa;
• 60% têm telemóvel;
• 5% não têm qualquer tipo de telefone.
12.1. Seleccionando ao acaso um trabalhador daquela empresa, qual é a probabilidade
de ele ter telefone de rede fixa e telemóvel?
12.2. Encontrou-se um funcionário que tinha telemóvel. Qual é a probabilidade de ele
ter telefone de rede fixa?
Resolução:
( ) 0,8 ( ) 0,6 ( ) 0,05p F p M p F M= = ∩ =
12.1 - ( ) ( ) ( ) ( ) ( ) ( ) 1 (p F M p F p M p F M p F p M p F M� �∩ = + − ∪ = + − − ∪ =� �
( ) ( ) 1 ( ) 0,8 0,6 1 0,05 0, 45p F p M p F M= + − + ∩ = + − + =
12.2 -
( ) 0, 45 3
( / ) 0,75
( ) 0,6 4
p F M
p F M
p M
∩
= = = =
13 - Sendo A e C dois acontecimentos tais que ( ) 0p C ≠ , prove que:
( ) ( )| | 1.p A C p A C+ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 11/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução:
( ) ( )
( ) ( ) 1 1
( ) ( )
p A C p A C
p A C p A C
p C p C
∩ ∩
+ = ⇔ + = ⇔
( ) x ( )p A p C
⇔
( )p C
( ) x ( )p A p C
+
( )p C
1 ( ) ( ) 1 . . .p A p A c q d= ⇔ + =
Nota: de ( ) ( ) 1p A C p A C+ =
tira-se: ( ) ( )| 1 |p A C p A C= −
14 - Dos acontecimentos A e B sabe-se que são independentes, ( ) ( )0 ,p A p B< <
( ) 12
49
p A B =� e ( ) ( )| | 1.p A B p B A+ =
Determine ( ).p B
Resolução:
( ) (
( ) ( ) 1
)
(
1
) )(
p A B
p
p A B p
B A
B
p
A
A B
p
∩∩
+ = ⇔ + = ⇔
Aqui é preciso ter cuidado, pois o que se pretendesaber é o p(B), e como não sei o valor de
p(A) vou fazer “desaparece-lo”:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 12/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( )
( )
( )p A B
p B
p A
⇔ +
∩ x ( )
( )
p B
p A
1= ⇔
Agora fazer “desaparecer” a fracção:
[ ]2 x( ) ( ) ( ) ( ) ( ) (( ) )p A B p B p p A BB B Bp B p p⇔ + = ⇔ ∩ + =∩ ⇔
Como sei o valor de ( )p A B∩ , pois este é me dado no enunciado:
( ) ( )
2
12
1 1 4. 1
12 490 ( )
49 2
p B p B p B
± − +
⇔ + − = ⇔ = ⇔� �� �
1 11 1 4 349 7( ) ( ) ( )
2 2 7 7
p B p B p B
± ±
⇔ = = ⇔ = ∨ =
Agora tem se que analisar e validar os valores obtidos:
12 12
( ) ( ) ( )
49 49
p A B p A p B∩ = ⇔ =
Assim:
4 12 3 12 12 12
( ). ( ). ( ) ( )
7 49 7 49 28 21
p A p A p A p A= ∨ = ⇔ = ∨ =
!!
3 4
( ) ( )
7 7
Falso
p A p A= ∨ =
�����
Porque que é que
4
( )
7
p A = é falso? Porque no enunciado é me dito que ( ) ( )0 .p A p B< <
Ora para ter
4
( )
7
p A = ,
3
( )
7
p B = . Pode não parecer mas
3 4
( ) ( ) .
7 7
p B p A= < =
Resposta.:
3 4
( ) ( )
7 7
p A p B= ∧ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 13/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
15 - Sejam A, B e C três acontecimentos possíveis de um mesmo espaço de resultados.
Prove que se A e C são incompatíveis, então ( ) ( )| |p A B C p B C=� �� �� .
Resolução:
Sabe-se que, para A e C serem incompatíveis, então A C∩ = ∅ , isto é, ( )p A C∩ = ∅ .
Tenho que provar: ( ) ( )p A B C p B C� ∪ � =� �
Recordar a regra da distributiva em relação a união: ( )*a b c ab ac+ = + . Assim:
( )
( )
( )
( ) ( )
( )
p A B C p A C B C
p C p
B
C
p A C
∩ ∪ ∩� � � �� � � �=� � =� =�
� �
�
( )( ) ( )
( )
( ) .
(
./
)
.
p B C p B C
p C p C
p B C c q d
∅ ∪ ∩ ∩
== =
16 - Num teste de avaliação de Matemática, feito por 28 alunos de uma turma do 12.0 ano,
verificou-se que 75% das raparigas tiveram positiva e 3 raparigas tiveram negativa. Sabendo
que neste teste ter nota positiva é independente do sexo, determine o número de rapazes que
tiveram positivas no teste.
Resolução:
( )
( ) 0,75 0,75
( )
p P M
p P M
p M
∩
= ⇔ = ⇔
( ) x (p P p M
⇔
)
( )p M
0,75 ( ) 0,75p P= ⇔ =
Ora se ouve 75% de positivas, de um total de 28 alunos, significa que houve 0,75 X 28 = 21
positivas.
Já consigo introduzir valores na tabela:
H M T
P 21
N 3
T 28
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 14/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Logo, com os valores que já sei, consigo calcular mais alguns valores. Houve 7 negativas
(28-21).
Se sei o total das negativas, e quantas mulheres tiveram negativas, também já consigo saber
quantos homens tiveram negativa: 4 (7-3).
Agora tenho dúvidas nas positivas!
Sei que são independentes, caso contrario o enunciado teria que dizer que não o eram. Vou
criar duas variáveis para os valores que não sei, e utilizar a regra dos abraços.
H M T
P a b 21
N 4 3 7
T 28
Só se usa a regra dos abraços quando são independentes.
4
4 4 9
3 4 3
3 3
21 4
7 63 921
3
Xa b
a b a b a
a b
b bb b
� = � ��= = =� � � �
⇔ ⇔ ⇔ ⇔
+ =
� � �= =+ =
�
36
12
3
9
9
aa
b
b
� == ��
⇔ ⇔
=
� =
H M T
P 12 9 21
N 4 3 7
T 28
Resposta: 12 rapazes tiveram positivas.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 15/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Provar a Regra dos Abraços:
A A
B ( )p A B∩ ( )p A B∩
B ( )p A B∩ ( )p A B∩
( ) ( ) ( ) ( ). . ?p A B p A B p A B p A B∩ ∩ = ∩ ∩ =
Como são independentes: ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )p A p B p A p B p A p B p A p B=
c.q.d.
17-Dos alunos de uma escola secundária, sabe-se que:
40% São raparigas 15% Fumam 60% Dos fumadores são rapazes
17.1. Escolhido aleatoriamente um dos alunos da escola, determine a probabilidade de ser:
a) Uma rapariga que não fuma.
b) Ser fumador sabendo que é rapariga.
17.2. Os acontecimentos "ser rapariga" e "ser fumador" são independentes? Justifique a
resposta
Resolução:
( ) ( ) ( )0, 4 0,15 0,6p M p F p H F= = =
Neste exercício a dificuldade estava em conseguir escrever esta equação: ( ) 0,6p H F =
Neste tipo de exercício, convém primeiro tentar preencher a tabela.
Construindo a tabela:
H M T
F 0,15
F
T 0,4 1
Aqui o segredo estava no total! No enunciado não é dito que é um, mas deduz-se.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 16/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Consigo calcular o total de homens, que é 1-0,4=0,6, e o total de não fumadores: 0,85.
H M T
F 0,15
F 0,85
T 0,6 0,4 1
Agora vou calcular ( )p H F� :
( ) ( )
( )
( ) ( )0,6 0,6 0,6
p H F
p H F p H F p F
p F
= ⇔ = ⇔ = ⇔
�
�
( ) ( )0,6 0,15 0,09Xp H F p H F⇔ = ⇔ =� �
Ao saber ( )p H F� , consigo calcular ( )p M F� , e é ( ) ( )1 0,06p M F p H F= − =� �
H M T
F 0,09 0,06 0,15
F 0,85
T 0,6 0,4 1
Agora já se consegue calcular os valores em falta:
H M T
F 0,09 0,06 0,15
F 0,51 0,34 0,85
T 0,6 0,4 1
Agora, com a tabela preenchida, já consigo responder.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 17/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
17.1 - a) ( ) 0,34p M F∩ =
b) ( ) ( )
( )
0,6
0,15
0, 4
p F M
p F M
p M
∩
= = =
17.2 - 0,09*0,34 0,51*0,06
Regra do abraço
=�����������
Como é uma preposição verdadeira, posso concluir que M e F são independentes.
18 - De um baralho de 52 cartas, extraem-se duas cartas. Calcule a probabilidade de obter
duas damas.
Resolução - tirar ao mesmo tempo ou separado é igual, pois não há reposição.
(As Cartas Damas não são independentes)
Como se pretende calcular a probabilidade de duas Damas consecutivas, tem se que a noção
que então a primeira carta a sair é Dama.
( ) ( )1 2
4 3
52 51
p D e p D= =
( )1 2
4 3 1
*
52 51 221
p D D∩ = =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 18/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Nota: se A e B são independentes
( ) ( )
( )
( )
p A B
p A B p A
p B
probabilidade de A sabendo B
∩
= =
↓
É ( )p A , pois é indiferente o valor de B, pois são independentes.
19 - Lancei um dado duas vezes. Determine a probabilidade de ter saído dois números pares.
Resolução: ( )1 2p P P∩ Já sei que o 1º é par
( )1 para a 2ª vez não interressa.p P
( )1 2
3 3 1
*
6 6 4
p P P∩ = =
20 - Uma caixa contém 5 lápis pretos e 9 lápis brancos. Tiram-se sucessivamente, sem
reposição, dois lápis da caixa. Determine a probabilidade de seremda mesma cor.
Resolução: 5 pretos e 9 brancos
Vou usar a convenção:
� � ( ) ( ) ( )1 2 1 2 1 2 1 2 1 2 1 2. .
Pretos Brancos Cuidado que esta é a
parte de intersecção
p PP B B p P P p B B p PP B B
� �
= ∪ = + −
�
�
� �
�����
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 19/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Mas trata-se de uma condição impossível!!!
Pois estou a dizer que da 1ª vez vou tirar um lápis, este é preto e branco (o índice 1
representa a 1ª vez, e o 2, a 2ª vez). Ora como só tiro um lápis de cada vez, não podem sair 2.
Assim,
( ) ( ) ( )1 2 1 2 1 2 1 2. . 0p PP B B p P P p B B= ∪ = + − =
( ) ( ) ( ) ( )1 2 1 1 2 1
5 4 9 8 46
. * *
14 13 14 13 91
p P p P P p B p B B= + = + =
21 - Considere um grupo de 10 pessoas, sendo 6 mulheres e 4 homens. Escolhe-se um grupo
de duas pessoas. Determine a probabilidade de o grupo ser formado por um homem e por uma
mulher.
Resolução: 6M 4H
( ) ( ) ( ) ( )1 2 1 2 1 2 1 2 1 2 1 2p H M M H p H M p M H p H M M H∪ = + − ∩ =
( ) ( ) ( ) ( ) ( )1 2 1 1 2 1 0p H p M H p M p H M p= + − =
4 6 6 4 8
* *
10 9 10 9 15
= + =
22 - Qual é a probabilidade de o Pedro e o João terem nascido no mês de Dezembro?
Resolução:
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 2
1 1 1
. . *
12 12 144
independentes
p D D p D p D D p D p D= = = =
�����
23 - Atirei ao ar duas moedas. Determine a probabilidade de ter saído duas faces coroas.
Resolução:
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 2
1 1 1
. . *
2 2 4
p C C p C p C C p C p C= = = =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 20/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
24 - Considere um lançamento simultâneo de dois dados equilibrados. Qual é a probabilidade
do produto dos números das faces que ficam voltadas para cima ser par?
Resolução - tem que haver pelo menos um par. O segredo está aqui:
Excluir as situações dos dois serem ímpares
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 2
1 1 1 3
1 1 . 1 1 * 1
2 2 4 4
p I I p I p I I p I p I= − = − = − = − = − =
25 - Uma caixa contém 12 lâmpadas coloridas, das quais 5 estão fundidas. Determine a
probabilidade de tirar ao acaso três lâmpadas e estarem todas boas.
Resolução - 7B 5F
( ) ( ) ( ) ( )1 2 3 1 2 2 1 21
7 6 5 210 7
. . * *
12 11 10 1320 44
p B B B p B p B B p B B B= = = =
26 - A ementa de um restaurante tem 4 sobremesas diferentes. Três clientes escolhem a
sobremesa. Qual é a probabilidade de escolherem sobremesas iguais?
Resolução - ( ) ( ) ( ) ( )11 21 31 12 22 32 13 23 33 14 24 34
A B C D
p S S S p S S S p S S S p S S S+ + +
����� ������� ������� �������
A, B, C e D são incompatíveis dois a dois.
Significa que a união é vazio: 0A B∩ =
Assim ( ) ( ) ( )p A B p A p B∪ = +
� � �
3 3 3
1 1 1 1 1 1 4 1
* *
4 4 4 4 4 4 16*4 16
B C DA
= + + + = =
�����
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 21/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
27 - Numa terra há só 3 médicos. Numa noite, adoecem 5 habitantes. Cada um deles escolhe,
ao acaso, um dos médicos e chama-o por telefone. Qual é a probabilidade de que chamem
todos o mesmo médico?
Resolução: ( )11 21 31 41 51 12 22 32 42 52 13 23 33 43 53p D D D D D D D D D D D D D D D∪ ∪ =
( )11 21 31 41 51 12 22 32 42 52 13 23 33 43 53) ( ) (p D D D D D p D D D D D p D D D D D= + + =
5 5 5 4 4
1 1 1 3 1 1
3 3 3 3.3 3 81
= + + = = =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 22/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Probabilidade – Ficha 3
2 - Num determinado canal de televisão fez-se publicidade a um detergente X. Pretendia-se
saber se este facto teria influência na compra desse detergente. Fez-se uma sondagem e
concluiu-se que:
65% das pessoas viram o anúncio na televisão;
45% compraram o detergente;
30% viram o anúncio na televisão e compraram o detergente X.
a) Com os dados, construa um diagrama de Venn para melhor interpretação da situação
descrita (A = "ver o anúncio na televisão"; B = "comprar o detergente X")
b) Qual a percentagem de pessoas que nem viram o anúncio na televisão nem compraram o
detergente X?
c) Qual a percentagem de pessoas que apenas compraram o detergente X?
d) Qual a probabilidade de uma pessoa comprar o detergente X, quando viu o anúncio na
televisão?
Resolução:
a) ( ) ( ) ( )0,65 0,45 0,3P A P B P A B= ∧ = ∧ =�
b) ( ) 0,2P C = - 20%
c) 0,45 – 0,30 = 0,15=15%
d) Aqui o universo é o total dos que viram o anúncio. O acontecimento é o facto de terem
comprado.
( ) 0,3| 0, 462
0,65
P B A = =
4 - Uma empresa tem 500 empregados: 380 licenciados, 412 com estágio na empresa e 50
com estágio na sucursal estrangeira. Só há um grupo de empregados que têm dois tipos de
formação no seu CV: 357 empregados são licenciados e estagiaram na empresa.
Qual a probabilidade de um empregado ao acaso
a) ter pelo menos um tipo de formação?
b) ser licenciado ou ter estagiado na empresa?
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 23/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( ) 380 0,76
500
P A = ≈ , ser licenciado.
( ) 412 0,82
500
P B = ≈ , ter estagio na empresa.
( ) 50 0,1
500
P C = = , ter estagiado na sucursal no estrangeiro.
( ) 357 0,71
500
P A B = ≈� , Licenciado com estagio.
( )) 1– 1 0,046 0,714 0,11 0,1 1 0,03 0,97a A B C∪ ∪ = − − − − = − =
) 0,046 0,714 0,11 0,87b A B∪ = + + =
5. Os alunos de Engenharia do sexo masculino de uma dada universidade praticam desporto
nas seguintes percentagens:
Futebol - 30%; Andebol - 20%; Ténis de Mesa - 20%;
Futebol e Andebol - 5%; Futebol e Ténis de Mesa-10%; Andebol e Ténis de Mesa - 5%;
Todos os 3 desportos - 2%.
Determine a probabilidade de um aluno, escolhido aleatoriamente
a) praticar desporto;
b) jogar somente futebol;
c) jogar futebol ou ténis de mesa.
Se o escolhido praticar desporto, qual a probabilidade de
d) jogar somente futebol?
e) jogar andebol?
f) jogar futebol ou ténis de mesa?
Resolução - acontecimentos:
F= “praticar futebol”, A= “praticar andebol”, T= “praticar ténis”-
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 24/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( ) ( ) ( )0,3 0,2 0,2P F P A P T= ∧ = ∧ =
( ) ( ) ( ) ( )0,05 0,1 0,05 0,02P F A P F T P A T P F A T= ∧ = ∧ = ∧ =� � � � �
1 0,17 2 0,07 3 0,12 4 0,08= ∧ = ∧ = ∧ =
5 0,02 6 0,03 7 0,03 8 0,48= ∧ = ∧ = ∧ =
a) ( ) 0,17 0,07 0,12 0,08 0,02 0,03 0,03 0,52P D F T A= = + + + + + + =� �
b) ( ) 0,3 (0,08 0,02 0,03) 0,17P E = − + + = - joga somente futebol
c) ( ) ( )0,17 0,03 0,08 0,07 0,03 0,4P B = + + + + =
d) O universo máximo agora é de 52%, conforme visto na alínea a).
( ) ( )
( )
0,17
|
0,52
P E
P E D
P D
= =
e) ( ) ( )
( )
0, 2
| 0,385
0,52
P AP A D
P D
= = =
f)
( )
( )
0, 4
0,52
P B
P D
=
6 - Na tabela seguinte apresenta-se a composição por género e destreza da população de um
país.
Género
Masculino Feminino
Destreza
Destro 1.726.348 2.110.253
Esquerdino 638.309 753.125
Outra 15.239 7.435
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 25/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Admita que se selecciona ao acaso um indivíduo desta população.
a) Qual a probabilidade de o indivíduo seleccionado ser destra?
b) E a de ser esquerdino?
c) E a de ser uma mulher destra?
d) Qual a probabilidade de o indivíduo seleccionado ser destro, admitindo que é uma mulher?
Resolução – 1º é necessário fazer as somas laterais:
Género
Masculino Feminino Total
Destreza
Destro 1.726.348 2.110.253 3.836.601
Esquerdino 638.309 753.125 1.391.434
Outra 15.239 7.435 22.674
Total 2.379.896 2.870.813 5.250.709
( ) Total destro . . 0,731
Total de individuos . .
P A = = ≈
3 836 601
5 250 709
( ) . . 0, 265
. .
P B = ≈
1 391 434
5 250 709
( ) 2.110.253 0,402
. .
P C = ≈
5 250 709
( ) 2.110.253 0,75
. .
P D = ≈
2 870 813
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 26/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Probabilidade – Ficha 4
4 - O mercado do serviço de telemóvel reparte-se por três empresas: empresa A com uma
quota de 41%, empresa B com 38% e empresa C com 21%. Um estudo levado a cabo por uma
associação de consumidores revelou que havia utilizadores do serviço insatisfeitos: 35% dos
clientes da empresa A, 35% dos clientes da empresa de B e 30% dos clientes da empresa C.
Calcule a probabilidade de um cliente satisfeito estar ligado à rede da empresa B.
Resolução – 1º vou identificar os acontecimentos:
A – “ser cliente da empresa A”.
B – “ser cliente da empresa B”.
C – “ser cliente da empresa C”.
S – “estar satisfeito”.
( ) ( ) ( )0,41 0,38 0,21P A P B P C= ∧ = ∧ =
( ) ( ) ( )| 0,35 | 0,35 | 0,30P S A P S B P S C= ∧ = ∧ =
Pretende se ( )| ?P B S = , em que o “B” é o que se pretende saber, e “S” condição que já sei.
Para resolver este exercício, preciso de saber alguma teoria:
Partição { } 1i iA ≥ é uma partição de Ω .
( )
disjunto
, os acontecimentos são todos diferentesi jA A i j= ∅ ≠������
.
( )
1
todo reunidos, temos de voltar ao qie se tinha no inicioi
i
A
≥
= Ω� .
Teorema da probabilidade total.
B um acontecimento.
{ } 1i iA ≥ uma partição de Ω .
( ) ( ) ( )
1
|
n
i i
i
P B P B A P A
≥
=�
Teorema de Bayes
A, B acontecimentos de Ω .
( ) ( ) ( )
( )
|
|
P A B P B
P B A
P A
=
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 27/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
{ } 1i iD ≥ uma partição de Ω .
A um acontecimento Ω .
( )
�
( )
�
( ) ( )
( ) ( )
Envolvendo uma
partição
Acontecimentoelemento da
partição
1
|
|
|
i i
i n
S i iB
i
P A D P D
P D A
P A D P D
≥
� �
�
=
�
�
� � �
���� ���
( ) ( ) ( )
( ) ( )
1
|
|
|
i i
i n
i i
i
P A D P D
P D A
P A D P D
≥
=
�
Voltando ao exercício, vou elaborar uma arvore:
Pretende-se ( ) ( )
( )
( ) ( )|
|
" "
P B S P S B P B
P B S
P S Três ramos com S
= = =
�
( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
|
|
| | |
P S B P B
P B S
P S A P A P S B P B P S C P C
⇔ = ⇔
+ +
( ) 0,65 x 0,38|
0,65 x 0, 41 0,65 x 0,38 0,70 x 0,21
P B S⇔ = ⇔
+ +
( )| 0,374P B S =
A, B, C são partições. Os três formam o universo.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 28/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( ) ( ) ( ) 1P A P B P C+ + =
Ou então, bem mais simples poderia ter elaborado uma tabela:
S S Total
A 14,35 26,65 41
B 13,30 24,7 38
C 6,30 14,7 21
Total 33,95 66,05 100
( ) 24,7| 0,374
66,05
P B S = =
7 - Uma companhia vende aparelhos de telefone. Cada telefone é, antes de ser vendido,
inspeccionado por dois inspectores. Quando aparece um telefone com defeito, o primeiro, o
Sr. Pereira, detecta-o com probabilidade 0,3 e coloca-o no caixote de telefones “a reparar”.
Dos telefones defeituosos que passam sem ser detectados pelo primeiro inspector, o segundo
encontra, em média, 6 em cada 10.
a) Qual a fracção de telefones com defeito que são detectados (por algum dos inspectores)?
b) Se um telefone foi parar ao caixote dos telefones a reparar qual a probabilidade de que
tenha sido lá colocado pelo primeiro inspector?
(Normal, 1 de Fevereiro de 2003, adaptado)
( ) ( )0,3 2º 0,6P PERREIRA P= ∧ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 29/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
1D = telefone com defeito que é detectado pelo Sr. Pereira.
2D = telefone com defeito que é detectado pelo 2º inspector.
D = foi para o caixote.
a) Telefone com defeito a ser detectado: ( ) ( )( )11 2P D P D D D= ⇔� �
( ) ( ) ( ) ( ) ( ) ( ) ( )1 1 11 2 1 2
0,3 0,6 0,7
|P D P D P D D P D P D P D D P D⇔ = + ⇔ = + ⇔�
��� ��������
( ) 0,72P D =
b) ( ) ( ) ( )
( )
( )1 11 1
| 1 x 0,3
| |
0,72
P D D P D
P D D P D D
P D
⇔ = ⇔ = ⇔
( )1 | 0,417P D D ≈
8. No passado dia 19 de Outubro foi lançado a partir do cosmódromo de Baikonur, no
Cazaquistão, o primeiro de três satélites de órbita polar do programa MetOp (Meteorological
Operational Satellite Programme). Suponha que a parte eléctrica do satélite foi produzida por
3 companhias diferentes (designemo-las por companhia A, B e C), nas proporções
0,5, 0,3 e 0, 2 . Suponha ainda que as probabilidades de avaria das componentes eléctricas,
nas primeiras 24 horas em órbitas são, na mesma ordem, de 0,02, 0,05 e 0,01.
a) Qual a probabilidade de uma componente avariar nas primeiras 24 horas em órbita?
b) Passadas 24 horas verificou-se a avaria de uma componente. Qual a probabilidade de esta
componente ter sido fabricada pela companhia B?
c) Considere o mecanismo apresentado.
Os pequenos rectângulos são componentes cuja origem está identificada pela letra que
contêm. O mecanismo funciona se existir um caminho entre as extremidades E1 e E2
contendo componentes em bom estado. Supondo que as componentes funcionam
independentemente umas das outras, qual a probabilidade do mecanismo funcionar?
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 30/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
(Especial, 28 de Outubro de 2006)
Resolução
A – componente a ser produzido pela companhia A.
B – componente a ser produzido pela companhia B.
C – componente a ser produzido pela companhia C.
D – componente avariado nas primeiras 24 horas.
( ) ( ) ( )0,5 0,3 0,2P A P B P C= ∧ = ∧ =
( ) ( ) ( )| 0,02 | 0,05 | 0,01P D A P D B P D C= ∧ = ∧ =
a) ( ) ( ) ( ) ( ) ( ) ( ) ( )
0,02 x 0,5 0,05 x 0,3 0,01 x 0,2
| | | 0,027P D P D AP A P D B P B P D C P C= + + =
������� ������� �������
b) ( ) ( ) ( )
( )
| 0,05 x 0,3
| 0,556
0,027
P D B P B
P B D
P D
= = ≈
c) F – mecanismo funciona?
1A - 1º componente a utilizar fabricado em A e estar em bom estado.
2A - 2º componente a utilizar fabricado em A e estar em bom estado.
1B - 1º componente a utilizar fabricado em B e estar em bom estado.
2B - 2º componente a utilizar fabricado em B e estar em bom estado.
1C - 1º componente a utilizar fabricado em C e estar em bom estado.
( ) ( ) ( ) ( )1 2 1 2 2 1 2P F P A A P B B A P C A= ⇔� � � � � �
( ) ( )( )( )2 1 1 2 1P F P A A B B C⇔ = ⇔� � � �
( ) ( ) ( )( )2 1 1 2 1
Reunião de 3 acontecimentos
P F P A P A B B C⇔ = ⇔� � �
�����������
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 31/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Observação:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
Na figura é o 4 e 5 Na figura é o 5 e 6 Na figura é o Na figura é o5 e 7 5
P A B C P A P B P C P A B CP A B P A C P B C− − − += + + � � �
��������������
� �
����
�
�
�
���
( ) ( ) ( ) ( ) ( ) ( )( )
( ) ( ) ( )
( )
( ) ( )1 11 1 2
2 1 11 12 1 2 11 x ...
P A P CP A P B P B
P A B B P A CP F P A P A P B B P C
�
�⇔ = + +
�
�
− −
�
� � �
����������
�
����
( )
( ) ( )
( )( )
( ) ( ) ( )
( )( )
( ) ( ) ( ) ( )1 1 1 1 2 11 12
1 1 1 1 12 1 1 2...
P A P C P B P B P P A P B P B P CC
P A C P B B C P A B B C
�
�
�
�
− +
�
−� � �
����� ���������
� � �
�����������
( )2 0,98P A =
( ) ( )2 1 0,95P B P B= =
( )1 0,99P C =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 32/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Probabilidade – Ficha 5
1 - Um exame de escolha múltipla é composto por 20 questões. Cada questão tem 5 opções de
resposta, das quais apenas uma está correcta. Um estudante que passou o semestre assistindo
ao World Wide Wrestling em casa e ouvindo músicas da Ágata ao auricular na aula, e por isso
não sabe nada da matéria, decide responder ao calha.
a) Qual é a probabilidade de o estudante responder certo a uma única questão?
b) Qual é o número de respostas correctas que ele pode esperar obter?
c) Qual é a probabilidade de responder correctamente a um número de questões entre duas e
cinco (inclusive)?
d) Qual é a probabilidade de responder correctamente a mais de metade das questões?
e) Se todas as questões tiverem igual cotação, como devem ser cotadas as respostas erradas,
para que a classificação média de um estudante desta categoria no exame seja zero?
Resolução: X é o número de respostas certas em 20 perguntas.
São 21 possibilidades, pois o zero também conta.
Como é um conjunto de Bernouille, é uma Binomial.
1
0, 2
5
p = = , em que o 20n = e o 0,2p = .
Assim representa se matematicamente ( ) ( )~ ; ~ 20 ; 0,2 .X Bin n p X Bin=
Agora vou responder as alíneas:
a) ( ) ( ) ( ) ( ) ( )( )10 921 1 1
202
1 0, 2 1 0,2 0,2 0,8 0,0 81
1
0
5
n xxP X p p
x
C
n − −� � � �
= = − = − = ≈
�
�
� � � �
Recordar que
( )1
20 19! x
1! 1 1
20
! x 19
20! 2
! 1!
0 0
2 !
2
0
C = = = =
−
(na calculadora é nCr ).
Se me socorrer da Tabela da Binomial, tenho que ter cuidado, pois os valores
são cumulativos, logo não é para = mas sim para ≥ .
Assim se quiser para 1X = , faço para 1X ≥ , e subtraio 2X ≥ . É evidente
perceber o porquê, mas mesmo assim vou explicar:
1X ≥ , são todos os números para cima de um, assim que 2X ≥ são todos
para cima de dois. Os número para cima de dois são comuns aos para cima
de 1, tirando o um. Assim faz se:
( ) ( ) ( )1 1 2P X P X P X= = ≥ − ≥ . Consultando a tabela, sei que:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 33/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( )1P X ≥ é 0,988 e ( )2P X ≥ é 0,931. Assim
( ) ( ) ( )1 2 0,988 0,931 0 051 , 7P X P X P X= = ≥ − ≥ = − = , valor que é muito
próximo do calculado. A diferença deve-se ao arredondamento dos valores
da tabela.
Como se consulta a tabela? É necessário saber “M”, que é o nosso “n” e o
“r” que é o nosso “p”.
Como é uma Binomial, uso a Tabela da Distribuição Binomial (obvio!).
Uso como se fosse o jogo da “Batalha Naval”, ou seja uso as coordenadas
“M/r” que são o nosso “n/p”.
Para ( )~ 20 ; 0,2X Bin e ( )1P X ≥ (cuidado com o sinal – maior ou igual)
Para ( )~ 20 ; 0,2X Bin e ( )2P X ≥ (cuidado com o sinal – maior ou igual)
b) [ ] ( ) ( ) x 20 x 0,2 4E X n p= = =
c) ( ) ( ) ( )2 5 2 5 Errado!P X P X P X≤ ≤ = ≥ − ≥
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 34/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Pois, o “X” tem que estar no intervalo de 2 e 5. A tabela é só para maior ou
igual. Ao se fazer “retirar” (que é o que o menos faz), retira-se também o 5, e
o 5 tem que ficar. Assim escolhe-se o numero a seguir, que aqui é 6.
( ) ( ) ( )2 5 2 6 0,931- 0,196 0,735P X P X P X Usar a tabela≤ ≤ = ≥ − ≥ = = =
d) ( )11 0,001P X ≥ =
e) Y Cotação Total= . Vou utilizar para a cotação certa o “C” e errada o “D”.
Assim x ___ - x ___ Y C D= Quais devem ser os valores? É preciso ter
cuidado.
( )
pois as que acerta não falha!
x - 20 xX XY C D= −
�����
( ). - . . 2020Y C D DX X C D X D= + = + −
Como sei que [ ]� � [ ] �
20C D D
Y
y ax b E Y a E X b
+ −
= + → = +
Como o valor de X é [ ] [ ]4 0E X E Y= ∧ = , então fica:
[ ]� ( ) ( ) [ ]�
0 4
20 0 20E Y E C D X D C D E X D
= =
= + − ⇔ = + − ⇔� �� �
1
0 4 4 20
4
C D D C D⇔ = + − ⇔ = .
O seja é preciso respeitar esta igualdade para que o valor médio seja zero.
6 a) Mostre que, para quaisquer acontecimentos A e B num espaço de probabilidade (�, �, P)
( ) ( ) ( ) ( )P A B P A P B P A B= + −� �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 35/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução:
( ) ( ) ( )
tanh Az Vermelhos o ulCa
AA B B B AA B= − −�
������ ��� �
�
�
� �
����
Assim:
( ) ( ) ( ) ( )AA B AP P BB BA = � �� − − ��� � �
Recordar o axioma 3 ( )3a - se (A e B são incompatíveis) então a probabilidade da reunião de
A com B é igual à soma das probabilidades de A e de B» , pois se os acontecimentos A e B
são incompatíveis não têm resultados comuns, a frequência relativa de AUB é a frequência
relativa de A mais a frequência relativa de B e o limite da soma das duas sucessões é a soma
dos limites.
Assim, e pelo axioma 3 ( )3a , ( ) ( ) ( )3
R k
R k
R k
a P A P A
∈
∈
=�� , para qualquer sucessão de
acontecimentos disjuntos.
( ) ( )
( ) ( )
A B A B
A B B A
− = ∅��
�
− = ∅��
� �
� �
, logo são disjuntos, posso aplicar o teorema ( )3a .
Assim ( ) ( ) ( ) ( )
( )
( ) ( ) ( )
3a
A B A BB AA BP A B P P P PA BB A= = + +� �−� �− −−� � �� �
Probabilidade de acontecimento 4 (P4) => ( - ) ( ) - ( )P A B P A P A B= ∩ , continuando,
( )
4
( ) - ( )
P
P A B P A P A B=� � ( )P A B+ �
Tem propriedade comutativa
( ) - ( )P B P B A+ ������
( )
4
( ) ( ) - ( )
P
P A B P A P B P A B=+� � c.q.d.
6.b) Por uma cidade passam três rios, o Azul, o Branco e o Castanho. Dos registos de anos
anteriores estima-se que, em cada Inverno:
- ( ) P A = probabilidade de transbordar o rio Azul = 0,20;
- ( ) P B = probabilidade de transbordar o rio Branco = 0,10;
- ( ) P C = probabilidade de transbordar o rio Castanho = 0,05;
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 36/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
- ( )| P A B = 0,03, ( )| P A C = 0,02 e ( )| P B C = 0,02;
- ( )| | P A B C = 0,01.
Mostre que a probabilidade de que pelo menos um dos rios transborde, num ano ao acaso, é
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )P A B C P A P B P C P A B P A C P B C P A B C= + + − − − +� � � � � � � e
calcule-a. (2ª frequência, 14 de Janeiro de 2009)
Resolução:
( ) 0,20 0,10 0,05 0,03 0,02 0,02 0,01 0,29P A B C = + + − − − + =� �
Demonstração (prova):
Sejam A, B, C acontecimentos quaisquer: ( )P A B C =� � , vou usar a regra que utilizei no
exercício 6a),
( )
( )
( ) ( ) ( )
3a
P A B C P A B P C P A B C= + − =� �� �� � � � �
( ) ( ) ( ) ( ) ( )
com a troca de com Cuidado
P A P B P A B P C P A B C= + − + − =� �� �
� �
� � �
�������
Utilizar a propriedade distributiva:
( ) ( ) ( ) ( ) ( ) ( )C CP A P B P A B P C P A B= + − + − =� �� ��� ��
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )P A P B P A B P C P A P B C A C B CC P−� �= + − � �� �+ − + =� �� �� � ��
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
Vou socorrer me de um calculo auxiliar
P A P B P A B P C P A C P B C P A C B C= + − + − =� �� �− +� � � � � ����������
Calculo auxiliar: ( ) ( )A C B C� � � , e utilizando a regra da comutatividade, fica.
( ) ( ) ( ) ( ) ( )BA C B C A C A C C B CC A B= = =� � � � � � � � � � �
Agora vou substituir no cálculo:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )P A B C P A P B P C P A B P A C P B C P A B C= + + − − − +� � � � � � �
c.q.d
6 c) Generalize os resultados das alíneas anteriores, demonstrando a Fórmula da Inclusão –
Exclusão para a probabilidade de uma reunião:
( ) ( ) ( ) ( )
1 2 1 2 3
1 2 1 2 3
1
1 1 1
... 1
nn n nn
n
k k k k k k k k
k k k k k k k k
P A P A P A A P A A A P AU
+
= = < < < =
� �� �
= −
�
�
�
+ +
� � �
− −� � �� � � �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 37/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
quaisquer que sejam os acontecimentos 1 2, , ..., nA A A num espaço de probabilidade.
Resolução:
Nota: ( ) 11 n++ − é que dá o sinal!
Se regressarmos ao exercício 6a), ( )
4
( ) ( ) - ( )
P
P A B P A P B P A B= +� � , é
( ) ( )
1 2
1 21 1
n nn
k k k k
k k k k
P A P A P A AU
= = <
� �
�
� �
−=
� � �
( )
( ) ( )1 2
1 1 2
1 2 1 2 1 2
1
( ) ( ) - ( )
nn
k kk
k kk
P A AP A
n
k
k
P A P A A P A P A P A AU
<=
−
=
��
� �
= = +
�
� �
�
��� ��
�� �
� �
E o 6b) é
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )P A B C P A P B P C P A B P A C P B C P A B C= + + − − − +� � � � � � �
( )1 2 3
1
n
k
k
P A P A A AU
=
� �
= ⇔
�
� �
� �
( ) ( )
( )
( )1 2 31 2
1 2 31 1 2
1 2 1 2 1 2 1 2 3
1 2 3 1 2 1 3 2 3 1 2 3
1
( ) ( ) ( ) - ( ) - ( ) - ( )
nnn
k k kk kk
k k kk kk
P A A AP A AP A
n
k
k
k k k k k k k k k
P A P A P A P A P A A P A A P A A P A A AU
< <<=
=
< < < <
− +
<
���
� �
= + + +
�
� �
� ��
���� ���
���� ���
�������� �������
� � � � �
����� ����� ����� �������
Nota: sem saber o valor dos termos, sei que o 1º termo será sempre maior do que o 2º, que por
sua vez será maior do que o 3º, e por ai adiante.
( ) ( ) ( )
1 2 1 2 3
1 2 1 2 31
n n n
k k k k k k
k k k k k k
P A P A A P A A A
= < < <
> >� � �� � �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 38/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
16. Demonstre a Desigualdade de Bonferroni (cuidado com o sinal, pois aqui é AND):
( ) ( )
11
1
n n
i i
ii
P A P A n
=≥
� �
≥ − −
�
� �
��
Resolução –
( )
1 1
nn
k k
k k
P A P AU
= =
� �
=
�
� �
� , e é igual se forem DISJUNTOS!
Se não forem é ( )
1 1
nn
k k
k k
P A P AU
= =
� �
≤
�
� �
� , que é a desigualdade de Boole, e é valida para qualquer
um.
Aplica se a desigualdade ( )
1 1
nn
k k
k k
P A P AU
= =
� �
≤
�
� �
� , aos acontecimentos complementares
1 2, , ..., nA A A .
Assim ( )
1 1
nn
k k
k k
P A P AU
= =
� �
≤
�
� �
� . Sei que
1 2 1 2
1
Generalizando as Leis de Morgan
... ...
n
k n n
k
A A A A A A A
=
= =� � � � � �
����������
( ) ( )1k kP A P A= − , para qualquer { }1, 2,...,k n∈
Ficando assim: ( )( )
11
1
n n
k k
kk
P A P A
==
� �
≤ −
�
�
� �
�� , e como 1 é uma constante, vem para fora do
somatório, ficando:
( )
1 11
1
n n n
k k
k kk
P A P A
= ==
� �
≤ −
�
�
� �
� ��
E como sei que
1
1
n
k =
� é a soma de “n” uns, fica
1
1
n
k
n
=
=� .
E também sei que
1 1
1
n n
k k
k k
P A P A
= =
� � � �
= −
�
�
� � �� �
� � , ficando tudo
( ) ( ) ( )
1 11 1
1 1
n nn n
k k k k
k kk k
P A n P A P A P A n
= == =
� � � �
− ≤ − ⇔ ≤ − −
�
�
� � � �
� �� �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 39/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Estatística - Diagramas Caixa com Bigodes
Exemplo: Os dados seguintes referem-se aos pesos do coração, em gramas, de 39
ratos:
25 27 28 29 31 32 34 35 36 37 37 38 38
39 40 40 42 43 44 45 46 47 47 48 49 50
51 52 53 54 54 59 59 62 63 63 63 65 68
Construa o diagrama caixa com bigodes referente a esta amostra.
Resolução:
1 - Dimensão da amostra: n = 39.
2 - Cálculo da mediana:
2.1 - ( ) 1 39 1 20
2 2
n
proj med
+ +
= = = .
2.2 - 20:39 45med X= = . Cuidado, pois é preciso ordenar. Neste exercício já
está ordenado.
3 - Cálculo dos quartos (nota usa se � �� � para indicar característica inferior):
3.1 - ( )
( )Proj 1 20 1
Prof = 10,5
2 2
med
quartos
+� � +� �� � � �= =
3.2 - Quarto inferior: lO:39 ll:39L
X X 37 37
F 37
2 2
+ +
= = =
25 27 28 29 31 32 34 35 36 37 37 38 38
39 40 40 42 43 44 45 46 47 47 48 49 50
51 52 53 54 54 59 59 62 63 63 63 65 68
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 40/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
3.3 - Quarto superior: lO:39 ll:39U
' 'X X 54 53
F 53,5
2 2
+ +
= = =
25 27 28 29 31 32 34 35 36 37 37 38 38
39 40 40 42 43 44 45 46 47 47 48 49 50
51 52 53 54 54 59 59 62 63 63 63 65 68
Pois o FU é do fim para trás, por isso é que é “X” linha!
Nota 1: quarto ≠ quartis.
Nota 2: para ler este numero 12,2� �� � e 12,8� �� � é 12. É sempre o inteiro mais baixo.
Cuidado com os números negativos, pois: 4,9� �� � , não é -4, mas sim -5. De facto o
número inteiro -5 é menor do que -4,9.
Nota 3: FL = Fourth Lower ; FU = Fourth Upper ; Prof = profundidade.
4 - Dispersão quartal: 53,5 37 16,5dF Fu FL= − = − = .
5 - Barreirasde Outliers:
5.1. Barreira inferior: 1,5 37 1,5 16,5 12,25X XFL dF− −= = .
5.2. Barreira superior: + 1,5 53,5 1,5 16,5 78,25X XFU dF −= = .
5.3. Conclusão: Qualquer valor da amostra pertence ao intervalo
] [12,25;78,25 , pelo que não existem outliers. Ou seja o número mais pequeno (25) e
o maior (68) pertencem ao domínio ] [12,25;78,25 .
6 - Construção da caixa com bigodes:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 41/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Exercícios de resumo:
Determinar a mediana (M) e os quartos (F), da seguinte lista:
4, 5, 10, 12, 12, 14, 15, 16
1º passo, determinar a dimensão da amostra. 8n = .
2º passo, determinar a profundidade da mediana. ( ) 1 8 1 4,5
2 2
n
prof M
+ +
= = = .
3º passo, determinar a mediana. ( )
4 5 12
2prof M
x x
M x
+
= = = .
4º passo, determinar a profundidade do quarto. ( )
( ) 1 5 1
3
2 2
prof M
prof F
+� � +� �� � � �= = = .
Cuidado aqui pois 5� �� � , lê se característica inferior de 5, e é o inteiro imediatamente
abaixo.
5º passo, determinar o 1º LF e ultimo UF quarto.
3 10.LF x= =
'3 14.UF x= = Cuidado aqui, pois a contagem é feita da direita para a esquerda
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 42/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Determinar a mediana (M) e os quartos (F), da seguinte lista:
2, 5, 8, 10, 12, 15, 20, 23, 34, 37
1º passo, determinar a dimensão da amostra. 10n = .
2º passo, determinar a profundidade da mediana. ( ) 1 10 1 5,5
2 2
n
prof M
+ +
= = = .
3º passo, determinar a mediana. ( )
5 6 12 15 13,5
2 2prof M
x x
M x
+ +
= = = = .
4º passo, determinar a profundidade do quarto. ( )
( ) 1 5,5 1
3
2 2
prof M
prof F
+� � +� �� � � �= = =
.
Cuidado aqui pois 5,5� �� � , lê se característica de 5,5, e é o inteiro imediatamente
abaixo.
5º passo, determinar o 1º LF e ultimo UF quarto.
3 8.LF x= =
'
3 23.UF x= =
Nota: Moda: é a que tem maior frequência ( ).in
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 43/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Construção de Histogramas
Regra de Sturges
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por
: :* n n l n
x x
h
N
−
=
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é
dado por
( ) ( ): : .n n l nXN h x xε = − −
Exemplo: Determine N, um possível h e ε , para o seguinte conjunto de dados:
Que devidamente arrumado, fica:
1º - ( ) ( )
( )2
ln 42
log 1 1 6.
ln 2
N n N N
� �
= + ⇔ = + ⇔ =� � � �� �
� �
2º - ( ): : 52 38* * * 2, 3 .
6
n n l nx xh h h
N
− −
= ⇔ = ⇔ = Logo posso considerar: 2,4.h =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 44/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
3º - ( ) ( ) ( ) ( ): : 6 2, 4 52 38 0,4.n n l nX XN h x xε ε ε= − − ⇔ = − − ⇔ =
Assim as classes a considerar são:
] ] ] ] ] ] 37,8 ; 40, 2 , 40,2 ; 42,6 , 42,6 ; 45,0 ,
] ] ] ] ] ] 45,0 ; 47,4 , 47, 4 ; 49,8 e 49,8 ; 52, 2 .
ix in iN if iF
] ] 37,8 ; 40,2 12 12 0,29 0,29
] ] 40, 2 ; 42,6 8 20 0,19 0,48
] ] 42,6 ; 45,0 8 28 0,19 0,67
] ] 45,0 ; 47,4 4 32 0,10 0,76
] ] 47, 4 ; 49,8 6 38 0,14 0,90
] ] 49,8 ; 52, 2 4 42 0,10 1,00
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 45/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Exercícios
1 - Um dos boletins mensais do I.N.E. publicou os seguintes resultados do
Observatório da Serra do Pilar, no Porto, em cada um dos meses de 1989.
Meses do Ano Números de dias com nevoeiro
Janeiro 2
Fevereiro 1
Março 7
Abril 2
Maio 6
Junho 7
Julho 4
Agosto 7
Setembro 3
Outubro 2
Novembro 2
Dezembro 3
a) Em quantos meses do ano se registaram 7 dias de nevoeiro?
b) Escreva uma tabela de frequências completa para o número de dias de
nevoeiro por mês, com as indicações mais usuais. Discuta se esta será uma boa
forma de representar dados deste tipo.
c) Indique o número de meses em que se verificaram 4 ou menos dias de
nevoeiro. A que percentagem do total correspondem esses meses?
Resolução a) : tem se 3 dias com nevoeiro.
b)
- Frequencia Absoluta - Frequencia Absoluta Cumulativa
- Frequencia Relativa - Frequencia Relativa Cumulativa
i i
i i
n N
f F
ix in iN if iF
1 1 1 1/12 1/12
2 4 5 1/3 5/12
3 2 7 1/6 7/12
4 1 8 1/12 2/3
6 1 9 1/12 3/4
7 3 12 1/4 1
n = 12
“n” – dimensão da amostra.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 46/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
= = ii i
n
n n f
n�
c) O número de meses em que se verificaram 4 ou menos dias de nevoeiro foram de
8, o que representa 66,7%.
Conclusão: esta tabela, onde foram excluídos os dados da tabela dada, peca por
ter apenas uma variável (a da “dias com nevoeiro”). Pois na tabela dada continha
a informação temporal, ou seja definia qual era os meses que tinha mais nevoeiro.
2 - Para cada um dos seguintes conjuntos de dados, faça uma representação gráfica adequada:
a) No âmbito de um estudo realizado com o objectivo de caracterizar o comportamento dos
clientes de um hipermercado, analisou-se o número de ocupantes por veículo para 1000
veículos que entraram no parque automóvel do referido hipermercado, num sábado.
b) A Tabaqueira, SA faz um apertado controlo da qualidade dos cigarros que produz; o peso é
uma das características rigorosamente acompanhadas. Com os pesos de uma amostra de 500
cigarros de uma das marcas produzidas construiu-se o seguinte quadro:
Peso (mg)
Classes Quantidade Proporção
] ]760; 780 4 0,008
] ]780; 800 43 0,086
] ]800; 820 118 0,236
] ]820; 840 168 0,336
] ]840; 860 117 0,234
] ]860; 880 39 0,078
] ]880; 900 11 0,022
Total 500 1
Resolução: os gráficos serão diferentes uma vez que em a) as variáveis são discretas, e em b)
as variáveis são continuas. Quando as variáveis são discretas, usa se um gráfico de barras, e
quando são continuas, usa se um histograma.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 47/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Assim, para o exercício a):
Jorge Rodrigues Valente – 2087406 UMa 13-03-201048/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Na 1ª figura tem se o gráfico dos dados. Na 2ª figura compara se o gráfico dos dados com o
modelo normal (modelo Gaussiano). Nota que não coincidem. Existe uma assimetria.
Na 3ª figura confirma se que o gráfico é assimétrico e “foge” para a direita.
Resolução da b): a quantidade é a frequência absoluta e a proporção a frequência relativa.
Peso (mg)
Classes
if iF
] ]760; 780 4 0,008
] ]780; 800 43 0,086
] ]800; 820 118 0,236
] ]820; 840 168 0,336
] ]840; 860 117 0,234
] ]860; 880 39 0,078
] ]880; 900 11 0,022
Total 500 1
Na 1º figura do exercício b) é o gráfico dos dados.
Na 2º figura do exercício confirma se que o gráfico é simétrico, pois ao se sobrepor o Modelo
Gausiano, nota-se coincidências.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 49/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
c) Escolheu-se ao acaso uma amostra de 100 homens e uma amostra de 200 mulheres numa
população, a fim de averiguar se a cor do cabelo estaria relacionada com o sexo. Os resultados
foram os seguintes:
Preto Castanho Louro Ruivo
Masculino 32 43 16 9
Feminino 55 65 64 16
Fica: Homens – Preto 32/100; Castanho 43/100; Louro 16/100; Ruivo 9/100
Mulheres – Preto 55/200; Castanho 65/200; Louro 64/200; Ruivo 16/200.
3 - Complete a tabela e indique a mediana da amostra.
ix in iN if iF
1 2 0,025
2 12
3 58
4
5
Resolução - sem fazer muitas contas consigo descobrir os seguintes valores:
ix in iN if iF
1 2 2 0,025 0,025
2 12 14
3 44 58
4
5 1
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 50/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Pois o total de iF é um.
Na 1ª linha sei que do valor 2 e do valor 0,025.
Na 2ª linha, sei que é 14, pois é 2 + 12.
Na 3ª linha, sei que é 44, pois é 58 - 14.
Agora, também consigo calcular a dimensão da amostra:
X2 1
80
0,025
n n= ⇔ =
Sabendo a dimensão da amostra, posso calcular os valores de if , quando sei iN :
ix in iN if iF
1 2 2 0,025 0,025
2 12 14 0,15 0,175
3 44 58 0,55 0,725
4
5 80 1
Agora consigo calcular os valores da linha 4, pois sei o ultimo valor e o penúltimo
da coluna iF :
ix in iN if iF
1 2 2 0,025 0,025
2 12 14 0,15 0,175
3 44 58 0,55 0,725
4 16 74 0,2 0,925
5 80 1
Só falta preencher os dois últimos da linha 5:
ix in iN if iF
1 2 2 0,025 0,025
2 12 14 0,15 0,175
3 44 58 0,55 0,725
4 16 74 0,2 0,925
5 6 80 0,075 1
Cuidado que a pergunta ainda não acabou! Também me é pedido o valor da
mediana:
Sei que tenho 2 uns, 12 dois, 44 três, 16 quatros e 6 cincos. Como a dimensão da
amostra é de 80, a mediana será o 40º número + 41º número, a dividir por dois:
: 1:
40:80 41:802 2 3 3 3
2 2 2
n n
n n
x x
x x
M M M M
+
+
+ +
= ⇔ = ⇔ = ⇔ =
Se a dimensão da amostra fosse impar, seria
1:
2
n
n
M x
+
= .
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 51/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
4 - Em seguida, apresentam-se seis "manchas" de histogramas, quatro das quais
apresentam os resultados do estudo, numa pequena cidade, das características
seguintes:
a) altura dos elementos das famílias nucleares cujos membros do casal têm idade
inferior a 24 anos;
b) altura dos elementos do casal;
c) altura dos indivíduos da cidade;
d) altura dos automóveis ligeiros.
Quais dos histogramas podem representar cada uma das variáveis anteriores?
Justifique a sua resposta.
Resolução:
Os gráficos 3 e 6 estão fora do contexto, pois nas quatros afirmações só é feita
referencia a altura. No gráfico 3 tem se o peso, e no 6 o rendimento.
A a) está relacionado com o gráfico 2, pois apresenta dois “picos”. O 1º diz
respeito a altura das crianças e o 2º diz respeito a altura dos pais. A altura dos filhos
nunca será próxima da altura dos pais, pois é me dito que a idade máxima dos pais
é de 24 anos (este pormenor é importante para se excluir os outros gráficos).
A b) está relacionado com o gráfico 4, pois se olharmos para o segundo pico do
gráfico 2, é igual. Como conclui em que o gráfico 2 pertencia ao a). Obviamente,
numa situação dita normal, os pais terão uma altura superior a 1,5 metros e menos
de 2 (alturas típicas portuguesas).
A c) está relacionado com o gráfico 5, pois não existe descontinuidade tanto na
linha de subida como na de descida, e começa com a altura das crianças até a
população adulta.
A d) está relacionado com o gráfico 1, por exclusão, e por ser os valores típicos das
alturas dos mais diferentes automóveis existentes.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 52/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
5 - O Vicente, que admitiu ser um veterano nas cantorias no chuveiro, comprou um
novo esquentador, porque lhe disseram que este era mais rápido a aquecer a água.
Recordando que com o seu velho esquentador no Inverno tinha de esperar em
média 20 segundos para poder começar o seu banho, começou a tomar nota dos
tempos relativos ao novo esquentador:
15,6 16,7 17,2 18,3 19,6 20,3
15,7 16,8 17,2 18,3 19,7 20,5
15,7 16,8 17,5 18,3 19,8 20,5
15,8 16,8 17,6 18,4 19,9 20,6
16,0 16,9 17,7 18,5 19,9 20,7
16,3 17,0 17,8 18,5 19,9 20,7
16,5 17,0 18,0 19,3 20,0 21,0
16,6 17,1 18,1 19,4 20,1 21,2
16,7 17,1 18,1 19,4 20,2 21,2
16,7 17,2 18,2 19,5 20,3 21,4
21 103,9 20 477
ii
x x= ∧ =� �
a) Calcule as características de localização e de dispersão mais usuais, e baseando-
se nelas discuta se o Vicente tem razões objectivas para estar satisfeito com a
compra que fez.
b) Faça uma representação gráfica dos dados e refira-se à simetria da variável
registada pelo Vicente.
Resolução: As características de localização mais usuais são:
Media; Moda; Mediana; Mínima; Máxima; 1º (FL) e 3º (FU) Quarto (o 2º é a Mediana).
Depois existem as medidas de Dispersão, que são:
Desvio Padrão; Variância; Dispersão Quartal; Amplitude (Range).
A Media é calculada pela fórmula 1
1103,9
18,4
60
n
i
i
X
X X X
n
== ⇔ = ⇔ =
�
A Media Aparada a 10% (por exemplo) retira-se de AMBAS as extremidades 10% dos
dados da amostra, e usa se depois a mesma formula, mas já com o “n” reduzido. Nota que se
retira “n” de ambos os lados!
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 53/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
A Variância é calculada peça fórmula:
2
2
2 2 21
1 1
( )
1 1
.
1 1
n
i n n
i
X X i i
i i
X X
s s X X
n n n
=
= =
− � �� �
= ∨ = −� �
�− − � �� �� �
�
� �
Vou utilizar a 2ª formula, pois é me dado o 21 103,9 20 477
ii
x x= ∧ =� � :
( )
2
22 2 2
1 1
1 1 1 1
. 20477 . 1103,9
1 60 1 60
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
� � �− − � �� �� �� �
� �
Cuidado para não trocar as variáveis
2
1
n
i
i
X
=
� com
1
n
i
i
X
=
� , pois confunde, uma vez que ambas
tem potencia elevado ao quadrado.Assim
2 2,8319Xs = .
O Desvio Padrão é calculado pela fórmula 2 1,68X X Xs s s= ⇔ = .
O Coeficiente de Variância é calculado pela fórmula Xcv
X
σ
= .
6 - Considere a amostra que se segue, correspondente às perdas diárias da Telecom devido a
chamadas internacionais feitas via Internet e por isso pagas como chamadas locais, em 100
dias escolhidos ao acaso em 1996.
0,0 0,5 1,0 1,4 1,7 2,0 2,3 2,8 3,1 3,4
0,1 0,5 1,0 1,4 1,8 2,0 2,3 2,8 3,2 3,4
0,1 0,5 1,1 1,4 1,8 2,0 2,4 2,8 3,2 3,4
0,1 0,6 1,1 1,5 1,8 2,0 2,4 2,8 3,2 3,5
0,2 0,6 1,1 1,5 1,8 2,0 2,4 2,8 3,2 3,5
0,2 0,7 1,2 1,6 1,8 2,0 2,4 2,9 3,2 3,5
0,3 0,7 1,2 1,6 1,9 2,1 2,4 2,9 3,3 3,6
0,3 0,8 1,2 1,6 1,9 2,1 2,5 3,0 3,3 3,6
0,4 0,9 1,2 1,6 1,9 2,1 2,7 3,0 3,3 3,6
0,5 0,9 1,3 1,6 1,9 2,1 2,7 3,1 3,4 3,7
100 100
2
1 1
195,2 489,2i i
i i
x X
= =
= ∧ =� �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 54/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
a) Construa histogramas apropriados para representar os dados, usando a Regra de Sturges e a
regra do desvio-padrão.
b) Proponha um modelo para a distribuição de frequências desta variável.
Resolução a): É preciso ter cuidado com “Construa histogramas apropriados … “ pois não
me é dito como deverei proceder, uma vez que tanto posso utilizar a Regra de
Sturges, como a do Desvio Padrão.
A do Desvio Padrão só posso utilizar se o gráfico for simétrico. Como ainda não fiz
o gráfico, não consigo utilizar este critério. Então uso o diagrama de Caule e Folha:
Assim, ( )2log 100 1 7N ≈ + ≈� �� � . Ou seja vou tentar ter 7 linhas de “arrumação” dos
dados. Agora tenho que tentar saber qual o melhor tipo que se enquadra nesta
exercício.
Tipo de forma 1, não se enquadra. O do tipo ½ vai me dar 8 linhas. Como N = 7,
dá. Assim fica:
0
1
100 ; X 10
2
Como se pode ver não é bem simétrico, falha ligeiramente, mas no enunciado é me
“pedido” par ir por este processo, pois dão me
100 100
2
1 1
i i
i i
x X
= =
∧� � . Assim, o 1º passo é
100
1 1 195,2 1,952
100 100
n
i i
i i
X X
X X X X
n
= == ⇔ = ⇔ = ⇔ =
� �
( )
2
22 2 2
1 1
1 1 1 1
489,72 195, 2
1 100 1 100
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
� � �− − � �� �� �� �
� �
2 1,0979Xs =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 55/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Cuidado aqui para não trocar o 2
1
n
i
i
X
=
� com o
2
1
n
i
i
X
=
� �
�
� �
� .
Logo 2 1,05X X Xs s s= ⇔ � .
O 2º passo é
] [1,05 1,05 ; ; 0,35 ; 0,525
3 2 3 2
X Xh h h
σ σ� � � �∉ ⇔ ∉ ⇔ ∉� � � �� �� �
Pode ser qualquer número neste intervalo, como por exemplo:
Vou escolher o h = 0,4:
3º passo, a Classe central:
;
2 2
h h
X X� �− +� �� �
Assim é: ] [0,4 0,41,95 ; 1,95 1,75 ; 2,15
2 2
� �− + ⇔� �� �
Esta é a central. Como sei que o mínimo é 0,0 e o máximo é 3,7, vou criando as
classes até PASSAR esses números.
Antes - [ ] ] ] ] ] ] ] ] ]0, 25 ; 0,15 , 0,15 ; 0,55 , 0,55 ; 0,95 , 0,95 ; 1,35 , 1,35 ; 1,75−
Central - ] ]1,75 ; 2,15
Depois - ] ] ] ] ] ] ] ]2,15 ; 2,55 , 2,55 ; 2,95 , 2,95 ; 3,35 , 3,35 ; 3,75
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 56/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
in iN if iF
] ]0,25 ; 0,15− 4 4 0,04 0,04
] ]0,15 ; 0,55 10 14 0,10 0,14
] ]0,55 ; 0,95 7 21 0,07 0,21
] ]0,95 ; 1,35 10 31 0,10 0,31
] ]1,35 ; 1,75 11 42 0,11 0,42
] ]1,75 ; 2,15 19 61 0,19 0,60
] ]2,15 ; 2,55 8 69 0,08 0,68
] ]2,55 ; 2,95 9 78 0,09 0,77
] ]2,95 ; 3,35 12 90 0,12 0,89
] ]3,35 ; 3,75 11 101 0,11 1
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 57/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
8 - Um estudo sobre os atrasos nos voas europeus durante o Verão de 1999,
realizado em determinado aeroporto, conduziu aos seguintes resultados:
a) Construa uma tabela de frequências (acumuladas e não acumuladas).
b) Represente os dados graficamente.
Resolução - pequena introdução:
im = marca da classe, ou seja o ponto médio da classe.
in = frequência absoluta.
iN = frequência absoluta acumulada.
if = frequência relativa (ou seja, in a dividir pela dimensão da amostra).
iF = frequência relativa acumulada.
Nota: as chavetas tanto podem estar abertas para o lado esquerdo como para o lado direito.
Assim sendo:
Classes
im in iN if iF
[ ]0;10 5 29 29 0,29 0,29
] ]10;20 15 23 52 0,23 0,52
] ]20;30 25 17 69 0,17 0,69
] ]30;40 35 14 83 0,14 0,83
] ]40;50 45 11 91 0,11 0,91
] ]50;60 55 6 100 0,06 1
n = 100
Para representar graficamente, e se nada me é dito, coloco no eixo dos “y” qualquer
uma das colunas. Mas é me dito para representar os dados. Os dados são os da
tabela dada no enunciado.
Assim sendo vou utilizar os dados da tabela:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 58/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
No eixo dos “x” é representado SEMPRE a classe.
Histograma
Quando se usa as classes (variáveis continuas) num gráfico, designa-se por
histograma, barras coladas umas as outras.
11 - Pretende-se conhecer a relação entre o rendimento familiar e o nível
educacional do proprietário de habitação própria. O nível educacional aparece nos
registos oficiais como uma variável categorizada com os seguintes níveis:
A - até 4 anos de escolaridade
B - até 9 anos de escolaridade
C - curso do ensino secundário
D - 1 a 2 anos da Universidade
E - Licenciatura
F - estudos de pós-graduação.
Optou-se, numa primeira abordagem aos dados, por apresentar as caixas de bigodes
para cada um destes níveis, Baseando-se na interpretação da figura seguinte,
forneça o máximo de informação relativamente à questão em análise.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 59/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Uma possível comparação das amostras representadas:
O rendimento familiar mediano aumenta com o nível de escolaridade do
proprietário de habitação própria. Observamos o maior "salto" na passagem da
categoria E (Licenciatura) para a categoria F (Estudos de pós-graduação). O mesmo
acontece para os quartos e para o rendimento familiar mínimo. O rendimento
familiar máximo também aumenta com o nível de escolaridade apesar desse
aumento ser pouco significativo na passagem da categoria D (1 a 2 anos de
escolaridade) para a categoria E. Os 25% maiores rendimentos na categoria A (até
4 anos de escolaridade) são superiores a alguns dos 25% menores rendimentos
familiares na categoria F.
A categoria D apresenta a maior amplitude amostral apesar de ser pouco maior do
que a apresentada nas categorias E e F. Observamos a maior dispersão quartal na
categoria F. Não há grandes diferenças entre as categorias A e B (até9 anos de
escolaridade) e entre as categorias B e C. No entanto, as diferenças entre as
categorias B e C são mais acentuadas a nível da dispersão. A dispersão dos 25%
menores rendimentos familiares ( )( )1LF x− aumenta com o nível de escolaridade do
proprietário de habitação própria. A dispersão dos 25% maiores rendimentos
familiares é menor na categoria F.
Observamos em todas as caixas de bigodes uma assimetria à direita apesar de mais
ligeira na caixa de bigodes correspondente à categoria F.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 60/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Exercício – 1: Os dados seguintes referem-se aos pesos do coração, em gramas, de
39 ratos:
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M)
e os quartos (F).
Resolução - 1: Sendo na dimensão da amostra, vamos usar um número de caules N
tão próximo quanto possível de ( )2log 1n +� �� � , isto é, ( )2log 1N n≈ +� �� � .
Observação: No caso dos diagramas de Caule e Folhas, conhecida por regra de
Sturges, devo de ter alguma flexibilidade, pois existe 3 tipos diferentes de fazer o
diagrama. Existe o designado por: Tipo de forma 1, ½ e 1/5. Escolhe se a mais
adequada.
Assim, ( )2log 39 1 6N ≈ + ≈� �� � .
Nota: ( ) ( )
( )2
ln 39
log 39 5,3
ln 2
= = .
Folhas não ordenadas:
Como é que se preenche este quadro? É fácil, só se ter que ter em conta que a folha
é a divisão logo abaixo do caule. Exemplo, 0 1º é o 40. Assim no caule fica o
número quatro, e na folha fica o zero:
O 2º número é o 29. No caule é dois e na folha é nove.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 61/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
O 3º numero é o 54, cinco e quatro:
E assim por diante.
Depois deste passo, segue se o Diagrama final, que consiste em ordenar os
números, por ordem crescente e colocar no topo referencias importantes:
139; lx10
Diagrama final:
139; lx10 , significa que o campo amostral tem 39 elementos, “1x” significa que se
está a usar o formato tipo um (ou seja não existe factores multiplicativos), e o 1"10 "
, significa que o caule é dezenas, ou seja o dois é na realidade vinte.
Assim sendo: o primeiro valor 2 || 5 representa 1 02x10 5x10 25+ = .
Outra nota a se ter em conta, é que o ( )2log 39 1 6N ≈ + ≈� �� � . E na realidade usou se 5
linhas. É esta flexibilidade que é preciso ter. Pois existe mais três formas de
representar o gráfico, e esta é a opção mais correcta, visto 6 - 5 ser 1. Um é um
valor aceitável.
A outra informação que é necessária acrescentar a tabela. É o valor acumulado,
tanto de cima para baixo, com de baixo para cima. A ter se em conta que a linha
onde se encontra a ( )prof M fica entre parênteses. Como ( ) 1 20.
2
n
prof M
+
= =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 62/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
20 5M x= =
Nota 1: a repetição do acumulado 14 é apenas coincidência!
Nota 2: se conta a partir do fim, é da direita para a esquerda! (aqui na 3 linha).
Agora vou determinar a mediana (M) e os quartos (F):
1º passo, determinar a dimensão da amostra. 39n = .
2º passo, determinar a profundidade da mediana. ( ) 1 39 1 20
2 2
n
prof M
+ +
= = = .
3º passo, determinar a mediana. ( ) 20 45prof MM x x= = = .
4º passo, determinar a profundidade do quarto. ( )
( ) 1 20 1
10,5
2 2
prof M
prof F
+� � +� �� � � �= = = .
5º passo, determinar o 1º LF e ultimo UF quarto.
10 11
37 37
37.
2 2L
x x
F
+ +
= = =
' '
10 11 54 53 53,5.
2 2U
x x
F
+ +
= = =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 53,5 37 16,5U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 37 1,5 16,5 12,25LF dF = =− −
Barreiras de Outliers Superior - X X 1,5 53,5 1,5 16,5 78,25UF dF = + =+
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (78,25): 0
Dados inferior a barreira inferior (12,25): 0
Posso concluir que não existe Outliers.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 63/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora Diagrama Caixa com Bigodes:
Caixa com 5 letras resumo:
Conclusão: os primeiros 25% estão compreendidos entre os números 25 e 37, assim
como os últimos 25% estão compreendidos entre os 53,5 e os 68. As dispersões
acontecem mais (ligeiramente) no 4º quartal. Não tem Outliers.
Construção de Histogramas/Barras - Regra de Sturges
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
Assim, ( )2log 39 1 6N ≈ + =� �� � (já visto anteriormente).
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
( ): : 68 25* * * 7,1 6
6
n n l nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar h = 7,2 (poderia ser 8!, a regra não é rigida).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 64/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é
dado por
( ) ( ): : .n n l nXN h x xε = − −
Assim ( ) ( ) 6 7, 2 68 25 0, 2Xε ε= − − ⇔ = , e como o inicio da classe é:
:
0,2
25 24,9
2 2l n
x
ε
− = − = .
Assim as classes a considerar são:
] ] ] ] ] ]24,9 ; 32,1 , 32,1 ; 39,3 , 39,3 ; 46,5 ,
] ] ] ] ] ] 46,5 ; 53,7 , 53,7 ; 60,9 e 60,9 ; 68,1 .
ix in iN if iF
] ]24,9 ; 32,1 6 6 0,15 0,15
] ] 32,1 ; 39,3 8 14 0,19 0,36
] ] 39,3 ; 46,5 7 21 0,19 0,54
] ] 46,5 ; 53,7 8 29 0,10 0,74
] ] 53,7 ; 60,9 4 33 0,14 0,85
] ] 60,9 ; 68,1 6 39 0,10 1
n = 39
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 65/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Na 1º figura do exercício é o gráfico dos dados.
Na 2º figura do exercício confirma se que o gráfico é assimétrico, pois ao se sobrepor o
Modelo Gausiano, não se nota coincidências.
Exercício – 2: Os dados seguintes representam os 26 pesos de cada um dos 26
alunos de uma turma de 11º ano de uma determinada escola:
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M)
e os quartos (F).
Resolução - 2: Sendo na dimensão da amostra, vamos usar um número de caules N
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 26 1 = 5N ≈ +� �� � .
Aqui é necessário tomar se uma decisão, pois os números são composto pela parte
inteira e fraccionaria. Como nas folha só se pode ter um algarismo, vai se “truncar”
(apagar) a parte decimal. Mas este “truncagem” só se realiza na arrumação dos
dados, poisnos cálculos é necessário respeitar o número com a sua parte decimal.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 66/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Folhas não ordenadas:
Como é que este quadro foi preenchido? É fácil, só se aproveitou a parte inteira. A
parte decimal foi APAGADA. Não confundir com arredondado.
Diagrama final:
Assim sendo: o primeiro valor 4 || 1 representa 1 04x10 1x10 41+ =
(seria então 41,75).
A outra informação que é necessária acrescentar a tabela. É o valor acumulado,
tanto de cima para baixo, com de baixo para cima. A ter se em conta que a linha
onde se encontra a ( )prof M fica entre parênteses.
Como ( ) 26 1 13,5.
2
prof M
+
= =
13 14 60 61 60,5
2 2
!
x
ER
x
M RADO
+ +
= = =
Não esquecer que os verdadeiros valores são (inclui-se os decimais!):
13 14 60,43 61,15 60,79
2 2
x x
M
+ +
= = =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 67/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou determinar a mediana (M) e os quartos (F):
1º passo, determinar a dimensão da amostra. 26n = .
2º passo, determinar a profundidade da mediana. ( ) 1 26 1 13,5
2 2
n
prof M
+ +
= = = .
3º passo, determinar a mediana. ( )
13 14 60, 43 61,15 60,79
2 2prof M
x x
M x
+ +
= = = = .
4º passo, determinar a profundidade do quarto.
( )
( ) 1 13,5 1 13 1
7
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = .
5º passo, determinar o 1º LF e ultimo UF quarto.
7 50,92.LF x= =
'7 67,81.UF x= =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 67,81 50,92 16,89U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 50,92 1,5 16,89 25,59LF dF = − =−
Barreiras de Outliers Superior - X X 1,5 67,81 1,5 16,5 93,15UF dF = + =+
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (93,145): 0
Dados inferior a barreira inferior (25,585): 0
Posso concluir que não existe Outliers.
Agora Diagrama Caixa com Bigodes:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 68/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Caixa com 5 letras resumo:
Conclusão: os primeiros 25% estão compreendidos entre os números 41,5 e 50,92,
assim como os últimos 25% estão compreendidos entre os 67,81 e 72,73. As
dispersões acontecem mais (ligeiramente) no 1º quartal. Não tem Outliers.
Construção de Histogramas/Barras - Regra de Sturges
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
Assim, ( )2log 26 1 = 5N ≈ +� �� � (já visto anteriormente).
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
: : 72,73 41,75* * * 6,196
5
n n l nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar h = 6,2. O limite inferior da primeira classe deverá ser
: ,2l n
x
ε
− em que ε é o excesso, e é dado por:
( ) ( ): : .n n l nXN h x xε = − −
Assim ( ) ( ) 5 6,2 72,73 41,75 0,02Xε ε= − − ⇔ = , e como o inicio da classe é:
:
0,02
41,75 41,74
2 2l n
x
ε
− = − = .
Assim as classes a considerar são:
] ] ] ] ] ]41,74 ; 47,94 , 47,94 ; 54,14 , 54,14 ; 60,34 ,
] ] ] ] 60,34 ; 66,54 e 66,54 ; 72,74 .
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 69/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
ix in iN if iF
] ]41,74 ; 47,94 5 5 0,19 0,19
] ] 47,94 ; 54,14 5 10 0,19 0,38
] ] 54,14 ; 60,34 3 13 0,12 0,50
] ] 60,34 ; 66,54 4 17 0,15 0,65
] ] 66,54 ; 72,74 9 26 0,35 1
n = 26
Na 1º figura do exercício é o gráfico dos dados.
Na 2º figura do exercício confirma se que o gráfico é assimétrico.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 70/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Exercício – 3: Na tabela em baixo encontra-se o número mensal de passageiros
(em centenas) referente ao período 1998-2001 da companhia EntreAsNuvens.
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M)
e os quartos (F).
Resolução - 2: Sendo na dimensão da amostra, vamos usar um número de caules N
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 48 1 = 6N ≈ +� �� � .
Aqui é necessário tomar se uma decisão, pois os números são de 4 algarismos,
ficando três no caule. Assim sendo seria necessário arranjar 100 linhas para
conseguir arrumar os dados. Além de ser um valor absurdo, só podemos utilizar 6
(este 6 não é uma obrigatoriedade, mas sim uma orientação). Vou então utilizar
uma forma do tipo ½. Vou definir conjuntos dos primeiros 50 como “Lower” e os
restantes 50 como “Upper”. E o número é o das centenas, por isso utilizo 2
1
x10
2
na
característica do diagrama caule e folhas.
Folhas não ordenadas:
Diagrama final:
Assim sendo: o 2º da 2ª linha valor 9U || 6 representa 2 19x10 6x10 960+ = . Ter em
atenção as potências. Como não se tem o 960, é na realidade o 968.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 71/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
A outra informação que é necessária acrescentar a tabela. É o valor acumulado,
tanto de cima para baixo, com de baixo para cima. A ter se em conta que a linha
onde se encontra a ( )prof M fica entre parênteses.
Como ( ) 48 1 24,5.
2
prof M
+
= =
Agora vou determinar a mediana (M) e os quartos (F):
1º passo, determinar a dimensão da amostra. 48n = .
2º passo, determinar a profundidade da mediana. ( ) 1 48 1 24,5
2 2
n
prof M
+ +
= = = .
3º passo, determinar a mediana.
( )
24 25 1 ?06 106 106 106 10 2
2 2
2
2
2
6
?
prof M
x x
M x
+ + +
= = = = = .
4º passo, determinar a profundidade do quarto.
( )
( ) 1 24,5 1 24 1
12,5
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = .
5º passo, determinar o 1º LF e ultimo UF quarto.
12 13
996 1009
1 002,5.
2 2L
x x
F
+ +
= = =
' '
12 13 1 111 1 105 1 108.
2 2U
x x
F
+ +
= = = Cuidado com este. Lê se da direita para a
esquerda, e na 4ª fila.
É errado fazer
' '
12 13 1 147 1 147
2 2U
x x
F
+ +
= = = . A contagem foi realizada da esquerda
para a direita.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 72/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 1 108 1 002,5 105,5U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 1 002,5 1,5 105,5 844, 25LF dF = − =−
Barreiras de OutliersSuperior - X X 1,5 1 108 1,5 105,5 1 266, 25UF dF = + =+
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior moderado (1 266,25): 0
Dados inferior a barreira inferior moderado (844,25): 0
Posso concluir que não existe Outliers.
Agora Diagrama Caixa com Bigodes:
Caixa com 5 letras resumo:
Conclusão: os primeiros 25% estão compreendidos entre os números 940 e 1 002,5,
assim como os últimos 25% estão compreendidos entre os 1 108 e 1 196. As
dispersões acontecem mais (ligeiramente) no 4º quartal. Não tem Outliers.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 73/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Construção de Histogramas/Barras - Regra de Sturges
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
Assim, ( )2log 48 1 = 6N ≈ +� �� � (já visto anteriormente).
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
( ): : 1196 940* * * 42, 6
6
n n l nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar h = 43.
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é
dado por
( ) ( ): : .n n l nXN h x xε = − −
Assim ( ) ( ) 6 43 1196 940 2Xε ε= − − ⇔ = , e como o inicio da classe é:
:
2
940 939
2 2l n
x
ε
− = − = .
Assim as classes a considerar são:
] ] ] ] ] ]939 ; 982 , 982 ; 1025 , 1025 ; 1068 ,
] ] ] ] ] ] 1068 ; 1111 , 1111 ; 1154 e 1154 ; 1197 .
ix in iN if iF
] ]939 ; 982 5 5 0,10 0,10
] ] 982 ; 1025 11 16 0,23 0,33
] ] 1025 ; 1068 8 24 0,17 0,50
] ] 1068 ; 1111 13 37 0,27 0,77
] ] 1111 ; 1154 7 44 0,15 0,92
] ] 1154 ; 1197 7 48 0,08 1
n = 48
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 74/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Na 1º figura do exercício é o gráfico dos dados.
Na 2º figura do exercício confirma se que o gráfico é assimétrico.
Exercício – 4: Os dados seguintes indicam a largura, em mm, do siso superior
direito de 78 indivíduos:
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M)
e os quartos (F).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 75/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução - 4: Sendo na dimensão da amostra, vamos usar um número de caules N
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 78 1 = 7N ≈ +� �� � .
Aqui é necessário tomar se uma decisão, pois os números são composto pela parte
inteira e fraccionaria. Como nas folha só se pode ter um algarismo, vai se “truncar”
(apagar) a parte inteira. Mas este “truncagem” só se realiza na arrumação dos
dados, pois nos cálculos é necessário respeitar o número com completo.
Aqui vou utilizar o formato do tipo 1/5. Consiste em agrupar as dezenas (10
números) em apenas 5. Usa se a terminologia inglesa para os números.
Porque não utilizar o tipo de formato do exemplo 3? Pois teria poucos caules (dois)
e o ideal seria ( )2log 78 1 = 7N ≈ +� �� � , logo tive que ir a procura de outro tipo de
forma. O que se encaixa nesta tabela é então a de 1/5.
T – Two e Tree; F – Four e Five; S – Six e Seven.
L – Lower para os números zero e um, e U – Upper para os números oito e nove.
Folhas não ordenadas:
Diagrama final:
Assim sendo: o 1º da 2ª linha valor 5F || 4 representa 1 25x10 4x10 0,54− −+ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 76/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
A outra informação que é necessária acrescentar a tabela. É o valor acumulado,
tanto de cima para baixo, com de baixo para cima. A ter se em conta que a linha
onde se encontra a ( )prof M fica entre parênteses.
Como ( ) 78 1 39,5.
2
prof M
+
= =
Agora vou determinar a mediana (M) e os quartos (F):
1º passo, determinar a dimensão da amostra. 78n = .
2º passo, determinar a profundidade da mediana. ( ) 1 78 1 39,5
2 2
n
prof M
+ +
= = = .
3º passo, determinar a mediana.
( )
39 40 0,60 0,61 0,605
2 2prof M
x x
M x
+ +
= = = = .
4º passo, determinar a profundidade do quarto.
( )
( ) 1 39,5 1 39 1
20
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = .
5º passo, determinar o 1º LF e ultimo UF quarto.
20 0,57.LF x= =
'20 0,64.UF x= = Cuidado com este. Lê se da direita para a esquerda, e na 5ª
fila.
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 0,64 0,57 0,07U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 0,57 1,5 0,07 0, 465LF dF = − =−
Barreiras de Outliers Superior - X X 1,5 0,64 1,5 0,07 0,745UF dF = + =+
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 77/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (0,745): 0
Dados inferior a barreira inferior (0,465): 0
Posso concluir que não existe Outliers.
Agora Diagrama Caixa com Bigodes:
Caixa com 5 letras resumo:
Conclusão: os primeiros 25% estão compreendidos entre os números 0,52 e 0,57,
assim como os últimos 25% estão compreendidos entre os 0,64 e os 0,69. As
dispersões são uniformes, tanto para a esquerda como para a direita. Não tem
Outliers.
Construção de Histogramas/Barras - Regra de Sturges
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 78/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Assim, ( )log 2 78 1 = 7N ≈ +� �� � (já visto anteriormente).
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
: : 0,69 0,52* * * 0,0243
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar h = 0,025.
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é
dado por
( ) ( ): : .n n l nXN h x xε = − −
Assim ( ) ( ) 7 0,025 0,69 0,52 0,005Xε ε= − − ⇔ = , e como o inicio da classe é:
:
0,005
0,52 0,518
2 2l n
x
ε
− = − = .
Assim as classes a considerar são:
] ] ] ] ] ] ] ]0,518 ; 0,543 , 0,543 ; 0,568 , 0,568 ; 0,593 , 0,593 ; 0,618 ,
] ] ] ] ] ] 0,618 ; 0,643 , 0,643 ; 0,668 e 0,668 ; 0,693 .
ix in iN if iF
] ]0,518 ; 0,543 8 8 0,10 0,10
] ] 0,543 ; 0,568 9 17 0,12 0,22
] ] 0,568 ; 0,593 18 35 0,23 0,45
] ] 0,593 ; 0,618 10 45 0,13 0,58
] ] 0,618 ; 0,643 15 60 0,19 0,78
] ] 0,643 ; 0,668 7 67 0,09 0,87] ] 0,668 ; 0,693 10 77 0,13 1
n = 77
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 79/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Na 1º figura do exercício é o gráfico dos dados.
Na 2º figura do exercício confirma se que o gráfico é assimétrico.
Exercício – 5: Os dados seguintes indicam a Fosfoquinase de creatina (U/Litro) em
54 adultos de sexo masculino.
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M)
e os quartos (F).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 80/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução - 5: Sendo na dimensão da amostra, vamos usar um número de caules N
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 54 1 = 6N ≈ +� �� � .
Arrumados os tabela fica:
Folhas não ordenadas:
2154; x 10
2
Agora vou determinar a mediana (M) e os quartos (F):
1º passo, determinar a dimensão da amostra. 54n = .
2º passo, determinar a profundidade da mediana. ( ) 1 54 1 27,5
2 2
n
prof M
+ +
= = = .
3º passo, determinar a mediana.
( )
27 28 87 87 87
2 2prof M
x x
M x
+ +
= = = = .
4º passo, determinar a profundidade do quarto.
( )
( ) 1 27,5 1 27 1
14
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = .
5º passo, determinar o 1º LF e ultimo UF quarto.
14 67.LF x= =
'
14 113.UF x= =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 113 67 46U LdF F F= − = − = .
Barreiras de Outliers Inferior - X 1,5 67 69 2LF dF = − = −−
Barreiras de Outliers Superior - X 1,5 113 69 182UF dF = + =+
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 81/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (182): 204 e 207.
Dados inferior a barreira inferior (-2): 0
Agora Diagrama Caixa com Bigodes:
De notar que os Outliers não estão na caixa do diagrama. O último mas abaixo da
barreira superior (abaixo do numero 182).
Caixa com 5 letras resumo:
Conclusão: os primeiros 25% estão compreendidos entre os números 27 a 67, assim
como os últimos 25% estão compreendidos entre os 113 a 176. As dispersões nota
se mais a direita. Tem 2 Outliers moderados a direita, que são o 204 e 207.
Exercício – 6: Os dados seguintes indicam o número de dendritos em células
cerebrais de porcos da Índia.
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M)
e os quartos (F).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 82/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução - 6: Sendo na dimensão da amostra, vamos usar um número de caules N
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 64 1 = 7N ≈ +� �� � .
Arrumados os tabela fica:
Folhas ordenadas:
164; 1 x 10
Agora vou determinar a mediana (M) e os quartos (F):
1º passo, determinar a dimensão da amostra. 64n = .
2º passo, determinar a profundidade da mediana. ( ) 1 64 1 32,5
2 2
n
prof M
+ +
= = = .
3º passo, determinar a mediana.
( )
32 33 31 32 31,5
2 2prof M
x x
M x
+ +
= = = = .
4º passo, determinar a profundidade do quarto.
( )
( ) 1 32,5 1 32 1
16,5
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = .
5º passo, determinar o 1º LF e ultimo UF quarto.
16 17
14 15
14,5.
2 2L
x x
F
+ +
= = =
' '
16 17 44 43 43,5.
2 2U
x x
F
+ +
= = =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 83/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 43,5 14,5 29U LdF F F= − = − = .
Barreiras de Outliers Inferior - X 1,5 14,5 43,5 29LF dF = − = −−
Barreiras de Outliers Superior - X 1,5 43,5 43,5 87UF dF = + =+
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (87): 0.
Dados inferior a barreira inferior (-29): 0.
Agora Diagrama Caixa com Bigodes:
De notar que os Outliers não estão na caixa do diagrama. O último mas abaixo da
barreira superior (abaixo do numero 182).
Caixa com 5 letras resumo:
Conclusão: os primeiros 25% estão compreendidos entre os números 0 e 14,5,
assim como os últimos 25% estão compreendidos entre os 43,5 e 50. As dispersões
nota se mais (ligeiramente) a esquerda. Não tem Outliers.
Construção de Histogramas/Barras - Regra de Sturges
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 84/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Assim, ( )2log 64 1 = 7N ≈ +� �� � (já visto anteriormente).
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
: : 50 0* * * 7,14
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar h = 7,2.
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é
dado por
( ) ( ): : .n n l nXN h x xε = − −
Assim ( ) ( ) 7 7, 2 50 0 0,4Xε ε= − − ⇔ = , e como o inicio da classe é:
:
0,4
0 0, 2
2 2l n
x
ε
− = − = − .
Assim as classes a considerar são:
] ] ] ] ] ] ] ]0, 2 ; 7,0 , 7,0 ; 14,2 , 14,2 ; 21,4 , 21, 4 ; 28,6 , −
] ] ] ] ] ] 28,6 ; 35,8 , 35,8 ; 43,0 e 43,0 ; 50,2 .
ix in iN if iF
] ]0, 2 ; 7,0− 5 5 0,08 0,08
] ] 7,0 ; 14, 2 11 16 0,17 0,25
] ] 14,2 ; 21,4 7 23 0,11 0,36
] ] 21, 4 ; 28,6 5 28 0,08 0,44
] ] 28,6 ; 35,8 9 37 0,14 0,58
] ] 35,8 ; 43,0 11 48 0,17 0,75
] ] 43,0 ; 50,2 16 64 0,25 1
n = 64
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 85/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Na 1º figura do exercício é o gráfico dos dados.
Na 2º figura do exercício confirma se que o gráfico é assimétrico.
Exercício – 7: Os dados seguintes indicam o número de escaravelhos em 144
círculos de um campo de trigo.
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M)
e os quartos (F).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 86/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução - 7: Sendo na dimensão da amostra, vamos usar um número de caules N
tãopróximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 144 1 = 8N ≈ +� �� � .
Arrumados os tabela fica:
Folhas não ordenadas:
11144; x 10
2
Mas também poderia ser 1
1
144; x 10
5
, pois distam a mesma distância:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 87/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou determinar a mediana (M) e os quartos (F):
1º passo, determinar a dimensão da amostra. 144n = .
2º passo, determinar a profundidade da mediana. ( ) 1 144 1 72,5
2 2
n
prof M
+ +
= = = .
3º passo, determinar a mediana.
( )
72 73 9 9 9
2 2prof M
x x
M x
+ +
= = = = .
4º passo, determinar a profundidade do quarto.
( )
( ) 1 72,5 1 72 1
36,5
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = .
5º passo, determinar o 1º LF e ultimo UF quarto.
36 37
5 5
5.
2 2L
x x
F
+ +
= = =
' '
36 37 15 15 15.
2 2U
x x
F
+ +
= = =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 15 5 10U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 5 1,5 10 10LF dF = − = −−
Barreiras de Outliers Superior - X X 1,5 15 1,5 10 30UF dF+ = + =
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (30): 0
Dados inferior a barreira inferior (-10): 0
Posso concluir que não existe Outliers.
Agora Diagrama Caixa com Bigodes:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 88/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Caixa com 5 letras resumo:
Conclusão: os primeiros 25% estão compreendidos entre os números 0 e 5, assim
como os últimos 25% estão compreendidos entre os 15 e 20. As dispersões são
uniformes. Pode se afirmar que existe uma simetria quase perfeita. Não tem
Outliers.
Construção de Histogramas/Barras - Regra de Sturges
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
Assim, ( )2log 144 1 = 8N ≈ +� �� � (já visto anteriormente).
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
: : 20 0* * * 2,5
8
n n l nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar h = 2,5.
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é
dado por
( ) ( ): : .n n l nXN h x xε = − −
Assim ( ) ( ) 8 2,5 20 0 0Xε ε= − − ⇔ = , e como o inicio da classe é:
:
0
0 0
2 2l n
x
ε
− = − = .
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 89/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Assim as classes a considerar são:
] ] ] ] ] ] ] ]0,0 ; 2,5 , 2,5 ; 5,0 , 5,0 ; 7,5 , 7,5 ; 10,0 ,
] ] ] ] ] ] ] ] 10,0 ; 12,5 , 12,5 ; 15,0 , 15,0 ; 17,5 e 17,5 ; 20,0 .
ix in iN if iF
] ]0,0 ; 2,5 17 17 0,12 0,12
] ] 2,5 ; 5,0 23 40 0,16 0,28
] ] 5,0 ; 7,5 17 57 0,12 0,4
] ] 7,5 ; 10,0 27 84 0,19 0,58
] ] 10,0 ; 12,5 6 90 0,04 0,63
] ] 12,5 ; 15,0 22 112 0,15 0,78
] ] 15,0 ; 17,5 18 130 0,13 0,9
] ] 17,5 ; 20,0 14 144 0,1 1
n = 144
Na 1º figura do exercício é o gráfico dos dados.
Na 2º figura do exercício confirma se que o gráfico é assimétrico.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 90/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Exercício – 8: Os dados seguintes indicam a duração (em minutos) das canções
nupciais de grilos.
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M)
e os quartos (F).
Resolução - 8: Sendo na dimensão da amostra, vamos usar um número de caules N
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 80 1 = 7N ≈ +� �� � .
Arrumados os tabela fica:
080; 1 x 10
Neste gráfico, e sem precisar de fazer cálculos, rapidamente detecto que o dado
11,41 é um Outliers Severo.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 91/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou determinar a mediana (M) e os quartos (F):
1º passo, determinar a dimensão da amostra. 80n = .
2º passo, determinar a profundidade da mediana. ( ) 1 80 1 40,5
2 2
n
prof M
+ +
= = = .
3º passo, determinar a mediana.
( )
40 41 1,64 1,67 1,655
2 2prof M
x x
M x
+ +
= = = = .
4º passo, determinar a profundidade do quarto.
( )
( ) 1 40,5 1 40 1
20,5
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = .
5º passo, determinar o 1º LF e ultimo UF quarto.
20 21
1,24 1,25
1, 245.
2 2L
x x
F
+ +
= = =
' '
20 21 2,31 2, 24 2, 275.
2 2U
x x
F
+ +
= = =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 2, 275 1, 245 1,03U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 1, 245 1,5 1,03 0,30LF dF = − = −−
Barreiras de Outliers Superior - X X 1,5 2,275 1,5 1,03 3,82UF dF+ = + =
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (3,82): 3,95 ; 3,95 ; 4,16 ; 4,23 ; 4,26 ; 5,31 ;
6,01 ; 11,41. Ou seja, existem 8 Outliers.
Dados inferior a barreira inferior (-0,30): 0
Vou verificar se existem Outliers Severos (só vou a procura do lado direito):
Barreiras de Outliers Severo Superior - X X 1,5 2, 275 3 1,03 5,37UF dF =+ + =
Dados superior a barreira superior (5,37): 6,01 ; 11,41. Ou seja, existem 3
Outliers Severos.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 92/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora Diagrama Caixa com Bigodes:
Este diagrama com bigodes tem algumas particularidades:
1º o ultimo dado não é o dado 11,41, mas sim o dado 3,53, pois é o dado
imediatamente abaixo do Outlier moderado (3,82).
2º a representação dos dados Outliers Moderados é feita com uma cruz (aqui
a verde, mas a cor não interessa, é só para ajudar a visualizar melhor).
3º a representação dos dados Outliers Severo é feita com um circulo (aqui a
vermelho, mas a cor não interessa, é só para ajudar a visualizar melhor).
4º a recta das abcissas está interrompida, pois senão ficaria um gráfico
demasiado comprido.
Caixa com 5 letras resumo:
Conclusão: os primeiros 25% estão compreendidos entre os números 1,02 e 1,25,
assim como os últimos 25% estão compreendidos entre os 2,28 e 3,53.
As dispersões acontecem mais a direita.
Tem 6 Outliers Moderados (3,95;4,16;4,23;4,26;5,31) e 2 Severos (6,01;11,41).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 93/305
Sugestões: jrvalente@netmadeira.comProbabilidades e Estatística
Construção de Histogramas/Barras - Regra de Sturges
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
Assim, ( )2log 80 1 = 7N ≈ +� �� � (já visto anteriormente).
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
: : 3,53 1,02* * * 0,358
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar h = 0,36.
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é
dado por
( ) ( ): : .n n l nXN h x xε = − −
Assim ( ) ( ) 7 0,36 3,53 1,02 0,01Xε ε= − − ⇔ = , e como o inicio da classe é:
:
0,01
1,02 1,015
2 2l n
x
ε
− = − = .
Assim as classes a considerar são:
] ] ] ] ] ] ] ]1,015 ; 1,375 , 1,375 ; 1,735 , 1,735 ; 2,095 , 2,095 ; 2,455 ,
] ] ] ] ] ] 2,455 ; 2,815 , 2,815 ; 3,175 e 3,175 ; 3,535 .
ix in iN if iF
] ]1,015 ; 1,375 26 26 0,36 0,36
] ] 1,375 ; 1,735 16 42 0,22 0,58
] ] 1,735 ; 2,095 9 51 0,13 0,71
] ] 2,095 ; 2,455 11 62 0,15 0,86
] ] 2, 455 ; 2,815 7 69 0,10 0,96
] ] 2,815 ; 3,175 0 69 0,00 0,96
] ] 3,175 ; 3,535 3 72 0,04 1
n = 72
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 94/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Na 1º figura do exercício é o gráfico dos dados.
Na 2º figura do exercício confirma se que o gráfico é assimétrico.
Exercício – 9: Os dados seguintes indicam a aminotransferase de alanina (U/Litros)
em voluntários adultos.
Construa o diagrama caule e folhas para esta amostra, e determinar a mediana (M)
e os quartos (F).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 95/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução - 9: Sendo na dimensão da amostra, vamos usar um número de caules N
tão próximo quanto possível de ( )2log 1 n +� �� � , isto é, ( )2log 77 1 = 7N ≈ +� �� � .
Arrumados os tabela fica:
177; 1 x 10
Agora vou determinar a mediana (M) e os quartos (F):
1º passo, determinar a dimensão da amostra. 77n = .
2º passo, determinar a profundidade da mediana. ( ) 1 77 1 39
2 2
n
prof M
+ +
= = = .
3º passo, determinar a mediana. ( ) 39 27prof MM x x= = = .
4º passo, determinar a profundidade do quarto.
( )
( ) 1 39 1 39 1
20
2 2 2
prof M
prof F
+� � +� � +� � � �= = = = .
5º passo, determinar o 1º LF e ultimo UF quarto.
20 20.LF x= =
'
20 37.UF x= =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 96/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Dispersão Quartal - 37 20 17U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 20 1,5 17 5,5LF dF = − = −−
Barreiras de Outliers Superior - X X 1,5 37 1,5 17 62,5UF dF = + =+
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (62,5): 0
Dados inferior a barreira inferior (-5,5): 0
Posso concluir que não existe Outliers.
Agora Diagrama Caixa com Bigodes:
Caixa com 5 letras resumo:
Conclusão: os primeiros 25% estão compreendidos entre os números 6 e 20, assim
como os últimos 25% estão compreendidos entre os 37 e 48. As dispersões são
uniformes. Não tem Outliers.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 97/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Construção de Histogramas/Barras - Regra de Sturges
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln
log 1 1.
ln 2
n
N n N
� �
= + ⇔ = +� � � �� �
� �
Assim, ( )2log 77 1 = 7N ≈ +� �� � (já visto anteriormente).
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
: : 48 6* * * 6
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar h = 6.
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é
dado por: ( ) ( ): : .n n l nXN h x xε = − −
Assim ( ) ( ) 7 6 48 6 0,0Xε ε= − − ⇔ = , e como o inicio da classe é:
:
0,0
6 6
2 2l n
x
ε
− = − = .
Assim as classes a considerar são:
[ ] ] ] ] ] ] ]6 ; 12 , 12 ; 18 , 18 ; 24 , 24 ; 30 ,
] ] ] ] ] ] 30 ; 36 , 36 ; 42 e 42 ; 48 .
ix in iN if iF
[ ]6 ; 12 6 6 0,08 0,08
] ] 12 ; 18 12 18 0,16 0,23
] ] 18 ; 24 13 31 0,17 0,4
] ] 24 ; 30 13 44 0,17 0,57
] ] 30 ; 36 13 57 0,17 0,74
] ] 36 ; 42 13 70 0,17 0,91
] ] 42 ; 48 7 77 0,09 1
n = 77
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 98/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Na 1º figura do exercício é o gráfico dos dados.
Na 2º figura do exercício confirma se que o gráfico é assimétrico.
Folha de Exercício 2 – Exercício 4 e 8
4. Considere a amostra bivariada
1 1 2 2( , ), ( , ) , ... , ( 1 , 1) , ( , ) , ( 1 , 1) , ... , ( , )i i i i i i n nx y x y x y x y x y x y− − + +
Suponha que há um erro na ordenada do par ( , )i ix y , que passa de iy a ´i i iy y y= + ∆ . Mostre
que o erro provocado por esta alteração no declive da recta dos mínimos quadrados é dado por
( )
( ) 2
´
1
i i
x
x x y
a a a
n s
− ∆
∆ = − =
−
onde a é o declive sem erro e ´a o declive com erro.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 99/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução - ´a é o declive com erro e a é o declive sem erro.
Ou seja tenho o seguinte:
Deste modo consigo calcular o “a”:
Como houve um erro, vou obter um ´a :
Nota:
( )
( )
1
1
1
n
n
−
=
−
( )
( )
1 1
2 2
1 1
( )
´
( )
1
1
(
(
( ) (
)
) )
n n
K K
n
K
n
i
K
i
K K
KKKX X X X X X
a
X X X
Y Y Y
X
n
n
Y
= =
= =
− −
= = =
−
− −
−
−
−
−� �
� �
Nota: acrescentei ( )1n − , pois preciso para chegar a igualdade pedida.
Também sei que
( )
2
21
( )
1
n
i
K
X
X X
s
n
=
−
=
−
�
( )
( )
( )
1 1 1
2
2 2
1 1
( ) ( ) ( )( ) ( ) ( )
´
1
( )
1
)
1
(
n n n
K K K
K K K
n n
X
i i
K
K K KK
K
KX X X X X X Y X X Y
a
n s
X X
n
n
Y Y
X
Y X X Y
X
= = =
= =
− − − − −
= = = =
− − −
−
−
−
− −
� � �
� �
Nota, como é bivariada, tenho que indicar que a variância diz respeito ao “x” , 2Xs .
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 100/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora tenho que me ver livre do 2º termo “
1
( )
n
K
K
X X Y
=
− −� ”. Ora as constantessaem do
somatório:
1
0!!
( )
n
K
K
Y X X
=
=
− −�
�������
O somatório é zero, pois todos os erros KX (afastamentos da media) anulam se com a media.
Assim fica:
( ) ( )
1 1
2 2
( ) ( ) ( )
´
1 1
n n
K K K K K
K K
X X
X X Y X X Y X X Y
a
n s n s
= =
− − − −
= = =
− −
� �
O somatório vai do primeiro até ao “n”, passando pelo erro.
( )
( )
( )
fEsta parcela fica do somatorio.
1
1
2 2
ra
o
( ) ( )( )
( )
´
1 1
n
n
K K
KK
K i
i i i
K i
K
K
X X
X X Y X X Y Y
X X Y
a
n s n s
=
=
≠
≠
− + − + ∆
−
= = =
− −
��
���� ���
( ) ( )
Desenvolvi!
1 1
2 2
(( ) ( ) (( ) ( )
´
))
1 1
i i
n n
K K Ki i i iK
K K
K i K
i
i
X X
X X X XX X Y X XY Y Y YY
a
n n s
X
s
X
= =
≠ ≠
+ ∆ + ∆− + − +
= =
−
− −
−
−
=
� �
����� ����
Mas deste termo “ ( ) ( )i i i iX X Y X X Y− + − ∆ ”, há uma parte que pode voltar a integrar o
somatório, que é ( )iX X− .
( ) ( ) ( )
'
1 1
2 2 2
( ) ( ) ( )
( )
´
1 1 1
a
a
n n
K K i i K K
i iK K
X X X
X X Y X X Y X X Y
X X Y
a
n s n s n s
=
=
= =
− + − ∆ −
− ∆
= = +
− − −
� �
������ �����
��� ��
Sendo assim posso fazer esta igualdade:
( ) 2
( )
´
1
i i
X
X X Y
a a
n s
− ∆
= +
−
c.q.d.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 101/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
8 - Dada uma amostra 1 2( , , .... , )nx x x , a ordem (rank) ascendente ir de uma observação ix é a
sua posição na amostra ordenada crescente (número de observações desde o mínimo até ix ), e a
ordem descendente 'ir é a sua posição na amostra ordenada decrescente (número de observações
desde ix até o máximo). Justifique que a ordem ascendente e a ordem descendente estão
relacionadas pela equação:
' 1i ir r n+ = +
Resolução:
Exemplo:
' 1i ir r n+ = +
Esquematizando:
{ }' 1 1,...,i ir r n i n∴ + = + ∀ ∈
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 102/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Frequência: 2000/01/17
Duração: 3 horas (cada grupo vale 3,5 valores).
Num estudo comparativo entre dois sistemas operativos registam-se os tempos de execução de
80 programas de simulação. Esses registos constam da tabela abaixo: X refere o tempo de
execução usando o sistema operativo I, Y o tempo de execução com o sistema operativo II,
W X Y= − .
Por comodidade fornecem-se ainda as seguintes somas:
80 80
2
1 1
2 301,4 68 634,72i i
i i
X X
= =
= ∧ =� �
80 80
2
1 1
2 483,9 80 566,37i i
i i
Y Y
= =
= ∧ =� �
80
1
71 711,43i i
i
X Y
=
=�
80 80
2
1 1
182,5 5 778,23i i
i i
W W
= =
= − ∧ =� �
Grupo I
a) Calcule as características amostrais da amostra x que lhe parecerem relevantes.
b) Desenhe a caixa com bigodes correspondente à amostra x.
c) Média, mediana e máximo são características de localização interessantes, desvio padrão e
dispersão quartal características de escala também muito comuns. Comente as qualidades e
defeitos daquelas características.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 103/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Vou 1º pôr por ordem:
Resolução a) - pequena introdução:
Quando se pede “Calcule as características amostrais…” tem se que responder a Media,
Mediana, Mínimo, Máximo, Moda, Desvio Padrão, Quartis e Outliers.
Mediana: 1
n
i
i
X
X
n
==
�
Média: ( )prof MM x=
Moda: o número mais vezes repetido (pode não haver moda), Desvio Padrão da Amostra
( )xs é diferente do Desvio Padrão da População ( ).xσ
Quartil - ( ) ( )
'
L Uprof F prof FF x F x= ∧ =
Assim:
80
1 1 2301,4 28,7675
80 80
n
i i
i i
X X
X X X X
n
= == ⇔ = ⇔ = ⇔ =
� �
( )
40 41 26,7 26,8 26,75
2 2prof M
x x
M x M M M
+ +
= ⇔ = ⇔ = ⇔ =
Variância:
( )
2
22 2 2
1 1
1 1 1 1
68 634,72 2 301,4
1 80 1 80
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
� � �− − � �� �� �� �
� �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 104/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
[ ] ( )2 2 21 168 634,72 66 205,53 2 429,2 30,75
79 79X X X
s s s⇔ = − ⇔ = ⇔ =
Desvio Padrão:
2 30,75 5,5X X X Xs s s s= ⇔ = ⇔ =
Quartis:
( )
20 21 25,0 25,1 25,05
2 2L L L Lprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
( )
' '
' 20 21 30,4 31,2 30,8
2 2U U U Uprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 30,8 25,05 5,75U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 25,05 1,5 5,75 16, 425LF dF = − =−
Barreiras de Outliers Superior - X X 1,5 30,8 1,5 5,75 39,425UF dF = + =+
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (39,425): 4 (43,2 ; 45,9 ; 47,8 ; 48,3)
Dados inferior a barreira inferior (16,425): 0
Vou verificar se existem Outliers Severos (só vou a procura do lado direito):
Barreiras de Outliers Severo Superior - X X 3 30,8 3 5,75 48,05UF dF = + =+
Dados superior a barreira superior (48,05): 48,3. Ou seja, existem 1 Outliers
Severos.
Resolução b) - Diagrama Caixa com Bigodes:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 105/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Este diagrama com bigodes tem algumas particularidades:
1º o dado máximo não é o 48,3, mas sim o dado 38,8, pois é o dado
imediatamente abaixo do Outlier moderado (43,2).
2º a representação dos dados Outliers Moderados é feita com uma cruz (aqui
a verde, mas a cor não interessa, é só para ajudar a visualizar melhor).
3º a representação dos dados Outliers Severo é feita com um circulo (aqui a
vermelho, mas a cor não interessa, é só para ajudar a visualizar melhor).
Não é pedido, para por uma questão de praticar exercícios vou fazer Caixa com 5
letras resumo:
Conclusão: os primeiros 25% estão compreendidos entre os números 23,3 e 25,1,
assim como os últimos 25% estão compreendidos entre os 30,8 e 38,8.
As dispersões acontecem mais a direita.
Tem 3 Outliers Moderados (43,2;45,9;38,8) e 1 Severos (48,3).
A Media e o Desvio Padrão (medidas de localização) são eficiente, mas pouco
resistentes (sensíveis aos outliers), pois se não considerássemos os outliers, o valor
da Media seria mais correcto e com um valor mais baixo.
A Mediana e a dispersão Quartal (são medidas de dispersão), são resistentes, mas
menos eficiente (dão nos pouca informação).
Nota: o número máximo e mínimo são pouco informativos sobre a amostra global
(nada eficiente), por isso não se devem de utilizar estes dois dados para chegar a
conclusões.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 106/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou fazer para a variável “y”, que nãoé pedido no exercício.
Assim:
80
1 1 2483,9 31,0375
80 80
n
i i
i i
Y Y
Y Y Y Y
n
= == ⇔ = ⇔ = ⇔ =
� �
( )
40 41 29,5 29,5 29,5
2 2prof M
y y
M y M M M
+ +
= ⇔ = ⇔ = ⇔ =
Variância:
( )
2
22 2 2
1 1
1 1 1 1
80 566,37 2 483,9
1 80 1 80
n n
Y i i Y
i i
s Y Y s
n n= =
� �� � � �= − ⇔ = −� �
� � �− − � �� �� �� �
� �
[ ] ( )2 2 21 180 566,37 77 121,99 3 444,38 43,60
79 79Y Y Y
s s s⇔ = − ⇔ = ⇔ =
Desvio Padrão:
2 43,60 6,6Y Y Y Ys s s s= ⇔ = ⇔ =
Quartis:
( )
20 21 26,2 26,4 26,3
2 2L L L Lprof F
y y
F y F F F
+ +
= ⇔ = ⇔ = ⇔ =
( )
' '
' 20 21 35,0 33,3 34,15
2 2U U U Uprof F
y y
F y F F F
+ +
= ⇔ = ⇔ = ⇔ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 107/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 34,15 26,3 7,85U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 26,3 1,5 7,85 14,525LF dF = − =−
Barreiras de Outliers Superior - X X 1,5 34,15 1,5 7,85 45,925UF dF = + =+
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (45,925): 3 (48,4 ; 50,6 ; 58,7)
Dados inferior a barreira inferior (14,525): 0
Vou verificar se existem Outliers Severos (só vou a procura do lado direito):
Barreiras de Outliers Severo Superior - X X 3 34,15 3 7,85 57,7UF dF =+ + =
Dados superior a barreira superior (57,7): 58,7. Ou seja, existem 1 Outliers
Severos.
Resolução b) - Diagrama Caixa com Bigodes:
Este diagrama com bigodes tem algumas particularidades:
1º o dado máximo não é o 48,3, mas sim o dado 38,8, pois é o dado
imediatamente abaixo do Outlier moderado (43,2).
2º a representação dos dados Outliers Moderados é feita com uma cruz (aqui
a verde, mas a cor não interessa, é só para ajudar a visualizar melhor).
3º a representação dos dados Outliers Severo é feita com um circulo (aqui a
vermelho, mas a cor não interessa, é só para ajudar a visualizar melhor).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 108/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Não é pedido, para por uma questão de praticar exercícios vou fazer Caixa com 5
letras resumo:
Conclusão: os primeiros 25% estão compreendidos entre os números 24,4 e 26,3,
assim como os últimos 25% estão compreendidos entre os 34,15 e 45,3.
As dispersões acontecem mais a direita.
Tem 2 Outliers Moderados (48,4 e o 50,6) e 1 Severos (58,7).
A Media e o Desvio Padrão (medidas de localização) são eficiente, mas pouco
resistentes (sensíveis aos outliers), pois se não considerássemos os outliers, o valor
da Media seria mais correcto e com um valor mais baixo.
A Mediana e a dispersão Quartal (são medidas de dispersão), são resistentes, mas
menos eficiente (dão nos pouca informação).
Nota: o número máximo e mínimo são pouco informativos sobre a amostra global
(nada eficiente), por isso não se devem de utilizar estes dois dados para chegar a
conclusões.
Agora vou fazer para a variável “W”, que também não é pedido no exercício.
Assim:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 109/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
80
1 1 182,5 2, 2813
80 80
n
i i
i i
W W
W W W W
n
= = −= ⇔ = ⇔ = ⇔ = −
� �
( )
40 41 1,7 1,6 1,65
2 2prof M
w w
M w M M M
+ − −
= ⇔ = ⇔ = ⇔ = −
Variância:
( )
2
22 2 2
1 1
1 1 1 1
5 778, 23 182,5
1 80 1 80
n n
W i i W
i i
s W W s
n n= =
� �� � � �= − ⇔ = − −� �
� � �− − � �� �� �� �
� �
( )2 2 21 1 15 778, 23 .33 306,25 5 361,9 67,87
79 80 79W W W
s s s� �⇔ = − ⇔ = ⇔ =� �� �
Desvio Padrão:
2 67,87 8,24W W W Ws s s s= ⇔ = ⇔ =
Quartis:
( )
20 21 5,6 4,7 5,15
2 2L L L Lprof F
w w
F w F F F
+ − −
= ⇔ = ⇔ = ⇔ = −
( )
' '
' 20 21 1,9 1,8 1,85
2 2U U U Uprof F
w w
F w F F F
+ +
= ⇔ = ⇔ = ⇔ =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 1,85 5,15 7U LdF F F= − = + = .
Barreiras de Outliers Inferior - X X 1,5 5,15 1,5 7 15,65LF dF = −− = − −
Barreiras de Outliers Superior - X X 1,5 1,85 1,5 7 12,35UF dF =+ = +
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (12,35): 4 (13,3 ; 14,7 ; 15,2 ; 19,6)
Dados inferior a barreira inferior (-15,65): 4 (-32,9 ; -22,7 ; -18,7 ; -17,0)
Vou verificar se existem Outliers Severos:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 110/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Barreiras de Outliers Severo Superior - X X 3 1,85 3 7 38,85UF dF+ = + =
Barreiras de Outliers Severo Inferior - X X 3 5,15 3 7 26,15UF dF− = − + = −
Dados superior a barreira superior (38,85): 0
Dados superior a barreira superior (-26,15): -32,9. Ou seja, existem 1 Outliers
Severos Inferior.
Resolução b) - Diagrama Caixa com Bigodes:
Este diagrama com bigodes tem algumas particularidades:
1º o dado máximo não é o 19,6, mas sim o dado 11,3, pois é o dado
imediatamente abaixo do Outlier moderado (13,3).
2º o dado mínimo não é o -32,9, mas sim o dado -15,6, pois é o dado
imediatamente abaixo do Outlier moderado (-17,0).
3º a representação dos dados Outliers Moderados é feita com uma cruz (aqui
a verde, mas a cor não interessa, é só para ajudar a visualizar melhor).
Não é pedido, para por uma questão de praticar exercícios vou fazer Caixa com 5
letras resumo (note se que o tempo é negativo por ser uma diferença):
Conclusão: os primeiros 25% estão compreendidos entre os números -15,6 e -5,15,
assim como os últimos 25% estão compreendidos entre os 1,85 e 11,3.
As dispersões acontecem mais a direita.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 111/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Tem 8 Outliers Moderados (a esquerda: -32,9 ; -22,7 ; -18,9 ; -17,0 e a direita:
13,3 ; 14,7 ; 15,2 ; 19,6).
A Media e o Desvio Padrão (medidas de localização) são eficiente, mas pouco
resistentes (sensíveis aos outliers), pois se não considerássemos os outliers, o valor
da Media seria mais correcto e com um valor mais baixo.
A Mediana e a dispersão Quartal (são medidas de dispersão), são resistentes, mas
menos eficiente (dão nos pouca informação).
Nota: o número máximo e mínimo são pouco informativos sobre a amostra global
(nada eficiente), por isso não se devem de utilizar estes dois dados para chegar a
conclusões.
Grupo II
a) Construa um histograma apropriado para representar x.
b) Determine a recta dos mínimos quadrados que exprime y como função de x. Face à
correlação entre aquelas variáveis o ajustamento será bom?
Resolução GII - a) Construção de Histogramas/Barras - Regra de Sturges.
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln 80
log 80 1 1.
ln 2
N N
� �
= + ⇔ = +� � � �� �
� �
Assim, ( )2log 80 1 = 7N≈ +� �� �
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
: : 48,3 23,3* * * 3,57
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar h = 3,6.
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é
dado por: ( ) ( ): : .n n l nXN h x xε = − −
Assim ( ) ( ) 7 3,6 48,3 23,3 0,2Xε ε= − − ⇔ = , e como o inicio da classe é:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 112/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
:
0, 2
23,3 23,2
2 2l n
x
ε
− = − = .
Assim as classes a considerar são:
] ] ] ] ] ] ] ]23,2 ; 26,8 , 26,8 ; 30,4 , 30,4 ; 34,0 , 34,0 ; 37,6 ,
] ] ] ] ] ] 37,6 ; 41,2 , 41,2 ; 44,8 e 44,8 ; 48,4 .
Classe ix in iN if iF
] ]23,2 ; 26,8 41 41 0,51 0,51
] ] 26,8 ; 30,4 19 60 0,24 0,75
] ] 30,4 ; 34,0 10 70 0,13 0,88
] ] 34,0 ; 37,6 2 72 0,03 0,9
] ] 37,6 ; 41,2 4 76 0,05 0,95
] ] 41,2 ; 44,8 1 77 0,01 0,96
] ] 44,8 ; 48,4 3 80 0,04 1
n = 80
Histograma do “X”
Tem uma assimetria direita prenunciada (evidente, e basta analisar os Outliers).
Assim não é de esperar que os dados analisados não sejam Gausianos (ou seja,
estes dados não foram dados numa distribuição Gausianos), e que não faz sentido
usar a regra do desvio padrão para a elaboração do gráfico. Usa se por isso a regra
de Struges.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 113/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou fazer para a variável “y”, que não é pedido no exercício.
Resolução GII - a) Construção de Histogramas/Barras - Regra de Sturges
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )
( )2 2
ln 80
log 80 1 1 log 80 1 = 7
ln 2
N N N
� �
= + ⇔ = + ⇔ ≈ +� � � �� �� � � �
� �
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
: 1: 58,7 24, 4* * * 4,9
7
n n nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar h = 5.
O limite inferior da primeira classe deverá ser 1: ,2n
x
ε
− em que ε é o excesso, e é
dado por: ( ) ( ): 1: .n n nXN h x xε = − −
Assim ( ) ( ) 7 5 58,7 24,4 0,7Xε ε= − − ⇔ = , e como o inicio da classe é:
1:
0,7
24, 4 24,1
2 2n
x
ε
− = − = .
Assim as classes a considerar são:
] ] ] ] ] ] ] ]24,1 ; 29,1 , 29,1 ; 34,1 , 34,1 ; 39,1 , 39,1 ; 44,1 ,
] ] ] ] ] ] 44,1 ; 49,1 , 49,1 ; 54,1 e 54,1 ; 59,1 .
Classe ix in iN if iF
] ]24,1 ; 29,1 39 39 0,49 0,49
] ] 29,1 ; 34,1 21 60 0,26 0,75
] ] 34,1 ; 39,1 11 71 0,14 0,89
] ] 39,1 ; 44,1 5 76 0,06 0,95
] ] 44,1 ; 49,1 2 78 0,03 0,98
] ] 49,1 ; 54,1 1 79 0,01 0,99
] ] 54,1 ; 59,1 1 80 0,01 1
n = 80
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 114/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Histograma do “Y”
Tem uma assimetria direita prenunciada (evidente, e basta analisar os Outliers).
Assim não é de esperar que os dados analisados sejam Gausianos (ou seja, estes
dados não foram dados numa distribuição Gausianos), e que não faz sentido usar a
regra do desvio padrão para a elaboração do gráfico. Usa se por isso a regra de
Struges.
Agora vou fazer para a variável “w”, que também não é pedido no exercício.
Resolução GII - a) Construção de Histogramas/Barras - Regra de Sturges
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln 80
log 80 1 1.
ln 2
N N
� �
= + ⇔ = +� � � �� �
� �
Assim, ( )2log 80 1 = 7N ≈ +� �� �
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
: 1: 32,9 19,6* * * 7,5
7
n n nx xh h h
N
− − −
= ⇔ = ⇔ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 115/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Logo posso considerar h = 8.
O limite inferior da primeira classe deverá ser 1: ,2n
x
ε
− em que ε é o excesso, e é
dado por: ( ) ( ): 1: .n n nXN h x xε = − −
Assim ( ) ( ) 7 8 32,9 19,6 3,5Xε ε= − − − ⇔ = , e como o inicio da classe é:
1:
3,5
32,9 34,6
2 2n
x
ε
− = − − = − .
Assim as classes a considerar são:
] ] ] ] ] ] ] ]34,6 ; -26,6 , 26,6 ; 18,6 , 18,6 ; -10,6 , -10,6 ; 2,6 , − − − − −
] ] ] ] ] ] 2,6 ; 5, 4 , 5,4 ; 13,4 e 13,4 ; 21,4 − .
Classe ix in iN if iF
] ]34,6 ; -26,6− 1 1 0,01 0,01
] ] 26,6 ; 18,6 − − 2 3 0,03 0,04
] ] 18,6 ; -10,6 − 10 13 0,13 0,16
] ] -10,6 ; 2,6 − 25 38 0,31 0,48
] ] 2,6 ; 5, 4 − 33 71 0,41 0,89
] ] 5, 4 ; 13,4 6 77 0,08 0,96
] ] 13,4 ; 21,4 3 80 0,04 1
n = 80
Histograma do “W”.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 116/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Tem uma assimetria a direita e a esquerda (tem Outliers de ambos os lados). Assim
não é de esperar que os dados analisados sejam Gausianos (ou seja, estes dados não
foram dados numa distribuição Gausianos), e que não faz sentido usar a regra do
desvio padrão para a elaboração do gráfico. Usa se por isso a regra de Struges.
Resolução GII - b) recordar os valores dados:
80 80
2
1 1
2 301,4 68 634,72i i
i i
X X
= =
= ∧ =� �
80 80
2
1 1
2 483,9 80 566,37i i
i i
Y Y
= =
= ∧ =� �
80
1
71 711,43i i
i
X Y
=
=�
Assim o que é pedido, é se é possível prever “Y” a partir de “X”, através da relação linear.
� �Y aX b= +
Vou recordar teoria - Coeficiente de Correlação Linear: O coeficiente de correlação linear é
uma medida do grau de associação entre variáveis. Esta medida toma valores entre -1 e 1.
Quando se mede a correlação entre variáveis, 1 significa uma relação linear perfeita e positiva,
enquanto -1 é também uma relação linear perfeita mas negativa. Valores próximos do zero
para o coeficiente de correlação linear indicam uma associação linear pobre entre variáveis.
O coeficiente de correlação amostraI de Pearson r da amostra bivariada ( ){ }
1
;
n
i i i
x y
=
é:
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
�
�
� � � �� � � �� � � �
� � �
� � � �
Teorema Recta dos Mínimos Quadrados (RMQ): Se os pontos da amostra bivariada
( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a recta dos mínimos quadrados que modela essa
relação é � �Y aX b= + , com:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 117/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
Assim no exercício faz-se:
( ) ( )( )
( ) ( )2
80. 71 711,43 2 301, 4 . 2 483,9
0,10531748
80. 68 634,72 2 301, 4
a a
−
= ⇔ =
−
( ) ( ) ( ) ( )
( ) ( )2
68 634,72 . 22 860 2 483,9 . 71 711,43
28,0190293
80. 68 634,72 2 301, 4
b b
−
= ⇔ =
−
� � ( ) ( )0,10531748 28,0190293Y aX b Y X= + ⇔ = +
Vou então verificar a correlação linear:
80 80 80
1 1 1 1 1 1
2 2 2 280 80 80 80
2 2 2 2
1 1 1 1 1 1 1 1
80
80 80
n n n
i i i i i i i i
i i i i i i
n n n n
i i i i i i i i
i i i i i i i i
n X Y X Y X Y X Y
r r
n X X n Y Y X X Y Y
= = = = = =
= = = = = = = =
− −
= ⇔ =
� � � � � � � �� � � � � � � �
− − − −� � � � � � � �
�
�
�
�
� � � � � � � �� � � � � � � �� � � � � � � �
� � � � � �
� � � � � � � �
( ) ( ) ( )
( ) ( ) ( ) ( )2 2
80. 71 711,43 2 301,4 . 2 483,9
80. 68 634,72 2 301,4 80. 80 566,37 2 483,9
r
−
=
� � � �− −
� � � �
( )( )
5 736 914, 4 5 716 447,46
194 335,64 275 550,39
r
−
=
0,08844558r =
Tendo obtido um 0,08844558r = , posso concluir que não existe uma correlação entre as
variáveis, pois o seu coeficiente está muito próximo do zero (o ajustamento não é bom).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 118/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Frequência: 2000/01/26
Responda a 5 das seguintes 6 perguntas:
Exercício 1 - Num estudo sobre o dimensionamento de urgências hospitalares registou-se o
tempo X durante o qual 80 doentes, escolhidos ao acaso (isto é, amostragem aleatória simples
sem reposição) estiveram na sala de cuidados intensivos (tempo medido em horas). Por outro
lado registou-se também o preço Y que cada um desses doentes custou ao orçamento
hospitalar. Para sua comodidade, a amostra X está já ordenada, e sabe-se que:
80 80
2
1 1
73,66 88,146i i
i i
X X
= =
= ∧ =� �
80 80
2
1 1
1 475,72 27 367,7456i i
i i
Y Y
= =
= ∧ =� �
80
1
1 406,6846i i
i
X Y
=
=�
X Y X Y X Y X Y
0,43 18,44 0,57 17,95 0,76 17,74 1,09 18,16
0,43 18,44 0,58 17,94 0,78 17,74 1,12 18,23
0,45 18,34 0,60 17,88 0,78 17,74 1,17 18,36
0,46 18,30 0,60 17,89 0,81 17,75 1,18 18,38
0,47 18,28 0,60 17,88 0,82 17,75 1,18 18,39
0,47 18,27 0,61 17,87 0,88 17,80 1,19 18,42
0,47 18,28 0,62 17,84 0,88 17,80 1,28 18,66
0,48 18,24 0,62 17,85 0,88 17,81 1,35 18,89
0,49 18,18 0,62 17,85 0,89 17,81 1,39 19,02
0,50 18,16 0,64 17,82 0,90 17,83 1,44 19,20
0,50 18,14 0,65 17,81 0,92 17,85 1,48 19,32
0,51 18,12 0,65 17,80 0,94 17,88 1,60 19,75
0,51 18,14 0,69 17,77 0,95 17,89 1,61 19,78
0,52 18,08 0,70 17,76 0,96 17,91 1,64 19,88
0,53 18,04 0,72 17,75 0,99 17,96 1,65 19,94
0,54 18,03 0,73 17,75 1,01 17,99 1,78 20,42
0,55 18,00 0,73 17,74 1,03 18,04 1,95 21,11
0,55 18,00 0,74 17,74 1,07 18,11 2,18 22,06
0,56 17,97 0,74 17,74 1,08 18,14 2,52 23,46
0,56 17,96 0,75 17,74 1,08 18,14 3,31 26,83
a) Determine a média e o desvio-padrão, mediana e dispersão quartal da amostra ~.
b) Represente a caixa com bigodes correspondente à referida amostra.
c) Construa um histograma apropriado para representar a amostra.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 119/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução a) - vou arrumar pela mesma variável:
80
1 1 73,66 0,92075
80 80
n
i i
i i
X X
X X X X
n
= == ⇔ = ⇔ = ⇔ =
� �
Variância:
( )
2
22 2 2
1 1
1 1 1 1
88,146 73,66
1 80 1 80
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
� � �− − � �� �� �� �
� �
2 0, 2572601899Xs =
Desvio Padrão:
2 0,2572601899 0,507208313X X X Xs s s s= ⇔ = ⇔ =
( ) 1Média Prof 40,5
2
n
M
+
→ = =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 120/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( )
40 41 0,75 0,76 0,755
2 2prof M
x x
M x M M M
+ +
= ⇔ = ⇔ = ⇔ =
( )
( )Prof 1
Quartis Prof 20,5
2
M
Q
+� �� �→ = =
( )
20 21 0,56 0,57 0,565
2 2L L L Lprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
( )
' '
' 20 21 1,09 1,08 1,085
2 2U U U Uprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 1,085 0,565 0,52U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 0,565 1,5 0,52 0,215LF dF = − = −−
Barreiras de Outliers Superior - X X 1,5 1,085 1,5 0,52 1,865UF dF = + =+
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (1,865): 4 (1,95 ; 2,18 ; 2,52 ; 3,31)
Dados inferior a barreira inferior (-0,215): 0
Vou verificar se existem Outliers Severos (só vou a procura do lado direito):
Barreiras de Outliers Severo Superior - X X 3 1,085 3 0,52 2,645UF dF = + =+
Dados superior a barreira superior (2,645): 3,31. Ou seja, existem 1 Outliers
Severos.
Resolução b) - Diagrama Caixa com Bigodes:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 121/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Este diagrama com bigodes tem algumas particularidades:
1º o dado máximo não é o 3,31, mas sim o dado 1,78, pois é o dado
imediatamente abaixo do Outlier moderado (1,95).
2º a representação dos dados Outliers Moderados é feita com uma cruz (aqui
a verde, mas a cor não interessa, é só para ajudar a visualizar melhor).
3º a representação dos dados Outliers Severo é feita com um circulo (aqui a
vermelho, mas a cor não interessa, é só para ajudar a visualizar melhor).
Caixa com 5 letras resumo:
Conclusão: os primeiros 25% estão compreendidos entre os números 0,43 e 0,565,
assim como os últimos 25% estão compreendidos entre os 1,085 e 1,78.
As dispersões acontecem mais a direita.
Tem 3 Outliers Moderados (1,95 ; 2,18 ; 2,52) e 1 Severos (3,31).
A Media e o Desvio Padrão (medidas de localização) são eficiente, mas pouco
resistentes (sensíveis aos outliers), pois se não considerássemos os outliers, o valor
da Media seria mais correcto e com um valor mais baixo.
A Mediana e a dispersão Quartal (são medidas de dispersão), são resistentes, mas
menos eficiente (dão nos pouca informação).
Nota: o número máximo e mínimo são pouco informativos sobre a amostra global
(nada eficiente), por isso não se devem de utilizar estes dois dados para chegar a
conclusões.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 122/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução c) - Construção de Histogramas/Barras (Regra de Sturges):
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln 80
log 80 1 1.
ln 2
N N
� �
= + ⇔ = +� � � �� �
� �
Assim, ( )2log 80 1 = 7N ≈ +� �� �
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
: : 3,31 0,43* * * 0,4114
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar h = 0,42.
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é
dado por: ( ) ( ): : .n n l nXN h x xε = − −
Assim ( ) ( ) 7 0,42 3,31 0,43 0,06Xε ε= − − ⇔ = , e como o inicio da classe é:
:
0,06
0, 43 0, 4
2 2ln
x
ε
− = − = .
Assim as classes a considerar são:
] ] ] ] ] ] ] ]0,40 ; 0,82 , 0,82 ; 1, 24 , 1, 24 ; 1,66 , 1,66 ; 2,08 ,
] ] ] ] ] ] 2,08 ; 2,50 , 2,50 ; 2,92 e 2,92 ; 3,34 .
Classe ix in iN if iF
(1) ] ]0,40 ; 0,82 44 44 0,55 0,55
(2) ] ] 0,82 ; 1,24 22 66 0,28 0,83
(3) ] ] 1,24 ; 1,66 9 75 0,11 0,94
(4) ] ] 1,66 ; 2,08 2 77 0,03 0,96
(5) ] ] 2,08 ; 2,50 1 78 0,01 0,98
(6) ] ] 2,50 ; 2,92 1 79 0,01 0,99
(7) ] ] 2,92 ; 3,34 1 80 0,01 1
n = 80
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 123/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Histograma do “X”
Tem uma assimetria direita prenunciada (evidente, e basta analisar os Outliers).
Assim não é de esperar que os dados analisados não sejam Gausianos (ou seja,
estes dados não foram dados numa distribuição Gausianos), e que não faz sentido
usar a regra do desvio padrão para a elaboração do gráfico. Usa se por isso a regra
de Struges.
Resolução a) - Não é pedido, mas vou fazer também para o “Y”:
80
1 1 1475,72 18,4465
80 80
n
i i
i i
Y Y
Y Y Y Y
n
= == ⇔ = ⇔ = ⇔ =
� �
Variância:
( )
2
22 2 2
1 1
1 1 1 1
27367,7456 1475,72
1 80 1 80
n n
Y i i X
i i
s Y Y s
n n= =
� �� � � �= − ⇔ = −� �
� � �− − � �� �� �� �
� �
2 1,8465394Ys =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 124/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Desvio Padrão:
2 1,8465394 1,3588743Y Y Y Ys s s s= ⇔ = ⇔ =
Cuidado, pois a tabela do “Y” não está ordenada!!
( ) 1Média Prof 40,5
2
n
M
+
→ = =
( )
40 41 18,00 18,03 18,015
2 2prof M
x x
M x M M M
+ +
= ⇔ = ⇔ = ⇔ =
( )
( )Prof 1
Quartis Prof 20,5
2
M
Q
+� �� �→ = =
( )
20 21 17,82 17,83 17,825
2 2L L L Lprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
( )
' '
' 20 21 18,36 18,34 18,35
2 2U U U Uprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 18,35 17,825 0,525U LdF F F= − = − = .
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 125/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Barreiras de Outliers Inferior - X X 1,5 17,825 1,5 0,525 17,0375LF dF = − =−
Barreiras de Outliers Superior - X X 1,5 18,35 1,5 0,525 19,1375UF dF = + =+
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (19,1375): 12 (19,02 ; 19,20 ; 19,32 ; 19,75 ;
19,78 ; 19,88 ; 19,94 ; 20,42 ; 21,11 ; 22,06 ; 23,46 ; 26,83)
Dados inferior a barreira inferior (17,0375): 0
Vou verificar se existem Outliers Severos (só vou a procura do lado direito):
Barreiras de Outliers Severo Superior - X X 3 18,35 3 0,525 19,925UF dF = + =+
Dados superior a barreira superior (19,925): 6 (19,94 ; 20,42 ; 21,11 ; 22,06 ;
23,46 ; 26,83). Ou seja, existem 6 Outliers Severos.
Resolução b) - Diagrama Caixa com Bigodes:
Este diagrama com bigodes tem algumas particularidades:
1º o dado máximo não é o 26,83, mas sim o dado 19,02, pois é o dado
imediatamente abaixo do Outlier moderado (19,2).
2º a representação dos dados Outliers Moderados é feita com uma cruz (aqui
a verde, mas a cor não interessa, é só para ajudar a visualizar melhor).
3º a representação dos dados Outliers Severo é feita com um circulo (aqui a
vermelho, mas a cor não interessa, é só para ajudar a visualizar melhor).
Caixa com 5 letras resumo:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 126/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Conclusão: os primeiros 25% estão compreendidos entre os números 17,74 e
17,825, assim como os últimos 25% estão compreendidos entre os 18,35 e 19,02.
As dispersões acontecem mais a direita.
Tem 5 Outliers Moderados (19,2 ; 19,32 ; 19,75 ; 19,78 ; 19,88) e 6 Severos (19,94
; 20,42 ; 21,11 ; 22,06 ; 23,46 ; 26,83).
A Media e o Desvio Padrão (medidas de localização) são eficiente, mas pouco
resistentes (sensíveis aos outliers), pois se não considerássemos os outliers, o valor
da Media seria mais correcto e com um valor mais baixo.
A Mediana e a dispersão Quartal (são medidas de dispersão), são resistentes, mas
menos eficiente (dão nos pouca informação).
Nota: o número máximo e mínimo são pouco informativos sobre a amostra global
(nada eficiente), por isso não se devem de utilizar estes dois dados para chegar a
conclusões.
Resolução c) - Construção de Histogramas/Barras (Regra de Sturges):
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln 80
log 80 1 1.
ln 2
N N
� �
= + ⇔ = +� � � �� �
� �
Assim, ( )2log 80 1 = 7N ≈ +� �� �
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por:
: : 26,83 17,74* * * 1,298571429
7
n n l nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar h = 1,3.
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é
dado por: ( ) ( ): : .n n l nXN h x xε = − −
Assim ( ) ( ) 7 1,3 26,83 17,74 0,01Xε ε= − − ⇔ = , e como o inicio da classe é:
:
0,01
17,74 17,735
2 2l n
x
ε
− = − = .
Assim as classes a considerar são:
] ] ] ] ] ] ] ]17,735 ; 19,035 , 19,035 ; 20,335 , 20,335 ; 21,635 , 21,635 ; 22,935 ,
] ] ] ] ] ] 22,935 ; 24,235 , 24,235 ; 25,535 e 25,535 ; 26,835 .
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 127/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Classe ix in iN if iF
(1) ] ]17,735 ; 19,035 69 69 0,86 0,86
(2) ] ] 19,035 ; 20,335 6 75 0,08 0,94
(3) ] ] 20,335 ; 21,635 2 77 0,03 0,96
(4) ] ] 21,635 ; 22,935 1 78 0,01 0,98
(5) ] ] 22,935 ; 24,235 1 79 0,01 0,99
(6) ] ] 24,235 ; 25,535 0 79 0 0,99
(7) ] ] 25,535 ; 26,835 1 80 0,01 1
n = 80
Histograma do “Y”
Tem uma assimetria direita prenunciada (evidente, e basta analisar os Outliers).
Assim não é de esperar que os dados analisados não sejam Gausianos (ou seja,
estes dados não foram dados numa distribuição Gausianos), e que não faz sentido
usar a regra do desvio padrão para a elaboração do gráfico. Usa se por isso a regra
de Struges.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 128/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Exercício 2 - Use os dados do exercício anterior.
a) Determine o coeficiente de correlação do par (x y).
b) Determine a recta dos mínimos quadrados que se ajusta àquela nuvem de pontos.
c) O ajustamento linear parece-lhe aceitável?
Como investigaria de forma mais objectiva se a recta dos mínimos quadrados é ou não
adequada a este conjunto de pares de observações?
Resolução a) - recordar os valores dados:
80 80
2
1 1
73,66 88,146i i
i i
X X
= =
= ∧ =� �
80 80
2
1 1
1475,72 27 367,7456i i
i i
Y Y
= =
= ∧ =� �
80
1
1 406,6846i i
i
X Y
=
=�
Assim o que é pedido, é se é possível prever “Y” a partir de “X”, através da relação linear.
�Y aX b= +
Vou recordar teoria - Coeficiente de Correlação Linear: O coeficiente de correlação linear é
uma medida do grau de associação entre variáveis. Esta medida toma valores entre -1 e 1.
Quando se mede a correlação entre variáveis, 1 significa uma relação linear perfeita e positiva,
enquanto -1 é também uma relação linear perfeita mas negativa. Valores próximos do zero
para o coeficiente de correlação linear indicam uma associação linear pobre entre variáveis.
O coeficiente de correlação amostral de Pearson r da amostra bivariada ( ){ }
1
;
n
i i i
x y
=
é:
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
�
�
� � � �� � � �� � � �
� � �
� � � �
Assim:
80 80 80
1 1 1
2 280 80 80 80
2 2
1 1 1 1
80
80 80
i i i i
i i i
i i i i
i i i i
X Y X Y
r
X X Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
�
�
� � � �� � � �� � � �
� � �
� � � �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 129/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( ) ( )( )
( ) ( ) ( ) ( )2 2
80 1 406,6846 73,66 1 475,72
80 88,146 73,66 80 27 367,7456 1 475,72
r
−
=
� � � �− −
� � � �
0,87999969r =
Tendo obtido um 0,87999969r = , posso concluir que ajustamento é razoável, uma vez que o
coeficiente de correlação é relativamente próximo de 1
Resolução b) - Teorema Recta dos Mínimos Quadrados (RMQ): Se os pontos da amostra
bivariada ( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a recta dos mínimos quadrados que modela
essa relação é � �Y aX b= + , com:
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
Observação: Para calcular o coeficiente de correlação e a recta dos mínimos quadrados, basta
dispor em colunas
Abcissas Ordenadas
Quadrados
das abcissas
Quadrados das
ordenadas
Abcissas X
Ordenadas
ix iy
2
ix
2
iy i ix y
e no fim somar.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 130/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
Vou recordar os somatórios dados:
80 80
2
1 1
73,66 88,146i i
i i
X X
= =
= ∧ =� �
80 80
2
1 1
1 475,72 27 367,7456i i
i i
Y Y
= =
= ∧ =� �
80
1
1 406,6846i i
i
X Y
=
=�
Assim no exercício faz-se:
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
( ) ( ) ( )
( ) ( )2
80. 1 406,6846 73,66 . 1 475,72
2,35762936
80. 88,146 73,66
a a
−
= ⇔ =
−
( ) ( ) ( ) ( )
( ) ( )2
88,146 . 1 475,72 73,66 . 1 406,6846
16,2757127
80. 88,146 73,66
b b
−
= ⇔ =
−
� � ( ) ( )2,35762936 16,2757127Y aX b Y X= + ⇔ = +
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 131/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
c) O ajustamento é razoável, uma vez que o coeficiente de correlação é relativamente
próximo de 1. Também se poderia ter ido pelo estudo dos resíduos.
Poderia estudar os resíduos quadráticos, pois é a partir deles que se define a regra dos
mínimos quadrados (RMQ).
Breve explicação sobre os resíduos - o resíduo de ordem iε representa a diferença entre o da
variável dependente e cada valor previsto pelo modelo de variável dependente:
�
�
valor observado valor previsto
i iy y−
Ou seja, os resíduos são definidos através da diferença entre cada valor iy (i-ésimo valor
observado da variável dependente) e
iy (i-ésimo valor esperado, pelo modelo
( )y f x= , da
variável dependente).
Assim, para cada { }1,...,i n∈ , o resíduo de ordem i é dado por
i iy y− , isto é,
i i iy yε = − .
O modelo adoptado é considerado bom se os resíduos iε forem desprezáveis, isto é, 0iε � .
Os resíduos devem flutuar moderadamente em torno de zero, sem padrão definido.
Ou seja veja se graficamente (com desenhos a cores!):
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 132/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Aqui, as rectas a vermelho, são as distanciam a que os dados estão da recta.
O ideal seria ter os pontos sobre a recta (aqui a verde):
Assim sendo a essa distancia é designada por resíduo ( )ε .
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 133/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
i iiy y ε= + , em que iε é o resíduo. Assim
i i iy yε = −
iε é positivo, pois esta acima da recta. O ideal seria 0iε = . Se os valores de iε forem muito
alto, o modelo da recta não é o mais indicado. Para contornar este problema, utiliza se o RMQ,
que tem por finalidade a de minimizar o erro.
Representa se a soma de TODOS os erros por .δ
Assim 2 2 2 2 21 2 3 4 ... nδ ε ε ε ε ε= + + + + +
Se 1nε + aumentar gradualmente, isto significa que a recta não é a ideal, deverá ser corrigida.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 134/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Frequência: 2000/07/10
Exame de recurso
Duração: 3 horas.
Responda às perguntas 3 e 5 e a mais três à sua escolha.
1 - Num estudo feito com rãs, registou-se a voltagem necessária para provocar a morte de cada
animal, obtendo os seguintes dados:
129 216 112 161 273 173 116 81 208 205
208 157 239 164 90 127 129 206 145 142
138 203 147 206 177 151 226 174 181 89
140 95 78 191 212 140 102 150 131 180
153 131 185 181 125 263 221 157 215 177
136 203 100 208 79 106 189 79 162 249
182 146 158 126 177 142 191 200 212 156
155
74
227
188
185
A Soma dos dados é 12 230, e a Soma dos seus Quadrados é 2 153 792.
Não confundir a Soma dos Quadrados:
2
1
n
i
i
X
=
� e o Quadrado das somas é
2
1
n
i
i
X
=
� �
�
� �
� .
1.1. Organize os dados em diagrama de caule e folhas. e calcule as medidas de localização e
dispersão mais usuais.
1.2. É preferível usar (média. desvio padrão) ou (mediana, dispersão quartal)?
1.3. No modelo Gaussiano, que relação existe entre o desvio padrão e a dispersão quartal?
1.4. Construa um histograma apropriado para representar aqueles dados.
1.5. Desenhe também a caixa com bigodes correspondente aos dados.
1.6. Com base nesta caixa com bigodes.que pode inferir sobre o modelo subjacente aos
dados?
Resolução 1.1 – recordar:
Medidas de localização mais usuais: mediana ( )X e média ( )M .
Medidas de dispersão mais usuais: dF e desvio padrão (s).
(Na pergunta 1.2 já está indicado quais é que o prof considera os mais usuais!)
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 135/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2
1
75; x 10
2
n =
Arrumado:
74 100 129 142 155 173 182 203 212 249
78 102 129 142 156 174 185 203 212 263
79 106 131 145 157 177 185 205 215 273
79 112 131 146 157 177 188 206 216
81 116 136 147 158 177 189 206 221
89 125 138 150 161 180 191 208 226
90 126 140 151 162 181 191 208 227
95 127 140 153 164 181 200 208 239
Mínimo Máximo Mediana M
74 273 163,07 161
1 163,07
n
i
i
X
X
n
== =
�
[ ] 1Prof 38
2
n
M
+
= =
e [ ]
[ ]Prof 1
Prof 19,5
2
M
F
� � +� �= =
[ ]
19 20
Prof 1312L F
x x
F x
+
= = = e [ ]
' 19 20
Prof
' '
201,5
2U F
x x
F x
+
= = =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 70,5U LdF F F= − = .
Barreiras de Outliers Inferior - X X 1,5 131 1,5 70,5 25, 25LF dF = =− −
Barreiras de Outliers Superior - X X 1,5 201,5 1,5 70,5 307,25UF dF = + =+
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (307,25): 0.
Dados inferior a barreira inferior (25,25): 0.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 136/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Variância:
( )
2
22 2 2
1 1
1 1 1 1
2 153 792 12 230
1 75 1 75
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
� � �− − � �� �� �� �
� �
( )2 21 159 486,67 2 155, 23
74X X
s s⇔ = ⇔ =
Desvio Padrão:
2 2 155,23X X Xs s s= ⇔ = ⇔
46, 42 46X Xs s⇔ = ⇔ ≈
Resolução 1.2 – o que se pretende é saber qual é que é a mais credível para esta amostra.
X e s são sensíveis a Outlier, sendo adequado a distribuições simétricas (comportam se bem,
os valores obtidos são de confiança).
A média ( )M e a dispersão Quartal (dF) são mais resistentes aos Outliers, portanto são
aconselháveis para a distribuição assimétricas.
Ou seja o que se pretende é saber se a amostra é simétrica. Na pergunta 1.3 irei fazer essa
demonstração.
Resoluções 1.3 – na distribuição normal (Gaussiana), a média e a mediana são iguais.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 137/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Posso concluir que L UM s F M s F− < ∧ + > .
Se multiplicar por -1:
0 2
2
L
U
U L
M s F
M s F
s F F
s dF
− + > −
+ >
+ > −
>
Como 2s dF> , não existem outliers, a média e a mediana são praticamente iguais, e os dados
aparentam ser simétricos, então existem razões validas para deduzir que esta amostra tenha
sido extraída de uma população normal (distribuição é normal).
Recordar:
Vou extrair amostras que me permitem concluir algo sobre a população:
Os gráficos e os diagramas que se elabora ajudam a interpretarem se os dados extraídos são
verdadeiramente representativos da população.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 138/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resoluções 1.4 – agora vou construir o histograma “apropriado”. Aqui, na pergunta, está uma
ratoeira, pois a tendência é usar a regra de Sturges, mas aqui não! Pois quando sei de antemão
de que se trata de uma distribuição normal (conclusão a que cheguei ao resolver a questão 1.1,
1.2 e 1.3) vou pelo processo do desvio padrão. Ou seja, sei pelo diagrama de caule e folhas
que nada de anormal se passa, sei que não tem outliers, e é simétrico. São pistas que me
permite utilizar este processo.Vou então criar as classes, e começo pela classe central, pois é
regra quando se utiliza o processo do desvio padrão:
Ora a minha classe central é me dado pela equação: ;
3 2
s s
h � �∈ � �� �
.
] [46,42 46,42 ; 15,47 ; 23,21
3 2
h h� �∈ ⇔ ∈� �� �
Ou seja vou escolher aleatoriamente um número (h) compreendido neste intervalo. Vou optar
pelo numero 20.
Assim h = 20.
Assim a minha classe central é
20 20
; 163,07 ; 163,07
2 2 2 2
h h
X X� � � �− + = − +� � � �� � � �
.
ix in iN if iF
1 ] ] 73,07 ; 93,07 7 7 0,09 0,09
2 ] ] 93,07 ; 113,07 5 12 0,07 0,16
3 ] ] 113,07 ; 133,07 8 20 0,11 0,27
4 ] ] 133,07 ; 153,07 12 32 0,16 0,43
5 ] ] 153,07 ; 173,07 9 41 0,12 0,55
6 ] ] 173,07 ; 193,07 14 55 0,19 0,73
7 ] ] 193,07 ; 213,07 11 66 0,15 0,88
8 ] ] 213,07 ; 233,07 5 71 0,07 0,95
9 ] ] 233,07 ; 253,07 2 73 0,03 0,97
10 ] ] 253,07 ; 273,07 2 75 0,03 1
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 139/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2 - Suponha que no mesmo estudo se pretende estabelecer uma relação log-linear
( )* lny y ax b= = + entre a voltagem necessária e o peso da rã.
2.1. Usando a seguinte amostra bivariada, estabeleça a relação pretendida usando a
metodologia dos mínimos quadrados.
Peso 53 55 57 58 61 63 64
Voltagem 171 179 174 176 186 188 165
2.2. Qual é o coeficiente de determinação entre as duas variáveis, e que Interpretação tem?
Resoluções 2.1 – Teorema Recta dos Mínimos Quadrados (RMQ): Se os pontos da amostra
bivariada ( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a recta dos mínimos quadrados que modela
essa relação é � �Y aX b= + , com:
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
Observação: Para calcular o coeficiente de correlação e a recta dos mínimos quadrados, basta
dispor em colunas
Abcissas Ordenadas
Quadrados
das abcissas
Quadrados das
ordenadas
Abcissas X
Ordenadas
ix iy
2
ix
2
iy i ix y
e no fim somar.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 140/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
Vou então elaborar uma tabela, pois preciso dos somatórios:
x y *y 2x ( )2*y *xy
53 171 5,1417 2809 26,4367 272,508
55 179 5,1874 3025 26,9090 285,306
57 174 5,1591 3249 26,6159 294,066
58 176 5,1705 3364 26,7339 299,888
61 186 5,2257 3721 27,3084 318,771
63 188 5,2364 3969 27,4203 329,896
64 165 5,1059 4096 26,0707 326,781
411 1.239,00 36,2267 24.233 187,4949 2.127,216Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 141/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Nota, não esquecer que ( )* lny y= .
Agora o que se pretende é �*y , e não o
y . Assim sendo
*
y aX b= + .
Nota: os dados da tabela podem não parecer tão evidente, mas na realidade é:
*
1 1
2.127,216
n n
i i i i
i i
X Y X Y
= =
= =� � *
1 1
36, 2267
n n
i i
i i
Y Y
= =
= =� �
Assim sendo, fica:
7 7 7
1 1 1 1 1 1
2 27 7
2 2
1 1 1 1
7
7
n n n
i i i i i i i i
i i i i i i
n n
i i i i
i i i i
n X Y X Y X Y X Y
a a
n X X X X
= = = = = =
= = = =
− −
= ⇔ = ⇔
� � � �
− −
�
�
� � � �
� � � � � �
� � � �
( ) ( )( )
( ) ( )
3
2
7 , ,
1,88 x 10
7
a a −
−
⇔ = ⇔ =
−
2 127 216 411 36 2267
24 233 411
7 7 7 7
2 2
1 1 1 1 1 1 1 1
2 27 7
2 2
1 1 1 1
7
n n n n
i i i i i i i i i i
i i i i i i i i
n n
i i i i
i i i i
X Y X X Y X Y X X Y
b b
n X X X X
= = = = = = = =
= = = =
− −
= ⇔ = ⇔
� � � �
− −
�
�
� � � �
� � � � � � � �
� � � �
( ) ( ) ( )( )
( ) ( )2
24 233 36,2267 411 2 127, 216
5,07
7 24 233 411
b b
−
⇔ = ⇔ =
−
Assim, a recta dos mínimos quadrados que modela essa relação é:
� ( ) ( )
*
31,88 x 10 5,07Y X−= +
Sei que � �( ) �( ) ( ) ( )* 3ln ln 1,88 x 10 5,07Y Y Y X−= → = + ⇔
� ( ) ( )31,88 x 10 5,07XY e
− +
=
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 142/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resoluções 2.2 – Coeficiente de determinação: há diferenças entre linear e não linear:
Na regressão múltipla, a medida relativa de adequação do ajuste é chamada de coeficiente de
determinação múltipla e é designada pelo símbolo R2. É a relação entre a variação explicada pela
equação de regressão múltipla e a variação total da variável dependente. Assim, R2=0,75 significa
que 75% de variância é explicada pelo modelo. O coeficiente de determinação (R2) é um número no
intervalo [0;1], calculado conforme a fórmula a seguir:
�
�
2
212
2 1
2
2 2
1 1
( )
( )
Variação explicita1
Variação total( ) ( )
1
n
i n
i i
y i
n n
y
i i
i i
Y Y
Y Ys nR
s
Y Y Y Y
n
=
=
= =
−
−
−= = = =
− −
−
�
�
� �
Onde Y é o valor médio dos Yi constantes da amostra e � iY é o correspondente valor estimado
através da equação ( � iY =β0 + β1X1i + β2X2i + ... + βkXki), para o elemento i da amostra.
Alguns autores recomendam o uso do coeficiente de determinação "ajustado" (Ra
2), que leva em
conta o número de variáveis explicatórias em relação ao número de observações. O propósito desta
medida é facilitar a comparação de diversos modelos de regressão, quando há alteração no número
de variáveis ou na quantidade de dados, de um modelo para outro. Tal coeficiente é determinado da
seguinte forma:
( )2 211 . 1
1a
n
R R
n k
−� �= − −
�− −� �
Onde Ra
2 é o coeficiente ajustado, R2 é o coeficiente de determinação normal, k é o número de
regressores e n é o tamanho da amostra. O coeficiente de determinação é empregado como um
indicador inicial da precisão das regressões, para a selecção dos modelos mais ajustados.
Vou elaborar uma tabela:
iY ( )
2
iY Y−
�
iY �( )
2
iY Y−
171
179
174
176
186
188
165
1.239,00
Sei que 1 177
n
i
i
Y
Y
n
== =
�
:
iY ( )
2
iY Y−
�
iY �( )
2
iY Y−
171 36
179 4
174 9
176 1
186 81
188 121
165 144
1.239,00 396
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 143/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Sei que � ( )
( )31,884929577 x 10 5,07X
Y e
− +
= (resultado obtido no exercício 2.1):
iY ( )
2
iY Y−
�
iY �( )
2
iY Y−
171 36 175,897 1,22
179 4 176,562 0,19
174 9 177,229 0,05
176 1 177,563 0,32
186 81 178,570 2,46
188 121 179,244 5,04
165 144 179,583 6,67
1.239,00 396 1.244,648 15,95
Assim:
�
�
2
212
2 1
2
2 2
1 1
( )
( )
15,951 0,04 4%
396( ) ( )
1
n
i n
i i
y i
n n
y
i i
i i
Y Y
Y Ys nR
s
Y Y Y Y
n
=
=
= =
−
−
−= = = = = =
− −
−
�
�
� �
Valor muito baixo, pois deveria de andar acima dos 95%. 5% da variância total é explicada pelo
modelo.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 144/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Frequência: 2003/06/18
Duração: 3 horas
Exercícios 1 – Na tabela abaixo registam-se os comprimentos, em cm, das asas direitas de
priolos (ave endémica dos Açores) de três ilhas.
São Miguel Terceira Pico
1 11,01 11,46 11,01
2 11,04 11,46 11,17
3 11,18 11,85 11,35
4 11,22 11,96 11,52
5 11,74 12,34 11,52
6 11,82 12,37 11,96
7 11,96 12,48 12,10
8 12,24 12,57 12,31
9 12,34 12,62 12,40
10 12,49 12,78 12,40
11 12,60 12,91 12,85
12 12,64 13,19 13,14
13 12,98 13,25 13,21
13
1
i
i
X
=
� 155,26 161,24 156,94
13
2
1
i
i
X
=
� 1.859,6674 2.003,9746 1.901,6877
(a) Calcule média, mediana, desvio padrão, dispersão quartal e coeficiente de variação de
cada uma das amostras.
(b) Apoiando-se nas caixas com 5 letras resumo, desenhe as caixas de bigodes paralelas
correspondentes às três subamostras. Que comentários considera haver a fazer?
(c) O que são outliers e como podem ser detectados?
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 145/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução a) São Miguel
13
1 1 155,259Mediana 11,943
13 13
n
i i
i i
X X
X X X X
n
= =→ = ⇔ = ⇔ = ⇔ =
� �
( ) 13 1Média Prof 7
2
M
+
→ = =
( ) 7 11,96prof MM x M x M= ⇔ = ⇔ =
Dispersão quartal:
( )
( )Prof 1
Quartis Prof 4
2
M
Q
+� �� �→ = =
( ) 4 11,22L L Lprof FF x F x F= ⇔ = ⇔ =
( ) 4
' ' 12,49U U Uprof FF x F x F= ⇔ = ⇔ =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 12, 49 11, 22 1, 27U LdF F F= − = − = .
Variância:
( )
2
22 2 2
1 1
1 1 1 1
1.859,6674 155, 26
1 13 1 13
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
� � �− − � �� �� �� �
� �
2 0, 4487730769Xs =
Desvio Padrão:
2 0,4487730769 0,6699052746X X X Xs s s s= ⇔ = ⇔ =
Coeficiente de variação
0,6699052746
11,943
Xscv cv
X
→ = ⇔ = ⇔
0,005609187596 5,6%cv cv⇔ = ⇔ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 146/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução a) Terceira
13
1 1 161, 24Mediana 12,403
13 13
n
i i
i i
X X
X X X X
n
= =→ = ⇔ = ⇔ = ⇔ =
� �
( ) 13 1Média Prof 7
2
M
+
→ = =
( ) 7 12,48prof MM x M x M= ⇔ = ⇔ =
Dispersão quartal:
( )
( )Prof 1
Quartis Prof 4
2
M
Q
+� �� �→ = =
( ) 4 11,96L L Lprof FF x F x F= ⇔ = ⇔ =
( ) 4
' ' 12,78U U Uprof FF x F x F= ⇔ = ⇔ =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 12,78 11,96 0,82U LdF F F=− = − = .
Variância:
( )
2
22 2 2
1 1
1 1 1 1
2.003,9746 161, 24
1 13 1 13
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
� � �− − � �� �� �� �
� �
2 0,3418730769Xs =
Desvio Padrão:
2 0,3418730769 0,5846991337X X X Xs s s s= ⇔ = ⇔ =
Coeficiente de variação
0,5846991337
12, 403
Xscv cv
X
→ = ⇔ = ⇔
0,04895747582 4,9%cv cv⇔ = ⇔ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 147/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução a) Pico
13
1 1 156,97Mediana 12,075
13 13
n
i i
i i
X X
X X X X
n
= =→ = ⇔ = ⇔ = ⇔ =
� �
( ) 13 1Média Prof 7
2
M
+
→ = =
( ) 7 12,10prof MM x M x M= ⇔ = ⇔ =
Dispersão quartal:
( )
( )Prof 1
Quartis Prof 4
2
M
Q
+� �� �→ = =
( ) 4 11,52L L Lprof FF x F x F= ⇔ = ⇔ =
( ) 4
' ' 12,40U U Uprof FF x F x F= ⇔ = ⇔ =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 12, 40 11,52 0,88U LdF F F= − = − = .
Variância:
( )
2
22 2 2
1 1
1 1 1 1
1.901,6877 156,97
1 13 1 13
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
� � �− − � �� �� �� �
� �
2 0,5279435897Xs =
Desvio Padrão:
2 0,5279435897 0,7265972679X X X Xs s s s= ⇔ = ⇔ =
Coeficiente de variação
0,7265972679
12,075
Xscv cv
X
→ = ⇔ = ⇔
0,06017368678 6,0%cv cv⇔ = ⇔ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 148/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução b) 5 letras resumo:
São Miguel
Terceira
Pico
Caixa de bigodes comparada:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 149/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Uma análise sobre estes gráficos, permite fazer três comentários relativamente aos
comprimentos das asas direitas de priolos:
1º, quanto a dispersão, não parece haver diferenças nas três ilhas.
2º, quanto a localização, parece que o comprimento das asas é um pouco superior na Ilha da
Terceira.
3º, quanto a simetria, a distribuição parece simétrica nos três casos.
Em conclusão, esta variável parece ser uma candidata a uma distribuição normal (Gausiana).
Resolução c) - As observações que apresentam um grande afastamento das restantes ou são
inconsistentes com elas são habitualmente designadas por outliers.
Estas observações são também designadas por observações “anormais”, contaminantes,
estranhas, extremas ou aberrantes. Podem ser detectados verificando se os dados estão fora
do intervalo:
[ ]1,5 ; 1,5 L UF X dF F X dF− +
2. Na tabela abaixo registam-se comprimentos do corpo e da asa direita dos 13 priolos da ilha
de São Miguel:
13 13
2
1 1
143,61 1600,9725i i
i i
X X
= =
= ∧ =� �
13 13
2
1 1
155,26 1859,6674i i
i i
Y Y
= =
= ∧ =� �
13
1
1722,5972i i
i
X Y
=
=�
(a) Determine a recta dos mínimos quadrados que exprime y como função linear de x.
(b) O que são os resíduos? Que propriedades devem ter para considerarmos que o modelo
adaptado é bom?
Resolução 2a) - �Y → valor previsto pelo modelo.
Assim o que é pedido, é se é possível prever “Y” a partir de “X”, através da relação linear.
�Y aX b= +
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 150/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Teorema RMQ: Se os pontos da amostra bivariada ( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a
recta dos mínimos quadrados que modela essa relação é �Y aX b= + , com:
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
Observação: Para calcular o coeficiente de correlação e a recta dos mínimos quadrados, basta
dispor em colunas
Abcissas Ordenadas
Quadrados
das abcissas
Quadrados das
ordenadas
Abcissas X
Ordenadas
ix iy
2
ix
2
iy i ix y
e no fim somar.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 151/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Assim no exercício faz-se:
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
( ) ( ) ( )
( ) ( )2
13 1722,5972 143,61 155,26
0,513
13 1600,9725 143,61
a a
−
= ⇔ =
−
( )( ) ( )( )
( ) ( )2
1600,9725 155,26 143,61 1722,5972
6, 275
13 1600,9725 143,61
b b
−
= ⇔ =
−
� � 0,513. 6, 275Y aX b Y X= + ⇔ = +
Ter em atenção, que esta recta obtida não me diz que é fiável, pois é preciso fazer a correlação
linear, ou o estudo dos resíduos, a fim de confirmar se é fiável ou não (vou explicar no
exercício 2b).
Resolução 2b) - breve explicação sobre os resíduos: O resíduo de ordem iε representa a
diferença entre o da variável dependente e cada valor previsto pelo modelo de variável
dependente:
�
�
valor observado valor previsto
i iy y−
Ou seja, os resíduos são definidos através da diferença entre cada valor iy (i-ésimo valor
observado da variável dependente) e
iy (i-ésimo valor esperado, pelo modelo
( )y f x= , da
variável dependente).
Assim, para cada { }1,...,i n∈ , o resíduo de ordem i é dado por
i iy y− , isto é,
i i iy yε = − .
O modelo adoptado é considerado bom se os resíduos iε forem desprezáveis, isto é, 0iε � .
Os resíduos devem flutuar moderadamente em torno de zero, sem padrão definido.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 152/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Aqui, as rectas a vermelho, são as distanciam a que os dados estão da recta.
O ideal seria ter os pontos sobre a recta (aqui a verde):
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 153/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Na figura pode se notar de que existe uma distância entre os ponto (valores lidos) e a recta
azul (valor esperado). Essa distância é designada por resíduo ( )ε .
i iiy y ε= + , em que iε é o resíduo. Assim
i i iy yε = −
Neste exemplo:
iε é positivo, pois esta acima da recta. O ideal seria 0iε = , ou seja os resíduos deveram
“flutuar” moderadamente em torno do valor zero (sem obrigar a um padrão). Se os valores de
iε forem muito alto, o modelo da recta não é o mais indicado. Para contornar este problema,
utiliza se o MMQ, que tem por finalidade a de minimizar o erro.
Representa se a soma de TODOS os erros por .δ
Assim 2 2 2 2 21 2 3 4 ... nδ ε ε ε ε ε= + + + + +
Se 1nε + aumentar gradualmente, isto significa que arecta não é a ideal, deverá ser corrigida.
Agora vou explicar um outro pressuposto que me diz se a recta obtida no exercício 2a) é de
confiança ou não.
Vou recordar teoria do Coeficiente de Correlação Linear: o coeficiente de correlação linear
é uma medida do grau de associação entre variáveis. Esta medida toma valores entre -1 e 1.
Quando se mede a correlação entre variáveis, 1 significa uma relação linear perfeita e positiva,
enquanto -1 é também uma relação linear perfeita mas negativa. Valores próximos do zero
para o coeficiente de correlação linear indicam uma associação linear pobre entre variáveis.
O coeficiente de correlação amostral de Pearson r da amostra bivariada ( ){ }
1
;
n
i i i
x y
=
é:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 154/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
�
�
� � � �� � � �� � � �
� � �
� � � �
Assim:
13 13 13
1 1 1
2 213 13 13 13
2 2
1 1 1 1
13
13 13
i i i i
i i i
i i i i
i i i i
X Y X Y
r
X X Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
�
�
� � � �� � � �� � � �
� � �
� � � �
( ) ( ) ( )
( ) ( ) ( ) ( )2 2
13 1722,5972 143,61 155,26
13 1600,9725 143,61 13 1859,6674 155, 26
r
−
=
� � � �− −
� � � �
0,084260312r =
Tendo obtido um 0,084260312r = , posso concluir que não existe uma correlação entre as
variáveis, pois o seu coeficiente está muito próximo do zero (o ajustamento não é bom).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 155/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Frequência: 2007/12/06
Duração: 2 horas.
1 – Os valores que se seguem referem se a um estudo sobre como os estímulos ambientais
afectam a capacidade de concentração, e representam o tempo, em segundos, que 36
voluntários demoram a fazer uma serie de cálculos aritméticos simples, em três condições
distintas: com televisão ligada (A), com o rádio ligado (B), e em silêncio (C).
A B C
31,47 33,32 32,78
37,72 34,72 26,45
34,90 28,41 29,90
31,86 41,96 32,08
35,78 37,10 28,55
29,93 27,73 36,25
36,38 26,37 30,74
29,57 34,43 25,68
36,38 24,75 29,04
34,77 30,71 32,65
24,10 35,81 27,21
32,71 28,94 32,58
Soma 395,57 384,25 363,91
Soma quadrática 13203,3429 12585,1815 11142,0269
1.1 – Trace diagramas de extremos e quartis paralelos para os três grupos.
1.2 – Faça um histograma para o conjunto de todos os dados (sem distinguir entre grupos).
1.3 – Face às respostas que deu às alíneas anteriores, qual lhe parece ser o efeito dos estímulos
ambientais visuais e auditivos na capacidade de conversão?
1.4 – O que é que o histograma sugere acerca da simetria da variável considerada? Compare
com a indicação fornecida pelos diagramas de extremos e quartis, e comente.
1.5 – Qual das medidas de dispersão é mais sensível a Outliers, a amplitude interquartis ou a
amplitude? Justifique a sua resposta.
Faço mais tarte, pois é sempre a mesma coisa…..
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 156/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2 - Noutra experiência do mesmo tipo, os voluntários tiveram de fazer contas com o rádio
como som de fundo, mas desta vez os períodos de som foram intercalados com períodos
de silêncio. Por outro lado, o tempo de execução da uma tarefa não é certamente o único
factor a levar em conta. Também importa a qualidade da execução, por isso registou-se o
número de erros que cada voluntário cometeu ao fazer as contas.
Silencio (x) 15 15 17 17 20 20 20 22 22
Tempo (y) 21,82 22,94 15,90 13,26 14,51 21,01 14,02 21,37 21,24
Nº erros (z) 1 1 3 5 0 2 0 3 3
x y 2y xy 2xy
Soma 168 166,07 3187,3287 3095,34 59264,5102
Soma quadrado 3 196 3 187,3287 1 288 337,339 1 128 196,824 451 290 945,5
Determine a equação de recta de regressão dos mínimos quadrados que dá o tempo que o
voluntário demorou a realizar a tarefa, y, como função da duração total dos silêncios, x.
Resolução 2 - �Y → valor previsto pelo modelo (pois o previsto é diferente do observado).
Assim o que é pedido, é se é possível prever “Y” a partir de “X”, através da relação linear.
�Y aX b= +
Teorema Recta dos Mínimos Quadrados (RMQ): Se os pontos da amostra bivariada
( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a recta dos mínimos quadrados que modela essa
relação é � �Y aX b= + , com:
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
Observação: Para calcular o coeficiente de correlação e a recta dos mínimos quadrados, basta
dispor em colunas
Abcissas Ordenadas
Quadrados
das abcissas
Quadrados das
ordenadas
Abcissas X
Ordenadas
ix iy
2
ix
2
iy i ix y
e no fim somar.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 157/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
Assim no exercício faz-se:
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 158/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( ) ( )( )
( ) ( )2
9 3095,34 168 166,07
0,077222
9 3196 168
a a
−
= ⇔ = −
−
( )( ) ( ) ( )
( ) ( )2
3196 166,07 168 3095,34
19,8937037
9 3196 168
b b
−
= ⇔ =
−
� � ( )0,077222 . 19,8937037Y aX b Y X= + ⇔ = − +
Mas está errado!
Pois é, o que é pedido é estimar o valor de “x”, se souber o valor de “y”, e a fórmula é:
�X aY b= +
E na formula geral troca se o “x” pelo “y”:
1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n
i i i i i i i i
i i i i i i
n n n n
i i i i
i i i i
n X Y X Y n X Y X Y
a a
n X X Y Yn
= = = = = =
= = = =
− −
= → =
� � � �
− −
�
�
� � � �
� � � � � �
� � � �
2 2
1 1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n n
i i i i i i i i i i
i i i i i i i i
n n n n
i i i i
i i i i
X Y X Y X Y
X X
X Y X Y
b b
n Y Yn
= = = = = = = =
= = = =
− −
= → =
� � � �
− −
�
�
� � � �
� � � � � � � �
� � � �
Assim:
( ) ( )( )
( ) ( )
1 1 1
2 2
2
1 1
9 3095,34 168 166,07
0,03767913174
9 3187,3287 166,07
n n n
i i i i
i i i
n n
i i
i i
n X Y X Y
a a a
n Y Y
= = =
= =
−
−
= ⇔ = ⇔ = −
−� �
−
�
� �
� � �
� �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 159/305
Sugestões: jrvalente@netmadeira.comProbabilidades e Estatística
( ) ( ) ( )( )
( ) ( )
2
1 1 1 1
2 2
2
1 1
3187,3287 168 166,07 3095,34
19,36193
9 3187,3287 166,07
n n n n
i i i i i
i i i i
n n
i i
i i
X Y
b b b
n
Y X Y
Y Y
= = = =
= =
−
−
= ⇔ = ⇔ =
−� �
−
�
� �
� � � �
� �
� ( )0,03767913174 . 19,36193X Y= − +
3 - Responda a apenas uma das alíneas que se seguem.
a) Para os dados da pergunta 2, ache o coeficiente de correlação entre x e y.
b) Suponha que para calcular a variância dos dados da primeira coluna, na pergunta I, se
fez a seguinte tabela no Excel.
A Desvios
31,47 -1,49
37,72 25,72
34,90 34,90
31,86 31,86
35,78 35,78
29,93 29,93
36,38 36,38
29,57 29,57
36,38 36,38
34,77 34,77
24,10 24,10
32,71 32,71
Soma quad. 11.453,934040
Variância 1.041,266731
Só que o valor a que se chegou está errado. Onde é que terá sido cometido o erro?
c) Para os dados da pergunta 2, admita que por observação do diagrama de dispersão e análise
dos resíduos se chegou à conclusão de que era mais adequada uma relação parabólica do tipo
y ax b= + . Linearize esta relação, e use o método dos mínimos quadrados para achar
valores apropriados para os coeficientes a e b.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 160/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução 3a) - Vou recordar teoria do Coeficiente de Correlação Linear: o coeficiente de
correlação linear é uma medida do grau de associação entre variáveis. Esta medida toma
valores entre -1 e 1. Quando se mede a correlação entre variáveis, 1 significa uma relação
linear perfeita e positiva, enquanto -1 é também uma relação linear perfeita mas negativa.
Valores próximos do zero para o coeficiente de correlação linear indicam uma associação
linear pobre entre variáveis. O coeficiente de correlação amostral de Pearson r da amostra
bivariada ( ){ }
1
;
n
i i i
x y
=
é:
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
�
�
� � � �� � � �� � � �
� � �
� � � �
2r - coeficiente de determinação.
cv - coeficiente de variação
s
cv
X
� �=
�
� �
.
Assim:
( ) ( ) ( )
( ) ( ) ( ) ( )
9 9 9
1 1 1
2 29 9 9 9
2 2
1 1 1 1
2 2
9
9 9
9 3095,34 168 166,07
9 3196 168 9 3187,3287 166,07
0,054
i i i i
i i i
i i i i
i i i i
X Y X Y
r
X X Y Y
r
r
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
�
�
� � � �� � � �� � � �
−
=
� � � �− −
� � � �
= −
� � �
� � � �
Tendo obtido um 0,054r = − , posso concluir que não existe uma correlação entre as
variáveis, pois o seu coeficiente está muito próximo do zero (o ajustamento não é bom).
Resolução 3b) o que nos é pedido é a de verificar se a segunda coluna (desvios) está correcta.
Desvio:
1
( )
n
i
i
X X
=
−� , e a seu resultado é zero! É por isso que não se usa, e se usa o seu
quadrado. Assim, o desvio quadrático é 2
1
( )
n
i
i
X X
=
−� .
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 161/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
A variância é
2
2 1
( )
1
n
i
i
X X
s
n
=
−
=
−
�
A Desvios
31,47 -1,49
37,72 25,72
34,90 34,90
31,86 31,86
35,78 35,78
29,93 29,93
36,38 36,38
29,57 29,57
36,38 36,38
34,77 34,77
24,10 24,10
32,71 32,71
Ora como sei a mediana: 1
395,57
32,964
12
n
i
i
X
X X X
n
== ⇔ = ⇔ =
�
.
Assim fica:
A X Desvios
31,47 32,96 -1,49
37,72 32,96 4,76
34,90 32,96 1,94
31,86 32,96 -1,10
35,78 32,96 2,82
29,93 32,96 -3,03
36,38 32,96 3,42
29,57 32,96 -3,39
36,38 32,96 3,42
34,77 32,96 1,81
24,10 32,96 -8,86
32,71 32,96 -0,25
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 162/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução 3c) para linearizar: ( )
2
2 2 y ax b y ax b= + ⇔ = + . Já esta, já tenho
o " "ax b+ , também tenho o 2" "y , que não pretendo. Então baptizo o 2 y por .z
Assim .z ax b= + O objectivo é transformar o que é dado até se chegar ao " "ax b+ .
Por exemplo se fosse
1
y
ax b
=
+
, então faria
1
ax b
y
= + , e faria
1
.z z ax b
y
= → = +
Voltando ao exercício:
1 1 1 1 1 1
2 2
2 2
2 2
1 1 1 1
n n n n n n
i i i i i i i
i i i i i i
n n n n
i i i i
i i i i
in X X n X X
a a
n
Z Y
X X X X
Z
n
Y
= = = = = =
= = = =
− −
= ⇔ = ⇔
� � � �
− −
�
�
� � � �
� � � � � �
� � � �
( ) ( ) ( )
( ) ( )2
9 59264,5102 168 . 3187,3287
3,872
9. 3196 168
a a
−
= ⇔ = −
−
� �
2 2
1 1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
2 2
i i
n n n n n n n n
i i i i i i i i i i
i i
Z Z
i i i i i i
n n n n
i i i i
i i i i
X X X X X X
b b
n X X n X
Z Z Y Y
X
= = = = = = = =
= = = =
− −
= ⇔ = ⇔
� � � �
− −
�
�
� � � �
� � � � � � � �
� � � �
( ) ( ) ( ) ( )
( ) ( )2
3196 . 3187,3289 168 . 59264,5102
426, 416317
9. 3196 168
b b
−
⇔ = ⇔ =
−
� ( )3,872 . 426,416317Z X= − +
Logo:
( )3,872 . 426, 416317Y X= − +
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 163/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Frequência: 2008/06/21
Duração: 3 horas.
Primeira parte: responda às perguntas 1 e 2 na sua totalidade.
1 - O quadro seguinte dá as taxas de emprego por nível de escolaridade, em 10 zonas do país.
Nível de escolaridade
1.1 - Com base nestes 30 valores, parece-lhe que se pode considerar que a taxa de emprego
tem uma distribuição aproximadamente normal? Justifique a sua resposta fazendo
representações gráficas adequadas.
1.2 - O que é que os dados sugerem acerca da relação entre a taxa de emprego e o nível de
escolaridade? Justifique a sua resposta com base em características amostrais descritivas
pertinentes.
Resolução 1.1 –
A variável é contínua, e é a taxa de emprego que está em estudo neste exercício.
São necessárias 3 características para se poder afirmar se os dados pertencem a uma
distribuição normal.
1º - o 1ºQ>2ºQ e o 4ºQ>3ºQ.
2º - o formato do gráfico ser parecido com um sino:
3º - a probabilidade de “X” estar dentro dos seguintes parâmetros:
( ) 0,68p X s X X s− < < + ≈
( ) 0 952 2 ,p X s X X s− < < + ≈
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 164/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Existe também as designadas por distribuição uniforme:
1º - o 1ºQ=2ºQ=3º Q=4ºQ.
2º - o formato do gráfico ser parecido com uma recta paralela ao eixo dos “X”:
Existe também as designadas por distribuição Qui-quadrada:
1º - o 1ºQ<2ºQ<3º Q<4ºQ.
2º - o formato do gráfico ser parecido com uma recta paralela ao eixo dos “X”:
Agora regressando ao exercício, vou primeiro ordenar os dados, utilizando o diagrama de
caules (tenho que ser capaz de saber interpretar qual a variável a analisar de que é a taxa de
emprego).
030; 1 x 10
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 165/305
Sugestões: jrvalente@netmadeira.comProbabilidades e Estatística
Assim fica:
Mínimo Máximo Média Moda
48,6 87,8 64,4 84,3
[ ] 1Prof 15,5
2
n
M
+
= = e [ ]
[ ]Prof 1
Prof 8
2
M
F
� � +� �= =
[ ] 8Prof 56,5L FF x x= = = e [ ]
' '
8Prof 83,1U FF x x= = =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 26,6U LdF F F= − = .
Barreiras de Outliers Inferior - X X 1,5 56,5 1,5 26,6 16,6LF dF = − =−
Barreiras de Outliers Superior - X X 1,5 83,1 1,5 26,6 123UF dF+ = + =
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (123): 0
Dados inferior a barreira inferior (16,6): 0
Agora Diagrama Caixa com Bigodes:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 166/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Histograma -
Nota: quando não se tem pistas, para representar o histograma, usa se a regra de Sturges. Pois
se eu soubesse de que se tratava de uma distribuição normal, iria pelo processo do desvio
padrão.
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln 30
log 1 1 5.
ln 2
N n N N
� �
= + ⇔ = + ⇔ =� � � �� �
� �
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por
60:60 1:60 87,8 48,6* * * 7,84
5
x x
h h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar: 8.h =
O limite inferior da primeira classe deverá ser : ,2l n
x
ε
− em que ε é o excesso, e é
dado por:
( ) ( ) ( ) ( ): : 5 8 87,8 48,6 0,8.n n l nX XN h x xε ε ε= − − ⇔ = − − ⇔ =
O limite inferior da primeira classe é
0,8
48,6 48, 2
2
− =
ix in iN if iF
1 ] ] 48,2 ; 56,2 7 7 0,2 0,2
2 ] ] 56,2 ; 64,2 8 15 0,3 0,5
3 ] ] 64,2 ; 72,2 5 20 0,2 0,7
4 ] ] 72,2 ; 80,2 0 20 0,0 0,7
5 ] ] 80,2 ; 88,2 10 30 0,3 1
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 167/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Com base na análise do histograma, pode se concluir que existe uma assimetria à direita.
Analisando o diagrama da caixa de bigode, pode se concluir que existe uma ligeira dispersão
no intervalo [ ]64,4 ; 83,1 , quando seria de esperar uma certa concentração dos dados.
Quanto as medidas de localização, tem se 67,56 ; 84,3 ; 64, 4oX M M= = = , são bem
diferentes.
Assim se pode concluir que existem fortes razões para afirmar que os dados não têm uma
distribuição normal.
Resolução 1.2 – Tenho que realizar um estudo individualizado. A variável é contínua, e é a o
nível de formação que está em estudo neste exercício.
Assim fica, para o 3º ciclo:
Mínimo Máximo Média
48,6 60,4 55,65
[ ] 1Prof 5,5
2
n
M
+
= = e [ ]
[ ]Prof 1
Prof 3
2
M
F
� � +� �= =
[ ] 3Prof 52,1L FF x x= = = e [ ]
' '
3Prof 56,5U FF x x= = =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 168/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 4, 4U LdF F F= − = .
Barreiras de Outliers Inferior - X X 1,5 52,1 1,5 4,4 45,5LF dF− = − =
Barreiras de Outliers Superior - X X 1,5 56,5 1,5 4, 4 63,1UF dF+ = + =
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (63,1): 0.
Dados inferior a barreira inferior (45,5): 0.
Assim fica, para o Secundário:
Mínimo Máximo Média
59,8 67,6 64,4
[ ] 1Prof 5,5
2
n
M
+
= = e [ ]
[ ]Prof 1
Prof 3
2
M
F
� � +� �= =
[ ] 3Prof 62,1L FF x x= = = e [ ]
' '
3Prof 65,0U FF x x= = =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 2,9U LdF F F= − = .
Barreiras de Outliers Inferior - X X 1,5 62,1 1,5 2,9 57,75LF dF = − =−
Barreiras de Outliers Superior - X X 1,5 65,0 1,5 2,9 69,35UF dF = + =+
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 169/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (69,35): 0.
Dados inferior a barreira inferior (57,75): 0.
Assim fica, para o Superior:
Mínimo Máximo Média
81,3 87,8 84,05
[ ] 1Prof 5,5
2
n
M
+
= = e [ ]
[ ]Prof 1
Prof 3
2
M
F
� � +� �= =
[ ] 3Prof 83,1L FF x x= = = e [ ]
' '
3Prof 84,8U FF x x= = =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 1,7U LdF F F= − = .
Barreiras de Outliers Inferior - X X 1,5 83,1 1,5 1,7 80,55LF dF = − =−
Barreiras de Outliers Superior - X X 1,5 84,8 1,5 1,7 87,35UF dF = + =+
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (87,35): 1, e é o numero 87,8.
Dados inferior a barreira inferior (80,55): 0.
(Falta a conclusão, mas estou sem pachorra…)
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 170/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2 - O quadro seguinte dá as taxas de desemprego numa região do país, nos dois primeiros
trimestres de dois anos consecutivos, junto com as respectivas somas, somas de quadrados e
somas de produtos (brutas).
2.1 - Ajuste uma recta aos valores homólogos da taxa de desemprego nos dois anos, pelo
método dos mínimos quadrados.
2.2 - Admita que a recta que achou na alínea anterior se mantém um modelo válido para a
segunda metade do ano. Sabendo que a taxa de desemprego “x” nesta região em Julho de
2006 foi de 5,8%, ache uma estimativa da taxa de desemprego “y” no mesmo mês do ano
seguinte.
2.3 - A sua resposta à alínea anterior pressupõe que a recta ajustada permite fazer uma boa
previsão de “y” a partir de “x”. Explique como é que este pressuposto poderia falhar. O que
é que se pode fazer para avaliar se o referido pressuposto é válido?
Resolução 2.1 - Teorema Recta dos Mínimos Quadrados (RMQ): Se os pontos da amostra
bivariada ( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a recta dos mínimos quadrados que modela
essa relação é � �Y aX b= + , com:
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 171/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Observação: Para calcular o coeficiente de correlação e a recta dos mínimos quadrados, basta
dispor em colunas
Abcissas Ordenadas
Quadrados
das abcissas
Quadrados das
ordenadas
Abcissas X
Ordenadas
ix iy
2
ix
2
iy i ix y
e no fim somar.
21 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 172/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Assim sendo, fica:
6 6 6
1 1 1 1 1 1
2 26 6
2 2
1 1 1 1
6
6
n n n
i i i i i i i i
i i i i i i
n n
i i i i
i i i i
n X Y X Y X Y X Y
a a
n X X X X
= = = = = =
= = = =
− −
= ⇔ = ⇔
� � � �
− −
�
�
� � � �
� � � � � �
� � � �
( ) ( )( )
( ) ( )2
6 457,13 48,30 56,50
1,77992277
6 390,11 48,30
a a
−
⇔ = ⇔ =
−
6 6 6 6
2 2
1 1 1 1 1 1 1 1
2 26 6
2 2
1 1 1 1
6
n n n n
i i i i i i i i i i
i i i i i i i i
n n
i i i i
i i i i
X Y X X Y X Y X X Y
b b
n X X X X
= = = = = = = =
= = = =
− −
= ⇔ = ⇔
� � � �
− −
�
�
� � � �
� � � � � � � �
� � � �
( )( ) ( )( )
( ) ( )2
390,11 56,50 48,30 457,13
4,911711712
6 390,11 48,30
b b
−
⇔ = ⇔ = −
−
Assim, a recta dos mínimos quadrados (RMQ) que modela essa relação é:
� ( ) ( )1,77992277 4,911711712Y X= + −
Resolução 2.1 – é para projectar “y” a partir de “x”, e como sei que “x” é 5,8%, é só substituir
na recta do RMQ:
� ( )( ) ( )5,81,77992277 4,911711712Y = + −
� 5,41Y =
Posso então concluir que é 5,41%.
(Ter em atenção, que esta recta obtida não me diz que é fiável, pois é preciso fazer a
correlação linear, ou o estudo dos resíduos, a fim de confirmar se é fiável ou não. Mas é algo
que irei responder no exercício seguinte).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 173/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução 2.3 - Vou recordar teoria do Coeficiente de Correlação Linear: o coeficiente de
correlação linear é uma medida do grau de associação entre variáveis. Esta medida toma
valores entre -1 e 1.
Quando se mede a correlação entre variáveis, 1 significa uma relação linear perfeita e positiva,
enquanto -1 é também uma relação linear perfeita mas negativa. Valores próximos do zero
para o coeficiente de correlação linear indicam uma associação linear pobre entre variáveis.
O coeficiente de correlação amostral de Pearson r da amostra bivariada ( ){ }
1
;
n
i i i
x y
=
é:
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
�
�
� � � �� � � �� � � �
� � �
� � � �
Nota: não confundir com o coeficiente de determinação, que é 2.r
Assim um dos pressuposto do Coeficiente de Correlação Linear, é o facto de 1r = .
6 6 6
1 1 1
2 26 6 6 6
2 2
1 1 1 1
6
6 6
i i i i
i i i
i i i i
i i i i
X Y X Y
r
X X Y Y
= = =
= = = =
−
= ⇔
� � � �� � � �
− −� � � �
�
�
� � � �� � � �� � � �
� � �
� � � �
( ) ( )( )
( ) ( ) ( ) ( )2 2
6 457,13 48,30 56,50
0,99931684 1
6 390,11 48,30 6 536,15 56,50
r r r
−
⇔ = ⇔ = ⇔ ≈
� � � �− −
� � � �
Face ao resultado obtido, posso afirmar que o valor de “y” estimado na alínea 2.2 é bom.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 174/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Poderia ter ido pela pelo pressuposto do erro. É o facto de os resíduos oscilarem em torno de
zero sem nenhum padrão definido.
Breve explicação sobre os resíduos: O resíduo de ordem iε representa a diferença entre o da
variável dependente e cada valor previsto pelo modelo de variável dependente:
�
�
valor observado valor previsto
i iy y−
Ou seja, os resíduos são definidos através da diferença entre cada valor iy (i-ésimo valor
observado da variável dependente) e
iy (i-ésimo valor esperado, pelo modelo
( )y f x= , da
variável dependente).
Assim, para cada { }1,...,i n∈ , o resíduo de ordem i é dado por
i iy y− , isto é,
i i iy yε = − .
O modelo adoptado é considerado bom se os resíduos iε forem desprezáveis, isto é, 0iε � .
Os resíduos devem flutuar moderadamente em torno de zero, sem padrão definido.
Vou agora fazer uma analisar os resíduos:
Sei que
ix iy
iy ε
7,90 9,10
9,00 11,10
8,20 9,70
7,70 8,80
7,60 8,60
7,90 9,20
Também sei que: � ( ) ( )1,77992277 4,911711712Y X= + −
ix iy
iy ε
7,90 9,10 9,15
9,00 11,10 11,11
8,20 9,70 9,68
7,70 8,80 8,79
7,60 8,60 8,62
7,90 9,20 9,15
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 175/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Também sei que:
i iy yε = −
ix iy
iy ε
7,90 9,10 9,15 -0,05
9,00 11,10 11,11 -0,01
8,20 9,70 9,68 0,02
7,70 8,80 8,79 0,01
7,60 8,60 8,62 -0,02
7,90 9,20 9,15 0,05
Este parâmetro ,ε informa se a recta está bem ajustada. Se houver divergência ou no inicio,
no meio, ou no fim, posso concluir que os resíduos não são perturbações amostrais.
Mas como tal não sucede, pois andam muito próximo do valor de zero, sem nenhum padrão
definido, posso então afirmar que os resíduos são perturbações amostrais de zero.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 176/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Frequência: 2008/11/06
Duração: 2 horas.
Grupo I: responda a ambas as perguntas 1 e 2.
1 - A tabela seguinte contém os tempos de vida de 100 lâmpadas de incandescência, em horas,
bem como algumas somas calculadas a partir destes. Os valores dos tempos já foram
ordenados.
Por comodidade fornecem-se ainda as seguintes somas:
100 100
2
1 1
98 928 100 432 622i i
i i
X X
= =
= ∧ =� �
Pretende se saber se se pode admitir uma distribuição normal para esta variável. Procure
responder a esta questão:
1.1 (4,5 valores) Representando os dados num histograma.
1.2 (4,5 valores) Fazendo a caixa com bigodes. (Identifique eventuais outliers.)
1.3 (4,5 valores) Através da média e do desvio padrão. Como referência, note que no modelo
normal 68% das observações estão a um desvio padrão ou menos de distância da média, e
95% das observações estão a dois desvios padrões ou menos de distância da média. Compare
estas proporções com as que existem na amostra.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 177/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resoluções1.1 - já estão por ordem crescente.
Nota 1: ter se muito cuidado com a interpretação das perguntas. Por exemplo na alínea c) é me
dito que “… 68% das observações estão a um desvio padrão…” significa que 68% dos dados
pertencem ao intervalo ;X s X s� �− +� � .
Nota 2: quando não se tem pistas, para representar o histograma, usa se a regra de Sturges.
Pois se eu soubesse de que se tratava de uma distribuição normal, iria pelo processo do desvio
padrão.
A regra de Sturges aconselha que se use um número de classes N dado por:
( ) ( )
( )2
ln
log 1 1 7.
ln 2
n
N n N N
� �
= + ⇔ = + ⇔ =� � � �� �
��
A amplitude de cada classe deve ser h com h > h * , sendo h * dado por
: : 1340 521* * * 117
7
n n i nx xh h h
N
− −
= ⇔ = ⇔ =
Logo posso considerar: 120.h =
O limite inferior da primeira classe deverá ser : ,2i n
x
ε
− em que ε é o excesso, e é
dado por
( ) ( ) ( ) ( ): : 7 120 1340 521 21.n n i nX XN h x xε ε ε= − − ⇔ = − − ⇔ =
O limite inferior da primeira classe é
21
521 510,5
2
− =
Assim as classes a considerar são, que começa com : : - ; - 2 2i n i n
x x h
ε ε� �� � � �+
�
�� �
� � � �� �
:
] ] ] ] ] ] ] ] 510,5 ; 630,5 , 630,5 ; 750,5 , 750,5 ; 870,5 , 870,5 ; 990,5 ,
] ] ] ] ] ] 990,5 ; 1110,5 , 1110,5 ; 1230,5 e 1230,5 ; 1350,5 .
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 178/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Não esquecer de por legendas nos eixos.
ix in iN if iF
1 ] ] 510,5 ; 630,5 2 2 0,02 0,02
2 ] ] 630,5 ; 750,5 4 6 0,04 0,06
3 ] ] 750,5 ; 870,5 17 23 0,17 0,23
4 ] ] 870,5 ; 990,5 26 49 0,26 0,49
5 ] ] 990,5 ; 1110,5 26 75 0,26 0,75
6 ] ] 1110,5 ; 1230,5 20 95 0,2 0,95
7 ] ] 1230,5 ; 1350,5 5 100 0,05 1
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 179/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resoluções1.2
1º passo, determinar a dimensão da amostra. 100n = .
2º passo, determinar a profundidade da mediana. ( ) 1 100 1 50,5
2 2
n
prof M
+ +
= = = .
3º passo, determinar a mediana. ( )
50 51 996 996 996
2 2prof M
x x
M x
+ +
= = = = .
4º passo, determinar os quartis:
( )
( ) 1 50 1
25,5
2 2
prof M
prof F
+� � +� �= = =
( )
25 26 883 895 889
2 2L L L Lprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
( )
' '
' 25 26 1118 1106 1112
2 2U U U Uprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 1112 889 223U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 889 1,5 223 554,5LF dF = − =−
Barreiras de Outliers Superior - X X 1,5 1112 1,5 223 1446,5UF dF = + =+
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (1 446,5): 0
Dados inferior a barreira inferior (554,5): 1, e é 521
Vou verificar se o Outliers existente se é Moderado ou Severo (só vou a procura do
lado inferior):
Barreiras de Outliers Severo Inferior - X X 1,5 889 3 223 220LF dF− = =−
Dados Outliers Severo Inferior (220): 0 Ou seja, existem 1 Outliers mas é
Moderado.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 180/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora Diagrama Caixa com Bigodes:
Resoluções1.3 –
Nota: não confundir a soma dos quadrados e o quadrado das somas.
Soma dos Quadrados:
2
1
n
i
i
X
=
� e o Quadrado das somas é
2
1
n
i
i
X
=
� �
�
� �
� .
Variância:
( )
2
22 2 2
1 1
1 1 1 1
100 432 622 98 928
1 100 1 100
n n
X i i X
i i
s X X s
n n= =
� �� � � �= − ⇔ = −� �
� � �− − � �� �� �� �
� �
( )2 21 2 565 130,16 25 910, 41
99X X
s s⇔ = ⇔ =
Desvio Padrão:
2 25 910,41X X Xs s s= ⇔ = ⇔
160,97 161X Xs s⇔ = ⇔ ≈
Agora vou elaborar uma tabela que me vai ajudar a tirar conclusões. Vou fazer
como diz no enunciado para um desvio padrão e para dois desvios padrão.
Aqui representei os dados do enunciado. Na 1ª linha tenho um desvio padrão e na
2ª, tenho dois desvio padrão.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 181/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Calculei depois o intervalo para cada um dos casos. Ou seja 990 161 829xX s− = − =
Assim para um desvio padrão, os dados são:
Com 1 desvio padrão
Com 2 desvios padrões
Assim acabo de preencher o resto da tabela:
Conclusão: Como os valores obtidos são próximos das proporções esperadas, pode
se concluir que os dados foram obtidos num modelo normal (Gausiano).
Se observarmos o histograma e a caixa de bigodes, também se conclui que é
bastante compatível com o modelo normal. A ligeira assimetria observada é devido
a existência de um outliers.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 182/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2 - (4,5 valores) A determinação da resistência à ruptura de pedaços de soldadura é
relativamente difícil, ao passo que é relativamente simples medir o diâmetro de uma secção de
soldadura. Assim sendo, seria vantajoso se a resistência à ruptura de um pedaço de soldadura
pudesse ser prevista a partir do seu diâmetro. Com base nos dados que se seguem, parece-lhe
viável esta estratégia?
Justifique com cálculos adequados.
1010 10
2
1 1 0
22 860 67 719 400 68 722 500i i i
i i i
X X X
= = =
= ∧ = ∧ =� � ∏
10 10
2
1 1
23 250 69 742 500i i
i i
Y Y
= =
= ∧ =� �
Resolução – cuidado com a leitura, pois o “X” está trocado com o “Y”! A troca foi
propositada, para aumentar o grau de dificuldade.
“ … seria vantajoso se a resistência à ruptura (y) de um pedaço de soldadura pudesse
ser prevista a partir do seu diâmetro.”
Deve se ler: “ … seria vantajoso se a resistência … pudesse ser prevista a partir do seu
diâmetro (x).”
Resistência à
ruptura
(X)
Diâmetro
(Y)
370 400
780 800
1210 1250
1560 1600
1980 2000
2450 2500
3070 3100
3550 3600
3940 4000
3950 4000
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 183/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Assim os dados estão trocados:
10 10
2
1 1
22 860 67 719 400i i
i i
Y Y
= =
= ∧ =� �
10 10
2
1 1
23 250 69 742 500i i
i i
X X
= =
= ∧ =� �
( )
1
Soma dos Produtos 68 722 500
n
i i
i
X Y
=
→ =�
Assim o que é pedido: é possível prever “Y” a partir de “X”, através da relação linear?
�Y aX b= +
O que me é perguntado na realidade se a equação da recta (RMQ) é de confiança. Para poder
responder existe dois pressupostos de diferente resolução, mas que provam o mesmo, que é ou
pelo Coeficiente de Correlação Linear ou pelo resíduo. Vou começar pelo primeiro:
Vou recordar teoria do Coeficiente de Correlação Linear: o coeficiente de correlação linear
é uma medida do grau de associação entre variáveis. Esta medida toma valores entre -1 e 1.
Quando se mede a correlação entre variáveis, 1 significa uma relação linear perfeita e positiva,
enquanto -1 é também uma relação linear perfeita mas negativa. Valores próximos do zero
para o coeficiente de correlação linear indicam uma associação linear pobre entre variáveis.
O coeficiente de correlação amostral de Pearson r da amostra bivariada ( ){ }
1
;
n
i i i
x y
=
é:
Resistência à
ruptura
(Y)
Diâmetro(X)
370 400
780 800
1210 1250
1560 1600
1980 2000
2450 2500
3070 3100
3550 3600
3940 4000
3950 4000
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 184/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
�
�
� � � �� � � �� � � �
� � �
� � � �
Assim no exercício faz-se:
1 1 1
2 2
2 2
1 1 1 1
n n n
i i i i
i i i
n n n n
i i i i
i i i i
n X Y X Y
r
n X X n Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
�
�
� � � �� � � �� � � �
� � �
� � � �
10 10 10
1 1 1
2 210 10 10 10
2 2
1 1 1 1
10
10 10
i i i i
i i i
i i i i
i i i i
X Y X Y
r
X X Y Y
= = =
= = = =
−
=
� � � �� � � �
− −� � � �
�
�
� � � �� � � �� � � �
� � �
� � � �
( ) ( ) ( )
( ) ( ) ( ) ( )2 2
10. 68 722 500 23 250 . 22 860
10. 69 742 500 23 250 10. 67 719 400 22 860
r
−
=
� � � �− −
� � � �
[ ][ ]
687 225 000 531 495 000
687 225 000 540 562 500 677 194 000 522 579 600
r
−
=
− −
0,9999717885r =
Tendo obtido um 0,9999717885r = , posso concluir que existe uma correlação quase perfeita
entre as variáveis, pelo que os dados são muito encorajadores quanto a possibilidade de se
poder estimar a resistência dos pedaços de soldadura com base no seu diâmetro.
Assim é possível prever “Y” a partir de “X”, através da relação linear.
�Y aX b= +
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 185/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Teorema Recta dos Mínimos Quadrados (RMQ): Se os pontos da amostra bivariada
( ){ }
1
;
n
i i i
x y
=
exibirem um padrão linear, a recta dos mínimos quadrados que modela essa
relação é � �Y aX b= + , com:
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
Observação: Para calcular o coeficiente de correlação e a recta dos mínimos quadrados, basta
dispor em colunas
Abcissas Ordenadas
Quadrados
das abcissas
Quadrados das
ordenadas
Abcissas X
Ordenadas
ix iy
2
ix
2
iy i ix y
e no fim somar.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 186/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2
1 1 1 1 1 1 1
2 2
2 2
1 1 1 1
n n n n n n n
i i i i i i i i i
i i i i i i i
n n n n
i i i i
i i i i
n X Y X Y X Y X X Y
a b
n X X n X X
= = = = = = =
= = = =
− −
= ∧ =
� � � �
− −
�
�
� � � �
� � � � � � �
� � � �
( ) ( ) ( )
( ) ( )2
10. 68 722 500 23 250 . 22 860
1,00721536
10. 69 742 500 23 250
a a
−
= ⇔ =
−
( ) ( ) ( ) ( )
( ) ( )2
69 742 500 . 22 860 22 860 . 68 722 500
22,5056657
10. 69 742 500 23 250
b b
−
= ⇔ =
−
� � ( ) ( )1,00721536 22,5056657Y aX b Y X= + ⇔ = +
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 187/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Grupo II
Responda a apenas uma das perguntas seguintes, 3 ou 4.
3 - (3 valores) Suponha que ao transcrever uma amostra de números ( )1 2, ,..., nx x x x= ocorre
um erro no primeiro valor, passando-se à amostra alterada ( )1 1 2' , ,..., nx x x xx+ ∆= .
Escrevendo a nova variância como 2 2' ,s s= + ∆ mostre que o erro ∆ produzido pela alteração
será de:
( ) ( )
2
11
12 . 1
xx
x X
n n
∆∆
∆ = − +
−
(Sugestão: desenvolva o numerador da variância, pondo de parte o termo correspondente à
observação que foi alterada.)
Resolução – quer-se provar que 2 2' .s s∆ = −
( )1 2, ,... nX x x x=
( )1 21,' ,... nX x x x x+= ∆
Calculo Auxiliar 1:
É necessário perceber se que
1
( ) 0
n
i
i
X X
=
− =� , pois os valores (somados) que estão acima de
X é o mesmo que estão abaixo. Logo a sua soma dá zero.
Não é pedido no exercício, mas vou tentar explicar o porquê de se usar a variância para depois
se calcular o valo do desvio padrão.
1 1 1
( )
n n n
i i
i i i
X X X X
= = =
− = −� � �
Sei que X é uma constante, logo pode sair de dentro do somatório, pois não irá contribuir
para o somatório, e aproveito para multiplicar o 1º termo por um 1
n
n
� �
�
� �
= :
1
1 1
( ) 1
n
in n
i
i
i i
X
X X
n
n
X=
= =
− = −
�
� �
Sei que: 1
n
i
i
X
X
n
==
�
, e a soma continua de 1 é
1
1
n
i
n
=
=� , logo,
1
( )
n
i
i
X X nX Xn
=
− = −�
1
( ) 0 c.q.d.
n
i
i
X X
=
− =�
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 188/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Poderia ter ido pelo fim, que também dava:
1 1 1
( )
n n n
i i
i i i
X X X X
= = =
− = −� � �
1 11
( 1)
n n
i i
i i
n
i
X X X X
= ==
− = −� � �
Nota que
1
1
n
i
X
=
� , é igual a somar “n” uns seguidos, o que vai dar “n”.
1
1 1
( )
n
in n
i
i i
i i
X
X X X
n
=
= =
− = −
�
� � .n
1 1
( )
n n
i i
i i
X X X
= =
⇔ − =� �
1
n
i
i
X
=
−�
1
( ) 0 c.q.d.
n
i
i
X X
=
− =�
Essa é a razão pela qual se utiliza a variância para se calcular o desvio padrão, pois é sempre
um número positivo.
2
2 1
( )
1
n
i
i
X X
s
n
=
−
=
−
�
Nota: a multiplicação pelo coeficiente
1
1n −
serve para anular a repetição pela técnica
utilizada de se elevar ao quadrado, por ser 2( )iX X−
Calculo Auxiliar 2:
Agora vou demonstrar que
2
2
2 1
1 1
( )
1
.
1
1 1
n
in n
i
i i
i i
X X
X X
n nn
=
= =
−� �� �
− =� �
� −� �� �� �−
�
� � .
( )
Desenvolvimento do binómio
2 2 2
1
2
1
1
( ) 2
( )
1 1
. .
1 1 1
n n
i i
n
i
i
i
i
i
X X
X X X
n n n
X X X
=
=
=
− � �
� �= = =
− − − � �
�
− − +
�
�
�
�
��������������
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 189/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( ) ( ) ( )2 2
1 1 1
1
. 2
1
n n n
i i
i i i
X X X X
n = = =
� �
= + − + =� �− � �
� � �
Sei que X é uma constante, logo pode sair de dentro do somatório, pois não irá contribuir
para o somatório:
( ) ( ) ( )2 2
11 1
1
. 2
1
1
n n
i i
i i
n
i
X X X X
n = ==
� �
= − + =� �− � �
� ��
A soma continua de 1 é
1
1
n
i
n
=
=� , assim:
( )
( )
2 21
1
1
2
1
.. .
n
in
i
i
i
n
n
X
X X X n
n
=
=
� �
� �
� �= − + =
− � �
� �� �
�
�
Sei que 1
n
i
i
X
X
n
==
�
,
( ) ( )2 2 2 2
1
2
1
1 1
. 2 . .
1
. 2 .
1
n n
i i
i i
XnX X X n X X X
n
n n
n = =
� � � �
= − + = − + =� � � �− −� � � �
� �
( ) ( )2 2
1 1
sei que ...
1 1
2
21 1. .
1 1
n n
i i
i
n
i
n
i i
i i
X X X n
X X
nn n
X n
n
=
= =
=
� �� � � �
� �
�
�� � � �
�
�= → = → − =� � � �− −
�
�� �
� �
�
�
� � � �
−
� �
� �
� �
�������
( ) ( )
2 2
2 2
1 1 1 1
2
1 1 1
. . c.q.d.
1 1
n n n n
i i i i
i i i i
n
X X X X
n n nn= = = =
� � � �� � � �
= − = −� � � �
��− −� � � �� � � �� � � �
� � � �
Ter em atenção de que o “n” quando sai para fora do quadrado, traz o quadrado.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 190/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Calculo Auxiliar 3:
1 1
1 1
2
1
12
1
1
' ' ' '
'
' '
i i
n n n n n
i i i i
i i i
iX X X X X X X
X
n n n n n
X
X
n
X
= == ==
+ + +
= = = = = +
+ ∆ ∆
∆
=
� � � � �
1'
X
X X
n
∆
= +
Agora com este conceitos recordados, vou resolver o exercício:
( ) ( )2
2 112
2
'
1 1
' '
n n
ii
ii
X XX X
s s
n n
==∆ = − =
−−
= −
− −
��
( ) ( ) ( ) ( )2
2
2
1
2
2
1
2
' ' '
1 1
'
n
i
ii
n
iX X X X X X X
n n
X
= =
− − − −
∆ = − =
−
+ +
−
� �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 191/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
No calculo auxiliar 3, fiquei a saber que 1 1 1'X X X= + ∆ ,
1'
X
X X
n
∆
= +
( ) ( )
2 2
2 2
1
2 2
1
1
1
1
1 1
n n
i i
i i
X X
X X
X X X X
n n
X XX
n n= =
∆ ∆� � � �+ +
�
� � � �
− + − − + −
�
�
�
�
� �� � �∆ = − =
−
�
∆
�
+
−
� �
Agora, muito cuidado com os sinais:
( ) ( )
2 2
2 2
1 1
1 1 1
2 2
1
n n
i i
i i
X X
X X X X X X X X X
n n
n
= =
∆ ∆� � � �+ ∆ − + − − − −
�−
�
� � � �∆
−
= =
−
−
� �
Agora vou agrupar de modo a me dar jeito:
( ) ( ) ( ) ( )
2
1
1 1
1
2
2
2
2
2
1
1
n n
i
i
i
i
XX
X X X
n
X X X X X
n
n
X
= =
� ∆ �� �− + ∆ −
�
�
�
−+ − −
∆
∆� �− −
�
�=
−
�� � =�
−
��
Agora vou desenvolver os quadrados:
( )21X X
∆ =
− ( )
2
1 1
1 1 1 ...
1
2
X X
X
n n
n
X X X
∆ ∆� � � �+ − ∆ − + ∆ −
�
�
+
�
� �
−
�
( ) ( ) ( )
2
2 2
1
1 1
2
... 2
n
i i
i
X X
X XX X X X
n n=
� �∆ ∆� �− − − +
�
�
��
+ −
� �
−
�
� ( )
2
2
1
n
i
i
X X
n
=
−−
−
�
Agora vou desenvolver o somatório a azul:
( )
2
1 1
1 1 12 ...
1
X X
X X X X
n n
n
∆ ∆� � � �− ∆ − + ∆ − +
�
�
� � � �∆ =
−
( )2
2
...
n
i
i
X X
=
−+ � ( ) ( )
2
1 1
2
2 22
2
n
i
i
n n
i
i i
X X
X X
n n
X X
== =
∆ ∆� � � �+ − − +
�
�
� �
− −
� �
� � �
1n −
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 192/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou desenvolver os produtos e os quadrados:
( ) ( ) ( )
22
1
1 1
2
1
11
1
1
2 2
1
12 2
1
2 2
n n
i
i i
X X
X X
n n
XX X
X
n
X XX
n
n
X X X
n = =
� � � �∆ ∆� � � � � �+ + − − +� � � �
�
�� �� � � � � ��
∆
− ∆∆
� � �� � � �∆
∆
− −
∆� �+
�
� �
=
∆
−
− � �
Vou pôr fora dos somatórios as constantes:
( ) ( ) ( )
2 2
21 1 1 1
1 1 1 1 1
22
12 22 2
1
n
i
i
n
i
X X X X
X X X X X X X
n
X
X
n n n
X
n
n = =
∆ ∆ ∆ ∆� � � �− ∆ − − + ∆ − ∆ + +
�
�
�
∆
−
�
−
� �∆ =
−
� �
Calculo auxiliar:
( ) ( ) ( ) ( ) ( )1
1 2 2
10 0
n
i
n n
i i
i ii
X X X XX X X X X X
= ==
− = ⇔ − + = ⇔ =− − − −�� �
Então fica:
( ) ( ) ( )( )
2 2
21 1 1 1 1
1 1 1 1 1
2
12 2 2 2
1
n
i
X X X X X
X X X X X X X
n n n
X
n
n
X
n =
∆ ∆ ∆ ∆ ∆� � � �− ∆ − − + ∆ − ∆ + − +
�
�
� �
−
� �
−
∆ =
−
�
( ) ( ) 11 1 12 2
X
X X X X X
n
∆
− ∆ − −
∆ =
( )
2
2 1 1 1
1 1 12 2
X X X
X X X X
n n n
∆ ∆ ∆� �+ ∆ − ∆ +
�
+ −�
�
2
1
2
1
n
i
X
n
n
=
∆� �+
�
� �
−
�
( )
2 2
2 1 1 1
1 1 1 1
2
2 2
1
n
i
X X X
X X X X X
n n n
n
=
∆ ∆ ∆� � � �− ∆ + ∆ − ∆ + +
�
�
� � � �∆ =
−
�
Sei que ( ) ( ) ( )
22 2
11 1
2
2
1 1
n
i
XX X
n n
n n n=
∆∆ ∆� � � �
= − = −
�
�
� � � �
�
Assim:
( ) ( ) ( )11
2
1
1 1
2
1
2
2
1 22
1
1
X
n
n
X
X
n n
X X X X
X
n
− ∆ + ∆ +
∆� �
� +
∆
∆
� �
∆
−− ∆
=
−
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 193/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( )
2
1
2
1
1 2
2
1 12 2
nX
n
X
n
X X
X
X
∆
−− ∆ + ∆ +
∆
∆
+
=
( )21
2
X
n
∆ ( )21
2
1
X
n
n
−
−
∆
( )
2
2
1
1
1 2
2
1
1 22
X
X X
n
X X
n
X∆
−
∆
− ∆ + ∆ +
∆ =
2
1
2
2
1X
n
X
n
∆
−
∆
+
1n −
( ) ( )
2
22 1
1 11 1 11
22
1
1
1
1
X XX
nn
X X XX X X
n n
− ∆ +− ∆ +
∆ = ⇔ ∆ =
� �∆ ∆ −∆ −
�
� �
− −
( ) ( )
2 2
1 1
1 1 1 12 2
1 1 1 1
1 1
X XX X X X X X
n n n n
n n
n n n
∆ ∆− ∆ − ∆
⇔ ∆ = + ⇔
−� � � �−
�
�
� � �∆ = + ⇔
− − − −
�
( )
( )211
1
1
2
1
X nX
X X
n
∆ −∆
⇔ ∆ = − +
− ( )1n n −
( ) ( )
2
11
12 . 1
. . .
xx
x X
n n
c q d
∆∆
∆ = − +
−
⇔
4.1 - (1 valor) Escolhe-se ao acaso um dos primeiros inteiros, { }0, 1, ... , , n com igual
frequência para todos, 0 1 np p ... p p.= = = = Qual tem de ser a probabilidade p?
4.2 - (2 valores) Discuta se será possível escolher ao acaso um elemento do conjunto de todos
os números naturais, { }, 2, ... , , ... ,N l n= de modo que cada um tenha igual probabilidade p
de ser o valor escolhido. (Sugestão: Procure perceber qual teria de ser o valor de p, nestas
condições).
Resolução 4.1 – cuidado com a leitura, pois se for mal interpretado, começa se logo mal!
É n+1. Vai se ver.
Teoria:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 194/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Usando o axiomática de Kolmogorov, tem se que:
( ) ( )1 Axioma 1 1p AΩ = →
( ) ( )0 Axioma 2 2p A A≥ →
( ) ( ) ( ) ( ) 3 3p A B p A p B se A B Axioma A∪ = + ∪ = ∅ →
Assim: { }( ) { } { } { } { }( )0,1,2,..., 1 0 1 2 ... 1p n p n= ⇔ = ⇔� � �
Usando o axioma 3 (A3) { }( ) { }( ) { }( ) { }( )0 1 2 ... 1p p p p n⇔ + + + + = ⇔
0 1 2 ... 1 ... 1np p p p p p p p⇔ + + + + = ⇔ + + + + =
Assim tenho
1
1
p
n
=
+
Resolução 4.2 – o valor de p deveria ser zero, mas também por outro lado: ( ) 1.p =�
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 195/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
{ }( ) { } { } { }( )1,2,..., 1 1 2 ... 1p n p n= ⇔ = ⇔� �
Usando o axioma 3 (A3) { }( ) { }( ) { }( )1 2 ... 1p p p n⇔ + + + = ⇔
0 1 2 ... 1 0 0 0 ... 0 1 . .np p p p P F⇔ + + + + = ⇔ + + + + =
. .P F - Preposição Falsa.
Se ,p a= com “a” muito próximo de zero (mas diferente de zero), então poderia afirmar
( ) 1.p =� Pois se tiver “a” muito próximo de zero, mas diferente de zero teria:
... 1 . .a a a a PV+ + + + =
Também sei que
1
1
n
a
+∞
=
= →� como é 0,≠ é porque é divergente.
Logo não existe, pois por mais pequeno que seja o número, a sua continua soma, é maior do
que um. Não é possível escolher um elemento do conjunto � de modo a que cada um tenha a
mesma probabilidade de p de ser o valor escolhido.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 196/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Frequência: 2009/02/02
Duração:2 horas.
Se vem fazer exame da 1ª parte, responda a três das quatro alíneas.
Se vem fazer exame da 2ª parte, responda a quatro das cinco alíneas.
Se vem fazer exame completo, responda a duas alíneas da 1ª parte e a três da 2ª
Nas perguntas de escolha múltipla, indique apenas a opção correcta.
1ª Parte
1 - Os diagramas de caule e folhas seguintes representam as notas que os alunos que já
passaram em Probabilidade e Estatística este ano tiveram nas duas frequências. Os valores
foram primeiro arredondados às unidades e depois ordenados.
1ª Frequência:
1155 ; x 10
5
n =
2 0U 8 9
7 1L 0 1 1 1 1
15 1T 2 2 2 2 2 3 3 3
(16) 1F 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5
24 1S 6 6 6 7 7 7 7 7 7 7 7
13 1U 8 8 8 8 9 9 9 9 9 9 9
2 2L 0 1
2ª Frequência:
1155 ; x 10
5
n =
14 0U 8 8 8 8 8 8 8 8 8 8 9 9 9 9
23 1L 0 0 0 0 0 1 1 1 1
(12) 1T 2 2 2 2 2 2 2 2 2 3 3 3
20 1F 4 4 4 4 4 4 4 5 5
11 1S 6 6 7 7 7
6 1U 8 9 9 9 9
1 2L 0
1.1 Faça caixas com cinco letras resumo para as notas em cada frequência e identifique
eventuais outliers. Comente a distribuição desta variável nas duas situações, referindo-se à
localização, à dispersão e à simetria.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 197/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
1.2 Encarando cada linha do diagrama corno uma classe [ [(1ª 7,5; 9,5 ,= [ [2ª 9,5;11,5 ,=
[ [ )3ª 11,5; 13,5 , . ,etc= escreva a tabela de frequências completa para os dados agrupados da
2ª prova, e aproveite-a para calcular a média e o desvio padrão agrupados.
Resolução 1.1 - ( ) 55 1Média Prof 28
2
M
+
→ = =
( ) 28 15prof MM x M x M= ⇔ = ⇔ =
Dispersão quartal:
( )
( )Prof 1
Quartis Prof 14,5
2
M
Q
+� �� �→ = =
( )
14 15 13
2L L Lprof F
x x
F x F F
+
= ⇔ = ⇔ =
( )
' 14 15' ' 17
2U U Uprof F
x x
F x F F
+
= ⇔ = ⇔ =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 17 13 4U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 13 1,5 4 7LF dF− = − =
Barreiras de Outliers Superior - X X 1,5 17 1,5 4 23UF dF+ = + =
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (23): 0
Dados inferior a barreira inferior (7): 0.
Posso concluir que não tem outliers.
Agora Diagrama 5 letras:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 198/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Para 2ª Frequencia –
( ) 55 1Média Prof 28
2
M
+
→ = =
( ) 28 12prof MM x M x M= ⇔ = ⇔ =
Dispersão quartal:
( )
( )Prof 1
Quartis Prof 14,5
2
M
Q
+� �� �→ = =
( )
14 15 9 10 9,5
2 2L L L Lprof F
x x
F x F F F
+ +
= ⇔ = ⇔ = ⇔ =
( )
' 14 15' ' 14
2U U Uprof F
x x
F x F F
+
= ⇔ = ⇔ =
Agora vou determinar a dispersão quartal e as barreiras de Outliers:
Dispersão Quartal - 14 9,5 4,5U LdF F F= − = − = .
Barreiras de Outliers Inferior - X X 1,5 9,5 1,5 4,5 2,75LF dF = − =−
Barreiras de Outliers Superior - X X 1,5 14 1,5 4,5 20,75UF dF = =+ +
Agora vou a tabela e verifico se existe dados superior a barreira superior e dados
inferior a barreira inferior:
Dados superior a barreira superior (20,75): 0
Dados inferior a barreira inferior (2,75): 0.
Posso concluir que não tem outliers.
(Falta os diagramas de caixa de bigodes e comentar, mas estou sem vontade…)
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 199/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução 1.2 – Cuidado, pois aqui é a Mediana Agrupada. Usa o meio da Classe (mi):
O símbolo desta Mediana Agrupada, tem um til, e o ideal é ser o mais próximo da Mediana.
� .i im nX
n
≈ � , e para poder continuar, vou precisar de fazer a respectiva tabela:
Cuidado, pois o “ im ” só interessa para o calculo e não para a contagem. Para a contagem é o
intervalo da classe.
� �. 14.8,5 9.10,5 12.12,5 9.14,5 5.16,5 5.18,5 1.20,5
55
i im nX X
n
+ + + + + +
≈ ⇔ ≈ ⇔�
� 12,54X ≈
Como se pode verificar no exercício 1.1 é muito próximo de ( )12,4X .
1 682 12,4
55
n
i
i
X
X X X
n
== ⇔ ⇔ = ⇔ =
�
( ) ( )
2
22 2 2
1 1
1 1 1 1
9263,75 989,5
1 54 55
n n
i i i i
i i
s m n m n s
n n= =
� �� � � �= − ⇔ = − ⇔� �
� � �− � �� �� �� �
� �
2 11,48 3,388s s⇔ = → =
ix im in iN if iF
1 ] ] 7,5 ; 9,5 8,5 14 14 0,25 0,25
2 ] ] 9,5 ; 11,5 10,5 9 23 0,16 0,42
3 ] ] 11,5 ; 13,5 12,5 12 35 0,22 0,64
4 ] ] 13,5 ; 15,5 14,5 9 44 0,16 0,80
5 ] ] 15,5 ; 17,5 16,5 5 49 0,09 0,89
6 ] ] 17,5 ; 19,5 18,5 5 54 0,09 0,98
7 ] ] 19,5 ; 21,5 20,5 1 55 0,02 1
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 200/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2 - Abaixo está um diagrama de dispersão com os resultados dos 48 n = alunos que fizeram
ambas as provas, tendo ou não sido aprovados.
Que género de relação lhe parece haver entre as notas nas duas frequências? Baseie a sua
resposta numa análise do gráfico, e quantifique-a também calculando uma medida de
associação adequada.
Use as seguintes somas:
1
1 945
n
i
i
X
=
=� ;
1
1 065
n
i
i
Y
=
=� ;
1
15 131,14
n
i i
i
X Y
=
=� ;
2
1
27 448,73
n
i
i
X
=
=� ; 2
1
11 025,35
n
i
i
Y
=
=� .
O facto de a maioria dos pontos se encontrarem abaixo da diagonal tem uma interpretação
pertinente, neste caso - qual?
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 201/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
1º - Interpretar o gráfico:
No ponto “A”, o aluno tirou 3,5 valores na 1ª frequência, e 11 valores na 2ª.
Se eu traçar uma diagonal,
Pronto agora estou pronto para interpretar o gráfico:
Não é do género linear, nem logaritmica. Medida de associação inadequada: r = 0,45 (o ideal é
1). Posso por isso afirmar que existe uma fraca associação entre as duas variáveis.
Está ainda incompleto, pois estou sem pachorra…
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 202/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Regra do Produto
Definição: Seja S um conjunto de resultados associado a uma experiência aleatória.
Sejam A e B dois acontecimentos, com ( ) 0p B ≠ . A probabilidade para que A se realize,
sabendo-se que B se realizou, designa-se por ( )|p A B e define-se pelo quociente,
( ) ( )
( )
p A B
p A B
p B
∩
=
A probabilidade de A, condicionada pela realização de B (ou a probabilidade de A
sabendo se B), que acaba de definir-se, representa a reavaliação da probabilidade de A
em face da informação de que B se realizou.
Definição: Seja S um conjunto de resultados associado a uma experiência aleatória e
sejam A e B dois acontecimentos. Dizemosque A e B são independentes se e só se
( ) ( ) ( ) x p A B p A p B∩ =
Consequência: Invertendo a expressão
( ) ( )
( )
p A B
p A B
p B
∩
=
Obtém-se a regra do produto:
( ) ( ) ( ) x |p A B p B p B A∩ =
Teorema: De um modo geral, a regra do produto é dada por:
( ) ( ) ( ) ( ) ( )1 2 3 1 2 1 3 1 2 1 2 3... x | x | x ... x | ...n n np A A A A p A p A A p A A A p A A A A A∩ ∩ ∩ ∩ = ∩ ∩ ∩ ∩ ∩
Teorema da Probabilidade Total: Seja Ω um espaço amostral associado a uma
experiência aleatória qualquer. Se os n acontecimentos 1 2 3, , ,..., nB B B B de ( )P Ω são
incompatíveis dois a dois, isto é, não existem dois que sejam compatíveis, e
1 2 3 ... nB B B B = Ω� � � � então para qualquer acontecimento A de ( )P Ω tem-se que:
( ) ( ) ( ) ( ) ( )1 2 3 ... + np A p B A p B A p B A p B A= ∩ + ∩ + ∩ + ∩
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 203/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Exercícios sobre a Regra do Produto
1 - No lançamento de um dado perfeito, qual é a probabilidade de o número obtido ser
6, sabendo que se obteve um
1.1. Número par?
1.2. Número ímpar?
1.3. Múltiplo de 3?
Resolução:
1.4 - ( ) ( ) 1 numero 6 1ser o numero 6 | sendo par |
3 numeros pares 3
p p A B= = =
1.5 - ( ) ( ) 1 numero 6ser o numero 6 | sendo impar | 0
não é impar
p p A B= = =
1.6 ( ) ( ) 1 numero 6 1ser o numero 6 | sendo multiplo de 3 |
3 ou 6 2
p p A B= = =
2 - Uma urna contém duas bolas verdes e três azuis. Tiram-se sucessivamente duas
bolas sem reposição. Sabendo que a primeira bola é azul, qual é a probabilidade de que
a segunda bola seja:
2.1. Verde?
2.2. Azul?
Resolução:
Nota: 1V representa a 1ª vez que é retirado uma bola, e 2V a 2ª vez.
2.1 - ( )1 2
2 (numeros possiveis de sair a bola certa) 1
4 (numero totais de bolas ainda existentes) 2
p V V = =
2.2 - ( )1 2
2 (numeros possiveis de sair a bola certa) 1
4 (numero totais de bolas ainda existentes) 2
p V V = = (é igual!)
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 204/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
3 - Extrai-se, ao acaso, uma bola de uma caixa que contém vinte bolas numeradas de 1
a 20. Considere os acontecimentos:
A: "a bola extraída tem um número par";
B: "a bola extraída tem um número múltiplo de 5".
Indique o valor da probabilidade condicionada ( )|p B A .
Sugestão: nos exercícios 1, 2 e 3 utilize a regra de Laplace.
Resolução:
( )p B A , em que o B representa os números múltiplos de 5, mas do lote de A, e o A
representa os números pares.
Ora de 1 a 20, tem se 10 números pares, e destes apenas dois são múltiplos de 5. Assim fica:
( ) 2 1 0,2
10 5
p B A = = =
4 - Dos acontecimentos A e B sabe-se que:
( ) 3
10
p A = e ( ) 7
10
p A B =�
Calcule ( )p B sabendo que A e B são independentes.
Resolução: vou recordar algumas regras:
A e B são incompatíveis se, e só se, (conjunto vazio)A B = ∅�
A e B são contrários se, e só se, (Universo)A B S=�
A e B são independentes se, e só se, ( ) ( ) ( ) x p A B p A p B=�
( ) ( ) ( ) ( ) + - p A B p A p B p A B=� �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 205/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
A azul está representando elementos que entra nos dois grupos, e é por isso que existe o 3º
termo do 2º membro. Ou seja para anular a repetição da contagem dos elementos que já
foram contados.
( ) ( ) ( ) - p A B p A p A B− = �
Quando afirmo que são independentes, significa que o 2º resultado não depende do resultado
obtido da 1ª, e assim escrever a seguinte equação:
( ) ( ) ( ) x p A B p A p B∩ =
Assim para resolver o exercício, e depois de analisar as três pistas dadas:
- ( ) 3
10
p A = , ( ) 7
10
p A B =� , e A e B serem independentes.
( ) ( ) ( ) ( )7 7 + -
10 10
p A B p A p B p A B= ⇔ = ⇔� �
Sei o valor de ( )p A , e como são independentes, então ( ) ( ) ( ) x p A B p A p B=� , fica:
( )
�
( ) ( ) ( )
( )
3 7
+ - x
10 10
p A B
p A
p B p A p B⇔ = ⇔
�
�������
( ) ( ) ( ) + - x 3 7
10 10
p B p Bp A⇔ = ⇔
( ) ( )� ( )
3
10
7 3 4
10 10 1
. 1
3
10 0
. p Ap B p B
� �
� �
⇔ − = ⇔ = ⇔� �
� �
−
� �� �
( ) 4
7
p B =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 206/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
5 - Prove que: Se A e B são acontecimentos independentes então A e B também o são.
Resolução:
( ) ( ) ( ) x p A B p A p B∩ =
Para provar que ( ) ( ) ( ) x p A B p A p B∩ = , sabendo a representação do Universo: ( ) 1p s = .
( ) ( ) ( ) ( ) ( )
( )
( )
�1
p S
p A A
p A A p S p A p A p A A= ⇔ + − = ⇔
�
� �
�����������
( ) ( ) ( ) ( )0 1 1p A p A p A p A⇔ + − = ⇔ = −
Assim: ( ) ( ) ( ) ( ) ( ) ( )1 1p A B p A B p A B p A p B p A B∩ = = − = − + − =� �� �� � �
( ) ( ) ( )1 p A p B p A B= − − + � como são independentes ( ) ( ) ( ) x p A B p A p B∩ =
( ) ( ) ( ) ( )1 x p A p B p A p B= − − + =
Aqui tenho que recordar da regra: ( )( )1 1 1a b ab a b− − + = − − , e assim fica:
( ) ( ) ( ) ( ) ( )( ) ( )( )1 1 1p B p A p A p B p A p B− − + = − −
Como sei que ( ) ( )1p A p A= − e ( ) ( )1p B p B= −
Posso então afirmar que ( ) ( ) ( ) x p A B p A p B∩ = c.q.d.
6 - Numa amostra constituída por 100 indivíduos obtiveram-se os resultados
apresentados no quadro seguinte e aleatoriamente seleccionou-se um indivíduo ao
acaso:
Com Bronquite Sem Bronquite
Fumadores 40 20
Não fumadores 10 30
6.1. Diga, justificando, se os acontecimentos «ser fumador» e «ter bronquite» são
independentes.
6.2. Calcule a probabilidade de um indivíduo que é fumador ter bronquite.
Resolução:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 207/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução:
6.1 - Para este exercício vou utilizar a regra dos abraços (expressão que se usa na gíria, pois
matematicamente não dá para provar nada). Consiste em verificar se A x D = B x C. Se for
verdade posso antever que são variáveis independentes.
40x30 = 20x10
É falso, não são independentes. Mas esta afirmação não tem qualquer significado
matemático, apenas me ajuda a antever a resposta. Vou agora passar a provar
matematicamente:
Sei que ( ) ( ) ( ) x p F B p F p B=� , se forem independentes.
Sei que ( ) 40 0,4
100
p F = =
Sei que ( ) 60 0,6
100
p F = =
Sei que ( ) 50 0,5
100
p B = =
( ) ( ) ( ) ( ) ( ) x 0,6 x 0,5 0,3p F B p F p B p F B p F B= ⇔ = ⇔ =� � �
Posso então concluir que ( ) ( ) ( ) x p F B p F p B≠� (não são independentes).
6.2 - ( ) ter bronquite sendo fumadorp B F → :
( ) ( )
( )
0,4 2
0,6 3
p B F
p B F
p F
= = =
�
7 - A probabilidade de um indivíduo A estar vivo daqui a 30 anos é 0.6 e a
probabilidade de um outro indivíduo B estar vivo daqui a 30 anos é 0.7. Determine a
probabilidade de daqui a 30 anos:
7.1. Estarem vivos os indivíduos A eB;
7.2. Não estarem vivos os indivíduos A e B;
7.3. Estar vivo pelo menos um dos indivíduos.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 208/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução:
Sei então que ( ) 0,6p A = e ( ) 0,7p B = ,
7.1 - ( ) ( ) ( ) x 0,6 0,7 0,42Xp A B p A p B= = =�
7.2 - ( ) ( ) ( ) ( ) ( ) x 1 0,6 1 0,7 0,12Xp A B p A p B= = − − =�
7.3 - ( ) ( ) ( ) ( ) + - 0,6 0,7 0,42 0,88p A B p A p B p A B= = + − =� �
8 - O João frequenta a Escola Secundária da cidade próxima do local onde vive.
Diariamente, tem duas possibilidades para ir às aulas: de comboio ou de autocarro.
Como prefere o autocarro, 60% das vezes escolhe esse meio de transporte.
Sabendo que a probabilidade de chegar atrasado às aulas é 22% e que a probabilidade
de ir de autocarro e chegar atrasado é 12%, calcule a probabilidade de:
8.1. Chegar atrasado sabendo que veio de autocarro;
8.2. Chegar atrasado ou ir de autocarro;
8.3. Não chegar atrasado e não ir de autocarro;
8.4. Ir de autocarro dado que chegou atrasado.
Resolução:
Sei então que ( ) 0,6p Auto = ( ) 0,4p Comboio =
( ) 0,22p Atrasado = ( ) 0,12p Auto Atrasado =�
8.1 - ( ) ( )
( )
0,12
/ 0,2
0,6
p Atrasado Auto
p Atrasado Auto
p Atrasado
= = =
�
8.2 - ( ) ( ) ( ) ( ) + - p Atrasado Auto p Atrasado p Auto p Atrasado Auto= − =�
0,22 0,6 0,12 0,7= + − =
8.3 - ( ) ( ) ( )1 - 1 0,7 0,3p Atrasado Auto p Atrasado Auto p Atrasado Auto= = = − =� � �
8.4 - ( ) ( )
( )
0,12 6
/
0, 22 11
p Auto Atrasado
p Auto Atrasado
p Auto
= = =
�
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 209/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
9 - A distribuição dos 200 passageiros num avião é:
Homens Mulheres Crianças Total
Portugueses 15 8 12 35
Espanhóis 21 5 17 43
Franceses 54 22 46 122
Total 90 35 75 200
Sai uma pessoa do avião. Qual é a probabilidade de:
9.1. Ser uma criança espanhola?
9.2. Ser portuguesa sabendo que é uma criança?
9.3. Não ser portuguesa sabendo que é uma criança?
Resolução:
9.1 - ( ) ( ) 17
200
p Crianças Espanhola p C E= =� �
Nota: não pode ser ( ) ( ) ( ) x p C E p C p E=� , pois não são independentes.
9.2 - ( ) ( )
( )
12
12 16200 0,16
75 75 100
200
Condicionada
p P C
p P C
p C
= = = = =
�
�����
9.3 - ( ) ( )( )
75 12
63 21 84200 0,84
12 17 46 75 25 100
200Condicionada
p P C
p P C
p C
−
= = = = = =
+ +
�
�����
10 - Supondo que a probabilidade de uma pessoa ser morena é 0,65 e a probabilidade
de ter os olhos verdes é 0,15. Determine a probabilidade de:
10.1. Ser morena e ter olhos verdes;
10.2. Ser morena ou ter olhos verdes;
10.3. Três pessoas serem morenas.
Observação: Neste exercício vai ter que considerar que os acontecimentos "ser
moreno/a" e "ter olhos verdes" são independentes...
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 210/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução:
( ) 0,65 ( ) 0,15p M p V= ∧ =
10.1 -
( )
( ) ( ) x ( ) 0,65 x 0,15 0,0975
Acontecimento independente
está no enunciado
p M V p M p V∩ = = =�������
10.2 - ( ) ( ) ( ) ( ) 0,65 0,15 0,0975 0,7025p M V p M p V p M V∪ = + − ∩ = + − =
10.3 - 1 2 3 1 2 3( ) ( ) x ( ) x ( ) 0,65 x 0,65 x 0,65 0,27p M M M p M p M p M∩ ∩ = = ≈
(são independente)
11 - Num determinado país, 65% dos habitantes têm automóvel, 42% têm telemóvel e
23% têm automóvel e telemóvel.
Resolução:
( ) 0,65 ( ) 0,42 ( ) 0,023p A p T p A T= = ∩ =
11.1. Escolhido ao acaso um habitante deste país, qual é a probabilidade de ele não ter
telemóvel nem automóvel?
11.2. Um determinado habitante tem telemóvel. Qual é a probabilidade de ele ter
também automóvel?
Resolução:
11.1 - ( ) ( ) 1 ( ) 1 ( ) ( ) ( )p A T p A T p A T p A p T p A T∩ = ∪ = − ∪ = − − + ∩ =
( )1 ( ) ( ) ( ) 1 0,65 0, 42 0, 23 0,16 16%p A p T p A T= − − + ∩ = − − + =
11.2 – ( ) ( )( ) 0, 23 23 0,548 55%
( ) 0,42 42
p A T
p A T
p T
∩
= = = = ≈
12 - Interrogaram-se os funcionários de uma empresa e concluiu-se que:
• 80% têm telefone de rede fixa;
• 60% têm telemóvel;
• 5% não têm qualquer tipo de telefone.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 211/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
12.1. Seleccionando ao acaso um trabalhador daquela empresa, qual é a probabilidade
de ele ter telefone de rede fixa e telemóvel?
12.2. Encontrou-se um funcionário que tinha telemóvel. Qual é a probabilidade de ele
ter telefone de rede fixa?
Resolução:
( ) 0,8 ( ) 0,6 ( ) 0,05p F p M p F M= = ∩ =
12.1 - ( ) ( ) ( ) ( ) ( ) ( ) 1 (p F M p F p M p F M p F p M p F M� �∩ = + − ∪ = + − − ∪ =� �
( )( ) ( ) 1 ( ) 0,8 0,6 1 0,05 0,45 45%p F p M p F M= + − + ∩ = + − + =
12.2 - ( )( ) 0,45 3( / ) 0,75 75%
( ) 0,6 4
p F M
p F M
p M
∩
= = = =
13 - Sendo A e C dois acontecimentos tais que ( ) 0p C ≠ , prove que:
( ) ( )| | 1.p A C p A C+ =
Resolução:
( ) ( )
( ) ( ) 1 1
( ) ( )
p A C p A C
p A C p A C
p C p C
∩ ∩
+ = ⇔ + = ⇔
( ) x ( )p A p C
⇔
( )p C
( ) x ( )p A p C
+
( )p C
1 ( ) ( ) 1 . . .p A p A c q d= ⇔ + =
Nota: de ( ) ( ) 1p A C p A C+ =
tira-se: ( ) ( )| 1 |p A C p A C= −
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 212/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
14 - Dos acontecimentos A e B sabe-se que são independentes, ( ) ( )0 ,p A p B< <
( ) 12
49
p A B =� e ( ) ( )| | 1.p A B p B A+ =
Determine ( ).p B
Resolução:
( ) (
( ) ( ) 1
)
(
1
) )(
p A B
p
p A B p
B A
B
p
A
A B
p
∩∩
+ = ⇔ + = ⇔
Aqui é preciso ter cuidado, pois o que se pretende saber é o p(B), e como não sei o valor de
p(A) vou fazer “desaparece-lo”:
( )
( )
( )p A B
p B
p A
⇔ +
∩ x ( )
( )
p B
p A
1= ⇔
Agora fazer “desaparecer” a fracção:
[ ]2 x( ) ( ) ( ) ( ) ( ) (( ) )p A B p B p p A BB B Bp B p p⇔ + = ⇔ ∩ + =∩ ⇔
Como sei o valor de ( )p A B∩ , pois este é me dado no enunciado:
( ) ( )
2
12
1 1 4. 1
12 490 ( )
49 2
p B p B p B
± − +
⇔ + − = ⇔ = ⇔� �� �
1 11 1 4 349 7( ) ( ) ( )
2 2 7 7
p B p B p B
± ±
⇔ = = ⇔ = ∨ =
Agora tem se que analisar e validar os valores obtidos:
12 12
( ) ( ) ( )
49 49
p A B p A p B∩ = ⇔ =
Assim:
4 12 3 12 12 12
( ). ( ). ( ) ( )
7 49 7 49 28 21
p A p A p A p A= ∨ = ⇔ = ∨ =
!!
3 4
( ) ( )
7 7
Falso
p A p A= ∨ =
�����
Porque que é que
4
( )
7
p A = é falso? Porque no enunciado é me dito que ( ) ( )0 .p A p B< <
Ora para ter
4
( )
7
p A = ,
3
( )
7
p B = . Pode não parecer mas
3 4
( ) ( ) .
7 7
p B p A= < =
Resposta.:
3 4
( ) ( )
7 7
p A p B= ∧ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 213/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
15 - Sejam A, B e C três acontecimentos possíveisde um mesmo espaço de resultados.
Prove que se A e C são incompatíveis, então ( ) ( )| |p A B C p B C=� �� �� .
Resolução:
Sabe-se que, para A e C serem incompatíveis, então A C∩ = ∅ , isto é, ( )p A C∩ = ∅ .
Tenho que provar: ( ) ( )p A B C p B C� ∪ � =� �
Recordar a regra da distributiva em relação a união: ( )*a b c ab ac+ = + . Assim:
( )
( )
( )
( ) ( )
( )
p A B C p A C B C
p C p
B
C
p A C
∩ ∪ ∩� � � �� � � �=� � =� =�
� �
�
( )( ) ( )
( )
( ) .
(
./
)
.
p B C p B C
p C p C
p B C c q d
∅ ∪ ∩ ∩
== =
16 - Num teste de avaliação de Matemática, feito por 28 alunos de uma turma do 12º
ano, verificou-se que 75% tiveram positiva e 3 raparigas tiveram “negativa”. Sabendo
que neste teste ter nota positiva é independente do sexo, determine o número de rapazes
que tiveram “positiva” no teste.
Resolução:
( )
( ) 0,75 0,75
( )
p P M
p P M
p M
∩
= ⇔ = ⇔
( ) x (p P p M
⇔
)
( )p M
0,75 ( ) 0,75p P= ⇔ =
Ora se ouve 75% de positivas, de um total de 28 alunos, significa que houve 0,75 X 28 = 21
positivas.
Já consigo introduzir valores na tabela:
H M T
P 21
N 3
T 28
Logo, com os valores que já sei, consigo calcular mais alguns valores. Houve 7 negativas
(28-21).
Se sei o total das negativas, e quantas mulheres tiveram negativas, também já consigo saber
quantos homens tiveram negativa: 4 (7-3).
Agora tenho dúvidas nas positivas!
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 214/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Sei que são independentes, caso contrario o enunciado teria que dizer que não o eram. Vou
criar duas variáveis para os valores que não sei, e utilizar a regra dos abraços.
H M T
P a b 21
N 4 3 7
T 28
Só se usa a regra dos abraços quando são independentes.
4
4 4 9
3 4 3
3 3
21 4
7 63 921
3
Xa b
a b a b a
a b
b bb b
� = � ��= = =� � � �
⇔ ⇔ ⇔ ⇔
+ =
� � �= =+ =
�
36
12
3
9
9
aa
b
b
� == ��
⇔ ⇔
=
� =
H M T
P 12 9 21
N 4 3 7
T 28
Resposta: 12 rapazes tiveram positivas.
Provar a Regra dos Abraços:
A A
B ( )p A B∩ ( )p A B∩
B ( )p A B∩ ( )p A B∩
( ) ( ) ( ) ( ). . ? Vou ver...p A B p A B p A B p A B será∩ ∩ = ∩ ∩ =
Como são independentes: ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )p A p B p A p B p A p B p A p B=
c.q.d.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 215/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
17 - Dos alunos de uma escola secundária, sabe-se que:
40% São raparigas 15% Fumam 60% Dos fumadores são rapazes
17.1. Escolhido aleatoriamente um dos alunos da escola, determine a probabilidade de ser:
a) Uma rapariga que não fuma.
b) Ser fumador sabendo que é rapariga.
17.2. Os acontecimentos "ser rapariga" e "ser fumador" são independentes? Justifique a
resposta
Resolução:
( ) ( ) ( )0, 4 0,15 0,6p M p F p H F= = =
Neste exercício a dificuldade estava em conseguir escrever esta equação: ( ) 0,6p H F =
Neste tipo de exercício, convém primeiro tentar preencher a tabela.
Construindo a tabela:
H M T
F 0,15
F
T 0,4 1
Aqui o segredo estava no total! No enunciado não é dito que é um, mas deduz-se.
Consigo calcular o total de homens, que é 1-0,4=0,6, e o total de não fumadores: 0,85.
H M T
F 0,15
F 0,85
T 0,6 0,4 1
Agora vou calcular ( )p H F� :
( ) ( )
( )
( ) ( )0,6 0,6 0,6
p H F
p H F p H F p F
p F
= ⇔ = ⇔ = ⇔
�
�
( ) ( )0,6 0,15 0,09Xp H F p H F⇔ = ⇔ =� �
Ao saber ( )p H F� , consigo calcular ( )p M F� , e é ( ) ( )1 0,06p M F p H F= − =� �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 216/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
H M T
F 0,09 0,06 0,15
F 0,85
T 0,6 0,4 1
Agora já se consegue calcular os valores em falta:
H M T
F 0,09 0,06 0,15
F 0,51 0,34 0,85
T 0,6 0,4 1
Agora, com a tabela preenchida, já consigo responder.
17.1 - a) ( ) 0,34p M F∩ =
b) ( ) ( )
( )
0,6
0,15
0, 4
p F M
p F M
p M
∩
= = =
17.2 - 0,09*0,34 0,51*0,06
Regra do abraço
=�����������
Como é uma preposição verdadeira, posso concluir que M e F são independentes.
18 - De um baralho de 52 cartas, extraem-se duas cartas. Calcule a probabilidade de obter
duas damas.
Resolução - tirar ao mesmo tempo ou separado é igual, pois não há reposição.
(As Cartas Damas não são independentes)
Como se pretende calcular a probabilidade de duas Damas consecutivas, tem se que a noção
que então a primeira carta a sair é Dama.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 217/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( ) ( )1 2
4 3
52 51
p D e p D= =
( )1 2
4 3 1
*
52 51 221
p D D∩ = =
Nota: se A e B são independentes
( ) ( )
( )
( )
p A B
p A B p A
p B
probabilidade de A sabendo B
∩
= =
↓
É ( )p A , pois é indiferente o valor de B, pois são independentes.
19 - Lancei um dado duas vezes. Determine a probabilidade de ter saído dois números pares.
Resolução: ( )1 2p P P∩ Já sei que o 1º é par
( )1 para a 2ª vez não interressa.p P
( )1 2
3 3 1
*
6 6 4
p P P∩ = =
20 - Uma caixa contém 5 lápis pretos e 9 lápis brancos. Tiram-se sucessivamente, sem
reposição, dois lápis da caixa. Determine a probabilidade de serem da mesma cor.
Resolução: 5 pretos e 9 brancos
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 218/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Vou usar a convenção:
� � ( ) ( ) ( )1 2 1 2 1 2 1 2 1 2 1 2. .
Pretos Brancos Cuidado que esta é a
parte de intersecção
p PP B B p P P p B B p PP B B
� �
= ∪ = + −
�
�
� �
�����
Mas trata-se de uma condição impossível!!!
Pois estou a dizer que da 1ª vez vou tirar um lápis, este é preto e branco (o índice 1
representa a 1ª vez, e o 2, a 2ª vez). Ora como só tiro um lápis de cada vez, não podem sair 2.
Assim,
( ) ( ) ( )1 2 1 2 1 2 1 2. . 0p PP B B p P P p B B= ∪ = + − =
( ) ( ) ( ) ( )1 2 1 1 2 1
5 4 9 8 46
. * *
14 13 14 13 91
p P p P P p B p B B= + = + =
21 - Considere um grupo de 10 pessoas, sendo 6 mulheres e 4 homens. Escolhe-se um grupo
de duas pessoas. Determine a probabilidade de o grupo ser formado por um homem e por uma
mulher.
Resolução: 6M 4H
( ) ( ) ( ) ( )1 2 1 2 1 2 1 2 1 2 1 2p H M M H p H M p M H p H M M H∪ = + − ∩ =
( ) ( ) ( ) ( ) ( )1 2 1 1 2 1 0
4 6 6 4 8
* *
10 9 10 9 15
p H p M H p M p H M p= + − =
= + =
22 - Qual é a probabilidade de o Pedro e o João terem nascido no mês de Dezembro?
Resolução:
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 2
1 1 1
. . *
12 12 144
independentes
p D D p D p D D p D p D= = = =
�����
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 219/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
23 - Atirei ao ar duas moedas. Determine a probabilidade de ter saído duas faces coroas.Resolução:
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 2
1 1 1
. . *
2 2 4
p C C p C p C C p C p C= = = =
24 - Considere um lançamento simultâneo de dois dados equilibrados. Qual é a probabilidade
do produto dos números das faces que ficam voltadas para cima ser par?
Resolução - tem que haver pelo menos um par. O segredo está aqui:
Excluir as situações dos dois serem ímpares
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 2
1 1 1 3
1 1 . 1 1 * 1
2 2 4 4
p I I p I p I I p I p I= − = − = − = − = − =
25 - Uma caixa contém 12 lâmpadas coloridas, das quais 5 estão fundidas. Determine a
probabilidade de tirar ao acaso três lâmpadas e estarem todas boas.
Resolução - 7B 5F
( ) ( ) ( ) ( )1 2 3 1 2 2 1 21
7 6 5 210 7
. . * *
12 11 10 1320 44
p B B B p B p B B p B B B= = = =
26 - A ementa de um restaurante tem 4 sobremesas diferentes. Três clientes escolhem a
sobremesa. Qual é a probabilidade de escolherem sobremesas iguais?
Resolução - ( ) ( ) ( ) ( )11 21 31 12 22 32 13 23 33 14 24 34
A B C D
p S S S p S S S p S S S p S S S+ + +
����� ������� ������� �������
A, B, C e D são incompatíveis dois a dois.
Significa que a união é vazio: 0A B∩ =
Assim ( ) ( ) ( )p A B p A p B∪ = +
� � �
3 3 3
1 1 1 1 1 1 4 1
* *
4 4 4 4 4 4 16*4 16
B C DA
= + + + = =
�����
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 220/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
27 - Numa terra há só 3 médicos. Numa noite, adoecem 5 habitantes. Cada um deles escolhe,
ao acaso, um dos médicos e chama-o por telefone. Qual é a probabilidade de que chamem
todos o mesmo médico?
Resolução: ( )11 21 31 41 51 12 22 32 42 52 13 23 33 43 53p D D D D D D D D D D D D D D D∪ ∪ =
( )11 21 31 41 51 12 22 32 42 52 13 23 33 43 53) ( ) (p D D D D D p D D D D D p D D D D D= + + =
5 5 5 4 4
1 1 1 3 1 1
3 3 3 3.3 3 81
= + + = = =
Teoria
Variável aleatória: lançamento de 2 dados, tem um espaço amostral de 36 ( )# 36 .S =
:X S R→ , X é a função de S para R.
Assim X=”A soma dos números das faces que ficam voltadas para cima ser igual a 4”.
(X é uma variável aleatória).
( ) { }� { }� { }�
1 3 4 2 2 4 3 1 4
Quantidades possiveis 3 1
4 1,3 , 2,2 , 3,1
36 12
P X P
Espaço a mostral
+ = + = + =
� �
�= = = = =
�
� �
Nota: ( )4P X = , significa: qual é a possibilidade da soma dos pares de dados somarem 4.
( )13P X = = ∅
( )12 1P X ≤ = , obviamente, qualquer que seja os números que saem, será SEMPRE inferior
ou igual a 12 (1=100%).
( )0 20 1P X≤ ≤ =
( )20 30P X≤ ≤ = ∅
( ) 11 12
36
P X X≤ ∨ ≥ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 221/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Caso 1 – Experiencia aleatória de lançamento de um dado.
{ } com uma pinta ; duas ; ; ; ; face três quatro cinco seisΩ =
Que por habito se diz: { }1 ; 2 ; 3 ; 4 ; 5 ; 6 Ω = , que não está errado, mas de facto não é o que
se observa.
X é a variável aleatória (v.a.) e que é o numero de pontos da face do dados.
Nota: X é sempre um numero real, ou seja é sempre “…é o numero de ...”.
f.m.p é a Função Massa de Probabilidade.
Assim a f.m.p. do lançamento de um dado é:
( ) ( ) ( ) ( )
Regra Geral
1 2 3
1 2 3
... ...
... ...
n
n
x x x x
X
f x f x f x f x
�
=
����������� ����������
nx caso possíveis, com probabilidade diferente de zero.
( )nf x probabilidade de acontecer, e tem que ser diferente de zero. Pois a seguir ao 6, tem se
o 7, 8, 9, … e estes não se representam, pois não existe possibilidades de acontecer, uma vez
que é só com um dado.
Do exercício
1 2 3 4 5 6
1 1 1 1 1 1
6 6 6 6 6 6
X
�
�
=
�
�������� �������
{ }Uniforme 1 ; 2 ; 3 ; 4 ; 5 ; 6 X � , lê se: X segue uma distribuição uniforme.
Quando as variáveis são pontos, que são o caso, são designadas de discretas.
Quando são variáveis de um domínio, são contínuas.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 222/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
f.m.p uniforme
{ }
Regra Geral
; 1 ; 2 ; 3 ; ... ;
i
i n
X i
n
�
∈�
=
�
������� ������
f.m.p não uniforme
Regra Geral
;
i
i i I
X
p
∈�
=
���� ���
, em que I é o conjunto.
1i
i I
p
∈
=�
Caso 2 – Bernouille - Uma urna com 4 bolas vermelhas (V) e 6 brancas (B).
Esta experiencia aleatória tem o seguinte universo amostral: { } ; V B e não { }4 ; 6V B . Pois é
vermelha ou é branca.
Ou é vermelha ou não é vermelha.
Ou é branca ou não é branca.
{ } ; V BΩ =
Para continuarmos o nosso raciocínio, vai se escolher uma bola preferida, aleatoriamente. Ou
seja vai se escolher as bolas vermelhas como sendo o acontecimento.
X é o número de bolas vermelhas na extracção de uma bola da urna.
Só há duas possibilidades: ou sai ou não sai, que matematicamente se representa por:
0X = ou 1X =
Agora vai se analisar a probabilidade de êxito de cada uma das situações:
( )0 0,6P X = = e ( )1 0,4P X = =
f.m.p não uniforme ( )BernouilleX p�
Regra Geral
;
i
i i I
X
p
∈�
=
���� ���
, em que I é o conjunto.
1i
i I
p
∈
=�
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 223/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( )Neste caso fica : BernouilleX p�
0 1
0,6 0, 4
X
�
=
0,6 1 0,4p p= ∧ − =
A característica (de ter sucesso) deste caso é “Bola vermelha”
( )Bernouille 0,4X �
Caso 3 – Binomial - Experiencia aleatória: 5 extracções com reposição, de uma bola da urna.
1ª 2ª 3ª 4ª 5ª
0, 4 0, 4 0,4 0,4 0, 4
X
p p p p p
�
=
= = = = =
Nota: não há erro de escrita na escolha de “p” minúsculo, pois é assim que se representa.
X é o número de bolas vermelhas, em 5 extracções de uma bola da urna.
0 - representa: nunca sair vermelho (sairam todas brancas).
5 - representa: sairam todas vermelhas.
X BBBBB
X VVVVV
= →
= →
�
f.m.p Binomial - ( )Binomial ; X n p�
( )
{ }
Regra Geral
; 1 ; 2 ; 3 ; ... ;
1
n ii
i
n
X n
p p
i
−
�
∈�
= � �
−
��
� �
���������� ���������
Em que o “p” é a probabilidade de sucesso e “n” o numero de provas.
No exerc cio : 0, 4 5í p n= ∧ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 224/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Exemplificando:
Considere uma caixa com 7 bolas, 2 amarelas (A), e 5 verdes (V). Tiram se três bolas, uma de
cada vez e sem reposição, da caixa. Seja X a variável aleatória (v.a.) que representa o numero
de bolas amarelas retiradas.
a) Calcule ( )2 .P X =
b) Determine a função massa de probabilidade.
c) Determinar a função cumulativa de distribuição.
d) Calcule o valor esperado de X.
Resolução:
a)
2 1 5 2 5 1 5 2 1
x x x x x x
7 6 5 7 6 5 7 6 5
x x x x x x A A V ou A V A ou V A A����� ����� �����
2 1 5 2 5 1 5 2 1 1
x x x x x x
7 6 5 7 6 5 7 6 5 7
� � � � � �+ + =
�
�
�
� � � � � �
b) Função densidade (massa), e é discreta.Uma representação usual das variáveis
aleatórias discretas é escrever na primeira linha os valores que a variável aleatória (v.a.) pode
ter, e na segunda linha as respectivas probabilidades:
( ) ( ) ( ) ( )
1 2 3
1 2 3
... ...
... ...
n
n
x x x x
X
f x f x f x f x
� �
= �
�
Assim:
0 2
2 1
1
1
7 7
X
� �
� �
= �
=� �
�
. Temos a probabilidade para zero e 2, mas não se tem para 1.
( ) 5 4 3 20 0 amarelas: x x x x
7 6 5 7
P X V V V= = = =
( ) 5 4 2 41 1 amarelas: x x x x
7 6 5 7
P X V V A= = = =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 225/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
c) Função distribuição: ( ) ( ) 0 0F x P X x se x= ≤ = <
( ) ( ) 2 0 1
7
F x P X x se x= ≤ = ≤ <
( ) ( ) 6 1 2, aqui são considerados as probabilidades de 0 e 1.
7
F x P X x se x= ≤ = ≤ <
( ) ( ) 1 2, ou seja são considerados TODAS as probabilidades.F x P X x se x= ≤ = ≥
Nota: ( ) ( ) 2 4 61 0
7 7 7
F x P X= ≤ = + + = .
Recordar – de uma variável aleatória, teorema: se F é uma função de distribuição então F goza
das seguintes propriedades:
1) ( ), 0 1. A probabilidade oscila entre zero e um.x R F x∀ ∈ ≤ ≤
2) F é crescente: ( ) ( ), , . Isto é verdade, pois é comulativo.x y R x y F x F y∀ ∈ < � ≤
3) ( ) ( ) ( ) ( ): lim 0 e : lim 1;
x x
F F x F F x
→−∞ →+∞
−∞ = = +∞ = =
4) ( ) ( ) ( ) ( ), , . Este índice é o mais importante!a b R a b P a X b F b F a∀ ∈ < � = −< ≤
5) F é contínua à direita: ( ) ( ) ( ), : lim .
x a
a R F a F x F a
+
+
→
∀ ∈ = =
6) ( ) ( ) ( ), .a R P X a F a F a−∀ ∈ = = −
Variável continua
( ) ( ) ( ) �
3 4 4 3 1 1 0 (alinea 4 do teorema 3)
Imagrm
Objecto x
P X F F< ≤ = − = − =
�������
d) ( ) ( )
2
0
2 4 1 6
0 x 1 x 2 x
7 7 7 7i ii
E x x f x
=
= = + + =� . Este valor é COMULATIVO.
Assim:
0 2
2 1
7
1
4
7
1
7
X
� �
� �
= �
=� �
�
.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 226/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
A variável aleatória Bernoulli: seja ( )~ .X Ber p Como o contradomínio de X é um conjunto
contável então X é uma variável aleatória discreta.
Variável aleatória binomial é com reposição (se assim não fosse, não seria uma serie de
Bernoulli). A variável aleatória X que representa o número de sucessos em “n” provas de
Bernoulli, com probabilidade de sucesso em cada prova “p”, é conhecida como variável
aleatória binomial. Por comodidade denota-se por ( )~ ; .X Bin n p
Em que “n” é o número de provas de Bernoulli, e “p” é a probabilidade de sucesso.
~X Bin é a distribuição binomial.
Se ( )~ ; X Bin n p então a função massa de probabilidade de X é dada por:
( )
( ) { }
{ }
1 se 0,1,2,...,
: , tal que
0 se \ 0,1, 2,...,
n xxn p p x n
xf R R f x
x R n
−�� �
− ∈�
�
→ = � �
� ∈
Nota :
n
x
� �
�
� �
é uma combinação, que na pratica representa se por , combinações de n, p a p.n pC
7
2
7
, combinações de sete, dois a dois.
2
C
� �
→
�
� �
Exercícios
Exercício 1: Determine a probabilidade de obter 4 e só 4 "cincos" no lançamento de um dado
15 vezes.
Resolução: X é número observado de faces “5”, quando se lança um dado 15 vezes.
Distribuição Binomial de X:
1
~ 15 ; .
6
X Bin � �
�
� �
15 é o número de vezes que o dado foi lançado.
1
6
p = → é a probabilidade de sair “5” num lançamento de um dado.
É nos pedido ( )4P X = , probabilidade do acontecimento “X” ocorrer 4 vezes.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 227/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Bernoulli ( )
( ) { }
{ }
1 se 0,1,2,...,
: , tal que
0 se \ 0,1, 2,...,
n xxn p p x n
xf R R f x
x R n
−�� �
− ∈�
�
→ = � �
� ∈
( )
15
15
114 4
4
15 1 1 1 5
1 1
6 6 1296 64
x n x
x
n
p p C
−
−� � � �� � � � � �� �
− = − =
�
�
�
�
�
�
� � � � � �� �� � � �
( ) ( ) ( )1365 0,00849 0,134588 0,142= ≈
Nota: A variável aleatória de Bernouille só permite avaliar o sucesso ou o não-sucesso.
Exercício 2: Estudos estatísticos mostram que sempre que se dá um nascimento de um bebé a
probabilidade de ser rapaz é 51%. Considere uma família com 5 filhos não gémeos.
Determine a probabilidade de que esta família tenha 3 e só 3 meninos.
Resolução: ( )rapaz 0,51p P= =
X (o acontecimento) é o numero de meninos.
n (provas) “… num total de 5 filhos … “ (poderá ser 0,1,2,…).
( ) ( )~ ; ~ 5 ; 0,51 .X Bin n p X Bin=
A variável aleatória X que representa o número de sucessos em n provas de Bernoulli, com
probabilidade de sucesso em cada prova p, é conhecida como variável aleatória binomial. Por
comodidade denota-se por ( )~ ; .X Bin n p
Se ( )~ ; X Bin n p então a função massa de probabilidade de X é dada por:
( )
( ) { }
{ }
1 se 0,1,2,...,
: , tal que
0 se \ 0,1, 2,...,
n xxn p p x n
xf R R f x
x R n
−�� �
− ∈�
�
→ = � �
� ∈
( ) ( ) ( ) ( ) ( ) ( )25 53 3 31 0,51 1 0,51 0,13265 0,43
5
93
n xxP X p C
n
p
x
− −� � � �
= = − = − =
�
�
� � � �
( )( ) ( )10 0,13265 0,2401 0,3185= ≈
Nota: quando nada nos é dito, utiliza se a binomial, pois quando é para se utilizar a equação
do Poisson é nos pedido.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 228/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Exercício 3: Se a probabilidade de um casal se divorciar nos primeiros 20 anos de casamento é
0.60, qual é a probabilidade que em 6 pares, agora casados, nos próximos 20 anos:
3.1. Nenhum se divorcie?
3.2. Todos se divorciem?
3.3. Exactamente 2 se divorciem?
3.4. Pelo menos 2 se divorciem?
Resolução 3.1: o 20 não tem qualquer utilidade! É para enganar.
X (o acontecimento) é o número de divórcio num conjunto de 6 casais (número de provas).
( ) ( ) ( ) ( ) ( )( )06 606
0
0 1 0,6 1 0,6 1 0
0
6
, 4
n xxP X p C
n
x
p
− −� � � �
= = − = − =
�
�
� � � �
( ) ( )( )1 1 0,004096 0,004096= =
Resolução 3.2:
( ) ( ) ( ) ( ) ( ) ( )6 66
66
6
6 1 0,6 1 0,6 0, 6656 1
6
04
n xxP
n
x
X p p C
− −� � � �
= = − = − =
�
�
� � � �
( ) ( ) ( )1 0,046656 1 0,046656= =
Resolução 3.3:
( ) ( ) ( ) ( ) ( ) ( )26 62 22 1 2
0,6 1 0,6 0,36 0,025
6
6
n xxP X p p C
n
x
− −� � � �
= = − = − =
�
�
� � � �
( )( )( )15 0,36 0,0256 0,13824= =
Resolução 3.4: cuidado aqui, pois é pelo menos 2. Logo pode ser 3, 4, 5, …
( ) ( )
Tenho 4 hipoteses! Tenho 2 hipoteses!
2 1 2P X P X≥ = − <
����� �����
.
Logo é mais fácil de calcular de até 2, e depois subtraiu a 1 este valor:
( ) ( ) ( )1 2 1 0 1P X P X P X− < = − = − = ⇔
( ) ( ) ( ) ( ) ( )0 1606 11 2 1 0,6 1 0,6 0,6 1 0,6
1
6 6
0
P X
− −� � � �� � � �
⇔ − < = − − − − ⇔� � � �
�
�
� � � �� � � �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 229/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( ) ( )( ) ( )( )66 160
5
1 2 1 1 0,4 0,6 0,4P X C C� � � �⇔ − < = − − ⇔
� � � �
( ) ( )( )( ) ( ) ( ) ( )1 2 1 1 1 0,004096 6 0,6 0,01024P X⇔ − < = − − ⇔� � � �� � � �
( )( )1 2 0,95904 2 0,95904P X P X− < = ⇔ ≥ =
7 - Um estudo encomendado por uma empresa permitiu apurar que aproximadamente 60% dos
seus trabalhadores mantinham uma atitude cooperativa face à empresa, 30% uma atitude hostil
e 10% uma atitude não definida.
7.1 Qual é a probabilidade de num grupo de 12 trabalhadores pelo menos 6 adoptarem uma
atitude hostil face à empresa?
7.2 Qual é a probabilidade de num grupo de 20 trabalhadores no mínimo 2 terem uma atitude
bem definida?
7.3 Qual é o número esperado de trabalhadores, num grupo de 50, com uma atitude
cooperativa?
Resolução 7.1: Cuidado com o “…pelo menos …” e ( ) ( )~ ; ~ 12 ; 0,3 .X Bin n p X Bin=
X é o numero de trabalhadores num grupo de 12, que mantêm uma atitude hostil.
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
pelo menos
6 6 7 8 9 10 11 12P X P X P X P X P X P X P X P X≥ = = + = + = + = + = + = + =
�����
Vou fazer só o arranque, pois é massador:
( ) ( ) ( ) ( )1212 6 666 1 0,3 1 0,3
xx nP X p p
x
C
n − −� �
= = − = −
�
� �
( ) ( ) ( ) ( )1212 7 777 1 0,3 1 0,3
xx nP X p p
x
C
n − −� �
= = − = −
�
� �
( ) ( ) ( ) ( )1212 8 888 1 0,3 1 0,3
xx nP X p p
x
C
n − −� �
= = − = −
�
� �
( ) ( ) ( ) ( )1212 9 999 1 0,3 1 0,3
xx nP X p p
x
C
n − −� �
= = − = −
�
� �
( ) ( ) ( ) ( )10 101
1212
010 1 0,3 1 0,3
xx nP X p p
x
C
n − −� �
= = − = −
�
� �
, pronto não faço mais…
Mas deve de dar perto dos 11,8%.
É mais fácil usar a tabela da binomial Cumulativa, com n = 12, r = 6, e p = 0.3!
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 230/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução 7.2: ( ) ( )~ ; ~ 20 ; 0,9 .Y Bin n p Y Bin=
Cuidado, pois o 0,9 é de facto 0,6+0,3!
Y é o numero (de sucessos) de trabalhadores num grupo de 20 (número de provas), que
mantêm uma atitude bem definida.
( ) ( ) ( ) ( )2 1 2 1 0 1P Y P Y P Y P Y≥ = − < = − = − =
( ) ( ) ( ) ( )2020 0 000 1 0,9 1 0,9
yy nP Y p p
y
C
n − −� �
= = − = −
�
� �
( ) ( ) ( ) ( )2020 1 111 1 0,9 1 0,9
yy nP Y p p
y
C
n − −� �
= = − = −
�
� �
( ) ( ) ( )20 192 1 1 x 1 x 0,1 20 x 0,9 x 0,1 1P Y ≥ = − − ≈
É mais fácil usar a tabela da binomial Cumulativa, com n = 20, r = 2, e p = 0.9!
Resolução 7.3: como se perante uma Binomial, então ( )E X np= e ( ) ( )1 .Var X np p= −
Não confundir este X com o exercício anterior, por isso vou utilizar o “Z”.
E ~=� . Numa Binomial, a média esperada é dada pela fórmula:
( ) x 50 x 0,6 30E Z n p= = = .
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 231/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Variável Aleatória Binomial Negativa
Foi já estudada a distribuição binomial como o modelo probabilístico adequado para descrever
os resultados associados a uma sucessão de provas de Bernoulli. A distribuição binomial
supõe a realização de “n” provas de Bernoulli, sendo aleatório o número de sucessos
observados nessas “n” provas. Se, pelo contrário se fixa o número de sucessos, digamos “r”, e
pretendemos considerar o número de provas de Bernoulli necessárias até se obter aqueles “r”
sucessos, temos uma outra variável aleatória (v.a.) definida. Neste caso o número de provas é
aleatório.
Definição - l: Considere uma sucessão de provas de Bernoulli, sendo “p” a probabilidade de
ocorrer sucesso em cada prova. A variável aleatória X que representa o número de provas
de Bernoulli necessárias até atingir “r” sucessos é conhecida por variável aleatória binomial
negativa. Podemos denotar essa variável por ( )~ r ; .X Bne p
Observação: Se ( )~ r ; .X Bne p então { }, 1, 2,...xCD r r r= + + . Como { }, 1, 2,...r r r+ + é
um conjunto contável, podemos afirmar que X é uma variável aleatória discreta.
Definição: Seja ( )~ r ; .X Bne p Diz-se que X é uma variável aleatória geométrica se e só se
r =1.
Observação 1: Se ( )~ r ; X Bne p então a função massa de probabilidade de X é dada por:
( )
( ) { }
{ }
1
1 se , 1, 2,...
1: , tal que
0 se \ , 1, 2,...
x rrx p p x r r r
rf R R f x
x R r r r
−� −� �
− ∈ + +�
�−→ = � �
� ∈ + +
Observação 2: Se ( )~ r ; X Bne p então ( ) rE X
p
= e ( ) 2
1 p
Var X r
p
−
= .
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 232/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Exercícios sobre Variável Aleatória Binomial Negativa
1 - A probabilidade de um atirador acertar no alvo é 0,6. Considere a variável aleatória (v.a.):
X: número de tiros que o atirador tem de efectuar até acertar pela terceira vez. Calcule:
1.1 ( )3P X = ;
1.2 ( )10P X = ;
1.3 O valor médio e a variância de X
Resolução: “…até acertar pela terceira vez.” é o número de provas a realizar (neste caso é 3).
Enunciando matematicamente é ( ) ( )~ r ; 3 ; 0,6 .X Bne p X Bne= �
( )
( ) { }
{ }
1
1 se , 1, 2,...
1: , tal que
0 se \ , 1, 2,...
x rrx p p x r r r
rf R R f x
x R r r r
−� −� �
− ∈ + +�
�−→ = � �
� ∈ + +
1.1 - Por coincidência, o “r” é igual ao “x”, e o “x” (3) é o número de sucessos pretendidos.
( ) ( ) ( ) ( ) ( )( )3 33
1 1
1 0,6 1
3
3 3 0,6
1 3 1
x rrP f p p
r
x
X
−−� − � −� � � �
= = − = − ⇔
�
�− −� � � �
=
( ) ( ) ( ) ( ) ( ) ( )
3 3 0
13
1 . 0,6 . 0, 4 0,3 2163P f CX − −= = = =
( )
( ) { }
{ }
1
1 se , 1, 2,...
11.2 : , tal que
0 se \ , 1, 2,...
x rrx p p x r r r
rf R R f x
x R r r r
−� −� �
− ∈ + +�
�−→ = � �
� ∈ + +
( ) ( ) ( ) ( ) ( )( )10 33
1 1
1 0,6 1 0
10
10 10 ,
1 3
6
1
rr xX p
r
p
x
P f
−−� − � −� � � �
= = − = − ⇔
�
�− −� � � �
=
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
3
3
7 3 71 9
21
10 . 0,6 . 0,4 . 0,1 6 . 0,4 0,010 1 270 4P f CX C− −= = = = ≈
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 233/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( ) ( )
( )
( )22
3 1 1 0,6
1.3 5 3 3, 3
0,6 0,6
r p
E X Var X r
p p
− −
= = = ∧ = = =
2 - Um jovem casal deseja ter exactamente duas filhas. Considere que o casal terá filhos
(rapazes ou raparigas) até realizar o desejo. Qual é a probabilidade de o casal vir a ter 4
crianças?
( ) ( ): ~ r ; 2 ; 0,5 .Resolução X Bne p X Bne= �
( )
( ) { }
{ }
1
1 se , 1, 2,...
1: , tal que
0 se \ , 1, 2,...
x rrx p p x r r r
rf R R f x
x R r r r
−� −� �
− ∈ + +�
�−→ = � �
� ∈ + +
( ) ( ) ( ) ( ) ( )( )4 22
1 1
1 0,5 1
4
4 4 0,5
1 2 1
x rrP f p p
r
x
X
−−� − � −� � � �
= = − = − ⇔
�
�− −� � � �
=
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
4 22
2
2 21 3
11
3
. 0,5 . 0,54 . 0,5 .4 0,5 0,1875.
16
P fX C C− −= = = = ==
3 - Um indivíduo que faz anos em Janeiro dispõe-se a inquirir pessoas ao acaso até encontrar
uma que faça anos também no mesmo mês.
3.1. Qual é a probabilidade de inquirir menos de 6 pessoas?
3.2. Qual é o número médio de inquirições que tem de fazer até ter sucesso?
( ) 1
"... at enc
1
3.1: ~ r ; ~
ontrar uma .
;
"... inquirir menos ..
.
1
.
.
"
2
.
"
Resolução X Bne p
é
X Bne
� �∧ =
�
� �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 234/305
Sugestões: jrvalente@netmadeira.comProbabilidades e Estatística
( )
( ) { }
{ }
1
1 se , 1, 2,...
1: , tal que
0 se \ , 1, 2,...
x rrx p p x r r r
rf R R f x
x R r r r
−� −� �
− ∈ + +�
�−→ = � �
� ∈ + +
� ( ) ( ) ( ) ( ) ( ) ( )
inquirir menos
6 1 2 3 4 5 6X X X XP P P PX XP P P X≤ =
� �
= + + + + +
� =
�
= =
�
= =
Vou decompor, pois é mais simples:
( ) ( ) ( )
11 11 1 1 1
1 1
1 1 12 12
1
1 1
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =
�
�
�
�
�− − � � � �� �� � � �
�
=
( ) ( ) ( ) ( )
1
0
1
1 1
1 11 1 1
. . 1. .1 0,08333333
12 12 12
1
12
1P f CX − −
� �= = = = =
�
� �
=
( ) ( ) ( )
11 21 1 1 1
1 1
1 1 12 12
2
2 2
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =
�
�
�
�
�− − � � � �� �� � � �
�
=
( ) ( ) ( ) ( )
1
1
1
2
21
1 11 1 11 11
. . 1. . 0,0764.
12 12 12
2 2
12 12
P fX C− −
� �= = = = =
�
� �
=
( ) ( ) ( )
11 31 1 1 1
1 1
1 1 12 12
3
3 3
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =
�
�
�
�
�− − � � � �� �� � � �
�
=
( ) ( ) ( ) ( )
2 2 2
1
1 2 31
3 1 11 1 11 11. . 1. . 0,07002
12 12
3 3
12 12 12
P X f C− −
� �= = = = =
�
� �
=
( ) ( ) ( )
11 41 1 1 1
1 1
1 1 12 12
4
4 4
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =
�
�
�
�
�− − � � � �� �� � � �
�
=
( ) ( ) ( ) ( )
4
3 3 3
1
11 3 4
1 11 1 11 11
. . 1. . 0,0642
12 12
4
12 12
4
12
P f CX − −
� �= = = = =
�
� �
=
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 235/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( ) ( ) ( )
11 51 1 1 1
1 1
1 1 12 12
5
5 5
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =
�
�
�
�
�− − � � � �� �� � � �
�
=
( ) ( ) ( ) ( )
4 4 4
1
1 4 51
5 1 11 1 11 11. . 1. . 0,05884.
12 12 12 12 1
5
2
5P f CX − −
� �= = = = =
�
� �
=
( ) ( ) ( )
11 61 1 1 1
1 1
1 1 12 12
6
6 6
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =
�
�
�
�
�− − � � � �� �� � � �
�
=
( ) ( ) ( ) ( )
5 5 5
1
1 5 61
6 1 11 1 11 11. . 1. . 0,05394.
12 12 12 12 1
6
2
6P f CX − −
� �= = = = =
�
� �
=
Agora tudo junto:
( ) ( ) ( ) ( ) ( ) ( ) ( )6 1 2 3 4 5 6X X X XP X X XP P P P P P≤ = = == + + + + += = =
( )
2 3 4 5
2 3 4 5 6
1 11 11 11 11 11
12 12 12 12 2 12
6
1
XP
� � � � � � � �� � � �
= + + + + +
�
�
�
�
�
�
� � � � � � � � � � � �
≤
( ) 2
1 11 11 11 11 11
1 1 1 1 0,40673.
12 12 12 12 2 12
6
1
XP
� �� �� �� � � �= + + + + + =
�
�
�
�
�
�� � � �� �� �� �
≤
( ) 1 3.2 : "Qual o n mero m dio ..." 12 (Valor médio).
1
12
r
Resolução é ú é E X
p
→ = = =
4 - Um homem tem 10 chaves, das quais apenas uma abre um cofre. Calcule a probabilidade
do homem abrir o cofre somente na quinta tentativa sabendo que o homem está embriagado e
que este não separa as chaves a cada tentativa infrutífera.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 236/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução – é sem reposição!
Recordar a definição: Seja ( )~ r ; .X Bne p Diz-se que X é uma variável aleatória geométrica
se e só se r =1.
( ) 1~ r ; ~ 1 ; .
10
Geometrica
X Bne p X Bne
� �
=
�
� ����������������
( )
( ) { }
{ }
1
1 se , 1, 2,...
1: , tal que
0 se \ , 1, 2,...
x rrx p p x r r r
rf R R f x
x R r r r
−� −� �
− ∈ + +�
�−→ = � �
� ∈ + +
( ) ( ) ( )
11 51 1 1 1
1 1
1 1 10 10
5
5 5
1
rxrP X f p p
x
r
−
− �� − −� � � � � �� � � � �= = − = − =
�
�
�
�
�− − � � � �� �� � � �
�
=
( ) ( ) ( ) ( )
5
4
11
1 1 9. . 1 x 0,1 x 6,561 0,6561
10 1
5 5
0
fXP C− −
� �= = = ≈
�
� �
=
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 237/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Variável Aleatória Hipergeométrica
Definição: Suponha-se que uma população tem um total de N elementos, k dos quais
apresentam a característica S. Consideremos a experiência aleatória que consiste em extrair ao
acaso e sem reposição “n” desses elementos e seja X o número de elementos com a
característica S entre os “n” extraídos. Dizemos que X é uma variável aleatória
hipergeométrica e representamos por
( )~ N ; ; .X Hip n k
( ) ( ) ( ){ } 1: Se ~ N ; ; ent o max 0, , ... ,min , . xX Hip n k ã CD n N k n k− = − +Observação
Como um conjunto finito ent o X uma vari vel aleat ria discreta. xCD é ã é á ó
( ) 2 : Se ~ N ; ; ent o a fun o massa de probabilidade de X :X Hip n k ã çã é−Observação
( )
se
: , tal que
0 se \
x
x
k N k
x n x
x CD
Nf R R f x
n
x R CD
� −� �� �
�
�
�−� �� �� ∈�
→ = � �
��
� ��
∈�
( ) ( ) ( ) ( )( )
( )2
3 : Se ~ N ; ; ent o e .
1
nk N k N nnk
X Hip n k ã E X Var X
N N N
− −
− = =
−
Observação
“N” é o total, “n” é a quantidade extraída sem reposição, e “k” a quantidade existente.
Exercícios sobre Variável Aleatória Hipergeométrica
1 - Considere-se a variável aleatória X que representa o número de cartas de copas em quatro
retiradas aleatoriamente sem reposição de um baralho vulgar de 52 cartas.
1.1. Construa a tabela de distribuição de probabilidades da variável X.
1.2. Calcule a média e a variância de X.
1.3. Qual é a probabilidade de serem todas de copas?
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 238/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução 1.1:
( ) ( )
13 13 1352
52
0 0
39
4 4
4
52
0
4
x x x
0,303820 0 x x
k kN
n
N
n
n C C C C C C
P f
C C C
n
X
k
x x
N
N
k
− −
− −
−� �� �
�
�−� �� �= = = = = =
�
�
� �
=
�
( ) ( ) 1
1352
52 5
313 1
1
2
9
34
4 4
3
1 x x x 0,438841 81 x x
N
N
k k
n
n
k
n C C C CC C
P
x x
X f
C C C
n
N
kN
− −
− −
−� �� �
�
�−� �� �= = = = = =
� �
�
�
=
�
( ) ( ) 2 2 2
13 13 152
52
3
5
9
2
3
4
2
4 4
x x x
0,2134932 2 x x
N
N
k k
n
n
k
n C C C C C C
P f
C C C
n
N k
x
N
x
X
− −
− −
−� �� �
�
�−� �� �= = = = = =
� �
�
�
=
�
( ) ( )
13 13 1352
52
3 3
39
4 1
4
52
3
4
x x x
0,041023 3 x x
k kN
n
N
n
n C C C C C C
P f
C C C
n
X
k
x x
N
N
k
− −
− −
−� �� �
�
�−� �� �= = = = = =
�
�
� �
=
�
( ) ( ) 4
1352
52 5
313 1
4
2
9
04
4 4
3
4 x x x 0,002644 14 x x
N
N
k k
n
n
k
n C C C CC C
P
x x
X f
C C C
n
N
kN
− −
− −
−� �� �
�
�−� �� �= = = = = =
� �
�
�
=
�
Tabela de probabilidade
0 1 2 3 4
0,304 0,439 0, 213 0,041 0,003 A soma é 1
X
�
=
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 239/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução 1.2:
( ) ( ) ( ) ( )( )
( )2
Se ~ ; ; .
1
n nn N N
N
k
Hip n E
kk
VkX
N N
XarX
N
− −
� = ∧ =
−
( ) 4 x 1
52
13
X
kn
E
N
= = =
( ) ( ) ( )
( )
( ) ( ) ( )( )
( ) ( )22
5213 524 4
0,706
1 52 52 1
13n n
XV
k
r
N N
N N
a
k− − − −
= = =
− −
Resolução 1.3: N=52, X=4, e k=13.
( )Se ~ N ; ; X Hip n k �
( ) ( ) 4
1352
52 5
313 1
4
2
9
04
44
3
4 x x x 0,002644 14 x x
N
N
k k
n
n
k
n C C C CC C
P
x x
X f
C C C
n
N
kN
− −
− −
−� �� �
�
�−� �� �= = = = = =
� �
�
�
=
�
2 - Numa remessa de 440 iogurtes de diversos sabores 20% são de sabor a morango.
Qual é a probabilidade de, escolhendo 10 ao acaso, 6 serem de sabor a morango?
Resolução:
440 440 x 0, 2 88 10
cuidado
N k n= ∧ = = ∧ =���������
( ) ( )~ ; ; ~ 4 ; 104 ; 880NX Xp n HipkHi ⇔
( ) ( )
440
440
6 6
352
10
88 88
440
6
1
8
4
0 10
8
6 4
x x x x xn
k N
n
k
N
x
N
N
k k
n x
X
C C C C C C
P f
C C C
n
− −
− −
−� �� �
�
�−� �� �= = = = = =
� �
�
=
� �
( ) 0,005046XP = =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 240/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
3 - Considere uma lotaria que vende 100 bilhetes dos quais 5 contém um prémio. Suponha
que compra 7 bilhetes. Qual a probabilidade de ganhar pelo menos um prémio?
Resolução:
100 5 7N k n= ∧ = ∧ =
( ) ( )~ ; ; ~ ; 57 ;1 00X XHip n k pN Hi⇔
( ) ( ) ( )1 11 1 0X X XP P P≥ <− = − ==
( ) ( ) 0 0 0
5 5 5100
100
95
7 7
100
7 7
x x x
0,690300 0 x xn
k N
n
k
N
k
n C C C C C C
P f
C C
x x
X
C
n
N
kN
− −
− −
−� �� �
�
�−� �� �= = = = = =
�
�
� �
=
�
Mas o que se pretende é:
( ) ( ) ( )1 1 1 0,69030 0,30961 0 61 9X X XP P P= − = − = − =≥ < =
Variável Aleatória de Poisson
Definição: Uma variável aleatória X com função massa de probabilidade dada por
( ) 0
0
se
: , tal que , com 0,!
0 se \
xe
x N
f R R f x x
x R N
λλ
λ
−�
∈�
→ = >
� ∈
é designada por variável aleatória de Poisson de parâmetro λ . Simbolicamente representa-se
por ( )~ .X Poi λ
Observação: Se ( )~ X Poi λ então X é uma variável aleatória discreta porque é contável
o conjunto 0.xCD N=
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 241/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Suponha-se que nos era pedido um modelo para o número de ambulâncias que chega ao
serviço de urgências do Hospital de Santa Maria, ou o número de automóveis que pára num
posto de abastecimento de gasolina na auto-estrada, o número de chamadas telefónicas que
chega a um posto de atendimento de pedidos de táxis, o número de espectadores de um jogo
de futebol que entra para o estádio, ou de participantes que chegam a uma manifestação, o
número de linfócitos 4T num volume de sangue, o número de peixes que se encontra num
dado volume de água, o número de moléculas de anidrido sulfuroso num determinado volume
de ar junto de uma via de acesso a Lisboa, ou o número de ninhos de grifos que são avistados
por um observador quando desce o Douro.
Representando por ( )N t o número de chegadas no intervalo ] ]0 ; ,t a família de variáveis
aleatórias ( ){ }: 0 N t t ≥ é um processo estocástico, isto é, depende do acaso; é um processo
de contagem, que assume os valores inteiros 0,1, 2, ... k = , considerando, como é natural,
( )0 0. N =
O processo que vamos estudar, chamado processo de Poisson, presta-se tão bem a modelar a
homogeneidade temporal quanto a homogeneidade espacial.
As simplificações que vamos fazer para modelar de forma simples um processo de contagem
do número de observações no intervalo ] ]0 ; t são três.
Axiomática do Processo de Poisson:
P1: O processo de chegadas é "regular", no sentido de homogéneo no tempo, isto é, se
fizermos uma translação no tempo isso não deve alterar a essência do processo.
Assim, P1 afirma que ( ) ( ) ( ) ( )2 1 2 1P N t N t k P N t h N t h k− = = + − + =� � � �� � � � , com
0,1,2, ...k = Por exemplo: estudar o processo entre as 9h e as 10h deve ser idêntico a estudá-
lo entre as 9h23m e as 10h23m.
P2: O que se passa num intervalo não é informativo sobre o que se passa num outro intervalo
disjunto do primeiro, para além da homogeneidade atrás postulada.
Assim, se ] ] ] ]1 2 3 4, , ,t t t t = ∅� então
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )2 1 4 3 2 1 4 3 x P
Intervalo Intervalo
P N t N t k N t N t j P N t N t k N t N t j
� �
� �− = − = = − = − =� � � �� � � �
� �� �
�
��������� ���������
Se soubermos que foram pedidos 6 táxis a uma central entre as 9h12m e as 9h23m, isso não
nos diz nada sobre quantos vão ser pedidos entre as 9h42m e as 10h28m e também não nos diz
nada sobre quantos vão ser pedidos entre as 9h34m e as 9h45m.
P3: Não há chegadas (exactamente) simultâneas, isto é, ( ) ( ) ( )2 ,P N t dt N t o dt+ − ≥ =� �� � e a
probabilidade de se observar uma chegada cresce regularmente, linearmente, com a amplitude
do intervalo de observação, em intervalos muito pequenos.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 242/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Mais precisamente, vamos supor que o processo é grosseiramente linear, que a menos de um
valor muito baixo e em certo sentido irrelevante e desprezável, a probabilidade de observar
uma ocorrência num intervalo muito curto ] ],t t dt+ é proporcional ao comprimento dt do
intervalo, isto é, ( ) ( ) ( )1 = . P N t dt N t dt o dtλ+ − = +� �� � (A constante de proporcionalidade,
chamada taxa de chegadas, é denotada por λ ).
Teorema: Seja ( ){ }:N t t O≥ um processo de contagem que verifique os postulados P1, P2 e
P3. Então, para cada 0 h ≥ e 0 t > fixos, ( ) ( ) ( )~ . N t h N h Poi tλ+ −
Corolário: Caso particular no caso de 0h = . ( ) ( )~N t Poi tλ
Observação: Por esta razão um Processo Estocástico de contagem ( ){ }: 0N t t ≥ que
verifique os postulados P1, P2 e P3 é denominado processo de Poisson de taxa λ .
Exercícios Variável Aleatória de Poisson
1 - Entre as 14 e as 16 horas, o número médio de chamadas telefónicas por minuto, atendidas
no centro, de comunicações de uma empresa é 2,5. Sabendo que o número de chamadas
sugere uma distribuição de Poisson, calcule a probabilidade de, durante um determinado
minuto haver:
1.1 – Zero chamadas telefónicas.
1.2 – Duas chamadas telefónicas.
1.3 – Quatro ou menos chamadas telefónicas.
1.4 – Mais de 6 chamadas telefónicas.
Resolução: vou utilizar o teorema (na realidade da teoria toda, o que realmente interessa é este
teorema).
( )~ X Poi λ , em que λ é a taxa. ( )�
processo
N t é o número de chegadas no intervalo ] ]0 ; .t
2,5 é o numero de chamadas por minuto, 2,5λ = .
Seja ( )1N , o “um” é de um minuto, ou seja o número de chamadas recebida no intervalo
] ]0 ; 1 .
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 243/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução 1.1: probabilidade de, num minuto, não se receber chamadas.
( )( ) ( )
02,5 2,5
2,5 x 2,5 x x 11 0 0,082
! 0! 1
x ee e
P N e
x
λ λ −− − −= = = = = ≈
Pode se usar a tabela de Poisson Individual, com m = 2,5, x = 0.
( )( )Nota : a probabilidade de se receber zero chamada nota se matematicamen 0te 1 .P N =
Resolução 1.2: probabilidade de, num minuto recebeu 2 chamadas.
( )( ) ( )
22,5 2,5 x 2,5 x x 6,25
1 2 0, 257.
! 2! 2
x ee e
P N
x
λ λ −− −
= = = = ≈
Pode se usar a tabela de Poisson Individual, com m = 2,5, x = 2.
Resolução 1.3: probabilidade de, num minuto, receber menos de 4 chamadas.
( ) ( )() ( )( ) ( )( ) ( )( ) ( )( )4 1 0 1 1 1 2 1 3 1 4P X P N P N P N P N P N≤ = = + = + = + = + = =
Já calculei para ( )( )1 0P N = e para ( )( )1 2 .P N =
( )( ) ( )
12,5 2,5 x 2,5 x 2,5
1 1 0, 20521
1! 1
e e
P N
− −
= = = ≈
( )( ) ( )
32,5 2,5 x 2,5 x 15,625
1 3 0,21376
3! 6
e e
P N
− −
= = = ≈
( )( ) ( )
42,5 2,5 x 2,5 x 39,0625
1 4 0,1336
4! 24
e e
P N
− −
= = = ≈
( ) ( ) ( ) ( ) ( ) ( )4 0,082 0,20521 0,257 0,21376 0,1336 0,8916P X ≤ = + + + + =
É mais fácil usar a tabela de Poisson cumulado, com m = 2,5, x = 5. Depois é subtrair a 1 o
valor da tabela, pois a tabela dá me os valores da direita, e pretende se da esquerda.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 244/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução 1.4: probabilidade de, num minuto, receber mais de 6 chamadas (logo não leva o
sinal de igual, mas só o sinal de maior).
( ) ( )( )6 1 1 6P X P N> = − ≤ ⇔
( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( )6 1 1 0 1 1 1 2 1 3 1 4 1 5 1 6P X P N P N P N P N P N P N P N� �> = − = + = + = + = + = + = + =� �
Já calculei para ( )( )1 0P N = até ( )( )1 4 .P N =
( )( ) ( )
52,5 2,5 x 2,5 x 97,65625
1 5 0,0668
5! 120
e e
P N
− −
= = = ≈
( )( ) ( )
62,5 2,5 x 2,5 x 244,140
1 6 0,02783
6! 720
e e
P N
− −
= = = ≈
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )6 1 0,082 0, 20521 0, 257 0,21376 0,1336 0,0668 0,02783P X > = − + + + + + +� �� �
( ) ( )6 1 0,9862 6 0,0138P X P X> = − ⇔ > =
2 - O número diário de doentes com complicações cardiovasculares que chegam a
determinada unidade de cuidados intensivos segue uma lei de Poisson com média 6. Qual é a
probabilidade de num certo dia, o número de doentes chegados àquela unidade ser, quando
muito, 3.
Resolução - Ora é me dito que 6λ = e o X é o número de doentes diários (X=3).
Cuidado com a palavra escolhida “… ser, quando muito, 3.”
Matematicamente é ( )3P X ≤ . Vou a tabela de distribuição de Poisson (INDIVIDUAL):
Mas é me dito menor ou igual (ou seja estão me a impor um valor máximo!), e a tabela só me
dá para valores “iguais” e não “menor ou igual”. É preciso SOMAR todos os menores:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 245/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Assim fica: ( ) ( ) ( ) ( ) ( )3 0 1 2 3P X P X P X P X P X≤ = = + = + = + = .
( ) ( ) ( ) ( ) ( )3 0,002 0,015 0,045 0,089 0,151P X ≤ = + + + =
Poderia ter ido pela tabela de distribuição de Poisson (CUMULATIVA):
( ) ( )3 1 3P X P X≤ = − > , E como na tabela não tenho ( )3P X > vou ter que ir por ( )4P X ≥
Nota: não tenho ( )3P X > , porque falta o IGUAL. Só tenho maior! Logo o próximo é o 4.
Assim fica ( ) ( ) ( )3 1 4 1 Valor da P X P X Tabela≤ = − ≥ = − . Vou utilizar a tabela dos
Cumulativos:
( ) ( )3 1 4 1 0,847 0,153P X P X≤ = − ≥ = − =
Obviamente os valores não coincidem devido aos arredondamentos.
Neste exercício, o grau de dificuldade está no facto do valor cumulativo das tabelas fornecidas
estão para “maior de que”, e nos exercícios é sempre (ou quase sempre) para “menor de que”.
Por isso é necessário realizar estes passos todos. Calcula-se para cima, e depois subtrai se a
um.
Nota: se em vez de ser ( )3P X ≤ , fosse ( )3P X = , então seria ( )3 0,089P X = =
3 - Uma loja tem uma média de 6 clientes por dia, e é razoável admitir que o número de
clientes diários segue uma distribuição de Poisson.
3.1 Qual é a probabilidade de aparecerem menos de 2 clientes num certo dia?
3.2 Qual é a probabilidade de aparecerem no total de 2 dias seguidos, 2 ou menos clientes?
3.3 Qual é a probabilidade de num dia aparecer exactamente 1 cliente e no dia seguinte
aparecer também só 1 cliente?
3.4 Qual é a probabilidade de aparecerem 4 clientes num dia, sabendo que no dia anterior
apareceu dois clientes?
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 246/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução: X é o número de clientes por dia, que neste caso é 6. Nota sempre que no
enunciado falar em “média” ou “taxa”, usa se SEMPRE a distribuição de Poisson.
“…uma média de 6 clientes…”
( ) ( )~ ~ 6X Poi X Poiλ =
3.1 – “…menos de 2…” representa-se assim: ( ) ( ) ( )2 0 1P X P X P X< = = + =
Para usar a “Tabela de três decimais para a distribuição de Poisson (termo CUMULATIVO) ”
tenho que reescrever a equação, mas numa igualdade (obviamente):
( ) ( )2 1 2 1 0,981 0,019P X P X< = − ≥ = − =
3.2 – “…total de 2 dias seguidos ou menos …”, cuidado, pois já não é a mesma variável. Vou
por isso usar o .Y Assim Y é o numero de clientes por cada dois dias seguido, e representa se
matematicamente por:
( ) ( )~ ~ 12X Poi X Poiλ =
É 12 , pois é dois dias seguidos, e como sei que em cada dia é seis, é só somar (!).
( ) ( )2 1 2P X P Y Cuidado≤ = − > = , pois tem que ser ( )3P Y ≥ , ficando assim:
( ) ( ) ( )2 1 2 1 3P X P Y P Y≤ = − > = − ≥
Agora vou a tabela:
Fica ( ) ( )2 1 2 1 0,998 0,002P X P Y≤ = − > = − = .
3.3 – “…exactamente 1…” 1 número de clientes no dia 1.X →
O dia 1 não é o primeiro dia do mês, mas sim o primeiro dia da contagem!
2 número de clientes no dia 2.X →
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 247/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
A distribuição de Poisson de parâmetro 6, que se representa por ( ) ( )1~ ~ 6X Poi X Poiλ =
E o 2º dia é ( ) ( )2~ ~ 6X Poi X Poiλ =
( )1 21 1P X X= ∧ = são variáveis independentes. Por isso posso fazer:
( ) ( ) ( ) ( )1 21 x 1 0,015 x 0,015 0,000225P X P X= = = =
Na tabela, em que λ é “m” e X é x.
Nota: � � � �
1 2 1 21 1 1 1
x
X X X X
P A B P A P B
= = = =
� � � � � �
=
�
�
�
� � � � � �
� , se “A” e “B” forem independentes.
Como se sabe se são independentes, é impor a condição “se”:
� �
� �
1 2
1 2
1 1
1 1
x
|
X X
X X
P A P B
P A B
= =
= =
� � � �
�
�
� � � � � �
=
�
� �
�
2 1X
P B
=
� �
�
� �
�
1 1X
P A
=
� �
=
�
� �
Para �
1 1X
P A
=
� �
�
� �
, não é preciso saber o que ocorreu em �
2 1X
P B
=
� �
�
� �
.
3.4 – ( ) ( )2 1 24 | 2 4 !P X X P X= = = = ,são variáveis independentes, como se viu no alínea 3.3.
Na tabela fico a saber que ( )2 4P X = é 0,134 (usando a tabela INDIVIDUAL, pois é igual e
não maior ou igual).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 248/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Tabela de três decimais para a distribuição de Poisson (termo INDIVIDUAL)
Observação: no processo de Poisson a fórmula é
( )
6 4. .6
0,1339
! 4!
xe e
P X x
x
λ λ− −
= = = = .
4 - Na linha de atendimento a clientes de um centro comercial recebe-se em média quatro
chamadas de reclamações por dia.
4.1 Calcule a percentagem de dias em que não há reclamações.
4.2 Qual a probabilidade de num dia se receber de três a seis queixas?
4.3 Qual a probabilidade de numa semana (2.a a 6.a feira) se receberem exactamente 15
reclamações?
4.4 Qual a probabilidade de se receber pelomenos uma reclamação em todos os dias de uma
semana?
Resolução: cuidado, pois apesar de não ser explicito o método da distribuição a usar, ela é
implícita (palavras caras, mas não encontrei outras!). Ou seja, não me é dito directamente para
usar o processo Poisson, mas é me dito indirectamente pois vem a palavra “… média…”.
4.1 “…não há reclamações …” é para X=0. A média é 4.λ =
( ) ( )~ ~ 4X Poi X Poiλ→ =
Em que X é o número de reclamações por dia.
( ) ( )
04. .
! !
4
0
0
xe e
P X Px
x
X
λ λ− −
= = → = = ⇔
( ) ( ) ( )
4
0 0
.1
0,018 1,0 8%
1
e
P X P X P X
−
⇔ = = ⇔ = = ⇔ = =
Pode se usar a tabela de Poisson Individual, com m = 4, e x = 0.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 249/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
4.2 ( ) ( ) ( )3 6 3 6 P X P X P X≤ ≤ = ≥ − ≥
( )Errado!, pois " 6" . O sinal menos é para retirar ao todos os que têm o 6 7 .X X X= ∈ > ≥
Pretende se o intervalo de 3 a 6. Calcula-se para maiores do que 3, e retira-se os maiores do
que 7. Não é 6, pois 6 ainda pertence ao intervalo. E como são variáveis discretas, escolhe-se
o numero a seguir. Correcto é assim:
( ) ( ) ( )3 6 3 7 3,4,5,6, 7P X P X P X≤ ≤ = ≥ − ≥ = , 8 , 9 , 10{ }
3
,... 7
X ≥
−
�����������
, 8 , 9 , 10{ } { }
3 67
,... 3, 4,5,6
XX ≤ ≤≥
=
������������
Este raciocínio é feito pelo simples facto da tabela cumulativa ser feita para “cima” (maior ou
igual) e o que se pretende é para “baixo” (menor ou igual). Como se pretende até ao 6, retira
se a partir do 7:
( ) ( ) ( ) ( ) ( )3 6 3 7 0,762 0,111 0,651P X P X P X≤ ≤ = ≥ − ≥ = − =
Tabela de três decimais para a distribuição de Poisson (termo CUMULATIVO)
4.3 Vou utilizar outra variável pois o meu λ é diferente. É 20! Porquê?
Porque se é de 2ª a 6ª, perfaz 5 dias, e a média diária não altera por se escolher um
determinado período mais alargado, logo mantém se os 4 diários.
Assim ( ) ( )~ ~ 20Y Poi Y Poiλ→ =
( ) ( ) ( )
20 15. .
015 15 ,05165
! !
15
15
20xe e
P Y P Y Y
x
P
λ λ− −
= = → = = ⇔ = =
Não posso utilizar a tabela, pois esta só vai até a 14.λ =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 250/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Mas o Excel não tem limites (!), e aqui está a confirmação de que a formula nos dá o valor
correcto:
4.4 ( ) ( ) ( ) ( ) ( ) ( ) ( )Domingo 2ª 3ª 4ª 5ª 6ª Sabado1 1 1 1 1 1 1P X P X P X P X P X P X P X≥ ∧ ≥ ∧ ≥ ∧ ≥ ∧ ≥ ∧ ≥ ∧ ≥
( ) ( )
7 7
1 0,982 0,88P X= ≥ = =� �� �
5 - O número de golos marcados por uma equipa de futebol até às t horas de jogo segue um
processo de Poisson de taxa 1,8.λ =
5.1 Qual é a probabilidade se ser marcado um golo durante a primeira meia hora de jogo?
5.2 Qual é a probabilidade de ser marcado 1 golo nos primeiros 15 minutos de jogo e 2 golos
nos últimos 40 minutos do jogo?
Resolução – para facilitar a interpretação do exercício, vou recordar a teoria (tem que ser!).
Axiomática do Processo de Poisson:
P1: O processo de chegadas é "regular", no sentido de homogéneo no tempo, isto é, se
fizermos uma translação no tempo isso não deve alterar a essência do processo.
Assim, P1 afirma que ( ) ( ) ( ) ( )2 1 2 1P N t N t k P N t h N t h k− = = + − + =� � � �� � � � , com
0,1,2, ...k = Por exemplo: estudar o processo entre as 9h e as 10h deve ser idêntico a estudá-
lo entre as 9h23m e as 10h23m.
P2: O que se passa num intervalo não é informativo sobre o que se passa num outro intervalo
disjunto do primeiro, para além da homogeneidade atrás postulada.
Assim, se ] ] ] ]1 2 3 4, , ,t t t t = ∅� então
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )2 1 4 3 2 1 4 3 x PP N t N t k N t N t j P N t N t k N t N t j− = − = = − = − =� � � � � �� � � � � ��
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 251/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Se soubermos que foram pedidos 6 táxis a uma central entre as 9h12m e as 9h23m, isso não
nos diz nada sobre quantos vão ser pedidos entre as 9h42m e as 10h28m e também não nos diz
nada sobre quantos vão ser pedidos entre as 9h34m e as 9h45m.
P3: Não há chegadas (exactamente) simultâneas, isto é, ( ) ( ) ( )2 ,P N t dt N t o dt+ − ≥ =� �� � e a
probabilidade de se observar uma chegada cresce regularmente, linearmente, com a amplitude
do intervalo de observação, em intervalos muito pequenos.
Mais precisamente, vamos supor que o processo é grosseiramente linear, que a menos de um
valor muito baixo e em certo sentido irrelevante e desprezável, a probabilidade de observar
uma ocorrência num intervalo muito curto ] ],t t dt+ é proporcional ao comprimento dt do
intervalo, isto é, ( ) ( ) ( )1 = . P N t dt N t dt o dtλ+ − = +� �� � (A constante de proporcionalidade,
chamada taxa de chegadas, é denotada por λ ).
Trata se de uma família de v.a. Para cada t tem se uma variável de Poisson.
( )X t - é o numero de golos marcados no intervalo de tempo ] ]0 ; ,t com t em horas.
Teorema: Seja ( ){ }:N t t O≥ um processo de contagem que verifique os postulados P1, P2 e
P3. Então, para cada 0 h ≥ e 0 t > fixos, ( ) ( ) ( )~ . N t h N h Poi tλ+ −
( ) ( )~X t Poi tλ
Para o h tenho a liberdade de lhe atribuir um numero qualquer. Vou escolher o zero. 0.h =
Corolário: Caso particular no caso de 0h = . ( ) ( )~N t Poi tλ
Observação: Por esta razão um processo estocástico de contagem ( ){ }: 0N t t ≥ que verifique
os postulados P1, P2 e P3 é denominado processo de Poisson de taxa λ .
Assim continuando o raciocínio o e sabendo de que 1,8λ = :
( ) ( ) ( ) ( )( )~ ~ 1,8N t Poi t N t Poi tλ →
Nota: “…de taxa 1,8.λ = ” é uma frequência, logo usa se o Processo Poisson.
Agora que já pus as ideias em ordem, vou finalmente resolver o exercício.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 252/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
5.1
1
1
2
P X
� �� � =
�
�
� �� �
, em que
1
2
é a meia hora de tempo (não confundir com meio jogo).
( ) ( ) ( ) ( )
Processo Poisson
Agora já se tem uma
Variavel Aleatoria de Poisson
1 1 1
~ ~ 1,8 ~ 0,9
2 2 2
N t Poi t N Poi N Poiλ
� �� � � � � �
→ ⇔
�
�
�
�
� � � � � �� �������� ���������
Agora vou a “Tabela de três decimais para a distribuição de Poisson (termo INDIVIDUAL) ”,
com 0,9λ = e 1X = .
Tabela de três decimais para a distribuição de Poisson (termo INDIVIDUAL)
( ) ( )1 1 1~ 1,8 ~ 0,9 0,366
2 2 2
N Poi N Poi
� �� � � � � �= =
�
�
�
�
� � � � � �� �
Ou seja
1
1 0,366
2
P X
� �� � = =
�
�
� �� �
.
5.2 Vou primeiro representar a escala do tempo para ser mais fácil perceber donde vem os
valores:
muito importante perceber este termo!
são os ULTIMOS 40 minutos.
1 3 5
1 2
4 2 6
Pois
P X X X
� �
�
� � � � � �
�= ∧ − =
�
�
�
�� � � � � �
�
�
� �
�������
( )1 3 50 1 2
4 2 6
Intervalo Intervalo
P X X X X
� �
�� � � � � �
− = ∧ − =
�
�
�
�
� � � � � �
�
� �
��������� ���������
e os intervalos são disjuntos.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 253/305
Sugestões: jrvalente@netmadeira.comProbabilidades e Estatística
Aqui usei o axioma P2:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )2 1 4 3 2 1 4 3 x P
Intervalo Intervalo
P N t N t k N t N t j P N t N t k N t N t j
� �
� �− = − = = − = − =� � � �� � � �
� �� �
�
��������� ���������
( )1 3 50 1 x P 2
4 2 6
P X X X X
� � � �� � � � � �− = − =
�
�
�
�
�
� � � � � �� � � �
Teoria:
P1: O processo de chegadas é "regular", no sentido de homogéneo no tempo, isto é, se
fizermos uma translação no tempo isso não deve alterar a essência do processo.
Assim, P1 afirma que ( ) ( ) ( ) ( )2 1 2 1P N t N t k P N t h N t h k− = = + − + =� � � �� � � � , com
0,1,2, ...k = Por exemplo: estudar o processo entre as 9h e as 10h deve ser idêntico a estudá-
lo entre as 9h23m e as 10h23m.
Ou seja no axioma P1, é dito que posso somar (ou subtrair) uma unidade, assim:
3 9 5 4 2 5
0
2 6 6
5
6
5
6 63
−
= = −= ∧ =−
Substituindo na minha equação, fica:
( ) ( )1 20 1 x P 0 2
4 3
P X X X X
� � � �� � � �− = − =
�
�
�
�
� � � �� � � �
Agora usando o axioma P1:
1 2
1 x P 2
4 3
P X X
� � � �� � � �= =
�
�
�
�
� � � �� � � �
, vou ter que usar um C.A.
Calculo Auxiliar: ( ) ( )1 1 1~ 1,8 ~ 0, 45 .
4 4 4
X Poi X Poi
� �� � � � � �=
�
�
�
�
� � � � � �� �
E ( ) ( )2 2 2~ 1,8 ~ 1, 2 .
3 3 3
X Poi X Poi
� �� � � � � �=
�
�
�
�
� � � � � �� �
Como os valores não estão na tabela, vou ter de os calcular.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 254/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( )0,45 1.1 . 1 1
0, 28693
4
0, 45
1
4
1
1! 4 !
x ee
P X X P Xx
x
P
λ λ −−� � � � � �� � � � � �= = → = = ⇔ = =
�
�
�
�
�
�
� � � � � �� � � � � �
( )21,2.2 . 2 2
0,21686
3 ! 3
2 2
2! 3
1, 2x
x
x
ee
P X P X P X
λ λ −−� � � � � �� � � � � �= = → = = ⇔ = =
�
�
�
�
�
�
� � � � � �� � � � � �
Assim, tudo completo fica:
( ) ( )1 21 x P 2 0, 28693 x 0, 21686 0,062279
4 3
P X X
� � � �� � � �= = = =
�
�
�
�
� � � �� � � �
A Distribuição Normal
A distribuição normal é a mais importante das distribuições contínuas. Com efeito, do ponto
de vista das aplicações empíricas, tem-se comprovado que muitos atributos observáveis de
determinada população são bem representados por variáveis aleatórias que seguem uma
distribuição normal. Por exemplo, a distribuição normal pode constituir uma boa aproximação
da distribuição das alturas (ou dos pesos) dos indivíduos em populaçoes razoavelmente
homogéneas, ou a distribuição dos erros de medida de determinadas grandezas físicas.
Definicão: Dizemos que X é uma variável aleatória normal (ou gaussiana) com
( )parâmetros , e 0, e escrevemos ~ ; se e só se a correspondente funçãoR X Norµ σ µ σ∈ >
densidade de probabilidade for :
( )
2
1 1
: , tal que exp .
22
x
f R R f x
µ
σπσ
� �−� �→ = −� �
�
� �� �� �
( )Observac o : Se ~ ; , então é uma v.a. absolutamente con .t u ín aã X Nor Xµ σ
( ) [ ] ( ) 2Proposicão: Se ~ ; , então e .X Nor E X Var Xµ σ µ σ= =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 255/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Exemplo que vai ajudar a compreensão:
A figura a seguir mostra uma curva normal típica, com seus parâmetros descritos
graficamente.
O valor de uma variável tem ocorrência normal quando está entre 95% da área sob a curva
em forma de sino, que tem a variável frequência no eixo dos Y, cujas extremidades ocupam
2,5% cada. Ou seja, algum valor é considerado normal se está na em qualquer ponto entre
0,025 e 0,975 (2,5 e 97,5%) da área sob a curva.
De ter em conta que as areas de 0 a 2,5% é a mesma do que de 97,5 a 100%. Isto é importante
uma vez que a tabela dada só dá valores superiores, e as vezes pretenden se inferior.
(
É muito importante entender como a curva é afetada pelos valores numéricos de µ e �.
Assim, como se vê na figura anterior, em que x corresponde ao número de desvios padrão e Y
demonstra a frequência, quanto maior a média, mais à direita está a curva.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 256/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Note-se que, se diferentes amostras apresentarem o mesmo valor de média µ e diferentes
valores de desvios padrão �, a distribuição que tiver o maior desvio padrão se apresentará
mais achatada (c), com maior dispersão em torno da média. Aquela que tiver o menor desvio
padrão apresentará o maior valor de frequência e acentuada concentração de indivíduos em
valores próximos à média (a).
Já, distribuições normais com valores de médias diferentes e o mesmo valor de desvio padrão
possuem a mesma dispersão, mas diferem quanto à localização no eixo dos X.
( )P Z z Area≥ =
Como consultar a tabela fornecida para um valor de 0,53 :z =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 257/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Vou a tabela e procuro por 0,50 e 0,03 (=0,53):
( )A tabela para ser única é necessário padronizar os dados dos exercícios para ~ 0 ; 1Z N
O significado desta fórmula é a seguinte: uma média de zero, e um desvio padrão é um.
Exercício:
1 - Sabe-se que a v.a. X tem distribuição normal com parâmetros µ = 3 e � = 2. Calcule:
( )1.1 5 ; P X <
( )1.2 0 ; P X ≥
( )1.3 1 4 ; P X− ≤ ≤
( )1.4 2 3 . P X≤ ≤
Resolução:
( )1.1 5 ?P X < = na tabela não se tem 5!! (pois a tabela só vai até 0,9)
Ok, é aqui que entra a estandardização. Ou seja vai se “transportar” de modo a se poder
utilizar a tabela.
( )
( )
� ( )
~ 0 ; 1
5 5 5
5
2
1
2
3
2 Z
Z
N
X
P X P P Z P Z P Z P Z
µ µ µ
σ σ σ
=
� �
� �− − − −
� � � � �
< = < = < = < = < = <
�
�
�
�
�� � � � � �
�
� �
���
Já está! Parece que já consigo utilizar a tabela. Disse “parece”!?
Pois é, tem mais um problema, a tabela é para “maior do que”.
( ) ( ) ( )
Aqui está a Aqui "converto" o
standarização "maior de que" em
"menor de que".
15 1 1P X P Z P Z< = < = − ≥
����� �����
Aqui também há novidade! Pois está-se a lidar com variáveis contínuas, logo é indiferente
colocar o igual.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 258/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( )
( ) ( )
( ) ( )
0 é por ser zero que é indiferente colocar o igual.P Z a
P Z a P Z a
P Z a P Z a
= =
≥ = >
≤ = <
Nas variáveis aleatórias de Poisson ou Binomial, por serem discretas, não se pode desprezar o
igual!
O porquê? É fácil, pois nas variáveis continuas o intervalo de números entre zero e um, por
exemplo, é infinito! Por isso mais um menos um é indiferente. Nas variáveis discretas, já não
se podem desprezar numero nenhum.
Assim voltando ao exercício, obtive então: ( ) ( )1 15P X P Z< = − > . Agora vou a tabela, mas
“separando” o número obtido, pois para ser exacto, o resultado é na realidade “1.00”. Pois na
tabela, nas linhas tenho “1.0” e nas colunas tenho “0,00”.
Baralhado!? Vou então socorrer me da tabela, poiscom o primeiro exemplo fica tudo mais
fácil de entender.
( ) ( )1 1 1 05 ,1587 0,8413P X P Z< = − ≥ = − =
Qual o significado deste valor calculado?
É a área! Em que a área total é 1, então neste caso seria 84,13% do total.
( )
( )
�
~ 0 ; 1
0 0 0 3
1.2
2
0
3
2
Z
Z N
X
P X P P Z P Z P Z
σ σ
µ µ µ
σ
=
� �
� �− − − −
� � � � �
≥ = ≥ = ≥ = ≥ = ≥ −
�
�
�
�
�� � � � � �
�
� �
���
Mais um problema, a tabela não tem números negativos! É preciso ser se criativo, pois se
Maomé não vai a montanha, vem a montanha a Maomé. Ou seja vou inverter o sinal:
( ) 30
2
P X P Z� �≥ = <
�
� �
.
Parece que resolvi um problema e criei outro. Mas não, pois este ultimo já sei resolver:
( ) ( ) ( )3 1 1,5
2
0 0P X P Z P X P Z� �≥ = < ⇔ ≥ = − >
�
� �
, mas na tabela não há números
fraccionários (!).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 259/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Agora vou a tabela, mas “separando” o número obtido, pois para ser exacto, o resultado é na
realidade “1.50”. Pois na tabela, nas linhas tenho “1.5” e nas colunas tenho “0,00”.
( ) ( ) ( ) ( )3 1 1,5 1 0,06680
2
0 0P X P Z P X P Z P X� �≥ = < ⇔ ≥ = − > ⇔ ≥ = − ⇔
�
� �
( ) 0, 30 9 32P X ≥ =
( ) ( )41.3 23 3 0,4 51 41 1
2 2
Z
X
P X P P Z P Z
σ σ σ
µ µ µ
=
� �
− − − − −
� � �
≤ ≤ = ≤ ≤ = ≤ ≤ = − ≤ ≤
�
� � �
−
�
−
�
�
−
���
Agora vou ter que recordar a teoria:
De uma variável aleatória, o seu teorema diz me que: se F é uma função de distribuição então
F goza das seguintes propriedades:
1) ( ), 0 1.x R F x∀ ∈ ≤ ≤
2) F é crescente: ( ) ( ), , .x y R x y F x F y∀ ∈ < � ≤
3) ( ) ( ) ( ) ( ): lim 0 e : lim 1;
x x
F F x F F x
→−∞ →+∞
−∞ = = +∞ = =
4) ( ) ( ) ( ) ( ), , , esta a que interessa .a b R a b P a X b F b F a É∀ ∈ = −≤<< �
5) F é contínua à direita: ( ) ( ) ( ), : lim .
x a
a R F a F x F a
+
+
→
∀ ∈ = =
6) ( ) ( ) ( ), .a R P X a F a F a−∀ ∈ = = −
Adaptado ao exercício:
( )
�
( )
� ( )
( )
( )
( )
2 0,5 0,5 2 (alinea 4 do teorema 3)
F a F b F b F a
P Z F F
� �
�− ≤ ≤ = − − =
�
� �
����� ���
( ) , o cuidado com o sinal das inequações só interessa para as variáveis discretas!P a X b≤<
O que não é o caso com as variáveis aleatórias normais.
( )
�
( )
�Assim: 0,5 2
F aF b
P Z P Z
� � � �
�≤ − − ≤
�
�
� � �� �
!Errado
( )Como fiz , tenho que ter o cuidado com a inequação.F a−
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 260/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Assim fica na realidade
( )
�
( )
� ( ) ( )0,5 2 0,5 2
F aF b
P Z P Z P Z P Z− ≥
� � � �
�≤ − = ≤ −
−�
�
� � ��
≤
�
, mas agora
tenho outro problema. O “-2”, como é um número negativo, não está na tabela. Assim fica:
( ) ( ) ( ) ( )0,5 2 0,5 2P Z P Z P Z P Z≤ − = ≤ −≥ ≥− =
Falta resolver este ( )0,5P Z ≤ , pois a tabela é para “maior do que”.
( ) ( ) ( ) ( )10,5 2 0,5 2P Z P Z P Z P Z−≤ − − −>≥ = ≥ =
Agora vou a tabela e sei que:
( ) ( ) ( ) ( )0,5 2 0,5 2 1 0,3085 0,0228 0,66871P Z P Z P Z P Z≤ − − ≥ = − ≥ = − − =− >
( ) ( )3 331.4 2 22
2 2
0,
3 3
5 0
Z
X
P X P P Z P Z
µ µ µ
σ σ σ
=
� �
− − − − −
� � �
≤ ≤ = ≤ ≤ = ≤ ≤ = − ≤ ≤
�
� � �
�
� �
���
( )
�
( )
� ( )
( )
� ( )
( )
0,5 0 0 0,5 (alinea 4 do teorema 3)
F bF a F b F a
P Z F F
� �
�− ≤ ≤ = − − =
�
� �
�����
( )
�
( )
� ( ) ( )0 0,5 0 0,5
F b F a
P Z P Z P Z P Z− ≥
� �� �
�≤ − = ≤ −
� − ≤
�
�� � � �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 261/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
( )
�
( )
� ( ) ( ) � ( )
0 Inverti o sinal
0 0,5 0 0,5 0,5 0,5 0,5 0,3085 0,1915
F b zF a
P Z P Z P Z P Z P Z
=
� �� �
�≤ − = ≤ − = − > = − =
�
�
−
�� � �
− ≤
�
≥
�����
2 - O tempo requerido para executar certa tarefa é uma variável aleatória com distribuição
normal de µ = 72 minutos e � = 12 minutos. Calcule a probabilidade de a tarefa:
2.1 Demorar mais de 93 minutos a ser executada;
2.2 Não demorar mais de 65 minutos a ser executada;
2.3 Demorar entre 63 e 78 minutos a ser executada.
Resolução:
X é uma variável aleatória normal. Em que:
( ) ( )~ ; ~ 72 ; 12X Nor X Norµ σ ⇔
( )
( )
�
~ 0 ; 1
93 93
12
2.1 1,75 0,04013
72
9
N
Z
Z
X
P X P P Z P Z
µ µ
σ σ
=
� �
� �− − −
� � �
≥ = ≥ = ≥ = ≥ =
�
�
�
�� � � �
�
� �
���
( )
( )
� ( ) ( )
~ 0 ; 1
2.2
65 6
0,58 0,58 0,281
5
6 0
7
1
5
2
2Z N
Z
X
P X P P Z P Z P Z
µ µ
σ σ
=
� �
� �− − −
�
≤ = ≤ = ≤ = ≤ − = ≥ =
�
�
�
� �
�
� �
���
( ) ( )2.3 0,75 0,578 7878
12 12
72 763 6 23
63
Z
X
P X P P Z P Z
σ σ σ
µ µ µ
=
� �
− − − − −
� � �
≤ ≤ = ≤ ≤ = ≤ ≤ = − ≤ ≤
�
� � �
�
� �
���
( )
�
( )
� ( )
( )
( )
( )
0,75 0,5 0,5 0,75 (alinea 4 do teorema)
F a F b F b F a
P Z F F
� �
�− ≤ ≤ = − − =
�
� �
����� �����
( )
( )
�
( )
� ( ) ( )0,5 0,75 0,63 5 08 ,757
F b F a
P X P Z P Z P Z P Z
� � � �
�
�≤ ≤ = ≤ − = ≤ − ⇔
�
�
� � � �
− ≥ − ≤
( ) ( ) ( )0,5 0,71 15 0,3086 5 0,2266 0,4643 78 9P X P Z P Z− ≥ −⇔ ≤ = − =≥≤ = −
Como se pode ver no gráfico quando 0, a área é metade do total.z =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 262/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Variável Aleatória Exponencial
A distribuição exponencial tem a sua génese associada ao processo de Poisson, muito embora
a sua utilização na modelação estatística seja bastante mais ampla, aplicando-se, para além do
tempo de espera entre eventos originados por um processo de Poisson, a fenómenos como o
tempo de vida de equipamentos, montantes de indemnizações, etc.
Definição - 1: A variável aleatória X com função densidade
( )
0 0
: , tal que ,
0x
se x
f R R f x
e se xλλ −
≤�
→ =
>
diz-se que tem distribuição exponencial ou que X é uma variável aleatória exponencial e X --
( )simbolicamente representamos por ~ .X Exp λ
( ) 2 : Se ~ ,então X é uma v.a. absolutamente contínua. Observação X Exp λ−
Teorema - 3: O tempo de espera X entre duas chegadas consecutivas (ou entre dois eventos
consecutivos) num processo de Poisson com taxa � tem distribuição exponencial com
( )parâmetro , isto é, ~ .X Expλ λ
( ) ( ) ( ) 2
1 1
4 : Se ~ então e .Proposição X Exp E X Var Xλ
λ λ
− = =
Exercícios
1 - A chegada de clientes a uma loja segue um processo de Poisson em que o ritmo médio de
afluência é de 20 clientes por hora. Após abrir a loja qual é a probabilidade de o comerciante
ter de esperar mais do que 5 minutos pela chegada do primeiro cliente?
Resolução – chegam consecutivamente 20 clientes por hora! Muito cuidado com a unidade
de tempo utilizada no enunciado.
� = 20
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 263/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
A variável é contínua, pois o tempo é contínuo. Assim, X é o tempo que decorre entre a
chegada de dois clientes.
( )Apetece fazer 5 minutos , mas a variavel hora.P X é>( )
0 0
Tenho que recordar a defini o 1 : , tal que
0x
se x
çã f R R f x
e se xλλ −
≤�
− → =
>
( )
( )
� ( ) ( )
( )
20
1 1 1
12 12 12
2
1
1
0
2
xx
f x
f x
P X f x dx e dx e dxλλ
+∞ +∞ +∞ −−� �> = = =
�
� �
� � � �����
Para poder integrar preciso do sinal, como não o tenho, coloco um dentro do integral (pois é
necessário para se poder fazer a integração, e outro fora do integral para não alterar o valor da
equação). Assim fica:
( )
( )
� ( ) ( )
( )
( ) ( )
( )
2
1 1 1 1
12 12 12 1
0 2
2
01
12
20 20
f x
f x
x xx
f x
P X f x dx e dx e dx e dxλλ
+∞ +∞ +∞ − −+∞−� �> = = = = ⇔
�
� �
− −� � � ������ �����
( ) ( )
( )
( ) ( )( ) ( )
1
12
1 1
12 12
20
20 20 2020
1
12
x x
f x
P X e dx e e e
� �
+∞+∞
�−− �− − +∞ �
� �� �� �> = = − =− − − − ⇔
�
�
�
�� � � � � �
� �����
( )( )20Ora sei que 0, assim substituindo, fica:e e∞− −∞+ = =
( )( ) ( ) ( )
1 20 20
1
2
20 12
0
2 2 1
1
0 0,1889 18,89%
12
P X e e e e
� �
�+∞ �
− − −− �
� � � �� �> = − − = − − = ≈
�
�
�
�� � � �� �
( ) 1 1Quanto ao tempo m dio que decorre entre duas chegadas 0,05.
20
é é E X
λ
= = =
Mas cuidado! Qual é a unidade!?
É a HORA. Ou seja é 0,05 horas, que é na prática 3 minutos.
Mas que tempo é este!?
É o tempo entre duas chegadas.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 264/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Estatística Intuitiva
Inferência Estatística
Representação matemática:
Parâmetros:
População Amostra
Média µ X
Variância 2σ
2s
Desvio Padrão σ s
Proporção p ^
p
Como se distinguir “População” e “Amostra”:
População é a totalidade de pessoas, animais, plantas ou objectos, da qual se podem recolher
dados. É um grupo de interesse que se deseja descrever ou acerca do qual se deseja tirar
conclusões. A média existe mas nunca se consegue saber o valor exacto, apenas se consegue
até a um intervalo de confiança de 95% (pois os valores variam instantaneamente ao longo do
tempo). Teoricamente (para estudo) a população é infinita.
Amostra é um subconjunto de uma população ou universo. A amostra deve ser obtida de uma
população específica e homogénea por um processo aleatório. A aleatorização é condição
necessária para que a amostra seja representativa da população. Depois de se calcular para a
amostra, extrapola se valores para a população.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 265/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Formulário de Hipóteses:
0H Estatística de teste 1H Região de rejeição
1.1
0p p=
0
0 0
X np
T
np q
−
=
0p p>
0p p<
0p p≠
T zα>
T zα< −
2
T zα< − ou
2
T zα>
1.2
0µ µ=
0XT
n
µ
σ
−
=
0µ µ>
0µ µ<
0µ µ≠
T zα>
T zα< −
2
T zα< − ou
2
T zα>
1.3
0µ µ=
0XT
s n
µ−
=
0µ µ>
0µ µ<
0µ µ≠
T zα>
T zα< −
2
T zα< − ou
2
T zα>
1.4
0µ µ=
0XT
s n
µ−
=
0µ µ>
0µ µ<
0µ µ≠
( ) ; 1nT t α −>
( ) ; 1nT t α −< −
; 1
2
n
T t α� �−
�
� �
< − ou
; 1
2
n
T t α� �−
�
� �
>
2.1
1 2p p=
^ ^
1 2
^ ^
1 2
1 1
p p
T
p q
n n
−
=
� �
+
�
� �
Onde
^
1 2
1 2
X X
p
n n
+
=
+
1 2p p>
1 2p p<
1 2p p≠
T zα>
T zα< −
2
T zα< − ou
2
T zα>
2.2
1 2 0dµ µ− =
( )1 2 0
2 2
1 1 2 2
X X d
T
n nσ σ
− −
=
+
1 2 0dµ µ− >
1 2 0dµ µ− <
1 2 0dµ µ− ≠
T zα>
T zα< −
2
T zα< − ou
2
T zα>
2.3
1 2 0dµ µ− =
( )1 2 0
2 2
1 1 2 2
X X d
T
s n s n
− −
=
+
1 2 0dµ µ− >
1 2 0dµ µ− <
1 2 0dµ µ− ≠
T zα>
T zα< −
2
T zα< − ou
2
T zα>
2.4
0d dµ =
0
d
d d
T
s n
−
=
0d dµ >
0d dµ <
0d dµ ≠
( ) ; 1nT t α −>
( ) ; 1nT t α −< −
; 1
2
n
T t α� �−
�
� �
< − ou
; 1
2
n
T t α� �−
�
� �
>
0p é a probabilidade NULA.
0µ é a media
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 266/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Formulário de Intervalos de confiança:
Intervalo de confiança para 1 população –
1.1 - Proporção -
^ ^ ^ ^
^ ^
2 2
. .Z p Z
n n
pq pq
p pα α− < < +
1.2 - Média, conhecendo o desvio padrão -
2 2
. .X Z X Z
n n
α α
σ σ
µ− < < +
1.3 - Média, desconhecendo o desvio padrão e “n” grande -
2 2
. .
s s
X Z X Z
n n
α αµ− < < +
1.7 - Média, desconhecendo o desvio padrão e “n” pequeno –
; 1 ; 1
2 2
. .
n n
s s
X t X t
n n
α αµ� � � �
− −
�
�
� � � �
− < < +
Ou seja no cálculo dos pontos 1.1, 1.2 e 1.3 usa se a tabela de distribuição (da curva) normal,
e para o ponto 1.4 usa se a tabela da distribuição “t”.
Nota: não é regra, mas distingue se “n” pequeno e “n” grande assim: pequeno < 30 < grande.
Intervalo de confiança para 2 população –
2.1 - Proporção –
^ ^ ^ ^ ^ ^ ^ ^
^ ^ ^ ^
1 2 1 22 2
1 1 2 2 1 1 2 2. .1 2 1 2 1 2Z Zn n n n
p q p q p q p q
p p p p p pα α
� � � �
− − + < − < − + +
�
�
� � � �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 267/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2.2 - Média, conhecendo o desvio padrão –
( ) ( )
2 2 2 2
1 2 1 2
1 2 1 2 1 2
1 2 1 22 2
. .X X Z X X Z
n n n nα α
σ σ σ σ
µ µ− − + < − < − + +
2.3 - Média, desconhecendo o desvio padrão e “n” grande –
( ) ( )
2 2 2 2
1 2 1 2
1 2 1 2 1 2
1 2 1 22 2
. .
s s s s
X X Z X X Z
n n n nα α
µ µ− − + < − < − + +
2.4 - Média, desconhecendo o desvio padrão e “n” pequeno –
; 1 ; 1
2 2
. .D DD
n n
s s
D t D t
n n
α αµ� � � �
− −
�
�
� � � �
− < < +
Ou seja no cálculo dos pontos 2.1, 2.2 e 2.3 usa se a tabela de distribuição (da curva) normal,
e para o ponto 2.4 usa se a tabela da distribuição “t”.
Exercício sobre Inferência Estatística
1 - Realizou-se uma experiência com objectivo de estudar as práticas de saúde dentária e
atitudes de uma certa população adulta de uma determinada cidade. Dos 300 adultos
intervenientes 123 afirmaram que com regularidade fazem um “chek-up” dentário 2 vezes por
ano.
Determine o intervalo de 95 % de confiança para a verdadeira proporção dos adultos que têm
cuidados dentários.
Resolução – primeiro vou organizar os dados fornecidos.
^ ^ ^123 177
300 1 0,95 1 0,05
300 300
n p q p c cα= ∧ = ∧ = − = ∧ = ∧ = − =
Nota: α é o nível de significância e “c” é o nível (ou intervalo) de confiança.
Se me socorrer do formulário, vou utilizar a fórmula 1.1 (do Intervalo de Confiança). Porquê?
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 268/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Porque é apenas uma população, logo começa por “1.?”. Agora das quatro como sei que é a
primeira? Pois é a única que me calcula a proporção! Assim fica:
^ ^ ^ ^
^ ^
0,05 0,05
2 2 2 2
123 177 123 177
. .123 123300 300 300 300. . . .
300 300 300 300
Z p Z Z p Z
n n
pq pq
p pα α− < < + = − < < + =
0,025 0,0250,41.0,59 0,41.0,59
0,41 . 0,41 .
300 300
Z p Z= − < < + =
Agora como sei o valor de 0,025Z ? Vou me socorrer da tabela da distribuição normal, mas
desta vez, sei o resultado, vou é a procura das coordenadas:
Assim o meu valor está nas coordenadas do resultado 0,025, que é 1,9 + 0,06.
Assim 0,025 1,96.Z =
Continuando o meu cálculo, fica:
0, 41.0,59 0,41.0,59
0, 41 1,96. 0,41 1,96. 0,354 0,466
300 300
p p= − < < + = < <
] [0,354 ; 0,466p∴ ∈
Posso por isso concluir (e afirmar) que a proporção de adultos que têm cuidados dentários está
entre 35,4 e 46,6 %, com um grau de confiança de 95%.
Nota a parte: o valor de Z depende da tabela usada, e nesta faculdade é esta formula (é apenas
uma opção aleatória em duas possibilidade). A tabela fornecida é para a situação de maior ou
igual. Se fosse menor ou igual seria 0,975
1
2
.Z Zα
−
=
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 269/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2 - Mediu-se a pressão sistólica numa amostra representativa com 36 indivíduos de uma
população e obteve-se uma média de 137 mm de Hg. De estudos anteriores, leva-se a supor
que nesta população a pressão arterial sistólica segue uma distribuição Normal de valor médio
e desvio padrão 9 mm de Hg.
Encontre um intervalo de confiança de 95% para a média da pressão arterial sistólica na
população.
Resolução – primeiro vou organizar os dados fornecidos.
36 137 9 0,95 1 0,05n X c cσ α= ∧ = ∧ = ∧ = ∧ = − =
Nota: α é o nível de significância e “c” é o nível (ou intervalo) de confiança.
Se me socorrer do formulário, vou utilizar a fórmula 1.2 (do Intervalo de Confiança). Porquê?
Porque é apenas uma população, logo começa por “1.?”. Agora das quatro como sei que é a
segunda? Pois é sei o valor do desvio padrão ( )9σ = ! Assim fica:
2 2
9 9
. . 137 1,96. 137 1,96.
36 36
X Z X Z
n n
α α
σ σ
µ µ− < < + = − < < + =
134,06 139,94µ< <
] [134,06 ; 139,94µ∴ ∈
Nota: já sabia, do exercício 1, o valor de
2
Zα , pois o intervalo de confiança é o mesmo!
Posso afirmar, com uma confiança de 95%, que a média de pressão arterial sistólical da
população é um valor entre 134,06 e 139,94.
3 - Num estudo, foi medido o comprimento de 100 folhas de uma certa variedade de arroz.
Essas medições permitiram calcular 28 cmX = e 2 22,09 .s cm=
Determine um intervalo a 90 % de confiança para o comprimento médio das folhas.
Resolução – primeiro vou organizar os dados fornecidos.
2 2100 28 cm 2,09 0,9 0 10 1 ,0cn X s cm cα= ∧ = ∧ = ∧ = − ==∧
Nota: α é o nível de significância e “c” é o nível (ou intervalo) de confiança, e aqui é de 90%!
Se me socorrer do formulário, vou utilizar a fórmula 1.3 (do Intervalo de Confiança). Porquê?
Porque é apenas uma população, logo começa por “1.?”. Agora das quatro como sei que é a
segunda? Pois não sei o valor do desvio padrão e “n” é grande! Assim fica:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 270/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2 2 2 2
2,09 2,09
. . 28 . 28 .
100 100
s s
X Z X Z Z Z
n n
α α α αµ µ− < < + = − < < + =
É preciso ter cuidado, pois é nos dado o valor de
2 22,09 s cm= , e o que se pretende é de “s”.
Também aqui o valor do nível de confiança é de 90%, logo como é um valor novo, é
necessário ir a tabela da distribuição normal:
0,1 0,05
2 2
Z Z Zα = =
Como não existe um valor igual, vou calcular a media dos dois valores próximos.
0,1 0,05
2 2
1,64 1,65
1,645
2
Z Z Zα
+
= = = =
1, 45 1, 45
28 1,645. 28 1,645. 27,76 28,24
10 10
µ µ= − < < + = < <
] [27,76 ; 28,24µ∴ ∈
Posso afirmar, com uma confiança de 95%, que o comprimento médio das folhas (da
população) está compreendido entre 27,76 e 28,24.
4 - Num hospital observaram-se 23 doentes com hepatite, tendo-se determinado para cada um
a relação:
globulina
X
total de proteínas
β
=
Sabendo que 15,5X = e 2 18,25s = , determine um intervalo de confiança para a média da
população correspondente.
Resolução – primeiro vou organizar os dados fornecidos.
223 15,5 18, 25 18,25 4, 27n X s s= ∧ = ∧ = → = =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 271/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Não me é dado o intervalo de confiança, e quando é omisso, então é de 95% (é regra).
0,95 1 0,05c cα= ∧ = − =
Se me socorrer do formulário, vou utilizar a fórmula 1.4 (do Intervalo de Confiança). Porquê?
Porque é apenas uma população, logo começa por “1.?”. Agora das quatro como sei que é a
segunda? Pois não sei o valor do desvio padrão e “n” é pequeno! Assim fica:
; 1 ; 1
2 2
. .
n n
s s
X t X t
n n
α αµ� � � �
− −
�
�
� � � �
− < < +
Aqui temos duas novidades, a primeira para se calcular o valor do “t” usa-se a tabela da
“Distribuição-t”, e a procura do valor também é diferente, pois é nos dado as coordenadas, e
só temos que encontrar o valor no centro.
A distribuição t (de “Student”) é uma distribuição de probabilidade teórica. É simétrica,
campaniforme, e semelhante à curva normal padrão, porém com caudas mais largas, ou seja,
uma simulação da t de Student pode gerar valores mais extremos que uma simulação da
normal. O único parâmetro v que a define e caracteriza a sua forma é o número de graus de
liberdade. Quanto maior for esse parâmetro, mais próxima da normal ela será.
Mas já lá vou, vou fazer o que é obvio:
( ) ( )0,025 ; 23 1 0,025 ; 23 1
; 1 ; 1
2 2
4,27 4, 27
. . 15,5 . 15,5 .
23 23n n
s s
X t X t t t
n n
α αµ µ− −� � � �
− −
�
�
� � � �
− < < + = − < < +
Agora vou me socorrer da tabela para calcular o valor de ( )0,025 ; 22t :
Assim ( )0,025 ; 22 2,074. Continuando, fica :t =
15,5 2,074.0,89 15,5 2,074.0,89 13,65 17,35µ µ= − < < − = < <
] [13,65 ; 17,35µ∴ ∈
Posso afirmar, com uma confiança de 95%, que num hospital, os doentes com hepatite (da
população) está compreendido entre 13,65 e 17,35.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 272/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
5 – A taxa de desemprego de um determinado país é 7,8%. Num dado distrito desse país
foram contabilidade 96 desempregados em 1.600 indivíduos pertencentes a população activa.
Ao nível de significância de 0,01, existe evidência de que a taxa de desemprego no distrito é
inferior a do país?
Resolução – X é o número de pessoas desempregadas.
“A taxa de desemprego…”, é uma proporção. Assim na estatística de teste (passo 3) é o ponto
1.1.
“…é inferior…” é a pista para o teste de hipótese 1H , assim no passo 4, escolho “T<”.
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso
formular-se as seguintes hipóteses
0 1
sempre igual
: 0,078 : 0,078
É
H p vs H p= <�����
Segundo passo: nível de significância 0,01α = .
Terceiro passo: estatística de teste 0
0 0
X np
T
np q
−
= (do formulário, o ponto 1.1)
Quarto passo: região de rejeição T zα< −
Em que ( )0,01 2,3263 na realidade é -2,3263, pois é para z z T zα α= = < −
Quinto passo: calculo
( )
0 0
0
0 0
1
x
2,6848
x 1 0,
1600
078
0,078
0,070
9
860
6
1
p q
p
p
t
n q
nX
= −
− −
= = ≈ −
−�����
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 273/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
2,6848 2,3263t T≈ − ∧ < −
Sexto passo: conclusão – Como o valor observado da estatística de teste pertence à região de
rejeição 0H , então rejeita-se a hipótese nula ( )0H e aceita-se a hipótese alternativa ( )1H .
Posso concluir, com uma confiança de 99%, que a taxa de desemprego no distrito é inferior a
do país.
6 – Uma amostra aleatória de 1785 adultos foi inquirida relativamente à seguinte questão:
assistiu a algum serviço religioso nos últimos 7 dias? 980 pessoas responderam “Sim”.
Ao nível de significância de 0,01, podemos considerar que os dados fornecem evidência
suficiente de que mais de metade da população adulta assistiu a um serviço religioso?
Resolução – X é o número de pessoas que foram a um serviço religioso.
“… metade …”, é uma proporção. Assim na estatística de teste (passo 3) é o ponto 1.1.
“…mais de metade …” é a pista para o teste de hipótese 1H , assim no passo 4, escolho “T>”.
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso
formular-se as seguintes hipóteses
0 1
sempre igual
: 0,5 : 0,5
É
H p vs H p >=�����
Segundo passo: nível de significância 0,01α = .
Terceiro passo: estatística de teste 0
0 0
X np
T
np q
−
= (do formulário, o ponto 1.1)
Quarto passo: região de rejeição T zα>
Em que 0,01 2,3263z zα = =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 274/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Quinto passo: calculo
( )
0 0
0
0 0
1
1785
1785 1
x
4,1421
x
980
0,
0,5
0,5 5
p q
t
n
p q
X
n
p
= −
−
− −
= = ≈
�����
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição.
4,1421 2,3263t T≈ ∧ >
Sexto passo: conclusão – Como o valor observado da estatística de teste pertence à região de
rejeição de 0H , então rejeita-se a hipótese nula ( )0H e aceita-se a hipótese alternativa ( )1H .
Posso concluir, com uma confiança de 99%, que os dados fornecem evidência suficiente de
que mais de metade da população adulta assistiu a um serviço religioso.
7 – O rótulo dos maços de uma dada marca de cigarros apresenta o valor 0,60 mg para
quantidade média de nicotina por cigarro. Num controlo, é analisado uma amostra aleatória de
100 desses cigarros. A quantidade média de nicotina e o desvio padrão obtido foi de 0,63 mg e
0,11 mg, respectivamente. Considerando, teste se estes resultados evidenciam uma quantidade
média de nicotina superior a especificada.
Resolução – Como tem o desvio padrão (amostra e não populacional!), e “n” é maior do que
30 (é 100). A fórmula a se escolher no passo 3 (estatística de teste) é o ponto 1.3.
A média ( )µ é de 0,60 mg e tenho evidência para desconfiar que é de 0,63 mg (“…superior a
especificada…”), é a pista para o teste de hipótese 1H , assim no passo 4, escolho “T>”.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 275/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso
formular-se as seguintes hipóteses
0 1
sempre igual
: 0,60 : 0,60
É
H vs Hµ µ >=�����
Segundo passo: nível de significância 0,05α = , pois quando nada me é dito, é porque o
intervalo de confiança é de 95%.
Terceiro passo: estatística de teste 0
X
T
s n
µ−
= (do formulário, o ponto 1.3)
Quarto passo: região de rejeição T zα> em que 0,05 1,6449.z zα = =
Quinto passo: calculo 0
0,6
0
2,72
0
10
0,63
73
0,11n
t
X
s
µ− −
= = ≈
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição.
2,7273 1,6449t T≈ ∧ >
Sexto passo: conclusão – Como ] [2,7273 1,6449 ; ,∈ + ∞ então o valor observado da
estatística de teste pertence à região de rejeição de 0H , então rejeita-se a hipótese nula ( )0H e
aceita-se a hipótese alternativa ( )1H . Posso concluir, com uma confiança de 95%, que os
resultados evidenciam uma quantidade média de nicotina superior a 0,60 mg.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 276/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
8 – O rótulo de uma marca de aspirina (comprimidos) diz que eles têm uma média de 75 mg
de concentração. Vinte desses comprimidos foram testados para ver se a concentração está de
acordo, e os resultados foram:
75,1 73,9 76,6 75,3 76,0 78,0 77,4 75,3 76,5 74,4
75,7 74,2 76,8 75,1 78,0 74,6 76,9 76,6 76,7 74,9
Este dados apresentam evidência de a concentração ser diferente de 75 mg?
Resolução – Com estas duas pistas do enunciado: “…uma média…” e “n” é menor do que 30
(é 20), consigo escolher a fórmula para o passo 3 (estatística de teste), que é o ponto 1.4
(apesar de ser igual a 1.3, difere da “região de rejeição”).
“…ser diferente de …” é uma avaliação bilateral ( )0µ µ≠ , logo a formula que irei escolher
para a “região de rejeição” é a 3ª
; 1
2
n
T t α� �−
�
� �
< − ou
; 1
2
n
T t α� �−
�
� �
> (a usar no passo 4).
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso
formular-se as seguintes hipóteses
0 1
sempre igual
: 75 : 75
É
H vs Hµ µ ≠=���
Segundo passo: nível de significância 0,05α = , pois quando nada me é dito, é porque o
intervalo de confiança é de 95%.
Terceiro passo: estatística de teste 0
X
T
s n
µ−
= (do formulário, o ponto 1.4)
Quarto passo: região de rejeição, para 0µ µ≠ ,
; 1
2
n
T t α� �−
�
� �
< − ou
; 1
2
n
T t α� �−
�
� �
> (basta calcular
uma delas, pois a outra é simétrica).
Em que ( )0,05 0,025 ; 19 ; 1 ; 20 1
2 2
n
T t T t T tα� � � �− −
�
�
� � � �
> = > = > =
Vou me socorrer da tabela t-Distribuição:
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 277/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Quinto passo: calculo 0
75
1, 2
3, 2726
75,
9
9
2029
X
t
s n
µ− −
= = ≈
Nota: tive que calcular a média ( )X e o desvio padrão ( )s .
( )
2
2
1 11 75,9 1, 2299
1
n nn
i ii
i ii
n X XX
n
s
n
X
n
= ==
� �
−
�
� �= = ∧ = =
−
� ��
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição.
3,2726 2,0930t T≈ ∧ >
Sexto passo: conclusão – Como o valor observado da estatística de teste pertence à região
critica, então rejeita-se a hipótese nula ( )0H e aceita-se a hipótese alternativa ( )1H . Posso
concluir, com uma confiança de 95%, que os dados apresentam evidência de que a
concentração média das aspirinas é diferente de 75 mg.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 278/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
9 – Foirealizada uma consulta a 300 eleitores do distrito A e a 200 eleitores do distrito B. A
percentagem calculada de votos a favor de determinado candidato nos distritos A e B de 56%
e 48%, respectivamente. Ao nível de significância de 0,05, teste se
a) Não há diferença entre os dois distritos.
b) O candidato tem preferência no distrito A.
Resolução a) – cuidado com a leitura, pois o candidato é o mesmo, os eleitores é que mudam.
“A percentagem calculada …” é uma proporção, é sobre 2 populações, e “n” é maior do que
30 (é de facto 300). A fórmula a se escolher no passo 3 (estatística de teste) é o ponto 2.1.
Não há diferença entre os dois distritos” é uma avaliação bilateral ( )0µ µ≠ , logo a formula
que irei escolher para a “região de rejeição” é a 3ª
2
T zα< − ou
2
T zα> (passo 4).
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso
formular-se as seguintes hipóteses
0 1
sempre igual
: :A B A B
É
H p p vs H p p≠=
�����
Sendo Ap a “verdadeira” proporção de eleitores dos distrito A a favor de um determinado
candidato.
Segundo passo: nível de significância 0,05α = , pois quando nada me é dito, é porque o
intervalo de confiança é de 95%.
Terceiro passo: estatística de teste
^ ^
^ ^ 1 1
A B
A B
p p
T
p q
n n
−
=
� �
+
�
� �
com
^
A B
A B
X X
p
n n
+
=
+
(do formulário, o ponto 2.1)
Quarto passo: região de rejeição, para 0µ µ≠ ,
2
T zα< − ou
2
T zα> (basta calcular uma delas,
pois a outra é simétrica).
Em que 0,05 0,025
2 2
1,96T z z zα= = = =
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 279/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Quinto passo: calculo
^
^ ^
^
0,48
1,7555
1 11 1 0,52 0, 472
300 2
0,56
0
x
0
8
A B
BA
n n
p
t
p
qp
− −
= = ≈
� � � �++
�
� � �� �
Tive que realizar um calculo auxiliar,
^
A B
A B
X X
p
n n
+
= ⇔
+
^ ^0,56 x 300 0,48 x200
0,528
300 200
p p
+
⇔ = ⇔ =
+
E o
^^ ^ ^
1 1 0,528 0,472q q qp−= =⇔ ⇔= −
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição.
1,7555 1,96t T≈ ∧ >
Sexto passo: conclusão – Como o valor observado da estatística de teste não pertence à região
rejeição, então rejeita-se a hipótese 1H e aceita-se a hipótese alternativa ( )0H , com uma
confiança de 95%. Isto é, não se pode afirmar que os eleitores dos dois distritos tenham
opiniões diferentes em relação ao apoio do candidato em questão.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 280/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução b) – “O candidato tem preferência no distrito A”, que posso representar por
A Bp p> , logo a formula que irei escolher para a “região de rejeição” é a 1ª T zα> (passo 4).
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso
formular-se as seguintes hipóteses
0 1
sempre igual
: :A B A B
É
H p p vs H p p>=
�����
Segundo passo: nível de significância 0,05α = , pois quando nada me é dito, é porque o
intervalo de confiança é de 95%.
Terceiro passo: estatística de teste
^ ^
^ ^ 1 1
A B
A B
p p
T
p q
n n
−
=
� �
+
�
� �
com
^
A B
A B
X X
p
n n
+
=
+
(do formulário, o ponto 2.1)
Quarto passo: região de rejeição, para 0µ µ> , T zα> . Aqui é diferente do alínea a)!
Em que 0,05 1,6449z zα = =
Quinto passo: calculo
^
^ ^
^
0, 48
1,7555
1 11 1 0,52 0,472
300 2
0,56
0
x
0
8
A B
BA
n n
p
t
p
qp
− −
= = ≈
� � � �++
�
� � �� �
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 281/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Tive que realizar um calculo auxiliar,
^
A B
A B
X X
p
n n
+
= ⇔
+
^ ^0,56 x 300 0,48 x200
0,528
300 200
p p
+
⇔ = ⇔ =
+
E o
^^ ^ ^
1 1 0,528 0,472q q qp−= =⇔ ⇔= −
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição.
1,7555 1,645t T≈ ∧ >
Sexto passo: conclusão – Como o valor observado da estatística de teste pertence à região
rejeição de 0H , então rejeita-se a hipótese 0H e aceita-se a hipótese alternativa ( )1H , ao nível
de significância de 0,05. Nesta perspectiva já posso afirmar, com uma confiança de 95%, que
o candidato em questão é mais popular no distrito A do que no distrito B.
10 – Em Junho de 1975, foram obtidos 85 amostras de água de diferentes zonas de um lago de
uma dada cidade. Com o objectivo de estudar o nível médio de concentração de cloro foram
efectuados análises químicas a essas amostras. Dois anos depois, foram analisadas 110
amostras, tendo se obtido os seguintes:
1975 1977
Média 18,3 17,8
Desvio Padrão 1,2 1,3
Os dados evidenciam a diminuição do nível médio de concentração de cloro nas aguas do lago
em 1977, em relação ao nível médio obtido em 1975? (usar 0,01α = ).
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 282/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Resolução – Vou utilizar 1µ para 1975 e 2µ para 1977.
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso
formular-se as seguintes hipóteses
0 1 2 1 1 2
sempre igual
: :
É
H vs Hµ µ µ µ= >
�����
Sendo iµ o nível médio de concentração de cloro no lago no ano “i”.
Segundo passo: nível de significância 0,01α = .
Terceiro passo: estatística de teste
( )1 2 0
2 2
1 1 2 2
X X d
T
s n s n
− −
=
+
(do formulário, o ponto 2.3)
Quarto passo: região de rejeição, para 1 2µ µ> , T zα> .
Em que 0,01 2,3263z zα = =
Quinto passo: calculo
( ) ( )1 2 0
2 2 2 2
1 1 2 2
18,3 17,8 0
2,7819
1,2 85 1,3 110
X X d
t
s n s n
− − − −
= = ≈
+ +
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição.
2,7819 2,3263t T≈ ∧ >
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 283/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Sexto passo: conclusão – Como o valor observado da estatística de teste pertence à região
rejeição, então rejeita-se a hipótese 0H e aceita-se a hipótese alternativa ( )1H , com um nível
de significância de 0,01. Posso afirmar com uma confiança de 99%, que os dados evidenciam
a diminuição do nível médio de concentração de cloro nas aguas do lago em 1977, em relação
ao nível médio do ano 1975.
11 – Um investigador pretende averiguar se uma determinada pílula tem como efeito
secundário o aumento da pressão arterial. Inicialmente, são efectuadas medições da pressão a
15 mulheres. Após 6 meses de utilização regular da pílula, são efectuados novas medições da
pressão arterial. As medições obtidas foram:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Antes 70 80 72 76 76 76 76 72 82 64 74 92 74 68 84
Depois 68 72 62 70 58 66 68 52 64 72 74 60 74 72 74
Diferença 2 8 10 6 18 10 8 20 18 -8 0 32 0 -4 10
Levam-nos os dados a crer, com uma confiança de 95%, de que o uso desta pílula reduz a
pressão arterial?
Resolução– Estes dados são DEPENDENTES, por terem sido realizadas (a 2ª volta) as
mesmas mulheres. Logo a fórmula que irei utilizar no passo 3 (estatística de teste) é o do
ponto 2.4 (os pontos 2.2 e 2.3 é para situações em que são independentes).
Primeiro passo: Será que há evidência suficiente para acreditar em 0H ou em 1H , para isso
formular-se as seguintes hipóteses
0 1
sempre igual
: 0 : 0d d
É
H vs Hµ µ >=
���
Sendo dµ a media das diferenças entre a pressão arterial ao inicio de 6 meses e a pressão
arterial no fim.
Segundo passo: nível de significância 0,05α = , porque o intervalo de confiança é de 95%.
Terceiro passo: estatística de teste 0
d
d d
T
s n
−
= (do formulário, o ponto 2.4)
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 284/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Quarto passo: região de rejeição, para 0d dµ > , ( ) ; 1nT t α −> .
Em que ( ) ( ) ( ) ; 1 0,05 ; 15 1 0,05 ; 14 1,761nT t T t T tα − −> = > = > =
Vou me socorrer da tabela t-Distribuição:
Quinto passo: calculo 0
8,6667
10, 13
3 5
5
,
8
0
2
2
ds n
d
t
d− −
= = ≈
Nota: tive que calcular a média ( )d e o desvio padrão ( )ds .
( )
2
2
1 11 8,6667 10,328
1
n n
d
n
i ii
i ii
n d d
n
s
n n
d
d
= ==
� �
−
�
� �= = ∧ = =
−
� ��
Como interpretar este resultado? “t” é o valor observado, e “T” é o inicio a região de rejeição.
3,25 1,761t T≈ ∧ >
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 285/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Sexto passo: conclusão – Como o valor observado da estatística de teste pertence à região
critica, então rejeita-se a hipótese nula ( )0H e aceita-se a hipótese alternativa ( )1H . Posso
concluir, com uma confiança de 95%, e com um nível de significância de 0,05, que o uso
desta pílula reduz a pressão arterial.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 286/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Frequência: 2003/06/18
Parte II
Exercícios 3 –
Resolução
( )
( )
( ) ( ) ( )
Vir das Furnas 0,32
Sete Cidades 0,54
Candelaria 1 0,14
P F
P S
P C P F P S
= =
= =
= = − − =
( )
( )
( )
5,4 | 0,12
5,4 | 0,17
5,4 | 0,06
P pH F
P pH S
P pH C
< =
< =
< =
Nota: 5,4 é uma variável contínua! Assim 5 ou Z 5Z > ≥ .
Pretende se calcular ( )| 5, 4 ?P F pH =>
Vou utilizar o Teorema da totalidade Total e o de Bayes.
( ) ( )
( )
5,4
| 5, 4
5,4
P F pH
P F pH
P pH
>
> =
>
�
Pelo Teorema da Probabilidade total vou calcular para 5,4pH < , pois é mais fácil.
Esquema de orientação:
( ) ( ) ( )5,4 5,4 5,4P F pH P S pH P C pH< < <� � � � �
Calculo auxiliar – fórmula da Probabilidade Total:
( ) ( ) ( ) ( ) ( ) ( ) ( )5,4 x 5,4 | + x 5,4 | + x 5,4 |P F pH P F P pH F P S P pH S P C P pH C< = < < <�
( ) ( ) ( ) ( ) ( ) ( ) ( )5,4 0,32 x 0,12 + 0,54 x 0,17 + 0,14 x 0,06P F pH < =�
( )5,4 0,1386P F pH < =� - fim do Calculo Auxiliar.
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 287/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Mas o que se pretende é para ser maior:
( ) ( )5,4 1 5,4 1 0,1386 0,8614P pH P pH> = − > = − = .
O cálculo auxiliar é porque é mais fácil, uma vez que tenho os dados para o simétrico.
Assim: ( ) ( )
( )
( ) ( )
( )
5, 4 x 5,4
| 5,4
5, 4 5,4
P F pH P F P pH
P F pH
P pH P pH
> >
> = =
> >
�
Recordar a fórmula ( ) ( )
( )
( ) ( )
( )
Pr
x
|
|
regra do produto
obabilidade Condicional
P A B
P
PP
B A
B A
P B
A
P A
= =
�� �
�� �
�
, adaptado ao exercício:
( ) ( )
( )
( )
( )�
( )
( )
( )
|
5, 4 x 5, 4 |
| 5, 4
5, 4 5,4
P A P B A
P F pH P F P pH F
P F pH
P pH P pH
> >
> = = ⇔
> >
��� ��
�
( ) ( )
0,32 x 1 0,12
| 5, 4 0,327
0,8614
Cuidado
P F pH
−
> = ≈
�� �
Exercícios 4 –
Resolução – Variável aleatória Binomial.
Uma sucessão de provas de Bernoulli é uma sequência de n experiências aleatórias em que:
• Em cada prova apenas interessa se o resultado é um sucesso (S) ou um insucesso (S);
• A probabilidade de sucesso mantém-se de prova para prova;
• O resultado de cada prova é independente do resultado de qualquer das provas anteriores.
a) • Sim.
• As “provas” são os 254 genes observados. Um “sucesso” corresponde a ocorrência
de mutação.
• Há independência (não depende um do outro, como se jogássemos uma moeda ao ar)
entre as provas, e as probabilidade de sucesso mantém se constante.
Podemos fazer a correspondência com a definição, ponto por ponto.
b) É necessário perceber o que é o X. Vou socorrer me da definição:
A variável aleatória X que representa o número de sucessos em n provas de Bernoulli, com
probabilidade de sucesso em cada prova p, é conhecida como variável aleatória binomial. Por
comodidade denota-se por ( )~ ; .X Bin n p
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 288/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Seja X o numero de mutação quando se irradia 254 genes. Assim ( )~ 254 ; 0,007 .X Bin
( ) ( ) ( )~ 254 ; 0,007 0 1 x n x
n
X Bi P
x
n X p p
−� �
→ = = − ⇔
�
� �
( ) ( ) ( ) ( )( )25 2540 25404 00 0,007 1 0,007 1
25
0
0,
4
993 0,168P X C
−� �
= = − = =
�
� �
c) ( ) ( ) ( ) ( )2 1 2 1 1 0P X P X P X P X= = − < = − = − =
Só me falta calcular o ( )1P X = :
( ) ( ) ( ) ( )( )2541 1 253254 11 0,007 1 0,007 0,007 0,993 0,300671
254
1
P X C
−� �
= = − = =
�
� �
( ) ( )2 1 2 1 0,300671 0,168 0,53133P X P X= = − < = − − ≈
d) ( ) x 254 x 0,007 1,778E X n p= = =
( )( ) ( ) ( )1,778 2 0,531P X E X P X P X> = > = ≥ =
Nota para os mais distraídos: 2 1,778 !>
Jorge Rodrigues Valente – 2087406 UMa 13-03-2010 289/305
Sugestões: jrvalente@netmadeira.com Probabilidades e Estatística
Frequência: 2008/06/21
Parte II
3 - Suponha que a probabilidade de haver motins durante ou após um jogo de futebol é de
10%, independentemente do que sucede em qualquer outro jogo. Se um campeonato for
composto por 20 jogos, responda:
3.1 Qual é a probabilidade de haver dois motins ou mais durante esse campeonato?
3.2 Qual é a probabilidade de o número de motins durante o campeonato ser maior do que
cinco?
3.3 Qual é o número médio de motins que se pode esperar por campeonato?
Resolução: As variáveis são independentes, logo é uma distribuição Binomial.
Seja X o número de motins por campeonato (em que o campeonato é composto por 20 jogos).
� �
~ 20 ; 0,1
pn
X Bin
� �
�
�
� �
, em que “n” é o numero de jogos que compõem um campeonato, e 0,1 é
os 10%.
Agora vou responder as alíneas.
3.1 - � �
Cuidado que o igual Na tabela é o "r"
não é indiferente, pois
uma variavel continua.
2P X
� �
�
�≥
�
�
� �
, assim fica ( )2 0,608P X ≥ = .
Poderia ter ido através do cálculo, que seria:
( ) ( )