Buscar

Exercícios resolvidos Estatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 140 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 140 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 140 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

���������	�
	�����
����������������	�
	�����
����������������	�
	�����
����������������	�
	�����
�����������
�����������
	��
������
	���������
	���������
	���������
	�������
������������	�	
���������
��� 
104
Introdução ao e-learning
FMD_i.p65 15-01-2004, 10:49104
Manual de Exercícios 
Estatística Aplicada 2 
 
 
 
 
ÍNDICE 
 
1. INTRODUÇÃO .............................................….................................... 4 
1.1 Definições Gerais ........................................................................ 5 
1.1.1. População 5 
1.1.2. Variáveis ou atributos 5 
1.1.3. Processo de amostragem 5 
1.2 A Estatística Descritiva e a Estatística Indutiva .............…...... 6 
2. ESTATÍSTICA DESCRITIVA .............................................…................... 8 
2.1 Variáveis Qualitativas ................................................................. 8 
2.2 Variáveis Quantitativas Discretas ............................................. 9 
2.3 Variáveis Quantitativas Contínuas ............................................ 10 
2.4 Medidas de Localização ............................................................. 11 
2.4.1. Média 11 
2.4.2. Mediana 12 
2.4.3. Moda 13 
2.5 Medidas de Ordem ...................................................................... 13 
2.6 Medidas de Assimetria ............................................................... 14 
2.7 Medidas de Dispersão ................................................................ 15 
2.7.1. Dispersão Absoluta 15 
2.7.2. Dispersão Relativa 16 
2.8 Análise de Concentração ........................................................... 17 
2.8.1. Curva de Lorenz 17 
2.8.2. Índice de Gini 18 
2.9 Estatística Descritiva Bidimensional ........................................ 19 
 
 
 
 
 
 
 
 
 
 
 
 
Manual de Exercícios 
Estatística Aplicada 3 
 
 
 
 
 
 
 
 
 
 
3. ESTATÍSTICA INDUTIVA .............................................…...................... 45 
3.1 Noções básicas de probabilidades ........................................... 45 
3.2 Probabilidade condicionada ...................................................... 48 
3.3 Funções de Probabilidade ........................................….............. 49 
3.4 Estimação por Intervalos ..........................................….............. 76 
3.5 Testes de hipóteses ..................................................….............. 89 
3.6 Aplicações Estatísticas: Fiabilidade ......................................... 105 
3.6.1. Conceito de fiabilidade 105 
3.6.2. Fiabilidade de um sistema 105 
3.7 Aplicações Estatísticas: Controlo Estatístico de Qualidade .. 110 
3.8 Aplicações Estatísticas: Tratamento Estatístico de Inquéritos . 114 
3.8.1. Teste de independência do qui-quadrado 114 
 
Manual de Exercícios 
Estatística Aplicada 4 
"A estatística é a técnica de torturar os números até que eles confessem". 
Autor desconhecido 
 
 
 
 
1. INTRODUÇÃO 
 
 
Inicialmente, a actividade estatística surgiu como um ramo da Matemática. 
Limitava-se ao estudo de medições e técnicas de contagem de fenómenos 
naturais e ao cálculo de probabilidades de acontecimentos que se podiam 
repetir indefinidamente. Actualmente, os métodos estatísticos são utilizados em 
muitos sectores de actividade, tendo como algumas aplicações estudos de 
fiabilidade, pesquisas de mercado, testes de controle de qualidade, tratamento 
de inquéritos, sondagens, modelos econométricos, previsões, etc. 
 
Exemplo de uma estatística: os valores da inflação entre 1980 e 1990 
constituem uma estatística. Fazer estatística sobre estes dados poderia 
consistir, por exemplo, em traçar gráficos, calcular a inflação média trimestral 
ou prever a inflação para 1991. 
 
A análise de um problema estatístico desenvolve-se ao longo de várias fases 
distintas: 
 
(i) Definição do Problema 
Saber exactamente aquilo que se pretende pesquisar; estabelecer o 
objectivo de análise e definição da população 
(ii) Amostragem e Recolha de Dados 
Fase operacional. É o processo de selecção e registo sistemático de dados, 
com um objectivo determinado. Os dados podem ser primários (publicados 
pela própria pessoa ou organização) ou secundários (quando são 
publicados por outra organização). 
(iii) Tratamento e Apresentação dos Dados 
Resumo dos dados através da sua contagem e agrupamento. É a 
classificação de dados, recorrendo a tabelas ou gráficos. 
Manual de Exercícios 
Estatística Aplicada 5 
(iv) Análise e Interpretação dos Dados 
A última fase do trabalho estatístico é a mais importante e delicada. Está 
ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade 
principal é descrever o comportamento do fenómeno em estudo (estatística 
descritiva). Na estatística indutiva a interpretação dos dados se 
fundamentam na teoria da probabilidade. 
 
 
 
1.1. Definições Gerais 
 
1.1.1. População 
 
Fazer estatística pressupõe o estudo de um conjunto de objectos bem 
delimitado com alguma característica em comum sobre os quais observamos 
um certo número de atributos designados por variáveis. 
Exemplo: Empresas existentes em Portugal 
 
 
1.1.2. Variáveis ou atributos 
 
As propriedades de uma população são estudadas observando um certo 
número de variáveis ou atributos. As variáveis podem ser de natureza 
qualitativa ou quantitativa. As variáveis quantitativas podem ainda dividir-se 
entre discretas e contínuas. As variáveis discretas assumem apenas um 
número finito numerável de valores. As variáveis contínuas podem assumir um 
número finito não numerável ou um número infinito de valores. 
Exemplo: um conjunto de empresas pode ser analisado em termos de sector 
de actividade (atributo qualitativo), número de trabalhadores (atributo 
quantitativo discreto), rácio de autonomia financeira (atributo quantitativo 
contínuo), etc 
 
 
1.1.3. Processo de amostragem 
 
Para conhecer de forma completa a população, podem efectuar-se: 
Manual de Exercícios 
Estatística Aplicada 6 
- recenseamentos (indagação completa de todos os elementos da 
população); este processo é, no entanto, tipicamente moroso e 
dispendioso, sendo esses os motivos porque os Censos são realizados 
apenas em cada 10 anos. 
- estudos por amostragem (observação de apenas um subconjunto, tido 
como representativo do universo). As técnicas de recolha de amostras 
garantem a sua representatividade e aleatoriedade. 
 
 
 
1.2. A Estatística Descritiva e a Estatística Indutiva 
 
Para além do ramo de amostragem, a estatística compreende dois grandes 
ramos: a estatística descritiva e a estatística indutiva. 
 
A estatística descritiva é o ramo da estatística que se encarrega do tratamento 
e análise de dados amostrais. Assim, depois de recolhida a amostra de acordo 
com técnicas que garantem a sua representatividade e aleatoriedade, fica 
disponível um conjunto de dados sobre o universo “em bruto” ou não 
classificados. Para que seja possível retirar qualquer tipo de conclusões, torna-
se necessário classificar os dados, recorrendo a tabelas de frequências e a 
representações gráficas, isto é, é preciso tratar os dados. Depois de tratados, 
será possível proceder à análise dos dados através de várias medidas que 
descrevem o seu comportamento: localização, dispersão, simetria dos dados, 
concentração, etc. São disso exemplo indicadores numéricos bem conhecidos 
como a média ou a variância. 
 
A estatística indutiva é o ramo da estatística que se ocupa em inferir das 
conclusões retiradas sobre a amostra para a população. De facto, a amostra 
não é mais do que um passo intermédio e exequível de obter informações 
sobre o verdadeiro objecto de estudo,que é o universo. A estatística indutiva 
(ou inferência estatística) garante a ligação entre amostra e universo: se algo 
se concluiu acerca da amostra, até que ponto é possível afirmar algo 
semelhante para o universo? É nesta fase que se procuram validar as 
hipóteses formuladas numa fase prévia exploratória. Claro que o processo de 
Manual de Exercícios 
Estatística Aplicada 7 
indução implica um certo grau de incerteza associado à tentativa de 
generalização de conclusões da “parte” (amostra) para o “todo” (universo). O 
conceito de probabilidade vai ter aqui, então, um papel fundamental. Isto é, não 
vai ser possível afirmar com toda a certeza que o comportamento da amostra 
ilustra perfeitamente o comportamento do universo, mas apenas que o faz com 
forte probabilidade. As inferências indutivas são assim elaboradas medindo, ao 
mesmo tempo, o respectivo grau de incerteza. Daí que, na ficha das técnicas 
das sondagens eleitorais, por exemplo, apareçam referências ao “nível de 
confiança” associado aos resultados e ao “erro” cometido. 
 
O esquema seguinte ilustra a “roda” da disciplina de estatística, relacionando 
os seus diferentes ramos: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
POPULAÇÃO 
OU UNIVERSO 
Amostragem 
TRATAMENTO E 
ANÁLISE DA AMOSTRA 
Estatística 
Descritiva 
Inferência
Estatística 
INFERIR DA AMOSTRA 
PARA O UNIVERSO 
Gráficos; tabelas; medidas descritivas 
Previsões 
Estimação 
Erros 
AMOSTRA 
Manual de Exercícios 
Estatística Aplicada 8 
 
 
 
 
 
2. ESTATÍSTICA DESCRITIVA 
 
 
Os resultados da observação de um atributo sobre os elementos do conjunto a 
analisar constituem os dados estatísticos. O ramo da estatística que se ocupa 
do tratamento, apresentação e análise de dados amostrais denomina-se de 
estatística descritiva. 
 
 
2.1. Variáveis Qualitativas 
 
Os dados qualitativos são organizados na forma de uma tabela de frequências, 
que representa o número ni de elementos de cada uma das categorias ou 
classes e que é chamado de frequência absoluta. A soma de todas as 
frequências é igual à dimensão da amostra (n). 
 
Numa tabela de frequências, além das frequências absolutas, também se 
apresentam as frequências relativas (fi), obtida dividindo a frequência absoluta 
pelo número total de observações. 
 
 
Modalidades Frequências absolutas Frequências relativas 
Mod. 1 n1 f1 
 
Mod. j nj fj 
 
Mod. n nn fn 
Total n: dimensão da amostra 1 
 
 
n
nifi = ; ni: nº de vezes que cada modalidade da variável foi observada. 
 
Manual de Exercícios 
Estatística Aplicada 9 
Estes dados podem também ser representados graficamente através de: 
 
Diagrama de barras 
Para cada modalidade, desenha-se uma barra de altura igual à frequência 
absoluta ou relativa (as frequências relativas são de preferir, pois permitem a 
comparação de amostras de diferentes dimensões). 
 
Diagrama sectorial ou circular 
Esta representação é constituída por um círculo, em que se apresentam tantas 
“fatias” quantas as modalidades em estudo. O ângulo correspondente a cada 
modalidade é proporcional às frequências das classes, fazendo corresponder o 
total da amostra (n) a 360º Geralmente, juntamente com a identificação da 
modalidade, indica-se a frequência relativa respectiva. 
 
 
 
2.2. Variáveis Quantitativas Discretas 
 
São variáveis que assumem um número finito ou infinito numerável de valores. 
A apresentação destas amostras é semelhante às variáveis qualitativas, 
fazendo-se uma tabela de frequências e uma representação gráfica recorrendo 
ao diagrama de barras. 
 
Valores da variável Frequências absolutas Frequências relativas 
X1 n1 f1 
 
Xj nj fj 
 
Xn nn fn 
Total n: dimensão da amostra 1 
 
 
Também é possível calcular as frequências (absolutas – Ni - e relativas - Fi) 
acumuladas, como se pode ver no exemplo: 
 
Nº defeituosos (X) Nº embalagens (ni) % embalagens (fi) Ni Fi 
0 80 40% 80 40% 
1 60 30% 80+60 40%+30% 
2 30 15% 170 85% 
3 20 10% 190 95% 
4 10 5% 200 100% 
Total 200 1 
 
Manual de Exercícios 
Estatística Aplicada 10 
2.3. Variáveis Quantitativas Contínuas 
 
Como foi dito anteriormente, uma variável (ou atributo) é contínua quando 
assume um número infinito não numerável de valores, isto é, podem assumir 
qualquer valor dentro de um intervalo. 
 
Neste caso, a construção da tabela compreende duas etapas: 
(i) Definição de classes de valores disjuntas, correspondentes a intervalos de 
números reais fechados à esquerda e abertos à direita, cuja constituição 
obedece a certas regras 
(ii) Contagem das observações pertencentes a cada classe 
 
 
Regra de construção de classes 
(pressupõe a formação de classes de igual amplitude) 
- Número de classes a constituir 
Depende de n = dimensão da amostra 
Se n≥25, o número de classes a constituir deve ser 5 
Se n<25, o número de classes a constituir deve ser n 
- Amplitude comum a todas as classes 
Sendo a amplitude total dos dados dada pela diferença entre o valor 
máximo e o valor mínimo observados, então a amplitude de cada classe 
será: 
Valor máximo da variável observado – Valor mínimo da variável observado 
Nº de classes a constituir 
 
 
 
Classes de 
valores da variável Frequências absolutas Frequências relativas 
[x1; x2[ n1 f1 
[x2; x3[ 
[x3; x4[ nj fj 
 
[xn-1; xn] n fn 
Total n: dimensão da amostra 1 
 
 
A distribuição de frequências representa-se através de um histograma. 
Um histograma é uma sucessão de rectângulos adjacentes, em que a base é 
uma classe e a altura a frequência (relativa ou absoluta) por unidade de 
amplitude (ni/ai ou fi/ai), sendo a amplitude de cada classe ai=ei-ei-1. A área total 
do histograma é a soma das frequências relativas, isto é, 1. 
Manual de Exercícios 
Estatística Aplicada 11 
 
1. Esta distribuição permite visualizar o tipo de distribuição e deve salientar 
alguns aspectos mais relevantes desta (moda, classe modal, ...). Como 
as classes podem ter amplitudes diferentes, para que todos os 
rectângulos (colunas) sejam comparáveis é necessário corrigir as 
frequências das classes (calculando as frequências que se teria se a 
amplitude de todas as classes fosse igual e igual a 1) 
2. É preferível representar o histograma com fi/hi do que com ni/hi uma vez 
que deste modo é possível comparar distribuições com diferente número 
de observações amostrais. 
 
Também é possível calcular as frequências (absolutas – Ni - e relativas - Fi) 
acumuladas. 
 
 
 
2.4. Medidas de localização 
 
2.4.1. Média ( X ) 
 
É a medida de localização mais usada, sobretudo pela sua facilidade de 
cálculo. 
Dados não-classificados (não agrupados numa tabela de frequências) 
 �
=
=
n
i
ix
n
x
1
1
 Média aritmética simples 
 
Dados classificados (isto é, agrupados numa tabela de frequências) 
Variáveis discretas 
 ��
==
==
n
i
iii
n
i
i xfxn
n
x
11
1
Média ponderada dos valores de X 
 
Dados classificados (isto é, agrupados numa tabela de frequências) 
Variáveis contínuas 
��
==
==
n
i
iii
n
i
i cfcn
n
x
11
1
 Média ponderada dos pontos médios das classes 
Manual de Exercícios 
Estatística Aplicada 12 
onde ci é o ponto médio de cada classe (
2
.sup.lim.inf.lim +
 ) 
A média é uma medida de localização que, geralmente, indica o valor central 
da distribuição, entendido como o valor em torno do qual se distribuem os 
valores observados. Desta forma, a média é muitas vezes utilizada como valor 
representativo da amostra. 
No entanto, a média tem o grande inconveniente de ser sensível a valores 
muito extremados ou aberrantes da distribuição (outliers).Em casos desses, a 
média deixa de ser um valor que aparece na parte central da distribuição para 
ser “empurrada” para os extremos. Nestes casos, é preferível recorrer à 
informação complementar fornecida por outras medidas de localização, como a 
moda e a mediana, que se definem a seguir. 
 
 
2.4.2. Mediana (Me) 
 
A mediana não se calcula a partir do valor de todas as observações, mas a 
partir da posição dessas observações. 
 
Dados não-classificados 
Se tivermos n valores x1, x2, ... xn 
Se n fôr ímpar, 
2
1+= nxMe 
Se n fôr par, 
2
1
22
+
+
=
nn xx
Me
 
 
Dados classificados 
A mediana é o valor tal que Fi = 0,5 
 
Variáveis discretas 
Se existe um valor de xi para o qual Fi = 0,5, então fala-se em intervalo 
mediano. 
Manual de Exercícios 
Estatística Aplicada 13 
Se não existe nenhum valor de xi para o qual Fi = 0,5, então a mediana é 
o primeiro valor para o qual Fi > 0,5. 
Variáveis contínuas 
Em geral, determina-se o valor para o qual Fi = 0,5 através de uma regra 
de três simples, atendendo a que as frequências acumuladas variam 
uniformemente dentro de cada classe. 
 
De uma forma geral: 
medianaclassexamp
FLFL
FLLMe .
infsup
inf5.0inf
−
−
+= 
 
 
2.4.3. Moda (Mo) 
Variáveis discretas 
A moda é valor de X para o qual fi é máximo, isto é, é o valor mais 
frequente da distribuição. 
Variáveis contínuas 
A classe modal é a classe de valores de X para o qual fi/hi é máximo, 
isto é, é a classe a que corresponde maior frequência por unidade de 
amplitude. 
 
 
2.5. Medidas de ordem 
 
Tal como se definiu para a mediana, é possível definir outros valores de 
posição ou valores separadores da distribuição em partes iguais. 
 
Chama-se quantil de ordem p ao valor de x a que corresponde Fi = p. 
- Se p=0,01; 0,02;.....0,99, chama-se ao quantil percentil 
- Se p=0,1; 0,2;...0,9, chama-se ao quantil decil 
- Se p=0,25, 0,5, 0,75, chama-se ao quantil QUARTIL (Q1, Q2 e Q3). A 
mediana é uma caso particular dos quartis (coincide com Q2) 
 
Variável discreta 
O quantil de ordem p é o primeiro valor de x para o qual i>p. 
Manual de Exercícios 
Estatística Aplicada 14 
Variável contínua 
Calcula-se por uma regra de três simples, como a mediana. 
De uma forma geral: 
 
1.
infsup
inf25.0inf1 Qclassexamp
FLFL
FLLQ
−
−
+= 
 
3.
infsup
inf75.0inf3 Qclassexamp
FLFL
FLLQ
−
−
+= 
 
A representação gráfica destas medidas designa-se de diagrama de 
extremos e quartis e serve para realçar algumas características da amostra. 
Os valores da amostra compreendidos entre os 1º e 3º quartis são 
representados por um rectângulo (caixa) com a mediana indicada por uma 
barra. Seguidamente, consideram-se duas linhas que unem os meios dos 
lados do rectângulo com os extremos da amostra. 
 
A partir deste diagrama, pode reconhecer-se a simetria ou enviesamento dos 
dados e a sua maior ou menor concentração: 
 
 
 
2.6. Medidas de assimetria 
 
A assimetria é tanto maior quanto mais afastados estiverem os valores da 
média, mediana e moda. Concretamente, se: 
− X = Me = Mo, a distribuição diz-se simétrica 
− X > Me > Mo, a distribuição diz-se assimétrica positiva (ou enviesada à 
esquerda) 
− X < Me < Mo, a distribuição diz-se assimétrica negativa (ou enviesada à 
direita) 
 
Coeficiente de assimetria de Bowley (g’): 
13
)12()23(
QQ
QQQQ
−
−−−
 
Se g’ = 0 ..............a distribuição é simétrica positiva ou equilibrada 
 Os quartis estão à mesma distância da mediana. 
Se g’ > 0 ..............a distribuição é assimétrica positiva ou “puxada” para 
25% 
maiores 
Manual de Exercícios 
Estatística Aplicada 15 
a esquerda (se fôr = 1, assimetria é máxima) 
 A mediana desliza para o lado do Q1, 
 logo Q3-Q2 > Q2-Q1 
Se g’ < 0 ..............a distribuição é assimétrica negativa ou “puxada” para 
 a direita (se fôr = -1, assimetria é máxima) 
 A mediana desliza para o lado do Q3, 
 logo Q2-Q1 > Q3-Q2 
 
 
 
 
 
 
 
 
 
 
 
 
2.7. Medidas de dispersão 
 
Duas distribuições podem distinguir-se na medida em que os valores da 
variável se dispersam relativamente ao ponto de localização (média, mediana, 
moda). Apresentam-se de seguida algumas das mais utilizadas, classificadas 
consoante a medida de localização usada para referenciar a dispersão das 
observações: 
 
 
2.7.1 Medidas de dispersão absoluta 
 
(i) Em relação à mediana 
Amplitude inter-quartis = Q = Q3 – Q1 
Significa que 50% das observações se situam num intervalo de 
amplitude Q. Quanto maior (menor) a amplitude do intervalo, maior 
(menor) a dispersão em torno da mediana. 
(ii) Em relação à média 
Variância amostral: mede os desvios quadráticos de cada valor 
observado em relação à média, havendo pouca dispersão se os desvios 
forem globalmente pequenos, e havendo muita dispersão se os desvios 
forem globalmente grandes. 
 
Q1 Q2 Q3 
Assimétrica positiva 
Assimétrica negativa 
Q1 Q2 
 Q3 
Manual de Exercícios 
Estatística Aplicada 16 
Dados não-classificados 
( )2
1
2 1�
=
−=
n
i
xxi
n
s
 
 
Dados classificados 
Variáveis discretas 
 
( ) ( )��
==
−=−=
n
i
n
i
xxifixxini
n
s
1
2
2
1
2 1
 
 
Dados classificados 
Variáveis contínuas 
 
( ) ( )��
==
−=−=
n
i
n
i
xcifixcini
n
s
1
2
2
1
2 1
 
 
onde ci é o ponto médio de cada classe i. 
Desvio-padrão: Medida de dispersão com significado real, mas que só é 
possível calcular indirectamente, através da raiz quadrada da variância. 
Está expressa nas mesmas unidades da variável. 
 
 
 
2.7.2 Medidas de dispersão relativa 
 
Muitas vezes, avaliar a dispersão através de um indicador de dispersão 
absoluta não é conveniente, assim como comparara a dispersão de duas 
distribuições, uma vez que estas medidas vêm expressas na mesma unidade 
da variável – como é o caso, por exemplo, da variância. Assim, é de esperar 
que os valores da variância sejam mais elevados quando os valores da variável 
são maiores, o que não significa que a distribuição seja muito dispersa. Para 
comparar diferentes distribuições de frequência são precisas medidas de 
dispersão relativa: 
 
definidaestáqualàrelaçãoemolocalizaçãdeMedida
absolutaDispersão
relativaDispersão = 
Manual de Exercícios 
Estatística Aplicada 17 
 
 
Coeficiente de variação 
x
sCV = x100% 
 
Outras medidas 
2
13
Q
QQ −
 
 
Estas medidas não estão expressas em nenhuma unidade, e permitem 
comparar dispersões entre duas amostras, pois não são sensíveis à escala 
(eventualmente diferente) em que as variáveis estejam expressas. 
 
 
 
2.8. Análise da concentração 
 
A noção de concentração apareceu associada ao estudo de desigualdades 
económicas, como a repartição do rendimento ou a distribuição de salários. O 
fenómeno de concentração está relacionado com a variabilidade ou dispersão 
dos valores observados, apesar de não poder ser analisado através das 
medidas de dispersão atrás descritas, que apenas medem a dispersão dos 
valores em relação a um ponto. O objectivo é determinar como o atributo 
(rendimento, salários, número de empresas) se distribui (se de forma mais ou 
menos uniforme) pelos diferentes indivíduos da amostra (que devem ser 
susceptíveis de serem adicionados, isto é, a análise de concentração não se 
aplica a idade, altura, peso, etc). 
Se o atributo estiver igualmente repartido pelos indivíduos, temos uma situação 
extrema de igual distribuição; e vice-versa de o atributo estiver concentrado 
num só indivíduo, temos uma situação extrema de máxima concentração. Em 
geral, interessa medir o grau deconcentração em situações intermédias. 
Para analisar a concentração, existem dois instrumentos: a Curva de Lorenz e o Índice 
de Gini. 
 
 
 
2.8.1 Curva de Lorenz 
Manual de Exercícios 
Estatística Aplicada 18 
 
O objectivo é comparar a evolução das frequências acumuladas (Fi = pi) com a 
evolução da soma dos valores da variável (qi) 
 
 
Quadro de dados 
Classes de 
valores da variável ni 
Quantidade 
atributo 
Freq.relativa 
acumuladas 
Proporção 
atrib.acumul, 
[x1; x2[ n1 yi p1 q1 
[x2; x3[ 
[x3; x4[ nj yj pj qj 
 
[xn-1; xn[ nn yn pn=1 qn=1 
Total n 
 
Os pontos (pi;qi) pertencem ao quadrado (0,1) por (0,1). A curva que os une é 
a curva de Lorenz. Se houver igual distribuição, a frequência das observações 
deve ter uma evolução igual à proporção do atributo correspondente, isto é, 
pi=qi. Nesse caso, a curva de Lorenz coincide com a diagonal do quadrado, 
que é designada de recta de igual repartição. Quanto mais a curva se afastar 
da recta, maior é a concentração. A zona entre a diagonal e acurva de Lorenz 
designa-se, por isso, de zona de concentração. 
 
 
2.8.2 Índice de Gini 
 
O índice de Gini é calculado pela seguinte expressão 
�
�
−
=
−
=
−
= 1
1
1
1
)(
n
i
n
i
pi
qipi
G 
 
Quando G = 0, a concentração é nula, havendo igual repartição. Caso o valor 
de G seja 1, a concentração será máxima. O valor de G varia entre 0 e 1, e 
quanto maior o seu valor, maior a concentração. 
 
 
Manual de Exercícios 
Estatística Aplicada 19 
2.9. Estatística Descritiva Bidimensional 
 
Numa situação em que se observam pares de valores (xi; yj), pode ter interesse 
estudar as relações porventura existentes entre os dois fenómenos, 
nomeadamente relações estatísticas. Não se trata de estudar relações 
funcionais (isto é, a medida em que o valor de uma variável é determinado 
exactamente pela outra), mas sim de estudar a forma como a variação de uma 
variável poderá afectar a variação da outra, em média. (por exemplo, o peso e 
a altura normalmente estão relacionados, mas a relação não é determinística). 
Duas variáveis ligadas por uma relação estatística dizem-se correlacionadas. 
Se as variações ocorrem, em média ou tendencialmente, no mesmo sentido, a 
correlação diz-se positiva. Se ocorrem em sentidos opostos, a correlação diz-
se negativa. 
 
Trata-se então de estudar se: 
- Se existe alguma correlação entre os fenómenos ou variáveis 
observadas 
- A existir, se é traduzível por alguma lei matemática, nem que 
tendencialmente 
- A existir, se é possível medi-la 
 
 
Por vezes, a representação gráfica do conjunto de dados bivariados sugere o 
ajustamento de uma recta a este conjunto de pontos, indicando a existência de 
uma tendencial correlação linear entre as duas variáveis, como é o caso do 
exemplo atrás descrito. A essa recta chama-se recta de regressão de y sobre 
x, que permite descrever como se reflectem em y (variável dependente ou 
explicada) as modificações processadas em x (variável independente ou 
explicativa). Essa recta torna possível, por exemplo, inferir (em média) a altura 
de um indivíduo, conhecendo o respectivo peso. 
Um dos métodos mais conhecidos de ajustar uma recta a um conjunto de 
dados é o Método dos Mínimos Quadrados, que consiste em determinar a recta 
que minimiza a soma dos quadrados dos desvios entre os verdadeiros valores 
de y e os obtidos a partir da recta que se pretende ajustar. Obtém-se assim a 
Manual de Exercícios 
Estatística Aplicada 20 
recta de regressão ou recta dos mínimos quadrados. Assim, se a recta de 
regressão obedecer à seguinte fórmula geral: 
 
y = a + bx 
 
o método permite minimizar a soma dos desvios quadráticos yi - (a + bxi). 
Assim sendo, obtém-se: 
�
�
−
−
= 22
xnx
yxnyx
b
i
ii
 e xbya −= 
 
Matematicamente, b designa o declive da recta. Em termos estatísticos, b 
corresponde ao coeficiente de regressão de y sobre x, que indica a variação 
média de y que acompanha uma variação unitária de x. 
 
O valor de a designa a ordenada na origem, isto é, o valor que y assume 
quando x=0. 
 
 
 
Quando, quer através do diagrama de dispersão, quer através da recta de 
regressão, se verifica a existência de uma associação linear entre as variáveis, 
pode-se medir a maior ou menor força com que as variáveis se associam 
através do coeficiente de correlação linear r: 
 
))((,
1
yyxxs
ss
s
r i
n
i
ixy
yyxx
xy
−−== �
=
 
 
 
Este indicador da correlação tem a vantagem de não depender das unidades 
ou da ordem de grandeza em que as variáveis estão expressas. O coeficiente 
de correlação linear está sempre compreendido entre –1 e 1. 
Se r > 0, então pode dizer-se que existe uma correlação positiva entre as 
variáveis, isto é, as variáveis variam no mesmo sentido: um aumento 
(diminuição de x) provoca um aumento (diminuição) de y, mas menos que 
proporcional. 
Manual de Exercícios 
Estatística Aplicada 21 
Se r < 0, então pode dizer-se que existe uma correlação negativa entre as 
variáveis, isto é, as variáveis variam em sentidos opostos: um aumento 
(diminuição de x) provoca uma diminuição (aumento) de y, mas menos que 
proporcional. 
Se r = 0, então pode dizer-se que as variáveis não estão correlacionadas 
linearmente. 
Antes de se efectuar um estudo de correlação, deve-se procurar justificação 
teórica para a existência ou inexistência de correlação. Caso contrário, poderá 
acontecer que variáveis sem relação de causalidade entre si, variem num certo 
sentido por razões exteriores. A esta correlação ilusória, chama-se correlação 
espúria. 
 
Nos extremos, se r = 1 ou se r = -1, então pode dizer-se que existe uma 
correlação positiva ou negativa perfeita, respectivamente, entre as variáveis, 
isto é, uma variação numa variável provoca na outra uma variação 
exactamente proporcional no mesmo sentido ou em sentido contrário. Isto é, a 
correlação é máxima. 
 
 
Correlação ordinal 
 
Por vezes, as variáveis vêm expressas numa escala ordinal, isto é, interessa 
mais conhecer a ordenação dos valores do que os valores observados 
propriamente ditos. Neste caso, em vez do coeficiente de correlação linear, 
calcula-se o coeficiente de correlação ordinal: 
 
y
i
x
ii
n
i
i
s RRd
nn
d
r −=
−
−=
�
=
,)1(61 2
1
2
 
 
 
 
 
 
Ordens (“ranks”) das 
observações de X e 
de Y, respectivamente 
Manual de Exercícios 
Estatística Aplicada 22 
ESTATÍSTICA DESCRITIVA 
Exercícios resolvidos 
 
Exercício 1 
Considere a distribuição de 1000 empresas de um sector de actividade 
segundo os resultados líquidos (em milhares de u.m.): 
 
Resultado Líquido Frequência. Relativa (%) 
[0; 1[ 10 
[1; 3[ 25 
[3; 5[ 35 
[5; 15[ 15 
[15; 25[ 10 
[25; 50[ 5 
Total 100 
 
a) Represente a distribuição graficamente. 
b) Determine a média e a moda da distribuição. Qual o significado dos 
valores encontrados? 
c) Calcule as frequências acumuladas e represente-as graficamente. 
Determine a mediana da distribuição. 
d) Determine os quartis da distribuição. Faça a sua representação gráfica. 
e) Analise a (as)simetria da distribuição em causa. 
f) Analise a concentração através do Índice de Gini e da Curva de Lorenz. 
 
 
Resolução 
 
a) 
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
0,2
0 10 20 30 40 50 60
fi/hi
Manual de Exercícios 
Estatística Aplicada 23 
 
b) 325,7%)55.37(...%)252(%)105,0(1
11
=+++=== ��
==
xxxcfcn
n
x
n
i
iii
n
i
i 
 
Em média, o resultado líquido de uma empresa é de 7325 unidades 
monetárias. 
 
A classe modal é aquela a que corresponde maior frequência por unidade de 
amplitude. Neste caso,o maior valor de fi / hi é 0,175. correspondente à classe 
[3; 5[, isto é, os valores de resultado líquido mais prováveis para uma empresa 
situam-se entre 3000 u.m. e 5000 u.m. 
 
c) A representação gráfica das frequências acumuladas (ver tabela) designa-se 
de polígono integral: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Classe mediana (classe a que corresponde uma frequência acumulada 0,5): [3; 5[ 
3 : Fi=0,35 
5 : Fi = 0,7 
 
Fi
0
0,2
0,4
0,6
0,8
1
0 20 40 60 80 100 120
X fi hi fi/hi Fi ci 
[0; 1[ 10% 1 0.1 10% 0.5 
[1; 3[ 25% 2 0.125 35% 2 
[3; 5[ 35% 2 0.175 70% 4 
[5; 15[ 15% 10 0.015 85% 10 
[15; 25[ 10% 10 0.01 95% 20 
[25; 50] 5% 25 0.002 100% 37.5 
Total 1 
Manual de Exercícios 
Estatística Aplicada 24 
Cálculo da mediana: 
0,7 - 0,35 ------------ 5 - 3 
0,5 – 0,35 -------------- Me – 3 
Me = 3 + ((2x0,15)/0,35) = 3,857 
50% das empresas apresentam resultados líquidos inferiores a 3857 u.m. 
 
d) Classe a que pertence Q1 (classe a que corresponde uma frequência 
acumulada 0,25): [1; 3[ 
1 : Fi=0,1 
3 : Fi = 0,35 
 
Cálculo do Q1: 
0,35 - 0,1 ------------ 3 - 1 
0,25 – 0,1 -------------- Q1 – 1 
Q1 = 1 + ((2x0,15)/0,25) = 2,2 
25% das empresas apresentam resultados líquidos inferiores a 2200 u.m. 
 
 
Classe a que pertence Q3 (classe a que corresponde uma frequência 
acumulada 0,75): [5; 15[ 
5 : Fi=0,7 
15 : Fi = 0,85 
 
Cálculo do Q3: 
0,85 - 0,7 ------------ 15 - 5 
0,75 – 0,7 -------------- Q3 – 5 
Q3 = 5 + ((10x0,05)/0,15) = 8,333(3) 
75% das empresas apresentam resultados líquidos inferiores a 8333 u.m. 
 
 
e) 
04596,0
2,2333,8
)2,2857,3()857,3333,8(
13
)12()23(
' >=
−
−−−
=
−
−−−
= QQ
QQQQg 
 
A distribuição é assimétrica positiva ou enviesada à esquerda. 
 
 
Manual de Exercícios 
Estatística Aplicada 25 
f) 
 
X fi ni ci Atributo pi (=Fi) qi 
[0; 1[ 10% 1000x10%=100 0.5 100x0.5=50 0.1 0.007 
[1; 3[ 25% 250 2 250x2=500 0.35 0.075 
[3; 5[ 35% 350 4 1400 0.7 0.266 
[5; 15[ 15% 150 10 1500 0.85 0.471 
[15; 25[ 10% 100 20 2000 0.95 0.744 
[25; 50[ 5% 50 37.5 1875 1 1 
Total 1 n=1000 7325 
 
 
 
 
 
47,0
95,085,07,035,01,0
)744,095,0(...)007,01,0(
=
++++
−++−
=G 
 
 
A distribuição dos resultados líquidos 
apresenta concentração média (G=0,5 
corresponde ao centro da escala 
possível, entre 0 e 1). Por exemplo, 
70% das empresas apresentavam 
resultados até 5000 u.m., mas isso 
representava apenas 26,6% do total 
de resultados das empresas da 
amostra, o que sugere um tecido 
empresarial com muitas PMEs, mas 
em que cada uma tem baixo resultado 
líquido. 
 
 
 
 
Exercício 2 
Considere a seguinte amostra de dimensão 200, referente aos lucros obtidos 
por empresas de um dado sector industrial, expressas numa determinada 
unidade monetária. 
 
Analise a concentração através do Índice de Gini e da Curva de Lorenz. 
 
Res.Liq.Totais 
7325
140050050 ++
 
Curva de Lorenz
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
Manual de Exercícios 
Estatística Aplicada 26 
Resolução 
 
Lucros ni Lucro total pi (=Fi) qi 
[0; 50[ 20 600 0.1 0.02 
[50; 100[ 60 4400 0.4 0.16(6) 
[100; 200[ 80 14000 0.8 0.63(3) 
[200; 300[ 30 7500 0.95 0.883(3) 
[300; 500] 10 3500 1 1 
Total 200 30000 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
243,0
25,2
)6(546,0)(
1
1
1
1
==
−
=
�
�
−
=
−
=
n
i
n
i
pi
qipi
G 
 
 
Tanto pela análise da Curva de Lorenz, como pelo valor do Índice de Gini, 
conclui-se que esta amostra apresenta concentração moderada, encontrando-
se os valores razoavelmente repartidos. 
 
 
Exercício 3 
Considere o exemplo abaixo referente ao peso e altura de 10 indivíduos. 
a) Represente o diagrama de dispersão. 
b) Analise a correlação existente entre peso e altura. 
c) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que 
exprima as peso em função da altura. 
Curva de Lorenz
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
Manual de Exercícios 
Estatística Aplicada 27 
 
Indivíduo Peso (kg) Altura (cm) 
A 72 175 
B 65 170 
C 80 185 
D 57 154 
E 60 165 
F 77 175 
G 83 182 
H 79 178 
I 67 175 
J 68 173 
 
 
Resolução 
 
a) 
 
 
 
 
 
 
 
 
 
 
 
 
b) No exemplo, r = 0,90681871, isto é, existe uma correlação positiva forte 
entre as duas variáveis, quase perfeita. 
 
c) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Diagrama de Dispersão
150
160
170
180
190
50 60 70 80 90
Peso (kg)
Al
tu
ra
 
(cm
)
Recta de Regressão
y = 0,9016x + 109,36
150
160
170
180
190
50 60 70 80 90
Peso (kg)
Al
tu
ra
 
(cm
)
Manual de Exercícios 
Estatística Aplicada 28 
A equação desta recta traduz-se em 
Altura = 109,36 + 0,9016 x Peso 
Isto é, se um indivíduo pesar 70 kg, a altura esperada será de 109,36 + 0,9016 
x 70 = 172,472. 
Por cada kg de peso adicional, espera-se que a altura do indivíduo aumente 
0,9016 cm. 
 
 
Exercício 4 
O quadro abaixo apresenta as vendas e as despesas em publicidade (ambas 
em milhares de u.m.) de uma empresa no período de 7 anos: 
Ano Vendas Desp. Publicidade 
1 10 3 
2 13 3 
3 18 5 
4 19 6 
5 25 8 
6 30 9 
7 35 13 
 
a) Compare as vendas e as despesas em publicidade quanto à dispersão. 
b) Analise a correlação existente entre volume e custo de produção. 
c) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que 
exprima as vendas em função das despesas em publicidade. 
 
 
Resolução 
a) Para comparar a dispersão das duas distribuições, é necessário calcular os 
coeficientes de variação (medidas de dispersão relativa): 
 
Dados não-classificados 
429,211
1
== �
=
n
i
ix
n
x
 
714,61
1
== �
=
n
i
iy
n
y
 
( ) 9408,691 2
1
2
=−= �
=
n
i
x xxi
n
s
 
( ) 0651,111 2
1
2
=−= �
=
n
i
y yyi
n
s
 
 
39,0
429,21
9408,69
===
x
sCV xx < 495,0714,6
0651,11
===
y
s
CV yy 
 
A dispersão das despesas em publicidade é superior à dispersão das vendas. 
 
 
Manual de Exercícios 
Estatística Aplicada 29 
b) 
( )( ) ( )( )[ ]
98,0
0651,119408,69
714,613429,2135...714,63429,2110
7
1
=
−−++−−
==
xss
s
r
yyxx
xy
 
 
Existe uma correlação positiva linear forte entre as duas variáveis. Em média, 
quando as despesas em publicidade aumentam (diminuem), as vendas 
aumentam (diminuem) de forma quase exactamente proporcional. 
 
 
 
c) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Exercício 5 
Considere que 10 estudantes foram sujeitos a uma prova de avaliação no início 
e no final do curso. No quadro abaixo, encontram-se as ordenações desses 10 
estudantes segundo as classificações obtidas em cada uma das provas: 
 
Aluno Prova inicial Rix 
Prova final 
Riy 
di 
Rix - Riy 
A 1 1 0 
B 3 2 1 
C 2 3 -1 
D 5 4 1 
E 7 6 1 
F 8 8 0 
G 9 7 2 
H 10 9 1 
I 6 10 -4 
J 4 5 -1 
Recta de Regressão
y = 2,4649x + 4,8782
0
10
20
30
3 8 13
Desp. Public.
Ve
n
da
s
Manual de Exercícios 
Estatística Aplicada 30 
Resolução 
Como não dispomos das classificações dos alunos, mas sim das ordenações 
das classificações (do 1º ao 10º classificado), para avaliar a correlação 
existente entre as 2 provas calcula-se o coeficiente de correlação ordinal: 
8424,0)1100(10
)11614011110(61)1(61 2
1
2
=
−
+++++++++
−=
−−=
�
=
x
x
nn
d
r
n
i
i
s 
 
 
A correlação é positiva e elevada (rs varia entre –1 e 1), isto é, os alunos que 
tiveram boa nota na prova inicial tiveram, em média, igualmente boa nota na 
prova final. 
 
 
Exercício 6 
O quadro que se segue descreve a distribuição do rendimento anual (em 
milhares de u.m.) de 2500 famílias da população de um país: 
Rendimento anual Nº de famílias 
[0, 1[ 250 
[1, 2[ 375 
[2, 5[ 625 
[5, 15[ 750 
[15, 25[ 375 
[25, 50[ 125 
 
a) Represente as frequências acumuladas graficamente. 
b) Determine o rendimento médio e mediano. 
c) Determine os três primeiros quartis. Que indicações lhe dão sobre a 
(as)simetria? 
d) O que pode concluir quanto à dispersão? 
e) Calcule o índice de Gini. O que conclui sobre a concentração do 
rendimento? 
 
Resolução 
a) 
Rendimento anual Nº de famílias % de famílias Fi (%) ci 
[0, 1[ 250 10 10 0.5 
[1, 2[ 375 15 25 1.5 
[2, 5[ 625 25 50 3.5 
[5, 15[ 750 30 80 10 
[15, 25[ 375 15 95 20 
[25, 50[ 125 5 1 37.5 
Manual de Exercícios 
Estatística Aplicada 31 
b) 025,9%)55.37(...%)155.1(%)105,0(1
11
=+++=== ��
==
xxxcfcn
n
x
n
i
iii
n
i
i 
 
Em média, o rendimento anual de uma família é de 9025 unidades monetárias. 
 
Classe mediana (classe a que corresponde uma frequência acumulada 0,5): [2; 5[ 
5 : Fi = 0,5. Logo, a mediana é 5 (50% das famílias têm rendimentos anuais até 
5000 unidades monetárias). 
 
 
c) Classe a que pertence Q1 (classe a que corresponde uma frequência 
acumulada 0,25): [1; 2[ 
3 : Fi = 0,25 
25% das famílias apresentam rendimentos anuais inferiores a 2000 u.m. 
 
 
Classe a que pertence Q3 (classe a que corresponde uma frequência 
acumulada 0,75): [5; 15[ 
5 : Fi=0,5 
15 : Fi = 0,8 
 
Cálculo do Q3: 
0,8 - 0,5 ------------ 15 - 5 
0,75 – 0,5 -------------- Q3 – 5 
Q3 = 5 + ((10x0,25)/0,3) = 13,333(3) 
75% das famílias apresentam rendimentos anuais inferiores a 13333 u.m. 
0
0,2
0,4
0,6
0,8
1
0 10 20 30 40 50 60 70 80 90 100
Manual de Exercícios 
Estatística Aplicada 32 
047,0
2333,13
)25()5333,13(
13
)12()23(
' >=
−
−−−
=
−
−−−
= QQ
QQQQg 
 
A distribuição é assimétrica positiva ou enviesada à esquerda. 
 
 
d) ( ) 286875,82* 2
1
2
2
1
2
=−=−= ��
==
xficixcifis
n
i
n
i
x 
 071,9286875,822 === xx ss 
 
 
e) 
Rendimento anual ni ci Rend. total pi (=Fi) qi 
[0, 1[ 250 0.5 125 0,1 0.00554 
[1, 2[ 375 1.5 562,5 0,25 0.0305 
[2, 5[ 625 3.5 2187,5 0,5 0.1274 
[5, 15[ 750 10 7500 0,8 0.46 
[15, 25[ 375 20 7500 0,95 0.7922 
[25, 50[ 125 37.5 4687.5 1 1 
Total 2500 22562,5 
 
4555,0
6,2
18436,1
)(
1
1
1
1
==
−
=
�
�
−
=
−
=
n
i
n
i
pi
qipi
G Concentração moderada do rendimento 
 
 
Exercício 7 
Considere a seguinte tabela que representa a distribuição dos empregados de 
uma instituição bancária segundo a remuneração bruta mensal (em milhares de 
unidades monetárias): 
 
Remuneração Frequência. Relativa (%) 
[60; 80[ 7.8 
[80; 100[ 15.2 
[100; 120[ 31.2 
[120; 140[ 19.5 
[140; 160[ 7.2 
[160; 200[ 8.1 
[200; 250[ 5.4 
[250, 300[ 2.6 
[300; 350] 3.0 
Total 100 
Manual de Exercícios 
Estatística Aplicada 33 
a) Calcule os quartis da distribuição. 
b) Analise a dispersão da distribuição em causa. 
c) Analise a assimetria da distribuição em causa. 
 
 
Resolução 
a) 
Remuneração Frequência. Relativa (%) Fi (%) 
[60; 80[ 7.8 7.8 
[80; 100[ 15.2 23 
[100; 120[ 31.2 54.2 
[120; 140[ 19.5 73.7 
[140; 160[ 7.2 80.9 
[160; 200[ 8.1 89 
[200; 250[ 5.4 94.4 
[250, 300[ 2.6 97 
[300; 350] 3.0 100 
Total 100 
 
Classe a que pertence Q1 (classe a que corresponde uma frequência acumulada 
0,25): [100; 120[ 
1 : Fi=0,23 
3 : Fi = 0,542 
Cálculo do Q1: 
0,542 - 0,23 ------------ 120 - 100 
0,25 - 0,23 -------------- Q1 - 100 
Q1 = 100 + ((20x0,02)/0,312) = 101,28 
25% dos empregados auferem remunerações inferiores a 101,28 milhares u.m. 
 
Classe a que pertence Q2 (classe a que corresponde uma frequência acumulada 
0,5): [100; 120[ 
100 : Fi=0,23 
120 : Fi = 0,542 
Cálculo do Q2: 
0,542 - 0,23 ------------ 120 - 100 
0,5 - 0,23 -------------- Q2 - 100 
Q2 = 100 + ((20x0,27)/0,312) = 117,3 
50% dos empregados auferem remunerações inferiores a 117,3 milhares u.m. 
Manual de Exercícios 
Estatística Aplicada 34 
Classe a que pertence Q3 (classe a que corresponde uma frequência 
acumulada 0,75): [140; 160[ 
120 : Fi=0,737 
140 : Fi = 0,809 
 
Cálculo do Q3: 
0,809 - 0,737 ------------ 160 - 140 
0,75 – 0,737 -------------- Q3 - 140 
Q3 = 140 + ((20x0,013)/0,072) = 143,61(1) 
75% dos empregados auferem remunerações inferiores a 143,61(1) milhares u.m. 
 
b) Amplitude do intervalo inter-quartis = Q3 - Q1 = 143,61(1) - 101,28 = 42,33 
 (dispersão reduzida em torno da mediana) 
 
c) 0243,0
28,10161,143
)28,1013,117()3,11761,143(
13
)12()23(
' >=
−
−−−
=
−
−−−
= QQ
QQQQg 
 
 A distribuição é assimétrica positiva ou enviesada à esquerda. 
 
 
Exercício 8 
 Os dados seguintes referem-se ao peso, expresso em gramas, do conteúdo de 
uma série de 100 garrafas que, no decurso de um teste, saíram de uma linha 
de enchimento automático: 
 
Peso (em gramas) Frequência. Relativa (%) 
[297; 298[ 8 
[298; 299[ 21 
[299; 300[ 28 
[300; 301[ 15 
[301; 302[ 11 
[302; 303[ 10 
[303; 304[ 5 
[304; 305[ 1 
[305; 306] 1 
Total 100 
 
a) Represente graficamente os dados acima. 
b) Calcule as frequências acumuladas e represente-as graficamente. 
Manual de Exercícios 
Estatística Aplicada 35 
c) Determine o peso médio, mediano e modal. Qual o seu significado? 
d) Determine os quartis da distribuição. 
e) Analise a dispersão do peso das garrafas. 
 
Resolução 
a) 
 
 
 
 
 
 
 
b) 
Peso (em gramas) Frequência Relativa (%) Fi (%) 
[297; 298[ 8 8 
[298; 299[ 21 29 
[299; 300[ 28 57 
[300; 301[ 15 72 
[301; 302[ 11 83 
[302; 303[ 10 93 
[303; 304[ 5 98 
[304; 305[ 1 99 
[305; 306] 1 100 
Total 100 
 
 
 
 
 
 
 
 
 
c) 
11,300%)15,305(...%)215,298(%)85,297(1
11
=+++=== ��
==
xxxcfcn
n
x
n
i
iii
n
i
i 
O peso médio das garrafas é de 300,11 kg. 
0
0,05
0,1
0,15
0,2
0,25
0,3
296 297 298 299 300 301 302 303 304 305 306 307
Histograma
0
0,2
0,4
0,6
0,8
1
295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310
F*
Manual de Exercícios 
Estatística Aplicada 36 
Classe mediana (classe a que corresponde uma frequência acumulada 0,5): [299; 
300[ 
299 : Fi = 0,29 
300 : Fi = 0,57 
Cálculo do Q2: 
0,57 - 0,29 ------------ 300 - 299 
0,5 - 0,29 -------------- Q2 - 299 
Q2 = 299 + ((1x0,21)/0,28) = 299,75 
50% das garrafas têm peso inferior a 299,75 kg. 
 
A classe modal é aquela a que corresponde maior frequência relativa. Neste 
caso, o maior valor de fi é 0,28 correspondente à classe [299; 300[, isto é, os 
pesos mais prováveis das garrafas situam-se entre 299 kg e 300 kg. 
 
d) Classe a que pertence Q1 (classe a que corresponde uma frequência 
acumulada 0,25): [298; 299[ 
298 : Fi=0,08 
299 : Fi = 0,29 
Cálculo do Q1: 
0,29 - 0,08 ------------ 298 - 299 
0,25 - 0,08 ------------ Q1 - 299 
Q1 = 299 + ((1x0,17)/0,21) = 299,0357 
25% das garrafas têm peso inferior a 299,0357 kg. 
 
Classe a que pertence Q3 (classe a que corresponde uma frequência 
acumulada 0,75): [301; 302[ 
301 : Fi=0,72 
302 : Fi = 0,83 
Cálculo do Q3: 
0,83 - 0,72 ------------ 302 - 301 
0,75 – 0,72 -------------- Q3 - 301 
Q3 = 301 + ((1x0,03)/0,11) = 301,27(27) 
75% das garrafas têm peso inferior a 301,27(27) kg. 
Manual de ExercíciosEstatística Aplicada 37 
e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 301,27(27) - 299,0357 = 2,237 
 (dispersão reduzida em torno da mediana) 
 
Exercício 8 
Numa faculdade, mediram-se as alturas de 100 alunos do primeiro ano: 
 
Altura (em metros) Nº Alunos 
[1,4; 1,5[ 2 
[1,5; 1,55[ 10 
[1,55; 1,6[ 25 
[1,6; 1,65[ 13 
[1,65; 1,7[ 17 
[1,7; 1,75[ 20 
[1,75; 1,8[ 10 
[1,8; 1,9] 3 
Total 100 
 
a) Represente graficamente os dados acima. 
b) Determine a altura média e a altura modal. Qual o seu significado? 
c) Calcule as frequências acumuladas e represente-as graficamente. 
d) Determine os quartis da distribuição e diga qual o seu significado. 
e) Analise a dispersão da distribuição. 
f) Analise a (as)simetria da distribuição. 
 
Resolução 
a) 
Altura (em metros) ni fi ci hi fi/hi Fi 
[1,4; 1,5[ 2 0,02 1,45 0,1 0,2 0,02 
[1,5; 1,55[ 10 0,1 1,525 0,05 2 0,12 
[1,55; 1,6[ 25 0,25 1,575 0,05 5 0,37 
[1,6; 1,65[ 13 0,13 1,625 0,05 2,6 0,5 
[1,65; 1,7[ 17 0,17 1,675 0,05 3,4 0,67 
[1,7; 1,75[ 20 0,2 1,725 0,05 4 0,87 
[1,75; 1,8[ 10 0,1 1,775 0,05 2 0,97 
[1,8; 1,9] 3 0,03 1,85 0,1 0,3 1 
Total 100 1 
 
 
 
 
 
 
 
0
1
2
3
4
5
6
1,4 1,5 1,6 1,7 1,8 1,9
Histogramafi/hi
Manual de Exercícios 
Estatística Aplicada 38 
b) 65,1%)385,1(...%)10525,1(%)245,1(1
11
=+++=== ��
==
xxxcfcn
n
x
n
i
iii
n
i
i 
A altura média dos alunos é de 1,65 m. 
 
A classe modal é aquela a que corresponde maior frequência por unidade de 
amplitude. Neste caso, o maior valor de fi / hi é 5. correspondente à classe 
[1,55; 1,6[, isto é, a altura mais provável de um aluno rondará 1,55m / 1,6m. 
 
c) 
 
 
 
 
 
 
d) Classe a que pertence Q1 (classe a que corresponde uma frequência 
acumulada 0,25): [1,55; 1,6[ 
1,55 : Fi=0,12 
1,6 : Fi = 0,37 
Cálculo do Q1: 
0,37 – 0,12 ------------ 1,6 – 1,55 
0,25 – 0,12 ------------ Q1 – 1,55 
Q1 = 1,55 + ((0,05x0,13)/0,25) = 1,576 
25% dos alunos têm altura inferior a 1,576 m. 
 
Classe a que pertence Q2 (classe a que corresponde uma frequência 
acumulada 0,5): [1,6; 1,65[ 
1,65 : Fi = 0,5 
50% dos alunos têm altura inferior a 1,65 m. 
 
Classe a que pertence Q3 (classe a que corresponde uma frequência 
acumulada 0,75): [1,7; 1,75[ 
1,7 : Fi=0,67 
1,75 : Fi = 0,87 
0
0,2
0,4
0,6
0,8
1
1,3 1,4 1,5 1,6 1,7 1,8 1,9 2
F*
Manual de Exercícios 
Estatística Aplicada 39 
Cálculo do Q3: 
0,87- 0,67------------ 1,75 – 1,7 
0,75 – 0,67-------------- Q3 – 1,7 
Q3 = 1,7 + ((0,05*0,08)/0,2) = 1,72 
75% dos alunos têm altura inferior a 1,72 m. 
 
e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 1,72 – 1,576 = 0,144 
 (dispersão reduzida em torno da mediana) 
( ) 00536875,0* 2
1
2
2
1
2
=−=−= ��
==
xficixcifis
n
i
n
i
x 
 07327,000536875,02 === xx ss 
(dispersão reduzida em torno da média) 
 
f) 0)7(027,0
576,172,1
)576,165,1()65,172,1(
13
)12()23(
' <−=
−
−−−
=
−
−−−
= QQ
QQQQg 
 
 A distribuição é ligeiramente assimétrica negativa ou enviesada à direita 
 (quase simétrica). 
 
 
Exercício 9 
Em determinada central telefónica, registou-se a duração das chamadas 
realizadas em Dezembro de 2001: 
 
Duração (em minutos) Nº Chamadas 
[0; 5[ 2000 
[5; 10[ 1500 
[10; 20[ 1000 
[20; 30[ 300 
[30; 50] 200 
Total 5000 
 
 
a) Represente graficamente as frequências simples e acumuladas. 
b) Determine a duração média das chamadas e respectivo desvio-padrão. 
c) Qual a duração da chamada mediana? Qual o significado do valor 
encontrado? 
Manual de Exercícios 
Estatística Aplicada 40 
d) Sabe-se que as chamadas realizadas durante o ano de 2001 
apresentaram uma duração média de 10 minutos, com desvio-padrão de 
8,7 minutos. Compare, quanto à dispersão, as chamadas efectuadas em 
Dezembro com as que tiveram lugar durante todo o ano de 2001. 
 
Resolução 
a) 
Duração (em minutos) ni fi hi fi/hi Fi ci 
[0; 5[ 2000 0,4 5 0,08 0,4 2,5 
[5; 10[ 1500 0,3 5 0,06 0,7 7,5 
[10; 20[ 1000 0,2 10 0,02 0,9 15 
[20; 30[ 300 0,06 10 0,006 0,96 25 
[30; 50] 200 0,04 20 0,002 1 40 
Total 5000 1 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b) 35,9%)440(...%)305,7(%)405,2(1
11
=+++=== ��
==
xxxcfcn
n
x
n
i
iii
n
i
i 
 A duração média de uma chamada é de 9,35 minutos. 
( ) 4525,81* 2
1
2
2
1
2
=−=−= ��
==
xficixcifis
n
i
n
i
x 
 025,900536875,02 === xx ss 
 
c) Classe mediana (classe a que corresponde frequência acumulada 0,5): [5; 10[ 
0
0,02
0,04
0,06
0,08
0,1
0 10 20 30 40 50 60
Histogramafi/hi
0
0,2
0,4
0,6
0,8
1
0 10 20 30 40 50 60 70 80 90 100
F*
Manual de Exercícios 
Estatística Aplicada 41 
5 : Fi = 0,4 
10 : Fi = 0,7 
Cálculo da Me: 
0,7 - 0,4 ------------ 10 - 5 
0,5 - 0,4 ------------ Me - 5 
Me = 5 + ((5x0,1)/0,3) = 6,67 
50% das chamadas têm duração a 6,67 minutos. 
 
d) 965,0
35,9
025,9
===
x
sCV xDez > 87,010
7,8
2001 === y
s
CV y 
 
Exercício 10 
Uma empresa coligiu dados relativos à produção de 12 lotes de um tipo especial 
de rolamento. O volume de produção e o custo de produção de cada lote 
apresentam-se na tabela: 
 
Lote Volume (unidades) Custo (contos) 
1 1500 3100 
2 800 1900 
3 2600 4200 
4 1000 2300 
5 600 1200 
6 2800 4900 
7 1200 2800 
8 900 2100 
9 400 1400 
10 1300 2400 
11 1200 2400 
12 2000 3800 
 
a) Analise a correlação existente entre volume e custo de produção. 
b) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que 
exprima o custo em função do volume de produção. 
 
Resolução 
a) ( )( ) ( )( )[ ] 98,0
1145944520854
3,270838003,13582000...3,270831003,13581500
12
1
=
−−++−−
==
xss
s
r
yyxx
xy
 
 
Correlação positiva quase perfeita. 
 
Manual de Exercícios 
Estatística Aplicada 42 
b) 
 
 
 
 
 
 
 
 
 
 
Exercício 11 
Um conjunto de empresas do sector da Construção e Obras Públicas cotadas 
na Bolsa de Valores foram analisadas relativamente aos seguintes indicadores: 
 EPS (Earnings per Share): Resultado Líquido por Acção 
 PBV (Price/Book Value): Preço / Situação Líquida por Acção 
 
 
Empresa EPS ($) PBV ($) 
1 191 0.9 
2 32 1.0 
3 104 0.8 
4 117 0.8 
5 210 1.5 
6 95 0.7 
7 65 0.9 
8 201 1.3 
9 81 0.4 
 
a) Analise a correlação existente entre aqueles dois indicadores. 
b) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que 
exprima a variável EPS em função de PBV. 
 
 
Resolução 
a) 
( )( ) ( )( )[ ]
61,0
096933,0332,3669
92,04,07,12181...92,09,07,121191
9
1
=
−−++−−
==
xss
s
r
yyxx
xy
 
 
Correlação positiva moderada. 
 
 
y = 1,4553x + 731,6
0
1000
2000
3000
4000
5000
6000
0 500 1000 1500 2000 2500 3000
Volume
Cu
st
o
Manual de Exercícios 
Estatística Aplicada 43 
b) 
 
 
 
 
 
 
 
 
 
 
 
Exercício 12 
Recolheu-se uma amostra em 17 cidades do país relativamente aos seguintes 
indicadores: 
Ri: Rendimento médio mensal na cidade i (em 106 unidades monetárias) 
Gi: Gasto médio mensal em bens de luxo na cidade i (em 106 u.m.) 
 
Ri Gi Ri Gi 
 
125 54 144 61 
127 56 147 62 
130 57 150 62 
131 57 152 63 
133 58 154 63 
135 58 160 64 
140 59 162 65 
143 59 165 66 
169 66 
 
 
Dados adicionais 
� = 2467iR � = 1030iG � = 3610732iR 
� = 626202iG � = 150270iiGR 
 
 
a) Estude a correlação entre rendimento e despesas em bens de luxo. 
b) Ajuste, pelo Método dos Mínimos Quadrados, uma função linear que 
exprima a variável Giem função de Ri. 
 
 
y = 124,04x + 7,383
0
50
100
150
200
250
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6
PBV
EP
S
Manual de Exercícios 
Estatística Aplicada 44 
Resolução 
a) 
986,0
)
17
1030
*1762620)(
17
2467
*17361073(
17
1030
*
17
2467
*17150270
))((
2
22
2
2222
=
−−
−
=
−−
−
=
� �
�
GnGRnR
GRnGR
r
ii
ii
XY
 
Correlação positiva forte. 
 
b) 
y = 0,2604x + 22,801
50
52
54
56
58
60
62
64
66
68
100 120 140 160 180 200
Rendimento
G
as
to
104
Introdução ao e-learning
FMD_i.p65 15-01-2004, 10:49104
Manual de Exercícios 
Estatística Aplicada 45 
 
 
 
 
 
3. ESTATÍSTICA INDUTIVA 
 
 
A estatística indutiva é o ramo da estatística que se ocupa em inferir das 
conclusões retiradas sobre a amostra para a população. Claro que o processo 
de indução implica um certo grau de incerteza associado à tentativa de 
generalização de conclusões da “parte” (amostra) para o “todo” (universo). O 
conceito de probabilidade vai ter aqui, então, um papel fundamental. Isto é, não 
vai ser possível afirmar com toda a certeza que o comportamento da amostra 
ilustra perfeitamente o comportamento do universo, mas apenas que o faz com 
forte probabilidade. 
De seguida, serão apresentadas algumas noções simples de probabilidades e 
funções de probabilidade, que serão úteis a aplicações de estatística indutiva 
relacionadas com controlo estatístico de qualidade e fiabilidade de 
componentes e sistemas. 
 
 
 
3.1. Noções básicas de probabilidade 
 
A teoria das probabilidades é um ramo da matemática extremamente útil para o 
estudo e a investigação das regularidades dos chamados fenómenos 
aleatórios. O exemplo seguinte pretende clarificar o que vulgarmente é 
designado por experiência aleatória. 
 
Deve entender-se como experiência qualquer processo ou conjunto de 
circunstâncias capaz de produzir resultados observáveis; quando uma 
experiência está sujeita à influência de factores casuais e conduz a resultados 
incertos, diz-se que a experiência é aleatória. 
Fundamentalmente, as experiências aleatórias caracterizam-se por: 
Manual de Exercícios 
Estatística Aplicada 46 
(i) poder repetir-se um grande número de vezes nas mesmas condições 
ou em condições muito semelhantes 
(ii) cada vez que a experiência se realiza, obtém-se um resultado 
individual, mas não é possível prever exactamente esse resultado 
(iii) os resultados das experiências individuais mostram-se irregulares, 
mas os resultados obtidos após uma longa repetição da experiência 
patenteiam uma grande regularidade estatística no seu conjunto 
 
Alguns autores consideram inserido no conceito de experiência aleatória um 
outro, o de espaço de resultados. O espaço de resultados corresponde ao 
conjunto formado por todos os resultados possíveis de uma experiência 
aleatória. Por exemplo, num lançamento de um dado ordinário tem-se que o 
espaço de resultados é }{ 6,5,4,3,2,1 . 
A importância da definição deste conceito advém sobretudo por ser o meio 
empregue para a definição de acontecimentos, que não sei mais que 
subconjuntos do espaço de resultados. Por exemplo, no lançamento de um 
dado podem definir-se, para além dos 6 acontecimentos elementares 
correspondentes à saída de cada uma das faces, outros como “saída de um 
número ímpar” definido pelo subconjunto }{ 5,3,1 . 
Definidos como conjuntos, aos acontecimentos é aplicável toda a construção 
disponível para aqueles, isto é, existe um paralelismo perfeito entre álgebra de 
conjuntos e álgebra de acontecimentos: 
(i) O acontecimento que contem todos os elementos do espaço de 
resultados chama-se acontecimento certo 
(ii) O acontecimento que não contem qualquer elemento do espaço de 
resultados chama-se acontecimento impossível 
(iii) Dois acontecimentos são mutuamente exclusivos se não têm em 
comum qualquer acontecimento do espaço de resultados 
(iv) A união de dois acontecimentos A e B representa-se por A ∪ B e é 
formado pelos elementos que pertencem a pelo menos um dos dois, 
A ou B 
(v) A intersecção de dois acontecimentos A e B representa-se por A ∩ B e 
é formado pelos elementos comuns a A e B 
Manual de Exercícios 
Estatística Aplicada 47 
Probabilidade de um acontecimento é expressa na escala de 0 a 1, sendo 0 a 
probabilidade associada a um acontecimento impossível e 1 a probabilidade 
associada a um acontecimento certo. A primeira definição foi proposta por 
Laplace em 1812. Pode definir-se probabilidade de um acontecimento A 
como sendo: 
Número de casos favoráveis ao acontecimento A 
P(A) = 
Número total de casos possíveis na exp. aleatória 
 
 
Uma das principais críticas a esta definição é a de que ela só é aplicável 
quando o espaço de resultados é finito e os seus elementos possuem igual 
probabilidade; daí que ela surja muito ligada aos “jogos de azar”, que possuem 
essas propriedades. É o que acontece com as duas faces de uma moeda, as 
52 cartas de um baralho, as 6 faces de um dado, etc. 
 
 Para se analisar a probabilidade de ocorrência de determinados 
acontecimentos, deve ter-se em atenção o seguinte: 
− Dois acontecimentos são ditos mutuamente exclusivos se não puderem 
acontecer ao mesmo tempo; se dois acontecimentos forem mutuamente 
exclusivos, então: 
P(A ∩ B) = 0 
− A probabilidade de união de dois acontecimentos mutuamente 
exclusivos é dada por 
P (A ∪ B) = P(A) + P(B) 
− Para dois acontecimentos quaisquer, vem que 
P (A ∪ B) = P(A) + P(B) - P(A ∩ B) 
− Dois acontecimentos dizem-se complementares se: 
P(A) = 1 – P( A ) 
− Dois acontecimentos são ditos independentes se a ocorrência de um 
não afectar a probabilidade de ocorrência de outro; a probabilidade de 
ocorrência de dois ou mais acontecimentos independentes é o produto 
das probabilidades dos respectivos acontecimentos, isto é: 
P(A ∩ B) = P(A) x P(B) 
 
Manual de Exercícios 
Estatística Aplicada 48 
Após a apresentação desta definição, convém ainda referir que, numa outra 
perspectiva, a da chamada teoria frequencista, a probabilidade de um 
acontecimento é definida como sendo o valor para o qual tende a frequência 
relativa do acontecimento quando o número de repetições da experiência 
aumenta. 
 
 
 
3.2. Probabilidade condicionada 
 
Exemplo: 
Um grupo de pessoas é classificado de acordo com o seu peso e a incidência 
de hipertensão. São as seguintes as proporções das várias categorias: 
 Obeso Normal Magro Total 
Hipertenso 0,1 0,08 0,02 0,2 
Não Hipertenso 0,15 0,45 0,2 0,8 
Total 0,25 0,53 0,22 1,00 
a) Qual a probabilidade de uma pessoa escolhida ao acaso ser hipertensa? 
b) Qual a probabilidade de uma pessoa obesa ser hipertensa? 
Resolução 
a) Basta ver que a proporção de hipertensos é de 20% 
b) Há que tomar em atenção que o que se pretende é a proporção de 
hipertensos na população de obesos, isto é 4,0
25,0
1,0
= . Por outras palavras, 
pretende-se calcular a probabilidade do acontecimento “ser hipertenso”, 
sabendo que ocorreu o acontecimento “ser obeso”. Repare-se que este 
quociente resulta da divisão entre a probabilidade de uma pessoa ser 
hipertensa e obesa e a probabilidade de uma pessoa ser obesa. Pode 
escrever-se que a probabilidade pretendida é dada por: 
)(
)()/(
OP
OHPOHP ∩= 
onde P(H/O) é a probabilidade de ocorrer o acontecimento “ser hipertenso”, 
sabendo que ocorreu ou condicionado pelo acontecimento “ser obeso”. 
Este exemplo corresponde ao cálculo de uma probabilidade condicionada. 
Manual de Exercícios 
Estatística Aplicada 49 
 
Como se viu anteriormente, dois acontecimentos são ditos independentes se a 
ocorrência de um não afectar a probabilidade de ocorrência de outro, isto é, se: 
P(A / B) = P(A) e se P(B / A) = P(B).Teorema de Bayes 
Seja B um acontecimento que se realiza se e só se um dos acontecimentos 
mutuamente exclusivos A1, A2,…An se verifica. Aos acontecimentos A1, A2,…An 
dá-se o nome de acontecimentos antecedentes. O teorema de Bayes permite 
calcular a probabilidade à posteriori de A1, A2,… An, isto é, a probabilidade de 
ocorrência de A1, A2,… An calculadas sob a hipótese de que B (acontecimento 
consequente) se realizou. De acordo com este teorema: 
�
=
=
n
i
ii
ii
i
ABPAP
ABPAP
BAP
1
)/().(
)/().()/( 
Este Teorema utiliza-se em situações em que a relação causal está invertida. 
�
=
n
i
ii ABPAP
1
)/().( designa-se de probabilidade total de ocorrência do 
acontecimento B, isto é, é a probabilidade de ocorrência do acontecimento 
consequente B face a todos os possíveis acontecimentos A1, A2,… An que o 
podem ter antecedido (ou causado a sua ocorrência). 
 
 
3.3. Funções de probabilidade 
 
A probabilidade associada aos acontecimentos possíveis numa experiência 
aleatória obedecem, por vezes, a um padrão. Se associarmos a uma 
experiência aleatória uma variável X (por exemplo, associar aos resultados da 
experiência lançamento de um dado - que são 6 (saída de face 1 a 6) – a 
variável X:“Nº da face resultante do lançamento de um dado”), então pode ser 
constituída uma lei ou função de probabilidade (f(x)) dessa variável X, tal que 
f(x) = P(X=xi) 
 
Manual de Exercícios 
Estatística Aplicada 50 
Por exemplo, para X: nº da face resultante do lançamento de um dado, vem 
que: 
xi 1 2 3 4 5 6 
f(xi) 1/6 1/6 1/6 1/6 1/6 1/6 
 
que se designa por lei uniforme. 
 
Algumas leis de probabilidade servem para explicar (ou aplicam-se a) um maior 
número de fenómenos estatísticos do que outras. Entre estas, contam-se a lei 
Binomial, a lei de Poisson e a lei Exponencial. 
 
(i) Lei Binomial 
Há alguns acontecimentos que são constituídos por um conjunto de 
experiências independentes, cada uma das quais com apenas dois estados 
possíveis de ocorrência e com uma probabilidade fixa de ocorrência para cada 
um deles. Por exemplo, os produtos resultantes de uma fábrica podem ser 
classificados como sendo defeituosos ou sendo não defeituosos, e o facto de 
um ter saído (ou não) defeituoso não influencia os outros serem (ou não). A 
distribuição das duas classes possíveis é discreta e do tipo binomial. 
No exemplo anterior, consideremos uma amostra de n artigos retirados da 
produção total, em relação aos quais se pretende identificar a variável X: “Nº de 
artigos defeituosos nos n que constituem a amostra”. A probabilidade de 
ocorrência do acontecimento “artigo é defeituoso” é dada por p: incidência de 
defeituosos na produção (convenientemente calculada através de métodos de 
estimação). A probabilidade do acontecimento complementar “artigo é não-
defeituoso” é dada por 
1 – p = q 
 
A probabilidade associada a x artigos defeituosos é dada por px (p x p x p x 
p...x vezes). Se há x defeituosos, restam n-x artigos não-defeituosos, com 
probabilidade dada por qn-x. Para calcular o número exacto de combinações de 
x artigos defeituosos com n-x artigos não-defeituosos, utiliza-se a figura 
“combinações de n, x a x, oriunda das técnicas de cálculo combinatório. Vem 
Manual de Exercícios 
Estatística Aplicada 51 
então que a probabilidade de existência de x defeituosos (e logo n-x não 
defeituosos) é igual a: 
xnxxnxn
x qpppn
nqpCxf −−
−
==
!)!(
!)( 
 
sendo que X segue Bi (n;p), sendo n e p os parâmetros caracterizadores da lei. 
Um acontecimento deve ter 4 características para que se possa associar a uma 
lei binomial: 
- número fixo de experiências (n) 
- cada experiência ter apenas duas classes de resultados possíveis 
- todas as experiências terem igual probabilidade de ocorrência (p) 
- as experiências serem independentes 
Em sistemas eléctricos de energia é possível, por exemplo, aplicar a 
distribuição binomial quando se pretende calcular a fiabilidade de uma central 
eléctrica, com várias unidades iguais e admitindo que cada unidade apenas 
pode residir em dois estados, a funcionar ou avariada. 
 
 
(ii) Lei de Poisson 
A lei de Poisson (ou lei dos acontecimentos raros ou cadenciados) dá a 
probabilidade de um acontecimento ocorrer um dado número de vezes num 
intervalo de tempo ou espaço fixado, quando a taxa de ocorrência é fixa (por 
exemplo, nº de chamadas que chegam a uma central telefónica por minuto; nº 
de varias que ocorrem numa máquina por dia). Os números de acontecimentos 
de “sucesso” ocorridos em diferentes intervalos são independentes. O 
parâmetro caracterizador da distribuição de Poisson é λ, que corresponde ao 
número médio de ocorrências por unidade de tempo ou espaço. 
Como o número médio de ocorrências do acontecimento é proporcional à 
amplitude do intervalo de tempo ou espaço a que se refere, a variável X: “Nº de 
ocorrências do acontecimento no intervalo [0,t[” segue lei de Poisson de 
parâmetro λt (isto é, se para 1 unidade de tempo o nº médio de ocorrências é 
λ, para t unidades de tempo o número médio de ocorrências é λt). A expressão 
( ) tx e
x
t λλ −
! 
Manual de Exercícios 
Estatística Aplicada 52 
dá a probabilidade de acontecerem x ocorrências no intervalo de tempo [0,t[, e 
corresponde à expressão da lei de probabilidade de Poisson : Po(λt) 
Por exemplo, se X fôr o “Nº de avarias que ocorrem no intervalo de tempo 
[0,t[”, então a probabilidade de não ocorrerem avarias nesse intervalo, isto é, a 
fiabilidade do componente/sistema como função do tempo, é dada por: 
( ) tt eet λλλ −− =
!0
0
 
 
 
(iii) Lei Exponencial 
Seja T a variável “Tempo ou espaço que decorre entre ocorrências 
consecutivas de um acontecimento”. Então T segue lei exponencial Exp (λ), 
sendo 
λ
1
 
o tempo que, em média, decorre entre ocorrências sucessivas do 
acontecimento. 
Note-se que é possível estabelecer uma relação entre a lei exponencial e a lei 
de Poisson. Assim, se X fôr o “Nº de avarias que ocorrem no intervalo de 
tempo [0,t[”, e T fôr o “Tempo que decorre entre avarias consecutivas”, então: 
 
P (T>t) = P(tempo que decorre entre avarias exceder t) 
= P(até ao instante t, não ocorre qualquer avaria) 
= P (ocorrerem zero avarias no intervalo [0,t[) = P(X=0) = te λ− 
 
A distribuição exponencial é a mais usada em estudos de fiabilidade, já que a 
probabilidade de um componente sobreviver até ao instante t é dada por 
t
e
λ−
 
A probabilidade de avariar até ao instante t é dada por 
t
e
λ−
−1
 
 
 
Manual de Exercícios 
Estatística Aplicada 53 
(iv) Lei Normal 
A lei Normal tem como parâmetros caracterizadores a média µ e o desvio-
padrão σ. Isto é, os valores observados têm uma determinada tendência 
central e uma determinada dispersão em torno da tendência central. 
 
A expressão 
�
∏
−
− 2
2)(
2
1
2
1 σ
µ
σ
Xi
e
 
 
representa a função densidade de probabilidade da distribuição Normal. 
 
Se se fizer o valor médio µ igual a zero e todos os desvios forem medidos em 
relação à média, a equação será: 
σ
µ−
=
XZ
 
 
que corresponde a uma distribuição normal estandardizada (0;1) com os 
valores tabelados, a qual é caracterizada por uma curva de Gauss: 
 
 
 
Esta distribuição apresenta 99,73% dos valores entre os extremos –3 e 3. 
 
Existem muitos tipos de distribuição, mas a curva normal é a forma de 
distribuição mais frequente nos processos industriais para características 
mensuráveis, e pode considerar-se como estabelecida pela experiência prática. 
 
Manual de Exercícios 
Estatística Aplicada 54 
 
 
 
 
(v) Lei Qui-Quadrado 
Considere-se um conjunto de n variáveis aleatórias Zi, obedecendo às 
seguintes condições: 
- cada variável Zi segue distribuiçãoN(0,1); 
- as variáveis Zi são mutuamente independentes 
 
Então, a variável aleatória X, construída a partir da soma das n variáveis Zi 
elevadas ao quadrado, segue distribuição Qui-Quadrado com n graus de 
liberdade, denotada por 
22
2
2
1
1
2
... n
n
i
i ZZZZX +++==�
=
 
2
nX χ∩ 
 
O termo “Graus de Liberdade” (d.f: degrees of freedom) é habitualmente usado 
para designar o número n de parcelas (variáveis Zi) adicionadas. É possível 
demonstrar que o valor esperado e a variância da distribuição de uma variável 
Qui-Quadrado são respectivamente 
n=µ 
n22 =σ 
A distribuição Qui-Quadrado é uma distribuição assimétrica à esquerda, 
aproximando-se da distribuição Normal à medida que n cresce. 
Manual de Exercícios 
Estatística Aplicada 55 
 
104
Introdução ao e-learning
FMD_i.p65 15-01-2004, 10:49104
Manual de Exercícios 
Estatística Aplicada 56 
PROBABILIDADES 
Exercícios resolvidos 
 
 
Exercício 1 
De um baralho ordinário (52 cartas) extrai-se ao acaso 1 carta. Determine a 
probabilidade dos seguintes acontecimentos: 
a) saída de Rei 
b) saída de copas 
c) saída de Rei ou copas 
d) saída de Rei mas não de copas 
e) não saída de Rei 
f) não saída de Rei nem de copas 
g) não saída de Rei ou não saída de copas 
 
Resolução 
A: saída de Rei 
B: saída de copas 
a) P(A)=1/13 
b) P(B)=1/4 
c) P(A ∪ B) = P(A) + P(B) - P(A ∩ B) = 1/13+1/4-1/52 = 4/13 (=(13+3)/52) 
d) P(A-B) = P(A) – P(A ∩ B) = 1/13 – 1/52 = 3/52 (= (4-1)/52) 
e) P( A )= 1-1/13 = 12/13 (=(52-4)/52) 
f) P( )BA ∩ = P( BA ∪ ) = 1 – P(A ∪ B) = 1 – 4/13 = 9/13 
g) P( )BA ∪ = P( BA ∩ ) = 1 – P )( BA ∩ = 1 – 1/52 = 51/52 
 
 
Exercício 2 
Um sistema electrónico é formado por dois sub-sistemas, A e B. De ensaios 
anteriores, sabe-se que: 
- a probabilidade de A falhar é de 20% 
- a probabilidade de B falhar sozinho é 15% 
- a probabilidade de A e B falharem é 15% 
Determine a probabilidade de: 
Manual de Exercícios 
Estatística Aplicada 57 
a) B falhar 
b) falhar apenas A 
c) falhar A ou B 
d) não falhar nem A nem B 
e) A e B não falharem simultaneamente 
 
Resolução 
A: o subsistema A falha 
B: o subsistema B falha 
P(A)=20% � P( A )= 80% 
P(B-A)=15% 
P(A ∩ B)=15% 
a) P(B) = P(B-A)+ P(A ∩ B) = 0,15 + 0,15 = 30% 
b) P(A-B) = P(A) – P(A ∩ B) = 0,2 – 0,15 = 5% 
c) P(A ∪ B) = P(A) + P(B) - P(A ∩ B) = 0,2 + 0,3 – 0,15 = 35% 
d) P( )BA ∩ = P( BA ∪ ) = 1 – P(A ∪ B) = 1 – 0,35 = 65% 
e) P( BA ∩ ) = 1 – P )( BA ∩ = 1 – 0,15 = 85% 
 
Exercício 3 
Suponha que há 3 jornais, A, B e C, com as seguintes percentagens de leitura: 
A: 9,8%; B: 22,9%; C: 12,1%; A e B: 5,1%; A e C: 3,7%; B e C: 6%; 
A, B e C: 2,4% 
Escolhe-se uma pessoa ao acaso. Calcule a probabilidade dessa pessoa: 
a) ler pelo menos um dos jornais 
b) ler A e B mas não C 
c) ler A mas não ler B nem C 
 
Resolução 
A: a pessoa escolhida lê o jornal A 
B: a pessoa escolhida lê o jornal B 
C: a pessoa escolhida lê o jornal C 
 
P(A) = 9,8% P(B) = 22,9% P(C) = 12,1% 
P(A ∩ B) = 5,1% P(A ∩ C) = 3,7% P(B ∩ C) = 6% 
P(A ∩ B ∩ C) = 2,4% 
Manual de Exercícios 
Estatística Aplicada 58 
a) 
)()()()()()()()( CBAPCBPCAPBAPCPBPAPCBAP ∩∩+∩−∩−∩−++=∪∪
= 0,098+0,229+0,121-0,051-0,037-0,06+0,024 = 32,4% 
b) P( )CBA ∩∩ = P( )() CBAPBA ∩∩−∩ = 0,051 – 0,024 = 2,7% 
c) )( CBAP ∩∩ = P(A) - )()()( CBAPCAPBAP ∩∩+∩−∩ 
= 0,098-0,051-0,037+0,024 = 3,4% 
 
Exercício 4 
Um gerente de uma galeria de arte muito creditada no mercado, está 
interessado em comprar um quadro de um pintor famoso para posterior venda. 
O gerente sabe que há muitas falsificações deste pintor no mercado e que 
algumas dessa falsificações são bastante perfeitas o que torna difícil avaliar se 
o quadro que ele pretende comprar é ou não um original. De facto, sabe-se que 
há 4 quadros falsos desse pintor para 1 verdadeiro. 
O gerente não quer comprometer o “bom nome” da galeria para a qual trabalha 
comprando um quadro falso. Para obter mais informação o gerente resolve 
levar o quadro a um museu de arte e pede para que o especialista do museu o 
examine. Este especialista garante-lhe que em 90% dos casos em que lhe é 
pedido para examinar um quadro genuíno daquele pintor, ele identifica-o 
correctamente como sendo genuíno. Mas em 15% dos casos em que examina 
uma falsificação do mesmo pintor, ele identifica-o (erradamente) como sendo 
genuíno. 
Depois de examinar o quadro que o gerente lhe levou, o especialista diz que 
acha que o quadro é uma falsificação. Qual é agora a probabilidade de o 
quadro ser realmente uma falsificação? 
 
Resolução 
V: o quadro é genuíno 
F: o quadro é falso 
I: o quadro é identificado correctamente 
P(V) = 20% 
P(F) = 80% 
P(I/V) = 90% � P( )/VI = 10% 
P( )/ FI = 15% � P(I/F) = 85% 
Manual de Exercícios 
Estatística Aplicada 59 
P(ser realmente falsificação/especialista identificou como falsificação) = 
= %1,97
7,0
68,0
1,0*2,085,0*8,0
85,0*8,0
)/(*)()/(*)(
)/(*)(
==
+
=
+ VIPVPFIPFP
FIPFP
 
 
Exercício 5 
Na ida para o emprego, o Sr. Óscar, polícia de profissão, tem de passar 
obrigatoriamente por três cruzamentos com semáforos. No primeiro 
cruzamento, o do Largo Azul, a probabilidade do semáforo se encontrar com 
sinal vermelho é de 10%. Em cada um dos cruzamentos seguintes, o Sr. Óscar 
fica parado devido aos sinais vermelhos em metade das vezes que lá passa. 
O Sr. Óscar já descobriu que os semáforos funcionam separadamente, não 
estando ligados entre si por qualquer mecanismo. 
Embora goste de cumprir a lei, o guarda Óscar passa no sinal verde e acelera 
no amarelo, só parando mesmo no sinal vermelho. 
a) Qual a probabilidade do Sr. Óscar chegar ao emprego sem ter de parar 
em qualquer sinal vermelho? 
b) Qual a probabilidade do Sr. Óscar ter de parar num só semáforo? 
c) Qual a probabilidade do Sr. Óscar ter parado no sinal vermelho do 
cruzamento do Largo Azul, sabendo que parou num só semáforo na sua 
ida para o emprego? 
 
Resolução 
A: polícia encontra sinal vermelho no 1º cruzamento 
B: polícia encontra sinal vermelho no 2º cruzamento 
C: polícia encontra sinal vermelho no 3º cruzamento 
P(A)=10% � P( A )= 90% 
P(B)=50% � P( B )= 50% 
P(C)=50% � P(C )= 50% 
 
a) P( )CBA ∩∩ = P( A )*P( B )*P(C ) = 0,9*0,5*0,5 = 22,5% 
b) P( )CBA ∩∩ + P( )CBA ∩∩ +P( )CBA ∩∩ = 
= P( A )*P( B )*P(C ) + P( A )*P( B )*P(C ) + P( A )*P( B )*P(C ) = 47,5% 
 
Manual de Exercícios 
Estatística Aplicada 60 
c) P(polícia parar no 1º cruzamento / polícia parou num só semáforo) 
%26,5
475,0
)(*)(*)(
475,0
)(
==
∩∩
=
CPBPAPCBAP
 
 
Exercício 6 
Após alguns testes efectuados à personalidade de um indivíduo, concluiu-se 
que este é louco com probabilidade 60%, ladrão com probabilidade igual a 70% 
e não é louco nem ladrão com probabilidade 25%. Determine a probabilidade 
do indivíduo: 
a) Ser louco e ladrão 
b) Ser apenas louco ou apenas ladrão 
c) Ser ladrão, sabendo-se que não é louco 
 
Resolução 
A: indivíduo é louco 
B: indivíduo é ladrão 
P(A)=60% 
P(B)=70% 
P( )BA ∩ = 25% = P( BA ∪ ) � P(A ∪ B) = 1 – 0,25 = 75% 
a) P(A ∪ B) = P(A) + P(B) - P(A ∩ B) � 0,75 = 0,6 + 0,7 - P(A ∩ B) 
P(A ∩ B) = 0,6 + 0,7 – 0,75 = 55% 
b) P(A-B) + P(B-A) = (0,6-0,55) + (0,7-0,55) = 20í 
c) P(B/ A ) = %5,37
4,0
15,0
6,01
)(
)(
)(
==
−
−
=
∩ ABP
AP
ABP
 
 
Exercício 7 
Uma moeda é viciada, de tal modo que P(F) = 2/3 e P(C) = 1/3. Se aparecem 
faces, então um número é seleccionado de 1 a 9. Se parecem coroas, um 
número é seleccionado entre 1 e 5. Determine a probabilidade de ser 
seleccionado um número par. 
 
Resolução 
P(Par) = 2/3*4/9 + 1/3*2/5 = 42,96% 
 
Manual de Exercícios 
Estatística Aplicada 61 
Exercício 8 
Numa fábrica,

Outros materiais