Buscar

Apostila

Prévia do material em texto

1 
 
 
APOSTILA 
 
 
 
 
 
ESTATÍSTICA E PROBABILIDADE 
 
 
 
 
 
CURSOS: ADMINISTRAÇÃO E RECURSOS HUMANOS 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2 
SUMÁRIO 
 
 
1 TÓPICOS DE ESTATÍSTICA 
1.1 INTRODUÇÃO 
1.2 DEFINIÇÃO DE ESTATÍSTICA 
 1.2.1 ESTATÍSTICA DESCRITIVA 
 1.2.2 PROBABILIDADE ESTATÍSTICA 
 1.2.3 INFERÊNCIA ESTATÍSTICA 
1.3 FASES DE UMA PESQUISA 
1.4 POPULAÇÃO E AMOSTRA 
1.5 AMOSTRAGEM PROBABILÍSTICA 
1.5.1 ALEATÓRIA SIMPLES 
1.5.2 PROPORCIONAL ESTRATIFICADA 
1.5.3 AMOSTRAGEM SISTEMÁTICA 
1.5.4 POR CONGLOMERADO 
1.6 AMOSTRAGEM NÃO PROBABILÍSTICA 
1.6.1 POR CONVENIÊNCIA 
1.6.2 POR COTAS 
 
2 ESTATÍSTICA DESCRITIVA 
2.1 VARIÁVEIS CONTÍNUAS E DISCRETAS 
2.2 DADOS ABSOLUTOS E DADOS RELATIVOS 
2.3 TABELAS 
2.3.1 SÉRIES ESTATÍSTICAS 
2.3.2 DISTRIBUIÇÃO DE FREQÜÊNCIA 
2.3.3 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA 
2.4 NÚMERO DE CLASSES 
2.5 TIPOS DE FREQÜÊNCIAS 
2.6 GRÁFICOS 
2.6.1 GRÁFICO DE LINHA 
2.6.2 GRÁFICO DE BARRAS 
2.6.3 GRÁFICO DE SETORES 
2.6.4 GRÁFICO DE PARETO 
2.6.5 REPRESENTAÇÃO GRÁFICA DE DISTRIBUIÇÃO DE FREQÜÊNCIA 
2.6.5.1 HISTOGRAMA 
2.6.5.2 POLÍGONO DE FREQÜÊNCIA 
2.6.5.3 POLÍGONO DE FREQÜÊNCIA ACUMULADA (OGIVA DE GALTON) 
2.6.5.4 CURVA DE FREQÜÊNCIA POLIDA 
2.6.6 FORMAS DAS CURVAS DE FREQÜÊNCIA 
2.7 MEDIDAS DE POSIÇÃO 
2.7.1 MÉDIAS 
2.7.2 MEDIANA 
2.7.3 MODA 
 2.7.4 SEPARATRIZES 
 2.7.5 VARIÂNCIA 
 2.7.6 DESVIO PADRÃO 
 2.7.7 COEFICIENTE DE VARIAÇÃO 
2.8 ASSIMETRIA E DE CURTOSE 
2.8.1 MEDIDA DE ASSIMETRIA 
2.8.2 COEFICIENTE DE ASSIMETRIA 
2.8.3 MEDIDA DE CURTOSE 
2.8.4 COEFICIENTE DE CURTOSE 
2.9 CORRELAÇÃO 
 2.9.1 COEFICIENTE DE CORRELAÇÃO 
2.10 REGRESSÃO 
2.10.1 AJUSTAMETO DA RETA 
 
 
 
 
 
3 
 
3 INTRODUÇÃO DE PROBABILIDADE ESTATÍSTICA 
3.1 EXPERIMENTO ALEATÓRIO 
3.2 ESPAÇO AMOSTRAL 
3.3 EVENTO 
3.3.1 EVENTOS INDEPENDENTES 
3.2.1 EVENTOS MUTUAMENTE EXCLUSIVOS 
3.4 PROBABILIDADE 
3.4.1 PROPRIEDADES 
3.4.2 PROBABILIDADE DA UNIÃO DE EVENTOS 
3.4.3 MULTIPLICAÇÃO DE PROBABILIDADES 
3.5 VARIÁVEL ALEATÓRIA, DISTRIBUIÇÃO DE PROBABILIDADE E VALOR ESPERADO 
3.5.1 DISTRIBUIÇÃO DE BERNOULLI 
3.5.2 DISTRIBUIÇÃO BINOMIAL 
3.5.3 DISTRIBUIÇÃO DE POISSON 
3.5.4 DISTRIBUIÇÃO NORMAL (CURVA NORMAL) 
 
 
 
4 INTRODUÇÃO DE INFERÊNCIA ESTATÍSTICA 
4.1 DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 
4.2 ESTIMATIVA 
4.2.1 ESTIMATIVAS PONTUAIS 
4.2.2 ESTIMATIVAS POR INTERVALOS 
4.3 INTERVALO DE CONFIANÇA PARA MÉDIA 
4.4 INTERVALO DE CONFIANÇA PARA UMA PROPORÇÃO 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4 
1 TÓPICOS DE ESTATÍSTICA 
 
1.1 ORIGEM DA ESTATÍSTICA E O SEU USO COMO FERRAMENTA DE GESTÃO 
 
A Matemática, considerada “a ciência que une à clareza do raciocínio a síntese da linguagem”, originou-se 
do convívio social, das trocas e da contagem, com caráter prático, utilitário e empírico. A Estatística, parte da 
Matemática Aplicada, teve origem semelhante. 
No passado, o estudo de fatos como batizados, casamentos e funerais, originaram as primeiras tábuas e 
tabelas e os primeiros números relativos e foram assim, adquirindo feições científicas. Com o passar dos anos, as 
tabelas tornaram-se mais completas, surgindo as representações gráficas e os cálculos das probabilidades, e a 
Estatística deixou de ser simples catalogação de dados numéricos para se tornar o estudo de como chegar a 
conclusões sobre o todo, partindo da observação de parte desse todo. 
Atualmente, a Estatística auxilia, por exemplo, a Geografia na descrição da população, a Economia 
procurando estabelecer harmonia entre produção, circulação e consumo da riqueza e a Sociologia no estudo dos 
movimentos, atitudes e agitações da massa humana. 
A análise e interpretação de dados estatísticos torna possível, por exemplo, o diagnóstico de uma empresa 
ou instituição, o conhecimento de seus problemas, a formulação de soluções apropriadas e um planejamento 
objetivo de ação. 
 
1.2 DEFINIÇÃO DE ESTATÍSTICA 
 
É a parte da Matemática Aplicada que fornece métodos para coleta, organização, descrição, análise e 
interpretação de dados, para a utilização dos mesmos na tomada de decisões. Pode ser dividida em três: Estatística 
Descritiva, Probabilidade Estatística e Inferência Estatística. 
 
1.2.1 ESTATÍSTICA DESCRITIVA 
 
Descreve e analisa um conjunto de dados através de tabelas e gráficos sem a preocupação em tirar 
conclusões. 
 
1.2.2 PROBABILIDADE ESTATÍSTICA 
 
Auxilia a quantificar o erro na tomada de decisões, e a principal vantagem nas situações de incerteza é 
quantificar a possibilidade de ocorrência de um acontecimento. 
 
1.2.3 INFERÊNCIA ESTATÍSTICA 
 
É a parte que trata das inferências e conclusões a partir da análise dos dados. 
 
1.3 FASES DE UMA PESQUISA 
 
São as fases do método estatístico: 
 
1.3.1 COLETA DE DADOS 
 
A coleta pode ser direta ou indireta. A coleta é direta quando feita sobre elementos informativos de registro 
obrigatório, tais como: nascimentos, casamentos e óbitos, importação e exportação de mercadorias, ou ainda, 
quando os dados são coletados pelo próprio pesquisador através de questionários sendo classificada relativamente 
ao fator tempo em: 
 
I - Contínua - quando feita continuamente, tal como a de nascimento ou de óbitos e a de freqüência dos alunos às 
aulas. 
 
II - Periódica - quando feita em intervalos constantes de tempo, como os censos, as eleições e as avaliações 
mensais dos alunos. 
 
III - Ocasional - quando feita a fim de atender a uma conjuntura ou a uma emergência, como nos casos das 
epidemias que assolam ou dizimam rebanhos inteiros. 
 
 
 
5 
 Dizemos que a coleta é indireta quando é inferida de elementos conhecidos da coleta direta. Por exemplo, a 
pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos pela coleta direta. 
 
1.3.2 CRÍTICA DOS DADOS 
 
A crítica pode ser externa ou interna. A crítica é externa quando visa às causas dos erros por parte do 
informante, por distração ou má interpretação das perguntas que lhe foram feitas; e é interna quando visa observar 
os elementos originais dos dados da coleta. 
 
1.3.3 APURAÇÃO DOS DADOS 
 
É a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser 
manual, eletromecânica ou eletrônica. 
 
1.3.4 EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS 
 
Os dados devem ser apresentados sob forma adequada, tabelas ou gráficos, tornando mais fácil o exame 
daquilo que está sendo objeto de tratamento estatístico. 
 
1.3.5 ANÁLISE DOS RESULTADOS 
 
O objetivo último da Estatística é tirar conclusões sobre o todo a partir de informações fornecidas por parte 
representativa do todo. Assim, realizadas as fases anteriores (Estatística Descritiva), fazemos uma análise dos 
resultados obtidos, através dos métodos da Inferência Estatística, e tiramos desses resultados conclusões e 
previsões. 
 
1.4 POPULAÇÃO E AMOSTRA 
 
Como em qualquer estudo estatístico temos em mente pesquisar uma ou mais características dos 
elementos de algum universo, esta característica deve estar perfeitamente definida. E isso se dá quando 
consideramos um elemento qualquer e podemos afirmar sem ambigüidade se esse elemento pertence ou não ao 
universo. 
Ao conjunto de entes portadores de, pelo menos, uma característica comum denominamos população. Para 
o número de elementos da população, denotamos N. 
Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as 
observações referentes a uma determinada pesquisa a apenas uma parte da população. A essa parte proveniente 
da população em estudo denominamos amostra, que é um subconjunto finito da população. Para o número de 
elementos da amostradenotamos n. 
É preciso que as amostras usadas sejam obtidas através de processos adequados e todas as vezes que as 
informações provêm de um conjunto menor que a população, cometem-se erros, e estes erros são quantificados 
pelo cálculo das probabilidades, o qual proporciona uma base racional para lidar com essa situação. 
O conhecimento das probabilidades fornece a base para o desenvolvimento das técnicas da tomada de 
decisão, explicam seu funcionamento e indicam como as conclusões podem ser apresentadas e interpretadas 
corretamente. 
 
 
1.5 AMOSTRAGEM PROBABILÍSTICA 
 
É uma técnica especial para colher amostras, que garante, tanto quanto possível, o acaso na escolha e tem 
por finalidade permitir fazer inferências sobre uma população após inspeção de apenas parte dela. As principais 
técnicas de amostragem são: 
 
1.5.1 AMOSTRAGEM ALEATÓRIA SIMPLES 
 
A amostragem aleatória simples pode ser realizada numerando-se a população de 1 a um número real a 
e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa seqüência, os quais 
concorrerão aos elementos pertencentes à amostra. 
 
 
 
 
6 
1.5.2 AMOSTRAGEM PROPORCIONAL ESTRATIFICADA 
 
Muitas vezes a população se divide em subpopulações, ou seja, estratos. 
Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento 
heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da 
amostra leve em consideração tais estratos. 
É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, 
além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos 
dos mesmos. 
 
1.5.3 AMOSTRAGEM SISTEMÁTICA 
 
Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de 
referência. A seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo 
pesquisador. A esse tipo de amostra denominamos sistemática. 
Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer 
a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população. 
 
1.5.4 AMOSTRAGEM POR CONGLOMERADO 
 
A amostragem por conglomerado pressupõe a disposição dos itens de uma população em subgrupos 
heterogêneos representativos da população global. Cada conglomerado pode ser encarado como uma 
minipopulação. Se a formação dos conglomerados for bem feita, cada um sendo exatamente semelhante ao outro, 
basta examinar apenas um conglomerado para fazer inferências sobre a população. 
A amostragem por conglomerado tem duas vantagens muito distintas sobre a amostragem aleatória. Uma é 
que na amostragem aleatória, os itens da população se acham muito dispersos, enquanto que na amostragem por 
conglomerado, os itens estão próximos uns dos outros. Uma segunda vantagem da amostragem por conglomerado 
é que não é necessário uma listagem dos itens da população. Basta uma lista dos conglomerados. 
 
1.6 AMOSTRAGEM NÃO PROBABILÍSTICA 
 
Este tipo de amostra, é determinada por ordem do pesquisador, ou seja não há uma aleatoriedade para a 
escolha de um elemento da população. 
 
1.6.1 AMOSTRAGEM POR CONVENIÊNCIA 
 
Indicada para estudos exploratórios. Frequentemente utilizados em supermercados para testar produtos. 
 
1.6.2 AMOSTRAGEM POR COTAS 
 
Na realidade, trata-se de uma variação da amostragem intencional. Necessita-se ter um prévio 
conhecimento da população e sua proporcionalidade. Por exemplo, deseja-se entrevistar apenas indivíduos da 
classe A, que representa 10% da população. Esta será a cota para o trabalho. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7 
2 ESTATÍSTICA DESCRITIVA 
 
A Estatística Descritiva estuda a descrição das observações coletadas e permite fazer comentários simples a seu 
respeito sem se preocupar com a abrangência das interpretações dos resultados obtidos. 
Sua finalidade é descrever as variáveis em estudo da maneira mais informativa e significativa possíveis. 
 
2.1 VARIÁVEIS CONTÍNUAS E DISCRETAS 
 
Variável é o conjunto de resultados possíveis de um fenômeno. 
Uma variável pode ser: 
 
 I - Qualitativa - quando seus valores são expressos por atributos: sexo, cor da pele, etc... 
 
II - Quantitativa - quando seus valores são expressos em números: salário, idade, etc ... 
 
Uma variável que pode assumir qualquer valor real entre dois valores dados é uma variável contínua. Caso 
isso não seja possível, a variável é chamada discreta. 
Em geral, as contagens resultam nas variáveis discretas, e as medições, nas variáveis contínuas. 
 
2.2 DADOS ABSOLUTOS E DADOS RELATIVOS 
 
Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou 
medida, são chamados dados absolutos. 
Dados relativos são os resultados de comparações por quociente que se estabelecem entre dados 
absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. 
Traduzem-se os dados relativos, em geral, por meio de taxas, percentagens, índices e coeficientes e, que 
é de grande valia quando o intuito é destacar a participação da parte no todo. 
Veremos, agora, como calculamos esses dados relativos: 
 
I - TAXA PERCENTUAL 
 
Taxa percentual é o valor que representa a quantidade de unidades tomadas em cada 100: 
 x% = x
100
 
 
II - ÍNDICES 
 
Os índices são razões entre duas grandezas tais que uma não inclui a outra. 
São exemplos de índices: 
Densidade demografica
populacao
erficie

sup
 
Renda per capita
renda
populacao

 
 
III - COEFICIENTES 
 
Os coeficientes são razões entre o número de ocorrências e o número total (número de ocorrências e o 
número de não-ocorrências). 
São exemplos de coeficientes: 
 
Coeficiente de natalidade
numero de nascimentos
populacao total
 
Coeficiente de evasao escolar
numero de alunos evadidos
numero inicial de matriculas

 
 
 
 
8 
 
2.3 TABELAS 
 
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que 
tenhamos uma visão global da variação dessa ou dessas variáveis. E isso ela consegue, inicialmente, apresentando 
esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis 
em estudo. 
 
A tabela é um quadro que resume um conjunto de observações, que compõe-se de: 
 
1 - corpo - conjunto de linhas e colunas que contém informações sobre a variável em estudo; 
2 - cabeçalho - parte superior da tabela que especifica o conteúdo das colunas; 
3 - coluna indicadora - parte da tabela que especifica o conteúdo das linhas; 
4 - linhas - retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus 
cruzamentos com as colunas; 
5 - célula - espaço destinado a um só número; 
6 - título - conjunto de informações, as mais completas possíveis, localizada no topo da tabela. 
 
Há ainda a considerar os elementos complementares da tabela, que são: a fonte, as notas e as chamadas, 
colocadas, preferencialmente, no seu rodapé. 
 
Exemplos: 
 
 PRODUÇÃO DE CAFÉ SALÁRIOS DOS FUNCIONÁRIOS 
 BRASIL 2002 – 2010 DA EMPRESA EMPATECOL 
 
ANOS PRODUÇÃO 
(1.000 t) 
 SALÁRIOS 
 (em reais) 
Frequência 
2002 2.535 1.300 1.400 3 
2003 2.666 1.400 1.500 5 
2004 2.122 1.500 1.600 8 
2005 3.750 1.600 1.700 11 
2006 2.007 1.700 1.800 15 
2007 2.783 1.800 1.900 10 
2008 2.991 1.900 2.000 7 
2009 3.124 2.0002.100 4 
2010 3.050 2.100 2.200 2 
 Dados fictícios Dados fictícios 
 
 
De acordo com a Resolução 886 da Fundação IBGE, nas células devemos colocar: 
 
 um traço horizontal ( - ) quando o valor é zero, não só quanto à natureza das coisas, como quanto o resultado 
do inquérito; 
 três pontos ( ... ) quando não temos os dados; 
 um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor; 
 zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada. 
 
Nota: Se os valores são expressos em numerais decimais, precisamos acrescentar à parte decimal um número 
correspondente de zeros ( 0,0; 0,00; 0,000; ... ). 
 
2.3.1 SÉRIES ESTATÍSTICAS 
 
 São tabelas associadas aos seguintes fenômenos: tempo (a época a que ele se refere), espaço (a região 
onde se passam os fatos) e espécie (o fenômeno que é descrito). 
 Conforme varie cada um desses elementos, podemos classificar as séries estatísticas em: 
 
 Série temporal, Cronológica, Evolutiva ou Histórica: É a série cujos dados estão dispostos de acordo com o 
tempo. 
 
 
9 
 Série Geográfica ou Territorial: É a série cujos dados estão dispostos em correspondência com a região 
geográfica. 
 Série Específica ou Qualitativa: É a série cujos dados estão em correspondência com a espécie do fenômeno. 
 Série Composta ou Mista: As combinações entre as séries constituem novas séries que estão representadas nas 
tabelas de dupla entrada. 
 
2.3.2 DISTRIBUIÇÃO DE FREQÜÊNCIA 
 
Para construir uma tabela de distribuição de freqüências com intervalo de classe, devemos utilizar uma 
amostra de dados estatísticos resultante de variáveis quantitativas. 
Utilizaremos como exemplo, para construção de nossa tabela, uma amostra coletada de dados relativos às 
estaturas de quarenta alunos de nossa universidade. 
 
ESTATURA DE 40 ALUNOS DE NOSSA UNIVERSIDADE 
 
166 160 161 150 162 160 165 167 164 160 
162 161 168 163 156 173 160 155 164 168 
155 152 163 160 155 155 169 151 170 164 
154 161 156 172 153 157 156 158 158 161 
 
Quando os dados de uma amostra não estão numericamente organizados, a esse conjunto de dados 
chamamos de tabela primitiva. 
A tabela obtida após a ordenação dos dados estatísticos recebe o nome de rol. 
 
ESTATURA DE 40 ALUNOS DA UNIVERSIDADE A 
 
150 154 155 157 160 161 162 164 166 169 
151 155 156 158 160 161 162 164 167 170 
152 155 156 158 160 161 163 164 168 172 
153 155 156 160 160 161 163 165 168 173 
 
Com isso, podemos observar facilmente qual a menor ou maior estatura; que as estaturas variaram em 
23cm; e, ainda, a ordem que um valor particular da variável ocupa no conjunto. 
O processo visto é ainda inconveniente, já que é muito extensa, mesmo quando o número de valores da 
variável ( n ) é de tamanho razoável. Sendo assim, a solução mais aceitável, pela própria natureza da variável 
contínua, é o agrupamento dos valores em vários intervalos. 
Assim, os dados da tabela anterior podem ser dispostos da seguinte forma: 
 
ESTATURA DE 40 ALUNOS DA UNIVERSIDADE A 
 
ESTATURAS 
( cm ) 
FREQÜÊNCIA 
150 154 4 
154 158 9 
158 162 11 
162 166 8 
166 170 5 
170 174 3 
Total 40 
 
O que pretendemos com a construção desse tipo de tabela é realçar o que há de essencial nos dados e, 
também, tornar possível o uso de técnicas analíticas para sua total descrição, até porque a Estatística tem por 
finalidade específica analisar o conjunto de valores, desinteressando-se por casos isolados. 
Quando os dados estão organizados em uma distribuição de freqüência, são denominados dados 
agrupados. 
 
 
 
 
 
 
10 
2.3.3 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA 
 
 Classe - São intervalos de variação da variável. 
 Limites de classe – São os extremos de cada classe. 
 Amplitude de um intervalo de classe - É a medida do intervalo que define a classe. 
 Amplitude total da distribuição - É a diferença entre o limite superior da última classe e o limite inferior da primeira 
classe (AT). 
 Amplitude amostral - É a diferença entre o valor máximo e o valor mínimo da amostra (AA). 
 Ponto médio de uma classe – É o ponto que divide o intervalo de classe em duas partes iguais. 
 Freqüência simples ou freqüência absoluta - É o número de observações correspondentes a essa classe ou a 
esse valor. 
 
 
2.4 NÚMERO DE INTERVALOS DE CLASSES 
 
Na construção da distribuição de frequência, foi necessária a determinação do número de classes e, 
consequentemente, sua amplitude. 
Para a determinação do número de classes usamos a regra de Sturges, que nos deu o número de classes 
em função do número de valores da variável: 
 
ni log3,31 
 
 
onde i é o número de classe e n é o tamanho da amostra, mas cabe ao pesquisador determinar o número de 
intervalos de classe que pretende organizar. 
 
Após a determinação do número de classes da distribuição, calculamos a amplitude dos intervalos de 
classe, recorrendo a fórmula: 
h
AA
i

 
 
 Em nosso exemplo, temos: 
 
 para n = 40, temos i = 6 classes. 
 
Logo: 
h 

 
173 150
6
23
6
3 8,
 
Quando o resultado não é exato, devemos arredondá-lo para mais. 
 
h = 4 cm. 
 
 
2.5 TIPOS DE FREQUÊNCIAS 
 
I - FREQUÊNCIAS SIMPLES OU ABSOLUTAS 
 
Frequências simples ou absolutas(fi) são os valores que realmente representam o número de dados de cada 
classe. 
A soma das frequências simples é igual ao número total dos dados: 
 
f ni 
 
 
II - FREQUÊNCIAS RELATIVAS 
 
Frequências relativas (fri) são os valores das razões entre as frequências simples e a frequência total: 
fr
f
f
i
i
i


 
 
 
 
11 
III - FREQUÊNCIA ACUMULADA 
 
Frequência acumulada (Fi) é o total das frequências de todos os valores inferiores ao limite superior do 
intervalo de uma dada classe: 
F fi i
 
 
Podemos ter dois tipos de frequência acumulada: “abaixo de” (FAB), onde efetuamos o somatório das 
frequências da primeira classe em diante e “acima de”(FAC), onde efetuamos o somatório a partir da última classe. 
 
IV - FREQUÊNCIA ACUMULADA RELATIVA 
 
Frequência acumulada relativa (Fri) de uma classe é a frequência acumulada da classe, dividida pela 
frequência total da distribuição: 
Fr
F
f
i
i
i


 
 
A partir da tabela vista na página 10, obtivemos uma nova tabela com as frequências estudadas: 
 
 
 ESTATURA DE 40 ALUNOS DA UNIVERSIDADE A 
 
i ESTATURAS (cm) fi xi fri Fi Fri 
1 150 154 4 152 0,100 4 0,100 
2 154 158 9 156 0,225 13 0,325 
3 158 162 11 160 0,275 24 0,600 
4 162 166 8 164 0,200 32 0,800 
5 166 170 5 168 0,125 37 0,925 
6 170 174 3 172 0,075 40 1,000 
  = 40  = 1,000 
 
O conhecimento dos vários tipos de freqüência ajuda-nos a responder a muitas questões com relativa 
facilidade, como as seguintes: 
 
 Quantos alunos têm estatura entre 166 cm, inclusive, e 170 cm? 
 Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm? 
 Quantos alunos têm estatura abaixo de 162 cm? 
 Qual o percentual de alunos com estatura superior a 158 cm? 
 
 
EXERCÍCIOS 
 
1 – Utilizando as amostras a seguir, construa a tabela de distribuição de frequência com intervalo de classe para 
cada uma e complete-as com as colunas de ponto médio, frequência relativa, frequência acumulada e frequência 
acumulada relativa. 
AMOSTRA 1 
200 225 241 253 260 274 292 
209 229 243 253 263 278 297 
213 232 244 255 266 283 312 
218 235 247 257 270 288 315 
220 238 252 259 270 292 318AMOSTRA 2 
800 850 850 900 920 960 990 1.000 1.000 1.000 1.050 
1.050 1.050 1.050 1.100 1.100 1.150 1.150 1.180 1.200 1.200 1.200 
1.220 1.250 1.250 1.250 1.270 1.280 1.300 1.330 1.350 1.370 1.370 
1.390 1.400 1.410 1.460 1.490 1.500 1.500 1.530 1.550 1.580 1.580 
1.610 1.650 1.700 1.720 1.750 1.790 1.800 1.880 1.970 2.100 2.190 
 
 
 
12 
2.6 GRÁFICOS 
 
Os gráficos permitem a representação de uma relação entre variáveis e facilitam a compreensão de dados, 
desde que apresentados de forma clara e objetiva. 
Os gráficos devem ser auto-explicativos e de fácil compreensão, de preferência sem comentários inseridos. 
Devem ser simples, atrair a atenção do leitor e inspirar confiança na veracidade do fenômeno em estudo. 
Alguns pontos devem ser respeitados na construção de um gráfico: 
 
 Ter o tamanho adequado à sua publicação em revistas. 
 Ter sempre título. 
 Ser construído em uma escala que não desfigure os fatos ou as relações que se deseja destacar. 
 
2.6.1 GRÁFICO DE LINHA 
 
Este tipo de gráfico se utiliza da linha poligonal para representar a série estatística. 
O gráfico de linha constitui uma aplicação do processo de representação das funções num sistema de 
coordenadas cartesianas. 
Os dados, geralmente de uma tabela, são colocados num sistema cartesiano ortogonal, que graficamente, 
temos pontos ligados por segmentos de reta. 
 
Vejamos o gráfico de linha a seguir: 
 
A tabela e o gráfico representam os percentuais de intenção de votos de três candidatos comparativamente: 
 
ELEIÇÕES PRESIDENCIAS - 2006 
Desempenho (%) 
 Candidatos 
Mês A B C 
Janeiro 12 30 40 
Fevereiro 16 25 36 
Março 20 20 40 
Abril 24 18 32 
Maio 30 20 35 
 Dados fictícios. 
 
 
 
 
ELEIÇÕES PRESIDENCIAS 2006 
0 
5 
10 
15 
20 
25 
30 
35 
40 
J F M A M Mês 
Desempenho % 
A 
B 
C 
 
 
 No eixo de x marcamos os meses e no eixo de y os percentuais dos candidatos A, B e C. São três gráficos de 
linha no mesmo sistema cartesiano, o que permite comparar o desempenho dos três candidatos. 
 
2.6.2 GRÁFICO DE BARRAS 
 
Nesse tipo de gráfico usamos retângulos com bases da mesma medida e separados por distâncias iguais. 
As frequências dos fatos observados são dadas pelas alturas dos retângulos, anotadas no eixo de y, se as barras 
forem verticais. Se as barras forem horizontais, pelos comprimentos dos retângulos, anotados no eixo de x. 
 
 
13 
 
Um gráfico de barras também pode ser usado de forma comparativa, apresentando dois ou mais conjuntos 
de dados: 
 
 
VENDAS DE APARTAMENTOS DE UMA 
IMOBILIÁRIA 
Unidades vendidas 
Mês 2006 2007 
Janeiro 15 12 
Fevereiro 10 18 
Março 12 20 
Abril 18 22 
 Dados fictícios. 
 
 
 
VENDAS DE APARTAMENTOS DE UMA 
IMOBILIÁRIA 
0 
5 
10 
15 
20 
25 
J F M A Mês 
Un. vendidas 
2006 
2007 
 
 
O gráfico de barras comparativas acima, mostra claramente que existe uma comparação nas vendas de 
apartamentos de uma imobiliária no ano de 2006 e 2007. 
 
 Os dados em gráficos de barras também podem ser representados por diferentes figuras, como pessoas, 
objetos etc. Esses gráficos recebem o nome de pictóricos. 
 
2.6.3 GRÁFICO DE SETORES 
 
Os dados são apresentados em setores circulares proporcionais aos valores. Para representar os setores, 
fazemos corresponder a uma volta do círculo (360º) o total (100%) dos dados e estabelecemos uma relação com o 
ângulo relativo ao setor de acordo com cada valor. 
 
 
 
Vejamos o gráfico de setores a seguir, relativo a produção agrícola do Brasil em 2002: 
 
 
PRODUÇÃO AGRÍCOLA - 2002 
Produtos Quantidade produzida 
(Toneladas) 
A 32,4 
B 21,6 
C 43,2 
D 10,8 
Total 108,0 
 Dados fictícios. 
 
 
 
14 
PRODUÇÃO AGRÍCOLA - 2002
C
40%
D
10%
A
30%
B
20%
 
 
 
2.6.4 GRÁFICO DE PARETO 
 
É um gráfico gerado através da associação de um gráfico de barras que identifica as frequências dos 
registros ou ocorrências em um processo de forma decrescente, com um gráfico de linhas das correspondentes 
frequências relativas acumuladas, que permite a priorização no que diz respeito sobre as ações na tomada de 
decisões. 
Podemos, através do gráfico de Pareto, filtrar os problemas menores dos maiores, onde é claro as falhas 
maiores necessitam de ações mais dinâmicas e urgentes, os problemas ou falhas menores necessitam de ações por 
igual, mas quando podemos visualizar o grau de importância de cada falha sempre devemos originar a ação sobre a 
mais crítica. 
 
 
 
 
2.6.5 REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA 
 
As tabelas com grande número de dados não dão ao leitor uma visão rápida e global de um fenômeno. Uma 
forma de amenizar esse problema é organizar seus dados, que serão apresentados agrupados em intervalos de 
classe. Para isso, é preciso que os dados estejam organizados em uma tabela de distribuição de frequências. 
Uma distribuição de frequência pode ser representada através de gráficos (histograma, polígono de 
frequências e polígono de frequências acumuladas ou ogiva de Galton). 
Construímos qualquer dos gráficos mencionados utilizando o primeiro quadrante do sistema de eixos 
coordenados cartesianas ortogonais. No eixo das abscissas, colocamos os valores da variável e no eixo das 
ordenadas, as frequências. 
Vamos ver algumas formas de representar uma distribuição de frequências. 
 
 
2.6.5.1 HISTOGRAMA 
 
O histograma é um gráfico formado por retângulos justapostos, sendo o número de retângulos igual ao 
número de intervalos de classe. A largura de cada retângulo é igual à amplitude do intervalo de classe, enquanto sua 
altura representa a frequência do intervalo de classe. 
 
 
15 
Ao se fazer qualquer tipo de gráfico, perde-se algumas informações, pois já não mais existem as 
observações originais. Entretanto, essa perda de informações, se comparada com a concisão e facilidade de 
interpretação ganha com o uso da distribuição de frequências e histograma, se torna desprezível. 
 
 
 
Vejamos o histograma para distribuição de frequências relativo aos pesos de uma classe escolar: 
PESOS DOS ALUNOS DE 
UMA CLASSE ESCOLAR 
Peso (kg) Freqüência 
40 50 6 
50 60 10 
60 70 18 
70 80 12 
80 90 4 
 Dados fictícios. 
 
 
PESOS DOS ALUNOS DE
UMA CLASSE ESCOLAR
0
2
4
6
8
10
12
14
16
18
40 50 60 70 80 90 Pesos
fi
 
 Notas: 
 A área de um histograma é proporcional à soma das frequências. 
 No caso de usarmos as frequências relativas, obtemos um gráfico de área unitária. 
 Quando queremos comparar duas distribuições, o ideal é fazê-lo pelo histograma de frequências relativas. 
 
2.6.5.2 POLÍGONO DE FREQUÊNCIA 
 
O polígono de frequência é um gráfico de linha em que cada ponto é obtido considerando-se como valor do 
eixo das abscissas (x), o ponto médio do intervalo de classe e como valor do eixo das ordenadas (y), a respectiva 
freqüência do intervalo. Consideramos também uma classe anterior a primeira e outra posterior à ultima. Ligando 
todos os pontos teremos o polígono de frequências. 
 
Vejamos o polígono de frequência para distribuição de frequências, relativo, também, aos pesos dos alunos 
de uma classe escolar: 
 
PESOS DOS ALUNOS DE 
UMA CLASSE ESCOLAR 
Peso (kg) Freqüência 
4050 6 
50 60 10 
60 70 18 
70 80 12 
80 90 4 
 Dados fictícios. 
 
 
16 
 
PESOS DOS ALUNOS DE
UMA CLASSE ESCOLAR
0
2
4
6
8
10
12
14
16
18
35 45 55 65 75 85 95 Pesos
fI
 
 
O polígono de frequência também apresenta área proporcional à soma das frequências. 
 
2.6.5.3 POLÍGONO DE FREQUÊNCIA ACUMULADA ou OGIVA DE GALTON 
 
O polígono de frequência acumulada ou ogiva de Galton é um gráfico de linha em que são consideradas as 
frequências acumuladas. Anotamos a frequência nula para o limite inferior da primeira classe e os limites superiores 
de todas as classes, da primeira à última. 
 
Vejamos a ogiva de Galton para distribuição de frequências, a seguir: 
 
 
 
 PESOS DOS ALUNOS DE UMA CLASSE 
 
Classe Freqüência Fi 
30 40 3 3 
40 50 5 8 
50 60 8 16 
60 70 12 28 
70 80 7 35 
80 90 3 38 
90 100 2 40 
 Dados fictícios. 
 
PESOS DOS ALUNOS DE
UMA CLASSE ESCOLAR
0
5
10
15
20
25
30
35
40
30 40 50 60 70 80 90 10 Pesos
 Fi
 
 
 
 
 
17 
Uma distribuição de frequência sem intervalos de classe é representada graficamente por um diagrama 
onde cada valor da variável é representado por um segmento de reta vertical e de comprimento proporcional à 
respectiva frequência. 
 
 
 fi 
I xi fi Fi 
1 2 4 4 
2 3 7 11 
3 4 5 16 
4 5 2 18 
5 6 1 19 
6 7 1 20 
 =20 
 Dados fictícios. 
 1 2 3 4 5 6 7 xi 
 
 
 
 
 
 
 
Também podemos representar a distribuição pelo gráfico da frequência acumulada, o qual se apresentará 
com pontos de descontinuidade nos valores observados da variável. 
 
 fr 
 
 
 
 20 
 
 
 10 
 
 
 0 
 1 2 3 4 5 6 7 xi 
 
 
 
2.6.5.4 CURVA DE FREQUÊNCIA POLIDA 
 
Em geral, os dados de uma amostra são extraídos de uma população. 
Se tornarmos as amostras cada vez mais amplas, sua amplitude ficaria cada vez menor, o que nos permite 
verificar a sua tendência em se transformar numa curva, o que nos deixa mais evidente a verdadeira natureza da 
distribuição da população. 
Esse procedimento não nos dará uma certeza absoluta de que a curva obtida seja tal qual a curva resultante 
de um grande número de dados. Porém, podemos afirmar que a distribuição assemelha-se mais à curva de 
freqüência do que ao polígono de frequência obtido de uma amostra limitada. 
Essa transformação corresponde na eliminação dos vértices da linha poligonal através do emprego de uma 
fórmula bastante simples, a qual, a partir das frequências reais, nos fornece novas frequências que se localizarão, 
assim como no polígono de frequência, nos pontos médios dos intervalos de classe. 
A fórmula para encontrar a frequência calculada (fci) é: 
 
fc
f f f
i
i i i

  1 12
4
 
 
 
 
18 
Quando fazemos uso da curva polida, convém mostrar as frequências realmente observadas por meios de 
pontos ou pequenos círculos, de modo que qualquer interessado possa, por si mesmo, julgar até que ponto os 
dados originais foram ajustados. 
 
Para distribuição da tabela à seguir, temos: 
 
 ESTATURA DE 40 ALUNOS 
 DA UNIVERSIDADE A 
 
i ESTATURAS ( cm ) fi fci 
1 150 154 4 4,25 
2 154 158 9 8,25 
3 158 162 11 9,75 
4 162 166 8 8,00 
5 166 170 5 5,25 
6 170 174 3 2,75 
  = 40 
 
 
fc
x
fc
x
fc
x
1
2
3
0 2 4 9
4
17
4
4 25
4 2 9 11
4
33
4
8 25
9 2 11 8
4
39
4
9 75

 
 

 
 

 
 
,
,
,
 
fc
x
fc
x
fc
x
4
5
6
11 2 8 5
4
32
4
8
8 2 5 3
4
21
4
5 25
5 2 3 0
4
11
4
275

 
 

 
 

 
 
,
,
 
 
 
 
EXERCÍCIOS 
 
2 – Utilizando as tabelas do exercício 1 (página 12), construa o Histograma, o Polígono de Frequência, a Ogiva de 
Galton e a Curva de Frequência. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
19 
2.6.6 FORMAS DAS CURVAS DE FREQUÊNCIA 
 
I - Curva em forma de sino 
 
São curvas que caracterizam-se pelo fato de apresentarem um valor máximo na região central e podem ser 
simétricas ou assimétricas: 
 
 Curva simétrica 
 
Caracteriza-se por apresentar o valor máximo no ponto central e as pontos equidistantes desse ponto terem 
a mesma frequência. 
 
 
 
 
 
 
 
 
 
 Curva assimétrica 
 
Apresentam a cauda de um lado da ordenada máxima mais longa do que o outro. Se a cauda mais alongada 
fica à direita, a curva é chamada assimétrica positiva. Se a cauda se alonga à esquerda, a curva é chamada 
assimétrica negativa. 
 
 
 
 
 
 
 
 
 
 
 
 
 
II - Curva em forma de jota 
 
Caracteriza-se por apresentar o ponto de ordenada máxima em uma das extremidades. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
20 
III - Curva em forma de U 
 
Caracteriza-se por apresentar ordenadas máximas em ambas as extremidades. 
 
 
 
 
 
 
 
 
 
 
 
 
IV - Distribuição retangular 
 
Caracteriza-se por apresentar todas as classes com a mesma frequência. Tal distribuição seria 
representada por um histograma em que todas as colunas teriam a mesma altura ou por um polígono de frequência 
reduzido a um segmento de reta horizontal. 
 
 
 
 
 
 
 
 
 
 
 
 
 
2.7 MEDIDAS DE POSIÇÃO 
 
 São medidas que resumem o comportamento de uma variável em uma distribuição, através de um ou mais 
valores de forma representativa. As mais usadas são a média, a mediana, a moda, a variância, o desvio padrão e o 
coeficiente de variação. 
 
2.7.1 MÉDIAS 
 
São utilizadas quando desejamos obter a medida de posição que possui a maior estabilidade. 
 
I - MÉDIA ARITMÉTICA 
 
É o quociente da soma dos valores de uma variável pela quantidade números somados. 
 
x
x x x
n
n

  1 2 ...
 
 
II - MÉDIA ARITMÉTICA PARA UMA DISTRIBUIÇÃO DE FREQUÊNCIA 
 
Temos que considerar dois casos: 
 
II.1 - Sem intervalos de classe 
 Se os elementos x1,x2,...,xn apresentam, respectivamente, frequências f1, f2,...,fn, então: 
 
 
 
21 
M
f x f x f x
f f f
f x
f
a
i i n n
n
i i
i
n
i
i
n
  
  
 



2 2
1 2
1
1
...
...
 
 
 Vejamos a média aritmética para uma distribuição de frequências sem intervalos de classe a seguir: 
 
NOTAS DE ESTATÍSTICA 
Notas fi 
3 3 
4 5 
5 6 
6 7 
7 6 
 Dados fictícios. 
 
x
f x
f
x x x x xi i
i
 
   
   
 


3 3 4 5 5 6 6 7 7 6
3 5 6 7 6
143
27
5 296,
 
 
 
 
II.2 - Com intervalos de classe 
 
 Neste caso, consideramos todos os valores de um determinado intervalo como coincidentes com o ponto 
médio ( xi ) do intervalo. Assim: 
 
x
f x
f
i i
i



, para uma amostra. 
 
 
 Vejamos a médiaaritmética para uma distribuição de frequência com intervalos de classe à seguir: 
 
NOTAS DE MATEMÁTICA 
Notas fi xi fixi 
0 2 3 1 3 
2 4 5 3 15 
4 6 18 5 90 
6 8 14 7 98 
8 10 10 9 90 
  fi = 50  fixi = 296 
 Dados fictícios. 
 
x
f x
f
i i
i
  


296
50
5 92,
 
 
 
II.3 - PROCESSO BREVE 
 
 Com o intuito de eliminarmos o grande número de cálculos que às vezes se apresentam na determinação da 
média, empregamos o que denominamos processo breve, baseado na mudança da variável x por outra y, tal que: 
 
h
xx
y i 0


 
 
 
 
22 
onde x0 é uma constante arbitrária escolhida convenientemente dentre os pontos médios da distribuição, de 
preferência o de maior frequência. 
 Fazendo essa mudança de variável, somamos x0 à média da nova variável e, ao mesmo tempo, 
multiplicamos a mesma por h. Resultando a fórmula modificada: 
 
x x
f y
f
h
i i
i
  

0
 
 
Assim, para distribuição à seguir, tomamos para o valor de x0 o ponto médio de maior frequência: x0 = 160. Como h 
= 4, temos para valores da nova variável: 
 
 
3
4
160172
0
4
160160
2
4
160168
1
4
160156
1
4
160164
2
4
160152
63
52
4















yy
yy
yyi
 
 
 
 ESTATURA DE 40 ALUNOS 
 DA UNIVERSIDADE A 
 
ESTATURAS ( cm ) fi xi yi yifi 
 150 154 4 152 -2 -8 
154 158 9 156 -1 -9 
158 162 11 160 0 0 
162 166 8 164 1 8 
166 170 5 168 2 10 
170 174 3 172 3 9 
  = 40  =10 
 Dados fictícios. 
 
 Temos, então, x0 = 160,  yifi = 10,  fi = 40 e h =4. 
 
 Substituindo os valores na fórmula, temos: 
 
cmxx 16111604
40
10
160
_

 
 
 
Notas: 
 
 O processo breve, com a nova variável definida, só pode ser usada em distribuições que apresentam intervalos 
de classe de mesma amplitude. 
 O processo breve pode, também, ser aplicado para as distribuições sem intervalos de classe, bastando fazer h = 
1. 
 
PROPRIEDADES DA MÉDIA ARITMÉTICA 
 
1ª Somando-se ou subtraindo-se uma constante de todos os valores de uma variável, a média do conjunto fica 
aumentada ou diminuída dessa constante. 
 
 
 
23 
2ª Multiplicando-se ou dividindo-se todos os valores uma variável por uma constante, a média do conjunto fica 
multiplicada ou dividida por essa constante. 
 
 
2.7.2 MEDIANA 
 
 Empregamos a mediana (Md) quando desejamos obter o ponto que divide a distribuição em partes iguais. 
 Dispondo os elementos em ordem crescente, a mediana é o valor intermediário ou a média aritmética dos 
valores intermediários. 
 
 
Vejamos as medianas a seguir: 
 
 Para o conjunto de valores 3, 4, 5, 6, 7, 8, 10, 11 e 12, Md = 7, pois temos quatro valores menores que 7 e 
quatro maiores que 7. 
 Para 1, 2, 3, 4, 5, 6, 7 e 8, Md = 4,5, ou seja, a média aritmética dos dois valores intermediários (4 e 5). 
 
I - MEDIANA PARA UMA DISTRIBUIÇÃO DE FREQUÊNCIA 
 
Temos que considerar dois casos: 
 
I.1 - Sem intervalo de classe 
 
Basta considerar a frequência acumulada e localizar o elemento intermediário. 
 
 Vejamos a mediana para uma distribuição de frequências sem intervalos de classe à seguir: 
 
Salários fi Fi 
1500 12 12 
2000 10 22 
2500 8 30 
3000 4 34 
3500 1 35 
 Dados fictícios. 
 
Como  fi = 35, temos: fi
 
2
35
2
17 5,
 
 
 Assim, a mediana é um valor entre o 17º e o 18º elemento. Esses valores ocorrem o salário de 2000. 
Portanto, Md = 2000. 
 
 
I.2 - Com intervalos de classe 
 
 Devemos inicialmente localizar a classe mediana, ou seja, a que contém o elemento equivalente à posição 
f i
2
. Em seguida, calculamos seu valor utilizando a fórmula: 
M l
f
F
f
hd d
i
ant
d
d 








2
.
 
 
em que: 
 
ld: limite inferior da classe mediana 
Fant: soma das frequências das classes anteriores à classe mediana 
hd: amplitude da classe mediana 
fd: frequência da classe mediana 
 
 
24 
 
 
 Vejamos a mediana para uma distribuição de frequência com intervalos de classe a seguir: 
 
Salários fi Fi 
1000 1200 20 20 
1200 1400 12 32 
1400 1600 10 42 
1600 1800 6 48 
1800 2000 2 50 
 Dados fictícios. 
 
Como: 
f F
f
i i
i

    50
2
50
2
25
 
Assim, a classe mediana é a segunda, isto é, a que contém o 25º elemento. 
 
Então: 
 
M xd  

1200
25 20
12
200 1283 33. . ,
 
 
 
2.7.3 MODA 
 
 A moda (Mo) é utilizada quando desejamos obter uma medida rápida e aproximada de posição. Em um 
conjunto de elementos é o elemento que ocorre com maior frequência. 
 
Vejamos as modas a seguir: 
 
 A moda do conjunto de números 2, 3, 4, 4, 5, 6, 6, 6, 7 e 8 é Mo = 6, que ocorre com frequência 3. (modal) 
 No conjunto 2, 3, 3, 4, 5, 5, 6, 7, 7 e 8, temos os números 3, 5 e 7 com frequência 2. Temos, portanto, três 
modas: 3, 5 e 7. (trimodal) 
 O conjunto dos números 2, 3, 4, 6, 8 e 9 não tem nenhum elemento com maior frequência que os demais. 
Portanto, não tem moda. (amodal) 
 
I - MODA PARA UMA DISTRIBUIÇÃO DE FREQUÊNCIAS 
 
Temos que considerar dois casos: 
 
I.1 - Sem intervalos de classe 
 
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável 
com maior frequência. 
 
Vejamos a moda para uma distribuição de frequência sem intervalos de classe a seguir: 
 
Salários fi 
1.550 5 
2.100 8 
2.580 6 
3.250 4 
3.570 2 
 Dados fictícios. 
 
Como a maior frequência é 8, Mo = 2.100. 
 
 
 
 
 
25 
I.2 - Com intervalos da classe 
 
A classe que apresenta a maior frequência é denominada classe modal. Consideramos como moda de uma 
distribuição de frequências o valor compreendido entre os limites da classe modal. Tal valor é dado por: 
 
M l
D
D D
ho o o  
1
1 2
.
 
em que: 
 
lo: limite inferior da classe modal 
ho: amplitude da classe modal 
D1: frequência da classe modal menos frequência da classe anterior à modal 
D2: frequência da classe modal menos frequência da classe posterior à modal 
 
Vejamos a moda para uma distribuição de frequências com intervalos de classe a seguir: 
 
Tempo (s) fi 
10 12 3 
12 14 4 
14 16 7 
16 18 12 
18 20 6 
 Dados fictícios. 
 
Como a classe modal é a quarta classe, pois tem maior freqüência, temos: 
 
91,16
11
10
162
65
5
16
21618
6612
5712
16
2
1














xM
h
D
D
l
o
o
o
 
 
 
 
EXERCÍCIOS 
 
3 – Para o conjunto de valores 213, 213, 213, 215, 215, 216, 216, 218, 220 e 221, calcule a média, a mediana e a 
moda. 
 
 
4 – Na tabela a seguir, determine a média, a mediana e a moda e construa o Gráfico de Pareto. 
 
 
 
5 – Calcule a média, a mediana e a moda na tabela da primeira amostra do exercício 1. 
 
 
6 – Calcule a média, a mediana e a moda, utilizando o Histograma, o Polígono de Frequência e Ogiva, 
respectivamente, da segunda amostra do exercício 2. 
 
 
 
26 
2.7.4 SEPARATRIZES 
 
A mediana é a medida de posição que separa a série estatística dois gruposque apresentam o mesmo 
número de valores. Existem outras medidas de posição que estão ligadas à mediana devido a essa característica, já 
que se baseiam em sua posição na série. Essas medidas são os quartis, os percentis e os decis que, juntamente 
com a mediana, são conhecidas pelo nome de separatrizes. 
 
I - OS QUARTIS 
 
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. 
Há, portanto, três quartis: 
 
 O primeiro quartil ( Q1) – valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor 
que ele e as três quartas partes restantes (75%) são maiores. 
 O segundo quartil ( Q2) – evidentemente, coincide com a mediana. 
 O terceiro quartil ( Q3) – valor situado de tal modo que as três quartas partes (75%) dos termos são menores 
que ele e uma quarta parte (25%) é maior. 
 
Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da 
mediana, bastando substituir, na fórmula da mediana, 
f i
2
 por: 
k fi
4
 
sendo k o número de ordem do quartil. 
 
Assim, temos: 
Q l
f
F
f
h e Q l
f
F
f
h
i
ant
i
ant
1 3
4
3
4
 









 









 
*
*
. *
*
.
 
II - OS DECIS 
 
Denominamos decis os nove valores que separam uma série em 10 partes iguais. 
Indicamos por: D1, D2, ... , D9. 
 
O cálculo de um decil segue a mesma técnica do cálculo da mediana, porém, a fórmula 
f i
2
 será 
substituída por 
k fi
10
, sendo k o número de ordem do decil. 
 
III - OS PERCENTIS 
 
Denominamos percentis os noventa e nove valores que separam uma série em 100 partes iguais. 
Indicamos por: P1, P2, ... , P55, ... , P99. 
O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém, a fórmula 
f i
2
 será 
substituída por 
k fi
100
, sendo k o número de ordem do percentil. 
 
 
EXERCÍCIO 
 
7 – Utilizando a tabela da segunda amostra do exercício 1 (página 12), calcule Q1, Q3, D4, D7, P20 e P82. 
 
 
 
 
 
 
27 
2.7.5 VARIÂNCIA 
 
A variância é a medida de posição baseada nos desvios em torno da média aritmética, porém determinando 
a média aritmética dos quadrados dos desvios. Assim, temos: 
 
s
x X
n
i2
2
1




( ), para uma amostra. 
 


2
2

( )x
N
i
, para uma população. 
 
2.7.6 DESVIO PADRÃO 
 
O desvio padrão também determina a dispersão dos valores em torno da média. 
A exemplo da variância, o desvio padrão leva em consideração a totalidade dos valores da variável em 
estudo, sendo também, um índice de variabilidade bastante estável, por isso é bastante usado. 
 
Fazendo 
s s 2
, temos: 
 
1
)( 2




n
Xxf
s
ii
, para uma amostra. 
 
N
xf ii
2) ( 



, para uma população. 
 
Notas: 
 
 Tanto o desvio padrão como a variância são usados como medidas de variabilidade. O uso de uma ou de outra 
dependerá da finalidade que se tenha em vista. 
 A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante 
na inferência estatística e em combinações de amostras. 
 
 
Exemplo: Calcule o desvio padrão da distribuição dada: 
 
 
Custo em R$ fi xi fixi fi( xi - 

)
2
 
400 500 1 450 450 62.500 
500 600 3 550 1.650 67.500 
600 700 5 650 3.250 12.500 
700 800 7 750 5.250 17.500 
800 900 4 850 3.400 90.000 
  = 20  = 14.000  = 250.000 
 
Então: 
 
700
20
000.14



i
ii
f
xf

 e 
8,111500.12
20
000.250) (
2




N
xf ii  
 
Estudos mostram que, para determinadas distribuições chamadas normais, no intervalo [
sxsx  ,
] estão 
68,27% dos elementos da distribuição, no intervalo [
sxsx 2,2 
] estão 95,45% dos elementos da distribuição e 
no intervalo [
sxsx 3,3 
] estão 99,73% dos elementos da distribuição. 
 
 
28 
 
 
PROCESSO BREVE 
 
Podemos obter o desvio padrão pelo processo breve de cálculo. Basta substituir a variável x pela variável y, 
tal que: 
h
xx
y i 0


 e depois multiplicar pela amplitude do intervalo de classe. 
 
PROPRIEDADES DO DESVIO PADRÃO 
 
1ª Somando-se ou subtraindo-se uma constante de todos os valores de uma variável, o desvio padrão não se altera. 
 
2ª Multiplicando-se todos os valores uma variável por uma constante diferente de zero, o desvio padrão fica 
multiplicado por essa constante. 
 
 
2.7.7 COEFICIENTE DE VARIAÇÃO 
 
Para contornar as dificuldades e limitações quando o desvio padrão for muito pequeno em relação à média, 
podemos caracterizar a variabilidade ou dispersão dos dados em termos relativos a seu valor médio, medida essa 
denominada coeficiente de variação (CV), que normalmente é dado em forma de porcentagem: 
 
x
s
CV 
, para uma amostra. 
CV 


, para uma população. 
 
 Exemplo: Tomando os resultados das medidas das estaturas e dos pesos de um mesmo grupo de 
indivíduos, verifique qual dos coeficientes de variação é o maior: 
 
ESTATÍSTICAS 
x
_ 
s 
ESTATURAS 175 cm 5,0 cm 
PESOS 68 kg 2,0 kg 
 
Temos: 
%94,20294,0
68
2
%85,20285,0
175
5


P
E
CV
CV
 
 
Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão ou variabilidade que as 
alturas. 
 
 
EXERCÍCIOS 
 
8 – Calcule o desvio padrão e o coeficiente de variação do exercício 3 (página 28). 
 
 
9 – Calcule o desvio padrão e o coeficiente de variação do exercício 4 (página 28). 
 
 
 
 
 
 
 
29 
10 – Calcule o desvio padrão e o coeficiente de variação da tabela abaixo: 
 
Salários fi 
 800 1.000 7 
1.000 1.200 12 
1.200 1.400 15 
1.400 1.600 10 
1.600 1.800 6 
1.800 2.000 3 
2.000 2.200 2 
 
 
 
 
 
2.8 ASSIMETRIA E CURTOSE 
 
2.8.1 MEDIDA DE ASSIMETRIA 
 
Quando temos uma distribuição simétrica, a média e a moda coincidem; sendo a distribuição assimétrica à 
esquerda ou negativa, a média é menor que a moda; e sendo assimétrica à direita ou positiva, a média é maior que 
a moda. 
Daí, temos que: 
 
Na distribuição simétrica 
MoMdx 
 
Na distribuição assimétrica negativa 
MoMdx 
 
Na distribuição assimétrica positiva 
MoMdx 
 
 
Baseando-se nessas relações entre a média e a moda, podemos empregá-las para determinar o tipo de 
assimetria. Assim, bastando calcular o valor da diferença 
Mox 
 temos que, se: 
 
 0Mox
 assimetria nula ou distribuição simétrica; 
 0Mox
 assimetria negativa ou à esquerda; 
 0Mox
 assimetria positiva ou à direita. 
 
Veja os exemplos das amostras abaixo: 
 
DISTRIBUIÇÃO A DISTRIBUIÇÃO B DISTRIBUIÇÃO C 
PESOS (kg) fi PESOS (kg) fi PESOS (kg) fi 
2 6 3 2 6 3 2 6 5 
6 10 8 6 10 6 6 10 10 
10 14 12 10 14 9 10 14 13 
14 18 12 14 18 14 14 18 9 
18 22 8 18 22 10 18 22 6 
22 26 3 22 26 4 22 26 3 
  = 46  = 46  = 46 
 
 Temos: 
 
x
 = 14 kg 
Md = 14 kg 
Mo = 14 kg 
S = 5,32 kg 
 
x
 = 14,96 kg 
Md = 15,43 kg 
Mo = 16,22 kg 
s = 5,43 kg 
 
x
 = 12,87 kg 
Md = 12,46 kg 
Mo = 11,71 kg 
s = 5,59 kg 
 
 
 
30 
 Logo: 
 
A - 14 – 14 = 0  a distribuição é simétrica. 
B - 14,96 – 16,22 = – 1,26 kg  a distribuição é assimétrica negativa. 
C - 12,87 – 11,71 = 1,16 kg  a distribuição é assimétrica positiva. 
 
 
2.8.2 COEFICIENTE DE ASSIMETRIAA medida anterior, por ser absoluta, apresenta a mesma deficiência do desvio padrão, isto é, não permite a 
possibilidade de comparação entre as medidas de duas distribuições. Por esse motivo, daremos preferência aos 
coeficientes de assimetria de Pearson, dado por: 
 
s
Mox
As


 e  
As
x Md
s

3. 
 
 Se 0,15 < /As/ < 1, a assimetria é considerada moderada; se 0 < /As/ < 0,15, é considerada fraca; e se /As/ > 
1, é considerada forte. 
 
 
 
EXERCÍCIO 
 
11 – Represente graficamente as distribuições do exemplo da página 33 através da curva de frequência e determine 
seus coeficientes de assimetria. 
 
 
 
 
 
2.8.3 MEDIDA DE CURTOSE 
 
 Denominamos medida de curtose, ou simplesmente curtose, o grau de achatamento de uma distribuição 
em relação a uma distribuição padrão, denominada curva normal. 
 Quando a distribuição apresenta uma curva de freqüência mais fechada que a normal ou mais aguda em 
sua parte superior, ela recebe o nome de leptocúrtica. 
Quando a distribuição apresenta uma curva de freqüência mais aberta que a normal ou mais achatada em 
sua parte superior, ela recebe o nome de platicúrtica. 
A curva normal, que é nossa base referencial, recebe o nome de mesocúrtica. 
 
 
2.8.4 COEFICIENTE DE CURTOSE 
 
 Uma fórmula para a medida da curtose é: 
 
 
 
K
Q Q
P P



3 1
90 102.
 
 
 Essa fórmula é conhecida como coeficiente percentílico de curtose. 
 Relativamente à curva normal, temos: K = 0,263 
 
 Assim: 
 
K = 0,263  curva mesocúrtica 
K < 0,263  curva leptocúrtica 
K > 0,263  curva platicúrtica 
 
 
31 
 
 Exemplo: Sabendo-se que uma distribuição apresenta as seguintes medidas: 
 
Q1 = 24,4 cm, Q3 = 41,2 cm, P10 = 20,2 cm e P90 = 49,5 cm 
 
temos: 
 
 
K 


 
41 2 24 4
2 49 5 20 2
16 8
58 6
0 287
, ,
, ,
,
,
,
 
 
 Como: 
 
0,287 > 0,263, concluímos que a distribuição é platicúrtica, em relação à normal. 
 
 
EXERCÍCIOS 
 
12 – Considere as seguintes estatísticas relativas a três distribuições de freqüência: 
 
DISTRIBUIÇÕES 
x
 Mo Md s 
A 52 52 52 2,92 
B 45 50 47 3,07 
C 48 46 47 3,14 
 
a) Classifique cada distribuição quanto ao tipo de assimetria. 
 
 
 
 
b) Calcule em cada distribuição o coeficiente de assimetria. 
 
 
 
 
 
 
13 – Considerando a distribuição de freqüência relativa aos pesos de 100 operários de uma fábrica: 
 
PESOS (kg) 50 ├ 58 ├ 66 ├ 74 ├ 82 ├ 90 ├ 98 
Nº DE OPERÁRIOS 10 15 25 24 16 10 
 
a) Determine o grau de assimetria. 
 
 
 
 
b) Determine o grau de curtose. 
 
 
 
 
c) Classifique a distribuição em relação à curva normal. 
 
 
 
 
 
 
 
 
32 
2.9 CORRELAÇÃO 
 
 Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe uma correlação 
entre elas. 
 Representando, em um sistema coordenado cartesiano ortogonal, os pares formados pelas duas variáveis, 
obtemos uma nuvem de pontos que denominamos diagrama de dispersão. 
 Esses pontos obtidos podem formar uma elipse em diagonal e que quanto mais fina for, mais ela se 
aproxima de uma reta denominada correlação linear. 
 Uma correlação pode ser: 
 
- Linear positiva, se os pontos do diagrama têm como “imagem” uma reta ascendente; 
- Linear negativa, se os pontos do diagrama têm como “imagem” uma reta descendente; 
- Não-linear, se os pontos têm como “imagem” uma curva. 
 
 Se os pontos apresentam-se dispersos, não oferecendo uma “imagem” definida, concluímos que não há 
relação alguma entre as variáveis em estudo. 
 
 
2.9.1 COEFICIENTE DE CORRELAÇÃO 
 
 O grau de intensidade da correlação entre duas variáveis pode ser determinado fazendo uso do coeficiente 
de correlação de Pearson: 
 
      2222 . iiii
iiii
yynxxn
yxyxn
r



, com r  [-1, 1]. 
Assim: 
 
Se r = 1, dizemos que há uma correlação perfeita e positiva. 
Se r = -1, dizemos que há uma correlação perfeita e negativa. 
Se r = 0, dizemos que não há correlação. 
 
Importante: 
 
 Se 
16,0  r
, há uma correlação relativamente forte. 
 Se 
0 3 0 6, , r
, há uma correlação relativamente fraca. 
 Se 
3,00  r
, há uma correlação muito fraca, o que não permite a tirada de conclusões sobre as 
variáveis em estudo. 
 
 
EXERCÍCIOS 
 
14 – Considerando uma amostra aleatória de 10 alunos de uma turma da universidade, determine o grau do 
coeficiente de correlação para as notas dadas: 
 
MATEMÁTICA ESTATÍSTICA 
5 6 
8 9 
7 8 
10 10 
6 5 
7 7 
9 8 
3 4 
8 6 
2 2 
 
 
 
33 
15 – Considerando uma amostra aleatória de 7 crianças que fazem tratamento contra a obesidade em uma certa 
clínica, determine o grau do coeficiente de correlação para as variáveis dadas: 
 
PESO (kg) ESTATURA (m) 
50 1,23 
53 1,45 
59 1,58 
63 1,65 
65 1,60 
67 1,63 
69 1,68 
 
 
 
 
2.10 REGRESSÃO 
 
 Toda vez que desejamos estudar determinada variável em função de outra, fazemos uma análise de 
regressão, que tem por objetivo descrever, através de um modelo matemático, a relação entre duas variáveis. 
 
2.10.1 AJUSTAMENTO DA RETA 
 
 A determinação do ajustamento da reta é obtido através da função definida por: 
 
Y aX b 
, 
 
supondo X a variável dependente e Y a independente. 
 
 Os valores dos parâmetros de a e b são adquiridos através das fórmulas: 
 
 22 i
iiii
xxn
yxyxn
a



 e 
xayb 
 
 
onde: 
 
x
x
n
i

 e 
y
y
n
i

 . 
 
 Como estamos utilizando uma amostra para obter ao valores dos parâmetros a e b, o resultado encontrado 
é uma estimativa da verdadeira equação de regressão, portanto devemos escrever: 
 
Y aX b
^
  
 
 Para traçar a reta do gráfico, devemos determinar dois de seus pontos. 
 
 
EXERCÍCIO 
 
16 – Utilizando os exercícios 14 e 15 da página 38, estabeleça as equações de regressão das retas ajustadas e 
esboce seus gráficos. 
 
 
 
 
 
 
 
 
34 
3 INTRODUÇÃO DE PROBABILIDADE ESTATÍSTICA 
Veremos agora os conceitos necessários que servem de ponto de apoio para os primeiros passos da 
inferência estatística. 
 
3.1 EXPERIMENTO ALEATÓRIO 
 
Ao lançar um dado uma ou mais vezes, não podemos saber com antecedência o número que se vai obter; 
sabemos apenas que os possíveis resultados são 1, 2, 3, 4, 5 ou 6. Esse tipo de experimento, cujo resultado não 
pode ser previsto, é chamado Experimento Aleatório, pois pode resultar em diferentes resultados, mesmo que 
repetido da mesma maneira e em qualquer ocasião. 
Na teoria das probabilidades, estudamos os experimentos aleatórios eqüiprováveis, ou seja, aqueles em 
que qualquer resultado pode ocorrer com a mesma chance. 
As probabilidades são utilizadas para exprimir a chance de ocorrência de um determinado evento e é dada 
por um número que pode variar de 0 (zero) a 1,00. 
 
3.2 ESPAÇO AMOSTRAL 
 
Espaço amostral ou conjunto universo é o conjunto U de todos os resultados possíveis de um experimento 
aleatório. O número de elementos desse conjunto é indicado por n(U). 
Vejamos alguns exemplos: 
 
 no lançamento de um dado, U = {1, 2, 3, 4, 5, 6} e n(U) = 6; 
 no sorteio de uma das dezenas da loto, U = {00, 01, 02, ... , 99} e n(U) = 100; 
 no lançamento de dois dados diferentes, U = {(1, 1), (1, 2), ... , (6, 5), (6, 6)} e n(U) = 36. 
 
3.3 EVENTO 
 
Qualquer subconjunto do espaço amostral U é um evento. 
No lançamento de um dado, por exemplo, o evento obter um número maior ou igual a 4 é representado por 
A = {4, 5, 6}, subconjunto de U = {1, 2, 3, 4, 5, 6}. 
 
Observações: 
 
1 - Quando A é igual a U, o evento é certo;no lançamento de uma moeda, A = {cara, coroa} é um evento 
certo: n(A) = n(U). 
2 - Se A = , o evento é impossível; por exemplo, obter 7 no lançamento de um dado. 
3 - Quando, para dois eventos A e
A
, A  
A
 = U e A  
A
 = , esses dois eventos são complementares. No 
lançamento de um dados, sendo A = {2, 4, 6} o evento obter um número par e 
A
 = {1, 3, 5} o evento obter um 
número ímpar, temos: 
A  
A
 = {1, 2, 3, 4, 5, 6} = U e A  
A
 =  
Portanto, A e
A
 são eventos complementares. 
 
 
Exemplo: Determine o espaço amostral do experimento aleatório lançamento simultâneo de duas moedas. 
 
Solução: Indicando cara por C e coroa por D, temos: 
 
 U = {(C, C), (C, D), (D, C), (D, D)} 
 n(U) = 4 
 
EXERCÍCIO 
 
17 – Considerando o experimento aleatório nascimento de três filhos de um casal, determine o espaço amostral e o 
subconjunto que representa o evento nascimento de exatamente dois meninos em três filhos do casal. 
 
 
 
 
 
35 
3.3.1 EVENTOS INDEPENDENTES 
 Dizemos que dois eventos são independentes quando a realização ou não de um dos eventos não afeta a 
probabilidade de realização do outro e vice-versa. 
Exemplo: No lançamento de dois dados distintos, a probabilidade de obtermos 1 no primeiro dado e 5 no segundo, é: 
P   
1
6
1
6
1
36
 
3.3.2 EVENTOS MUTUAMENTE EXCLUSIVOS 
 Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a 
realização do(s) outro(s). 
Assim, no nascimento de uma criança, o evento “nascer menino” e o evento “nascer menina”, são 
mutuamente exclusivos, pois na realização de um deles, o outro não se realiza. 
 
3.4 PROBABILIDADE 
Num experimento aleatório eqüiprovável, sendo n(U) o número de elementos do espaço amostral U e n(A) o 
número de elementos do evento A, a probabilidade de que ocorra o evento A é dada pelo número real: 
 
P A
n A
n U
( )
( )
( )

 
 
Então, a probabilidade de um evento é dada pelo quociente da divisão do número de casos favoráveis pelo 
número de casos possíveis, ou seja: sempre que um espaço amostral consiste de N resultados possíveis que são 
igualmente prováveis, a probabilidade de cada resultado será 
1
N
.
 
 
Exemplo: No lançamento de duas moedas e o evento ocorrer cara pelo menos uma vez. Representando para cara C 
e para coroa D, temos: 
 
U C C C D D C D D
n U
A C C C D D C
n A











{( , ),( , ),( , ),( , )}
( )
{( , ),( , ),( , )}
( )
4
3
3 casos em 4 possíveis 
 
P( A
n A
n U
)
( )
( )
 
3
4
 
 
EXERCÍCIOS 
18 – Na escolha de um número de 1 a 30, qual a probabilidade de ser sorteado um múltiplo de 5? 
 
 
 
 
19 – Qual a probabilidade de, no lançamento simultâneo de dois dados, obter soma igual a 7? 
 
 
 
 
 
 
36 
 
3.4.1 PROPRIEDADES 
 
1ª) Se A = , então n(A) = 0 e, portanto, P(A) = 0 (probabilidade do evento impossível). 
 
2ª) Se A = U, então n(A) = n(U) e P(A) = 1 (probabilidade do evento certo). 
 
3ª) Se A  U, então 0  n(A)  n(U). 
 
Dividindo a desigualdade por n(U)  0, temos: 
 
0
0 1
n U
n A
n U
n U
n U
P A
( )
( )
( )
( )
( )
( )    
 
4ª) Se A e 
A
 são eventos complementares, então n(A) + n(
A
) = n(U). 
Dividindo a igualdade por n(U)  0, temos: 
 
n A
n U
n A
n U
n U
n U
P A P A
( )
( )
( )
( )
( )
( )
( ) ( )     1
 
 
 
3.4.2 PROBABILIDADE DA UNIÃO DE EVENTOS 
 
Se A e B são dois eventos de um espaço amostral U, sabemos que 
n(A  B) = n(A) + n(B) - n(A  B): 
 
 U 
 
 A B 
 
 
 
 
 
 
 
 
 
Dividindo essa igualdade por n(U)  0, temos: 
 
n A B
n U
n A
n U
n B
n U
n A B
n U
P A B P A P B P A B
( )
( )
( )
( )
( )
( )
( )
( )
( ) ( ) ( ) ( )

  

     
 
 
Se A  B = , os eventos são mutuamente exclusivos, isto é, P(A  B) = 0. Daí: 
 
 P(A  B) = P(A) + P(B) 
 
 
EXERCÍCIOS 
 
20 – Sorteando um número de 1 a 30, qual a probabilidade de que ele seja par ou múltiplo de 3? 
 
 
21 – Lançando-se simultaneamente dois dados não viciados, calcule a probabilidade de que suas faces superiores 
exibam soma igual a 7 ou 9. 
 
 
 
37 
3.4.3 MULTIPLICAÇÃO DE PROBABILIDADES 
 
A probabilidade do produto é dada por um princípio análogo ao princípio fundamental da contagem, quando 
os eventos A e B são independentes. 
Se ocorre um evento A de probabilidade p e, em seguida, ocorre o evento B de probabilidade q (ambos 
independentes), então a probabilidade de que ocorram os eventos A e B na ordem indicada é p.q: 
 
P A B P A P B p q( ) ( ) ( )    
 
 
Essa regra pode ser generalizada para n eventos A1, A2, ... , An com probabilidades p1, p2, ... , pn, 
respectivamente. 
 
Exemplo: Determine a probabilidade de sair o número 5 em dois lançamentos sucessivos de um dado. 
 
Solução: Sendo A o evento obter 5 no primeiro lançamento e B o evento obter 5 no segundo lançamento, 
 
vem: 
U
n U
n A
n B











{ , , , , , }
( )
( )
( )
1 2 3 4 5 6
6
1
1
 
 
Temos 
P A e P B( ) ( ) , 
1
6
1
6
 com A e B independentes. 
Logo, a probabilidade pedida é dada por: P(A) x P(B) = 
1
6
1
6
1
36
x 
 
 
EXERCÍCIOS 
 
22 – Em uma urna há 5 bolas azuis e 9 bolas brancas. Retiramos uma bola da urna e, em seguida, sem repor a bola 
retirada, retiramos uma segunda bola. Determine a probabilidade de: 
 
 
 
 
23 – Numa certa comunidade, 52% dos habitantes são mulheres e destas 2,4% são canhotas. Dos homens, 2,5% 
são canhotos. Calcule a probabilidade de que um indivíduo escolhido ao acaso seja canhoto. 
 
 
 
 
 
3.5 VARIÁVEL ALEATÓRIA E DISTRIBUIÇÃO DE PROBABILIDADE 
 
 Definimos variável aleatória de um espaço amostral, a função onde a cada elemento desse espaço é 
atribuído um número real. 
 Seja X uma variável aleatória que pode assumir qualquer valor x  R, e a cada valor xi correspondem pontos 
do espaço amostral. Associamos, então, a cada valor xi a probabilidade pi de ocorrência de tais pontos no espaço 
amostral. 
 Assim, temos: 
pi  1
 
 
 Os valores x1, x2, ... , xn e seus correspondentes p1, p2, ... , pn, definem uma distribuição de probabilidade. 
 
Exemplo: Sendo c o evento cara e k o evento coroa. S = {(c, c), (c, k), (k, c), (k, k)} é o espaço amostral que 
representa o lançamento simultâneo de duas moedas. Construa a tabela de distribuição de probabilidade do evento 
que representa o número de caras. 
 
 
38 
 
PONTO AMOSTRAL X Número de caras ( X ) p(X) 
(c, c) 2 2 1/4 
(c, k) 1 1 1/2 
(k, c) 1 0 1/4 
(k, k) 0 

1 
 
 
 Ao definir a distribuição de probabilidade, estabelecemos uma correspondência entre os valores da variável 
aleatória X e os valores da variável P. Essa correspondência define uma função que determina a distribuição de 
probabilidade da variável aleatória X. 
 
 
EXERCÍCIO 
 
24 – Uma determinada moeda viciada apresenta cara duas vezes mai frequentemente que coroa. Essa moeda é 
jogada quatro vezes. Seja X o número de caras que aparece. Estabeleça a distribuição de probabilidade de X. 
 
 
 
 
 
3.5.1 DISTRIBUIÇÃO DE BERNOULLI 
 
Dados dois eventos complementares, A e A_ , temos: 
 
P A P A P A P A( ) ( ) ( ) ( )
_ _
    1 1
 
 
Sendo P( A ) = p, podemos escrever:
P A p()
_
 1
 
 
 A variável aleatória X, que pode assumir apenas os valores p e (1 – p) é chamada variável aleatória de 
Bernoulli. 
 
 
3.5.2 DISTRIBUIÇÃO BINOMIAL 
 
Chamamos de experimento binomial ao experimento formado por n ensaios de Bernoulli. 
Assim, se P(A) = p, a probabilidade de o evento A ocorrer exatamente k vezes em n experiências é dada 
por: 
P A
n
k
p pk
k n k( ) ( )





 
1
 
 
Observação: A lei binomial só pode ser aplicada a experiências aleatórias discretas que obedeçam às seguintes 
condições: 
 
1. Fixado um número n, a experiência é repetida n vezes nas mesmas condições. 
2. Na experiência, só dois resultados são possíveis: ou ocorre A ou ocorre 
A
. 
3. Os eventos A e 
A
 têm sempre, respectivamente, as probabilidades p e 1 - p em todas as tentativas. 
4. Cada experiência é independente das outras. 
 
 
Exemplo: Jogando um dado 4 vezes, qual a probabilidade de sair o número 5 exatamente 3 vezes? 
 
 
 
39 
Solução: 
A n A
A n A
U n U
  
  
  





{ } ( )
{ , , , , } ( )
{ , , , , , } ( )
5 1
1 2 3 4 6 5
1 2 3 4 5 6 6
 
        P A p P A p( ) ( )
1
6
1 1
1
6
5
6
 
 
Se:
P A
n
k
p pk
k n k( ) ( )





 
1
 
324
1
6
5
6
1
4
6
5
.
6
1
.
3
4
)(:
3
343
3 



















xxAPLogo
. 
 
 
EXERCÍCIOS 
 
25 – Uma prova consta de 6 questões com 4 opções cada uma e uma única alternativa correta. Qual a probabilidade 
de acertar duas das 6 questões? 
 
 
26 – Um jogador tem 
2
3
de probabilidade de vencer uma partida sempre que joga. Sabendo que ele vai jogar 5 
partidas, determine a probabilidade de ele vencer no máximo duas. 
 
 
 
 
 
3.5.3 DISTRIBUIÇÃO DE POISSON 
 
Na teoria da probabilidade a distribuição de Poisson é uma distribuição de probabilidade discreta. Ela 
expressa, por exemplo, a probabilidade de um certo número de eventos ocorrerem num dado período tempo, caso 
estes ocorram com uma taxa média conhecida e caso cada evento seja independente do tempo decorrido desde o 
último evento. A probabilidade de que existam exatamente k ocorrências, sendo k um inteiro não negativo, é 
 
onde: 
 
 e é base do logaritmo natural (e = 2.71828...), 
 k! é o fatorial de k, 
 λ é um número real, igual ao número esperado de ocorrências que ocorrem num dado intervalo de tempo. 
 
Por exemplo, se o evento ocorre a uma média de 4 minutos, e estamos interessados no número de eventos que 
ocorrem num intervalo de 10 minutos, usariámos como modelo a distribuição de Poisson com λ = 10/4 = 2.5. 
 
 
 
 
 
40 
EXERCÍCIO 
 
27 – Certo evento ocorre em média de 3 minutos. Usando como modelo a distribuição de Poisson, determine a 
probabilidade desse evento ocorrer até 10 vezes num intervalo de 20 minutos. Esboce o gráfico dessa situação. 
 
 
 
 
3.5.4 DISTRIBUIÇÃO NORMAL (curva normal) 
 
 Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a distribuição 
normal. Entretanto, podem ocorrer algumas distorções porque essa distribuição leva ao raciocínio de que todos os 
fenômenos se comportam segundo esse modelo, o que não é verdade, porém, muitas das variáveis correspondem à 
distribuição normal ou dela se aproximam. 
 Também conhecida como distribuição de Gauss-deMoivre-Laplace, possui como parâmetros a média e o 
desvio padrão. 
É uma distribuição simétrica em torno da média e a média, a mediana e a moda são iguais. Uma variação na 
média causa uma mudança na localização da distribuição. Quando a média aumenta, o gráfico de distribuição 
desloca-se para direita e, quando diminui, desloca-se para esquerda, sem alterar sua forma. Se a variância ou o 
desvio padrão aumenta ou diminui, a distribuição torna-se mais plana ou mais pontiaguda em torno da média. 
 
 O aspecto gráfico de uma distribuição normal vem a seguir: 
 
 
 
 
 
 
 
x
 
 
Para uma perfeita compreensão da distribuição normal, observe o gráfico e procure visualizar as seguintes 
propriedades: 
 
1. A variável aleatória X pode assumir todo e qualquer valor. 
2. A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média, que 
recebe o nome de curva normal. 
3. A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde a 
probabilidade de uma variável aleatória X assumir qualquer valor real. 
4. A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das 
abscissas sem, no entanto, tocá-lo. 
5. Como a curva é simétrica em torno de 
x
, a probabilidade de ocorrer valor maior do que a média é igual a 
probabilidade de ocorrer valor menor que a média, isto é, ambas as probabilidades são iguais a 0,5. P(X > 
x
) = 
P(X < 
x
) 
 
 Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal interesse é obter a 
probabilidade dessa variável aleatória assumir um valor num determinado intervalo. 
Se X é uma variável aleatória com distribuição normal de média 
x
 e desvio padrão s, então a variável 
z
x x
s

 tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e desvio padrão 1. 
 O valor de z, ou valor padronizado, como também é conhecido, representa o número de desvios padrão que 
um valor X dista da média considerada. Pode ser positivo, zero ou negativo: se positivo, o valor original está à direita 
da média; se zero, o valor é igual à média e, se negativo, está à esquerda da média. 
 As probabilidades associadas à distribuição normal padronizada são encontradas em tabelas, não havendo 
necessidade de serem calculadas. É uma tabela de distribuição normal reduzida, que nos dá a probabilidade de Z, 
entre a média 0 e um dado valor z, isto é: 
 P(0 < Z < z) 
 
 
 
41 
Temos, então, que se X é uma variável aleatória com distribuição normal de média 
x
 e desvio padrão s, 
podemos escrever: P(
x
 < X < x) = P(0 < Z < z), com 
z
x x
s

 . 
 
Exemplo: Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa máquina. 
Sabe-se que essa variável tem distribuição normal com 
x
= 2 cm e s = 0,04 cm. Calcule a probabilidade de um 
parafuso ter um diâmetro com valor entre 2 e 2,05 cm. 
 
É fácil notar que essa probabilidade indicada por P(2 < X < 2,05), corresponde à área hachurada do gráfico a 
seguir: 
 
 
 
 
 
 
 2 2,05 
 
Como queremos calcular P(2 < X < 2,05), para obter essa probabilidade, precisamos, em primeiro lugar, 
calcular o valor de z que corresponde a x = 2,05 (x = 2  z = 0, pois 
x
 = 2). 
 
Temos, então: 
z
x x
s




 
2 05 2
0 04
0 05
0 04
1 25
,
,
,
,
, ,
 onde: P(2 < X < 2,05) = P(0 < Z < 1,25) 
 
 Procurando o valor de z = 1,25 na tabela, temos que: P(0 < Z < 1,25) = 0,3944. 
 
 Assim, a probabilidade é de 0,3944, ou seja 39,44%. 
 
 
EXERCÍCIOS 
 
28 – Utilizando os dados do exemplo acima, determine as seguintes probabilidades: 
 
a) P(1,93 < X < 2,05) b) P(2,02 < X < 2,05) 
 
c) P(1,93 < X < 1,97) 
d) P(X > 2,02) e) P(X > 1,97) 
 
 
 
29 – Os salários semanais dos operários industriais são distribuídos normalmente, em torno da média de R$ 500,00, 
com desvio padrão de R$ 40,00. Calcule a probabilidade de um operário ter um salário semanal situado entre R$ 
490,00 e R$ 520,00. 
 
 
 
30 – Considerando que as estatísticas

Continue navegando