[Apostila] Estatística Aplicada a Engenharia I

•
UFRN

Estudante PD
10/09/2013
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 110 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 110 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 110 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Prévia do material em texto
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE CIÊNCIAS EXATAS E DA TERRA
DEPARTAMENTO DE ESTATÍSTICA
 
Estatística Aplicada 
a Engenharia I
 Prof. Msc. André Luiz Sena da Rocha
 andrerochaest@yahoo.com.br
 
 
 
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE CIÊNCIAS EXATAS E DA TERRA
DEPARTAMENTO DE ESTATÍSTICA 
 
 
 
 
Estatística Aplicada 
a Engenharia I 
 
 
 
 
 
Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
 
Natal / RN 
 
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE 
CENTRO DE CIÊNCIAS EXATAS E DA TERRA 
 
Estatística Aplicada 
ÍNDICE 
 
UNIDADE I - ESTATÍSTICA DESCRITIVA ......................................................... 1 
1.1 - NATUREZA E CAMPO DA ESTATÍSTICA ................................................................................................................. 1 
1.2 - O MÉTODO ESTATÍSTICO ..................................................................................................................................... 1 
1.3 - POPULAÇÃO, AMOSTRA E TIPOS DE VARIÁVEIS .................................................................................................. 2 
1.4 - REPRESENTAÇÃO TABULAR .................................................................................................................................. 7 
1.4.1 - Distribuição de Frequências ........................................................................................................................... 8 
1.5 - REPRESENTAÇÃO GRÁFICA ....................................................................................................................... 16 
1.5.1 - Gráfico de Setores ........................................................................................................................................ 16 
1.5.2 - Gráfico de Colunas e Barras ........................................................................................................................ 17 
1.5.3 - Histograma e Polígono de Frequências ........................................................................................................ 18 
1.6 – MEDIDAS DE TENDÊNCIA CENTRAL................................................................................................................... 20 
1.6.1 - Média Aritmética ......................................................................................................................................... 21 
1.6.2 – Mediana ....................................................................................................................................................... 23 
1.6.3 - Moda ............................................................................................................................................................ 27 
1.6.4 – Separatrizes ................................................................................................................................................. 30 
1.7 - MEDIDAS DE DISPERSÃO .................................................................................................................................... 32 
1.7.1 – Variância ..................................................................................................................................................... 34 
1.7.2 - Desvio Padrão .............................................................................................................................................. 36 
1.7.3 - Coeficiente de Variação ............................................................................................................................... 38 
1.8 - ANÁLISE EXPLORATÓRIA DE DADOS .................................................................................................................. 39 
1.8.1 - Esquema dos 5-Números ............................................................................................................................. 39 
1.8.2 - Box-Plot ....................................................................................................................................................... 40 
 
UNIDADE II - PROBABILIDADE ......................................................................... 43 
2.1 - EXPERIMENTOS ALEATÓRIOS ............................................................................................................................. 43 
2.2 - ESPAÇO AMOSTRAL ............................................................................................................................................ 44 
2.3 - EVENTOS .............................................................................................................................................................. 44 
2.4 - RESULTADOS EQUIPROVÁVEIS ........................................................................................................................... 47 
2.5 – DEFINIÇÕES DE PROBABILIDADE ....................................................................................................................... 48 
2.6 - PROBABILIDADE CONDICIONAL ......................................................................................................................... 50 
2.7 - EVENTOS INDEPENDENTES .................................................................................................................................. 53 
2.8 – VARIÁVEL ALEATÓRIA UNIDIMENSIONAL ........................................................................................................ 54 
2.9 - MODELOS DE PROBABILIDADE DISCRETOS ....................................................................................................... 55 
2.9.1 - Distribuição de Bernoulli ............................................................................................................................. 55 
2.9.2 - Distribuição Binomial .................................................................................................................................. 57 
2.9.3 - Distribuição de Poisson ................................................................................................................................ 61 
 
 
 
 
2.10 - PRINCIPAIS DISTRIBUIÇÕES CONTÍNUAS ......................................................................................................... 63 
2.10.1 - Distribuição Uniforme ............................................................................................................................... 63 
2.10.2 - Distribuição Exponencial ........................................................................................................................... 64 
2.10.3 – Distribuição Normal .................................................................................................................................. 64 
2.10.4 - Distribuição t de Student ............................................................................................................................ 73 
 
UNIDADE III - INFERÊNCIA ESTATÍSTICA .................................................... 76 
4.1 - DISTRIBUIÇÃO AMOSTRAL DA MÉDIA E DA PROPORÇÃO .................................................................................. 78 
4.1.1 – Distribuição Amostral da Média ................................................................................................................. 78 
4.1.2 – Distribuição Amostral da Proporção ........................................................................................................... 79 
4.2 - ESTIMAÇÃO POR PONTO E INTERVALO ............................................................................................................... 80 
4.2.1 - Estimação Pontual ........................................................................................................................................ 80 
4.2.2 - Estimação Intervalar ....................................................................................................................................80 
4.2.2.1- Intervalo de confiança para a média ........................................................................................................................ 82 
4.2.2.2 - Intervalo de confiança para a proporção ................................................................................................................ 86 
4.3 - TESTES DE HIPÓTESES ........................................................................................................................................ 87 
4.3.1 - Teste para a Média quando σ2 é conhecido .................................................................................................. 90 
4.3.2 - Teste para a Média quando σ2 é desconhecido............................................................................................. 95 
4.3.3 - Teste para Proporções .................................................................................................................................. 99 
4.3.4 - Valor-P ...................................................................................................................................................... 101 
 
REFERÊNCIAS 
 
ANEXOS 
ANEXO A - DISTRIBUIÇÃO NORMAL PADRÃO 
TABELA B - DISTRIBUIÇÃO T DE STUDENT 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
1
UNIDADE I 
 ESTATÍSTICA DESCRITIVA 
 
 
1.1 - Natureza e Campo da Estatística 
 
Estatística é a ciência que diz respeito à coleta, apresentação e análise de dados quantitativos, de tal 
forma que seja possível efetuar julgamentos sobre os mesmos. 
Ramos da Estatística: 
a) Estatística descritiva → trata da observação de fenômenos de mesma natureza, da coleta de 
dados numéricos referentes a esses fenômenos, da sua organização e classificação através de 
tabelas e gráficos, bem como da análise e interpretação. 
b) Probabilidade estatística → utilizada para analisar situações que envolvem o acaso 
(aleatoriedade). 
c) Inferência estatística → estuda as características de uma população com base em dados 
obtidos de amostras. 
 
OBS: Estatística Indutiva pode ser denominada como inferência. Portanto, a estatística indutiva 
estuda as características de uma população, com base em dados obtidos de amostras. 
 
Inferência = Indução + Margem de Erro 
 
1.2 - O Método Estatístico 
A realização de uma pesquisa deve passar, necessariamente pelas fases apresentadas abaixo: 
 
 
 
 
 
 
 
Coletas 
dos 
Dados 
Definição 
do 
problema 
Planejamento 
Crítica 
dos 
Dados
Apresentação 
dos dados 
Tabelas e Gráficos 
Análise e interpretação 
dos dados 
→→→→ →→→→ →→→→ 
→→→→ →→→→ 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
2
1) Definição do problema →→→→ Saber exatamente o que se pretende pesquisar, ou seja, definir 
corretamente o problema. 
2) Planejamento →→→→ determinar o procedimento necessário para resolver o problema, como 
levantar informações sobre o assunto objeto do estudo. É importante a escolha das perguntas em 
um questionário, que na medida do possível, devem ser fechadas. 
� O levantamento de dados pode ser de dois tipos: Censitário e Amostragem. 
� Outros elementos do planejamento de uma pesquisa são: 
• Cronograma das atividades; 
• Custos envolvidos; 
• Exame das informações disponíveis; 
• Delineamento da amostra. 
 
3) Coleta de Dados →→→→ consiste na busca ou compilação dos dados. Pode ser classificado, 
quanto ao tempo em: 
• Contínua (inflação, desemprego, etc); 
• Periódica (Censo); 
• Ocasional (pesquisa de mercado, eleitoral) 
 
4) Crítica dos dados →→→→ objetiva a eliminação de erros capazes de provocar futuros enganos. 
Faz-se uma revisão crítica dos dados suprimindo os valores estranhos ao levantamento. 
 
5) Apresentação dos dados →→→→ a organização dos dados denomina-se “Série Estatística”. Sua 
apresentação pode ocorrer por meio de tabelas e gráficos. 
6) Análise e Interpretação dos Dados →→→→ consiste em tirar conclusões que auxiliem o 
pesquisador a resolver seu problema, descrevendo o fenômeno através do cálculo de medidas 
estatísticas, especialmente as de posição e as de dispersão. 
 
1.3 - População, Amostra e Tipos de Variáveis 
 
Inferência Obtenção de resultados para uma população com base em observações 
Estatística extraídas a partir de uma amostra retirada desta população. 
 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
3
POPULAÇÃO: 
 É o conjunto de elementos (na totalidade) que têm, em comum, uma determinada 
característica. Pode ser finita, como o conjunto de alunos de uma determinada escola, ou infinita, 
como o número de vezes que se pode jogar um dado. 
 
AMOSTRA: 
 É qualquer subconjunto da população. A técnica de seleção desse subconjunto de elementos 
é chamada de Amostragem. 
 
Como já vimos, a inferência estatística tem como objetivo a estimação de parâmetros para uma 
população tendo como base às informações extraídas através de uma amostra. Neste contexto, o 
estudo dos mais diversos tipos de procedimentos de amostragem se faz necessário. 
 
Exercício 1.1: Dentre os 3000 alunos de uma escola, selecionaram-se 30 e inquiriram-se sobre o 
programa de televisão preferido. Sendo respondidos como programas preferidos “Telejornal”, 
“Novelas” e “Cinema”, com 10, 12 e 8 alunos, respectivamente. Responda: 
a) a população; 
b) a amostra. 
 
Exercício 1.2: Para saber a aceitação de uma nova ração canina para filhotes de médio porte, uma 
empresa selecionou 200 filhotes com até 6 meses de idade de diversas raças de médio portem, e 
contabilizou a engorda deles. 
 Indique: 
a) a população; 
b) a amostra; 
 
Exercício 1.3: Para realizar um estudo sobre o tempo gasto, em segundos, por 100 atletas na corrida 
dos 100 metros com obstáculos, registrou-se o tempo gasto por 16 desses atletas e obtiveram-se os 
seguintes resultados: 
Indique: 
a) a população; 
b) a amostra; 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
4
Exercício 1.4: Um aluno da UFMG do curso de “Cinema de Animação e Artes Digitais ” realizou 
um sorteio dentre todas as fitas de VHS da biblioteca de sua Universidade, de 8 fitas para seu 
Trabalho de Conclusão de Curso. 
a) a população; 
b) a amostra; 
 
Exercício 1.5: Um aluno de Biblioteconomia da UFRN está fazendo um levantamento de todas as 
Dissertações do curso de História, Geografia e Pedagogia, defendidas a partir do ano de 2000 e que 
estão cadastradas no banco de dados da Biblioteca Zila Mamede. Dentre elas eles selecionou 10 de 
cada curso e contabilizou as datas de defesa.. 
a) a população; 
b) a amostra; 
 
As técnicas de amostragem podem ser classificadas em dois grandes grupos: a amostragem 
probabilística e a amostragem não probabilística. 
 
1. Amostragem Probabilística: neste grupo encontram-se os planos amostrais que utilizam 
mecanismos aleatórios de seleção dos elementos da amostra, atribuindo a cada um deles 
uma probabilidade, conhecida à priori, de pertencer à amostra. 
2. Amostragem Não Probabilística: neste grupo encontram-se os planos amostrais que não 
utilizam mecanismos aleatórios de seleção dos elementos da amostra, e dessa forma, não 
existe nenhuma probabilidade associada à seleção desses elementos. 
 
Ambos os procedimentos têm vantagens e desvantagens. A grande vantagem das amostras 
probabilísticas é medir a precisão da amostra obtida. Tais medidas já são bem mais difíceis para os 
procedimentos do outro grupo. Diante disso, amostras probabilísticas são comumente utilizadas na 
prática. Os tipos de planos de amostragem probabilísticos são os seguintes: 
 
• Amostragem Aleatória Simples: cada elementoda população tem a mesma chance (ou 
probabilidade) de ser selecionado. Os elementos são escolhidos através de sorteio. Para isso, 
tabelas de números aleatórios são frequentemente utilizadas. Por exemplo, selecionar 5 
alunos de uma turma usando a lista de chamada. 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
5
• Amostragem Estratificada: a população é dividida em estratos (ou grupos) homogêneos, 
sendo selecionada uma amostra aleatória simples de cada estrato. Por exemplo, selecionar 
alunos de 5ª a 8ª série de uma determinada escola. Neste caso, cada série corresponde a um 
estrato, e de cada estrato uma amostra aleatória simples dos alunos é extraída, lembrando 
que pra tanto seria necessário sorteio a partir da lista de chamada também. 
 
• Amostragem Sistemática: os elementos são selecionados segundo uma regra pré-definida. 
É bastante utilizada quando os elementos da população estão arranjados em uma ordem. Por 
exemplo, se em uma concessionária deseja-se estimar o preço total dos seus carros a partir 
de uma amostra de 10 carros selecionar possuindo para tanto uma lista dos carros em ordem 
de preço do maior para o menor, ou do menor para o maior. Uma observação importante é 
que, por exemplo, se os elementos escolhidos estiverem em ordem não se deve pegar os 
primeiros elementos, ou os últimos, ou os do meios, deve-se percorrer elementos de cada 
parte. 
 
Exercício 1.6: Para cada uma das seguintes situações diga qual o tipo de amostragem foi utilizada. 
− O conselho universitário de uma universidade deseja conhecer a opinião dos alunos e 
professores sobre uma resolução a ser votada, que estabelece horários fixos para o 
atendimento de alunos pelos professores. Para compor a amostra foram sorteados 
aleatoriamente 10% dos alunos matriculados e 10% dos professores. 
 
− Um treinador de uma confederação esportiva deseja dividir 20 times em dois grupos. Para o 
primeiro grupo seleciona aleatoriamente 10 times, e considera os 10 restantes para o segundo 
grupo. 
 
− Uma lista de corredores de uma maratona contém 1000 nomes, numerados consecutivamente 
de 1 a 1000. Iniciando-se do 5º nome, uma amostra foi composta considerando sorteados os 
nomes referentes aos números 15º, 25º, 35º, 45º, 55º e assim sucessivamente até que fossem 
escolhidos 100 nomes. 
 
− Um sociólogo na Universidade de Charleston seleciona 12 homens e 12 mulheres de cada 
uma de quatro turmas de educação física. 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
6
− Um treinador sorteia 6 jogadores de seu time de futebol sem mais critério s de seleção e tira 
uma amostra de urina de cada um. 
− O programa Planned Parenthood (Planejamento Familiar) pesquisa 500 homens e 5000 
mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais. 
 
TIPOS DE VARIÁVEIS: 
 
É condição inerente a uma população natural existir variação quanto aos atributos que lhe podem 
ser estudados. Portanto, a variabilidade é uma característica comum aos dados de observação e 
experimentos. Um atributo sujeito à variação é descrito em Estatística por uma variável. 
 
 Nominal 
 Qualitativa 
 Ordinal 
Variável 
 Discreta 
 Quantitativa 
 Contínua 
 
Variável Qualitativa: os dados podem ser distribuídos em categorias mutuamente exclusivas. Por 
exemplo, sexo (masculino, feminino), cor, causa de morte, grupo sanguíneo, etc. 
- Nominal: as categorias podem ser permutáveis (não existe ordem natural dos seus níveis); 
Exemplo: [masculino, feminino], [sim, não], [fuma, não fuma]; 
 
- Ordinal: as categorias descrevem uma ordenação natural dos seus níveis. 
Exemplo: [péssimo, ruim, regular, bom, ótimo]. 
 
Variável Quantitativa: os dados são expressos através de números. Por exemplo, idade, estatura, 
peso, etc. 
- Discreta: Assumem valores que podem ser associados aos números naturais ( 1, 2,3,...=� ). 
Dá uma ideia de contagem. 
Exemplo: Número de irmãos dos 30 alunos da turma de Engenharia 
 [0, 1, 2, 5, 3, 4, 1, 0, 2, 3, 5, 4, 0, 1, 2, 2, 1, 0, 1, 1, 2, 0, 0, 3, 2 , 3, 4, 2, 1, 2]. 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
7
- Contínua: Assume infinitos valores em um dado intervalo. Dá uma ideia de medição. 
Exemplo: altura e/ou peso de animais ou de pessoas. 
[1.70, 1.57, 1.80, 1.94, 1.68, 1.71] 
 
Exercício 1. 7: Classifique com relação ao tipo de variável as seguintes informações: 
• Sexo (“Masculino” ou “Feminino”); 
• Tempo de uso de um HD de 1 TB (em meses completos); 
• Tempo em horas para término de uma simulação num software; 
• Altura de jogadores de vôlei de certo time (em metros); 
• Fuma (“Sim” ou “Não”); 
• Peso de vigas de concreto (em quilogramas); 
• Número de filhotes de uma ninhada; 
• Tolerância ao cigarro (indiferente, incomoda pouco, incomoda muito); 
• Horas que gasta estudando. 
• Resultado final de uma disciplina da UFRN (“Aprovado” ou “Reprovado”) 
 
1.4 - Representação Tabular 
 
Consiste em dispor os dados em linhas e colunas, distribuídas de modo ordenado, segundo algumas 
regras práticas e obedecendo (ainda) à Resolução nº 886/66, de 26 de outubro de 1966, do Conselho 
Nacional de Estatística. As tabelas devem conter: 
 
a) Título - O quê? (fenômeno). Onde? (época). Quando? (local). 
b) Cabeçalho - indica o conteúdo das colunas 
c) Coluna Indicadora - especifica o conteúdo das linhas 
d) Cabeçalho da coluna indicadora - indica o conteúdo da coluna indicadora 
e) Corpo - caselas ou células, onde são registrados os dados. 
f) Rodapé - notas e identificação da fonte de onde foram coletados os dados. 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
8
 
 
1.4.1 - Distribuição de Frequências 
 
Tabelas com grandes números de dados são cansativas e não dão uma visão rápida e geral do 
fenômeno. Dessa forma, é necessário que os dados sejam organizados em uma tabela de 
distribuição de frequências. Estas podem ser simples (dados não-agrupados) ou por classes (dados 
agrupados). 
 
DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES: 
Série estatística para dados nominais, ordinais e discretos, organizados em uma tabela. 
 
Construção de uma Distribuição de Frequências: 
Para a construção de uma distribuição de frequências os seguintes componentes são necessários: 
� Dados Brutos: são os dados apresentados desordenadamente, da forma como foram coletados. 
Exemplo 1.1: Peso (kg) de 14 blocos de concreto (dados brutos): 
74 58 69 80 74 95 56 74 76 81 60 57 64 62 
� Rol: são os dados apresentados em ordem crescente. 
Exemplo 1.1: Peso (kg) de 14 blocos de concreto (em forma de rol): 
56 57 58 60 62 64 69 74 74 74 76 80 81 95 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
9
Construção de uma Distribuição de frequências simples 
1. Ordenar os dados brutos em forma de rol (ordem crescente) 
2. Listar todos os elementos diferentes, numa coluna de nome “X”. 
3. Listar a frequência de todos os elementos diferentes numa coluna de nome "fi" ou "frequência". 
4. Somar todos os elementos da coluna "fi" (total). 
 
Exemplo 1.2: Numa pesquisa feita para detectar o número de filhos de empregados de uma 
multinacional, foram encontrados os seguintes valores: 
1 4 2 5 3 2 0 3 2 1 5 4 2 5 0 
3 2 4 2 3 2 3 2 1 4 2 1 3 4 2 
 
Solução: 
� Rol (dados em ordem crescente): 
0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 
2 3 3 3 3 3 3 4 4 4 4 45 5 5 
 
� Tabela de Distribuição de Frequências: 
 
Número de filhos por empregado de uma multinacional 
Número de filhos (X) fi f i% 
0 2 6,7 
1 4 13,3 
2 10 33,3 
3 6 20 
4 5 16,7 
5 3 10 
Total 30 100 
Fonte: Dados Fictícios 
 
Algumas considerações ou conclusões: 
Qual o número de funcionários que não tem filhos? Qual o seu percentual? 
Quantos funcionários têm cinco filhos e qual o seu percentual? 
A maioria dos funcionários tem quantos filhos? E a minoria? Informe o percentual de ambos. 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
10 
INFORMAÇÕES ADICIONAIS NUMA DISTRIBUIÇÃO DE FREQUÊNCIAS 
Além das informações contidas na tabela, destaca-se outros parâmetros relevantes: 
- LI = limite inferior de cada classe; 
- LS = limite superior de cada classe; 
- Pm = ponto médio de cada classe � x = (Li + Ls) / 2; 
- fi = frequência absoluta = número de ocorrências de cada classe; 
- fi % = frequência percentual � fi % = (fi / n) 100; 
- ↓F = frequência absoluta acumulada "abaixo de"; 
- ↑F = frequência absoluta acumulada "acima de"; 
- ↓F% = frequência percentual acumulada "abaixo de"; 
- ↑F% = frequência percentual acumulada "acima de"; 
 
Exemplo 1.3: Veremos como fica a distribuição de frequências simples com essas informações 
adicionais: 
Número de filhos de empregados de uma multinacional 
Nº de filhos fi f % F↓ F↑ F↓% F↑% 
0 2 6,7 2 30 6,7 100 
1 4 13,3 6 28 20 93,3 
2 10 33,3 16 24 53,3 80 
3 6 20 22 14 73,3 46,7 
4 5 16,7 27 8 90 26,7 
5 3 10 30 3 100 10 
Total 30 100 - - - - 
Fonte: Dados fictícios 
Responda: 
a) Quantos empregados têm até 2 filhos? 
Resp: Se dá por F↓, sendo igual a 16 filhos. 
b) Quantos empregados têm ao menos 4 filhos? 
Resp: Se dá por F↑, sendo igual a 8 filhos. 
c) Qual o percentual de empregados com no máximo 1 filho? 
Resp: Se dá por F%↓, sendo igual a 93,3%. 
d) Qual o percentual de empregados com no mínimo 2 filhos? 
Resp: Se dá por F↑%, sendo igual a 80%. 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
11 
DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES: 
Série estatística para dados contínuos. Os números são agrupados em classes, com suas respectivas 
frequências absolutas, relativas e percentuais, com o objetivo de facilitar ao analista o seu estudo. 
 
Os seguintes componentes são utilizados apenas em distribuição de frequências em classes: 
� Amplitude Total (A): é a diferença entre o maior valor do rol (LS) e o menor valor (LI). 
 
A = LS - LI 
 
� Número de Classes (c): corresponde à quantidade de classes, nas quais serão agrupados os 
elementos do rol. Para determinar c, utiliza-se a fórmula de Sturges: 
 
C = 1 + (3,33333.....) · log(n) 
 em que n = número de elementos do rol. 
� Amplitude ou Intervalo de Classe (i): geralmente utilizam-se intervalos iguais, obtidos através 
da fórmula: 
i = A/C 
 
Construção de uma Distribuição de frequências por classes 
a) Ordenar os dados brutos em forma de rol (ordem crescente) 
b) Calcular a amplitude total: A = LS - LI 
c) Calcular o número de classes e arredondar o valor final para um número inteiro utilizando a 
regra e arredondamento: 
C = 1 + (3,33333.....) • log(n) 
d) Calcular o intervalo entre classes: i = A / C. 
e) A 1º coluna será a das classes. O menor número dos dados em rol será o limite inferior da 
primeira classe (“LI” da fórmula utilizada na amplitude total “A”), a partir do qual todas as 
outras classes serão definidas a partir deste número, somando ele ao intervalo entre classes. 
Exemplo: Para C = 5, i = 1,5 e LI = 7,4 (menor número dos dados em forma de rol). 
O limite inferior da 1º classe será 7,4 e o limite superior da mesma classe será 
LI + i = 7,4 + 1,5 = 8,9. 
Por sua vez, o limite inferior da 2º classe será 8,9 e o superior: 8,9 + i = 8,9 + 1,5 = 10,4. 
Este procedimento será realizado até termos o número “C” de classes (este previamente 
calculado). 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
12 
f) Para indicar o intervalo, utilizaremos o símbolo |- . Por exemplo, no caso de haver o limite 
inferior 7,4 e o limite superior 8,9. Indicaremos este intervalo como : 7,4 |- 8,9. 
Isso significa todos os números que estão entre 7,4 e o mais próximo possível de 8,9, porém, 
caso haja um número igual ao limite superior dessa classe, este deverá ser computado apenas 
na próxima classe (para o Exemplo do número 5, na 2º classe, sendo esta: 8,9 |- 10,4). 
g) Uma vez definidas as classes, a tabela de frequências pode ser construída, a partir da 2º coluna 
de nome “frequência” ou simplesmente “fi”, fazendo-se o processo de contagem, que consiste 
em verificar a qual classe cada dado pertence. 
 
OBS: Em algumas situações, pode-se utilizar uma distribuição de frequências por classes para 
dados discretos quando todos os números ou a maioria são diferentes. 
 
Exemplo 1.4: Construir uma distribuição de frequências para o número diário de experimentos 
realizados em um laboratório durante duas semanas. [0, 2, 3 ,4 , 5, 10, 12, 7, 9, 0, 5, 13, 17, 10, 6]. 
Para essa situação, a mais viável será uma distribuição por classes, que deverá seguir o mesmo 
procedimento, apenas com o cuidado ao calcular o intervalo entre classes (i), o mesmo deverá ser 
arredondado para um número inteiro. 
 
Exemplo 1.5: Construa de uma Distribuição de Frequências com CLASSES para os dados 
referentes ao Peso (kg) de 14 blocos de concreto: 
 
56 57 58 60 62 64 69 74 74 74 76 80 81 95 
 
 
Solução: 
Amplitude Total (A): A = LS – LI = 95 – 56 = 39. 
 
Número de Classes (C): C = 1 + (3,33333.....) · log(n) = 1 + 3,333 · log (14) = 4,82 ≈ 5. 
 
Intervalo de Classe (i): A=39 e C=5 � i = A/C = 39/5 = 7,8. 
 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
13 
Peso de blocos de concreto 
Peso (kg) fi fi% 
56,0 |- 63,8 5 35,71% 
63,8 |- 71,6 2 14,28% 
71,6 |- 79,4 4 28,58% 
79,4 |- 87,2 2 14,28% 
87,2 |-| 95 1 7,14% 
Total 14 100% 
Fonte: Dados Fictícios 
 
Exemplo 1.6: Um determinado hospital está interessado em analisar a quantidade de creatinina (em 
miligramas por 100 mililitros) encontrada na urina (de 24 horas) de seus pacientes internados com 
problemas renais. Os dados são os seguintes: 
 
1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,56 1,83 
1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,50 1,46 
1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,59 1,49 
1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,37 1,40 
1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66 1,71 1,44 
1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75 1,57 1,83 
1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,86 2,02 
 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
14 
Solução: 
� Rol (dados em ordem crescente): 
1,08 1,15 1,22 1,22 1,23 1,26 1,31 1,33 1,33 1,36 1,37 1,38 
1,40 1,40 1,40 1,43 1,43 1,43 1,44 1,46 1,46 1,46 1,47 1,47 
1,47 1,47 1,49 1,49 1,50 1,51 1,51 1,52 1,52 1,52 1,53 1,54 
1,54 1,55 1,56 1,56 1,57 1,57 1,58 1,58 1,58 1,59 1,59 1,60 
1,60 1,61 1,62 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,68 1,68 
1,69 1,69 1,71 1,72 1,73 1,73 1,75 1,76 1,80 1,81 1,86 1,86 
1,86 1,86 1,86 1,86 1,89 1,90 1,96 2,00 2,02 2,18 2,29 2,34 
 
� Amplitude Total (dá uma ideia do campo de variação dos dados): 
A = LS - LI = (2,34) - (1,08) = 1,26 
Analisando-se a quantidade de creatinina encontrada na urina dos 84 pacientes verificou-se que, 
ocorreu a variação de 1,26 no seu campo (de 1,08 a 2,34). 
 
� Estabelecer o Número de Classes (c): 
c = 1 + (3,3333.....) · log(n) = 1 + (3,3333....) · log(84) = 7,414 ���� c= 7 
 
� Estabelecer o Intervalo de Classe (i): 
 
i = A / c = (1,26) / 7 = 0,18 
Quantidade de creatinina (ml) encontrada na urina de 84 pacientes com problemas renais. 
Classes fi f % Pm (X) ↓%f ↑%f ↓F ↑F 
1,08 ├ 1,26 5 5,9 1,17 5,9 100 5 84 
1,26 ├ 1,44 13 15,5 1,35 21,4 94,1 18 79 
1,44 ├ 1,62 32 38,1 1,53 59,5 78,6 50 66 
1,62 ├ 1,80 18 21,4 1,71 80,9 40,5 68 34 
1,80 ├ 1,98 11 13,1 1,89 94,0 19,1 79 16 
1,98 ├ 2,16 2 2,4 2,07 96,4 6,0 81 5 
2,16 2,34 3 3,6 2,25 100 3,6 84 3 
Total 84 100 - - - - - 
Fonte: Dados fictícios 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
15 
Observação 1: O melhor valor para representar cada classe é o ponto médio (Pm), o qual se obtém 
pela fórmula: 
Pm = Li + (i / 2), ou ainda, Pm = (Li + Ls) / 2 
 
Observação 2: 1,08 |- 1,26, intervalo fechado à esquerda (pertencem a classe valores iguais ao 
extremo inferior) e aberto à direita (não pertencem a classe valores iguais ao extremo superior). De 
forma análoga, 2,16 |-| 2,34, intervalo fechado à esquerda e à direita. 
 
Responda: 
a) Quantos pacientes têm até 1,79 ml de creatinina? 
Resp: Se dá por F↓, sendo igual a 68 pacientes. 
b) Quantos pacientes têm ao menos 1,98 ml de creatinina? 
Resp: Se dá por F↑, sendo igual a 5 pacientes. 
c) Qual o percentual de pacientes com no máximo 1,61 ml de creatinina? 
Resp: Se dá por F%↓, sendo igual a 59,5%. (mais da metade). 
d) Qual o percentual de pacientes com no mínimo 1,98 ml de creatinina? 
Resp: Se dá por F↑%, sendo igual a 6%. 
 
Exercício 1.8: Na fabricação de semicondutores, o ataque químico por via úmida é frequentemente 
usado para remover silicone da parte posterior das pastilhas antes da metalização. A taxa de ataque 
é uma característica importante no processo. Um tipo de solução pra ataque químico foi estudada, 
usando uma amostra de 50 pastilhas. As taxas observadas de ataque (10-3 mils/min) são dadas a 
seguir: 
 
2,1 4,2 2,7 28,2 9,9 9 2 6,6 3,9 1,6 14,7 9,6 16,1 8,1 8,2 20,2 6,9 
4,3 3,3 1,2 4,1 18,4 0,2 6,1 13,5 7,4 0,2 8,3 0,3 1,3 14,1 1,0 2,4 2,4 
16,2 8,7 24,1 1,4 8,2 5,8 1,6 3,5 12,2 18 26,7 3,7 12,3 23,1 5,6 0,4 
 
 
 
EST0323– Estatística Aplicada a Engenharia I 
 
1.5 - REPRESENTAÇÃO GRÁFICA
 
Todo o gráfico deve apresentar título (pode ser colocado tanto acima como abaixo) e escala 
(crescem da esquerda para a direita e de baixo para cima). As legendas devem ser
direita ou abaixo do gráfico. A seguir vemos os principais tipos de gráficos:
 
1.5.1 - Gráfico de Setores 
 
Também conhecido como Gráfico de Pizza, este grá
parte de um todo. É, então, usado um círculo de raio qualquer, com a área ou ângulo total sendo 
proporcional ao total (100%) da série de dados a representar e a ár
circular sendo proporcional a cada dado da série.
 
Exemplo 1.7: Exemplo de um gráfico de setores
 
Tabela 1.1: Principais rações caninas vendidas numa certa cidade em 2010
Marca da Ração
 
Figura 1.1: Principais rações caninas vendidas numa certa cidade em 2010
Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
REPRESENTAÇÃO GRÁFICA 
Todo o gráfico deve apresentar título (pode ser colocado tanto acima como abaixo) e escala 
(crescem da esquerda para a direita e de baixo para cima). As legendas devem ser
direita ou abaixo do gráfico. A seguir vemos os principais tipos de gráficos: 
Também conhecido como Gráfico de Pizza, este gráfico é usado quando cada valor representa uma 
parte de um todo. É, então, usado um círculo de raio qualquer, com a área ou ângulo total sendo 
proporcional ao total (100%) da série de dados a representar e a área ou ângulo de cada setor 
circular sendo proporcional a cada dado da série. 
Exemplo de um gráfico de setores 
: Principais rações caninas vendidas numa certa cidade em 2010
Marca da Ração Percentual (%) 
Caninu’s 18 
Campeão 15 
Foster 24 
Pedigree 43 
Fonte: Dados Fictícios 
: Principais rações caninas vendidas numa certa cidade em 2010
 
16 
Todo o gráfico deve apresentar título (pode ser colocado tanto acima como abaixo) e escala 
(crescem da esquerda para a direita e de baixo para cima). As legendas devem ser colocadas à 
fico é usado quando cada valor representa uma 
parte de um todo. É, então, usado um círculo de raio qualquer, com a área ou ângulo total sendo 
ea ou ângulo de cada setor 
: Principais rações caninas vendidas numa certa cidade em 2010 
 
: Principais rações caninas vendidas numa certa cidade em 2010 
EST0323– Estatística Aplicada a Engenharia I 
 
1.5.2 - Gráfico de Colunas e Barras
 
As variações quantitativas da tabela são r
horizontalmente. É usado para representar qualquer tipo de série. 
 
Exemplo 1.8: Exemplo de um Gráfico de Barras
 
Tabela 1.2: Principais causas de morte nos EUA em 2004
Tipo de morte
Acidentes de carro
Álcool 
Armas de fogo
Cigarro 
Doenças Infecciosas
Doenças Venéreas
Drogas 
Obesidade 
Outras 
Total 
Fonte: Ie Estatísticas, 2004. 
 
Figura 1.
 
 
Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
Gráfico de Colunas e Barras 
As variações quantitativas da tabela são representadas por colunas dispostas verticalmente ou 
horizontalmente. É usado para representar qualquer tipo de série. 
Gráfico de Barras 
: Principais causas de morte nos EUA em 2004 
morte Frequência Percentual (%)
Acidentes de carro 856 23,70 
457 12,65 
Armas de fogo 985 27,27 
247 6,84 
Doenças Infecciosas 112 3,10 
Doenças Venéreas 98 2,71 
631 17,47 
124 3,43 
102 2,82 
3612 100 
Figura 1.2: Principais causas de morte nos EUA em 2004 
 
17 
epresentadas por colunas dispostas verticalmente ou 
Percentual (%) 
 
EST0323– Estatística Aplicada a Engenharia I 
 
Exemplo 1.9: Exemplo de um Gráfico de Colunas 
Figura 1.3: Principais rações caninas vendidas numa certa cidade 
 
1.5.3 - Histograma e Polígono de Frequências
 
A apresentação tabular dos dados é feita através de uma distribuição de frequências. Fica 
complementada com uma representação grá
de frequências são tipos de gráficos usados para representar uma distribuiç
de uma variável quantitativa contínua.
 
Exemplo 1.10: Exemplo de um histograma e de um polígono de frequências
 
Tabela 1.3: Distribuição de frequências dos preços de ovos 
 
Preço dos ovos 
 
 47 ├ 68 
 68 ├89 
 89 ├110 
110 ├131 
131 ├152 
Total 
 
Fonte: GUJARATI. Basic Econometrics
 
Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
Gráfico de Colunas 
Principais rações caninas vendidas numa certa cidade em 2010
Histograma e Polígono de Frequências 
A apresentação tabular dos dados é feita através de uma distribuição de frequências. Fica 
complementada com uma representação gráfica desses mesmos dados. O histograma e o polígono 
ficos usados para representar uma distribuição de frequências simples 
de uma variável quantitativa contínua. 
Exemplo de um histograma e de um polígono de frequências 
: Distribuição de frequências dos preços de ovos - EUA - 1990 
f fr F↓ F%
19 38 19 
19 38 38 
9 18 47 
2 4 49 
1 2 50 
50 100 - 
Basic Econometrics. McGraw-Hill, 3a ed. 1995. 
 
18 
 
em 2010 
A apresentação tabular dos dados é feita através de uma distribuição de frequências. Fica 
fica desses mesmos dados. O histograma e o polígono 
de frequências simples 
F%↓ 
38 
76 
94 
98 
100 
- 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
19 
Um histograma é um conjunto de retângulos com bases sobre um eixo horizontal dividido de 
acordo com os comprimentos de classes, centros nos pontos médios das classes e áreas 
proporcionais ou iguais às frequências. 
Um polígonode frequências é um gráfico de linha que se obtém unindo por uma poligonal 
os pontos correspondentes às frequências das diversas classes, centradas nos respectivos pontos 
médios. Para obter as interseções da poligonal com o eixo, cria-se em cada extremo uma classe com 
frequência nula. Note que esses gráficos podem ser construídos com base nas frequências absolutas 
ou relativas. O importante é que a escala nos eixos horizontal e vertical, bem como os retângulos, 
sejam construídos de forma a que suas áreas espelhem a proporcionalidade dessas frequências. 
Na Figura 1.10 apresentamos o histograma para a distribuição de frequências dada na Tabela 
1.17, referente ao preço da dúzia de ovos nos estados americanos em 1990. Aqui cabe uma 
observação sobre o histograma, que foi construído com o software free R; cada retângulo foi 
construído de modo que sua área fosse exatamente igual à frequência relativa. Por exemplo, todos 
os retângulos têm base 21, que é a amplitude de classe. A altura dos dois primeiros retângulos é 
[área/base = 0,38 / 21 = 0,0180952], de modo que a área resultante é 0,38. Para a terceira classe, 
temos que [altura = área/base = 0,18 / 21 = 0,0085714]. 
O ponto fundamental na interpretação de um histograma é compreender que as áreas dos 
retângulos representam as frequências de cada classe. Como a variável é contínua e a frequência 
dada se refere a uma classe de valores, a suposição que se faz é que essa frequência se distribui 
uniformemente pela classe. Na Figura 1.10, a frequência relativa da classe 47 ├ 68 é 0,38 (ou 38%) 
e ela está uniformemente distribuída pela classe, o que significa que subclasses de mesmo 
comprimento teriam a mesma frequência. Por exemplo, as frequências das classes 47├57,5 e 
57,5├68 seriam ambas iguais 0,19. Já a subclasse 89├95 teria uma frequência de 0,0085714 × 
(95−89) = 0,0514286. Mais uma vez, o princípio é que área = frequência. Com relação ao polígono 
de frequências, a ideia é representar o comportamento “típico” de cada classe através do seu ponto 
médio. Assim, o polígono de frequência está representado na Figura 1.11 
 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
20 
HISTOGRAMA 
 
Figura 1.4: Histograma da distribuição de frequência dos preços dos ovos nos estados 
 
POLÍGONO DE FREQUÊNCIAS 
 
Figura 1.5: Polígono de frequência dos preços dos ovos nos estados americanos 
 
 
1.6 – Medidas de Tendência Central 
 
Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica 
do problema. Mas é conveniente apresentar medidas que mostrem a informação de maneira 
resumida. 
 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
21 
Medidas de Tendência Central 
São medidas que tendem para o centro da distribuição e têm a capacidade de representá-la como um 
todo. Dão o valor do ponto em torno do qual os dados se distribuem. As principais são: Média 
Aritmética, Mediana e Moda e algumas. 
 
1.6.1 - Média Aritmética 
 
A média aritmética pode ser definida em dois tipos: populacional (µ ) e amostral ( X ). Nos dois 
casos existem três situações quanto aos cálculos. 
 
1. Dados apresentados em forma de rol: 
A média será: 
rol do elementos de número
rol do elementos os todosde soma
n
x
X
n
i
==
∑
=1i
 
 
Exemplo 1.11: Número de tonadas a serem trocadas em 12 hotéis de Natal (50, 62, 70, 86, 60, 64, 
66, 77, 58, 55, 82, 74) � X =67 
Análise: O número médio de tomadas para serem trocadas é de 67 por hotel. 
 
Exercício 1.9: Um gerente de supermercado quer estudar a movimentação de pessoas em seu 
estabelecimento, constata que 195, 1.002, 941, 768 e 1.283 pessoas entraram no seu 
estabelecimento nos últimos cinco dias. Descubra o número médio de pessoas que entraram 
diariamente neste estabelecimento nos últimos cinco dias. 
 
2. Dados apresentados em forma de distribuição de frequência simples: 
A média será: 
∑
∑
=
=
=
n
1i
i
n
ii
f
fx
X 1i 
Exemplo 1.12: Número de peças com defeitos produzidas em 27 dias em certa fábrica 
X 0 1 2 3 4 Total 
f 2 4 10 6 5 27 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
22 
2,3
27
(4).(5) (3).(6) (2).(10) (1).(4)(0).(2)
f
fx
X
n
1i
i
n
ii
=
++++
==
∑
∑
=
=1i
 
Análise: Verifica-se que o número médio de peças com defeitos é de 2,3 por dia. 
 
 
Exercício 1.10: As informações abaixo apresentam a idade dos usuários de drogas internos numa 
clínica para tratamento. Determine a idade média dos internos. 
 
Idade fi 
17 2 
18 4 
19 5 
20 6 
21 3 
22 4 
23 2 
Total 26 
 
 
3. Dados apresentados em forma de distribuição de frequência em classes: 
 
A média será: 
∑
∑
=
=
=
n
1i
i
n
1i
im
f
fP
X 
 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
23 
Exemplo 1.13: Nascidos vivos segundo o peso ao nascer, em kg. 
Classes fi Pm 
1,5 |- 2,0 3 1,75 
2,0 |- 2,5 16 2,25 
2,5 |- 3,0 31 2,75 
3,0 |- 3,5 34 3,25 
3,5 |- 4,0 11 3,75 
4,0 |- 4,5 4 4,25 
4,5 |-| 5,0 1 4,75 
Total 100 - 
3
100
(4,75).(1) )(2,25).(16(1,75).(3)
f
fP
X
n
1i
i
n
im
=
+++
==
∑
∑
=
=
…1i
 
Análise: Verifica-se que o peso médio dos 100 nascidos vivos observados é 3 kg. 
 
1.6.2 – Mediana 
 
Valor que divide a distribuição em duas partes iguais, em relação à quantidade de elementos. Isto é, 
é o valor que ocupa o centro da distribuição, de onde se conclui que 50% dos elementos ficam 
abaixo dela e 50% ficam acima. 
 
Colocados em ordem crescente, a mediana (Med ou Md) é ou valor que divide a amostra, ou 
população, em duas partes iguais. 
 
 
 
0 Med 100% 
 
a) Variável Discreta: os dados estão dispostos em forma de rol ou em uma distribuição de 
frequência simples. 
 
 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
24 
� Se “n” for ímpar: 
Med = elemento central (de ordem 1
2
n + 
 
 
) 
 
- Exemplo 1.14: Dados em forma de rol: 
Seja a amostra: 8, 10, 12, 14, 16 � Med = 5 1 3
2
+ 
= 
 
�
 elemento do rol = 12 
 Interpretação: o 3º elemento do rol (12) divide 50% da distribuição dos dados à direita 
 e à esquerda. 
- Exemplo 1.15: Dados em uma distribuição de frequência simples: 
 Suponha a seguinte distribuição de frequência simples. 
X fi ↓F 
1 1 1 
2 3 4 
3 5 9 
4 2 11 
Total 11 - 
 n = 11 (ímpar) 
 Elemento mediano: [(n+1)/2]º = 6º elemento 
 3ª classe contém o 6º elemento � Med = 3. 
 
� Se “n” for par: 
Med = média aritmética dos dois elementos centrais (de ordem 
2
n 
 
 
 e 1
2
n 
+ 
 
) 
- Exemplo 1.16: Dados em forma de rol: 
Seja a amostra: 8, 10, 12, 14, 16, 19 
6 3 elemento do rol
2 2
61 1 4 elemento do rol
2 2
n
n
   
= =   
   
   
+ = + =   
   
�
�
 
Med = 3 elemento 4 elemento 12 14 13
2 2
Mediana + += = =
� �
 
Interpretação: a média do 3º e 4º elemento do rol (13) divide 50% da distribuição dos dados à 
 direita e à esquerda. 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
25 
- Exemplo 1.17: Dados em uma distribuição de frequência simples: 
Suponha a seguinte distribuição de frequência simples. 
X fi ↓F 
82 5 5 
85 10 15 
87 15 30 
89 8 38 
90 4 42 
Total 42 - 
Fonte: Dados fictícios 
 
n = 42 (par) 
Elemento mediano: (n/2)º = 21º elemento 
 (n/2)º + 1 = 22º elemento 
 3ª classe contém o 21º e o 22º elemento 
 Med= (87 + 87)/2 = 87 
 
b) Variável Contínua: os dados estão agrupados em uma distribuição de frequências em classes, 
então: 
 
• 1º Passo: Organizar os dados em forma de rol (ordem crescente); 
• 2º Passo: Calcular a ordem (n/2)º. Como a variável é contínua não importa se é par ou ímpar. 
• 3º Passo: Através da ↓F identificar a classe que contém a mediana, isto é, a posição da 
mediana. 
• 4º Passo: Utilizar a fórmula: 
Med
Med
Med
Med .if
FP
LIMed 





 ↓−
+=
−
 
- LIMed = limite inferior da classe que contém a mediana; 
- PMed = posição da mediana = 2f i /∑ = xº elemento; 
- 
-F ↓ = frequência absoluta acumulada "abaixo de" da classe anterior à classe que contém a 
mediana; 
- fMe = frequência absoluta da classe que contém a mediana; 
- iMe = intervalo da classe que contém a mediana; 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
26 
Exemplo 1.18: Temperatura (Cº) para o derretimento de certo material eletrônico. 
Temperatura fi Pm F↓ 
 
150 |- 200 35 175 35 
 
200 |- 250 164 225 199 
 
250 |- 300 31 275 230 
 
300 |- 350 344 325 574 
 
350 |- 400 112 375 686 
 
400|- 450 32 425 718 
 
455 |-| 500 10 475 728 
 
Total 728 - - 
Fonte: Dados fictícios 
 
PMe = (n/2)� (728/2)� 364º elemento � 4ª classe: [300; 350) 
0Med
Med Med
Med
P F 364 - 230Med LI .i 300 .(50) 319,75
f 344
C
− 
− ↓  
= + = + =   
  
 
 
Exercício 1.11: Um determinado hospital está interessado em analisar a quantidade de creatinina 
(em miligramas por 100 mililitros) encontrada na urina (de 24 horas) de seus pacientes internados 
com problemas renais. Calcule a Mediana. 
 
Quantidade de creatinina (ml) encontrada na urina de 84 pacientes com problemas renais. 
Classes fi F↓ 
1,08 |- 1,26 5 5 
1,26 |- 1,44 13 18 
1,44 |- 1,62 32 50 
1,62 |- 1,80 18 68 
1,80 |- 1,98 11 79 
1,98 |- 2,16 2 81 
2,16 |-| 2,34 3 84 
Total 84 - 
Fonte: Dados fictícios 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
27 
1.6.3 - Moda 
 
É o valor que ocorre com maior frequência na série, ou seja, aquele que mais se repete. 
 
Exemplo: Na série 3, 4, 5, 7, 7, 7, 9, 9 � Mo = 7 
 
� SÉRIE UNIMODAL (TEM UMA ÚNICA MODA) 
Exemplo: Na série 3, 5, 6, 6, 6, 7, 8 � Mo = 6 
� SÉRIE BIMODAL (OCORREM DUAS MODAS) 
Exemplo: Na série 2, 5, 5, 5, 6, 7, 9, 9, 9, 10, 10 � Mo1 = 5 e Mo2 = 9 
� SÉRIE TRIMODAL (OCORREM TRÊS MODAS) 
Exemplo: Na série 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9, 9 � Mo1 = 4, Mo2 = 7 e Mo3 = 9 
� SÉRIE POLIMODAL (OCORREM QUATRO OU MAIS MODAS) 
Exemplo: Na série 0, 0, 1, 3, 3, 4, 7, 8, 8, 11, 12, 12, 13, 13 � Mo1 = 0, Mo2 = 3, Mo3 = 8, 
Mo4 = 12 e Mo5 = 13 
� SÉRIE AMODAL (NÃO EXISTE MODA) 
Exemplo: Na série 0, 1, 3, 4, 7, 8 � não existe moda 
 
 
a) DADOS APRESENTADOS EM UMA DISTRIBUIÇÃO DE FREQUÊNCIA SIMPLES. 
Mo = elemento que tenha maior frequência 
 
 
Exemplo 1.19: 
X fi 
1 13 
3 15 
6 25 
10 8 
Total 61 
Mo = 6 
 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
28 
Exemplo 1.20: 
Tipo de Sangue fi 
O 547 
A 441 
B 123 
AB 25 
Total 1136 
Mo = sangue do tipo "O" 
 
b) DADOS APRESENTADOS EM UMA DISTRIBUIÇÃO DE FREQUÊNCIA CLASSES. 
 
Nesse caso, a moda pode ser determinada através de quatro processos. 
 
1. Moda Bruta (MoB) 
Corresponde ao ponto médio da classe modal, ou seja, MoB = (li + ls)/2 
 
Exemplo 1.21: Quantidade de Creatinina 
Classes fi 
1,08 ├ 1,26 5 
1,26 ├ 1,44 13 
1,44 ├ 1,62 32 
1,62 ├ 1,80 18 
1,80 ├ 1,98 11 
1,98 ├ 2,16 2 
2,16 2,34 3 
Fonte: Dados fictícios 
 
2. Moda de Pearson (MoP) 
 
Utilizada mais especificamente, juntamente com X e Med, para mostrar o comportamento da 
distribuição, em relação a concentração ou não de seus elementos. 
 
Mo 3 Med - 2 X= ⋅ ⋅
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
29 
Utiliza-se a MoP para a análise da assimetria. 
 
a) Assimetria à esquerda: oPMMedX << (concentração à direita ou nos valores maiores); 
b) Simétrica: XMedM oP == (concentração no centro); 
c) Assimetria à direita: XMedM oP << (concentração à esquerda ou nos valores menores). 
 
Exemplo 1.22: Calcule a moda de Pearson para os seguintes dados X = 1,61 e Med = 1,57. 
 
Mo 3 Med- 2 X = 3(1,57) - 2(1,61) =1,49= ⋅ ⋅
 
 
Análise: XMedM oP << , o que indica uma assimetria à direita, isto é, uma maior concentração à 
esquerda (ou em direção aos valores menores). 
 
Exercício 1.12: Calcule a moda de pearson para a distribuição de frequências abaixo: 
Quantidade (ml) encontrada numa amostra de 320 soluções utilizadas num processo químico. 
Quantidade (ml) fi F↓ 
4,08 |- 5,44 49 49 
5,44 |- 6,80 70 119 
6,80 |- 8,16 142 261 
8,16 |- 9,52 29 290 
9,52 |-| 10,88 30 320 
Total 320 - 
Fonte: Dados fictícios 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
30 
1.6.4 – Separatrizes 
 
Além das medidas de posição que estudamos, há outras que, consideradas individualmente, 
não são medidas de tendência central, mas estão ligadas à mediana, já que se baseiam em sua 
posição na série. Essas medidas - os quartis, os percentis e os decis - são, juntamente com as 
medianas, conhecidas pelo nome genérico de separatrizes. 
Os quartis, decis e percentis são muito similares à mediana, uma vez que também 
subdividem a distribuição de medidas de acordo com a proporção das frequências observadas. 
Enquanto a mediana divide a distribuição em duas metades, os quartis dividem-se em quatro 
quartos, os decis em 10 partes e os pontos percentis dividem a distribuição em 100 partes. 
 
Mediana (Me) divide em duas partes iguais 
Quartis (Q1, Q2 e Q3) dividem em quatro partes iguais 
Decis (D1, D2, ..., D9) dividem em dez partes iguais 
Percentis (P1, P2, ..., P99 ) dividem em cem partes iguais 
 
São utilizadas para se conhecer, com precisão, as distribuições dos dados como um todo. As 
separatrizes podem ser utilizadas tanto em dados não-agrupados (em forma de rol ou em 
distribuição de frequência simples) tanto quanto em dados agrupados (distribuição de frequências 
em classes). 
 
Relação visual das separatrizes 
 
!-------------------!-------------------! 
Md 
 
 
!---------!---------!---------!---------! 
Q1 Q2 Q3 
 
 
!-----!-----!-----!-----!-----!-----!-----!-----!-----!-----! 
 D1 D2 D3 D4 D5 D6 D7 D8 D9 
 
 
!----------!----------!----------!----------!----------!----------!----------!----------!----------!----------! 
 P10 P20 P30 P40 P50 P60 P70 P80 P90 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
31 
SEPARATRIZES PARA DADOS NÃO-AGRUPADOS 
 
Primeiro encontra-se a posição e em seguida identifica a classe para cada separatriz. 
As posições são calculadas da seguinte maneira: 
 1 – Posição da Mediana: PMe = 2
n
 
 2 – Posição dos Quartis: PQx = . n4
x
 , x = 1, 2, 3 
 3 – Posição dos Decis: PDx = 
 . n
10
x
 , x = 1, 2, ..., 9 
 4 – Posição dos Percentis: PPx = 
 . n
100
x
 , x = 1, 2, ..., 99 
em que: 
x refere-se à determinação da separatriz (exemplo para quartil, x=1,2,3); 
n refere-se ao número de elementos dos dados ou distribuição. 
 
Exemplo 1.23: Considere o tempo (anos) de 24 máquinas utilizadas numa indústria. Calcule os 
Quartis. 
17 18 19 20 21 22 23 24 25 26 27 29 32
 33 35 38 39 42 44 46 48 50 54 57 
 
Calculando os quartis, temos: 
1
2
3
1 246 elemento=22
4 4
2 24 12 elemento=29
4
3 24 18 elemento=42
4
o
o
o
x nEq
Eq Mediana
Eq
⋅ ⋅
= = =
⋅
= = =
⋅
= =
 
 
Em relação aos quartis, encontramos os 6º, 12º e o 18º elemento da distribuição dos dados, que 
correspondem aos números 22, 29 e 42. Assim, podemos concluir que 25% das máquinas têm idade 
de até 22 anos de uso, como também metade delas têm até 29 anos e 25% têm ao menos 42 anos. 
25% das máquinas têm mais de 42 anos de uso na indústria. 
 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
32 
Calculando os Decis 3, 7 e 9, temos: 
 
3
5
9
3 24 7 8 23 247,2 23,5
10 10 2 2
5 24 12 elemento=29
10
9 24 21 22 48 5021,6 49
10 2 2
o o
o
o o
x n elemento elementoEd
Ed Mediana
elemento elementoEd
⋅ ⋅ + +
= = = ≈ = =
⋅
= = =
⋅ + +
= = ≈ = =
 
 
Em relação aos decis calculados, encontramos os 7º, 12º e o 22º elemento da distribuição dos 
dados, que correspondem aos números 23,5, 29 e 49. Assim, podemos concluir que 30% das 
máquinas têm até 23,5 anos de uso, como também metade delas têm até 29 anos e 90% têm ao 
menos 49 anos. 10% das máquinas têm mais de 49 anos de uso na indústria. 
 
Calculando os Percentis 30, 70 e 90, temos: 
 
17
35
83
17 24 4 5 20 214,08 elemento 20,5
100 100 2 2
35 24 8 9 24 258,4 elemento 24,5
100 2 2
83 24 19 20 44 4619,92 elemento 45
100 2 2
o o
o
o o
o
o o
o
x nEp
Ep
Ep
⋅ ⋅ + +
= = = ≈ = =
⋅ + +
= = ≈ = =
⋅ + +
= = ≈ = =
 
 
Em relação aos percentis calculados, encontramos os 4º, 8º e o 20º elemento da distribuição dos 
dados, que correspondem aos números 20,5; 24,5 e 45. Assim, podemos concluir que 17% das 
máquinas têm até 20,5 anos de uso, como também 35% deles têm até 24,5 anos e 65% têm ao 
menos 24,5 anos. Conclui-se também que 83% têm até 45 anos de utilização na indústria e 17% 
têm no mínimo 45 anos. 
 
1.7 - Medidas De Dispersão 
 
Utilizaremos o termo dispersão para indicar o grau de afastamento de um conjunto de 
números em relação a sua média, pois ainda que consideremos a média como um número que tem a 
faculdade de representar uma série de valores ela não pode por si mesma, destacar o grau de 
homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. O nosso 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
33 
objetivo é construir medidas que avaliem a representatividade da média, para isto usaremos as 
medidas de dispersão. 
 Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não 
são suficientes para caracterizar totalmente uma sequência numérica. 
Se observarmos as seguintes sequências: 
 
X: 70, 70, 70, 70, 70 
Y: 68, 69, 70, 71, 72 
Z: 1, 38, 70, 76, 165 
 
Calculando a média aritmética de cada um desses conjuntos, obtemos: 
 
350
 70
5
ixX X
n
= ⇒ = =
∑
 
iy 350Y 70
n 5
= = =
∑
 
iz 350Z 70
n 5
= = =
∑
 
 
Observamos, então, que os três conjuntos apresentam a mesma média aritmética igual a 70. 
Calculando a mediana para os três, dará também o mesmo resultado, ou seja, 70. Assim, 
pensaríamos que essas três variáveis são iguais, no entanto, são sequências completamente distintas 
do ponto de vista da variabilidade de dados. 
 
Na sequência X, não há variabilidade dos dados. A média 70 representa bem qualquer valor 
da série. Na sequência Y, a média 70 representa bem a série, mas existem elementos da série 
levemente diferenciados da média 70. Na sequência Z, existem muitos elementos bastante 
diferenciados da média 70. Concluímos que a média 70 representa otimamente a sequência X, 
representa razoavelmente bem a sequência Y, mas não representa bem a sequência Z. 
 Nosso objetivo é construir medidas que avaliem a representatividade da média. Para 
isto, usaremos as medidas de dispersão. 
 Observe que na sequência X os dados estão totalmente concentrados sobre a média 70, não 
há dispersão de dados. Na sequência Y, há forte concentração dos dados sobre a média 70, mas há 
fraca dispersão de dados. Já na série Z há fraca concentração de dados em torno da média 70 e forte 
dispersão de dados em relação à média 70. 
As principais medidas de dispersão absolutas são: amplitude total, variância, desvio padrão e 
coeficiente de variação. 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
34 
1.7.1 – Variância 
 
 È a medida de dispersão mais utilizada. É definida como sendo o quociente entre a soma 
dos quadrados dos desvios e o número de elementos. É classificada em dois tipos: 
 
Variância Populacional ( 2σ ) ⇒ 
( ) ( )2 22 21i i
i
X X X
X
N N N
σ
 
−  
= = − 
  
∑ ∑
∑
 
Variância Amostral (s2) ⇒ 
( ) ( )2 22 21
1 1
i i
i
X X X
S X
n n n
 
−  
= = − 
− −   
∑ ∑
∑
 
 
Exemplo 1.24: Calcule a variância da estatura do tempo em anos do funcionamento de 5 geradores 
de certa indústria automobilística: 
 
1,92 1,72 1,82 1,80 1,84 
 
Antes de calcular a variância, é necessário calcular a média ( X ). Logo: 
 
1,92 1,72 1,82 1,80 1,84 9,1 1,82
5 5
X + + + += = =
 
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( )
2 2 2 2 2 2
2
2 2 2 2 2
1,92 1,82 1,72 1,82 1,82 1,82 1,80 1,82 1,84 1,82
1 5 1
0,1 0,1 0 0,02 0,02 0,01 0,01 0 0,0004 0,0004
4 4
0,0208 0,0052.
4
iX XS
n
−
− + − + − + − + −
= =
− −
+ − + + − + + + + +
= = =
= =
∑
 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
35 
Exercício 1.13: Calcule a variância do número de incisões feitas em três crianças numa cirurgia dos 
membros superiores e inferiores. Comenta sobre a variabilidade. 
 
Laboratório 
Corpo de prova 
I II III IV 
A 2,59 1,45 1,09 4,79 
B 1,99 1,99 1,99 1,99 
C 0,80 0,01 3,98 7,59 
 
IMPORTANTE: Quando os dados estão dispostos em uma tabela de distribuição de frequência 
(simples ou em classes), utilizam-se as seguintes fórmulas: 
 
1º Caso – Frequência Simples 
( )










⋅
−⋅
−
= ∑ ∑
n
fxfx
n
s
i
i
2
22
1
1
 
( )










⋅
−⋅= ∑ ∑ N
fxfx
N
i
i
2
22 1σ 
2º Caso – Frequência em Classes 
( )










⋅
−⋅
−
= ∑ ∑
n
fPmfPm
n
s
2
22
1
1
 
( )










⋅
−⋅= ∑ ∑ N
fPmfPm
N
2
22 1σ 
 
ATENÇÃO: “Desvantagem” do uso da variância 
No cálculo da variância, quando elevamos ao quadrado a diferença )x(x i −−−− , a unidade de 
medida da série fica também elevada ao quadrado. 
Portanto, a variância é dada sempre no quadrado da unidade de medida da série. Se os dados 
são expressos em metros, a variância é expressa em metros quadrados. Em algumas situações, a 
unidade de medida da variância nem faz sentido. É o caso, por exemplo, em que os dados são 
expressos em litros. A variância será expressa em litros quadrados. 
Logo, o valor da variância não pode ser comparado diretamente com os dados da série, ou 
seja: variância não tem interpretação. 
 
Solução: Utilizar o DESVIO PADRÃO como medida. 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
36 
1.7.2 - Desvio Padrão 
 
 Medida de dispersão que apresenta as propriedades da variância e tem a mesma unidade de 
medida dos dados. É a raiz quadrada da variância. 
Notações: 
1) Quando a sequência de dados representa uma população a variância será denotada por 2σ e o 
desvio padrão correspondente por σ . 
2) Quando a sequência de dados representa uma amostra a variância será denotada por 2S e o 
desvio padrão correspondente por S . 
 Desvio Padrão Populacional (σ) ⇒ ( )
2
iX X
N
σ
−
=
∑
 
Desvio Padrão Amostral (s) ⇒ 
( )2
1
iX XS
n
−
=
−
∑
 
 
OBS: Quanto maior o valordo desvio padrão significa que mais dispersos estão os elementos 
em torno da média. 
 
Exercício 1.14: Calcule o desvio-padrão do Exercício 1.13. 
 
Interpretação do Desvio Padrão 
 
O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão. 
 É fundamental que o interessado consiga relacionar o valor obtido do desvio padrão com os 
dados da série. Quando uma curva de frequência representativa da série é perfeitamente simétrica (
MoMdX ======== ), podemos afirmar que os intervalos: 
] x ,x[ σσσσσσσσ ++++−−−− contém aproximadamente 68% dos valores da série. 
]2 x ,2x[ σσσσσσσσ ++++−−−− contém aproximadamente 95% dos valores da série. 
]3 x ,3x[ σσσσσσσσ ++++−−−− contém aproximadamente 99% dos valores da série. 
EST0323– Estatística Aplicada a Engenharia I 
 
 
OBS: Quando a distribuição não é perfeitamente simétrica, estes percentuais apresentam pequenas 
variações para mais ou para menos, segundo
as três propriedades definidas acima não ocorrem com exatidão.
 
 
Exemplo 1.25: Suponha uma série com média 
estes valores da seguinte forma: 
 
1. Os valores da série estão concentrados em torno de 100.
 
2. O intervalo [95, 105] contém aproximadamente 68% dos valores da série.
O intervalo [90, 110] contém aproximadamente 95% dos valores da série.
 O intervalo [85, 115] contém aproximadamente 99% dos valores da série.
 
 
Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
Quando a distribuição não é perfeitamente simétrica, estes percentuais apresentam pequenas 
variações para mais ou para menos, segundo o caso. Ou seja, na presença de assimetria ou 
as três propriedades definidas acima não ocorrem com exatidão. 
Suponha uma série com média 100====x e desvio padrão 5====σσσσ
 
Os valores da série estão concentrados em torno de 100. 
O intervalo [95, 105] contém aproximadamente 68% dos valores da série. 
O intervalo [90, 110] contém aproximadamente 95% dos valores da série. 
15] contém aproximadamente 99% dos valores da série. 
 
37 
 
Quando a distribuição não é perfeitamente simétrica, estes percentuais apresentam pequenas 
o caso. Ou seja, na presença de assimetria ou outliers, 
5 , podemos interpretar 
 
 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
38 
1.7.3 - Coeficiente de Variação 
 
 Dissemos antes que, por serem as unidades do desvio-padrão as mesmas que as unidades dos 
dados originais, é mais fácil entender o desvio-padrão do que a variância. No entanto, aquela 
mesma propriedade torna difícil comparar a variação para valores originados de diferentes 
populações, ou seja, quando as medidas de duas ou mais variáveis são expressas em unidades 
diferentes como peso/altura, capacidade/comprimento, etc. Usa-se então o Coeficiente de Variação 
(CV), que é uma medida relativa, que expressa o desvio padrão como uma porcentagem da média 
aritmética e ele não tem unidade específica. Quanto mais próximo de zero, mais homogênea é a 
distribuição. Quanto mais distante, mais dispersas. 
O CV mede a dispersão em relação à média. É a razão entre o desvio padrão e a média. O 
resultado obtido dessa operação é multiplicado por 100, para que o coeficiente de variação seja 
dado em porcentagem. 
100sCV
X
= ⋅
 
ANÁLISE 
1. DISPERSÃO BAIXA: CV ≤ 15% 
2. DISPERSÃO MÉDIA: 15% ≤ CV ≤ 30% 
3. DISPERSÃO ALTA: CV ≥ 30% 
 
OBS.: Um CV alto indica que a dispersão dos dados em torno da média é muito grande. 
 
 
Exemplo 1.26: Alturas e Pesos de Homens. Usando os dados amostrais de alturas e pesos de 40 
homens de uma turma de estatística, encontramos as estatísticas dadas na tabela a seguir. 
 
 Média - X Desvio padrão - S 
Altura (cm) 168 7,56 
Peso (kg) 72 10,98 
 
 
Calcule o coeficiente de variação para altura e peso, e a seguir, compare os dois resultados. 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
39 
Solução: 
CV para Altura: 7,56100 100 0,045 100 4,5%.
168Altura
SCV
X
= ⋅ = ⋅ = ⋅ =
 
 
CV para Peso: 10,98100 100 0,1525 100 15,25%.
72Peso
SCV
X
= ⋅ = ⋅ = ⋅ =
 
Reparem que se fôssemos comparar apenas o desvio padrão (fazendo isso já estaríamos 
errando, pois não se podem comparar desvios-padrão de populações com unidades de medição 
diferentes, neste caso cm e kg), iríamos erroneamente deduzir que as duas populações tinham 
variabilidade muito próximas. No entanto, ao calcular os coeficientes de variação para as duas 
populações, analisa-se que a variabilidade das alturas dos homens é quase quatro vezes menos que a 
variabilidade dos pesos. Isso faz sentido intuitivamente, porque vemos rotineiramente que os pesos 
entre homens variam muito mais do que as alturas. Por exemplo, é muito raro ver dois homens 
adultos com um deles tendo duas vezes a altura do outro, mas é muito comum ver dois homens com 
um deles pesando duas vezes o peso do outro. 
 
Exercício 1.14: Em um grupo de pacientes, foram tomadas as pulsações (batidas por minuto) e 
dosadas as taxas de ácido úrico (mg/100ml). Mas médias e os desvios-padrão foram: 
 
Variável Média - Desvio padrão - S 
Pulsação 68,7 8,7 
Ácido úrico 5,46 1,03 
 
Compare a dispersão da Pulsação com as taxas de ácido úrico. 
 
1.8 - Análise Exploratória de Dados 
 
1.8.1 - Esquema dos 5-Números 
 
 
No caso de uma distribuição com outliers, não é ideal representar um conjunto de valores 
com o uso da média e do desvio-padrão, pois devido a presença de valores extremos, elas foram 
afetados. Tukey (1970, 1977) sugeriu o uso de cinco medidas para analisar casos como esse, sendo 
elas: 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
40 
a) Limite Inferior (Li) e Limite Superior ( Ls) 
b) Q1, Q2 e Q3 
 
Forma de representação: 
 
 
 
 
 
Notações: 
a) Q3 - Q1 = Intervalo interquartil (dj) 
b) Me - Li = Dispersão inferior 
c) Ls - Me = Dispersão superior. 
 
Estas cinco medidas são chamadas de estatística de ordem e são medidas resistentes de 
posição de uma distribuição. Dizemos que uma medida de posição é resistente quando for pouco 
afetada por mudanças de uma pequena porção dos dados. A mediana é uma medida resistente, ao 
passo que a média não o é. 
 
1.8.2 – BOX-PLOT 
 
É a representação gráfica dos 5-números, em que são destacados o intervalo interquartil (dj) 
e as observações discrepantes, ou seja: valores menores que Q dj1 3
2
− ou maiores que Q dj3 3
2
+ . (Os 
pontos discrepantes são representados por um asterisco ou travessão). 
 O desenho esquemático (Figura abaixo) dá uma ideia da posição, dispersão, assimetria, 
caudas e dados discrepantes. A posição central dos valores é dada pela mediana e a dispersão por dj. 
As posições relativas de Q1, Q2 e Q3, dão uma noção da assimetria. As caudas são as linhas acima e 
abaixo do retângulo (ou caixa). 
 
 Ls Q2 = Med Li Q3 Q1 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
41 
 (Q3 + 3/2dj) 
 
 LS 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 Q1 
 
 
 LI 
 
 
 
 
 
 
 (Q1 - 3/2dj) 
Q2 = Med 
Q3 
 
Desenho esquemático do Box-plot 
 
 
Exemplo 1.27: Os dados abaixo são referentes ao tempo em segundos até uma reação química 
realizada em 40 tubos de ensaio. Construa um Boxplot e faça uma breve descrição sobre os dados. 
 
47,5 50 50 57,5 60 62,3 63,2 63,56 64,5 65,1 72,2 72,3 74,1 74,8 
75,7 76,2 79 79,2 79,3 81,5 82,1 84 85,3 88,1 88,5 90 92,6 94,7 
95,5 96 98,3 98,7 99,2 100 101,2 110 122,7 125,9 134,6 136,2 
 
O que vamos precisar: 
LI = 47,5 
LS= 136,2 
1
2
3
1 40 10 elemento = 65,1
4 4
2 40 20 elemento = 81,5
4
3 40 30 elemento = 96
4
o
o
o
x nQ
Q Mediana
Q
⋅ ⋅
= = =
⋅
= = =
⋅
= =
 
 
dj = Q3 - Q1 = 96 – 65,1 = 30,9. 
Me - Li = 81,5 – 47,5 = 34 
EST0323– Estatística Aplicada a Engenharia I 
 
Ls - Me = 136,2 – 81,5 = 54,7 
Assim, podemos calcular os limites que informarão se há pontos discrepantes (
3
1
3 396 30,9 142,35
2 2
3 365,1 30,9 18,75
2 2
Q dj
Q dj
   
+ = + =   
   
   
− = − =   
   
Logo, não há nenhum outlier, uma vez que não existe nenhum
segundos ou com tempo inferior a 
 
1. Podemos analisar que 25% dos 
e que metade deles houve reação em 
reação química acima de 81 segundos
2. Analisa-se também que 75% dos 
25% delas no mínimo 96 s. 
3. Chama-se atenção que a reação mais rápida 
segundos. 
4. Não há outliers na distribuição dos dados.
Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
Assim, podemos calcular os limites que informarão se há pontos discrepantes (
96 30,9 142,35
65,1 30,9 18,75
 
, uma vez que não existe nenhuma reação com tempo superior
tempo inferior a 18 segundos. O gráfico é representado abaixo: 
 
Podemos analisar que 25% dos experimentos tiveram uma reação química em 
houve reação em até 81 segundos. Assim como na outra 
segundos. 
se também que 75% dos reações ocorreram no máximo em 96 segundos
a reação mais rápida foi em 47 segundos e a mais demorada, 
na distribuição dos dados. 
 
42 
Assim, podemos calcular os limites que informarão se há pontos discrepantes (outliers). 
empo superior a 142 
. O gráfico é representado abaixo: 
 
experimentos tiveram uma reação química em até 65 segundos, 
na outra metade, teve 
segundos, assim como, 
a mais demorada, de 136 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
43 
 
UNIDADE II 
PROBABILIDADE 
 
 
A Teoria da probabilidade é útil para analisar situações que envolvem o acaso. Jogos de 
dados e de cartas, ou o lançamento de uma moeda para o ar. As distribuições de probabilidade 
incorporam a estatística descritiva e a teoria da probabilidade. Ambas formam a base da inferência 
estatística. Algumas aplicações: 
- Na maioria dos jogos esportivos (futebol, basquete, surfe...), até certo ponto; 
- Na decisão de parar de imunizar pessoas com menos de 20 anos contra determinada doença; 
- Na decisão de arriscar-se a atravessar uma rua no meio do quarteirão; 
- Na engenharia, com uso na tomada de decisões, sendo aplicado principalmente conceitos de 
planejamento de experimentos e amostragem; 
- Todas utilizam a probabilidade consciente ou inconscientemente. 
 
2.1 - Experimentos Aleatórios 
 
São experimentos que ao serem repetidos nas mesmas condições não produzem sempre o mesmo 
resultado, ou seja, exibem variação nos seus resultados. 
 
Exemplo 2.1: Considere alguns exemplos de experimentos aleatórios, denotados aqui por ε. 
• ε1: Tempo, em horas, até a falha de um equipamento; 
• ε2: Número de itens defeituosos em uma linha de produção em um período de 24 horas; 
• ε3: Ocorrência ou não da ruptura de uma viga a um peso x em toneladas; 
• ε4: A sequência de caras e coroas verificada no lançamento de uma moeda 4 vezes; 
• ε5: Lançamento de uma moeda até que apareça cara pela primeira vez. 
 
Embora não sejamos capazes de afirmar qual o particular resultado deste experimento, poderemos 
descrever o conjunto de todo os seus possíveis resultados. 
 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
44 
2.2 - Espaço Amostral 
 
Denotado por S ou Ω, é definido como o conjunto de todos os possíveis resultados de um 
experimento aleatório. 
 
Exemplo 2.2: Consideramos a seguir o espaço amostral associado a cada um dos experimentos 
citados no Exemplo 2.1. 
• Tempo, em horas, até a falha de um equipamento; 
 Ω1 = { t ; t ≥ 0 } 
• Número de itens defeituosos em uma linha de produção em um período de 24 horas; 
 Ω2 = {0, 1, ..., n}; sendo n o número máximo de itens produzidos em 1 dia. 
• Ocorrência ou não da ruptura de uma viga a um peso x em toneladas; 
 Ω3 = { sim , não } 
• A sequência de caras e coroas verificada no lançamento de uma moeda 4 vezes; 
 Ω4 = {cccc, ccck, cckc, ckcc, kccc, kkkk, kkkc, kkck, kckk, ckkk, cckk, ckck, kckc, kkcc, ckkc, kcck} 
• Lançamento de uma moeda até que apareça cara pela primeira vez. 
 Ω5 = {c, kc, kkc, kkkc, kkkkc, ...} 
 
2.3 - Eventos 
 
É um subconjunto de um espaço amostral. 
 
Exemplo 2.3: Os eventos Ai a seguir referem-se aos espaços amostrais dados no Exemplo 2.2. 
• Tempo, em horas, até a falha de um equipamento; 
A1 = {“ ocorre falha em menos de 3 horas ”} � A1 = { t, t > 3}; 
• Número de itens defeituosos em uma linha de produção em um período de 24 horas; 
A2 = {“ menos de 5 itens defeituosos ”}� A2 = { 0, 1, 2, 3, 4 }; 
• Ocorrência ou não da ruptura de uma viga a um peso x em toneladas; 
A3 = {“ viga com ruptura”} � A3 = { sim }; 
• A sequência de caras e coroas verificada no lançamento de uma moeda 4 vezes; 
A4 = {“ somente caras ”} � A4 = { cccc }; 
• Lançamento de uma moeda até que apareça cara pela primeira vez. 
A5 = {“ apareça cara em até 3 lançamentos ”} � A5 = { c, kc, kkc }. 
EST0323– Estatística Aplicada a Engenharia I 
 
Obs: Também são eventos o próprio 
conjunto vazio Ø (chamado de evento impossível
individual de Ω. 
Dado que os eventos associados a um espaço amostral são por sua vez conjuntos, podemos 
efetuar as operações do tipo: união, intercessão, complementação e diferença,
às respectivas operações que se realizam com os subconjuntos de qualquer conjunto abstrato, e 
formar a partir destas operações, novos eventos tais como:
• { ouAx:xBA ∈=∪
A ou sempre que ocorre B, e somente neste caso.
• { eAx:xBA ∈=∩
ocorrem A e B simultanea
• Ac = {x : x ∈ Ω, x ∉ 
ocorre, (e não ocorre, se A ocorre). Claramente nota
• A – B = {x : x ∈ A e x 
ocorre A e não ocorre B.
Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
Também são eventos o próprio Ω (chamado de evento certo, ou seja, sempre ocorre),
evento impossível, ou seja, nunca ocorre), ou qualquer resultado 
Dado que os eventos associados a um espaço amostral são por sua vez conjuntos, podemos 
união, intercessão, complementação e diferença,
às respectivas operações que se realizam com os subconjuntos de qualquer conjunto abstrato, e 
formar a partir destas operações, novos eventos tais como: 
}Bxou ∈ , isto é: A ∪ B é o evento que ocorre sempre que ocorre 
A ou sempre que ocorre B, e somente neste caso. 
 
A B∪ 
}Bx ∈ isto é: A ∩ B é o evento que ocorre somente quando 
simultaneamente. 
 
A B∩ 
 A}, isto é Ac é o evento contrário de A, somente ocorre se A não 
ocorre, (e não ocorre, se A ocorre). Claramente nota-se que Ac ∪ A = 
 
A e x ∉ B}, isto é: (A – B) é o evento que ocorre unicamente quando 
ocorre A e não ocorre B. 
 
A-B 
A B 
A 
Ac 
 
45 
, ou seja, sempre ocorre), o 
, ou qualquer resultado 
Dado que os eventos associados a um espaço amostral são por sua vez conjuntos, podemos 
união, intercessão, complementação e diferença, de forma semelhante 
às respectivas operações que se realizam com os subconjuntos de qualquer conjunto abstrato, e 
B é o evento que ocorre sempre que ocorre 
B é o evento que ocorre somente quando 
é o evento contrário de A, somente ocorre se A não 
A = Ω. 
B) é o evento que ocorre unicamente quando 
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha 
andrerochaest@yahoo.com.br 
 
46 
Quando dois eventos são tais que, eles nunca podem ocorrer simultaneamente, neste caso se 
tem que A ∩ B = ∅, eles