Buscar

Livro pdf - Estatística - Prof. MSc. Uanderson Rébula

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 95 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 95 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 95 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

- 1 - 
Uanderson Rebula de Oliveira Estatística
Associação Educacional Dom Bosco 
ESTATÍSTICA E PROBABILIDADE 
 
 
Uanderson Rebula de Oliveira 
br.linkedin.com/in/uandersonrebula/ 
http://lattes.cnpq.br/1039175956271626
 
ESTATÍSTICA 
- 2 - 
Uanderson Rebula de Oliveira Estatística
EMENTA: 
Estatística descritiva: conceito e fases de estudo. Variáveis. População e amostra. 
Séries estatísticas: conceitos, tabelas, distribuição de frequência e representação 
gráfica. Medidas de Tendência Central. Medidas de Ordenamento. Medidas de 
Variação. Medidas de Assimetria e Curtose. Correlação e Regressão Linear Simples. 
OBJETIVO: 
Refletir a partir da Estatística Básica sobre as ferramentas consolidadas pelo uso e 
pela ciência, disponíveis a todos, que auxiliam na tomada de decisão. 
UANDERSON REBULA DE OLIVEIRA 
Mestrado em Engenharia de Produção-Universidade Estadual Paulista-UNESP 
Pós-graduado em Controladoria e Finanças-Universidade Federal de Lavras-UFLA 
Pós-graduado em Logística Empresarial-Universidade Estácio de Sá-UNESA 
Graduado em Ciências Contábeis-Universidade Barra Mansa-UBM 
Técnico em Metalurgia-Escola Técnica Pandiá Calógeras-ETPC 
 Técnico em Segurança do Trabalho-ETPC 
Operador Siderúrgico e Industrial-ETPC 
Pesquisador pelo ITL/SEST/SENAT. Professor na UNIFOA no curso de Pós graduação em Engenharia de 
Segurança do Trabalho. Professor da Universidade Estácio de Sá - UNESA nas disciplinas de Gestão Financeira de 
Empresas, Fundamentos da Contabilidade e Matemática Financeira, Probabilidade e Estatística para o curso de 
Engenharia de Produção, Análise Estatística para o curso de Administração, Ergonomia, Higiene e Segurança do 
Trabalho, Gestão de Segurança e Análise de Processos Industriais (Gestão Ambiental), Gestão da Qualidade: 
programa 5S (curso de férias). Professor na Associação Educacional Dom Bosco para os cursos de Administração 
e Logística. Ex-professor na Universidade Barra Mansa – UBM nos cursos de Engenharia de Produção e de 
Petróleo. Ex-professor Conteudista na UNESA (elaboração de Planos de Ensino e de Aula, a nível nacional). Ex-
professor em escolas técnicas nas disciplinas de Estatística Aplicada, Estatística de Acidentes do Trabalho, 
Probabilidades, Contabilidade Básica de Custos, Metodologia de Pesquisa Científica, Segurança na Engenharia de 
Construção Civil e Higiene do Trabalho. Ex-professor do SENAI. Ex-consultor interno, desenvolvedor e instrutor 
de cursos corporativos na CSN, a níveis Estratégicos, Táticos e Operacionais. Ex-Membro do IBS–Instituto 
Brasileiro de Siderurgia. 
Resende - RJ – 2017 
ESTATÍSTICA 
- 3 - 
Uanderson Rebula de Oliveira Estatística
APRESENTAÇÃO 
DA DISCIPLINA 
Uma das ferramentas mais utilizadas hoje em dia 
pelos cientistas, analistas financeiros, médicos, engenheiros, 
jornalistas etc. é a Estatística, que descreve os dados observados e 
desenvolve a metodologia para a tomada de decisão em presença 
da incerteza. O verbete estatística foi introduzido no século XVIII, 
tendo origem na palavra latina status (Estado), e serviu 
inicialmente a objetivos ligados à organização político-social, como 
o fornecimento de dados ao sistema de poder vigente. Hoje em dia,
os modelos de aplicação da Teoria Estatística se estendem por todas 
as áreas do conhecimento, como testes educacionais, pesquisas 
eleitorais, análise de riscos ambientais, finanças, controle de 
qualidade, análises clínicas, índices de desenvolvimento, 
modelagem de fenômenos atmosféricos etc. Podemos 
informalmente dizer que a Teoria Estatística é uma ferramenta que 
ajuda a tomar decisões com base na evidência disponível, decisões 
essas afetadas por margens de erro, calculadas através de modelos 
de probabilidade. 
No entanto, a probabilidade se desenvolveu muito 
antes de ser usada em aplicações da Teoria Estatística. Um dos 
marcos consagrados na literatura probabilística foi a 
correspondência entre B. Pascal (1623-1662) e P. Fermat (1601-
1665), onde o tema era a probabilidade de ganhar em um jogo 
com dois jogadores, sob determinadas condições. Isso mostra que o 
desenvolvimento da teoria de probabilidades começou com uma 
paixão humana, que são os jogos de azar, mas evoluiu para uma 
área fortemente teórica, em uma perspectiva de modelar a 
incerteza, derivando probabilidades a partir de modelos 
matemáticos. 
A análise combinatória deve grande parte de seu 
desenvolvimento à necessidade de resolver problemas 
probabilísticos ligados à contagem, mas hoje há diversas áreas em 
que seus resultados são fundamentais para o desenvolvimento de 
teorias, como, por exemplo, a área de sistemas de informação. 
Nesta apostila encontraremos as definições de 
Estatística, vocabulário básico, população e amostra, séries 
estatísticas, medidas estatísticas. Correlação e regressão entre 
outros temas importantes. 
“Atualmente, todos – estudantes e professores – procuram o Udemy porque é a 
plataforma onde todos estão”. 
Fonte: Jornal do Brasil 
www.udemy.com 
Junte-se a milhões de estudantes na maior plataforma on-line 
de cursos curtos e práticos do mundo. 
Com mais de 45.000 cursos virtuais disponíveis, o Udemy é uma plataforma global de 
ensino on-line onde 15 milhões de alunos estão dominando novas habilidades. 
O foco do Udemy são os conhecimentos práticos e úteis para o mercado de trabalho. Há 
cursos gratuitos e pagos. São cursos curtos e com valores bem acessíveis. 
Faça o curso online na Udemy 
Estatística I (para leigos): 
aprenda fácil e rápido! 
 Com o Prof. MSc. Uanderson Rébula 
Saiba 
mais 
Clique aqui 
"O livro digital Estatística I para leigos possui uma linguagem fácil e ao mesmo tempo dinâmica. O 
conteúdo do livro está ordenado de forma a facilitar a aprendizagem dos alunos, mesmo aquelas 
pessoas que não tenham noção nenhuma de estatística aprenderão com esse livro. Você pode 
estudar sozinho para concursos pois o livro é auto explicativo ou até mesmo em grupos, no meu 
caso faço isso com meus alunos. Eu super recomendo esse livro!!! NOTA 1000" 
Maria Eunice Souza Madriz 
Professora de estatística da rede estadual de ensino da Bahia 
Avaliação do livro pelo cliente na amazon.com.br 
- 5 - 
Uanderson Rebula de Oliveira Estatística
1 – CONCEITOS PRELIMINARES  
1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA, 7 
1.2 FASES DO ESTUDO ESTATÍSTICO, 12 
1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA, 13 
1.4 POPULAÇÃO E AMOSTRA, 15 
1.5 ESTATÍSTICA DESCRITIVA E INFERENCIAL , 17 
2 – SÉRIES ESTATÍSTICAS  
2.1 CONCEITOS E TIPOS DE SÉRIES ESTATÍSTICAS,  19 
Tabelas, 19 
Gráficos, 20 
2.2 DISTRIBUIÇÃO DE FREQUÊNCIA, 23 
Frequência absoluta e histograma, 23 
Frequência relativa, absoluta acumulada e relativa acumulada, 24 
Agrupamento em classes, 25 
Polígono de frequência e ogiva, 26 
3 – MEDIDAS RESUMO
3.1 MEDIDAS DE POSIÇÃO, 28 
MÉDIA, 28 
Média simples e Média ponderada, 28 
Média de distribuição de frequência, 29 
 MEDIANA, 30 
 MODA, 31 
 RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA, 33 
3.2 MEDIDAS DE ORDENAMENTO (OU SEPARATRIZES), 34 
Quartil, 34 
Decil e Percentil, 35 
3.3 MEDIDAS DE VARIAÇÃO (OU DISPERSÃO), 36 
Introdução, 36 
Variância e Desvio Padrão, 37 
Coeficiente de Variação,  39 
Desvio padrão de Distribuição de frequência, 39 
3.4 MEDIDAS DE ASSIMETRIA E CURTOSE, 41 
Assimetria e coeficiente de assimetria, 41 
Curtose e coeficiente de curtose, 42 
4 – CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES           
CORRELAÇÃO LINEAR SIMPLES, 44 
REGRESSÃO LINEAR SIMPLES, 47 
REFERÊNCIAS BIBLIOGRÁFICAS, 49 
ANEXO I – LIVROS RECOMENDADOS, 50 
ANEXO II –  Software BIOESTAT , 51 
ANEXO I II– Estatística no Excel, 52  
Sumário 
Prof. MSc. Uanderson Rébula de Oliveira 
Sumário 
Uma mensagem do Prof. MSc Uanderson Rébula. CLIQUE NO VÍDEO
CLIQUE AQUI E INSCREVA-SENO CURSO JÁ
- 6 - 
Uanderson Rebula de Oliveira Estatística
 
1 
CONCEITOS PRELIMINARES 
- 7 - 
Uanderson Rebula de Oliveira Estatística
1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA 
ESTATÍSTICA NA PRÁTICA 
Analise as informações abaixo para melhor compreensão do conceito de Estatística. 
 ACIDENTES DO TRABALHO NO BRASIL – 1970 a 2005 
Conceito de Acidente: Lesão corporal ou doença, relacionada com o exercício do trabalho. (Lei 8.213/91 – art. 19 a 21) 
INSS: Órgão público responsável pela coleta, organização e representação dos dados.  
 Coleta: Por meio de um formulário eletrônico denominado “CAT – Comunicação de Acidente do Trabalho”, enviado 
pelas empresas quando da ocorrência, conforme determina o art. 22 da Lei 8.213/91. 
 Organização: Através de um grande banco de dados do INSS. 
 Representação: Através de um documento denominado “Anuário Estatístico de Acidentes do Trabalho”, contendo 
tabelas, gráficos e diversas análises. Disponível no site www.previdencia.gov.br, na seção “Estatística”. 
Motivo: Quando  o  trabalhador  se  afasta  por motivo  de  acidente,  o  INSS  concede  benefícios  acidentários,  como  auxílio 
doença acidentário, auxílio acidente, aposentadoria por invalidez, pensão por morte, reabilitação entre outros.  
COMPILAÇÃO E ANÁLISE DE DADOS (INFORMAÇÕES) sobre acidentes do trabalho, de 1970 a 2005: 
 
 
 
 
Observa‐se ao longo dos anos o aumento gradativo da quantidade de trabalhadores no Brasil, de 7.284.022 chegando a 33.238.617, 
reflexo do crescimento econômico do País. Essas informações (dados) são importantes para fins de comparação com a evolução da 
quantidade de acidentes do trabalho no mesmo período, como segue abaixo: 
No período de 1970 a 1976 a quantidade de acidentes  foi alta, comparando‐se com a pequena quantidade de  trabalhadores no 
mesmo  período.  Somente  a  partir  de  1978  os  acidentes  começaram  a  reduzir,  em  razão  da  aprovação  das  Normas 
Regulamentadoras – NR’s (disponível no www.mte.gov.br), tornando‐se de aplicação obrigatória em todo o País. Esta redução pode 
ser vista como positiva, entretanto, não podemos comemorar esses números, pois a quantidade de acidentes ainda é alarmante e 
está praticamente estagnada, desde 1994. 
7.284.022
8.148.987
11.537.024
14.945.489
16.638.799
18.686.355
19.476.36219.673.915
22.163.827
23.661.57923.198.656
22.272.843
23.667.24123.830.312
24.491.635
26.228.629
27.189.614
28.683.91329.544.927
31.407.576
33.238.617
0
5.000.000
10.000.000
15.000.000
20.000.000
25.000.000
30.000.000
35.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Evolução da QUANTIDADE de TRABALHADORES 
no Brasil - 1970 a 2005. 
FONTE: Revista Proteção Anos 
1.220.111
1.504.723
1.796.671
1.743.825
1.551.461
1.464.211
1.178.472
961.575
1.207.859
991.581
693.572
532.514
388.304 395.455
414.341
363.868340.251393.071 399.077
465.700 491.711
0
250.000
500.000
750.000
1.000.000
1.250.000
1.500.000
1.750.000
2.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Involução da QUANTIDADE de ACIDENTES DO 
TRABALHO no Brasil - 1970 a 2005. 
Anos 
FONTE: Revista Proteção 
Aprovação das NR’s 
- 8 - 
Uanderson Rebula de Oliveira Estatística
E  as  regiões?  Como  esses  acidentes  estão  distribuídos  nas  regiões  do  país?  Qual  a  pior  região?  Vejamos  abaixo  em  um 
Cartograma (mapa com dados), REFERENTE AO ANO DE 2005 (491.711 acidentes): 
Observa‐se que a região em 1° lugar em número de acidentes é a Sudeste, em 2° está a região Sul, em 3° a região Nordeste, em 4° a região 
Centro‐Oeste e por último a Norte. Ao analisarmos este  gráfico podemos  tomar diversas  conclusões, porém,  tais  conclusões  somente  são 
possíveis através de um estudo, o que demanda  tempo. Todavia, observa‐se que a quantidade de acidentes acompanha a porcentagem da 
participação do  PIB da  região.  Esta  correlação pode  ser  resultado do  reflexo da  economia da  região. Ora,  a  região  Sudeste, por  exemplo, 
corresponde a 56,5% do PIB do País. Logicamente esta região possui um maior número de empresas e, consequentemente, maior número de 
mão‐de‐obra e atividades produtivas,  fato que pode  justificar a enorme quantidade de acidentes  comparada  com as demais  regiões. Esses 
dados também podem estar relacionados com as políticas dos estados e das empresas, a atuação das fiscalizações do Ministério do Trabalho, 
as  culturas das  regiões, os  investimentos empresariais, a  capacitação de mão de obra  (treinamentos) entre outros  fatores. Entende‐se por 
Produto Interno Bruto (PIB) a soma, em valores monetários, de todos os bens e serviços finais produzidos em uma determinada região. 
Tradicionalmente, no Brasil, as políticas de desenvolvimento têm se restringido aos aspectos econômicos e vêm sendo traçadas 
de maneira paralela ou pouco articuladas com as políticas sociais, cabendo a estas últimas arcarem com os ônus dos possíveis 
danos gerados  sobre a  saúde da população, dos  trabalhadores em particular e a degradação ambiental. Para que o Estado 
cumpra seu papel para a garantia desses direitos, é mister a formulação e implementação de políticas e ações de governo. 
POSSÍVEIS SOLUÇÕES PARA REDUZIR OS ACIDENTES 
A partir da análise dos dados podemos concluir que a política de segurança do trabalho adotada no País está estagnada. A 
simples  aplicação  da  norma  regulamentadora  não  está  sendo  suficiente  para  reduzir  o  índice  de  acidentes. Os  dados  nos 
mostram que não haverá mudanças significativas se não forem feitas alterações nessa política. 
Para contornar a situação, os Ministérios do Trabalho, da Saúde e da Previdência Social publicaram, para consulta pública, em 
29.12.2004  a PNSST  ‐ POLÍTICA NACIONAL DE  SEGURANÇA  E  SAÚDE DO  TRABALHADOR,  com  a  finalidade de promover  a 
melhoria da qualidade de vida e da saúde do trabalhador.  
Os Ministérios reconheceram a deficiência da segurança do trabalho no país, carecendo de mecanismos que: 
 Incentivem medidas de prevenção;
 Responsabilizem os empregadores;
 Propiciem o efetivo reconhecimento dos direitos do trabalhador;
 Diminuam a existência de conflitos institucionais;
 Tarifem de maneira mais adequada as empresas e
 Possibilite um melhor gerenciamento dos fatores de riscos ocupacionais.
Distribuição da quantidade e porcentagem de acidentes de trabalho no Brasil por Regiões, 
correlacionados com o Produto Interno Bruto ‐ PIB ‐ ano 2005. 
FONTE: Adaptado da Revista Proteção e do IBGE (www.ibge.gov.br) 
NORDESTE 
• Acidentes: 49.010 (10% do total) 
• PIB: 13,1% de participação
SUDESTE 
• Acidentes: 279.689 (57% do total) 
• PIB: 56,5% de participação
NORTE 
• Acidentes: 19.117 (4% do total) 
• PIB: 5% de participação
CENTRO‐OESTE 
• Acidentes: 31.470 (6% do total) 
• PIB: 8,9% de participação
SUL 
• Acidentes: 112.425 (23% do total) 
• PIB: 16,6% de participação
Espírito Santo ‐ 11.039 acidentes 
Minas Gerais ‐ 52.335 acidentes 
Rio de Janeiro ‐ 34.610 acidentes 
São Paulo ‐ 181.705 acidentes 
É  campeão  de  acidentes  no  Brasil,  participando  com 
181.705, o que corresponde a 37% do total; por conseguinte 
o seu  PIB  também  é  o  maior  do  País,  com  33,9%  de
participação.
- 9 - 
Uanderson Rebula de Oliveira Estatística
Face ao exposto, a PNSST propõe, dentre outras, as seguintes ações a serem desenvolvidas pelos três Ministérios: 
Área  Ações 
Tributos1, 
financiamentos 
e licitações. 
 Estabelecer  política  tributária  que  privilegie  empresas  com menores  índices  de  acidentes  e  que 
invistam na melhoria das condições de trabalho; 
 Criarlinhas  de  financiamento  para  a melhoria  das  condições  de  trabalho,  incluindo máquinas  e 
equipamentos, em especial para as pequenas e médias empresas; 
 Incluir requisitos de  SST para concessão de financiamentos públicos e privados; 
 Incluir requisitos de SST nos processos de licitação dos órgãos públicos; 
 Instituir a obrigatoriedade de publicação de balanço de SST para as empresas, a exemplo do que já 
ocorre com os dados contábeis; 
Educação e 
pesquisa 
 Incluir conhecimentos básicos em SST no currículo do ensino fundamental e médio; 
 Incluir disciplinas em SST no currículo de ensino superior, em especial nas carreiras de profissionais 
de saúde, engenharia e administração; 
 Estimular a produção de estudos e pesquisas na área de interesse desta Política; 
 Articular instituições de pesquisa e universidades para a execução de estudos e pesquisas em SST, 
integrando uma rede de colaboradores para o desenvolvimento técnico ‐ cientifico na área; 
 Desenvolver  um  amplo  programa  de  capacitação  dos  profissionais,  para  o  desenvolvimento  das 
ações em segurança e saúde do trabalhador; 
Ambientes 
nocivos 
 Eliminar as políticas de monetarização dos riscos (adicionais de riscos). 
 Outras ações 
Coleta de dados 
 Compatibilizar os instrumentos de coleta de dados e fluxos de informações. 
 Incluir nos  Sistemas e Bancos de Dados as  informações  contidas nos  relatórios de  intervenções e 
análises dos ambientes de trabalho, elaborados pelos órgãos de governo envolvidos nesta Política. 
CONSIDERAÇÕES FINAIS SOBRE O ESTUDO DE ACIDENTES. 
O que acabamos de ver é um estudo estatístico. Como vimos, os dados sobre acidentes do trabalho no Brasil são controladas 
pelo  INSS. A comunicação de acidentes permite ao  INSS estimar e acompanhar o real  impacto do trabalho sobre a saúde e a 
segurança da população brasileira. O  INSS  coleta, organiza,  apresenta e publica  as estatísticas de acidentes do  trabalho no 
Brasil. Conforme observado, quando ocorre um acidente, a empresa, por força de lei, é obrigada a 
enviar a CAT ao INSS, alimentando, assim, o seu grande banco de dados.   
É importante ressaltar que os dados de acidentes de trabalho não se constituem, tão somente, num 
importante  registro  histórico,  mas  sim  numa  ferramenta  inestimável  para  os  profissionais  que 
desempenham  atividades  nas  áreas  de  saúde  e  segurança  do  trabalhador,  assim  como 
pesquisadores  e  demais  pessoas  interessadas  no  tema.  A  análise  desses  dados  possibilita  a 
construção  de  um  diagnóstico mais  preciso  acerca  da  epidemiologia  dos  acidentes,  propiciando, 
assim, a elaboração de políticas mais eficazes para as áreas relacionadas com o tema. 
TÓPICO PARA REFLEXÃO Acidente do Trabalho: o problema do Brasil. 
Os acidentes de  trabalho afetam a produtividade econômica,  são  responsáveis por um  impacto  substancial  sobre o  sistema de proteção 
social e influenciam o nível de satisfação do trabalhador e o bem estar geral da população. 
Estima‐se que a ausência de segurança nos ambientes de trabalho no Brasil tenha gerado, no ano de 2003, um custo de cerca de R$32,8 
bilhões para o país. Deste total, R$ 8,2 bilhões correspondem a gastos com benefícios acidentários e aposentadorias especiais, equivalente a 
30% da necessidade de financiamento do Regime Geral de Previdência Social ‐ RGPS verificado em 2003, que foi de R$ 27 bilhões. O restante 
da despesa corresponde à assistência à saúde do acidentado,  indenizações, retreinamento, reinserção no mercado de trabalho e horas de 
trabalho perdidas. 
Isso sem levar em consideração o sub‐dimensionamento na apuração das contas da Previdência Social, que desembolsa e contabiliza como 
despesas não acidentárias os benefícios por  incapacidade, cujas CAT não  foram emitidas. Ou seja, sob a categoria do auxílio doença não 
ocupacional, encontra‐se encoberto um grande contingente de acidentes que não compõem as contas acidentárias. 
Parte deste “custo segurança no trabalho” afeta negativamente a competitividade das empresas, pois ele aumenta o preço da mão‐de‐obra, 
o que  se  reflete no preço dos produtos. Por outro  lado, o  incremento das despesas públicas com previdência,  reabilitação profissional e 
saúde reduz a disponibilidade de recursos orçamentários para outras áreas ou induz o aumento da carga tributária sobre a sociedade. 
De outro  lado, algumas empresas afastam  trabalhadores, e muitas vezes os despedem  logo após a  concessão do beneficio. Com  isso, o 
trabalhador se afasta, já sendo portador de doença crônica contraída no labor, e o desemprego poderá se prolongar na medida em que, para 
obter o novo emprego, será necessária a realização do exame admissional, no qual serão eleitos apenas aqueles considerados como “aptos” 
e, portanto, não portadores de enfermidades. 
Fonte: RESOLUÇÃO CNPS Nº 1.269, DE 15 DE FEVEREIRO DE 2006 
_________________ 
1. Tributo: Impostos; taxas e contribuições de melhoria, devida ao poder público.
- 10 - 
Uanderson Rebula de Oliveira Estatística
CONCEITO DE ESTATÍSTICA 
É  A  CIÊNCIA QUE  SE  DEDICA  EM  COLETAR, ORGANIZAR,  APRESENTAR,  ANALISAR  E  INTERPRETAR  DADOS 
(INFORMAÇÕES) PARA TOMADA DE DECISÃO. 
 Estatística  é  a  ciência  dos  dados.  A  Estatística  lida  com  a  coleta,  o 
processamento  e  disposição  de  dados  (informações),  atuando  como 
ferramenta  crucial  nos  processos  de  soluções  de  problemas.  A  Estatística 
facilita  o  estabelecimento  de  conclusões  confiáveis  sobre  algum  fenômeno 
que esteja sendo estudado (WERKEMA, 1995).  
 É por meio da análise e interpretação dos dados estatísticos que é possível o 
conhecimento  de  uma  realidade,  de  seus  problemas,  bem  como,  a 
formulação de soluções apropriadas por meio de um planejamento objetivo 
da ação, para além dos “achismos” e “casuismos” comuns. 
 No uso diário o  termo  “estatística”  refere‐se a  fatos numéricos. Tenha em 
mente, entretanto, que estatística é bem diferente de matemática. Estatística 
é, antes de qualquer coisa, um método científico que determina questões de 
pesquisa; projeta  estudos  e  experimentos;  coleta, organiza,  resume  e  analisa dados;  interpreta  resultados  e  esboça 
conclusões.  Ou  seja,  utiliza‐se  dados  como  evidências  para  responder  a  interessantes  questões  sobre  o  mundo.  A 
matemática só é utilizada para calcular a estatística e realizar algumas das análises, mais isso é apenas uma pequena parte 
do  que  realmente  é  a  estatística.  Portanto,  a  estatística  mantém  com  a  matemática  uma  relação  de  dependência, 
solicitando‐lhe auxílio, sem o qual não poderia desenvolver‐se. 
 A Estatística é uma  ciência  interdisciplinar, ou  seja, é  comum a duas ou mais disciplinas ou  ramos de  conhecimento. 
Assim, a Estatística é aplicada na Medicina, Administração, Engenharias, Economia, Contabilidade, Direito, Segurança do 
Trabalho, Qualidade, Marketing entre outras áreas. Veja abaixo. 
Medicina. Estudos de epidemiologia, 
inter‐relações  dos  determinantes  da 
freqüência  e  distribuição  de  doenças 
populacionais 
*Engenharia de Produção. Estudos de 
um  conjunto  de  dados  de  todas  as 
fases de um processo produtivo. 
Segurança  do  Trabalho.  Estudos  de 
acidentes  e  doenças,  suas  causas, 
quantidade, parte atingida, setores, % 
de afastamentos etc. 
Contabilidade.  Estudos  das 
informações financeiras das empresas 
públicas e privadas. 
Finanças.  Estudos  de  uma  série  de 
informações estatísticas para orientar 
investimentos. 
Economia.  Estudos  de  taxas  de 
inflação,  índice  de  preços,  taxa  de 
desemprego, futuro da economia. 
*Engenharia de Produção – A aplicação da Estatística na produção merece especial atenção. A atual ênfase na qualidade
torna o controle da qualidade uma  importante aplicação da estatística na área daprodução. Usa‐se uma série de mapas 
estatísticos de  controle de qualidade para monitorar o  resultado  (output) de um processo de produção.  Suponha, por 
exemplo, que uma máquina preencha recipientes com 2 litros de determinado refrigerante. Periodicamente, um operador 
do  setor  de  produção  seleciona  uma  quantidade  de  recipientes  e  verifica  a  exatidão,  ou  seja,  se  não  há  desvios.  A 
Estatística também é usada na Engenharia de Produção para Estratificação, que consiste no agrupamento da informação 
(dados) sob vários pontos de vista, de modo a focalizar a ação, considerando os fatores equipamento, tempo entre outros. 
Exemplo: 
Tipo de dano:  Operador:  Máquina de lavar: Roupas danificadas  
em uma lavanderia  Tipo de roupa:  Marca do sabão:  Máquina de secar: 
- 11 - 
Uanderson Rebula de Oliveira Estatística
UM POUCO DE HISTÓRIA E ATUALIDADE 
O termo “Estatística” provém da palavra “Estado” e foi utilizado originalmente 
para  denominar  levantamentos  de  dados  (riquezas,  impostos,    nascimentos, 
mortalidade,  batizados,  casamentos,  habitantes  etc.),  cuja  finalidade  era 
orientar o Estado em suas decisões.  
 Segundo  Costa  (2005,  p.  5)  em  1085,  Guilherme  “O  Conquistador”, 
ordenou  que  se  fizesse  um  levantamento  na  Inglaterra,  que  deveria 
incluir  informações  sobre  terras,  proprietários,  uso  da  terra, 
empregados,  animais  e  serviria,  também,  de  base  para  cálculo  de 
impostos. Tal levantamento originou um volume intitulado “domesday book”. 
 No  século  XVIII  o  estudo  dos  dados  foi  adquirindo,  aos  poucos,  feição 
verdadeiramente  científica.  A  palavra  Estatística  apareceu  pela  primeira 
vez no século XVIII e foi sugerida pelo alemão Godofredo Achenwall (1719‐
1772), onde determinou o seu objetivo e suas relações com as ciências. 
 Desde essa época, a Estatística deixou de ser a simples catalogação de dados numéricos coletivos e  se 
tornou o estudo de como chegar a conclusões sobre o todo, partindo da observação e análise de partes 
desse todo. Essa é sua maior riqueza.  
Atualmente  a  sociedade  está  completamente  tomada  pelos  números.  Eles 
aparecem  em  todos  os  lugares  para  onde  você  olha,  de  outdoors mostrando  as 
últimas  estatísticas  sobre  aborto,  passando  pelos  programas  de  esporte  que 
discutem as  chances de um  time de  futebol  chegar à  final do  campeonato, até o 
noticiário  da  noite,  com  reportagens  focadas  no  índice  de  criminalidade,  na 
expectativa de vida de uma pessoa que não come alimentos saudáveis e no índice 
de aprovação do presidente.  
Em um dia comum, você pode se deparar com cinco, dez ou, até mesmo, vinte diferentes estatísticas  (ou até 
muito mais  em  um  dia  de  eleição).  Se  você  ler  todo  o  jornal  de  domingo,  irá  se  deparar  com  centenas  de 
estatísticas em reportagens, propagandas e artigos sobre todo tipo de assunto: desde sopa (quanto em média uma 
pessoa consome por ano?) até castanhas (quantas castanhas você precisa comer para aumentar seu QI?). 
Nas  empresas  a  Estatística  desempenha  um  papel  cada  vez  mais  importante  para  os  Gerentes.  Esses 
responsáveis pela tomada de decisão utilizam a estatística para: 
 Apresentar e descrever apropriadamente dados e informações sobre 
a empresa; 
 Tirar conclusões sobre grandes populações, utilizando informações 
coletadas a partir de amostras; 
 Realizar suposições confiáveis sobre a atividade da empresa; 
 Melhorar os processos da empresa. 
A estatística é um  instrumento eficiente para a compreensão e  interpretação da realidade e não 
deve ser subestimada. Realmente existem pesquisas feitas de forma incorreta e que, por isso, não 
são confiáveis. Mas, em geral, quando um estudo estatístico é feito com critério, seus resultados 
permitem obter conclusões e prever  tendências sobre  fatos e  fenômenos. Um estudo bem  feito 
não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor possível. 
- 12 - 
Uanderson Rebula de Oliveira Estatística
1.2 FASES DO ESTUDO ESTATÍSTICO 
Um estudo estatístico confiável depende do planejamento e da correta execução das seguintes etapas: 
1. Definir o que será estudado e a natureza dos dados, como exemplo:
ESTUDO NATUREZA DOS DADOS 
Acidentes do 
Trabalho no Brasil 
 Quantidade e período 
 Por regiões, estados ou municípios 
 Por atividade econômica 
 Por idade dos acidentados 
 Por parte do corpo atingida 
 Por causas dos acidentes etc. 
Peças danificadas na 
linha A 
 Tipo de peça   |  Tipo de defeito 
 Quantidade  
 Período e Turnos 
 Máquinas e Operadores 
 Matéria prima etc. 
Defina  com  clareza  os  objetivos  da 
pesquisa, ou seja, o que se pretende 
apurar,  que  tipo  de  problema 
buscará detectar. 
2. Coletar dados
Após definir o que será estudado e o estabelecimento do planejamento do trabalho (forma de coleta dos dados, 
cronograma das atividades, custos envolvidos, levantamento das informações disponíveis), o passo seguinte é o 
da coleta de dados, que consiste na busca ou compilação dos dados, componentes do  fenômeno a ser 
estudado. Nessa etapa recolhem‐se os dados tendo o cuidado de controlar a qualidade da informação. 
O sucesso de uma pesquisa depende muito da qualidade dos dados recolhidos. Podem ser por meio 
de Criação de Softwares, a exemplo da CAT; Uso de Softwares da empresa; Dados históricos 
da empresa (físicos); Pesquisas com questionários etc. 
3. Organizar e contar dados
À procura de falhas e imperfeições, os dados devem ser cuidadosamente organizados e contados, a fim de não incorrermos 
em erros grosseiros que possam influenciar nos resultados. No exemplo da “Estatística na prática”, após a coleta da quantidade 
de acidentes por meio da CAT, organiza‐os por período,  regiões etc. Da mesma maneira, se você usa um questionário para 
coletar dados na empresa, organiza‐os da forma necessária à pesquisa, além da contagem a ser feita. 
4. Apresentação de dados
 
5. Análise dos dados e tomada de decisão
Chegamos à fase mais complexa do processo estatístico, que consiste na análise dos dados. Por fim, a 
partir  da  análise  realizada,  poderemos  chegar  a  uma  tomada  de  decisão.  Observe  o  estudo 
“Estatística na prática”. O que  resultou a análise dos acidentes no Brasil, no período de 1970 a 
2005?   Veja que os Ministérios do Trabalho, Previdência Social e da Saúde  se mobilizaram para 
resolverem essa questão de saúde pública, com diversas ações a serem implementadas no país. A 
partir dessa discussão,  fica claro que um profissional com conhecimentos de Estatística  terá maior 
facilidade em  identificar um problema em sua área de atuação, determinar os  tipos de dados que 
irão contribuir para sua análise, coletar esses dados e a seguir estabelecer conclusões e determinar 
um plano de ação para a solução do problema detectado. 
Os dados devem ser 
apresentados  sob  a 
forma de tabelas ou 
gráficos,  a  fim  de 
tornar  mais  fácil  e 
rápido  o  exame 
daquilo  que  está 
sendo estudado. 
1.220. 111
1.504. 723
1.796.671
1.743.825
1.551.461
1.464.211
1.178. 472
961. 575
1. 207.859
991.581
693. 572
532.514
388.304 395. 455
414.341
363. 868 340.251 393.071 399.077
465.700 491.711
0
250 .000
500 .000
750 .000
1.000 .000
1.250 .000
1.500 .000
1.750 .000
2.000 .000
1970 1972 1974 19 76 1978 19 80 1982 1 984 1986 1 988 1990 1992 1994 1996 199 8 2000 20 01 2002 20 03 2004 2 005
Involução da QUANTIDADE de ACIDENTES DO 
TRABALHO no Brasil - 1970 a 2005. 
Anos 
FONTE: Revista Proteção 
Aprovação das NR’s 
- 13 - 
Uanderson Rebula de Oliveira Estatística
1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA 
O  vocabulário utilizado em estudos estatísticos  teve  sua origem nos primeiros estudos  feitos pelahumanidade e que eram 
relativos  à  demografia  (estudo  estatístico  das  populações).  Por  isso  a  Estatística  emprega  termos  próprios  dessa  área  de 
conhecimento, mas com um sentido diferenciado. Assim, para dar prosseguimento, é de extrema importância destacar alguns 
termos utilizados no jargão estatístico. 
VARIÁVEL – É o termo usado para aquilo que você está pesquisando, estudando, analisando. 
, 
 No  estudo  representado  no  gráfico  abaixo  a  variável  é  o  acidente  do  trabalho.  Utilizada  como  um  adjetivo  do 
vocabulário do dia‐a‐dia, variável sugere que alguma coisa se modifica ou varia.  
São exemplos de Variáveis 
Doenças, Sexo, Estaturas, Peso, Idade, Renda, Natalidade, Mortalidade, PIB, Inflação, Exportações brasileiras, 
Produção de café, Alimentação, Peças produzidas por hora, Paradas de produção no mês, Rotatividade de 
estoque por ano, Poluição, Clima na região sudeste, Consumo de energia no mês, Vendas mensais de uma 
empresa, Produção diária de automóveis etc. 
EXEMPLO DE APLICAÇÃO: 
A associação dos moradores de um bairro queria traçar um perfil dos frequentadores de um parque ali situado. 
Uma equipe de pesquisa elaborou questões a fim de reunir as  informações procuradas. Numa manhã de quarta‐
feira, 6 pessoas  foram entrevistadas e cada uma  respondeu a questões para  identificar  idade, número de vezes 
que freqüenta o parque por semana, estado civil, meio de transporte utilizado para chegar ao parque, tempo de 
permanência no parque e renda familiar mensal. Os resultados são mostrados na tabela a seguir: 
Cada um dos aspectos investigados — os quais permitirão fazer a análise desejada — é denominado variável. 
1.220.111
1.504.723
1.796.671
1.743.825
1.551.461
1.464.211
1.178.472
961.575
1.207.859
991.581
693.572
532.514
388.304 395.455
414.341
363.868340.251393.071 399.077
465.700 491.711
0
250.000
500.000
750.000
1.000.000
1.250.000
1.500.000
1.750.000
2.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Involução da QUANTIDADE de ACIDENTES 
DO TRABALHO no Brasil - 1970 a 2005. 
FONTE: Revista Proteção Anos 
VARIÁVEL 
Variáveis 
- 14 - 
Uanderson Rebula de Oliveira Estatística
TIPOS DE VARIÁVEIS 
Há,  pois,  uma  divisão  principal  para  as  variáveis  estatísticas,  que  consiste  em  considerá‐las  como  Variáveis Quantitativas 
(discretas ou contínuas) e Variáveis Qualitativas (nominal ou ordinal). Esta divisão é de facílima compreensão! 
Então, os tipos de Variáveis da pesquisa do parque serão: 
PARA LEITURA 
Se a dúvida persiste, você pode observar no quadro abaixo mais esclarecimentos sobre esses conceitos. 
Tipo de VARIÁVEL Resposta fornecida à pesquisa 
Quantitativa 
(Em números)
Será Quantitativa a variável para a qual se possa atribuir um valor numérico. Se a resposta fornecida à pesquisa estiver expressa 
por um número, então a variável é quantitativa. Por exemplo: quantos livros você lê por ano? A resposta é um número? Então, 
variável quantitativa. Quantas pessoas moram em sua casa? A resposta é um número? Então, novamente, variável quantitativa.  
No caso do estudo “ACIDENTE DO TRABALHO, é uma variável quantitativa, pois estudamos a quantidade de acidentes no período 
de 1970 a 2005 
 Discreta 
(números inteiros) 
(contagem) 
Variável  Quantitativa  Discreta  é  a  variável  quantitativa  que  assume  somente  números  inteiros.  Resulta,  geralmente,  de 
contagem.  Esta  variável  não  pode  assumir  qualquer  valor,  dentro  de  um  intervalo  de  valores  de  resultados  possíveis.  Por 
exemplo, se eu pergunto quantos irmãos você tem, a resposta jamais poderia ser “tenho 3,75 irmãos”, ou “tenho 4,8 irmãos”, ou 
seja, a resposta não poderia assumir todos os valores de um  intervalo! Este acima é o conceito formal de variável discreta! O 
conceito  para memorizar  é  o  seguinte:  aquela  variável  obtida  por meio  de  uma  contagem.  Em  outras  palavras:  a  variável 
discreta você conta!. Exemplos: quantas pessoas moram na sua casa? Quantos  livros você tem? Quantos carros você tem? Se, 
para responder à pergunta, você faz uma contagem, então está diante de uma variável quantitativa discreta. 
 Contínua 
(Números não inteiros) 
(medição) 
Variável Quantitativa Contínua é aquela que pode assumir qualquer valor dentro de um intervalo de resultados possíveis. Se eu 
pergunto quantos quilos você pesa, a resposta pode ser 65,35kg. Se eu pergunto qual a temperatura na cidade hoje, a resposta 
pode ser 27,35°C. Para  facilitar a memorização, basta  lembrar que a variável quantitativa contínua pode ser obtida por uma 
medição, ou  seja,  a  variável  contínua  você mede!  Exemplos:  peso,  altura,  duração  de  tempo  para  resolução  de  uma  prova, 
pressão, temperatura etc. 
Qualitativa 
(nomes, atributos) 
Se  a  pergunta  é  “qual  a  sua  cor  preferida?”,  logicamente  a  resposta  não  será  um  número,  daí  estaremos  tratando  de  uma 
variável qualitativa, ou seja, aquela para a qual não se atribui um valor numérico. Exemplos: Sexo: masculino ou feminino 
VARIÁVEL
QUANTITATIVA
QUALITATIVA
DISCRETA
CONTÍNUA
Quando não é possível ordenar as categorias. 
Ex.:  sexo  (masculino ou  feminino), Cor dos olhos  (preto ou  verde), 
campo de estudo (Engenharia, Direito etc) 
Não  é  possível  estabelecer  uma  ordem,  uma  gradação,  o mais  ou 
menos importante, prioritário etc. 
ORDINAL 
NOMINAL
Quando  as  variáveis  forem  em  números 
inteiros, obtido por contagem:  
0      1      2      3      4     55     77   987   etc. 
Ex.: Idade (anos), gols de futebol, etc 
Quando  as  variáveis  forem  em  números 
não inteiros, assumem qualquer valor:  
0,2       1,12      3,77      4,768       etc. 
Ex.: Altura (cm), peso (kg), tempo (hh:mm) 
Números 
Nomes 
Inteiros 
Não inteiros 
Quando é possível ordenas as categorias. 
Pesquisa de alimentação: 
     [1] Ótimo     [2] Bom    [3] Regular    [4] ruim 
Grau de instrução de funcionários de uma empresa 
   1º grau     2º grau     Superior    Mestrado     Doutorado 
Ordenável 
Não é ordenável 
Qualitativa nominal
Quantitativa discreta Quantitativa contínua 
- 15 - 
Uanderson Rebula de Oliveira Estatística
1.4 POPULAÇÃO E AMOSTRA 
Quando você quer saber se a sopa ficou boa, o que você faz? Mexe a panela, retira um pouco com 
uma colher e prova. Depois tira uma conclusão sobre todo o conteúdo da panela sem, na verdade, 
ter provado tudo. Portanto, é possível ter uma idéia de como a sopa está sem ter que comer tudo. 
Isso é o que se faz em estatística. 
A estatística deixou de ser a simples catalogação de dados numéricos e se tornou o estudo de como 
chegar a conclusões sobre o  todo  (população), partindo da observação e análise de partes desse 
todo (amostra). Essa é sua maior riqueza. Assim, podemos conceituar população e amostra como: 
POPULAÇÃO É UM CONJUNTO DE TODOS OS ELEMENTOS EM ESTUDO. 
AMOSTRA É UMA PARTE DA POPULAÇÃO (ou subconjunto). 
 
 
 
 
 
 
 
 
 
 Muitas vezes quando queremos fazer um estudo estatístico, não é possível analisar toda a população 
envolvida com o fato que pretendemos investigar, como exemplo o sangue de uma pessoa ou a poluição 
de um rio. É impossível o teste do todo. Há situações também em que é inviável o estudo da população, 
por  exemplo,  a  pesquisa  com  todos  os  torcedores  em  um  estádio  de  futebol  durante  uma  partida. 
Nesses  casos,  o  estatístico  recorre  a  uma  amostra  que,  basicamente,  constitui  uma  redução  da 
população a dimensões menores, sem perda das características essenciais. 
 Os resultados fundamentados em uma amostra não serão exatamente os mesmos que você encontraria 
se estudasse  toda a população, pois, quando você  retirauma amostra, você não obtém  informações a 
respeito  de  todos  em  uma  dada  população.  Portanto,  é  importante  entender  que  os  resultados  da 
amostra fornecem somente estimativas dos valores das características populacionais. Com métodos de 
amostragens apropriados, os  resultados da amostra produzirão  “boas” estimativas da população, ou 
seja, um estudo bem feito não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor 
possível. Quando aprendemos estatística inferencial, também aprendemos técnicas para controlar esses 
erros de amostragem. 
4 razões para selecionar uma amostra 
O número de elementos em uma população é muito grande; 
Demanda menos tempo do que selecionar todos os itens de uma população; 
É menos dispendioso (caro) do que selecionar todos os itens de uma população; 
Uma análise amostral é menos cansativa e mais prática do que uma análise da população inteira.  
Podemos visualizar o conceito 
de  população  e  amostra  na 
figura ao lado. 
Quando  pesquisamos  toda  a 
população, damos o nome de 
censo. 
A  precisão  depende  do 
tamanho  da  amostra,  e 
quanto  maior  é  o  tamanho 
amostral,  maior  será  a 
precisão das informações. 
AMOSTRA
(uma parte da população)
POPULAÇÃO
(todos os elementos em estudo)
AMOSTRA
(uma parte da população)
POPULAÇÃO
(todos os elementos em estudo)
N é designado para População 
n é designado para Amostra 
“N”
“n”
- 16 - 
Uanderson Rebula de Oliveira Estatística
São exemplos de População e Amostra: 
MEDICINA.  Pretende‐se  estudar  o  efeito  de  um  novo  medicamento  para  curar  determinada  doença.  É 
selecionado um grupo de 50 doentes, administrando‐se o novo medicamento a 10 desses doentes escolhidos ao 
acaso e o medicamento habitual aos restantes.  
População: Todos os 50 doentes com a doença que o medicamento a estudar pretende tratar. 
Amostra: Os 10 doentes selecionados. 
CONTROLE DE QUALIDADE. O Gerente de Produção de uma fábrica de parafusos pretende assegurar‐se de que 
a  porcentagem  de  peças  defeituosas  não  excede  um  determinado  valor,  a  partir  do  qual  determinada 
encomenda poderia ser rejeitada.  
População: Todos os parafusos fabricados ou a fabricar, utilizando o mesmo processo. 
Amostra: Parafusos escolhidos ao acaso entre os lotes produzidos. 
ESTUDOS DE MERCADO. O gerente de uma fábrica de produtos desportivos pretende lançar uma nova linha de 
esquis, pelo que encarrega uma empresa especialista em estudos de mercado de “estimar“ a porcentagem de 
potenciais compradores desse produto. 
População: conjunto de todos os praticantes de desportos de neve. 
Amostra: conjunto de alguns praticantes inquiridos pela empresa. 
SISTEMAS DE PRODUÇÃO. Um fabricante de pneus desenvolveu um novo tipo de pneu e quer saber o aumento 
da durabilidade em  termos de kilometragem em  relação à atual  linha da empresa. Produz diariamente 1000 
pneus e selecionou 120 para testes. 
População: 1000 pneus. 
Amostra: 120 pneus. 
OUTROS EXEMPLOS DE AMOSTRAS: 
- 17 - 
Uanderson Rebula de Oliveira Estatística
AMOSTRA
(uma parte da população)
POPULAÇÃO
(todos os elementos em estudo)
AMOSTRA
(uma parte da população)
POPULAÇÃO
(todos os elementos em estudo)
1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL 
Estatística descritiva – É o ramo da estatística 
que  envolve  a  organização,  o  resumo  e  a 
representação  dos  dados  para  tomada  de 
decisão. 
Estatística Inferencial – É o ramo da estatística 
que envolve o uso da  amostra para  chegar  a 
conclusões  sobre  a  população.  Uma 
ferramenta  básica  no  estudo  da  estatística 
inferencial é a probabilidade. 
Algumas ferramentas aplicadas à 
Estatística Inferencial: 
Probabilidades 
Uma Probabilidade é uma medida numérica que representa a chance de um evento ocorrer. Ex.: 
Ao lançar um dado, qual a probabilidade de obter o valor 4? R = 1/6 = 16% 
Estimação, margem de erro e intervalo de confiança 
Suponha que o tempo médio que você leva para chegar ao trabalho de carro é de 35’, com uma margem de erro 
de 5’ para mais ou para menos. A estimativa é de que o tempo médio gasto até 
chegar  ao  trabalho  fica em algum ponto entre 30’ e 40’. Esta estimativa é um 
intervalo de confiança, pois leva em consideração o fato de que os resultados da 
amostra irão variar e dá uma indicação de uma variação esperada. 
A margem  de  erro  é  uma medida 
de  quão  próximo  você  espera  que 
seus resultados representem toda a 
população  que  está  sendo 
estudada.  Vários  fatores 
influenciam  a  amplitude  de  um 
intervalo de confiança, tais como o 
tamanho amostral, a variabilidade da população e o quanto você espera obter de precisão. A maioria dos pesquisadores contenta‐se com 95% 
de  confiança  em  seus  resultados.  Estar  95%  confiante  indica  que  se  você  coletar muitas, mas muitas  amostras  e  calcular  o  intervalo  de 
confiança para todas, 95% dessas amostras terão intervalos de confiança que abrangerão o alvo. 
Teste de hipótese 
Teste de hipótese é um procedimento estatístico em que os dados são coletados e medidos para comprovar uma 
alegação feita sobre uma população. Por exemplo, se uma pizzaria alega entregar as pizzas dentro de 30’ a partir 
do  pedido,  você  pode  testar  se  essa  alegação  é  verdadeira,  coletando  uma  amostra  aleatória  do  tempo  de 
entrega durante um  determinado período de tempo e observar o tempo médio de entrega para essa amostra. 
 - 18 - 
 
 
Uanderson Rebula de Oliveira Estatística
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2 
 
SÉRIES ESTATÍSTICAS 
Prof. MSc. Uanderson Rébula de Oliveira 
Sumário 
Uma mensagem do Prof. MSc Uanderson Rébula. CLIQUE NO VÍDEO
CLIQUE AQUI E INSCREVA-SE NO CURSO JÁ
- 19 - 
Uanderson Rebula de Oliveira Estatística
2.1 CONCEITOS E TIPOS DE SÉRIES 
As  tabelas  e  gráficos  constituem  um  importante  instrumento  de  análise  e  interpretação  de  um  conjunto  de  dados. 
Diariamente é possível encontrar  tabelas e  gráficos nos mais  variados  veículos de  comunicação  (jornais,  revistas,  televisão, 
Internet),  associadas  a  assuntos  diversos  do  nosso  dia‐a‐dia,  como  resultados  de  pesquisas  de  opinião,  saúde  e 
desenvolvimento humano, economia, esportes, cidadania, etc. A importância das tabelas e dos gráficos está ligada sobretudo à 
facilidade e rapidez na absorção e interpretação das informações por parte do leitor e também às inúmeras possibilidades de 
ilustração e resumo dos dados apresentados. 
TABELAS 
São quadros que resumem um conjunto de dados. 
Tipos de Tabelas 
SÉRIE HISTÓRICA 
Descreve  os  valores  da  variável, 
discriminados  por  TEMPO  (anos, 
meses, dias, horas, etc. 
SÉRIE GEOGRÁFICA 
Descreve  os  valores  da  variável, 
discriminados por REGIÕES (países, 
cidades, bairros, ruas, layout, etc) 
SÉRIE ESPECÍFICA 
Descreve  os  valores  da  variável, 
discriminados  por  temas 
ESPECIFICOS. 
SÉRIE CONJUGADA 
É utilizado quando temos a necessidade de apresentar em uma única 
tabela  a  variação  de  valores  DE MAIS  DE UMA  VARIÁVEL,  isto  é, 
fazer de forma conjugada de duas ou mais séries. 
Esta série, por exemplo, é GEOGRÁFICA – HISTÓRICA 
Título – conjunto de informações sobre o estudo. 
Cabeçalho –especifica o conteúdo das colunas 
Coluna indicadora –especifica o conteúdo das linhas 
Coluna numérica ‐–especifica  a quantidade das linhas 
Linhas – retas imaginárias de dadosCélula – espaço destinado a um só número 
Rodapé – simplesmente a fonte dos dados
- 20 - 
Uanderson Rebula de Oliveira Estatística
GRÁFICOS
A  importância  dos  gráficos  está  ligada  à  facilidade  e  rapidez  na  absorção  e  interpretação  das  informações  e 
também às inúmeras possibilidades de ilustração e resumo dos dados apresentados. Eis os mais usados: 
Gráfico em Linha (para séries históricas) 
É a representação dos valores por meio de linhas. Usamos quando precisamos de uma informação rápida de um 
valor ao longo do tempo. 
Gráfico em Colunas 
É  a  representação  dos  valores  por  meio  de  retângulos,  dispostos  verticalmente.  Utiliza‐se  muito  quando 
necessitamos saber a quantidade de valor. 
ACIDENTES DO TRABALHO EM 
SÃO PAULO: 1989 ‐ 1991
0
500
1000
1500
2000
2500
1989 1990 1991
anos
Q
ua
nt
id
ad
e
São Paulo
Guarulhos
Campinas
Osasco
Santos
FONTE: Dados fictícios 
 QUANTIDADE DE ACIDENTES DO TRABALHO
SÃO PAULO: 1989 ‐ 1994
6254
7265
6325
5458
8658
9578
0
2000
4000
6000
8000
10000
12000
1989 1990 1991 1992 1993 1994
Anos
Q
ua
nt
id
ad
e
FONTE: Dados fictícios 
 ACIDENTES DO TRABALHO
SÃO PAULO: 1989 ‐ 1994
6254
7265
6325
5458
8658 9578
0
2000
4000
6000
8000
10000
1989 1990 1991 1992 1993 1994
Anos
Q
ua
nt
id
ad
e
FONTE: Dados fictícios 
 - 21 - 
 
 
Uanderson Rebula de Oliveira Estatística
 
Gráfico em Barras 
É o mesmo conceito que o de Colunas, porém utiliza‐se sempre que os dizeres a serem inscritos são extensos. 
 
 
 
 
 
 
 
 
 
 
    
 
 
 
 
 
Gráfico em Setores 
Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação 
de um dado no total, geralmente na forma de porcentagem. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Gráfico Polar 
É  o  gráfico  ideal  para  representar  séries  temporais  cíclicas,  isto  é,  séries  temporais  que  apresentam  em  seu 
desenvolvimento determinada periodicidade, por exemplo, o mês de janeiro a dezembro. 
 
 
   
 QUANTIDADE DE ACIDENTES DO TRABALHO
EM SÃO PAULO ‐ POR TIPO ‐  1989
55
1396
698
3578
598
0 1000 2000 3000 4000
Impacto
Perfuração
Atrito
Queda
Corte
Ti
po
Quantidade
FONTE: Dados fictícios 
ACIDENTES DO TRABALHO
SÃO PAULO ‐ 1989 
 FONTE: Dados fictícios 
ACIDENTES DO TRABALHO
SÃO PAULO ‐ 1989 
 FONTE: Dados fictícios 
- 22 - 
Uanderson Rebula de Oliveira Estatística
Número de cada 
Delegacia 
Gráfico de Pareto 
É  um  gráfico  de  colunas  na  qual  a  altura  de  cada  barra  representa  os  dados,  porém  na  ordem  de  altura 
decrescente,  com  a  coluna  mais  alta  posicionada  à  esquerda.  Tal  posicionamento  ajuda  a  enfatizar  dados 
importantes e é frequentemente usado nos negócios. 
Os cinco veículos mais vendidos 
no Brasil em janeiro de 1995 
Veículo  Quantidade (milhões) 
Ômega  34 
Monza  30 
Gol  25 
Corsa  22 
Fusca  15 
FONTE: dados fictícios 
Gráfico de Dispersão 
É usado para representar a relação entre duas variáveis quantitativas, por meio de pontos e linhas. Aprendemos a 
utilizar esse gráfico quando estudamos “Correlação e Regressão”. 
Investimentos versus vendas  
no setor da empresa X 
Anos  Investimentos  Vendas  
1999  500  1000 
2000  1000  2000 
2001  1500  3000 
2002  2000  4000 
FONTE: dados fictícios 
Gráfico Cartograma 
Este gráfico é empregado quando o objetivo é o de  figurar os dados estatísticos diretamente  relacionados com 
áreas geográficas ou políticas (mapas), corpo humano entre outras figuras. 
 
 
Os cinco veículos mais vendidos 
no Brasil em janeiro de 1995
15
2225
30
34
0
10
20
30
40
Ômega Monza Gol Corsa Fusca
Veículos
Q
ua
nt
id
ad
e (
m
ilh
õe
s)
FONTE: Dados fictícios 
FONTE: SSP/SP 
- 23 - 
Uanderson Rebula de Oliveira Estatística
2.2 DISTRIBUIÇÃO DE FREQUÊNCIA 
Frequência absoluta e Histograma 
Ao se trabalhar com grandes conjuntos de dados, em geral é útil organizá-los e resumi-los em uma 
tabela, chamada Distribuição de frequência. 
 Na distribuição de frequência listamos todos os valores coletados, um em cada linha, marcam‐se as vezes em que eles 
aparecem,  incluindo as  repetições, e conta‐se a quantidade de ocorrências de cada valor. Por este motivo,  tabelas 
que apresentam valores e suas ocorrências denominam‐se distribuição de freqüências. 
 O termo “freqüência” indica o número de vezes que um dado aparece numa observação estatística. 
EXEMPLO 
Um professor organizou os resultados obtidos em uma prova com 25 alunos da seguinte forma: 
    Notas dos 25 alunos              Comentário 
4,0  5,0  7,0  9,0  9,0 
4,0  5,0  7,0  9,0  9,0 
4,0  5,0  7,0  9,0  9,0 
4,0  6,0  8,0  9,0  9,0 
4,0  6,0  8,0  9,0  9,0 
Agora  ele  pode  fazer  uma  representação  gráfica  para  analisar  o 
desempenho da  turma. Em primeiro  lugar, o professor pode  fazer uma 
tabulação dos dados, ou seja, organizá‐los de modo que a consulta a eles 
seja  simplificada.  Então,  faremos  a  distribuição  de  freqüência  destas 
notas, por meio da contagem de dados. 
       Distribuição de freqüência       Comentário
Nota   Freqüência, f (nº de alunos) 
4,0  5 
5,0  3 
6,0  2 
7,0  3 
8,0  2 
9,0  10 
f=25 
Esta  forma  de  organizar  dados  é  conhecida  como  distribuição  de 
frequência, e o número de  vezes que um dado  aparece é  chamado de 
frequência absoluta, representado por f. Exemplos:  
 A frequência absoluta da nota 4,0 é 5. 
 A freqüência absoluta da nota 9,0 é 10. 
O  símbolo  grego    “sigma”  significa  “somatório”,  muito  usado  em 
Estatística. Portanto, f=25 significa a soma de 5+3+2+3+2+10. 
Representamos a freqüência por um gráfico, chamado Histograma. 
        HISTOGRAMA                 Comentário 
ESTA FREQUÊNCIA QUE ACABAMOS DE ESTUDAR É DENOMINADA FREQUENCIA 
ABSOLUTA (f), QUE É SIMPLESMENTE A CONTAGEM DOS DADOS. 
 Em Estatística não trabalhamos somente com frequência absoluta (f), mas também com outros tipos de freqüências, 
que são: freqüência relativa (fr), frequência absoluta acumulada (Fa) e frequência relativa acumulada (FRa). 
 Estudaremos agora cada uma delas. 
Quando  os  dados  numéricos  são  organizados,  eles  geralmente  são 
ordenados  do  menor  para  o  maior,  divididos  em  grupos  de  tamanho 
razoável  e,  depois,  são  colocados  em  gráficos  para  que  se  examine  sua 
forma, ou distribuição  (no exemplo:  4,0 – 5,0 – 6,0 – 7,0 – 8,0 – 9,0). Este 
gráfico é chamado de Histograma.  
Um histograma é um gráfico de  colunas  juntas.  Em um histograma não 
existem espaços entre as colunas adjacentes, como ocorre em um gráfico 
de  colunas. No exemplo, a escala horizontal  (→)  representa as notas e a 
escala vertical (↑) as freqüências. 
O histograma ao lado indica que cinco alunos tiraram a nota 4,0; três alunos tiraram 
a nota 5,0; dois alunos tiraram a nota 6,0; três alunos tiraram a nota 7,0; dois alunos 
tiraram 8,0 e dez alunos tiraram 9,0. 
5
3
2
3
2
10
0
2
4
6
8
10
12
N
úm
er
o d
e a
lu
no
s
4,0 5,0 6,0 7,0 8,0 9,0
Nota
Desempenho dos alunos na prova
- 24 - 
Uanderson Rebula de Oliveira Estatística
Frequência Relativa fr (%) 
Conceito. Representado por fr(%), significa a relação existente entre a frequência absoluta f e a soma das freqüências f. É a 
porcentagem (%) do número de vezes que cada dadoaparece em relação ao total. 
EXEMPLO 
    5/25 * 100  =  20%. 
      freqüência relativa fr (%)                  Comentários aos cálculos
Nota  f  fr(%) 
4,0  5  20% 
5,0  3  12% 
6,0  2  8% 
7,0  3  12% 
8,0  2  8% 
9,0  10  40% 
f=25  100% 
A frequência relativa fr(%) é obtida por f/f * 100, conforme abaixo: 
 A fr(%) da nota 4,0 é   5/25 * 100  =  20%.
 A fr(%) da nota 5,0 é  3/25 * 100   = 12%
 A fr(%) da nota 6,0 é  2/25 * 100   =  8%
 A fr(%) da nota 7,0 é  3/25 * 100   = 12%
 A fr(%) da nota 8,0 é  2/25 * 100  = 8%
 A fr(%) da nota 9,0 é  10/25 * 100 = 40%.
Frequência Absoluta Acumulada Fa 
Conceito. Representado por Fa, significa a soma das freqüências absolutas até o elemento analisado. 
EXEMPLO 
    Fa2=5+3 = 8 
     frequência absoluta acumulada (Fa)          Comentários aos cálculos 
Nota  f  fr(%)  Fa 
4,0  5  20%  5 
5,0  3  12%  8 
6,0  2  8%  10 
7,0  3  12%  13 
8,0  2  8%  15 
9,0  10  40%  25 
f=25  100%  ‐ 
A frequência absoluta acumulada Fa é obtida conforme abaixo: 
 A Fa da nota 4,0 é 5 (sempre repete a primeira). 
 A Fa das notas 4,0 e 5,0 é 5+3=8. 
 A Fa das notas 4,0, 5,0 e 6,0 é 5+3+2=10. 
 A Fa das notas 4,0, 5,0, 6,0 e 7,0 é 5+3+2+3=13. 
 A Fa das notas 4,0, 5,0, 6,0, 7,0 e 8,0 é 5+3+2+3+2=15. 
 A Fa das notas 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 5+3+2+3+2+10=25 
Frequência Relativa Acumulada FRa (%) 
Conceito. Representado por FRa (%), significa a soma das freqüências relativas fr(%) até o elemento analisado. 
EXEMPLO 
   20% + 12% = 32% 
   frequência relativa acumulada (FRa)             Comentários aos cálculos 
Nota  f  fr(%)  Fa  FRa(%) 
4,0  5  20%  5  20% 
5,0  3  12%  8  32% 
6,0  2  8%  10  40% 
7,0  3  12%  13  52% 
8,0  2  8%  15  60% 
9,0  10  40%  25  100% 
f=25  100%  ‐  ‐ 
A frequência relativa acumulada FRa(%) é obtida conforme abaixo: 
 A FRa(%) de 4,0 é 20% (sempre repete a primeira). 
 A FRa(%) de 4,0 e 5,0 é 20+12 = 32% 
 A FRa(%) de 4,0, 5,0 e 6,0 é 20+12+8 = 40% 
 A FRa(%) de 4,0, 5,0, 6,0 e 7,0 é 20+12+8+12 = 52% 
 A FRa(%) de 4,0, 5,0, 6,0, 7,0 e 8,0 é 20+12+8+12+8 = 60% 
 A FRa(%) de 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 20+12+8+12+8+40=100% 
NOTA IMPORTANTE SOBRE DISTRIBUIÇÃO DE FREQUÊNCIA: 
Nota  f  fr(%)  Fa  FRa(%) 
25  100% 
f=25  100%  ‐  ‐ 
Para saber se o desenvolvimento da distribuição de freqüência por completo está 
correto, os valores ao lado, em vermelho, deverão coincidir. 
- 25 - 
Uanderson Rebula de Oliveira Estatística
Agrupamento em Classes 
Em uma distribuição de frequência, ao se trabalhar com grandes conjuntos de dados e com valores 
dispersos, podemos agrupá-los em classes. 
 Se um conjunto de dados  for muito disperso, uma  representação melhor seria através do agrupamento dos dados 
com a construção de classes de frequência. Caso isso não ocorresse, a tabela ficaria muito extensa. Veja abaixo: 
EXEMPLO 
Um radar instalado na Dutra registrou a velocidade (em Km/h) de 40 veículos, indicadas abaixo: 
   Velocidade de 40 veículos (Km/h) 
Distribuição de frequência 
É  fácil  ver  que  a  distribuição  de  frequências 
diretamente  obtida  a  partir  desses  dados  é 
dada uma tabela razoavelmente extensa. 
70  90  100    110   123 
71  93  102   115    123 
73  95  103   115  123 
76  97  105   115  123 
80  97  105   117  124 
81  97  109   117  124 
83  99  109   121  128 
86  99  109   121  128 
Nota  f 
70  1 
71  1 
73  1 
76  1 
80  1 
81  1 
83  1 
86  1 
90  1 
93  1 
95  1 
97  3 
99  2 
100  1 
102  1 
103  1 
105  2 
109  3 
110  1 
115  3 
117  2 
121  2 
123  4 
124  2 
128  2 
f=40 
       Distribuição de frequência com classes 
i  Velocidade (Km/h)  f 
1  70   80  4 
2  80   90  4 
3    90   100  8 
4     100   110  8 
5     110   120  6 
6     120   130  10 
f=40 
A distribuição em ”classes” é como se  fosse uma compressão dos dados.  Imagine se 
fizéssemos uma distribuição de frequência de todas velocidades (de 70 a 128). A tabela 
ficaria imensa! Por este motivo existe a distribuição de frequência com classes. 
Como criar uma Distribuição de Freqüência com classes 
1. Calcule a quantidade de classes (i), pela raiz da quantidade de dados. São 
40 veículos. Então,  40 = 6,3       i = 6 classes.
2. Calcule a amplitude de classe (h) que é o tamanho da classe, sendo:
 
Maior valor  – Menor valor      =    128 – 70  = 9,6        h=10
             quantidade de classes (i)      6 
Nota: o Maior valor  (128) e o Menor valor  (70) são obtidos da  lista dos registros das 
velocidades dos 40 veículos. 
3. Montar  as  classes  a  partir  do  Menor  valor  (70),  somando  com  a
amplitude de classe (10) até que se chegue na 6ª classe, assim:
TIPOS DE INTERVALOS DE CLASSE 
No  Brasil  usa‐se  o  intervalo    (Resolução  866/66  do  IBGE).  Já  na  literatura  estrangeira 
utiliza‐se comumente com intervalo fechado. 
CONCEITOS IMPORTANTES 
LIMITES DE CLASSE ‐   São os valores extremos de cada classe. No exemplo 70   80, 
temos que o limite inferior é 70 e o limite superior  80.  
AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT) – É a diferença entre o  limite superior da 
última classe e o limite inferior da primeira classe, no exemplo 130 – 70 = 60. 
AMPLITUDE AMOSTRAL  (AA) – É a diferença entre o valor máximo e o valor mínimo 
da amostra, no exemplo 128 – 70 = 58. 
i  Velocidade (Km/h) 
  1  70   +10    80 
2...  80   +10    90  
...6  120   +10   130 
Tipo  Representação  Dados do intervalo 
Aberto   70   80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 
Fechado à esquerda   70  80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 
Fechado    70  80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 
Fechado à direita    70   80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 
Classes
Limite 
inferior 
Limite 
superior 
- 26 - 
Uanderson Rebula de Oliveira Estatística
0
2
4
6
8
10
12
Q
ua
nt
id
ad
e d
e v
eí
cu
lo
s
Resultados dos registros 
de um radar
             70  75   80   85   90    95  100  105  110  115 120  125  130
Velocidade (Km/h) 
Abaixo vemos as distribuições de  frequências absoluta  f,  relativa  fr(%), absoluta acumulada Fa e  relativa acumulada FRa(%), 
bem como o Histograma desta distribuição. 
  Distribuição de freqüência com classes f, fr(%), Fa e FRa (%) 
OUTRAS REPRESENTAÇÕES GRÁFICAS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA 
Polígono de frequência – É um gráfico em linha que representa os pontos centrais dos intervalos de classe. 
Para construir este gráfico, você deve calcular o ponto central de classe (xi), que é o ponto que divide o intervalo de classe em 
duas partes iguais. Por exemplo, a velocidade dos veículos da 1ª classe pode ser representada por  70 + 80  = 75Km/h 
      2 
A construção de um polígono de frequências é muito simples. Primeiro, 
construímos  um  histograma;  depois marcamos  no  “telhado”  de  cada 
coluna o ponto central e unimos sequencialmente esses pontos. 
 Ogiva  –    (pronuncia‐se  o’jiva).  Conhecida  também  por  polígono  de  frequência  acumulada.  É  um  gráfico  em  linha  que 
representa as  freqüências acumuladas  (Fa),  levantada nos pontos correspondentes aos  limites  superiores dos  intervalos de 
classe. Para construí‐la, você deve elaborar o histograma de freqüência f em uma escala menor, considerando o último valor a 
freqüência acumulada da última classe, no caso, 40. 
i  Velocidade (Km/h)  f  Fr(%)  Fa  FRa(%) 
1  70   80  4  10%  4  10% 
2  80   90  4  10%  8  20% 
3   90   100  8  20%  16  40% 
4      100   110  8  20%  24  60% 
5      110   120  6  15%  30  75% 
6      120   130  10  25%  40  100% 
              f=40  100% 
i  Velocidade (Km/h)  f  xi 
1  70   80  4  75 
2  80   90  4  85 
3    90   100  8  95 
4   100   110  8  105 
5   110  120  6  115 
6   120   130  10  125 
              f=40 
i  Velocidade (Km/h)  f  Fa 
1  70   80  4  4 
2  80   90  4  8 
3   90   100  8  16 
4      100   110  8  24 
5      110   120  6  30 
6      120   130  10  40 
              f=40 
4 4
8 8
6
10
0
2
4
6
8
10
12
Q
ua
nt
id
ad
e d
e v
eí
cu
lo
s
Resultados dos registros 
de um radar
70         80        90         100       110        120       130 
Velocidade (Km/h) 
70   80
Ponto central
 75Km/h 
Velocidade (Km/h) 
4 4
8 8 6
10
0
5
10
15
20
25
30
35
40
Q
ua
nt
id
ad
e d
e v
eí
cu
lo
s
Resultados dos registros 
de um radar
70          80           90          100         110         120         130 
4 
8 
16 
24 
30 
40 
- 27 - 
Uanderson Rebula de Oliveira Estatística
3 
MEDIDAS RESUMO 
O que dizer se um professor quer saber sobre as notas dos 110 alunos de uma disciplina? Poderíamos, talvez, 
utilizar para  resposta uma  tabela com as  frequências das notas. Porém, o professor gostaria de uma  resposta 
rápida, que sintetize a informação que se tem, e não uma distribuição de frequência das notas coletadas. 
Para resumir a quantidade de informação contida em um conjunto de dados, utilizamos, em estatística, medidas 
que descrevem, POR MEIO DE UM SÓ NÚMERO, características desses dados. Veja exemplo abaixo. 
NOTAS DE ESTATÍSTICA DE 110 ALUNOS DA ESCOLA A 
5.6  8.3  4.5  8.7  3.9  9  5.5  7.9  9.5  10 
9.6  6.6  5.3  3  9.5  3.9  9  5.6  7  5.9 
7  8.9  2  8.7  9  3  8  6.7  4.2  6.5 
6.5  4.6  9.5  5.3  3.9  9  3  8.8  9  8.9 
7.1  6.5  3.9  4.9  9.4  5.3  9.5  2  5.3  7.5 
9.2  9.8  9.5  5.9  5.5  5  7  8.3  5.6  9 
6.1  5.6  4.9  6.5  9  9.6  7.5  7  9  4.5 
4.2  8.9  9.6  9.8  8  6.5  7.9  2  5  5.3 
7.3  8  9  5.6  1  9.8  4  9.5  3.6  5 
8.6  4.2  9.6  8.9  5.9  4.2  6  5.3  8  2.8 
9.2  9  9.8  3.9  8  9.5  3.3  8.4  5.3  4.5 
Para uma conclusão rápida, qual foi o desempenho desses alunos? Isto pode ser respondido com as medidas abaixo. 
Medidas resumo  Valor  Interpretação 
Média  6,5  Valor que representa o ponto de equilíbrio das notas (como uma gangorra). 
Mediana  7,0  50% dos alunos tiraram abaixo de 7,0. 
Moda  9,0  Nota que mais se repetiu. 
Desvio padrão ‐ DP  2,3  A maioria das notas está variando entre ±2,3 em torno da média 6,5 (4,2‐‐‐‐8,8) 
Coeficiente variação  34%  Há variação de 34% das notas em torno da média (complementa o DP). 
1º Quartil  5,0  25% dos alunos tiraram abaixo de 5,0. 
3º Quartil  9,0  75% dos alunos tiraram abaixo de 9,0. 
Através dessas informações é possível analisar o desempenho desses alunos. 
- 28 - 
Uanderson Rebula de Oliveira Estatística
3.1 MEDIDAS DE POSIÇÃO 
São medidas que utilizamos para obter um número que represente o valor central de um conjunto de dados. As Medidas de 
Tendência Central mais utilizadas são: Média, Mediana e Moda. 
MÉDIA 
MÉDIA SIMPLES - É uma medida que representa um valor típico ou normal num conjunto de dados. 
 A média  simples  serve  como um  “ponto de  equilíbrio”  em um  conjunto de dados  (como  o  ponto  de  apoio  de  uma 
gangorra). Cada dado tem igual importância e peso. Sofre a influência de todos os dados. 
      A Média simples é obtida pela seguinte equação: 
x  = x     →          soma dos valores dos dados 
  n      →              quantidade de dados 
A Média é representada por  x
(lê‐se “x barra”) 
EXEMPLO. Supondo que uma escola adote como critério de aprovação a Média 7,0 e, considerando as quatro 
notas de João e Maria durante o ano, informe se foram aprovados. 
Notas de João:   3,5  |  6,0  |  9,5  |  9,0  | 
x  = x       3,5 + 6,0 + 9,5 + 9,0 
  n     4 
x  = 7,0  →  aprovado
MÉDIA PONDERADA. Semelhante a Média simples, porém, atribuindo-se a cada dado um peso que 
retrate a sua importância. 
 O termo “ponderação” é sinônimo de peso, importância, relevância. Sugere, então, a atribuição de um peso a um determinado dado. 
Em alguns casos, os valores variam em grau de importância, de modo que podemos querer ponderá‐los apropriadamente. É calculada 
multiplicando‐se um peso por cada valor, fazendo com que alguns valores influenciem mais fortemente a média do que outros. 
A Média ponderada é obtida pela seguinte equação: 
px = (x . p)      →      soma dos valores . pesos
  p        →             soma dos pesos  
Vamos representar a 
Média ponderada por 
px
EXEMPLO Supondo que uma escola adote como critério de aprovação a Média 7,0, sendo que as provas bimestrais 
são ponderadas com pesos 1, 2, 3 e 4, respectivamente para o 1º bim, 2º bim, 3º bim e 4º bim. Considerando as 
notas de João (na ordem bimestral crescente), informe se foi aprovado. 
Notas de João:  | 9,0  |   8,0   |  6,0  |  5,0 
px = (x . p)
           p 
px =   (9,0 . 1) + (8,0 . 2) + (6,0 . 3) + (5,0 . 4) 
1+2+3+4 
px = 6,3  →  reprovado
Nota. Em uma média simples ele seria aprovado por 7,0. 
A atribuição de pesos  visa  fazer  com que  certos  valores  tenham mais  influência no  resultado do que outros. Também pode  ser 
aplicado em cálculos de índices de inflação, atribuindo pesos para setor de vestuário, alimentação, etc.
Média de João
3.5
6.0
7,0
9.5 9.0
0.0
2.0
4.0
6.0
8.0
10.0
N
ot
as
1º Bim 2º Bim Média 3º Bim 4º Bim
Bimestres
Média das notas de João 
9,0
1
8,0
2
6,3 6,0
3
5,0
4
0,0
2,0
4,0
6,0
8,0
10,0
No
ta
s e
 pe
so
s
1º Bim 2º Bim Média 3º Bim 4º Bim
Bimestres
Média ponderada das notas de João 
Média ponderada 
- 29 - 
Uanderson Rebula de Oliveira Estatística
MÉDIA DE DISTRIBUIÇÃO DE FREQUÊNCIA – aplica-se quando não se tem a lista original dos dados 
Quando  trabalhamos  com  uma  distribuição  de  frequência,  não  sabemos  os  valores  exatos  que  caem  em 
determinada  classe.  Para  tornar  possíveis  os  cálculos,  consideramos  que,  em  cada  classe,  todos  os  valores 
amostrais sejam iguais ao ponto central de classe. Por exemplo, considere o intervalo de classe 70    80, com 
uma frequência de 4. Admitimos que todos os 4 valores sejam iguais a 75 (o ponto central de classe). Com o total 
de 75 repetido 4 vezes, temos um total de 75 x 4 = 300. Podemos, então, somar esses produtos obtidos de cada 
classe para encontrar o total de todos os valores, os quais, então, dividimos pela quantidade de dados. 
É importante salientar que a distribuição de frequência resulta em uma aproximação da média 
porque não se baseia na lista original exata dos valores amostrais. 
CALCULANDO A MÉDIA DE DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALO DE CLASSE 
i  Velocidade (Km/h)  f  x  f . x 
1  70   80  4  75  300 
2  80   90  4  85  340 
3    90   100  8  95  760 
4     100   110  8  105  840 
5     110   120  6  115  690 
6     120   130  10  125  1250 
f=40  ‐  (f.x) = 4180 
Procedimento: 
1. Multiplicar  as  frequências  f  pelos  pontos  centrais
de classe x e adicionar os produtos. 
2. Somar as frequências f;
3. Somar os produtos (f.x);
4. Aplicar a fórmula abaixo:
x  =    (f.x)   →    4180  =  104,5 Km/h
   f     40 
Média a partir de um HISTOGRAMA COM INTERVALOS DE CLASSE: 
Não é necessário montar tabela. Veja na figura ao  lado 
que basta multiplicar a  freqüência pelo ponto médio e 
adicionar  os  produtos.  Depois,  divida  pela  soma  das 
freqüências. 
(4*75)+(4*85)+(8*95)+(8*105)+(6*115)+(10*125) 
        4+4+8+8+6+10      
x  =    (f.x)   →    4180  =  104,5 Km/h
   f     40 
CALCULANDO A MÉDIA DE DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALO DE CLASSE
Nota (x)   f 
(nº de alunos) 
f . x 
4,0  5  20 
5,0  3  15 
6,0  2  12 
7,0  3  21 
8,0  2  16 
9,0  10  90 
f=25  (f.x) = 174 
Quando a distribuição não tem agrupamentode classes, 
consideraremos  as  frequências  como  sendo  os  pesos 
dos elementos correspondentes: 
(5*4,0)+(3*5,0)+(2*6,0)+(3*7,0)+(2*8,0)+(10*9,0) 
        5+3+2+3+2+10      
x  =(f.x)   →    174  =  6,96
   f      25 
Média a partir de um HISTOGRAMA SEM INTERVALO DE CLASSE  Multiplique a freqüência por   “x”   (notas) e adicione os 
produtos. Depois, divida pela soma das freqüências. 
(5*4,0)+(3*5,0)+(2*6,0)+(3*7,0)+(2*8,0)+(10*9,0) 
        5+3+2+3+2+10      
x  =(f.x)   →    174  =  6,96
   f      25 
Ponto central de classe 
x               =  
4 4
8 8
6
1 0
0
2
4
6
8
10
12
Q
ua
nt
id
ad
e d
e v
eí
cu
lo
s
R e su ltad o s  do s  reg istro s  de  um  rad a r
70              80                90              100              110             120              130 
Velocidade (Km/h) 
  X             = 
5
3
2 3 2
10
0
2
4
6
8
10
12
N
úm
er
o d
e 
al
un
os
4.0 5.0 6.0 7.0 8.0 9.0
Nota
Desempenho dos alunos na prova
x 
 75              85             95            105           115           125 
x  x 
+ 
(4*75)+(4*85) ... 
- 30 - 
Uanderson Rebula de Oliveira Estatística
MEDIANA
Medida que representa o valor que está no MEIO de um conjunto de dados. 
Uma desvantagem da média simples é que ela é sensível a qualquer valor, de modo que um valor 
excepcional  (alto ou baixo) pode afetar drasticamente a média. A Mediana  supera grandemente 
essa desvantagem, pois não é afetada por valores extremos, de tal modo que você pode utilizar a 
mediana quando estão presentes valores extremos. 
Como achar a mediana de um conjunto de dados 
Para quantidade ÍMPAR de valores 
A Posição do termo central é dada por:      2
1nP 
Ex.: 12, 78, 69, 75, 80, 71, 82, 73, 785.    n=9 
2
19P    = 5     →      5ª posição 
A Md é o valor da 5º posição. Ordenando os dados, temos: 
 12, 69, 71, 73,     75    ,78, 80, 82, 785 
  1ª      2ª       3ª       4ª             5ª            6ª       7ª        8ª        9ª 
         Mediana 
Para quantidade PAR de valores 
As posições dos termos 
centrais são dadas por:  2
nP1     e     P2 = a que sucede P1
Ex.: 12, 78, 69, 75, 80, 71, 82, 73, 785, 995.   n=10 
2
10P1  = 5ª posição        e   P2 =  6ª posição 
A Md é o valor entre a 5º e 6ª posição. Ordenando os dados, temos: 
       12, 69, 71, 73,       75, 78      80, 82, 785, 995 
   1ª      2ª       3ª       4ª                  5ª       6ª               7ª      8ª         9ª        10ª 
       Mediana
A Md é a Média dos dois termos centrais.   2
7875Md   = 76,5 
MEDIANA de uma distribuição de frequência e Histograma SEM INTERVALOS DE CLASSE 
 
 Nota  f  Fa  Observações 
4,0  4  4  Da 1ª até a 4ª 
5,0  3  7  Da 5ª até a 7ª 
6,0  2  9  Da 8ª até a 9ª 
7,0  3  12    Da 10ª até a 12ª 
8,0  2  14   Da 13ª até a 14ª 
9,0  11  25   Da 15ª até a 25ª 
f = n = 25 → ímpar  
2
1nP     →  2
125 =  13ª
Os  dados  já  estão  ordenados.  Então  a 
Md é o valor da 13ª posição. Através da 
Fa fica fácil identificar a posição central: 
           Então, a nota Md = 8,0  
 f=25 
MEDIANA de uma distribuição de frequência e Histograma COM INTERVALOS DE CLASSE 
Acumule Fa e ache a posição da Md 
i  Velocidades  f  Fa 
1  70   80  4  4 
2  80   90  4  8 
3     90   100  8  16 
4   100   110  8  24 
5   110   120  6  30 
6   120   130  10  40 
     f=40 
Independente se n é ímpar ou par usa‐se a equação n/2.  Então, 40/2  = 20
A Md está na 20ª posição e será algum valor da classe mediana 100   110. A 
partir da equação abaixo podemos achar uma aproximação da Md. 
f
h* Fa  ‐  
2
n
 lMd
ant
inf  




l inf      =  limite inferior da classe mediana 
Faant =  Fa da classe anterior 
h       = amplitude do intervalo de classe 
f        = freqüência da classe mediana 
Resolvendo a equação, temos: 
8
10*16  ‐  
2
40
Md   



 100
Md = 105 Km/h, aproximadamente 
 
 
 
 
 
 
O total das frequências é 40.  Então, a Md será 40/2 = 20ª posição.  Observe 
pelo  Fa  que  a  classe  mediana  é  100    110.  Também  é  possível 
determinar l inf, Fa ant, h e f. Então, aplicando a equação, temos: 
8
10*16  ‐  
2
40
Md   



 100 = 105 km/h, aproximadamente 
 
0%           50%                  100%
Mediana 
4 4
8 8
6
10
0
2
4
6
8
10
12
Q
ua
nt
id
ad
e d
e v
eí
cu
lo
s
Resultados dos registros 
de um radar
70       80          90        100        110       120      130 
Velocidade (Km/h) 
Fa 
20ª Fa ant = 16 
(4+4+8) 
  ← h →
     10 
  f = 8
l inf 
 20ª 
    Md = 8,0
4
3
2 3 2
11
0
2
4
6
8
10
12
N
úm
er
o d
e a
lu
no
s
4.0 5.0 6.0 7.0 8.0 9.0
Nota
Desempenho dos alunos na prova
 Fa 13ª
- 31 - 
Uanderson Rebula de Oliveira Estatística
5
3
2
3
2
10
0
2
4
6
8
10
12
N
úm
er
o d
e a
lu
no
s
4,0 5,0 6,0 7,0 8,0 9,0
Nota
Desempenho dos alunos na prova
NOTA SOBRE A MEDIANA. A mediana é menos utilizada do que a média simples. A mediana pode ser aplicada quando existem valores 
discrepantes em um conjunto de dados. Por exemplo, se a renda per capita de sete famílias fosse: $240; $370; $410; $520; $630; $680 e $820, 
a mediana seria $520 e a média $524. Essas duas medidas poderiam representar este conjunto de dados. Mas se a renda de sete famílias fosse: 
$240; $370; $410; $520; $630; $680 e $10.000, o valor da mediana manter‐se‐ia o mesmo, enquanto a média simples passaria a ser $1.836, 
pois foi  influenciada pelo valor discrepante ($10.000), que não é uma medida  ideal para representar este conjunto de dados. A medida  ideal 
seria a mediana. Note que os valores discrepantes tem, pois, muito menor influência sobre a mediana do que sobre a média.  
Em  relação  à mediana  na  distribuição  de  freqüência  com  intervalos  de  classe,  admite‐se  que  as  velocidades  dos  veículos  se  distribuem 
continuamente. Nesse caso, a mediana é a velocidade para o qual a metade da freqüência total 40/2 = 20 fica situada abaixo e a outra acima
dele. Ora, a soma das três primeiras freqüências de classe é 4+4+8 = 16. Então, para obter a 20ª velocidade desejada, são necessários mais 4 
dos 8 casos existentes na 4ª classe. Como o quarto intervalo de classe, 100  110, a mediana situa‐se a 4/8 de distância, e é: 100 + 4/8 (110 – 
100)  = 105 km/h. Com a equação fica mais fácil encontrar a mediana pois não exige este tipo de raciocínio. 
MODA 
Medida que representa o valor que mais se REPETE em um conjunto de dados. 
Na linguagem coloquial, moda é algo que está em evidência, ou seja, algo que se vê bastante! Em estatística a moda é o valor que detém 
o maior número de observações, ou seja, o valor ou valores mais  frequentes em uma série de dados. A moda não é necessariamente
única, ao contrário da média simples ou da mediana. É especialmente útil quando os valores ou observações não são numéricos, uma vez 
que a média e a mediana podem não ser bem definidas. 
Exemplos: 
A série {1, 3, 5, 5, 5, 6, 6, 7} apresenta moda =  5, pois é o número que mais se repete.  
A série {1, 3, 5, 5, 6, 6, 7, 8} apresenta duas modas (Bimodal): 5 e 6, pois são os que mais se repetem.  
A série {1, 3, 5, 5, 6, 6, 7, 7} apresenta mais do que duas modas (Polimodal): 5, 6 e 7 
A série {1, 3, 2, 5, 8, 7, 9, 10} não apresenta moda = amodal, pois nenhum número se repete. 
MODA de uma distribuição de freqüência e Histograma SEM INTERVALOS DE CLASSE 
Notas dos alunos 
A Moda será a nota 9,0, pois é 
a  que  mais  se  repete  no 
conjunto de dados 
4,0  5,0  8,0  9,0 
4,0  6,0  9,0  9,0 
4,0  6,0  9,0  9,0 
4,0  7,0  9,0  9,0 
4,0  7,0  9,0 
5,0  7,0

Continue navegando