Buscar

Material de aula Estatística Aplicada à Investigação Social

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 50 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 50 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 50 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade Federal Fluminense - UFF
Polo Universitário de Campos dos Goytacazes, RJ
Professora: Simone Manhães Arêas Mérida
Estatística Aplicada à Investigação Social
CAPÍTULO I - O Desenvolvimento da Estatística
 Histórico
Embora a palavra estatística não existisse, há indícios de que 3000 anos a.C. já se faziam censos na Babilônia, China e Egito.
A própria Bíblia leva-nos a essa recuperação histórica: o quarto livro do Antigo Testamento (Números) começa com uma instrução a Moisés: “Fazer um levantamento dos homens de Israel que estiverem aptos para a guerra”.
Na época do imperador César Augusto, saiu um edito para que se fizesse o censo em todo o império romano (a palavra censo deriva de censere, que em latim, significa taxar). Tem-se nos registros bíblicos que, Maria e José viajaram de Nazaré para Belém, na época do nascimento de Jesus Cristo para que fossem recenseados.
A palavra Estatística vem de status (Estado, em latim) e sob essa palavra acumularam-se descrições e dados relativos ao Estado. A estatística, nas mãos dos Estadistas, constituiu-se verdadeira ferramenta administrativa.
Em 1805, Guilherme, “O Conquistador”, ordenou que se fizesse um levantamento estatístico da Inglaterra. Esse levantamento deveria incluir informações sobre terras, proprietários, uso da terra, empregados animais e serviria, também, de base para o cálculo de impostos. Tal levantamento originou um volume intitulado Domesday Book (dia do juízo final).
No século XVII ganhou destaque na Inglaterra, a partir das Tábuas de Mortalidade, a Aritmética Política, de John Graunt, que consistiu de exaustivas análises de nascimentos e mortes. Dessas análises resultou a conclusão, ente outras, de que a porcentagem de nascimentos de crianças do sexo masculino era ligeiramente superior à de crianças do sexo feminino.
A palavra estatística foi cunhada pelo acadêmico alemão Gottfried Achenwall por volta da metade do século XVIII.
 Conceituação
A Estatística possui alguns conceitos antigos. Ela ainda é usada como simples contagem aritmética; como sinônimo de dados publicados oficialmente ou como transformações matemáticas. Assim, é comum ouvir alguém dizer: “Aqui estão as estatísticas sobre o jogo realizado ontem!”
Eis alguns conceitos modernos para a Estatística:
“É a parte matemática aplicada que se ocupa em obter conclusões a partir de dados observados”.
“É a estimativa de um parâmetro a partir de uma amostra” (parâmetro é o elemento numérico usado para caracterizar todo o conjunto).
“Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos” (para a Estatística, somente interessam os fatos que englobem um grande número de elementos, pois ela busca encontrar leis de comportamento para todo o conjunto e não se preocupa com cada um dos elementos em particular).
 Campos de Aplicação
A Estatística encontra aplicações em quase todos os campos da atividade humana.
O Estado e a Sociologia têm necessidade de conhecer as populações por seus efetivos, por sexo, idade, estado civil, profissão, nacionalidade, etc. O nível cultural de um povo pode ser indicado pela proporção dos que sabem ler e escrever, em relação ao total de habitantes e pelo número de alunos das escolas. As tábuas de mortalidade, confrontadas de tempos em tempos, ou com as de outros países, permitem avaliar a evolução do grau de sanidade física.[2: A tábua completa de mortalidade da população brasileira, estimada pelo IBGE – Instituto Brasileiro de Geografia e Estatística é um modelo demográfico que descreve a incidência da mortalidade ao longo das idades e resume, numericamente, as condições gerais de saúde de uma população. A tábua de mortalidade é importante instrumento de avaliação das políticas públicas no campo da Saúde. www.ibge.gov.br]
Os serviços de meteorologia, tão importantes para a navegação aérea e marítima, são essencialmente estatísticos, com seus estudos de temperaturas, pressões, quedas de chuva, umidade, ventos, etc. Na agricultura, a Estatística serve como orientador seguro, fornecendo informações sobre colheitas, rendimento das terras, valores da produção e outros. Na indústria e no comércio pode-se comparar produções e volumes de vendas em relação ao total por região, estudar a situação dos mercados e suas tendências.
Grandes serviços a Estatística presta à Biologia, desde o “homem médio” de Quetelet, passando pela teoria da hereditariedade de Mendel, até as infinitas aplicações de hoje. A Geografia conclui através de estudos estatísticos as densidades demográficas, correntes migratórias, climas, etc.
Na informática também encontramos importantes aplicações, entre elas: avaliação de desempenho de redes de computadores, assim como aplicações em redes neurais artificiais e mineração de dados, na Inteligência Artificial.
E ainda, na História e Literatura, onde trabalhos estatísticos estudam a extensão dos períodos, coincidências, pontuações e estilos.
 Método Científico
1.4.1. Método
Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso e outros, por necessidades práticas, sem aplicação de um método. Atualmente, quase todo acréscimo resulta da observação e de um estudo. Se bem que muitos desses conhecimentos possam ter sido observados inicialmente por acaso, a verdade é que desenvolvemos processos científicos para seu estudo e para adquirirmos tais conhecimentos.
Por definição Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. Dentre os métodos científicos, vamos destacar o método experimental e estatístico.
 O método experimental: consiste em manter constantes todas as causas (fatores) e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. E o método preferido no estudo das Ciências da natureza, como a Física, a Química, etc.
O método estatístico: muitas vezes há necessidade de descobrir fatos em um campo em que o método experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto se faz variar a causa que, naquele momento interessa. (Como exemplo, pode-se citar a determinação das causas que definem preço de uma mercadoria. Para ser aplicado o método experimental, terá que fazer variar a quantidade da mercadoria e verificar se tal fato irá influenciar seu preço, porém, seria necessário que não houvesse alteração nos outros fatores. Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salários, o gosto das outras necessidades etc. mas isso tudo é impossível).
O método estatístico, embora mais difícil e menos preciso, diante da impossibilidade de manter as causas constantes, admite todas as causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas.
O campo da estatística lida com a coleta, a apresentação, a análise e o uso dos dados para tomar decisões, resolver problemas e planejar produto e processos. Devido a muitos aspectos da prática envolver o trabalho com dados, obviamente algum conhecimento de estatística é importante para os profissionais. Especificamente, técnicas estatísticas podem ser uma ajuda poderosa no planejamento de novos produtos e sistemas, melhorando os projetos existentes e planejando, desenvolvendo e melhorando os processos de produção.
1.5 Ramos Básicos da Estatística:
1.5.1- Estatística Descritiva ou Análise Exploratória de Dados: é a parte da estatística referente a coleta, a organização e a descrição dos dados. Tem por objetivo descrever e analisar determinada população, sem pretender tirar conclusões de caráter mais genérico. Nesta fase não se tira conclusões. Vamos resumir (ou descrever) um conjunto de dados para que possamos fazer a inferência. 
1.5.2- Estatística Indutiva ou Inferência Estatística: é a fase onde interpretamos e generalizamos as informações. É a parte da estatística que, baseando-se em resultadosobtidos da análise de uma amostra da população procura-se inferir, induzir ou estimar as leis de comportamento da população da qual a amostra foi retirada.
Esta fase aborda 2 problemas fundamentais: a estimação de parâmetros de uma população e os testes de hipóteses. 
EXEMPLO: Uma amostra grande de homens com 48 anos de idade foi estudada durante 18 anos. Entre 60% e 70% dos homens solteiros estavam vivos aos 65 anos de idade. Entre os homens casados, 90% estavam vivos aos 65 anos. Que parte do estudo representa a Estatística descritiva? Que conclusões podem ser tiradas desse estudo usando a estatística inferencial?
Solução: A estatística descritiva inclui afirmações tais como “entre 60% e 70% dos homens solteiros estavam vivos aos 65 anos de idade” e “entre os homens casados, 90% estavam vivos aos 65 anos”. Uma possível inferência tirada desse estudo é a de que o fato de ser casado está associado com uma vida mais longa para os homens.
Quase todos os dias, estamos expostos à Estatística. Veja alguns trechos de jornais e revistas:
“As escolas brasileiras têm em média 18 computadores em funcionamento, segundo pesquisa do Comitê Gerenciador da Internet (CGI) sobre o uso de tecnologia da informação e comunicação (TIC) na rede de ensino municipal e estadual”. (Fonte: Jornal Valor Econômico 10/08/2011).
As vendas do comércio varejista subiram 0,2% em junho ante maio, na série com ajuste sazonal, informou hoje o Instituto Brasileiro de Geografia e Estatística (IBGE)”. (Fonte: www.exame.abril.com.br 11/08/2011).
“Cerca de 110 mil construções em Campos pagam IPTU” (Fonte: Folha da Manhã 31/01/07)
As informações que acabamos de ler baseiam-se em um levantamento de dados. 
Dados: são informações provenientes de observações, contagens, medidas ou respostas. 
	Muitas vezes, os dados são apresentados graficamente.
Quando lidamos com os dados, é importante conhecermos a FONTE destes dados. Antes de aceitar a verdade de um número, pergunte de onde veio e se não existe outro mais significativo.
1.6 População e Amostra
População é o conjunto da totalidade dos indivíduos sobre o qual se faz uma inferência. Pode-se classificar pelo tamanho, sendo finita, quando a população possui um número determinado de elementos e infinita, quando possui um número infinito de indivíduos.
Amostra é um subconjunto finito, representativo ou não, da população em estudo. Essa representatividade ocorre quando ela apresenta as mesmas características gerais da população da qual foi extraída.
 
“Importante: A menos que uma população seja pequena, geralmente é impraticável obter todos os seus dados. Na maior parte dos estudos, a informação deve ser obtida a partir de uma amostra”.
Exemplo: Em um levantamento recente, perguntou-se a 3.002 adultos no Brasil, se eles liam notícias na Internet pelo menos uma vez por semana. Seiscentos adultos responderam que sim. 
População resposta de todos os adultos do Brasil. Amostra resposta dos 3002 adultos.
 Qual o conjunto de dados?
R: São as 600 respostas positivas e as 2.402 respostas negativas.
 Variáveis
	Definição - Variável é o conjunto de resultados possíveis de um fenômeno. São os dados a serem estudados de uma população ou amostra. As características a serem estudadas são chamadas de Variáveis (designadas por letras latinas x, y, z).
Classificação dos Tipos de Variáveis:
Qualitativas = são expressas por atributos, registros não-numéricos.
Exemplo: Cor dos olhos dos alunos, religião; gênero, estado civil.
Quantitativas = são expressas em números.
Exemplo: Índice de liquidez das indústrias fluminenses; produção de café no Brasil, nº. de defeitos em aparelhos de TV.
As variáveis quantitativas podem ser:
b1) Discreta - quando os valores são expressos através de nºs. inteiros, normalmente resulta de contagens.
Exemplo: nº. de clientes de uma loja pode ser 1, 2, 10, 15; mas não podem ser 2,5; 3,79. Logo o nº. de clientes é uma variável discreta.
 
 b2) Contínua - quando pode assumir qualquer valor correspondente ao conjunto de nºs reais, resulta normalmente de medições. 
Exemplo: as prestações a serem pagas pelos clientes são uma variável contínua, pois pode ser R$51,20 ou R$ 172,50, etc.
1.8 Amostragem - Técnica especial para escolher as amostras. Deve garantir o acaso da escolha, ou seja, cada elemento da população tem a mesma chance de ser escolhido. 
As principais técnicas de amostragem são: Amostragem aleatória simples; Amostragem proporcional estratificada e Amostragem sistemática.
1.9 Técnica de Arredondamento de Dados
Como, frequentemente, o pesquisador realiza medidas em suas experiências que resultam em números decimais, é conveniente que se estabeleçam algumas regras de arredondamento de dados, baseadas na Resolução 886/66 do IBGE.
Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3, ou 4, fica inalterado o último algarismo a permanecer.
Ex: 53,24 arredondado para o décimo mais próximo será igual a 53,2.
 13,39 arredondado para o inteiro mais próximo será igual a 13.
 6,2483 arredondado para i centésimo mais próximo será igual a 6,25.
Quando o primeiro algarismo a ser abandonado é 6, 7, 8 ou 9, aumenta-se de uma unidade o último algarismo a permanecer.
Ex: 42,17 arredondado para o décimo mais próximo será igual a 42,2.
 53,91 arredondado para o inteiro mais próximo será igual a 54.
 23,678 arredondado para i centésimo mais próximo será igual a 23,68.
Quando o primeiro algarismo a ser abandonado é 5, há duas soluções:
c.1) Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade ao algarismo a permanecer.
Ex: 2,352 arredondado para o décimo mais próximo será igual a 2,4.
 76,5001 arredondado para o inteiro mais próximo será igual a 77.
 23,6554 arredondado para i centésimo mais próximo será igual a 23,66.
c.2) Se o 5 for o último algarismo ou se só se seguirem zeros, o último algarismo a ser conservado só será aumentado de uma unidade se for ímpar.
Ex: 24,75 arredondado para o décimo mais próximo será igual a 24,8.
 24,65 arredondado para o décimo mais próximo será igual a 24,6.
 53,50 arredondado para o inteiro mais próximo será igual a 54.
 23,6750 arredondado para o centésimo mais próximo será igual a 23,68.
 23,7650 arredondado para o centésimo mais próximo será igual a 23,76.
CAPÍTULO II – ANÁLISE EXPLOTATÓRIA DE DADOS
2.1 Levantamento Estatístico - É um processo técnico que associa números a fenômenos coletivos com o objetivo de se obter conclusões. Na análise exploratória dos dados (a Estatística Descritiva) vamos trabalhar com as seguintes etapas:
 COLETA ORGANIZAÇÃO RESUMO ANÁLISE
 dos dados dos dados dos dados dos dados
Amostra (coleta direta e coleta indireta)
Coeficientes
Informações (parâmetros)
Tabelas e Gráficos 
2.2 Série Estatística – é toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou de espécie.
Pode-se inferir que numa série, podemos classificá-las em:
- Séries históricas: cronológica, temporais ou marchas. Descreve os valores da variável, em determinado local, discriminados segundo intervalo de tempo variável.
Séries geográficas: espaciais, territoriais ou de localização. Descrevem os valores da variável, em determinado instante, discriminados segundo regiões.
Séries específicas ou categóricas: Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especializações ou categorias.
Séries conjugadas: Em cada tabela descrevem a variação de mais de uma variável, istoé, faz-se à conjugação de duas ou mias séries.
2.3 Tabelas
Um dos objetivos da Estatística é sintetizar os valores que uma determinada variável pode assumir, de forma que tenhamos uma visão global da variabilidade dessa variável. E isso ela consegue, inicialmente, apresentando esses valores em tabelas e gráficas, que irão nos fornecer informações rápidas e seguras a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas.
Tabela: é um quadro que resume um conjunto de observações. Uma tabela compõe-se de:
Título: conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê? Onde? Quando? Fica localizado no topo da tabela. As perguntas do título referem-se respectivamente à espécie ou categoria, ao lugar e ao tempo. Essas tabelas, que apresentam esses tipos de informações, são denominadas Séries Estatísticas.
Corpo: conjunto de linhas e colunas que contém informações sobre a variável em estudo;
Cabeçalho: parte superior da tabela que especifica o conteúdo das linhas;
Coluna indicadora: parte da tabela que especifica o conteúdo das linhas;
Linhas: retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas;
Casa ou células: espaço destinado a um só número;
Há ainda a considerar os elementos complementares da tabela, que são:
Fonte, Notas e Chamadas: colocados de preferência no seu rodapé.
Obs.: De acordo com a resolução nº. 886 da Fundação IBGE, nas casas ou células devemos colocar:
um traço horizontal (--) quando o valor é zero, não só quanto à natureza das coisas, como quanto ao resultado do inquérito;
três pontos (...) quando não temos dados;
um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor;
zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são expressos em numerais decimais, precisaremos acrescentar à parte decimal um número correspondente de zeros (0,0; 0,00; 0,000).
2.4 Forma de Distribuição de Dados
Os dados constituem a matéria prima da estatística e através deles o pesquisador busca seu objetivo, analisando-os, verificando os resultados e testando hipóteses acerca da natureza da realidade.
Nesta seção serão apresentadas as maneiras de se manipular os dados coletados em uma pesquisa, por exemplo, de modo que sejam agrupados visando à simplificação de sua utilização e compreensão.
Dados Brutos: é uma seqüência de valores numéricos não organizados, obtidos diretamente da observação de um fenômeno coletivo.
Se representarmos por X a característica observada no fenômeno coletivo, então x1 representa o valor da característica obtida na primeira observação do fenômeno coletivo, x2 representa o valor da segunda característica e assim sucessivamente.
Assim, os dados podem ser representados por X: x1, x2, x3, ..., xn. 
Rol é uma seqüência ordenada dos Dados Brutos. Portanto, quando ordenados na forma crescente ou decrescente, os dados brutos passam a se chamar Rol.
Exemplo: Observando as notas de 30 alunos em uma prova, obtivemos os seguintes dados: 
X: 7,5; 3,5; 5,0; 4,5; 4,5; 5,0; 7,5; 3,5; 4,5; 4,5; 2,0; 3,5; 6,0; 3,0; 3,5;
 4,5; 7,5; 4,5; 3,0; 7,5; 6,0; 4,5; 4,5; 6,0; 3,5; 7,5; 6,0; 4,5; 5,0; 3,0.
Se arrumarmos os dados brutos em rol, ficará da seguinte forma:
Rol: {2,0; 3,0; 3,0; 3,0; 3,5; 3,5; 3,5; 3,5; 3,5; 4,5; 4,5; 4,5; 4,5; 4,5; 4,5;
 4,5; 4,5; 4,5; 5,0; 5,0; 5,0; 6,0; 6,0; 6,0; 6,0; 7,5; 7,5; 7,5; 7,5; 7,5}.
Os dados quantitativos coletados em um problema podem ser agrupados segundo uma distribuição de freqüência simples ou uma distribuição de freqüência agrupada.
2.4.1 Distribuição de freqüências é o arranjo dos valores e suas respectivas freqüências absolutas. 
2.4.1.1 - Distribuição de Freqüências – Variável Discreta
A variável é discreta quando assume valores em pontos da reta real. Exemplo: número de erros em um livro: 0, 1, 2, 3, ...
EXEMPLO NUMÉRICO - Dado uma série qualquer...
	Xi
	3
	4
	7
	8
	12
	fi
	2
	5
	8
	4
	3
Tem-se que xi são os valores da variável x e fi corresponde à freqüência simples (repetição) de cada valor de xi. Determina-se a média da seguinte forma:
	i
	Xi
	fi
	fri
	Fi
	Xi . fi
	1
	3
	2
	0,0909
	2
	6
	2
	4
	5
	0,2273
	7
	20
	3
	7
	8
	0,3636
	15
	56
	4
	8
	4
	0,1818
	19
	32
	5
	12
	3
	0,1364
	22
	36
	
	
	22
	1
	
	150
Freqüência simples ou absoluta (fi): chama-se freqüência simples ou absoluta de uma classe ou de um dado o número de observações correspondentes a essa classe ou a esse dado. 
	Obs.: Repare que o somatório das freqüências simples (fi) é igual ao número total de observações (n).
Freqüência acumulada (FiAC): é a soma da freqüência simples deste elemento com as freqüências simples dos elementos que o antecedem. 
Freqüência relativa simples (fri) - é a relação da freqüência simples (fi) deste elemento pelo número total (n) de elementos da série. 
EXEMPLO PRÁTICO – O gerente do departamento de uma instituição financeira deseja analisar o número diário de operações fechadas nos últimos dois anos por um operador de seu departamento de opções de ações negociadas na Bolsa de Valores. Na tabela seguinte foi registrada uma amostra probabilística simples de tamanho vinte e seis, extraída das operações diárias fechadas pelo Operador B nos últimos dois anos. 
	Ordem (i)
	Operações fechadas por dia (Xi)
	Dias (fi)
	(fri)
	FiAC
	1
	11
	2
	0,0769
	2
	2
	12
	5
	0,1923
	7
	3
	13
	6
	0,2308
	13
	4
	14
	7
	0,2692
	20
	5
	15
	3
	0,1154
	23
	6
	16
	2
	0,0769
	25
	7
	17
	1
	0,0385
	26
	
	
	26
	1
	
Análise da tabela de freqüências absolutas:
O número máximo de 17 operações diárias fechadas pelo Operador B aconteceu em apenas um dia da amostragem.
Entretanto, o valor mínimo 11 se repetiu em dois dias.
Em seis dias da amostragem o operador B fechou 13 operações por dia, e em sete dias da amostragem fechou 14 operações por dia.
2.4.1.2 - Distribuição de Freqüências – Variável Contínua
A variável será contínua quando assumir, teoricamente, qualquer valor em um determinado intervalo da reta real. Exemplo: peso dos alunos: 50,5 Kg; 50,572 Kg; ...
Exemplo:
O grande atacadista “W” da cidade “C”, no mês de setembro de 2004, utiliza uma empacotadora automática para embalar os pacotes de 5,00Kg de açúcar cristal, que ele já comercializava anteriormente, porém, medidos por balanças, num processo bem artesanal.
Sempre preocupado em fazer bons negócios, o empresário tratou de conferir o trabalho da máquina (é de fundamental importância para ele, estar tranqüilo com o Instituto de Pesos e Medidas “IPM”). Mandou que fosse medida a massa (pelo processo artesanal) de uma amostra aleatória de trinta pacotes (empacotados pela máquina), que resultou desta operação os dados abaixo:
	4,60
	4,65
	4,68
	4,72
	4,75
	4,76
	4,78
	4,78
	4,79
	4,80
	4,80
	4,82
	4,83
	4,84
	4,85
	4,86
	4,87
	4,89
	4,90
	4,91
	4,92
	4,93
	4,93
	4,95
	4,97
	4,99
	5,00
	5,04
	5,06
	5,08
A EXPLORAÇÃO destes dados está apresentada na tabela, nos gráficos, nas informações e nos coeficientes apresentados abaixo:
	i
	Classes
	fi
	fri
	FiAC
	XI
	xi.fi
	
	
	
	1
	4,60 ___ 4,68
	2
	0,07
	2
	4,64
	9,28
	-0,22
	0,0484
	0,0968
	2
	4,68 ___ 4,76
	3
	0,10
	5
	4,72
	14,16
	-0,14
	0,0196
	0,0588
	3
	4,76 ___ 4,84
	8
	0,27
	13
	4,80
	38,40
	-0,06
	0,0036
	0,0288
	4
	4,84 ___ 4,92
	7
	0,23
	20
	4,88
	34,16
	+0,02
	0,0004
	0,0028
	5
	4,92 ___ 5,00
	6
	0,20
	26
	4,96
	29,76
	+0,10
	0,0100
	0,0600
	6
	5,00 ___ 5,08
	4
	0,13
	30
	5,04
	20,16
	+0,18
	0,0324
	0,1296
	
	---
	30
	1,00
	---
	---
	145,92
	---
	---
	0,3768
FONTE: Dados hipotéticos retirados dos registros apresentados pelos responsáveis da empresa “W”.
Setorgrama:No resumo temos os parâmetros:
 Moda Mediana Média Desvio-padrão
 
	Na análise, temos os coeficientes: 
	Segundo Pearson, houve simetria entre os elementos (os diâmetros dos eixos produzidos pela empresa “H S/A”)
	Supondo que o Instituto que inspeciona os pesos (IPM) exige desta empresa, que:
	Exigência I: os pacotes por ela lançados no mercado não podem apresentar massa inferior a mais de 1% do valor nominal (menos de 4.950g);
Penalidade: (multa de R$ 10.000,00)
	Exigência II: os pacotes por ela lançados no mercado não podem apresentar massa inferior a mais de 5% do valor nominal (menos de 4.750g);
Penalidade: (fecha a empresa e o responsável é preso por estar lesando o consumidor gravemente)
Vamos supor que o “IPM” esteja inspecionando os pacotes embalados por esta empacotadora. Ao retirar um pacote ao acaso, há chances:
1ª. a) De este empresário ser multado, se a sua resposta for positiva, qual é a probabilidade disto ocorrer?
1ª. b) De este empresário ser preso por estar lesando gravemente o consumidor, se a sua resposta for positiva, qual é a probabilidade disto ocorrer?
2ª. Em relação às informações da questão anterior, o empresário chegou à conclusão que, se algum pacote estiver a 1% do valor nominal, ele vai ter problemas não contornáveis, seja com o “IPM” ou com o seu bolso. Num montante de dois mil pacotes embalados por esta empacotadora automática, quantos pacotes podem esperar que criem problemas não contornáveis para o mesmo?
3ª. Estabeleça um intervalo de confiança com cinco pontos percentuais de possibilidade de erro e interprete para uma pessoa que não estudou esse conteúdo, o que isto representa?
Vamos entender os passos da EXPLORAÇÃO:
Frequentemente o pesquisador depara-se com a necessidade de trabalhar com um volume muito grande de dados, em que a amplitude dessas observações também é grande . Neste caso, a apresentação dos dados agrupados na forma nominal torna-se de difícil leitura, no sentido de que se esvazia o conteúdo das informações. Desse modo, objetivando simplificação e melhor compreensão dos dados, costuma-se agrupa-los em classes e construir uma distribuição de freqüências agrupadas. Cada categoria ou grupo nesta distribuição assim condensada recebe o nome de intervalo de classe, cujo tamanho é determinado pela quantidade de marcas ou escores nele contido. Na determinação do tamanho e da quantidade de classes, as seguintes normas devem ser observadas:
As classes devem abranger todas as observações;
O extremo superior de uma classe é o extremo inferior da classe subjacente;
Cada valor observado deve enquadrar-se em apenas uma classe;
A quantidade de classes, de modo geral, não pode ser calculada a partir do número de observações (n) através do critério da raiz.
Construção da Variável Contínua
Número de classes (K)
Utilizando o critério da raiz: 
 O valor de K deve ser o valor inteiro mais próximo de , uma unidade a menos ou a mais que este valor.
Exemplo: n = 30 . 
Portanto, o valor mais próximo é 5. As opções para K então são 4 ou 5 ou 6.
Amplitude de classes (h) – tamanho das classes basta dividir a amplitude total (AT) pelo número de classes (k).
Amplitude Total (AT) de um conjunto de observações é igual a diferença entre o maior e o menor elemento de uma seqüência. Então, pode ser representada por: AT=X máx – X mín
Assim como no caso do número de classes (K), a amplitude das classes (h) deve ser aproximada para o maior inteiro. Deve ser escolhido o valor de h mais fácil de se operar.
Intervalo de classe é qualquer subdivisão da amplitude total de uma série estatística.
Limite das classes - cada intervalo de classe fica caracterizado por dois números reais. O menor valor é chamado limite inferior (li) e o maior valor é chamado de limite superior (ls). Assim, se a classe for 2 ___ 4, o limite inferior será o valor 2 e o limite superior será o valor 4.
Pontos médios das classes (xi) - é a média aritmética entre o limite superior (ls) e o limite inferior (li) da classe. Assim, se a classe for 2 ___ 4, teremos:
, como ponto médio da classe.
Obs.: O ponto médio de uma classe é considerado como o seu valor representativo, ou seja, para efeito de análise estatística dos dados faz-se a suposição de que todos os valores da classe coincidem com seu ponto médio.
	Passos para construir uma distribuição de freqüência a partir de uma variável contínua.
Decida sobre o número de classes a serem incluídas na distribuição de freqüência;
Determine a amplitude da classe;
Calcule os limites de classes. Você pode usar a entrada mínima dos dados como o limite inferior da primeira classe, adicione a amplitude da classe ao limite inferior remanescente. Lembre-se de que as classes não podem se sobrepor.
Conte quantos dados deverão constar em cada classe para determinar a freqüência simples de cada classe.
Exemplo:
Y: {2,0; 2,5; 3,0; 3,5; 4,0; 4,0; 4,0; 4,5; 4,5; 5,0; 5,0; 5,0; 5,0; 5,5; 5,5;
 5,5; 6,0; 6,0; 6,0; 6,5; 6,5; 6,5; 7,0; 7,5; 7,5; 7,5; 8,0; 8,5; 9,0; 9,5}.
Tabela de Freqüências para Variáveis contínuas
	Classe
	Notas
	fi
	Fri
	Fi
	FRi
	1
	2,0 ___ 3,5
	 3
	3/30 = 0,10 
	3
	3/30 = 0,10 
	2
	3,5 ___ 5,0
	6
	6/30 = 0,20 
	9
	9/30 = 0,30 
	3
	5,0 ___ 6,5
	10
	10/30 = 0,33 
	19
	19/30 = 0,63 
	4
	6,5 ___ 8,0
	 7
	7/30 = 0,23 
	26
	26/30 = 0,87 
	5
	8,0 ___ 9,5
	4
	4/30 = 0,13 
	30
	30/30 = 1,00
	
	
	n = 30
	1,00
	
	
Na apresentação das tabelas, podemos notar que:
Os valores da freqüência simples (fi) nos mostram o número de vezes que o elemento figura no conjunto de dados;
Os valores da freqüência acumulada (Fi) nos mostram a soma da freqüência simples de tal elemento com as freqüências simples dos elementos que o antecedem;
Os valores da freqüência relativa (fri) representam a participação percentual de cada elemento da série.
2.5 Somatório ou Notação Sigma
Somatório – Notação Sigma () – quando queremos representar uma soma de n valores do tipo X1+ X2+ ...+ Xn , podemos codificá-la a través da expressão:
X1+ X2+X3+ ...+ Xn = 
Onde:
 - é utilizada para representar as operações de adição entre as parcelas.
Xi – é a parcela genérica.
A parcela genérica é obtida tornando-se os termos constantes em todas as parcelas, no caso X. Para representar a parte variável em cada parcela, no caso os índices, utilizamos a letra i e indicamos a variação de i. 
A expressão deve ser lida: “soma dos valores Xi, para i variantes de 1 até n”.
Se apenas parte dos valores é que deve ser somada, usam-se índices para indicá-los. Assim, 
2.6 Medidas de Posição ou de Tendência Central
As medidas de tendência central são usadas para indicar um valor que tende a tipificar, ou a representar melhor, um conjunto de números. As três medidas mais usadas são a média, a mediana e a moda.
2.6.1.1 Média Aritmética Simples (ou Me)	
É a idéia que ocorre à maioria das pessoas quando se fala em “média”. Calcula-se a média aritmética determinando-se a soma dos elementos (ou valores) e dividindo-a pelo número de elementos no conjunto. Assim, se um estudante fez quatro provas e obteve as notas 83, 94, 95 e 86, sua nota média será: 
A média aritmética simples de uma amostra é representada pelo símbolo (leia-se “X barra”), e seu cálculo pode expressar-se para uma seqüência numérica X: X1, X2, ..., Xn, em notação sigma como segue.
2.6.1.2 Dados Agrupados: Média Aritmética Ponderada
Para uma seqüência numérica X: X1, X2, ..., Xn, afetados por pesos p1, p2, ..., pn, respectivamente, a média aritmética ponderada, que designaremos por é definida como:
 ou 
Exemplo 1:
Se um professor informar aos alunos que haverá dois exames, valendo cada um 30% do total de pontos do curso, e um exame final valendo 40%. O cálculo da média aritmética ponderada deve levar em conta os pesos desiguais dos exames.Assim, o estudante que obtém 80 no primeiro exame, 90 no segundo, e 96 no exame final, terá uma média final de 89,4:
	Exame
	Nota
	Peso
	Nº 1
	80
	0,30
	Nº 2
	90
	0,30
	final
	96
	0,40
	
	
	1,00
2.6.2 Mediana (Md) - A Mediana (Md) é um valor que ocupa a posição central de uma série.
Sua característica principal é dividir um conjunto ordenado de dados em dois grupos iguais. S o número de observações n for ímpar, a Mediana será o elemento central (de ordem ). Caso n seja par, a Mediana era a média aritmética entre os elementos centrais (de ordem e ou e ).
Para calcular a mediana, é necessário primeiro ordenar os valores em ordem crescente. 
2.6.2.1 Cálculo da Mediana - Dados não-agrupados (Dados Brutos ou Rol)
a) Md = 4
b) 
2.6.2.2 Cálculo da Mediana - Variável Discreta
No caso da variável discreta, aplica-se o mesmo raciocínio anterior.
Exemplo:
Título......
	I
	Xi
	Fi
	FiAC
	1
	3
	2
	2
	2
	4
	5
	7
	3
	7
	8
	15
	4
	8
	4
	19
	5
	12
	3
	22
	
	---
	22
	---
 Classe que contém o valor mediano. 
Fonte: ....
A posição do termo central é . 
Na freqüência acumulada (Fi) podemos localizar o 11º elemento da série que é 7. A freqüência acumulada imediatamente superior a 11. Logo, .
Interpretação: 50% dos valores da série são menores ou iguais a 7 e 50% dos valores da série são maiores ou iguais a 7.
Não confundir Mediana com Posição da Mediana que é dada por: .
2.6.2.3 Cálculo da Mediana - Variável Contínua
1º passo: achar a posição da mediana dada por: 
2º passo: através da Freqüência Acumulada (Fi) identificar a classe que contém a mediana.
3º passo: utiliza-se a fórmula:
 Onde:
 – limite inferior da classe mediana;
n – número de elementos da série;
Fant – Freqüência acumulada da classe anterior à 
 classe mediana 
 fmd – freqüência simples da classe mediana;
 h – amplitude do intervalo de classe.
Exemplo:
 Título......
	Classes
	fi
	Fi
	35 ___ 45
	5
	05
	45 ___ 55
	12
	17
	55 ___ 65
	18
	35
	65 ___ 75
	14
	49
	75 ___ 85
	6
	55
	85 ___ 95
	3
	58
	
	58
	
 3ª classe que contém o valor mediano
 Fonte: ......
1º passo: º;
2º passo: Através da freqüência acumulada (Fi), encontrar a classe que contém a 29,5º posição;
3º passo: aplicar a fórmula: 
= 55 n = 58 =17 = 18 
Aplicando a fórmula:
2.6.3 Moda (MO) - a Moda é o elemento mais freqüente da distribuição e será denotada por Mo. Se nenhum elemento se destaca pela maior freqüência, o conjunto de dados não possui moda, então chamaremos de amodal.
2.6.3.1 Cálculo da Moda 
Exemplos:
A: 2, 8, 3, 5, 4, 5, 3, 5, 5, 1. 
Mo = 5. É uma seqüência unimodal.
B: 6, 10, 5, 6, 10, 2. 
Mo = 6 e Mo =10. É uma seqüência bimodal.
C; 2, 2, 5, 8, 5, 8. 
Neste caso, todos os elementos da série apresentam a mesma freqüência, então diremos que a série é amodal.
2.6.3.2 Cálculo da Moda - Variável Discreta
Exemplos:
	Xi
	fi
	73
	02
	75
	12
	77
	12
	79
	05
A maior freqüência observada na segunda coluna é o 12 e corresponde ao s elementos 75 e 77 da série. Portanto, é uma série bimodal com Mo = 75 e Mo = 77.
	Xi
	fi
	4
	3
	5
	3
	8
	3
	10
	3
Todos os elementos da série possuem a mesma freqüência. Portanto, a série é amodal.
2.7 Medidas de Assimetria
As distribuições de freqüência de um conjunto de dados podem diferir não só em termos das medidas de posição e de dispersão, mas também com relação à forma característica das respectivas curvas (representações gráficas denominadas curvas de freqüências). Com relação à forma, as curvas características das distribuições de freqüências podem ser deformadas (ou não) se comparadas com um certo padrão de referência ( Curva de Distribuição Normal ou Curva de Gauss ). 
Caso não haja coincidência da média, da mediana e da moda, a distribuição é dita assimétrica e a curva característica é enviesada (deformada) para um dos lados.
COEFICIENTE DE ASSIMETRIA DE PEARSON
Me – Mo 
≅
 3.( Me – Md )
 Pearson propôs a seguinte relação empírica entre a MÉDIA, a MODA e a MEDIANA.
PROPRIEDADES DA ASSIMETRIA
Dado o coeficiente de assimetria de certa distribuição de dados:
1ª
 - o seu módulo indica o grau de enviesamento; 
2ª
 - o sinal indica o lado da inclinação
 se positivo, a inclinação é para a esquerda;
 se negativo, a inclinação é para a direita.
No caso dos coeficientes segundo Pearson, por exemplo, se Mo < Md < Me então : 
 
e
1
 > 0 
e 
e
2
 > 0 
 e a 
assimetria
 é dita à 
esquerda
. 
Caso contrário se assimetria 
Me < Md < Mo
 então 
 
e
1
 < 0 
 e 
 e
2
 < 0 
 e a 
assimetria
 é dita à 
direita
.
Em relação à 
MEDIANA
;
e
2
 = 
Em relação à 
MODA
;
e
1
 = 
Representação gráfica da posição relativa à MÉDIA, MEDIANA e MODA
 	 curva SIMÉTRICA (ou segundo Gauss NORMAL)
 	 curva ASSIMÉTRICA POSITIVA
 	 curva ASSIMÉTRICA NEGATIVA
	
	
Resumo:
Segundo PEARSON pode-se medir o grau de simetria dos elementos trabalhados em relação à dispersão destes, isto é possível através do COEFICIENTE DE ASSIMETRIA:
Em relação à 
MEDIANA
;
e
2
 = 
Em relação à 
MODA
;
e
1
 = 
 
 ou
Para se fazer análise através do coeficiente de Pearson (que resultou do cruzamento de três parâmetros), é preciso observar a tabela abaixo:
Assim. Negativo
 SIMÉTRICO 
Assim. Positivo
 
__
 e<0
_______._ __
e 
 0
____._____
 e>0
___
 
-0,50 0,50
 
Exemplo: Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.
	Intervalos de classes
	fi
	Fi
	xi
	xi. fi
	
	 3___ 5
	 1
	1
	4
	4
	16,81
	 5___ 7
	 2
	3
	6
	12
	8,82
	 7___ 9
	 13
	16
	8
	104
	0,13
	 9___11
	 3
	19
	10
	30
	10,83
	11___13
	 1
	20
	12
	12
	15,21
	
	 20
	
	
	 162
	 51,8
 
 CURVA ASSIMÉTRICA POSITIVA FRACA
2.8 Medidas Separatrizes
São números reais que dividem a seqüência ordenada de dados em partes que contém a mesma quantidade de elementos da série.
Percentis - os percentis dividem um conjunto de dados em cem partes iguais. Assim:
0% 1% 2% 3% . . . 50% . . . 98% 99% 100%
 
 P1 P2 P3 P50 P98 P99 
2.8.1 Cálculo das Medidas Separatrizes - Dados Brutos ou Rol
1º passo – ordenar os elementos obtendo o Rol;
2º passo – identificar o percentil correspondente;
3º passo – calcular o i% de n, ou seja, para localizar a posição do percentil i no Rol;
4º passo – identificar o elemento (xi) que ocupa esta posição;
Exemplo: Calcule o P25 da seqüência X: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15.
Solução: X: 1, 2, 5, 5, 5, 8, 10, 11, 12, 12, 13, 15.
Calcula-se 25% de 12, que é o número de elementos da série , obtendo: 
 P25 é o 3º elemento do Rol. Então, P25 = 5.
Interpretação: 25% dos valores desta seqüência são valores menores ou iguais a5 e 75% dos valores desta seqüência são valores maiores ou iguais a 5.
2.8.2 Cálculo das Medidas Separatrizes - Variáveis Discretas
1º passo – calcular o i% de n, ou seja, para localizar a posição do Pi;
2º passo – identificar o elemento que ocupa esta posição;
Exemplo: Calcule P40 para a série.
	xi
	fi
	Fi
	2
	3
	03
	4
	5
	08
	5
	8
	16
	7
	6
	22
	10
	2
	24
	
	24
	
Solução:
1º passo - calcula-se 40% de 24, ou seja, . 
A posição do percentil está compreendida entre o 9º e o 10º elemento da série.
2º passo - a média dos valores que ocupam estas posições é .
Assim, P40 = 5
Interpretação: 40% dos valores desta seqüência são valores menores ou iguais a 5 e 60% dos valores desta seqüência são valores maiores ou iguais a 5.
2.9 Medidas de Dispersão - São medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média. Servem para medir a representatividade da média.
Sejam as séries:
X: 10; 1; 18; 20; 35; 3; 7; 15; 11; 10.
Y: 12; 13; 13; 14; 12; 14; 12; 14; 13; 13.
Z: 13; 13; 13; 13; 13; 13; 13; 13; 13; 13.
Tem-se: 
Apesar de as séries terem a mesma média, são seqüências completamente distintas do ponto de vista da variabilidade de dados. Na série X existem muitos elementos bastante diferenciados da média 13. A série Y há forte concentração em torno da média 13 e apresenta fraca dispersão de dados. Já na série Z, não há variabilidade de dados, ou seja, não há dispersão. Assim, a média é muito mais representativa para a série Z do que para a série X.
As principais medidas de dispersão absoluta são: Amplitude Total, Desvio Médio Simples, Variância e Desvio-Padrão. Todas elas, exceto a Amplitude Total, têm na média o ponto de referência.
2.9.1 Amplitude Total (AT) – é a diferença entre o maior e o menor dos valores da série.
At = X máx – X mín
Comentário: Apesar da facilidade de obtenção da amplitude total, esta é uma medida que tem pouca sensibilidade estatística, pois depende apenas de dois valores. É possível modificar completamente a dispersão ou a concentração dos elementos em torno da média, sem alterar a amplitude total da série.
2.9.2 Variância ( ou ) – é uma média aritmética calculada a partir dos quadrados dos desvios obtidos entre os elementos da série e sua média.
Para o caso do cálculo da variância populacional, a fórmula é:
 
2 indica variância populacional e lê-se sigma ao quadrado.
 da fórmula é a média da população.
Para o caso do cálculo da variância amostral, a fórmula é:
Como você deve ter observado, as diferenças entre as fórmulas são: para o caso da variância populacional , utiliza-se a média populacional tendo como denominador o tamanho da população (N). Para o cálculo da variância amostral , utiliza-se a média amostral , tendo como denominador o tamanho da amostra menos um: (n – 1).
2.9.3 Desvio-padrão ( ou s) – é a raiz quadrada positiva da variância.
 é o desvio-padrão populacional
 é o desvio-padrão amostral
Observando-se a fórmula original para o cálculo da variância, nota-se que é uma soma de quadrados. Dessa forma, se a unidade da variável for, por exemplo, metro (m) teremos como resultado metro ao quadrado (m2). Para se ter a unidade original, necessita-se definir outra medida de dispersão, que é a raiz quadrada da variância – o desvio-padrão. 
Interpretação do desvio-padrão
Como o desvio-padrão é a medida de dispersão mais importante, é fundamental que se consiga relacionar o valor obtido do desvio-padrão com os dados da série.
Quando uma curva de freqüência representativa da série é perfeitamente simétrica como a curva abaixo, podemos afirmar que:
o intervalo contém aproximadamente 68% dos valores;
o intervalo contém aproximadamente 95% dos valores;
o intervalo contém aproximadamente 99% dos valores . 
						68%
 95%
 99%
 
 Cerca de 68% da área está a dois desvios padrão.
 Cerca de 95% da área está a dois desvios padrão.
 
 Cerca de 99% da área está a dois desvios padrão.
Quando se afirma que uma série apresenta média e desvio-padrão , pode-se interpretar estes valores da seguinte forma:
Os valores da série estão concentrados em torno da média .
O intervalo [95; 105] contém aproximadamente, 68% dos valores da série.
O intervalo [90; 110] contém aproximadamente, 95% dos valores da série.
O intervalo [85; 115] contém aproximadamente, 99% dos valores da série.
É importante que se tenha percebido que, ao aumentar o tamanho do intervalo, aumenta-se o percentual de elementos contido no intervalo.
2.9.4 Coeficiente de Variação – trata-se de uma medida relativa de dispersão útil para a comparação em termos do grau de concentração em torno da média de séries distintas. 
 ou 
Onde:
 = desvio-padrão populacional
 s = desvio-padrão amostral
 = média aritmética
O coeficiente de variação é expresso em porcentagens.
EXERCÍCIOS DE FIXAÇÃO
1º Estudo de Caso
Um novo material poderá substituir o cimento em determinados casos na construção civil, por apresentar um custo e um peso menor. Um técnico conhecedor das ferramentas disponibilizadas pela Estatística foi requisitado pelo laboratório do “L”, na cidade de Campos dos Goytacazes/RJ no início de março de 2004, para apresentar informações sobre a resistência deste material. Para fazer uma boa exploração, o companheiro utilizou os recursos do laboratório desta instituição e conseguiu registrar as pressões máximas suportadas por trinta corpos de provas, no S.I., dados estes que estão expressos a seguir:
	7,3N/m2
	4,0N/m2
	6,6N/m2
	10,0N/m2
	7,9N/m2
	4,8N/m2
	5,6N/m2
	6,2N/m2
	5,0N/m2
	8,6N/m2
	9,0N/m2
	5,8N/m2
	8,4N/m2
	8,9N/m2
	7,6N/m2
	4,5N/m2
	7,1N/m2
	6,1N/m2
	7,N/m2
	3,0N/m2
	8,2N/m2
	5,2N/m2
	5,3N/m2
	6,0N/m2
	7,5N/m2
	6,4N/m2
	6,8N/m2
	7,7N/m2
	5,4N/m2
	2,8N/m2
2º Estudo de Caso
A vida útil de trinta pneus, em dias, foi monitorada pelo gerente de transporte “Y”, da Distribuidora “W”, na cidade de “C. G” em janeiro de 2004. Os dados abaixo registram estes desgastes:
	700
	845
	690
	712
	850
	725
	788
	750
	810
	735
	800
	650
	710
	755
	720
	660
	860
	745
	880
	827
	760
	775
	900
	840
	600
	750
	815
	640
	715
	790
Esses valores devem ser explorados convenientemente por você, para que se possa fazer confirmações sobre a população no futuro (estimações). Sabe-se que na exploração, depois da ORGANIZAÇÃO dos dados em tabelas e gráficos, deve-se RESUMI-LOS (através dos parâmetros como: Porcentagem, Moda, Mediana, Média Aritmética e Desvio-padrão) e analisá-los (segundo o grau de dispersão e o grau de assimetria).
3º Estudo de Caso
No polígono de freqüências dados a seguir, temos retratado na organização dos dados, o número de problemas por programa, encontrado no primeiro semestre de 2003 pelos técnicos da Empresa “Y” que utilizam os softwares rodados no linux, na cidade de “São João da Barra”.
fi 10
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
 0 10 16 22 28 34 40 46 52
 	Número de problemas encontrados pelos técnicos por programa
4º Estudo de Caso
	Uma amostra de canos plásticos com 2,00” de diâmetro, produzidos num certo processo fabril, foi monitorada pelo gerente de produção “W” da empresa “Y”, localizada na cidade de “Macaé” em fevereiro de 2004. Abaixo temos os registros das medidas encontradas deste canos.
	2,01”
	2,05”
	2,06”
	2,06”
	2,01”
	2,00”
	2,07”
	2,03”
	2,05”
	2,04”2,03”
	2,04”
	1,97”
	2,07”
	2,06”
	2,04”
	2,02”
	2,02”
	2,04”
	1,99”
	2,02”
	2,06”
	2,02”
	2,01”
	1,95”
	1,99”
	2,03”
	1,97”
	2,01”
	2,09”
	2,04”
	1,99”
	1,98”
	2,03”
	2,04”
	2,00”
	1,98”
	1,99”
	1,97”
	2,03”
	2,04”
	2,01”
	2,03”
	1,99”
	2,00”
	2,01”
	2,03”
	2,00”
	2,01”
	2,06”
2.10 Representação Gráfica de Séries Estatísticas
A representação gráfica das séries estatísticas tem por finalidade representar os resultados obtidos, permitindo chegar-se a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. 
Há várias maneiras de representar graficamente uma série estatística, podendo citar entre elas os gráficos em linhas; em colunas; em barras; em porcentagens complementares etc. Contudo, os elementos simplicidade, clareza e veracidade devem ser considerados na elaboração de um gráfico.
Nosso interesse estará voltado para os gráficos de análise da série estatística que são: Gráficos setoriais, Histograma, Polígono de freqüência e a Curva polida de freqüência.
 Gráficos Setoriais – é um dos mais simples recursos gráficos, pois consiste em um círculo cujos setores ou partes do mesmo círculo totalizam 100%. Eles são especialmente úteis quando se tem como objetivo representar diferenças de freqüências entre categorias de nível nominal. Quando os dados são agrupados em intervalos de classes os outros tipos de gráficos são preferíveis aos setoriais.
Os gráficos setoriais são também conhecidos em linguagem “popular”, não cientifica, como gráfico de “pizza” ou gráfico de “torta”. A seguir, um exemplo de aplicação de gráfico setorial.
Exemplo: 
Suponha que a população de 2000 estudantes de uma determinada universidade apresente as seguintes origens:
 Título:........
	i
	Origem dos alunos
	Freqüência (fi)
	fri %
	1
	Urbana
	240
	12
	2
	Suburbana
	1400
	70
	3
	Rural
	360
	72
	
	Total
	2000
	100
 Fonte:.....
2.10.1.1 Gráfico de colunas ou Histograma 
Histograma para Variável Discreta - é um gráfico de colunas que representa a distribuição de um conjunto de dados. Um histograma possui as seguintes propriedades:
A escala horizontal é quantitativa e mede os valores dos dados (Xi).
A escala vertical mede as freqüências dos dados (fi).
Considerando uma série qualquer:
	xi
	2
	3
	3,5
	4,5
	5
	6
	7,5
	fi
	1
	3
	5
	9
	3
	4
	5
Então, o histograma assume a forma:
Histograma – Variável Contínua - É um conjunto de retângulos justapostos, representados em um sistema de coordenadas cartesianas, cujas bases são intervalos de classe e cujas alturas são valores proporcionais às freqüências simples correspondentes. Considerando a série das variáveis contínuas acima:
	Classe
	Intervalo de classe
	fi
	1
	2 ___ 4
	 04
	2
	4 ___ 6
	12
	3
	6 ___ 8
	10
	4
	 8 ___ 10
	 04
Então o histograma assume a forma:
Se unirmos os pontos médios das bases superiores destes retângulos, obtemos uma nova figura chamada polígono de freqüência, onde a área é a mesma do histograma. 
Quando estamos trabalhando com um censo, o histograma representa diretamente a distribuição de freqüência da população, mas quando estamos trabalhando com uma amostra, o histograma representa apenas a distribuição de freqüência da amostra e não da população.
No entanto, se imaginarmos o número n de elementos da amostra aumentando progressivamente, o número de classes iria aumentando progressivamente e a amplitude do intervalo de classe iria diminuindo, o que transformaria o polígono de freqüência praticamente em uma figura polida, chamada curva polida de freqüência.
EXERCÍCIOS PROPOSTOS I – ANÁLISE EXPLORATÓRIA DOS DADOS
1.	Uma pesquisa sobre a idade, em anos de uma classe de calouros de uma faculdade, revelou os seguintes valores:
18; 17; 18; 20; 21; 19; 20; 18; 17; 19;
20; 18; 19; 18; 19; 21; 18; 19; 18; 18;
19; 19; 21; 20; 17; 19; 19; 18; 18; 19;
18; 21; 18; 19; 19; 20; 19; 18; 19; 20;
18; 19; 19; 18; 20; 20; 18; 19; 18; 18.
Construa a distribuição de frequências para estes dados e o histograma.
2.	Um banco selecionou ao acaso 25 contas de pessoas físicas em uma agência, em determinado dia, obtendo os seguintes saldos em unidades monetárias:
52.500,00 18.300,00 35.700,00 43.800,00 22.150,00
 6.830,00 3.250,00 17.603,00 35.603,00 7.800,00
16.323,00 42.130,00 27.606,00 18.350,00 12.521,00
25.300,00 31.452,00 39.610,00 22.450,00 7,380,00
28.000,00 21.000,00 14.751,00 39.512,00 17.319,00
Construa a distribuição de frequências para estes dados e o histograma.
3.	Calcule o salário médio, construa o histograma e o polígono de frequências para a série representativa de uma amostra dos salários de 25 funcionários selecionados em uma empresa.
	I
	Salários $
	Número de funcionários
	1
	1.000,00 ___ 1.200,00
	02
	2
	1.200,00 ___ 1.400,00
	06
	3
	1.400,00 ___ 1.600,00
	10
	4
	1.600,00 ___ 1.800,00
	05
	5
	1.800,00 ___ 2.000,00
	02
4.	Calcule a média aritmética da distribuição:
	Classes
	fi
	2 ___ 4
	05
	4 ___ 6
	10
	6 ___ 8
	14
	8 ___ 10
	08
	10 ___12
	03
	
	40
5.	Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O lote só é aprovado se apresentar um peso superior a 4 quilos. Se as unidades que compõem determinado lote pesam: 3; 4; 3,5; 5,0; 3,5; 4; 5; 5,5; 4; 5; este lote será aprovado? Qual o peso médio do produto?
6.	Uma loja vende cinco produtos básicos A, B, C, D, E. O lucro por unidade comercializada destes produtos vale respectivamente $200,00; $300,00; $500,00; $ 1.000,00; $ 5.000,00. A loja vendeu em determinado mês 20; 30; 20; 10; 5 unidades respectivamente. Qual foi o lucro médio por unidade comercializada por esta loja?
7.	A média mínima para aprovação em determinada disciplina é 5,0. Se um estudante obtém as notas 7,5; 8,0; 3,5; 6,0; 5,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questão, pergunta-se se ele foi ou não aprovado.
Têm-se $2.000,00 disponíveis, mensalmente, para a compra de determinado artigo que custou, nos meses de junho, julho e agosto, respectivamente, $ 200,00; $ 500,00 e $ 700,00. Qual foi o custo médio do artigo para esse período? Qual foi a média do dinheiro que sobrou?
9.	O salário de 40 funcionários está distribuído segundo o quadro abaixo. Calcule o salário médio, mediano e o salário mais frequente destes funcionários. Calcule também o desvio-padrão.
	I
	Salários $
	Nº. de funcionários (fi)
	1
	400,00 ___ 500,00
	12
	2
	500,00 ___ 600,00
	15
	3
	600,00 ___ 700,00
	08
	4
	700,00 ___ 800,00
	03
	5
	800,00 ___ 900,00
	01
	6
	900,00 ___ 1.000,00
	01
10.	Uma loja de departamentos selecionou um grupo de 54 notas fiscais, durante um dia e obteve a seguinte tabela. Calcule o valor médio e mediano das notas fiscais e seu desvio-padrão.
	I
	Valores $
	Nº. de notas fiscais (fi)
	1
	0 ___ 50
	10
	2
	50 ___ 100
	28
	3
	100 ___ 150
	12
	4
	150 ___ 200
	02
	5
	200 ___ 250
	01
	6
	250 ___ 300
	01
11.		O departamento de recursos humanos de uma empresa, tendo em vista o aumento de produtividade de seus vendedores, resolveu, premiar com um aumento de 5% no salário, a metade de seus vendedores mais eficientes. Para isto, fez um levantamento de vendas semanais, por vendedor, obtendo a tabela:
	I
	Vendas $
	Nº. de vendas (fi)
	1
	 0 ___ 10.000
	10
	2
	10.000 ___ 20.000
			28
	3
	20.000 ___ 30.000
	12
	4
	30.000 ___ 40.000
	02
	5
	40.000 ___ 50.000
	01
Determine a mediana da distribuição e interprete o valor obtido.
12.	A distribuição de frequência abaixo representa idade de 50 alunos de uma classe de primeiro ano de uma Faculdade.
	Xi
	17
	18
	19
	20
	21
	fi
	3
	18
	17
	8
	4
Calcule:
a) Q1 b) K3 c)D1 d) Q3 e) P95
13.	A tabela de frequências relativas a seguir apresenta os salários, em reais, dos trabalhadores de certo empreendimento:
	Salários
	Frequências relativas (%)
	 400 ___ 500
	16
	 500 ___ 600
	26
	 600 ___ 700
	15
	 700 ___ 800
	24
	 800 ___ 900
	10
	 900 ___ 1000
	05
	1000 ___ 1100
	03
	1100 ___ 1200
	01
O terceiro quartil desses salários é melhor indicado por:
(A) 760,00; (B) 775,00; (C) 785,00 (D) 790,00; (E) 800,00.
14.	(AGU, 2006) - As notas de dez alunos num exame estão dadas a seguir:
	2
	5
	8
	3
	6
	5
	8
	7
	6
	10
O desvio-padrão e a variância dessas notas podem ser expressos, respectivamente, por:
(A) 1,8 e 4,6; (B) 2,0 e 2,2; (C) 2,3 e 5,2; (D) 2,0 e 4,6; (E) 2,0 e 1,9.
15.	(AFRF, 2005) Para dados agrupados representados por uma curva de frequências, as diferenças entre os valores da média, da mediana e da moda são indicadores da assimetria da curva. Indique a relação entre essas medidas de posição para uma distribuição negativamente assimétrica.
a) A média apresenta o maior valor e a mediana se encontra abaixo da moda.
b) A moda apresenta o maior valor e a média se encontra abaixo da mediana.
c) A média apresenta o menor valor e a mediana se encontra abaixo da moda.
d) A média, a mediana e a moda são coincidentes em valor.
e) A moda apresenta o menor valor e a mediana se encontra abaixo da média.
Resolução:
O sinal que caracteriza uma curva como assimétrica positiva ou negativa segundo Pearson, é dado pela diferença entre a média aritmética e a moda, da distribuição considerada.
Para curvas desviadas para a esquerda ou para a direita a mediana se localiza entre a média aritmética e a moda.
Para que a curva seja assimétrica negativa, a média aritmética será menor do que a moda, portanto, teremos a seguinte relação: Média aritmética < mediana < moda
Portanto as alternativas b e c são corretas
16.	O grau, ao qual os dados numéricos tendem a dispersar-se em torno de um valor médio chama-se:
a) média.
b) variação ou dispersão dos dados.
c) mediana.	
d) correlação ou dispersão.
e) moda.
17.	Em uma empresa, o salário médio dos homens é de $4.000, com desvio-padrão de $1.500 e, o salário médio das mulheres é de $3.000, com desvio-padrão de $1.200. A dispersão relativa dos salários é maior para os homens ou para as mulheres?
18.	(FISCAL DO TRABALHO -1994) O levantamento de dados sobre os salários de 100 funcionários de uma determinada empresa forneceu os seguintes resultados:
	Quantidade de salários mínimos
	Nº de empregados
	02 ___ 04
	25
	04 ___ 06
	35
	06 ___ 08
	20
	08 ___ 10
	15
	10 ___ 12
	05
 
É correto afirmar que:
20% dos funcionários recebem acima de 6 salários mínimos;
A mediana é de 7 salários mínimos;
60% dos funcionários recebem menos que 6 salários mínimos;
O salário médio é de 7 salários mínimos;
80% dos funcionários recebem de 6 a 8 salários mínimos.
(ENGENHEIRO DO BNDES – 2008)	Para um estudo sobre a distribuição de salário mensal dos empregados de uma empresa foram coletados os salários de uma amostra aleatória de 50 empregados. Os resultados levaram à construção da distribuição de frequência abaixo. Não existem observações coincidentes com os extremos das classes.
	Classe (em salários mínimos)
	Frequência relativa acumulada
	1 – 3
	40
	3 – 5
	70
	5 – 7
	90
	7 - 11
	100
A média aritmética e a variância amostral da distribuição valem, aproximadamente:
	Opções
	Média amostral (em salários mínimos)
	Variância amostral (em salários mínimos2)
	(A)
	2,6
	2,2
	(B)
	2,6
	2,9
	(C)
	4,1
	2,9
	(D)
	4,1
	5,0
	(E)
	7,2
	12,1
20.	CESGRANRIO (Engenheiro (a) de Produção Junior - Petrobras/2008)
A média e a mediana do conjunto de números (4; 10; 9; 3; 4; 6), respectivamente, são:
(A) 5 e 4 (B) 5 e 6 (C) 6 e 4 (D) 6 e 5 (E) 6 e 6
21.	CESGRANRIO (Analista de Sistemas – Desenvolvimento de Aplicações, IBGE/2010)
A tabela abaixo apresenta a distribuição de freqüências das idades de um grupo de crianças.
	Classes (em anos)
	fi
	0 ___ 2
	5
	2 ___ 4
	2
	4 ___ 6
	4
	6 ___ 8
	2
	8 ___10
	7
A média das idades dessas crianças, em anos, é:
(A) 5,0 (B) 5,2 (C) 5,4 (D) 5,6 (E) 5,8
22 – CESGRANRIO (Analista de Sistemas – Desenvolvimento de Aplicações, IBGE/2010)
A tabela abaixo apresenta a distribuição de frequências das idades de um grupo de crianças.
	Classes (em anos)
	fi
	0 ___ 2
	5
	2 ___ 4
	2
	4 ___ 6
	4
	6 ___ 8
	2
	8 ___10
	7
A mediana da distribuição de frequências apresentada é
(A) 5,5 (B) 5,6 (C) 5,7 (D) 5,8 (E) 5,9
23 – CESGRANRIO (Analista de Sistemas – Desenvolvimento de Aplicações, IBGE/2010)
No último mês, Alípio fez apenas 8 ligações de seu telefone celular cujas durações, em minutos, estão apresentadas no rol abaixo. 
5 2 11 8 3 8 7 4 
O valor aproximado do desvio padrão desse conjunto de tempos, em minutos, é
(A) 3,1 (B) 2,8 (C) 2,5 (D) 2,2 (E) 2,0
24 – (Analista Judiciário – TRT – 3 ª Região (MG) FCC/2009)
Considere:
I. Dados demográficos incluem informações sobre uma população tais como a sua composição por sexo, raça e idade.
II. Estatísticas vitais lidam com nascimentos, mortes, casamentos, divórcios e ocorrências de doenças.
III. Em demografia, o conceito de taxa e de proporção têm o mesmo significado.
IV. Pirâmide etária é uma representação gráfica da composição da população de um lugar em função da idade e do sexo, em um determinado período de tempo. 
Está correto o que se afirma APENAS em:
(A) I e II (B) I, II e IV (C) II, III e IV (D) II e III (E) III e IV
2
5 – (Engenheiro (a) de Produção - ELETROBRAS / 2007)
Dados os valores da tabela abaixo, a média e a variância populacionais da variável 0 – 1 são, respectivamente:
	X
	P(x)
	0
	0,30
	1
	0,70
(A) 0,5 e 0,21; (B) 0,5 e 0,10; (C) 0,7 e 0,21; (D) 0,9 e 0,49; (E) cálculo impossível sem a máquina calculadora.
26 - 14 – (Analista Judiciário – TRT- 3ª Região (MG) FCC/2009)
Considere uma curva de uma distribuição estatística unimodal apresentando o valor da mediana superior ao valor da moda e o valor da média aritmética superior ao valor da mediana. Então, com relação às medidas de assimetria e curtose é correto afirmar que se trata se uma curva apresentando uma distribuição:
Leptocúrtica. 
Platicúrtica.
Assimétrica à esquerda.
Assimétrica à direita.
Com coeficiente de curtose igual ao da curva normal.
27 – ESAF – 2005 (Receita Federal - Auditor Fiscal da Receita Federal – Área Tecnológica da Informação – Prova I e Área Tributária Aduaneira – Prova I
Em uma determinada semana uma empresa recebeu as seguintes quantidades de pedidos para os produtos A e B:
	Produto A
	39
	33
	25
	30
	41
	36
	37
	Produto B
	50
	52
	47
	49
	54
	40
	43
Assinale a opção que apresente os coeficientes de variação dos dois produtos:
CVA=15,1% e CVB=12,3%
CVA=16,1% e CVB=10,3%
CVA=16,1% e CVB=12,3%
CVA=15,1% e CVB=10,3%
CVA=16,1% e CVB=15,1%
28 – (Engenheiro do BNDES - 2008)
24 Para um estudo sobre a distribuição de salário mensal dos empregados de uma empresa foram coletados os salários de uma amostra aleatória de 50 empregados. Os resultados levaram à construção da distribuição de frequência abaixo. Não existem observações coincidentes com os extremos das classes.
	Classe (em salários mínimos)
	Frequência relativa acumulada
	1 – 3
	40
	3 – 5
	70
	5 – 7
	90
	7 – 11
	100
A média aritmética e a variância amostral da distribuição valem, aproximadamente:2,6 e 2,2 (B) 2,6 e 2,9
(C) 4,1 e 2,9 (D) 4,1 e 5,0
7,2 e 12,1
Gabarito Exercícios Propostos I - Páginas 37 a 46
Questão 1
Tabela de frequências para variáveis discretas
	I
	Variável (Xi)
	Frequencia (fi)
	Frequencia relativa (fri)
	Porcentagem (%)
	Frequencia Acumulada (Fiac)
	Frequencia relativa acumulada (Friac)
	1
	17
	3
	0,06
	6
	3
	0,06
	2
	18
	18
	0,36
	36
	21
	0,42
	3
	19
	17
	0,34
	34
	38
	0,76
	4
	20
	8
	0,16
	16
	46
	0,92
	5
	21
	4
	0,08
	8
	50
	1,00
	Total
	...
	50
	1,00
	100
	...
	...
 Fonte : Dados hipotéticos
Histograma para variáveis discretas
 Fonte : Dados hipotéticos
Questão 2
Tabela de frequências para variáveis contínuas
	i
	Classes
	fi
	fri
	(%)
	Fiac
	Friac
	1
	 3.250 ___ 11.458
	4
	0,16
	16
	4
	0,16
	2
	11.458 ___19.666
	7
	0,28
	28
	11
	0,44
	3
	19.666 ___ 27.874
	5
	0,20
	20
	16
	0,64
	4
	27.874 ___ 36.082
	4
	0,16
	16
	20
	0,80
	5
	36.082 ___ 44.290
	4
	0,16
	16
	24
	0,96
	6
	44.290 ___ 52.498
	0
	0,00
	0
	24
	0,96
	7
	52.498 ___ 60.706
	1
	0,04
	4
	25
	1,00
	Total
	...
	25
	1,00
	100
	...
	...
		Fonte : Dados hipotéticos
Histograma para dados agrupados em classes
 Fonte : Dados hipotéticos
Questão 3
Média aritmética - 
Histograma
Fonte: Dados hipotéticos
Polígono de freqüências
 Fonte : Dados hipotéticos
Questão 4 - Média aritmética - 
Questão 5 - Média aritmética - 
Questão 6 - Média aritmética - 
Questão 7 - Média aritmética - 
Questão 8 - Média aritmética - 
Questão 9 - Moda - e Desvio-padrão - 
Questão 10 - Moda – Mediana – Média aritmética – 
 Coeficiente de assimetria - Desvio-padrão - 
Questão 11 - Mediana - 
Questão 12 - a) b) c) 
 d) e) 
Questão 13 - Letra B - 
Questão 14 - Letra C – Desvio médio = 1,8 e Variância = 5,2
Questão 15 - Letras B e C estão corretas.
Questão 16 - Letra B 
Questão 17 - CVH = 37,5% e CVM = 40,0%
Questão 18 - Letra C
Questão 19 – Letra D
 Questão 20 - Letra D
Questão 21 - Letra C
Questão 22 - Letra A
Questão 23 - Letra B 
Questão 24 - Letra B
Questão 25 - Letra C
Questão 26 - Letra D
Questão 27 - Letra B
Questão 28 - Letra D
BIBLIOGRAFIA:
BUSSAB, W. O, MORETTIN, L.G. Estatística Básica, 5ª edição. Saraiva, 2004.
CARVALHO, Sergio. Estatística Básica, 2ª edição. Elsevier Editora Ltda, 2006.
FONSECA, J. S, MARTINS, G.A. Curso de Estatística. 6ª edição. São Paulo: Atlas, 1996.
HOFFMANN, R. Estatística para Economistas, 4ª edição revista e ampliada. São Paulo. Pioneira Thomson Learning. 2006. 
LARSON, R, FARBER, B. Estatística Aplicada. 2ª edição. São Paulo: Pearson - Prentice Hall, 2004.
LEVIN, J., FOX, J. A. Estatística para Ciências Humanas. 9ª edição. São Paulo: Prentice Hall, 2004.
MARTINS, G. A, DONAIRE, D. Princípios de Estatística, 4ª edição. São Paulo: ATLAS, 1991.
SILVA, E. M, GONÇALVES, V, MUROLO, A. C. ESTATÍSTICA. 3ª edição. São Paulo: Atlas, 1999.
TAFNER, P. S. B, CARVALHO, M. M. Curso de Estatística Elementar, 1ª edição. Rio de Janeiro: Papel virtual, 2002.
TOLEDO, G. L, OVALLE, I. I. Estadística Básica. 2ª edição. São Paulo, ATLAS, 1995.

Outros materiais