Buscar

Apostila estatística descritica-AGRO

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 41 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 41 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 41 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

FACULDADE VÉRTICE - UNIVÉRTIX 
Credenciada junto ao MEC: Portaria 1.084/2007
DISCIPLINA: Estatística 
PROFa: Irlane Bastos Costa
TURMA: Agronomia 1º e 2º períodos
 
 
 
ESTATÍSTICA DESCRITIVA
Amostragens
Apresentação de dados – Tabelas e Gráficos
Medidas de tendência central
Medidas de dispersão
Matipó, 2014
1.INTRODUÇÃO 
A estatística é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento.
Áreas da Estatística:
1.- Estatística Descritiva
2.- Probabilidade
3.- Inferência estatística
A estatística descritiva é a etapa inicial da análise utilizada para descrever e resumir os dados. A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou está área da estatística.
A teoria de probabilidades nos permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza.
A inferência estatística é o estudo de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra.
2. AMOSTRAGEM
Uma área importante em muitas aplicações Estatísticas é a da Tecnologia de Amostragem.
Exemplos de Aplicação:
• Pesquisa de mercado,
• Pesquisa de opinião,
• Avaliação do processo de produção,
• Praticamente em todo experimento.
2.1. POPULAÇÃO X AMOSTRA
• População - conjunto dos elementos que se deseja estudar.
• Amostra - subconjunto da população.
Exemplo:
• Censo: Estudo através do exame de todos os elementos da população.
• Amostragem: Estudo por meio do exame de uma amostra.
Por que fazer amostragem ao invés de censo?
Economia
Menor tempo
Maior qualidade nos dados levantados
População infinita.
Mais fácil, com resultados satisfatórios.
Quando fazer censo?
População pequena (tamanho da amostra grande em relação ao da população).
Quando se exige o resultado exato.
Quando já se dispõe dos dados da população.
2.2. AMOSTRAGEM PROBABILÍSTICA OU ALEATÓRIA 
- Quando a probabilidade de um elemento da população ser escolhido é conhecida.
- Pode ser do tipo:
Amostragem aleatória simples
Amostragem sistemática
Amostragem estratificada
2.3 CONSIDERAÇÕES SOBRE OS TIPOS DE AMOSTRAGENS:
AMOSTRAGEM ALEATÓRIA SIMPLES
É o tipo de amostragem probabilística mais utilizada. Dá exatidão e eficácia à amostragem, além de ser o procedimento mais fácil de ser aplicado – todos os elementos da população têm a mesma probabilidade de pertencerem à amostra. É bastante preciso e apresenta todos os elementos da população com probabilidade conhecida de serem escolhidos para fazer parte da amostra. O processo consiste em selecionar uma amostra “n” a partir de uma população “N”. Geralmente a seleção é feita sem reposição e cada amostra é feita unidade a unidade até que se atinja o número pré-determinado. 
As duas maneiras mais utilizadas de obter a amostra “n” são o método de sorteio, no qual são escolhidos um a um até que esteja completa a amostragem e a tabela de números aleatórios, na qual serão sorteados até que seja satisfeita a solicitação da amostra. 
AMOSTRAGEM POR SORTEIO 
Neste método, o que se tem que fazer primeiro é elaborar uma lista dos elementos da população, numerados de acordo com a quantidade de elementos, para então serem sorteados. Todo o número tem a mesma probabilidade de ser sorteado e não há repetição. 
Exemplo 1: Numa cidade há 30 estabelecimentos agrícolas. Desejando fazer uma pesquisa de preços de adubos nitrogenados o agrônomo decidiu amostrar apenas 10 estabelecimentos. pois, há pressa em se proceder a compra destes adubos. Apresente o procedimento correto para se escolher os 10 estabelecimento a serem avaliados. 
Esse processo não é muito prático para grandes populações, nesse caso é preferível utilizar uma tabela de números aleatórios.
TABELAS DE NÚMEROS ALEATÓRIOS
As tabelas de números aleatórios contêm os 10 algarismos 0, 1, 2, 3, . . ., 9, dispostos aleatoriamente em linhas e colunas. Segue uma representação de parte de uma Tabela de números aleatórios:
3690 2492 7171 7720 6509 7549 2330 5733 4730
0813 6790 6858 1489 2669 3743 1901 4971 8280
6477 5289 4092 4223 6454 7632 7577 2816 9202
0772 2160 8236 0812 4195 5589 0830 8261 9232
5692 9870 3583 8997 1533 6566 8830 7271 3809
2080 3828 7880 0586 8482 7811 6807 3309 2729
1039 3382 7600 1077 4455 8806 1822 1669 7501
7227 0104 4141 1521 9104 5563 1392 8238 4882
8506 6348 4612 8252 1062 1757 0964 2983 2244
5086 0303 7423 3298 3979 2831 2257 1508 7642
Exemplo de como utilizar uma tabela de números aleatórios:
Exemplo 1: Suponha que desejamos obter uma amostra aleatória simples de 10 elementos tomados ao acaso de uma população com 90 elementos no total.
Resolução:
Com os elementos numerados de 01 a 90. Devemos verificar “cegamente” a tabela de números aleatórios, literalmente fechando os olhos e apontando para uma posição inicial.
Após definirmos o ponto procederemos com a leitura dos números de dois dígitos em qualquer direção.
Suponha que começamos a ler os dígitos em grupos de dois a partir da linha 2 e coluna 1.Os números sorteados foram: 
Quando o número lido supera o maior número da população (90) este é descartado e continua-se a leitura.
Descarta-se também números repetidos.
AMOSTRAGEM SISTEMÁTICA:
É uma amostra aleatória na qual os itens são selecionados de uma população em intervalos uniformes de uma lista ordenada, até que o total de elementos desejáveis sejam colhidos na amostra. 
O primeiro elemento deve ser escolhido aleatoriamente e os demais de forma sistemática.
Exemplo 1: Imagine que você tenha 500 cadastros arquivados em sua empresa e você quer uma amostra de 2% desses cadastros. Como você obteria uma amostra sistemática? 
Resolução: 
Se você quer uma amostra de 2% dos 500 cadastros, então você quer uma amostra de tamanho 10. Para obter o tamanho do intervalo, você deve dividir 500 por 10, obtendo assim 50. 
Sorteie então um número entre 1 e 50, inclusive. Esse será o número do primeiro cadastro da amostra. Depois, a partir desse número, conte 50 cadastros e retire o último para constituir a amostra. Proceda dessa forma sucessivamente, até completar a amostra. 
Se o número sorteado para iniciar a amostra for 2, então a amostra será constituída pelos seguintes elementos: 2, 52, 102, 152, 202, 252, 302, 352, 402, 452.
Exemplo 2 
É dada uma população constituída pelas 12 primeiras letras do alfabeto. Explique o que você faria para obter uma amostra sistemática de 3 elementos. 
Resolução: 
dividindo 12 por 3 obtém-se 4. Sorteie então uma das quatro primeiras letras do alfabeto. Essa letra sorteada será a primeira da amostra. Depois, a partir dessa letra, conte quatro e retire a quarta letra para a amostra. Repita o procedimento e retire mais uma letra de forma sucessiva. 
Resolução: se a letra sorteada for B, então a amostra será B, F e J.
AMOSTRAGEM ESTRATIFICADA:
Os itens da população são primeiramente classificados pelo pesquisador em subgrupos distintos ou estratos, baseado em uma ou mais características importantes. Ex: homens e mulheres; estudantes de graduação e pós-graduação.
Exemplo 1:
Digamos que dos quarenta alunos, 30 sejam homens e 10 sejam mulheres, vamos obter uma amostra de 10% da população, utilizando a amostragem proporcional estratificada, portanto: 
EXERCÍCIOS PROPOSTOS – TIPOS DE AMOSTRAGENS
1) Em um congresso para agrônomos serão ministradas várias palestras. O número de agrônomos inscritos nas palestras foram: 226 em fitopatologia, 215 em entomologia e 159 em nutrição mineral de plantas. Obtenha uma amostra proporcional estratificada de 30 agrônomos.
2) Em uma empresa com cinco departamentos existem 150 funcionários, sendo: 18 no departamento A; 22 no departamento B;25 no departamento C; 55 no departamento D e 30 no departamento E. A) Obtenha uma amostra não proporcional de 10% dos funcionários. B) Obtenha uma amostra proporcional de 10% dos funcionários.
3) Utilizando a tabela de números aleatórios faça a escolha dos funcionários que irão compor a amostra em cada departamento do exercício 2.
4) Uma população encontra-se dividida em 4 estratos, com tamanhos, respectivamente: N1= 50; N2 = 70; N3 = 80 e N4 = 20. Sabendo-se que, ao ser realizada uma amostragem estratificada proporcional, 7 elementos da amostra foram retirados do segundo estrato, determine o número total de elementos da amostra e o número de elementos da amostra de cada estrato.
5) O diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, desejoso de conhecer as condições de vida extra-escolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias, resolve fazer um levantamento por amostragem sistemática em 20% dessa clientela. Obtenha, para esse diretor, os elementos componentes da amostra. A amostragem será não proporcional. Utilize a a tabela de números aleatórios. Suponha que você tenha duas listas. Uma com os nomes de todos os meninos e a outra com os nomes de todas as meninas. E, os nomes estão numerados. 
6) Numa rua existem 900 residências, obter uma amostra sistemática de 20 residências desta rua.
7) Um pesquisador deseja obter uma amostra aleatória simples de 15 empresas de 435 que estão situadas em uma determinada parte do estado. Utilizando a tabela de números aleatórios apresente as empresas que serão avaliadas.
8) Faça uma amostragem sistemática das empresas do exercício 7. Amostrar 15 empresas.
2.4 TAMANHO DA AMOSTRA
Conceitos:
Parâmetro: característica da população.
Estimativa: valor acusado por uma estatística que estima o valor de um parâmetro populacional.
ERRO AMOSTRAL: diferença entre o valor que a estatística pode acusar e o verdadeiro valor do parâmetro que se deseja estimar.
ERRO AMOSTRAL TOLERÁVEL: quanto um pesquisador admite errar na avaliação dos parâmetros de interesse numa população. Exemplo, o resultado de uma pesquisa eleitoral: Candidato A = 20%, com 2% de erro amostral (18% - 22%)
FÓRMULA PARA CÁLCULO DO TAMANHO DA AMOSTRA
N = Tamanho da população
E0 = erro amostral tolerável
nO = primeira aproximação do tamanho da amostra 
n = tamanho da amostra
EXEMPLO CÁLCULO DO TAMANHO DA AMOSTRA
N = 200 famílias
E0 = erro amostral tolerável = 4% (E0 = 0,04)
n0 = 1/(0,04)2 = 625 famílias
n (tamanho da amostra corrigido) = n = 200x625/200+625 = 125000/825 = 152 famílias
E se a população fosse de 200.000 famílias?
n = (200.000)x625/(200.000 +625) = 623 famílias
Observe-se que se N é muito grande, não é necessário considerar o tamanho exato N da população. Nesse caso, o cálculo da primeira aproximação já é suficiente para o cálculo. 
Observe que: N = 200 famílias, E0 = 4% n = 152 famílias →76% da população
Observe que: N = 200.000 famílias, E0 = 4% n = 623 famílias → 0,3% da população
Logo, é errôneo pensar que o tamanho da amostra deve ser tomado como um percentual do tamanho da população para ser representativa
EXERCÍCIOS PROPOSTOS - TAMANHO DA AMOSTRA
Numa pesquisa para uma eleição presidencial, qual deve ser o tamanho de uma amostra aleatória simples, se se deseja garantir um erro amostral não superior a 2% ?
Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos favoráveis a certo treinamento. Qual deve ser o tamanho da amostra aleatória simples que garanta um erro amostral não superior a 5%?
Após ter definido os objetivos, formulado as hipóteses, planejado a pesquisa e coletado os dados, por um estudo observacional (amostragem) ou por um estudo experimental esses dados devem ser digitados em uma planilha.
Quase sempre o conjunto de dados se trata de uma massa de valores incompreensível, sem uma estrutura aparente.
Técnicas descritivas ou exploratórias são utilizadas para organizar os dados e investigá-los, relatar ou expor características dos mesmos e procurar indícios de padrões ou características interessantes que possam indicar possíveis tendências.
Essas técnicas consistem na leitura e no resumo dos dados utilizando tabelas, gráficos, estatísticas e esquemas. Elas devem fornecer resultados simples, que tem algumas características como: Atrair a atenção, serem auto-explicativos, ser de fácil compreensão e serem confiáveis.
As técnicas usadas são: 
Descrição Tabular: Tabelas são utilizadas para sumarizar os dados, especialmente as tabelas de distribuição de frequências.
Gráficos descritivos: Gráficos são usados para sumarizar os dados e
Descrição Paramétrica: Estima-se os valores de certos parâmetros que completam a descrição do conjunto dos dados.
3.TIPOS DE VARIÁVEIS 
Variável é a característica de interesse que é medida em cada elemento da amostra ou população. Como o nome diz, seus valores variam de elemento para elemento. As variáveis podem ter valores numéricos ou não numéricos e são classificadas da seguinte forma: 
Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas. 
Variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável e, assim, somente fazem sentido valores inteiros. Geralmente são os resultados de contagens. Exemplos: número de filhos, número de bactérias numa placa, número de insetos por gleba. 
Variáveis contínuas: características mensuráveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), idade.
Variáveis Qualitativas (ou categóricas): Envolve simplesmente o ato de nomear, rotular, quantificar ou classificar objetos, pessoa ou qualquer característica. Ex: sexo, profissão, estado civil, vendas, compras, etc….Trata-se de uma variável restritiva em termos de possibilidades do uso de técnicas estatísticas, uma vez que não são possíveis operações aritméticas com seus valores.. Podem ser nominais ou ordinais. 
Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio. Exemplo:
Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1o, 2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro). 
Uma variável originalmente quantitativa pode ser coletada de forma qualitativa. Por exemplo, a variável idade, medida em anos completos, é quantitativa; mas, se for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc...), é qualitativa (ordinal). Outro exemplo é o peso dos lutadores de boxe, uma variável quantitativa se trabalharmos com o valor obtido na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado, etc.). 
Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea, por exemplo. Isto não significa que a variável sexo passou a ser quantitativa.
RESUMO
3.1. REPRESENTAÇÃO GRÁFICA DE VARIÁVEIS QUALITATIVAS 
Iniciaremos essa apresentação com os dados de natureza qualitativa, que são os mais fáceis de tratar do ponto de vista da análise descritiva.
Para organizar os dados provenientes de uma variável qualitativa, é usual fazer uma tabela de frequências, como a Tabela 1 onde estão apresentadas as frequências com que ocorrem cada um dos sexos no total dos 97 ursos observados.
Tabela 1: Distribuição de frequências dos ursos segundo sexo.
Cada categoria da variável sexo (feminino, masculino) é representada numa linha da tabela. Há uma coluna com as contagens de ursos em cada categoria (frequência absoluta) e outra com os percentuais queessas contagens representam no total de ursos (frequência relativa). Esse tipo de tabela representa a distribuição de frequências dos ursos segundo a variável sexo.
Como a variável sexo é qualitativa nominal, isto é, não há uma ordem natural em suas categorias, a ordem das linhas da tabela pode ser qualquer uma.
A Tabela 2 mostra a distribuição de frequências dos ursos segundo o mês de observação, que é uma variável qualitativa ordinal. Nesse caso, podemos acrescentar mais duas colunas com as frequências acumuladas (absoluta e relativa), que mostram, para cada mês, a frequência de ursos observados até aquele mês. Por exemplo, até o mês de julho, foram observados 31 ursos, o que representa 32,0% do total de ursos estudados.
Tabela 2: Distribuição de frequências dos ursos segundo mês de observação.
A visualização da distribuição de frequências de uma variável fica mais fácil se fizermos um gráfico a partir da tabela de frequências. Existem vários tipos de gráficos, dependendo do tipo de variável a ser representada. Os gráficos de barras, colunas e setores (pizza) são os gráficos mais comuns para a descrição de dados oriundos de variáveis qualitativas. Basicamente, eles mostram as frequências de observações para cada rótulo, ou categoria, da variável que se deseja descrever. Os softwares estatísticos têm comandos específicos para a construção desses tipos de gráficos. 
No gráfico de COLUNAS utilizamos no eixo horizontal os rótulos que são usados para identificar as classes (categorias). No eixo vertical utilizamos uma escala de frequência absoluta simples ou em porcentagem. 
Gráfico 1- Distribuição de frequências dos ursos de acordo com o mês de observação.
No gráfico de Barras faz-se o contrário, ou seja, as classes são colocadas no eixo vertical e as frequências no eixo horizontal.
As barras e colunas devem ter larguras fixas e devem estar separadas.
Gráfico 2- Distribuição de frequências dos ursos de acordo com o mês de observação.
O gráfico em setores ou pizza constitui outro dispositivo gráfico para representar as distribuições de frequências de dados qualitativos. Para construir um gráfico de pizza precisamos calcular a coluna de frequências relativas ou proporção (frequência absoluta/número total de observações): fi = Fi/n. Este valor pode ser apresentado na forma de porcentagem: 
fi% = fi x 100	. Feito isto utilizaremos as porcentagens das frequências relativas para subdividirmos o círculo em setores, ou partes, que correspondem à frequência relativa de cada rótulo ou classe.
GRÁFICO DE PIZZA
Gráfico 3- Distribuição de frequências do sexo dos ursos.
3.2. DESCRIÇÃO DE DADOS QUANTITATIVOS 
Quando estamos trabalhando com uma variável discreta que assume poucos valores, podemos dar a ela o mesmo tratamento dado às variáveis qualitativas, assumindo que cada valor é uma classe e que existe uma ordem natural nessas classes.
Tabela 3: Distribuição de frequências do número de filhos por família em uma localidade (25 lares).
Analisando a Tabela 3, podemos perceber que as famílias mais frequentes são as de dois filhos (40%), seguida pelas famílias de três filhos. Apenas 16% das famílias têm mais de três filhos, mas, são ainda mais comuns do que famílias sem filhos.
Gráfico 4 - Distribuição de frequências do número de filhos por família
Quando trabalhamos com uma variável discreta que pode assumir um grande número de valores distintos como, por exemplo, Consumo Mensal de Energia Elétrica, por 50 Usuários Particulares KWH (quilowatts-hora). A solução é agrupar os valores em classes ao montar a tabela. 
Dados Brutos 
São aqueles valores a que se chegou pela simples coleta, sem qualquer Preocupação quanto à sua ordenação. 
Exemplo: Consumo Mensal de Energia Elétrica, por 49 Usuários Particulares KWH (quilowatts-hora)
58 62 80 57 8 126 136 96 144 19 90 86 38 94 82 75 148 114 131 28 66 95 121 158 64 105 118 73 83 81 50 92 60 52 89 58 10 90 94 74 9 75 72 157 125 76 88 78 84 36
Como se pode observar, os números estão dispostas de forma desordenada. Em razão disso, pouca informação se consegue obter inspecionando os dados anotados. Mesmo uma informação tão simples como a de saber os consumos máximo e mínimo requer um certo exame dos dados da tabela.
 Rol
	Consiste em representar os dados na ordem crescente.
Consumo Mensal de Energia Elétrica, por 50 Usuários Particulares KWH(quilowatts-hora)
	8
	9
	10
	19
	28
	36
	38
	50
	52
	57
	58
	58
	60
	62
	64
	66
	72
	73
	74
	75
	75
	76
	78
	80
	81
	82
	83
	84
	86
	88
	89
	90
	92
	94
	94
	95
	96
	105
	114
	118
	121
	125
	126
	131
	136
	144
	148
	157
	158
Essa classificação dos dados proporciona algumas vantagens concretas com relação à sua forma original:
- é possível visualizar de forma ampla as variações de consumo.
- os valores extremos são percebidos de imediato.
- é possível observar uma tendência de concentração dos valores na faixa de 50-90 kwh
Apesar de o rol propiciar ao analista mais informação e com menos esforço de concentração do que os dados brutos, ainda assim persiste o problema de a análise ter que se basear nas 50 observações. O problema se agravará quando o número de dados for muito grande.
COMO MONTAR UMA TABELA COM INTERVALOS DE CLASSES
	
Vamos construir uma tabela de distribuição de frequências e o histograma das idades dos funcionários de uma amostra de 50 elementos selecionados da empresa X.
Dados: Idades de 50 funcionários (colocadas em ordem crescente). 
18 - 20 - 20 - 21 - 22 - 24 - 25 - 25 - 26 - 27 - 29 - 29 - 30 - 30 - 31 - 31 - 32 - 33 - 34 - 35 - 36 - 36 - 37 - 37 - 37 - 37 - 38 - 38 - 38 - 40 - 41 - 43 - 44 -44 - 45 - 45 - 45 - 46 - 47 - 48 - 49 - 50 - 51 - 53 - 54 - 54 - 56 - 58 - 62 - 65 
1º passo: Construir o rol (dados em ordem crescente) através dos dados brutos (São aqueles valores a que se chegou pela simples coleta, sem qualquer preocupação quanto à sua ordenação) e determinar a Amplitude Total: AT 
AT = Maior medida - Menor medida 
No caso, o rol já foi construído, e a Amplitude Total será: AT = 65 - 18 = 47. 
2º passo: Como os dados serão agrupados em classes, é preciso escolher o número de classes - K, bem como o tamanho do intervalo das classes - I. É possível o uso de intervalos com tamanhos iguais, ou desiguais. Geralmente, escolhem-se tamanhos iguais. Há vários critérios para a escolha do número de classes. Dos dois critérios mostrados a seguir, usaremos o 1º critério. 
1 º Critério: Fórmula de Sturges: 
onde: n = número de elementos que se deseja representar. 
2º Critério: Regra empírica, dada pela Tabela 3. 
Tabela 3. Número de classes para a construção da distribuição de freqüências e histograma. 
	Número de elementos que se deseja representar
	Número de classes
	Menor do que 25
	5 ou 6
	Entre 25 e 50
	De 7 a 14
	Maior do que 50
	 De 15 a 20
No exemplo que estamos mostrando: 
 = 1 + 3,33 (1, 7) 
 7 
3º passo: Quanto ao tamanho dos intervalos (iguais) das classes h: 
No exemplo: I 
 AT/ K = 47 ÷ 7 
 7 
Quanto aos limites das classes, utilizaremos o seguinte critério: a ⱶ b (incluiremos nesta classe todos os elementos maiores ou iguais a a e menores do que b.
Dessa forma teremos a tabela a seguir referente à idade dos funcionários:
	Classes
	Intervalos das classes
	Fi
	1
	18 ⱶ 25
	6
	2
	25 ⱶ 32
	10
	3
	32 ⱶ 39
	13
	4
	39 ⱶ 46
	8
	5
	46 ⱶ 53
	6
	6
	53 ⱶ 60
	5
	7
	60 ⱶ 67
	2
	somas
	
	50
Tipos de frequências
Frequência Absoluta (Fi)
É o número de repetições de um valor individual ou de uma classe de valores da variável.
Frequência Relativa (fi ou fi%)
Representa a proporção de observações de um valor individual ou de uma classe, em relação ao número total de observações.
fi = Fi/n onde n é o total de observações daamostra.
Desejando expressar o resultado em termos percentuais: fi% = fi x 100
Frequência Absoluta Acumulada (Fac)
A frequência acumulada “abaixo de” uma classe ou de um valor individual é a soma da frequência absoluta dessa classe ou desse valor com as frequências absolutas das classes ou dos valores anteriores.
Frequência Relativa Acumulada (fac ou fac%)
A frequência relativa acumulada “abaixo de” uma classe ou de um valor individual é a soma da frequência relativa dessa classe ou desse valor com as frequências relativas das classes ou dos valores anteriores.
Ponto Médio
Como a variável de estudo é agrupada em classes, temos interesse em determinar os pontos médios das classes - xi .
Xi = Li + (Ls – Li)/2
Eis a tabela de distribuição de freqüências para os dados do exemplo: 
Recordando: 
C = número de classes = 7 
I = tamanho do intervalo = 7 
Menor medida = 18 anos 
Maior medida = 65 anos 
Logo, a primeira classe conterá todas as idades maiores ou iguais a 18 e menores do que 25, pois os limites da 1ª classe são 18 ⱶ 25. 
Assim, a tabela da distribuição de freqüências das idades poderá ser representada da seguinte maneira: 
	Classes
	Intervalos das classes
	Fi
	fi
	fi%
	Fac
	fac
	%fac
	xi
	1
	18 ⱶ 25
	6
	6/50=0,12
	12
	6
	0,12
	12
	21,5
	2
	25 ⱶ 32
	10
	0,20
	20
	16
	0,32
	32
	28,5
	3
	32 ⱶ 39
	13
	0,26
	26
	29
	0,58
	58
	53,5
	4
	39 ⱶ 46
	8
	0,16
	16
	37
	0,74
	74
	42,5
	5
	46 ⱶ 53
	6
	0,12
	12
	43
	0,86
	86
	49,5
	6
	53 ⱶ 60
	5
	0,10
	10
	48
	0,96
	96
	56,5
	7
	60 ⱶ 67
	2
	0,04
	4
	50
	1
	100
	63,5
	somas
	
	50
	1
	100
	
	
	
	
Conforme os objetivos da Estatística Descritiva, a tabela de distribuição das frequências sintetiza e organiza uma coleção de dados, facilitando a compreensão e análise da variável sob estudo. Dentre outras considerações sobre as idades dos 50 funcionários que estamos analisando, poderemos afirmar: 
• a maior quantidade de funcionários tem idade entre 32 e 38 anos; 
• apenas 4% dos funcionários possuem idades iguais ou superiores a 60 anos, sendo 65 anos a maior idade do grupo; 
• cinqüenta e oito por cento dos funcionários da amostra têm idades inferiores a 38 anos, sendo 18 anos a menor idade do grupo. 
Os histogramas são os gráficos mais adequados para a descrição de dados oriundos de variáveis quantitativas. Basicamente, eles mostram as frequências de observações para cada valor ou conjunto de valores da variável que se deseja descrever. Os softwares estatísticos têm comandos específicos para a construção dos histogramas. 
Observar: os histogramas contêm as mesmas informações da tabela de distribuição das freqüências. São representações que buscam a organização e sintetização de grupos de dados quantitativos. 
EXERCÍCIOS PROPOSTOS – TABELAS E GRÁFICOS
Conceitue população e amostra
Conceitue variável qualitativa.
Conceitue variável quantitativa.
Conceitue dado bruto e rol.
CONCEITUE ESTATÍSTICA DESCRITIVA.
Suponha que uma pesquisa de opinião pública deve ser realizada em duas grandes cidades e uma zona rural. Os elementos na população de interesse são todos os homens e mulheres do estado com idade acima de 21 anos. Que tipo de amostragem você sugeriria?. 
Um médico está interessado em obter informação sobre o número médio de vezes em que 15.000 especialistas prescreveram certa droga no ano anterior (N = 15.000). Deseja-se obter uma amostra n = 1.600. Que tipo de amostragem você sugeriria e por quê? 
Assinale a afirmativa verdadeira:
Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos horizontalmente.
Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos verticalmente.
Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos verticalmente e um gráfico de colunas, horizontalmente.
Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos horizontalmente e um gráfico de colunas, verticalmente.
Todas as alternativa anteriores são falsas.
Os dados seguintes representam 20 observações relativas ao índice pluviométrico em determinado município do Estado: Milímetros de chuva
Montar a tabela de distribuição de frequências apresentando as colunas das frequências: absolutas, absolutas acumuladas, relativas, relativas em porcentagem, relativas em porcentagens acumuladas e ponto médio. OBS: iniciar em 140 e utilizar intervalo de classe igual a 4. Construir o histograma utilizando a porcentagem.
Considere a seguinte distribuição de frequência correspondente aos diferentes preços de um determinado produto em vinte casas agrícolas pesquisadas.
	PREÇOS
	CASAS AGRÍCOLAS
	50
	2
	62
	5
	67
	6
	75
	6
	81
	1
Quantas casas agrícolas apresentaram um preço de R$50,00? 
Apresente as colunas da frequência relativa em decimal e em porcentagem.
Quantas casas agrícolas apresentaram um preço de até R$67,00 (inclusive)? 
Qual o percentual de casas agrícolas com o menor preço?
Qual o percentual de casas agrícolas com o maior preço?
Fazer o gráfico de colunas.
Os dados do quadro seguinte referem-se ao resultado de um teste de germinação realizado num dado lote de cereal do qual se recolheram 80 amostras, cada uma constituída por 100 grãos, que foram postos a germinar em condições controladas de temperatura e umidade. O número de grãos que germinaram ao fim de 14 dias por amostra está registrado a seguir:
	86
	95
	92
	89
	92
	92
	 91
	88
	88 
	94
	90
	88
	89
	90
	86
	88
	93
	92
	92
	87
	91
	94
	92
	94
	91
	92
	88
	94
	93
	91
	91
	91
	92
	90
	89
	86
	89
	90
	90
	89
	84
	89
	88
	93
	92
	95
	86
	93
	91
	90
	91
	89
	89
	95
	92
	94
	94
	90
	86
	93
	86
	94
	90
	87
	93
	91
	90
	92
	93
	94
	92
	92
	94
	93
	93
	92
	93
	93
	88
	91
a) Montar uma tabela de distribuição de frequências incluindo as colunas de frequências absolutas, absolutas acumulas, relativas, relativas em porcentagem, relativas acumuladas
b) Construir o histograma das frequências absolutas.
c) Das 80 amostras quantas apresentaram número de sementes germinadas igual ou superior a 90 sementes?
d) Qual a classe com maior frequência? 
e) Esta classe representa quanto por cento das amostras?
f) Qual a classe com menor frequência? 
g) Esta classe representa quanto por cento da amostras?
h) Quantas amostras tiveram pelo menos 94 das sementes germinadas?
i) Quantas amostras tiveram menos de 85 das sementes germinadas?
4. MEDIDAS DE POSIÇÃO 
Como o próprio título sugere nossa pretensão aqui é a determinação e o cálculo de medidas que ofereçam o posicionamento da distribuição dos valores de uma variável que desejamos analisar. 
 4.1. Média aritmética ou média amostral
A medida de tendência central mais comum para um conjunto de dados é a média aritmética. A média aritmética de uma amostra de n observações – x1, x2, ... , xn - representada pelo símbolo 
 (lê-se X - barra), é calculada por: 
Onde n é o número total de observações.
EXEMPLO: Encontrar a média aritmética para o conjunto de observações: 5, 1, 6, 2, 4. 
Solução: temos cinco observações: n = 5, então: 
Quando os valores de xi estão agrupados com suas respectivas frequências absolutas Fi, a média aritmética ou média amostral é expressa por: 
EXEMPLO: Determinar a idade média para o conjunto dos 50 funcionários considerados na Tabela a seguir:
Solução: Da tabela de distribuição de freqüências, temos: 
	Classes
	Intervalos das classes
	Fi
	xi
	xiFi
	1
	18 ⱶ 25
	6
	21,5
	129
	2
	25 ⱶ 32
	10
	28,5
	285
	3
	32 ⱶ 39
	13
	35,5
	461,50
	4
	39 ⱶ 46
	8
	42,5
	340
	5
	46 ⱶ 53
	6
	49,5297
	6
	53 ⱶ 60
	5
	56,5
	282,50
	7
	60 ⱶ 67
	2
	63,5
	127
	somas
	
	50
	
	1.922
Logo: 
 
 
 anos
O resultado 38,44 anos é aproximado, uma vez que utilizamos os pontos médios xi como representantes das classes em que foram agrupadas as 50 idades. O valor da média aritmética, desconsiderando-se o agrupamento em classes, é de: 
 
 anos
Observar: a diferença entre os resultados foi de 38,32 - 38,44 = - 0,12. 
Assim, quando o analista dispuser da tabela de distribuição de frequências, e admitir que uma aproximação do cálculo da média não vai comprometer suas conclusões, poderá usar a fórmula para os dados agrupados. Caso contrário, deverá utilizar a fórmula comum para o cálculo da média aritmética. 
EXERCÍCIOS PROPOSTOS
1. A média mínima para aprovação em determinada disciplina é 5,0. Se um estudante obtém as notas 7,5; 8,0; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questão, pergunta-se se ele foi ou não aprovado. 
2. A seguir, é dada a distribuição da quantidade de defeitos por computador para uma amostra de 100 aparelhos: 
Quantidade de defeitos por computador O 1 2 3 4 5 6 
Número de aparelhos 15 28 20 14 10 7 6 
Determinar o número médio de defeitos por computador. 
4.2. Mediana 
Colocados em ordem crescente, mediana (Md) é o valor que divide a amostra, ou população, em duas partes iguais. Assim: 
 Md
	
	
	
	
 0 50% 100%
 Cálculo da mediana para dados não agrupados e agrupados sem intervalos 
Se n for ímpar, a mediana será o elemento central de ordem . Se n 
for par, a mediana será a média entre os elementos centrais de ordem 
 e
 
EXEMPLO: Calcular a mediana para as distribuições: 
	Classes
	Fi
	Fac
	1
	1
	1
	2
	3
	4
	3
	5
	9
	4
	2
	11
	soma
	11
	
 
 
 
Por meio da Fac encontra-se o valor xi correspondente à mediana. Neste exemplo, será o 3 (Md= 3). Observar: é o xi correspondente à classe que contiver a ordem calculada, no caso o sexto elemento. Explicação prática: 12223333344
b) 
	Classes
	Fi
	Fac
	82
	5
	5
	85
	10
	15
	87
	15
	30
	89
	8
	38
	90
	4
	42
	soma
	42
	
Assim: 21º corresponde a 87 e 22º corresponde a 87, logo
Cálculo da mediana para os dados agrupados em intervalos classes
1 º passo: Calcula-se a ordem n/2. 
2º passo: Pela Fac identifica-se a classe que contém a mediana (classe Md). 
3º passo: Utiliza-se a fórmula: 
em que: 
= limite inferior da classe que contem a mediana 
n = tamanho da amostra ou número de elementos.
 
= soma das frequências absolutas anteriores à classe que contem mediana.
h = amplitude da classe que contem a mediana 
FMd = frequência da classe que contem a mediana
EXEMPLO: Dada a distribuição amostral, calcular a mediana: 
	Intervalo das classes
	Fi
	Fac
	35 ⱶ 45
	5
	5
	45 ⱶ 55
	12
	17
	55 ⱶ 65
	18
	35
	65 ⱶ 75
	14
	49
	75 ⱶ 85
	6
	55
	85 ⱶ 95
	3
	58
	soma
	58
	
1º passo: Calcula-se n/2 = 58/2 = 29º 
2º passo: Identifica-se a classe Md pela Fac• Nesse caso, a classe Md é a 3ª. 
3º passo: Aplica-se a fórmula: 
Então: 50% das observações têm medidas abaixo de 61,67, e 50% acima desse valor. 
4.3- QUATIL
Os quartis dividem um conjunto de dados em quatro partes iguais de 25%. Assim:
0% 25% 50% 75% 100%
	​​​​​​​​​​​​​​​​​​​​
	
	
	
	
	
	
	
 Q1 Q2 = Md Q3
1º quartil deixa 25% dos dados
2º quartil coincide com a mediana, deixa 50% dos dados
3º quartil deixa 75% dos dados
 
Determinação do quartil para dados não agrupados e agrupados sem intervalos de classe
Quando os dados não estão agrupados em classes ou estão agrupados e sem intervalos utiliza-se a fórmula in/4 para determinar a posição em que o quartil está.
EXEMPLO: Calcular o valor do 1º, 2º e 3º quartis para a distribuição a seguir: 
	Classes
	Fi
	Fac
	1
	1
	1
	2
	3
	4
	3
	5
	9
	4
	2
	11
	soma
	11
	
in/4 = 1x11/4 = 2,75, logo o primeiro quartil é representado pela classe 2.
in/4 = 2x11/4 = 5,5 logo o segundo quartil é representado pela classe 3.
In/4 = 3x11/4 = 8,25 logo o segundo quartil também é representado pela classe 3.
Determinação do quartil para dados agrupados em intervalos de classe
1º Passo: Calcula-se a ordem n/4
2º Passo: identifica-se a classe que contem o quartil pela Fac
3º Passo: Aplica-se a fórmula:
em que: 
= limite inferior da classe que contem o quartil
n = tamanho da amostra ou número de elementos 
 
= soma das frequências absolutas anteriores à classe Q1
h = amplitude da classe que contem o quartil
FQ1 = frequência da classe que contem o quartil
DETERMINAÇÃO DO 3º QUARTIL
1º Passo: Calcula-se a ordem 3n/4
2º P1asso: identifica-se a classe que contem o quartil 3 pela Fac
3º Passo: Aplica-se a fórmula:
em que: 
= limite inferior da classe que contem o quartil 3.
n = tamanho da amostra ou número de elementos 
 
= soma das frequências absolutas anteriores à classe que contem o quartil 3.
h = amplitude da classe que contem o quartil 3.
FQ3 = frequência absoluta da classe que contem o quartil 3.
Exemplo: Dada a distribuição, determinar os quartis (Q1 e Q3) e a mediana.
	Classes
	Fi
	Fac
	7 ⱶ 17
	 6
	6
	17 ⱶ 27
	15
	21
	27 ⱶ 37
	20
	41
	37 ⱶ 47
	10
	51
	47 ⱶ 57
	5
	56
	Soma
	56
	
Diante desses resultados, pode-se afirmar que, nessa distribuição, há:
 25% 25% 25% 25%
	​​​​​​​​​​​​​​​​​​​​
	
	
	
	
	
	
	
 22,33 30,5 38 57
4.4- DECIS
Continuando o estudo das medidas separatrizes: mediana e quartis, há os decis. São os valores que dividem a série em 10 partes iguais.
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 
	
	
	
	
	​​​​​​​​​​​​​
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
 D1 D2 D3 D4 D5 D6 D7 D8 D9 
O cálculo para um decil é dado por:
1º Passo: Calcula-se a ordem in/10, em que i = 1, 2, 3, ...,9
2º Passo: identifica-se a classe que contem o decil pela Fac
3º Passo: Aplica-se a fórmula:
em que: 
= limite inferior da classe que contem o decil.
n = tamanho da amostra ou número de elementos. 
 
= soma das frequências absolutas anteriores à classe que contem o decil.
h = amplitude da classe que contem o decil.
FDi = frequência absoluta da classe que contem o decil.
4.5. PERCENTIS
São as medidas que dividem a serie em 100 partes iguais.
0% 1% 2% 3% ... 50% ... 97% 98% 99%100%
	
	
	
	
	​​​​​​​​​​​​​​​​​​​​
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
 P1 P2 P3 ... P50 ... P97 P98 P99 P100 
O cálculo de um percentil (Pi) é dado por:
1º Passo: Calcula-se a ordem in/100, em que i = 1, 2, 3, ...,97, 98, 99, 100.
2º Passo: identifica-se a classe que contem o percentil pela Fac
3º Passo: Aplica-se a fórmula:
 
Exemplo: Determinar o 4º decil e o 72º percentil da seguinte distribuição:
	Classes
	Fi
	Fac
	4 ⱶ 9
	8
	8
	9 ⱶ 14
	12
	20
	14 ⱶ19
	17
	37
	19 ⱶ24
	3
	40
	Soma
	40
	
Portanto, nessa distribuição, o valor 12,33 divide a distribuição em duas partes: uma (à esquerda) com 40% dos elementos e a outra com 60%. O valor 16,59 indica que 72% dos elementos da distribuição estão abaixo de 16,59 e 28% acima.
4.6. MODA
Cálculo da Moda para dados agrupados em classes sem intervalos
Dentre as principais medidas de posição, destaca-se a Moda. É o valor mais frequente da distribuição. Para distribuições simples (sem agrupamento de classes), a identificação da Moda é facilitada pela simples observação do elemento que apresenta maior frequência. Assim, para a distribuição:
	xi
	243
	245
	248
	251
	307
	Fi
	7
	17
	23
	20
	8
A moda será 248 (Mo = 248).
Cálculo da Moda para dados agrupados em classes com intervalo
Há diversas formulas para o calculo da moda agrupada em classes. Destacaremos o calculo da moda por meio da formula de Czuber.
1o Passo: identifica-se a classe modal (classe com maior frequência)
2o Passo: Aplica-se a formula:
Em que:
 = limite inferior da classe modal
 
 = Diferença entre a frequência da classe modal e a frequência da classe imediatamente anterior
= Diferença entre a frequência da classe modal e a frequência da classe imediatamente posterior	
 h = Amplitude da classe moda
Exemplo: Determinar a moda para a distribuição:
1o Passo: Indica-se a classe modal: 2 ⱶ 3ª 
2º Passo: Aplica-se a fórmula
EXERCÍCIOS PROPOSTOS
Para cada série e distribuição determine a mediana e a moda.
12, 7, 10, 8, 8
1, 3, 3, 4, 6, 8 ,8, 9
	xi
	7 ⱶ 10
	10 ⱶ 13
	13 ⱶ 16
	16 ⱶ 19
	19 ⱶ 22
	Fi
	6
	10
	15
	10
	5
	Classes
	0 ⱶ 1
	1 ⱶ 2
	2 ⱶ 3
	3 ⱶ 4
	4 ⱶ 5
	soma
	Fi
	3
	10
	17
	8
	5
	43
	xi
	12
	13
	15
	17
	Fi
	5
	13
	19
	20
 d) 
5. MEDIDAS DE DISPERSÃO 
São medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média. Servem para medir a representatividade da média. 
Sejam as séries: (A) 20, 20, 20 e (B) 15, 10, 20, 25, 30 
Apesar de as séries terem médias iguais, a série A não apresenta dispersão em torno da média, enquanto os valores da série B apresentam dispersão em torno da média. Nesta seção são apresentadas medidas estatísticas que avaliam o grau de dispersão, ou variabilidade, de uma variável. 
Variância Amostral
Como se deseja medir a dispersão dos dados em relação à média é interessante analisar os desvios de cada valor (isto é ). Se os desvios forem baixos, teremos pouca dispersão; ao contrário, se os desvios forem altos, teremos elevada dispersão. É fácil constatar que a soma dos desvios em torno da média é zero . 
Para o cálculo da variância, consideram-se os quadrados dos desvios. A variância, S2, de uma amostra de n medidas é igual à soma dos quadrados dos desvios dividida por (n - 1), assim: 
Desenvolvendo o quadrado das diferenças: e somando os termos comuns, encontram-se as seguintes fórmulas práticas para o cálculo da variância amostral: 
Quanto maior o valor de S2, maior a dispersão dos dados amostrais. 
Para dados agrupados tem-se:
 Ou 
EXEMPLO: Calcular a variância para as medidas amostrais: 3, 7, 2, 1, 8. Usar fórmula básica e fórmula prática. 
Solução: Fórmula Básica
	
	Xi
	
	
	
	3
	3 – 4,2 = -1,2
	1,44
	
	7
	2,8
	7,84
	
	2
	-2,2
	4,84
	
	1
	-3,2
	10,24
	
	8
	3,8
	14,44
	soma
	21
	0
	38,80
A média amostral = 
Feito os cálculos dos desvios pode-se obter a variância amostral aplicando –se a fórmula:
Solução: Fórmula prática
	
	
	3
	9
	7
	49
	2
	4
	1
	1
	8
	64
	21
	127
Então a variância será:
Desvio padrão amostral
O cálculo da variância é obtido pela soma dos quadrados dos desvios em relação à média. Assim é que, se a variável sob análise for medida em metros, a variância deverá ser expressa em m2 (metros ao quadrado). Ou seja, a variância é expressa pelo quadrado da unidade de medida da variável que está sendo estudada. Para melhor interpretar a dispersão de uma variável, calcula-se a raiz quadrada da variância, obtendo-se o desvio padrão (S) que será expresso na unidade de medida original. Assim: 
Exemplo: Calcular o desvio padrão para as medidas utilizadas no exemplo da variância.
 un2
 Interpretação do desvio padrão 
Para qualquer distribuição de variável aleatória normal cuja distribuição é simétrica tem-se que: 
• O intervalo contém 68,27% das observações amostrais. 
• O intervalo contém 95,45% das observações amostrais.
• O intervalo contém 99,73% das observações amostrais.
EXEMPLO 1: Calcular a variância e o desvio padrão da seguinte distribuição amostral: 
	xi
	5
	7
	8
	9
	11
	Fi
	2
	3
	5
	4
	2
EXEMPLO 2: Determinar a variância e o desvio padrão dos dados da tabela a seguir:
	Classes
	Intervalos das classes
	Fi
	xi
	xiFi
	x2Fi
	1
	18 ⱶ 25
	6
	21,5
	
	
	2
	25 ⱶ 32
	10
	28,5
	
	
	3
	32 ⱶ 39
	13
	53,5
	
	
	4
	39 ⱶ 46
	8
	42,5
	
	
	5
	46 ⱶ 53
	6
	49,5
	
	
	6
	53 ⱶ 60
	5
	56,5
	
	
	7
	60 ⱶ 67
	2
	63,5
	
	
	somas
	
	50
	
	
	
 
Interpretar os resultados.
Coeficiente de variação de Pearson 
Trata-se de uma medida dispersão relativa. Enquanto a amplitude total, variância e o desvio padrão são medidas absolutas de dispersão, o coeficiente de variação (C.V.) mede a dispersão relativa. Assim: 
A partir do coeficiente de variação pode-se avaliar a homogeneidade do conjunto de dados e, consequentemente, se a média é uma boa medida para representar estes dados. Quanto mais próximo de zero, mais homogêneo é o conjunto de dados e mais representativa será sua média. Quanto maior o coeficiente de variação mais heterogêneo o conjunto de dados e a média é menos representativa. Neste caso optamos pela mediana.
Uma desvantagem do C.V. é que ele deixa de ser útil quando a média está próxima de zero. Uma média muito próxima de zero pode inflacionar o C.V..
Eis algumas regras empíricas para interpretação do coeficiente de variação: 
C.V. < 15% há baixa dispersão
15% > C.V. < 30% há média dispersão
C.V. ≥ 30% há elevada dispersão 
EXEMPLO: Em uma empresa, o salário médio dos homens é de $ 4.000, com desvio padrão de $ 1.500, e o salário médio das mulheres é de $ 3.000, com desvio padrão de $ 1.200. A dispersão relativa dos salários É maior para os homens? 
Solução: Dos dados do problema ternos: 
para os homens: 
para as mulheres: 
Resposta: Os salários das mulheres têm dispersão relativa maior de que os salários dos homens. As duas distribuições apresentam elevada dispersão. 
	
EXERCÍCIOS PROPOSTOS
Foram feitas oito medidas do diâmetro (em mm) interno de anéis forjados de pistão de um motor de um automóvel. Os dados codificados são: 1, 3, 15, 0, 5, 2, 5 e 4. Calcule a média, desvio padrão da amostra e o Coeficiente de Variação.
Setemedidas da espessura de óxido em pastilhas são estudadas para verificar a qualidade em um processo de fabricação de semicondutores. Os dados (angstroms) são: 1.264, 1.280, 1.301, 1.300, 1.292, 1.307, 1275. Calcule a média e o desvio padrão da amostra.
 A AMPLITUDE 
A amplitude, ou R, é a diferença entre o maior e o menor valor inclusos no conjunto de dados. Dessa forma, quando H representa o maior valor no grupo e L representa o menor valor, a amplitude dos dados não-agrupados é 
R =H-L 
Exemplo: Durante um determinado mês de verão, os oito representantes de venda de uma empresa de aquecimento e ar-condicionado venderam os seguintes números de unidades de ar-condicionado central: 8, 11, 5, 14, 8, 11, 16, I I. A amplitude do número de unidades vendidas é 
R = H - L = 16 - 5 = 11,0 unidades 
No caso de dados agrupados a amplitude será a diferença entre o limite superior do último intervalo (Ls) de classe e o limite inferior do primeiro intervalo de classe (Li).
R = Ls – Li
AMPLITUDES MODIFICADAS 
Uma amplitude modificada é uma amplitude para a qual alguns valores em cada extremidade da distribuição são eliminados da consideração. A amplitude dos 50% centrais é uma amplitude entre os valores do 25° percentil e o 75° percentil da distribuição. Sendo assim, ela é também a amplitude entre o primeiro e o terceiro quartis da distribuição. Por esta razão, a amplitude dos 50% centrais é usualmente designada como a amplitude interquartil (IRQ). Dessa forma, 
IRQ = Q3 – Q1
Outras amplitudes modificadas que são às vezes usadas são a dos 80% centrais, 90% centrais e 95% centrais. 
7. MEDIDAS DE FORMA: ASSIMETRIA E CURTOSE.
A medida de assimetria indica o grau de distorção da distribuição em relação a uma distribuição simétrica. As distribuições podem ser: simétrica, assimétrica positiva ou assimétrica negativa.
7.1.Distribuição de Frequência Simétrica:
Uma distribuição é dita simétrica se existe um eixo de simetria no gráfico gerado pela tabela de frequência. Esse eixo divide o gráfico em duas partes iguais, de modo que, se rebatermos uma na outra, elas se sobrepõem completamente. Como mostra as figuras abaixo:
Sempre que os dados tiverem média, mediana e moda iguais, a distribuição será simétrica. x=Md=Mo
7.2 Distribuição de Frequência Assimétrica.
Se a distribuição não for simétrica, podemos ter dois casos de assimetria: assimetria positiva e assimetria negativa. A assimetria será negativa se a cauda da distribuição estiver do lado esquerdo do gráfico, como mostra a figura seguinte (a), e será positiva se a cauda da distribuição estiver do lado direito do gráfico, (b). A assimetria geralmente ocorre devido à extensão de uma das caudas da distribuição. Uma vez que os valores da cauda afetam muito a média, mas não a mediana e a moda, a média sempre acompanha o lado da cauda da distribuição.
Nas figuras abaixo, podemos verificar que a distância da média em relação à moda e a mediana será maior, quanto maior for a extensão da cauda da distribuição e, consequentemente, maior será a assimetria da distribuição.
Sendo a distribuição simétrica, a média e a moda coincidem; sendo a distribuição assimétrica à esquerda ou negativa, a média é menor que a moda; e sendo assimétrica à direita ou positiva, a média é maior que a moda.
Baseando-se nessas relações entre média e a moda, podemos empregá-las para determinar o tipo de assimetria. Assim, calculando o valor da diferença:
x − Mo
se:
x - Mo = 0 _ assimetria nula ou distribuição simétrica
x - Mo < 0 _ assimetria negativa ou à esquerda
x - Mo > 0 _ assimetria positiva ou à direita
Coeficiente de Assimetria.
A medida de assimetria de uma distribuição pode ser realizada pelo coeficiente de assimetria de Pearson, dado por:
Dependendo do valor de As, podemos classificar a distribuição em:
_ Simétrica, se |As| < 0,15
_ Assimétrica moderada, se 0,15 ≤ |As| <1,0
_ Assimétrica forte, se |As| ≥ 1,0
7.4 Medidas de Achatamento ou Curtose.
A medida de curtose nos indica a forma da curva de distribuição em relação ao seu achatamento. A forma da curva de distribuição em relação à curtose pode ser leptocúrtica, mesocúrtica ou platicúrtica.
Quando a distribuição apresenta uma curva de frequência mais fechada que a normal (ou mais aguda em sua parte superior), ela recebe o nome de leptocúrtica. Quando a distribuição apresenta uma curva de freqüência mais aberta que a normal (ou mais achatada na sua parte superior), ela é chamada de platicúrtica. A curva normal que é a referencial, recebe o nome de mesocúrtica.
7.5 Coeficiente de Curtose:
A curtose pode ser medida pela seguinte expressão:
Essa fórmula é conhecida como coeficiente percentílico de curtose. Relativamente a curva normal, temos; c = 0,263
Assim:
C = 0,263 _ curva mesocúrtica
C < 0,263 _ curva leptocúrtica
C > 0,263 _ curva platicúrtica
Exercício de fixação 1: Sabendo-se que uma distribuição apresenta as seguintes medidas:
Q1 = 24,4 cm, Q3 = 41,2 cm, P10 =20,2 cm e P90 =49,4 cm, classificá-la quanto à curtose.
08 13 67 90 68 58 14 89 26 69. 
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
n = 11, n é impar, logo a mediana será o elemento de ordem: � EMBED Equation.3 ���. Para identificá-lo, abre-se a coluna das frequências acumuladas Fac.
n = 42, n é par, logo a mediana será a média entre os elementos de ordem: � EMBED Equation.3 ��� e � EMBED Equation.3 ���, ou seja, 21º e 22º. Identifica-se os elementos pela Fac.
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
Classe Q1 n/4 = 56/4 = 14
Classe Md n/2 = 56/2 = 28
Classe Q3 3n/4 = 3 x 56/4 = 42
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
Classe D4 = in/10 = (4 x 40)/10 = 16
Classe P72 = in/100 = (72 x 40)/100 = 28,8
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� PAGE \* MERGEFORMAT �41�
_1405257865.unknown
_1423053795.unknown
_1469381949.unknown
_1469382924.unknown
_1469382936.unknown
_1469382911.unknown
_1437362842.unknown
_1469381848.unknown
_1469381938.unknown
_1469381736.unknown
_1437362841.unknown
_1423055356.unknown
_1407063325.unknown
_1407063372.unknown
_1407063508.unknown
_1407063509.unknown
_1407063506.unknown
_1407063379.unknown
_1407063349.unknown
_1407063362.unknown
_1407063328.unknown
_1407063304.unknown
_1407063323.unknown
_1405261127.unknown
_1403435613.unknown
_1403460319.unknown
_1403461972.unknown
_1403587946.unknown
_1403590521.unknown
_1403590680.unknown
_1403591171.unknown
_1404665848.unknown
_1403591126.unknown
_1403590574.unknown
_1403588183.unknown
_1403588274.unknown_1403587978.unknown
_1403462235.unknown
_1403587798.unknown
_1403462651.unknown
_1403462185.unknown
_1403461512.unknown
_1403461785.unknown
_1403461960.unknown
_1403461061.unknown
_1403461064.unknown
_1403461333.unknown
_1403460325.unknown
_1403458270.unknown
_1403460103.unknown
_1403460137.unknown
_1403458282.unknown
_1403435755.unknown
_1403431650.unknown
_1403432097.unknown
_1403433790.unknown
_1403433894.unknown
_1403433919.unknown
_1403432232.unknown
_1403431759.unknown
_1403425658.unknown
_1403425730.unknown
_1403425517.unknown

Outros materiais