Baixe o app para aproveitar ainda mais
Prévia do material em texto
FACULDADE VÉRTICE - UNIVÉRTIX Credenciada junto ao MEC: Portaria 1.084/2007 DISCIPLINA: Estatística PROFa: Irlane Bastos Costa TURMA: Agronomia 1º e 2º períodos ESTATÍSTICA DESCRITIVA Amostragens Apresentação de dados – Tabelas e Gráficos Medidas de tendência central Medidas de dispersão Matipó, 2014 1.INTRODUÇÃO A estatística é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. Áreas da Estatística: 1.- Estatística Descritiva 2.- Probabilidade 3.- Inferência estatística A estatística descritiva é a etapa inicial da análise utilizada para descrever e resumir os dados. A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou está área da estatística. A teoria de probabilidades nos permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza. A inferência estatística é o estudo de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra. 2. AMOSTRAGEM Uma área importante em muitas aplicações Estatísticas é a da Tecnologia de Amostragem. Exemplos de Aplicação: • Pesquisa de mercado, • Pesquisa de opinião, • Avaliação do processo de produção, • Praticamente em todo experimento. 2.1. POPULAÇÃO X AMOSTRA • População - conjunto dos elementos que se deseja estudar. • Amostra - subconjunto da população. Exemplo: • Censo: Estudo através do exame de todos os elementos da população. • Amostragem: Estudo por meio do exame de uma amostra. Por que fazer amostragem ao invés de censo? Economia Menor tempo Maior qualidade nos dados levantados População infinita. Mais fácil, com resultados satisfatórios. Quando fazer censo? População pequena (tamanho da amostra grande em relação ao da população). Quando se exige o resultado exato. Quando já se dispõe dos dados da população. 2.2. AMOSTRAGEM PROBABILÍSTICA OU ALEATÓRIA - Quando a probabilidade de um elemento da população ser escolhido é conhecida. - Pode ser do tipo: Amostragem aleatória simples Amostragem sistemática Amostragem estratificada 2.3 CONSIDERAÇÕES SOBRE OS TIPOS DE AMOSTRAGENS: AMOSTRAGEM ALEATÓRIA SIMPLES É o tipo de amostragem probabilística mais utilizada. Dá exatidão e eficácia à amostragem, além de ser o procedimento mais fácil de ser aplicado – todos os elementos da população têm a mesma probabilidade de pertencerem à amostra. É bastante preciso e apresenta todos os elementos da população com probabilidade conhecida de serem escolhidos para fazer parte da amostra. O processo consiste em selecionar uma amostra “n” a partir de uma população “N”. Geralmente a seleção é feita sem reposição e cada amostra é feita unidade a unidade até que se atinja o número pré-determinado. As duas maneiras mais utilizadas de obter a amostra “n” são o método de sorteio, no qual são escolhidos um a um até que esteja completa a amostragem e a tabela de números aleatórios, na qual serão sorteados até que seja satisfeita a solicitação da amostra. AMOSTRAGEM POR SORTEIO Neste método, o que se tem que fazer primeiro é elaborar uma lista dos elementos da população, numerados de acordo com a quantidade de elementos, para então serem sorteados. Todo o número tem a mesma probabilidade de ser sorteado e não há repetição. Exemplo 1: Numa cidade há 30 estabelecimentos agrícolas. Desejando fazer uma pesquisa de preços de adubos nitrogenados o agrônomo decidiu amostrar apenas 10 estabelecimentos. pois, há pressa em se proceder a compra destes adubos. Apresente o procedimento correto para se escolher os 10 estabelecimento a serem avaliados. Esse processo não é muito prático para grandes populações, nesse caso é preferível utilizar uma tabela de números aleatórios. TABELAS DE NÚMEROS ALEATÓRIOS As tabelas de números aleatórios contêm os 10 algarismos 0, 1, 2, 3, . . ., 9, dispostos aleatoriamente em linhas e colunas. Segue uma representação de parte de uma Tabela de números aleatórios: 3690 2492 7171 7720 6509 7549 2330 5733 4730 0813 6790 6858 1489 2669 3743 1901 4971 8280 6477 5289 4092 4223 6454 7632 7577 2816 9202 0772 2160 8236 0812 4195 5589 0830 8261 9232 5692 9870 3583 8997 1533 6566 8830 7271 3809 2080 3828 7880 0586 8482 7811 6807 3309 2729 1039 3382 7600 1077 4455 8806 1822 1669 7501 7227 0104 4141 1521 9104 5563 1392 8238 4882 8506 6348 4612 8252 1062 1757 0964 2983 2244 5086 0303 7423 3298 3979 2831 2257 1508 7642 Exemplo de como utilizar uma tabela de números aleatórios: Exemplo 1: Suponha que desejamos obter uma amostra aleatória simples de 10 elementos tomados ao acaso de uma população com 90 elementos no total. Resolução: Com os elementos numerados de 01 a 90. Devemos verificar “cegamente” a tabela de números aleatórios, literalmente fechando os olhos e apontando para uma posição inicial. Após definirmos o ponto procederemos com a leitura dos números de dois dígitos em qualquer direção. Suponha que começamos a ler os dígitos em grupos de dois a partir da linha 2 e coluna 1.Os números sorteados foram: Quando o número lido supera o maior número da população (90) este é descartado e continua-se a leitura. Descarta-se também números repetidos. AMOSTRAGEM SISTEMÁTICA: É uma amostra aleatória na qual os itens são selecionados de uma população em intervalos uniformes de uma lista ordenada, até que o total de elementos desejáveis sejam colhidos na amostra. O primeiro elemento deve ser escolhido aleatoriamente e os demais de forma sistemática. Exemplo 1: Imagine que você tenha 500 cadastros arquivados em sua empresa e você quer uma amostra de 2% desses cadastros. Como você obteria uma amostra sistemática? Resolução: Se você quer uma amostra de 2% dos 500 cadastros, então você quer uma amostra de tamanho 10. Para obter o tamanho do intervalo, você deve dividir 500 por 10, obtendo assim 50. Sorteie então um número entre 1 e 50, inclusive. Esse será o número do primeiro cadastro da amostra. Depois, a partir desse número, conte 50 cadastros e retire o último para constituir a amostra. Proceda dessa forma sucessivamente, até completar a amostra. Se o número sorteado para iniciar a amostra for 2, então a amostra será constituída pelos seguintes elementos: 2, 52, 102, 152, 202, 252, 302, 352, 402, 452. Exemplo 2 É dada uma população constituída pelas 12 primeiras letras do alfabeto. Explique o que você faria para obter uma amostra sistemática de 3 elementos. Resolução: dividindo 12 por 3 obtém-se 4. Sorteie então uma das quatro primeiras letras do alfabeto. Essa letra sorteada será a primeira da amostra. Depois, a partir dessa letra, conte quatro e retire a quarta letra para a amostra. Repita o procedimento e retire mais uma letra de forma sucessiva. Resolução: se a letra sorteada for B, então a amostra será B, F e J. AMOSTRAGEM ESTRATIFICADA: Os itens da população são primeiramente classificados pelo pesquisador em subgrupos distintos ou estratos, baseado em uma ou mais características importantes. Ex: homens e mulheres; estudantes de graduação e pós-graduação. Exemplo 1: Digamos que dos quarenta alunos, 30 sejam homens e 10 sejam mulheres, vamos obter uma amostra de 10% da população, utilizando a amostragem proporcional estratificada, portanto: EXERCÍCIOS PROPOSTOS – TIPOS DE AMOSTRAGENS 1) Em um congresso para agrônomos serão ministradas várias palestras. O número de agrônomos inscritos nas palestras foram: 226 em fitopatologia, 215 em entomologia e 159 em nutrição mineral de plantas. Obtenha uma amostra proporcional estratificada de 30 agrônomos. 2) Em uma empresa com cinco departamentos existem 150 funcionários, sendo: 18 no departamento A; 22 no departamento B;25 no departamento C; 55 no departamento D e 30 no departamento E. A) Obtenha uma amostra não proporcional de 10% dos funcionários. B) Obtenha uma amostra proporcional de 10% dos funcionários. 3) Utilizando a tabela de números aleatórios faça a escolha dos funcionários que irão compor a amostra em cada departamento do exercício 2. 4) Uma população encontra-se dividida em 4 estratos, com tamanhos, respectivamente: N1= 50; N2 = 70; N3 = 80 e N4 = 20. Sabendo-se que, ao ser realizada uma amostragem estratificada proporcional, 7 elementos da amostra foram retirados do segundo estrato, determine o número total de elementos da amostra e o número de elementos da amostra de cada estrato. 5) O diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, desejoso de conhecer as condições de vida extra-escolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias, resolve fazer um levantamento por amostragem sistemática em 20% dessa clientela. Obtenha, para esse diretor, os elementos componentes da amostra. A amostragem será não proporcional. Utilize a a tabela de números aleatórios. Suponha que você tenha duas listas. Uma com os nomes de todos os meninos e a outra com os nomes de todas as meninas. E, os nomes estão numerados. 6) Numa rua existem 900 residências, obter uma amostra sistemática de 20 residências desta rua. 7) Um pesquisador deseja obter uma amostra aleatória simples de 15 empresas de 435 que estão situadas em uma determinada parte do estado. Utilizando a tabela de números aleatórios apresente as empresas que serão avaliadas. 8) Faça uma amostragem sistemática das empresas do exercício 7. Amostrar 15 empresas. 2.4 TAMANHO DA AMOSTRA Conceitos: Parâmetro: característica da população. Estimativa: valor acusado por uma estatística que estima o valor de um parâmetro populacional. ERRO AMOSTRAL: diferença entre o valor que a estatística pode acusar e o verdadeiro valor do parâmetro que se deseja estimar. ERRO AMOSTRAL TOLERÁVEL: quanto um pesquisador admite errar na avaliação dos parâmetros de interesse numa população. Exemplo, o resultado de uma pesquisa eleitoral: Candidato A = 20%, com 2% de erro amostral (18% - 22%) FÓRMULA PARA CÁLCULO DO TAMANHO DA AMOSTRA N = Tamanho da população E0 = erro amostral tolerável nO = primeira aproximação do tamanho da amostra n = tamanho da amostra EXEMPLO CÁLCULO DO TAMANHO DA AMOSTRA N = 200 famílias E0 = erro amostral tolerável = 4% (E0 = 0,04) n0 = 1/(0,04)2 = 625 famílias n (tamanho da amostra corrigido) = n = 200x625/200+625 = 125000/825 = 152 famílias E se a população fosse de 200.000 famílias? n = (200.000)x625/(200.000 +625) = 623 famílias Observe-se que se N é muito grande, não é necessário considerar o tamanho exato N da população. Nesse caso, o cálculo da primeira aproximação já é suficiente para o cálculo. Observe que: N = 200 famílias, E0 = 4% n = 152 famílias →76% da população Observe que: N = 200.000 famílias, E0 = 4% n = 623 famílias → 0,3% da população Logo, é errôneo pensar que o tamanho da amostra deve ser tomado como um percentual do tamanho da população para ser representativa EXERCÍCIOS PROPOSTOS - TAMANHO DA AMOSTRA Numa pesquisa para uma eleição presidencial, qual deve ser o tamanho de uma amostra aleatória simples, se se deseja garantir um erro amostral não superior a 2% ? Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos favoráveis a certo treinamento. Qual deve ser o tamanho da amostra aleatória simples que garanta um erro amostral não superior a 5%? Após ter definido os objetivos, formulado as hipóteses, planejado a pesquisa e coletado os dados, por um estudo observacional (amostragem) ou por um estudo experimental esses dados devem ser digitados em uma planilha. Quase sempre o conjunto de dados se trata de uma massa de valores incompreensível, sem uma estrutura aparente. Técnicas descritivas ou exploratórias são utilizadas para organizar os dados e investigá-los, relatar ou expor características dos mesmos e procurar indícios de padrões ou características interessantes que possam indicar possíveis tendências. Essas técnicas consistem na leitura e no resumo dos dados utilizando tabelas, gráficos, estatísticas e esquemas. Elas devem fornecer resultados simples, que tem algumas características como: Atrair a atenção, serem auto-explicativos, ser de fácil compreensão e serem confiáveis. As técnicas usadas são: Descrição Tabular: Tabelas são utilizadas para sumarizar os dados, especialmente as tabelas de distribuição de frequências. Gráficos descritivos: Gráficos são usados para sumarizar os dados e Descrição Paramétrica: Estima-se os valores de certos parâmetros que completam a descrição do conjunto dos dados. 3.TIPOS DE VARIÁVEIS Variável é a característica de interesse que é medida em cada elemento da amostra ou população. Como o nome diz, seus valores variam de elemento para elemento. As variáveis podem ter valores numéricos ou não numéricos e são classificadas da seguinte forma: Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas. Variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável e, assim, somente fazem sentido valores inteiros. Geralmente são os resultados de contagens. Exemplos: número de filhos, número de bactérias numa placa, número de insetos por gleba. Variáveis contínuas: características mensuráveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), idade. Variáveis Qualitativas (ou categóricas): Envolve simplesmente o ato de nomear, rotular, quantificar ou classificar objetos, pessoa ou qualquer característica. Ex: sexo, profissão, estado civil, vendas, compras, etc….Trata-se de uma variável restritiva em termos de possibilidades do uso de técnicas estatísticas, uma vez que não são possíveis operações aritméticas com seus valores.. Podem ser nominais ou ordinais. Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio. Exemplo: Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1o, 2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro). Uma variável originalmente quantitativa pode ser coletada de forma qualitativa. Por exemplo, a variável idade, medida em anos completos, é quantitativa; mas, se for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc...), é qualitativa (ordinal). Outro exemplo é o peso dos lutadores de boxe, uma variável quantitativa se trabalharmos com o valor obtido na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado, etc.). Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea, por exemplo. Isto não significa que a variável sexo passou a ser quantitativa. RESUMO 3.1. REPRESENTAÇÃO GRÁFICA DE VARIÁVEIS QUALITATIVAS Iniciaremos essa apresentação com os dados de natureza qualitativa, que são os mais fáceis de tratar do ponto de vista da análise descritiva. Para organizar os dados provenientes de uma variável qualitativa, é usual fazer uma tabela de frequências, como a Tabela 1 onde estão apresentadas as frequências com que ocorrem cada um dos sexos no total dos 97 ursos observados. Tabela 1: Distribuição de frequências dos ursos segundo sexo. Cada categoria da variável sexo (feminino, masculino) é representada numa linha da tabela. Há uma coluna com as contagens de ursos em cada categoria (frequência absoluta) e outra com os percentuais queessas contagens representam no total de ursos (frequência relativa). Esse tipo de tabela representa a distribuição de frequências dos ursos segundo a variável sexo. Como a variável sexo é qualitativa nominal, isto é, não há uma ordem natural em suas categorias, a ordem das linhas da tabela pode ser qualquer uma. A Tabela 2 mostra a distribuição de frequências dos ursos segundo o mês de observação, que é uma variável qualitativa ordinal. Nesse caso, podemos acrescentar mais duas colunas com as frequências acumuladas (absoluta e relativa), que mostram, para cada mês, a frequência de ursos observados até aquele mês. Por exemplo, até o mês de julho, foram observados 31 ursos, o que representa 32,0% do total de ursos estudados. Tabela 2: Distribuição de frequências dos ursos segundo mês de observação. A visualização da distribuição de frequências de uma variável fica mais fácil se fizermos um gráfico a partir da tabela de frequências. Existem vários tipos de gráficos, dependendo do tipo de variável a ser representada. Os gráficos de barras, colunas e setores (pizza) são os gráficos mais comuns para a descrição de dados oriundos de variáveis qualitativas. Basicamente, eles mostram as frequências de observações para cada rótulo, ou categoria, da variável que se deseja descrever. Os softwares estatísticos têm comandos específicos para a construção desses tipos de gráficos. No gráfico de COLUNAS utilizamos no eixo horizontal os rótulos que são usados para identificar as classes (categorias). No eixo vertical utilizamos uma escala de frequência absoluta simples ou em porcentagem. Gráfico 1- Distribuição de frequências dos ursos de acordo com o mês de observação. No gráfico de Barras faz-se o contrário, ou seja, as classes são colocadas no eixo vertical e as frequências no eixo horizontal. As barras e colunas devem ter larguras fixas e devem estar separadas. Gráfico 2- Distribuição de frequências dos ursos de acordo com o mês de observação. O gráfico em setores ou pizza constitui outro dispositivo gráfico para representar as distribuições de frequências de dados qualitativos. Para construir um gráfico de pizza precisamos calcular a coluna de frequências relativas ou proporção (frequência absoluta/número total de observações): fi = Fi/n. Este valor pode ser apresentado na forma de porcentagem: fi% = fi x 100 . Feito isto utilizaremos as porcentagens das frequências relativas para subdividirmos o círculo em setores, ou partes, que correspondem à frequência relativa de cada rótulo ou classe. GRÁFICO DE PIZZA Gráfico 3- Distribuição de frequências do sexo dos ursos. 3.2. DESCRIÇÃO DE DADOS QUANTITATIVOS Quando estamos trabalhando com uma variável discreta que assume poucos valores, podemos dar a ela o mesmo tratamento dado às variáveis qualitativas, assumindo que cada valor é uma classe e que existe uma ordem natural nessas classes. Tabela 3: Distribuição de frequências do número de filhos por família em uma localidade (25 lares). Analisando a Tabela 3, podemos perceber que as famílias mais frequentes são as de dois filhos (40%), seguida pelas famílias de três filhos. Apenas 16% das famílias têm mais de três filhos, mas, são ainda mais comuns do que famílias sem filhos. Gráfico 4 - Distribuição de frequências do número de filhos por família Quando trabalhamos com uma variável discreta que pode assumir um grande número de valores distintos como, por exemplo, Consumo Mensal de Energia Elétrica, por 50 Usuários Particulares KWH (quilowatts-hora). A solução é agrupar os valores em classes ao montar a tabela. Dados Brutos São aqueles valores a que se chegou pela simples coleta, sem qualquer Preocupação quanto à sua ordenação. Exemplo: Consumo Mensal de Energia Elétrica, por 49 Usuários Particulares KWH (quilowatts-hora) 58 62 80 57 8 126 136 96 144 19 90 86 38 94 82 75 148 114 131 28 66 95 121 158 64 105 118 73 83 81 50 92 60 52 89 58 10 90 94 74 9 75 72 157 125 76 88 78 84 36 Como se pode observar, os números estão dispostas de forma desordenada. Em razão disso, pouca informação se consegue obter inspecionando os dados anotados. Mesmo uma informação tão simples como a de saber os consumos máximo e mínimo requer um certo exame dos dados da tabela. Rol Consiste em representar os dados na ordem crescente. Consumo Mensal de Energia Elétrica, por 50 Usuários Particulares KWH(quilowatts-hora) 8 9 10 19 28 36 38 50 52 57 58 58 60 62 64 66 72 73 74 75 75 76 78 80 81 82 83 84 86 88 89 90 92 94 94 95 96 105 114 118 121 125 126 131 136 144 148 157 158 Essa classificação dos dados proporciona algumas vantagens concretas com relação à sua forma original: - é possível visualizar de forma ampla as variações de consumo. - os valores extremos são percebidos de imediato. - é possível observar uma tendência de concentração dos valores na faixa de 50-90 kwh Apesar de o rol propiciar ao analista mais informação e com menos esforço de concentração do que os dados brutos, ainda assim persiste o problema de a análise ter que se basear nas 50 observações. O problema se agravará quando o número de dados for muito grande. COMO MONTAR UMA TABELA COM INTERVALOS DE CLASSES Vamos construir uma tabela de distribuição de frequências e o histograma das idades dos funcionários de uma amostra de 50 elementos selecionados da empresa X. Dados: Idades de 50 funcionários (colocadas em ordem crescente). 18 - 20 - 20 - 21 - 22 - 24 - 25 - 25 - 26 - 27 - 29 - 29 - 30 - 30 - 31 - 31 - 32 - 33 - 34 - 35 - 36 - 36 - 37 - 37 - 37 - 37 - 38 - 38 - 38 - 40 - 41 - 43 - 44 -44 - 45 - 45 - 45 - 46 - 47 - 48 - 49 - 50 - 51 - 53 - 54 - 54 - 56 - 58 - 62 - 65 1º passo: Construir o rol (dados em ordem crescente) através dos dados brutos (São aqueles valores a que se chegou pela simples coleta, sem qualquer preocupação quanto à sua ordenação) e determinar a Amplitude Total: AT AT = Maior medida - Menor medida No caso, o rol já foi construído, e a Amplitude Total será: AT = 65 - 18 = 47. 2º passo: Como os dados serão agrupados em classes, é preciso escolher o número de classes - K, bem como o tamanho do intervalo das classes - I. É possível o uso de intervalos com tamanhos iguais, ou desiguais. Geralmente, escolhem-se tamanhos iguais. Há vários critérios para a escolha do número de classes. Dos dois critérios mostrados a seguir, usaremos o 1º critério. 1 º Critério: Fórmula de Sturges: onde: n = número de elementos que se deseja representar. 2º Critério: Regra empírica, dada pela Tabela 3. Tabela 3. Número de classes para a construção da distribuição de freqüências e histograma. Número de elementos que se deseja representar Número de classes Menor do que 25 5 ou 6 Entre 25 e 50 De 7 a 14 Maior do que 50 De 15 a 20 No exemplo que estamos mostrando: = 1 + 3,33 (1, 7) 7 3º passo: Quanto ao tamanho dos intervalos (iguais) das classes h: No exemplo: I AT/ K = 47 ÷ 7 7 Quanto aos limites das classes, utilizaremos o seguinte critério: a ⱶ b (incluiremos nesta classe todos os elementos maiores ou iguais a a e menores do que b. Dessa forma teremos a tabela a seguir referente à idade dos funcionários: Classes Intervalos das classes Fi 1 18 ⱶ 25 6 2 25 ⱶ 32 10 3 32 ⱶ 39 13 4 39 ⱶ 46 8 5 46 ⱶ 53 6 6 53 ⱶ 60 5 7 60 ⱶ 67 2 somas 50 Tipos de frequências Frequência Absoluta (Fi) É o número de repetições de um valor individual ou de uma classe de valores da variável. Frequência Relativa (fi ou fi%) Representa a proporção de observações de um valor individual ou de uma classe, em relação ao número total de observações. fi = Fi/n onde n é o total de observações daamostra. Desejando expressar o resultado em termos percentuais: fi% = fi x 100 Frequência Absoluta Acumulada (Fac) A frequência acumulada “abaixo de” uma classe ou de um valor individual é a soma da frequência absoluta dessa classe ou desse valor com as frequências absolutas das classes ou dos valores anteriores. Frequência Relativa Acumulada (fac ou fac%) A frequência relativa acumulada “abaixo de” uma classe ou de um valor individual é a soma da frequência relativa dessa classe ou desse valor com as frequências relativas das classes ou dos valores anteriores. Ponto Médio Como a variável de estudo é agrupada em classes, temos interesse em determinar os pontos médios das classes - xi . Xi = Li + (Ls – Li)/2 Eis a tabela de distribuição de freqüências para os dados do exemplo: Recordando: C = número de classes = 7 I = tamanho do intervalo = 7 Menor medida = 18 anos Maior medida = 65 anos Logo, a primeira classe conterá todas as idades maiores ou iguais a 18 e menores do que 25, pois os limites da 1ª classe são 18 ⱶ 25. Assim, a tabela da distribuição de freqüências das idades poderá ser representada da seguinte maneira: Classes Intervalos das classes Fi fi fi% Fac fac %fac xi 1 18 ⱶ 25 6 6/50=0,12 12 6 0,12 12 21,5 2 25 ⱶ 32 10 0,20 20 16 0,32 32 28,5 3 32 ⱶ 39 13 0,26 26 29 0,58 58 53,5 4 39 ⱶ 46 8 0,16 16 37 0,74 74 42,5 5 46 ⱶ 53 6 0,12 12 43 0,86 86 49,5 6 53 ⱶ 60 5 0,10 10 48 0,96 96 56,5 7 60 ⱶ 67 2 0,04 4 50 1 100 63,5 somas 50 1 100 Conforme os objetivos da Estatística Descritiva, a tabela de distribuição das frequências sintetiza e organiza uma coleção de dados, facilitando a compreensão e análise da variável sob estudo. Dentre outras considerações sobre as idades dos 50 funcionários que estamos analisando, poderemos afirmar: • a maior quantidade de funcionários tem idade entre 32 e 38 anos; • apenas 4% dos funcionários possuem idades iguais ou superiores a 60 anos, sendo 65 anos a maior idade do grupo; • cinqüenta e oito por cento dos funcionários da amostra têm idades inferiores a 38 anos, sendo 18 anos a menor idade do grupo. Os histogramas são os gráficos mais adequados para a descrição de dados oriundos de variáveis quantitativas. Basicamente, eles mostram as frequências de observações para cada valor ou conjunto de valores da variável que se deseja descrever. Os softwares estatísticos têm comandos específicos para a construção dos histogramas. Observar: os histogramas contêm as mesmas informações da tabela de distribuição das freqüências. São representações que buscam a organização e sintetização de grupos de dados quantitativos. EXERCÍCIOS PROPOSTOS – TABELAS E GRÁFICOS Conceitue população e amostra Conceitue variável qualitativa. Conceitue variável quantitativa. Conceitue dado bruto e rol. CONCEITUE ESTATÍSTICA DESCRITIVA. Suponha que uma pesquisa de opinião pública deve ser realizada em duas grandes cidades e uma zona rural. Os elementos na população de interesse são todos os homens e mulheres do estado com idade acima de 21 anos. Que tipo de amostragem você sugeriria?. Um médico está interessado em obter informação sobre o número médio de vezes em que 15.000 especialistas prescreveram certa droga no ano anterior (N = 15.000). Deseja-se obter uma amostra n = 1.600. Que tipo de amostragem você sugeriria e por quê? Assinale a afirmativa verdadeira: Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos horizontalmente. Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos verticalmente. Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos verticalmente e um gráfico de colunas, horizontalmente. Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos horizontalmente e um gráfico de colunas, verticalmente. Todas as alternativa anteriores são falsas. Os dados seguintes representam 20 observações relativas ao índice pluviométrico em determinado município do Estado: Milímetros de chuva Montar a tabela de distribuição de frequências apresentando as colunas das frequências: absolutas, absolutas acumuladas, relativas, relativas em porcentagem, relativas em porcentagens acumuladas e ponto médio. OBS: iniciar em 140 e utilizar intervalo de classe igual a 4. Construir o histograma utilizando a porcentagem. Considere a seguinte distribuição de frequência correspondente aos diferentes preços de um determinado produto em vinte casas agrícolas pesquisadas. PREÇOS CASAS AGRÍCOLAS 50 2 62 5 67 6 75 6 81 1 Quantas casas agrícolas apresentaram um preço de R$50,00? Apresente as colunas da frequência relativa em decimal e em porcentagem. Quantas casas agrícolas apresentaram um preço de até R$67,00 (inclusive)? Qual o percentual de casas agrícolas com o menor preço? Qual o percentual de casas agrícolas com o maior preço? Fazer o gráfico de colunas. Os dados do quadro seguinte referem-se ao resultado de um teste de germinação realizado num dado lote de cereal do qual se recolheram 80 amostras, cada uma constituída por 100 grãos, que foram postos a germinar em condições controladas de temperatura e umidade. O número de grãos que germinaram ao fim de 14 dias por amostra está registrado a seguir: 86 95 92 89 92 92 91 88 88 94 90 88 89 90 86 88 93 92 92 87 91 94 92 94 91 92 88 94 93 91 91 91 92 90 89 86 89 90 90 89 84 89 88 93 92 95 86 93 91 90 91 89 89 95 92 94 94 90 86 93 86 94 90 87 93 91 90 92 93 94 92 92 94 93 93 92 93 93 88 91 a) Montar uma tabela de distribuição de frequências incluindo as colunas de frequências absolutas, absolutas acumulas, relativas, relativas em porcentagem, relativas acumuladas b) Construir o histograma das frequências absolutas. c) Das 80 amostras quantas apresentaram número de sementes germinadas igual ou superior a 90 sementes? d) Qual a classe com maior frequência? e) Esta classe representa quanto por cento das amostras? f) Qual a classe com menor frequência? g) Esta classe representa quanto por cento da amostras? h) Quantas amostras tiveram pelo menos 94 das sementes germinadas? i) Quantas amostras tiveram menos de 85 das sementes germinadas? 4. MEDIDAS DE POSIÇÃO Como o próprio título sugere nossa pretensão aqui é a determinação e o cálculo de medidas que ofereçam o posicionamento da distribuição dos valores de uma variável que desejamos analisar. 4.1. Média aritmética ou média amostral A medida de tendência central mais comum para um conjunto de dados é a média aritmética. A média aritmética de uma amostra de n observações – x1, x2, ... , xn - representada pelo símbolo (lê-se X - barra), é calculada por: Onde n é o número total de observações. EXEMPLO: Encontrar a média aritmética para o conjunto de observações: 5, 1, 6, 2, 4. Solução: temos cinco observações: n = 5, então: Quando os valores de xi estão agrupados com suas respectivas frequências absolutas Fi, a média aritmética ou média amostral é expressa por: EXEMPLO: Determinar a idade média para o conjunto dos 50 funcionários considerados na Tabela a seguir: Solução: Da tabela de distribuição de freqüências, temos: Classes Intervalos das classes Fi xi xiFi 1 18 ⱶ 25 6 21,5 129 2 25 ⱶ 32 10 28,5 285 3 32 ⱶ 39 13 35,5 461,50 4 39 ⱶ 46 8 42,5 340 5 46 ⱶ 53 6 49,5297 6 53 ⱶ 60 5 56,5 282,50 7 60 ⱶ 67 2 63,5 127 somas 50 1.922 Logo: anos O resultado 38,44 anos é aproximado, uma vez que utilizamos os pontos médios xi como representantes das classes em que foram agrupadas as 50 idades. O valor da média aritmética, desconsiderando-se o agrupamento em classes, é de: anos Observar: a diferença entre os resultados foi de 38,32 - 38,44 = - 0,12. Assim, quando o analista dispuser da tabela de distribuição de frequências, e admitir que uma aproximação do cálculo da média não vai comprometer suas conclusões, poderá usar a fórmula para os dados agrupados. Caso contrário, deverá utilizar a fórmula comum para o cálculo da média aritmética. EXERCÍCIOS PROPOSTOS 1. A média mínima para aprovação em determinada disciplina é 5,0. Se um estudante obtém as notas 7,5; 8,0; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questão, pergunta-se se ele foi ou não aprovado. 2. A seguir, é dada a distribuição da quantidade de defeitos por computador para uma amostra de 100 aparelhos: Quantidade de defeitos por computador O 1 2 3 4 5 6 Número de aparelhos 15 28 20 14 10 7 6 Determinar o número médio de defeitos por computador. 4.2. Mediana Colocados em ordem crescente, mediana (Md) é o valor que divide a amostra, ou população, em duas partes iguais. Assim: Md 0 50% 100% Cálculo da mediana para dados não agrupados e agrupados sem intervalos Se n for ímpar, a mediana será o elemento central de ordem . Se n for par, a mediana será a média entre os elementos centrais de ordem e EXEMPLO: Calcular a mediana para as distribuições: Classes Fi Fac 1 1 1 2 3 4 3 5 9 4 2 11 soma 11 Por meio da Fac encontra-se o valor xi correspondente à mediana. Neste exemplo, será o 3 (Md= 3). Observar: é o xi correspondente à classe que contiver a ordem calculada, no caso o sexto elemento. Explicação prática: 12223333344 b) Classes Fi Fac 82 5 5 85 10 15 87 15 30 89 8 38 90 4 42 soma 42 Assim: 21º corresponde a 87 e 22º corresponde a 87, logo Cálculo da mediana para os dados agrupados em intervalos classes 1 º passo: Calcula-se a ordem n/2. 2º passo: Pela Fac identifica-se a classe que contém a mediana (classe Md). 3º passo: Utiliza-se a fórmula: em que: = limite inferior da classe que contem a mediana n = tamanho da amostra ou número de elementos. = soma das frequências absolutas anteriores à classe que contem mediana. h = amplitude da classe que contem a mediana FMd = frequência da classe que contem a mediana EXEMPLO: Dada a distribuição amostral, calcular a mediana: Intervalo das classes Fi Fac 35 ⱶ 45 5 5 45 ⱶ 55 12 17 55 ⱶ 65 18 35 65 ⱶ 75 14 49 75 ⱶ 85 6 55 85 ⱶ 95 3 58 soma 58 1º passo: Calcula-se n/2 = 58/2 = 29º 2º passo: Identifica-se a classe Md pela Fac• Nesse caso, a classe Md é a 3ª. 3º passo: Aplica-se a fórmula: Então: 50% das observações têm medidas abaixo de 61,67, e 50% acima desse valor. 4.3- QUATIL Os quartis dividem um conjunto de dados em quatro partes iguais de 25%. Assim: 0% 25% 50% 75% 100% Q1 Q2 = Md Q3 1º quartil deixa 25% dos dados 2º quartil coincide com a mediana, deixa 50% dos dados 3º quartil deixa 75% dos dados Determinação do quartil para dados não agrupados e agrupados sem intervalos de classe Quando os dados não estão agrupados em classes ou estão agrupados e sem intervalos utiliza-se a fórmula in/4 para determinar a posição em que o quartil está. EXEMPLO: Calcular o valor do 1º, 2º e 3º quartis para a distribuição a seguir: Classes Fi Fac 1 1 1 2 3 4 3 5 9 4 2 11 soma 11 in/4 = 1x11/4 = 2,75, logo o primeiro quartil é representado pela classe 2. in/4 = 2x11/4 = 5,5 logo o segundo quartil é representado pela classe 3. In/4 = 3x11/4 = 8,25 logo o segundo quartil também é representado pela classe 3. Determinação do quartil para dados agrupados em intervalos de classe 1º Passo: Calcula-se a ordem n/4 2º Passo: identifica-se a classe que contem o quartil pela Fac 3º Passo: Aplica-se a fórmula: em que: = limite inferior da classe que contem o quartil n = tamanho da amostra ou número de elementos = soma das frequências absolutas anteriores à classe Q1 h = amplitude da classe que contem o quartil FQ1 = frequência da classe que contem o quartil DETERMINAÇÃO DO 3º QUARTIL 1º Passo: Calcula-se a ordem 3n/4 2º P1asso: identifica-se a classe que contem o quartil 3 pela Fac 3º Passo: Aplica-se a fórmula: em que: = limite inferior da classe que contem o quartil 3. n = tamanho da amostra ou número de elementos = soma das frequências absolutas anteriores à classe que contem o quartil 3. h = amplitude da classe que contem o quartil 3. FQ3 = frequência absoluta da classe que contem o quartil 3. Exemplo: Dada a distribuição, determinar os quartis (Q1 e Q3) e a mediana. Classes Fi Fac 7 ⱶ 17 6 6 17 ⱶ 27 15 21 27 ⱶ 37 20 41 37 ⱶ 47 10 51 47 ⱶ 57 5 56 Soma 56 Diante desses resultados, pode-se afirmar que, nessa distribuição, há: 25% 25% 25% 25% 22,33 30,5 38 57 4.4- DECIS Continuando o estudo das medidas separatrizes: mediana e quartis, há os decis. São os valores que dividem a série em 10 partes iguais. 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% D1 D2 D3 D4 D5 D6 D7 D8 D9 O cálculo para um decil é dado por: 1º Passo: Calcula-se a ordem in/10, em que i = 1, 2, 3, ...,9 2º Passo: identifica-se a classe que contem o decil pela Fac 3º Passo: Aplica-se a fórmula: em que: = limite inferior da classe que contem o decil. n = tamanho da amostra ou número de elementos. = soma das frequências absolutas anteriores à classe que contem o decil. h = amplitude da classe que contem o decil. FDi = frequência absoluta da classe que contem o decil. 4.5. PERCENTIS São as medidas que dividem a serie em 100 partes iguais. 0% 1% 2% 3% ... 50% ... 97% 98% 99%100% P1 P2 P3 ... P50 ... P97 P98 P99 P100 O cálculo de um percentil (Pi) é dado por: 1º Passo: Calcula-se a ordem in/100, em que i = 1, 2, 3, ...,97, 98, 99, 100. 2º Passo: identifica-se a classe que contem o percentil pela Fac 3º Passo: Aplica-se a fórmula: Exemplo: Determinar o 4º decil e o 72º percentil da seguinte distribuição: Classes Fi Fac 4 ⱶ 9 8 8 9 ⱶ 14 12 20 14 ⱶ19 17 37 19 ⱶ24 3 40 Soma 40 Portanto, nessa distribuição, o valor 12,33 divide a distribuição em duas partes: uma (à esquerda) com 40% dos elementos e a outra com 60%. O valor 16,59 indica que 72% dos elementos da distribuição estão abaixo de 16,59 e 28% acima. 4.6. MODA Cálculo da Moda para dados agrupados em classes sem intervalos Dentre as principais medidas de posição, destaca-se a Moda. É o valor mais frequente da distribuição. Para distribuições simples (sem agrupamento de classes), a identificação da Moda é facilitada pela simples observação do elemento que apresenta maior frequência. Assim, para a distribuição: xi 243 245 248 251 307 Fi 7 17 23 20 8 A moda será 248 (Mo = 248). Cálculo da Moda para dados agrupados em classes com intervalo Há diversas formulas para o calculo da moda agrupada em classes. Destacaremos o calculo da moda por meio da formula de Czuber. 1o Passo: identifica-se a classe modal (classe com maior frequência) 2o Passo: Aplica-se a formula: Em que: = limite inferior da classe modal = Diferença entre a frequência da classe modal e a frequência da classe imediatamente anterior = Diferença entre a frequência da classe modal e a frequência da classe imediatamente posterior h = Amplitude da classe moda Exemplo: Determinar a moda para a distribuição: 1o Passo: Indica-se a classe modal: 2 ⱶ 3ª 2º Passo: Aplica-se a fórmula EXERCÍCIOS PROPOSTOS Para cada série e distribuição determine a mediana e a moda. 12, 7, 10, 8, 8 1, 3, 3, 4, 6, 8 ,8, 9 xi 7 ⱶ 10 10 ⱶ 13 13 ⱶ 16 16 ⱶ 19 19 ⱶ 22 Fi 6 10 15 10 5 Classes 0 ⱶ 1 1 ⱶ 2 2 ⱶ 3 3 ⱶ 4 4 ⱶ 5 soma Fi 3 10 17 8 5 43 xi 12 13 15 17 Fi 5 13 19 20 d) 5. MEDIDAS DE DISPERSÃO São medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média. Servem para medir a representatividade da média. Sejam as séries: (A) 20, 20, 20 e (B) 15, 10, 20, 25, 30 Apesar de as séries terem médias iguais, a série A não apresenta dispersão em torno da média, enquanto os valores da série B apresentam dispersão em torno da média. Nesta seção são apresentadas medidas estatísticas que avaliam o grau de dispersão, ou variabilidade, de uma variável. Variância Amostral Como se deseja medir a dispersão dos dados em relação à média é interessante analisar os desvios de cada valor (isto é ). Se os desvios forem baixos, teremos pouca dispersão; ao contrário, se os desvios forem altos, teremos elevada dispersão. É fácil constatar que a soma dos desvios em torno da média é zero . Para o cálculo da variância, consideram-se os quadrados dos desvios. A variância, S2, de uma amostra de n medidas é igual à soma dos quadrados dos desvios dividida por (n - 1), assim: Desenvolvendo o quadrado das diferenças: e somando os termos comuns, encontram-se as seguintes fórmulas práticas para o cálculo da variância amostral: Quanto maior o valor de S2, maior a dispersão dos dados amostrais. Para dados agrupados tem-se: Ou EXEMPLO: Calcular a variância para as medidas amostrais: 3, 7, 2, 1, 8. Usar fórmula básica e fórmula prática. Solução: Fórmula Básica Xi 3 3 – 4,2 = -1,2 1,44 7 2,8 7,84 2 -2,2 4,84 1 -3,2 10,24 8 3,8 14,44 soma 21 0 38,80 A média amostral = Feito os cálculos dos desvios pode-se obter a variância amostral aplicando –se a fórmula: Solução: Fórmula prática 3 9 7 49 2 4 1 1 8 64 21 127 Então a variância será: Desvio padrão amostral O cálculo da variância é obtido pela soma dos quadrados dos desvios em relação à média. Assim é que, se a variável sob análise for medida em metros, a variância deverá ser expressa em m2 (metros ao quadrado). Ou seja, a variância é expressa pelo quadrado da unidade de medida da variável que está sendo estudada. Para melhor interpretar a dispersão de uma variável, calcula-se a raiz quadrada da variância, obtendo-se o desvio padrão (S) que será expresso na unidade de medida original. Assim: Exemplo: Calcular o desvio padrão para as medidas utilizadas no exemplo da variância. un2 Interpretação do desvio padrão Para qualquer distribuição de variável aleatória normal cuja distribuição é simétrica tem-se que: • O intervalo contém 68,27% das observações amostrais. • O intervalo contém 95,45% das observações amostrais. • O intervalo contém 99,73% das observações amostrais. EXEMPLO 1: Calcular a variância e o desvio padrão da seguinte distribuição amostral: xi 5 7 8 9 11 Fi 2 3 5 4 2 EXEMPLO 2: Determinar a variância e o desvio padrão dos dados da tabela a seguir: Classes Intervalos das classes Fi xi xiFi x2Fi 1 18 ⱶ 25 6 21,5 2 25 ⱶ 32 10 28,5 3 32 ⱶ 39 13 53,5 4 39 ⱶ 46 8 42,5 5 46 ⱶ 53 6 49,5 6 53 ⱶ 60 5 56,5 7 60 ⱶ 67 2 63,5 somas 50 Interpretar os resultados. Coeficiente de variação de Pearson Trata-se de uma medida dispersão relativa. Enquanto a amplitude total, variância e o desvio padrão são medidas absolutas de dispersão, o coeficiente de variação (C.V.) mede a dispersão relativa. Assim: A partir do coeficiente de variação pode-se avaliar a homogeneidade do conjunto de dados e, consequentemente, se a média é uma boa medida para representar estes dados. Quanto mais próximo de zero, mais homogêneo é o conjunto de dados e mais representativa será sua média. Quanto maior o coeficiente de variação mais heterogêneo o conjunto de dados e a média é menos representativa. Neste caso optamos pela mediana. Uma desvantagem do C.V. é que ele deixa de ser útil quando a média está próxima de zero. Uma média muito próxima de zero pode inflacionar o C.V.. Eis algumas regras empíricas para interpretação do coeficiente de variação: C.V. < 15% há baixa dispersão 15% > C.V. < 30% há média dispersão C.V. ≥ 30% há elevada dispersão EXEMPLO: Em uma empresa, o salário médio dos homens é de $ 4.000, com desvio padrão de $ 1.500, e o salário médio das mulheres é de $ 3.000, com desvio padrão de $ 1.200. A dispersão relativa dos salários É maior para os homens? Solução: Dos dados do problema ternos: para os homens: para as mulheres: Resposta: Os salários das mulheres têm dispersão relativa maior de que os salários dos homens. As duas distribuições apresentam elevada dispersão. EXERCÍCIOS PROPOSTOS Foram feitas oito medidas do diâmetro (em mm) interno de anéis forjados de pistão de um motor de um automóvel. Os dados codificados são: 1, 3, 15, 0, 5, 2, 5 e 4. Calcule a média, desvio padrão da amostra e o Coeficiente de Variação. Setemedidas da espessura de óxido em pastilhas são estudadas para verificar a qualidade em um processo de fabricação de semicondutores. Os dados (angstroms) são: 1.264, 1.280, 1.301, 1.300, 1.292, 1.307, 1275. Calcule a média e o desvio padrão da amostra. A AMPLITUDE A amplitude, ou R, é a diferença entre o maior e o menor valor inclusos no conjunto de dados. Dessa forma, quando H representa o maior valor no grupo e L representa o menor valor, a amplitude dos dados não-agrupados é R =H-L Exemplo: Durante um determinado mês de verão, os oito representantes de venda de uma empresa de aquecimento e ar-condicionado venderam os seguintes números de unidades de ar-condicionado central: 8, 11, 5, 14, 8, 11, 16, I I. A amplitude do número de unidades vendidas é R = H - L = 16 - 5 = 11,0 unidades No caso de dados agrupados a amplitude será a diferença entre o limite superior do último intervalo (Ls) de classe e o limite inferior do primeiro intervalo de classe (Li). R = Ls – Li AMPLITUDES MODIFICADAS Uma amplitude modificada é uma amplitude para a qual alguns valores em cada extremidade da distribuição são eliminados da consideração. A amplitude dos 50% centrais é uma amplitude entre os valores do 25° percentil e o 75° percentil da distribuição. Sendo assim, ela é também a amplitude entre o primeiro e o terceiro quartis da distribuição. Por esta razão, a amplitude dos 50% centrais é usualmente designada como a amplitude interquartil (IRQ). Dessa forma, IRQ = Q3 – Q1 Outras amplitudes modificadas que são às vezes usadas são a dos 80% centrais, 90% centrais e 95% centrais. 7. MEDIDAS DE FORMA: ASSIMETRIA E CURTOSE. A medida de assimetria indica o grau de distorção da distribuição em relação a uma distribuição simétrica. As distribuições podem ser: simétrica, assimétrica positiva ou assimétrica negativa. 7.1.Distribuição de Frequência Simétrica: Uma distribuição é dita simétrica se existe um eixo de simetria no gráfico gerado pela tabela de frequência. Esse eixo divide o gráfico em duas partes iguais, de modo que, se rebatermos uma na outra, elas se sobrepõem completamente. Como mostra as figuras abaixo: Sempre que os dados tiverem média, mediana e moda iguais, a distribuição será simétrica. x=Md=Mo 7.2 Distribuição de Frequência Assimétrica. Se a distribuição não for simétrica, podemos ter dois casos de assimetria: assimetria positiva e assimetria negativa. A assimetria será negativa se a cauda da distribuição estiver do lado esquerdo do gráfico, como mostra a figura seguinte (a), e será positiva se a cauda da distribuição estiver do lado direito do gráfico, (b). A assimetria geralmente ocorre devido à extensão de uma das caudas da distribuição. Uma vez que os valores da cauda afetam muito a média, mas não a mediana e a moda, a média sempre acompanha o lado da cauda da distribuição. Nas figuras abaixo, podemos verificar que a distância da média em relação à moda e a mediana será maior, quanto maior for a extensão da cauda da distribuição e, consequentemente, maior será a assimetria da distribuição. Sendo a distribuição simétrica, a média e a moda coincidem; sendo a distribuição assimétrica à esquerda ou negativa, a média é menor que a moda; e sendo assimétrica à direita ou positiva, a média é maior que a moda. Baseando-se nessas relações entre média e a moda, podemos empregá-las para determinar o tipo de assimetria. Assim, calculando o valor da diferença: x − Mo se: x - Mo = 0 _ assimetria nula ou distribuição simétrica x - Mo < 0 _ assimetria negativa ou à esquerda x - Mo > 0 _ assimetria positiva ou à direita Coeficiente de Assimetria. A medida de assimetria de uma distribuição pode ser realizada pelo coeficiente de assimetria de Pearson, dado por: Dependendo do valor de As, podemos classificar a distribuição em: _ Simétrica, se |As| < 0,15 _ Assimétrica moderada, se 0,15 ≤ |As| <1,0 _ Assimétrica forte, se |As| ≥ 1,0 7.4 Medidas de Achatamento ou Curtose. A medida de curtose nos indica a forma da curva de distribuição em relação ao seu achatamento. A forma da curva de distribuição em relação à curtose pode ser leptocúrtica, mesocúrtica ou platicúrtica. Quando a distribuição apresenta uma curva de frequência mais fechada que a normal (ou mais aguda em sua parte superior), ela recebe o nome de leptocúrtica. Quando a distribuição apresenta uma curva de freqüência mais aberta que a normal (ou mais achatada na sua parte superior), ela é chamada de platicúrtica. A curva normal que é a referencial, recebe o nome de mesocúrtica. 7.5 Coeficiente de Curtose: A curtose pode ser medida pela seguinte expressão: Essa fórmula é conhecida como coeficiente percentílico de curtose. Relativamente a curva normal, temos; c = 0,263 Assim: C = 0,263 _ curva mesocúrtica C < 0,263 _ curva leptocúrtica C > 0,263 _ curva platicúrtica Exercício de fixação 1: Sabendo-se que uma distribuição apresenta as seguintes medidas: Q1 = 24,4 cm, Q3 = 41,2 cm, P10 =20,2 cm e P90 =49,4 cm, classificá-la quanto à curtose. 08 13 67 90 68 58 14 89 26 69. � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� n = 11, n é impar, logo a mediana será o elemento de ordem: � EMBED Equation.3 ���. Para identificá-lo, abre-se a coluna das frequências acumuladas Fac. n = 42, n é par, logo a mediana será a média entre os elementos de ordem: � EMBED Equation.3 ��� e � EMBED Equation.3 ���, ou seja, 21º e 22º. Identifica-se os elementos pela Fac. � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� Classe Q1 n/4 = 56/4 = 14 Classe Md n/2 = 56/2 = 28 Classe Q3 3n/4 = 3 x 56/4 = 42 � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� Classe D4 = in/10 = (4 x 40)/10 = 16 Classe P72 = in/100 = (72 x 40)/100 = 28,8 � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � PAGE \* MERGEFORMAT �41� _1405257865.unknown _1423053795.unknown _1469381949.unknown _1469382924.unknown _1469382936.unknown _1469382911.unknown _1437362842.unknown _1469381848.unknown _1469381938.unknown _1469381736.unknown _1437362841.unknown _1423055356.unknown _1407063325.unknown _1407063372.unknown _1407063508.unknown _1407063509.unknown _1407063506.unknown _1407063379.unknown _1407063349.unknown _1407063362.unknown _1407063328.unknown _1407063304.unknown _1407063323.unknown _1405261127.unknown _1403435613.unknown _1403460319.unknown _1403461972.unknown _1403587946.unknown _1403590521.unknown _1403590680.unknown _1403591171.unknown _1404665848.unknown _1403591126.unknown _1403590574.unknown _1403588183.unknown _1403588274.unknown_1403587978.unknown _1403462235.unknown _1403587798.unknown _1403462651.unknown _1403462185.unknown _1403461512.unknown _1403461785.unknown _1403461960.unknown _1403461061.unknown _1403461064.unknown _1403461333.unknown _1403460325.unknown _1403458270.unknown _1403460103.unknown _1403460137.unknown _1403458282.unknown _1403435755.unknown _1403431650.unknown _1403432097.unknown _1403433790.unknown _1403433894.unknown _1403433919.unknown _1403432232.unknown _1403431759.unknown _1403425658.unknown _1403425730.unknown _1403425517.unknown
Compartilhar