Baixe o app para aproveitar ainda mais
Prévia do material em texto
Fundamentos de Estatística 2020.1 Ementa AULA 08 ü Revisão de Conteúdo Estatística Aurélio Buarque de Holanda Ferreira (1986) definiu Estatística como uma parte da matemática em que se investigam os processos de obtenção, organização e análise de dados sobre uma população e os métodos de tirar conclusões e fazer predições com base nesses dados. A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial.. Estatística Descritiva Inferencial Refere-se à descrição e organização de dados experimentais Serve para tirar conclusões da realidade de um todo, partindo-se de um conhecimento de uma parte População e Amostra Amostra é o subconjunto de elementos retirados da população que estamos observando para obtermos determinados dados. População é o conjunto de elementos que desejamos observar para obtermos determinados dados. “ É um conjunto de elementos com pelo menos uma característica em comum”. Inferência Estatística é o processo pelo qual se admite que os resultados obtidos na análise dos dados de uma amostra são válidos para toda a população da qual aquela amostra foi retirada. Consiste em obter e generalizar conclusões. Variável Variável – propriedade que identifica, caracteriza, descreve, qualifica ou organiza. Variável Quantitativa Discreta Contínua Qualitativa Nominal Ordinal Intervalar Distingue os informes em função de suas propriedades, atributos ou condições. Exemplos: Cor de olhos, conceito para filmes... Expressa alguma propriedade mensurável do evento de interesse. Em geral resulta de medição, enumeração, contagem ou cálculo. Exemplos: peso, estatura, número de filhos, idade... Variável Contínuas aquelas que podem assumir qualquer valor, em geral números reais. Exemplo: estatura, peso. Discretas aquelas que só podem assumir determinados valores, geralmente números naturais. Exemplo: número de filhos, quantidade de alunos em sala. Ordinais indicam relação de ordem ou hierarquia entre os elementos, são exemplos as classificações de concurso e tabelas de campeonatos. Nominais são aquelas que apresentam qualidade como sexo, religião e todas as questões cuja resposta seja sim ou não. Intervalares apresentam uma escala ou intervalo de valores para classificação como opinião sobre filme (excelente, muito bom, bom, regular, ruim). Tipos de Frações Fração Imprópria ocorre quando o denominador é menor que o numerador. Fração Própria ocorre quando o numerador é menor que o denominador. Fração Aparente ocorre quando o numerador é um número múltiplo do denominador. Exemplo: 3 /3; 6 / 2 Número Misto: Representação de uma fração imprópria. Exemplo: 1 ¼ Como transformar uma fração imprópria em número misto? Exemplo: 21 / 4 Frações Equivalentes representam a mesma parte do todo. Exemplo: ½ = 2/4 = 3/6. Frações 1) Simplificação de Frações: 8 / 20 è 2 / 5 2) Redução de Frações a um mesmo denominador: 3 / 4 e 7 / 10 è 15 / 20 e 14 / 20. 3) Comparação de Frações: Com o mesmo denominador à 2 / 5 < 4 / 5 Com denominadores diferentes à 5 / 8 > 7 / 12 MDC (20, 8) = 4 “A / B é irredutível quando MDC (A,B) = 1” MMC (4, 10) = 20 MMC (8, 12) = 24 Operações com Frações Multiplicação de Frações Exemplo em sala com duas ou mais frações. Adição e Subtração: Exemplos em sala com mesmo denominador, com denominadores diferentes e com frações mistas. Divisão de Frações Exemplo em sala Proporção Razão: Quatro números (a, b, c, d) pertencentes ao conjunto de números Reais (b e d > 0) . a / b = c / d è “ a está para o b, assim como c está para o d” a x d = b x c Propriedade: a / b = c / d a / b = c / d è (a + c) / (b + d) = (3a + 2c) / (3b + 2d) Divisão diretamente proporcional: Exemplo: Dividir o número 396 em partes diretamente proporcionais a 2, 4, 6. 33 è Constante de Proporcionalidade Divisão inversamente proporcional: Exemplo: Dividir o número 354 em partes inversamente proporcionais a 2, 5 e 7. Arredondamento de números Arredondamento para 2 casas decimais: 1 2 3 4 5 6 7 8 9 NÃO MUDA 48,333333 = 48,33. 48,7777777 = 48,78 Técnicas de Amostragem Amostragem Aleatória Simples Exemplo: O tempo de utilização de caixas eletrônicos depende de cada usuário e das operações efetuadas. Foram coletadas 24 medidas desse tempo (em minutos): 1,2 / 1,0 / 1,5 / 1,2 / 1,3 / 1,4 / 1,2 / 1,6 / 1,8 / 1,6 / 1,2 / 1,5 / 2,1 / 2,3 / 1,5 / 1,4 / 2,0 / 2,5 / 1,9 / 1,1 / 2,0 / 1,8 / 2,6 / 1,3 1 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24 Componha uma amostra aleatória simples de tamanho n = 4. TNA 10ª L e 6ª C 1º Passo: Enumerar de 1 a “N” 2º Passo: Sortear 4 elementos (n = 4) na Tabela de números aleatórios (TNA) partindo da referência dada; TNA 10ª Linha 6ª Coluna População com 24 números: Precisamos de números de 2 dígitos para escolha da amostra; Criar um critério padrão: A partir do número sorteado andar sempre para baixo na TNA. Números sorteados: 16 / 03 / 04 / 17 Amostragem Aleatória Simples Exemplo: O tempo de utilização de caixas eletrônicos depende de cada usuário e das operações efetuadas. Foram coletadas 24 medidas desse tempo (em minutos): 1,2 / 1,0 / 1,5 / 1,2 / 1,3 / 1,4 / 1,2 / 1,6 / 1,8 / 1,6 / 1,2 / 1,5 / 2,1 / 2,3 / 1,5 / 1,4 / 2,0 / 2,5 / 1,9 / 1,1 / 2,0 / 1,8 / 2,6 / 1,3 1 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24 Componha uma amostra aleatória simples de tamanho n = 4. TNA 10ª L e 6ª C 1º Passo: Enumerar de 1 a “N” 2º Passo: Sortear 4 elementos (n = 4) na Tabela de números aleatórios (TNA) partindo da referência dada; Sorteio: 16 / 03 / 04 / 17 Amostra: ⎨ 1,4 ; 1,5 ; 1,2 ; 2,0 ⎬ Amostragem Sistemática Exemplo: O tempo de utilização de caixas eletrônicos depende de cada usuário e das operações efetuadas. Foram coletadas 24 medidas desse tempo (em minutos): 1,2 / 1,0 / 1,5 / 1,2 / 1,3 / 1,4 / 1,2 / 1,6 / 1,8 / 1,6 / 1,2 / 1,5 / 2,1 / 2,3 / 1,5 / 1,4 / 2,0 / 2,5 / 1,9 / 1,1 / 2,0 / 1,8 / 2,6 / 1,3 1 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24 Componha uma amostra sistemática de tamanho n = 6. TNA 6ª L e 3ª C 1º Passo: Enumerar de 1 a “N” 2º Passo: Obter a razão N / n = 24 / 6 = 4 3º Passo: Sortear o K è inteiro de 1 a 4 TNA 6ª Linha 3ª Coluna Amostragem Sistemática Exemplo: O tempo de utilização de caixas eletrônicos depende de cada usuário e das operações efetuadas. Foram coletadas 24 medidas desse tempo (em minutos): 1,2 / 1,0 / 1,5 / 1,2 / 1,3 / 1,4 / 1,2 / 1,6 / 1,8 / 1,6 / 1,2 / 1,5 / 2,1 / 2,3 / 1,5 / 1,4 / 2,0 / 2,5 / 1,9 / 1,1 / 2,0 / 1,8 / 2,6 / 1,3 1 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24 Componha uma amostra sistemática de tamanho n = 6. TNA 6ª L e 3ª C 1º Passo: Enumerar de 1 a “N” 2º Passo: Obter a razão N / n = 24 / 6 = 4 3º Passo: Sortear o K è inteiro de 1 a 4 k = 3 4º Passo: Amostra: k ; k+r; k+2r;.... Amostra: 3; 7; 11; 15; 19; 23 Amostra: { 1,5; 1,2; 1,2; 1,5; 1,9; 2,6 } Amostragem Estratificada Proporcional Exemplo: O tempo de utilização de caixas eletrônicos depende de cada usuário e das operações efetuadas. Foram coletadas 24 medidas desse tempo (em minutos): 1,2 / 1,0 / 1,5 / 1,2 / 1,3 / 1,4 / 1,2 / 1,6 / 1,8 / 1,6 / 1,2 / 1,5 / 2,1 / 2,3 / 1,5 / 1,4 / 2,0 / 2,5 / 1,9 / 1,1 / 2,0 / 1,8 / 2,6 / 1,3 A1 A2. A3. A4. A5. A6. A7. A8. A9. A10. A11 A12 B1 B2. A13 A14 B3 B4. A15 A16 B5 A17 B6. A18 Divida a população em 2 estratos: Estrato A: Valores menores que 2,0 TNA 8ª L 3ª C Estrato B: Valores maiores que 2,0 TNA 16ª L 2ª C Extraia uma amostra estratificada proporcional de tamanho n=101º Passo: Enumerar de 1 a “N” 2º Passo: População. Amostra 24 10 18. nA. Regra de três simples: 18 x 10 / 24 = nA = 7,5 è. 8 nB = 10 – 8 = 2 TNA 8ª Linha 3ª Coluna Sorteio A: {07; 02; 01; 11; 16; 09; 18; 12} População de 18 elementos 2 dígitos – Colunas 3 e 4 16ª Linha 2ª Coluna Sorteio B: {6; 5} População de 6 elementos Amostragem Estratificada Proporcional Exemplo: O tempo de utilização de caixas eletrônicos depende de cada usuário e das operações efetuadas. Foram coletadas 24 medidas desse tempo (em minutos): 1,2 / 1,0 / 1,5 / 1,2 / 1,3 / 1,4 / 1,2 / 1,6 / 1,8 / 1,6 / 1,2 / 1,5 / 2,1 / 2,3 / 1,5 / 1,4 / 2,0 / 2,5 / 1,9 / 1,1 / 2,0 / 1,8 / 2,6 / 1,3 A1 A2. A3. A4. A5. A6. A7. A8. A9. A10. A11 A12 B1 B2. A13 A14 B3 B4. A15 A16 B5 A17 B6. A18 Divida a população em 2 estratos: Estrato A: Valores menores que 2,0 TNA 8ª L 3ª C Estrato B: Valores maiores que 2,0 TNA 16ª L 2ª C Extraia uma amostra estratificada proporcional de tamanho n=10 1º Passo: Enumerar de 1 a “N” 2º Passo: nA = 7,5 è. 8. Sorteio A: {07; 02; 01; 11; 16; 09; 18; 12} nB = 10 – 8 = 2. Sorteio B: { 6; 5} 3º Passo: Amostra à { 1,2; 1,0; 1,2; 1,2; 1,1; 1,8; 1,3; 1,5; 2,6; 2,0} Tipos de Amostragem Qual o melhor processo de Amostragem a ser utilizado em cada caso? 1- Ao escalar uma comissão para atuar em determinado projeto, uma Instituição de pesquisa resolveu selecionar aleatoriamente 4 pessoas brancas, 3 pardas e 4 negras; 2- Um diretor deseja descobrir a causa de um problema organizacional na empresa. Para isso, ele precisa conversar com alguns funcionários para entender a opinião deles do caso. 3- Um fabricante verifica a qualidade dos produtos produzidos testando um a cada 100 produzidos na sua linha de produção. 4- Seleção de uma amostra de produtos em um armazém. Os corredores estão identificados pelas letras de A a F. As colunas de cada corredor estão identificadas pelo número e pelo andar. Primeiro foram sorteados dois corredores (B e F) e depois foram selecionados ao acaso 50% dos produtos de cada corredor. Amostragem Estratificada Amostragem Aleatória Amostragem Sistemática Amostragem por conglomerado e amostragem aleatória SÉRIES ESTATÍSTICAS As tabelas permitem cálculos e leituras em diversas direções, enquanto os quadros apenas apresentam informações. Tabela: Quadro: Tabelas Elementos genéricos de uma tabela: A tabela não deve ser fechada lateralmente Formatação de Tabelas ü Título: aponta o fenômeno estudado, época e local de ocorrência; ü Cabeçalho: explica o conteúdo das colunas; ü Coluna Indicadora: detalha as linhas; ü Corpo: Conjunto de linhas e colunas que contém informações sobre a variável em estudo. Mostra os dados; ü Linhas: retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas; ü Casa ou Célula: espaço destinado a um só número; ü Fonte: cita o informante (caracterizando a confiabilidade dos dados); ü Notas: esclarecem o conteúdo e indicam a metodologia adotada na obtenção ou elaboração da informação; ü Chamadas: clarificam pontos específicos da tabela. Classificação das Séries Estatísticas As séries estatísticas podem ser classificadas de acordo com a natureza dos dados apresentados. A série histórica (também chamada de cronológica ou temporal) apresenta dados dispostos em função do tempo. Classificação das Séries Estatísticas Série geográfica (ou territorial ou espacial) apresenta informações em função do local, que pode ser por cidades, estados, países, etc. A época e o fenômeno estudados se mantém constantes. Classificação das Séries Estatísticas Já a série específica (ou categórica) mantém fixos o local e o período do estudo, variando a categoria dos dados. Classificação das Séries Estatísticas Gráficos Diagramas: são gráficos geométricos de, no máximo, duas dimensões. Para sua construção, em geral, fazemos uso do sistema cartesiano. Gráficos 0 10 20 Eduado Marcelo Leticia Aron 0 2 4 6 Categoria 1 Categoria 3 Barras 0 5 C… C… C… C… Colunas 34% 51% 15% Cachorro Gato Passarinho 0 5 10 15 20 Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Gráficos Pictogramas: constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras. Cartogramas: é a representação sobre uma carta geográfica. Tabulação Dados Brutos: são a relação dos resultados obtidos em uma pesquisa e que foram transcritos aleatoriamente, ou seja, fora de qualquer ordem. Rol: é a relação dos resultados obtidos em uma pesquisa e que foram colocados em ordem numérica, crescente ou decrescente. Frequência ou frequência absoluta: é o número de vezes que um mesmo resultado acontece durante uma pesquisa. Elementos de uma Distribuição de Frequência Classe: Classes de frequência ou, simplesmente, classes são intervalos de variação da variável; Limites e Classe: denominamos limites de classe os extremos de cada classe. Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do IBGE, em termos de desta quantidade até menos aquela, empregando, para isso, o símbolo (inclusão de li e exclusão de Li. Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe. hi = Li - li Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo). Elementos de uma Distribuição de Frequência Amplitude amostral é a diferença entre o valor máximo e o valor mínimo da amostra. Ponto médio de uma classe é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais. Elementos de uma Distribuição de Frequência Estaturas Frequência 150 à 154 4 154 à 158 9 158 à 162 11 162 à 166 8 166 à 170 5 170 à 174 3 Total 40 ü Classe 2 = 154 à 158; ü Limite inferior = 154 / Limite superior = 158; ü Amplitude = 158 – 154 = 4; ü Amplitude total da distribuição = 174 – 150 = 24; ü Amplitude Amostral = 173 – 150 = 23; ü Ponto médio da classe 2 = (154 + 158) / 2 = 156 Observe que a amplitude total da distribuição jamais coincide com a amplitude amostral. Tipos de Frequência Frequências Simples (f) ou Absolutas são os valores que realmente representam o número de dados de cada classe. A soma das frequências simples é igual ao número total dos dados: S fi = n Frequências relativas (fr) são os valores das razões entre frequências simples e a frequência total: fri = fi / S fi , podendo ser expresso em decimal ou %. O objetivo d as frequênc ias relativas é o de perm itir a análise ou facilitar a s comparaç ões. Tipos de Frequência Frequência Acumulada (F) é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. Fk = S fi (i = 1, 2, ..., k) Frequência Acumulada relativa (Fr) de uma classe é a frequência acumulada da classe, dividida pela frequência total da distribuição Fri = Fi / S fi , podendo ser expresso em decimal ou %. Tipos de Frequência Estaturas Frequência 150 à 154 4 154 à 158 9 158 à 162 11 162 à 166 8 166 à 170 5 170 à 174 3 Total 40 ü Quantos alunos tem estatura entre 154 cm, inclusive, e 158 cm? f2 = 9, logo, 9 alunos ü Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm? fr1 = f1 / S fi = 4 / 40 = 0,10 = 10% ü Quantos alunos tem estatura abaixo de 162 cm? S fi (i = 1, 2, 3) = F3 = 24 ü Quantos alunos tem estatura não inferior a 158 cm? S fi (i = 3, 4, 5, 6) = 11 + 8 + 5 + 3 = 27 Histograma Histograma é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. [150, 154,3] (154,3, 158,6] (158,6, 162,9] (162,9, 167,2] 0 2 4 6 8 10 12 Histogramaü O histogramagoza de uma propriedade da qual faremos considerável uso: a área de um histograma é proporcional à soma das frequências; ü No caso de usarmos as frequências relativas, obtemos um gráfico de área unitária; ü Quando queremos comparar duas distribuições, o ideal é fazê-lo pelo histograma de frequências relativas. Polígono de Frequência Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. Polígono de Frequência é um gráfico linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. 0 2 4 6 8 10 12 148 152 156 160 164 168 172 176 Polígono de Frequência Polígono de Frequência Acumulada Polígono de Frequência Acumulada é traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. 0 10 20 30 40 50 152 156 160 164 168 172 Polígono de Frequência Acumulada Medidas de Posição Medidas de Posição: estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal (eixo das abscissas). As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central, destacamos: i. A média aritmética; ii. A mediana; iii. A moda. As outras medidas de posição são as separatrizes, que englobam: i. A própria mediana; ii. Os quartis; iii. Os percentis. Média Aritmética Média Aritmética é o quociente da divisão da soma dos valores da variável pelo número deles: X = S Xi / n Sendo: X = média aritmética Xi = os valores da variável n = número de valores São propriedades da Média Aritmética: i. A soma algébrica dos desvios tomados em relação à média é nula è S di = 0; ii. Somando-se (ou subtraindo-se) uma constante (c) de todos os valores de uma variável, a média do conjunto ficará aumentada (ou diminuída) dessa mesma constante (c); iii. Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante; Média Aritmética Média Aritmética para dados agrupados (sem intervalos de classe) Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino: Nº de Meninos fi 0 2 1 6 2 10 3 12 4 4 S = 34 Neste caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: X = S Xi fi / S fi Média Aritmética Média Aritmética para dados agrupados (com intervalos de classe) Neste caso, precisamos abrir duas colunas. Uma para o ponto médio Xi e outra para o valor de Xi * fi. i Estaturas (cm) fi Xi Xi * fi 1 150 à 154 4 152 152*4=608 2 154 à 158 9 156 1.404 3 158 à 162 11 160 1.760 4 162 à 166 8 164 1.312 5 166 à 170 5 168 840 6 170 à 174 3 172 516 S = 40 S = 6.440 X = 6.440 / 40 = 161 cm X = S Xi fi / S fi Média Aritmética ü O processo breve, com a nova variável definida por nós, só pode ser usado em distribuições que apresentam intervalos de classe de mesma amplitude. ü O processo breve pode, também, ser aplicado para as distribuições sem intervalos de classe, bastando considerar h = 1. Fases para o cálculo da média pelo processo breve: 1. Abrimos uma coluna para os valores de xi; 2. Escolhemos um dos pontos médios (preferencialmente o de maior frequência) para determinar o valor de x0; 3. Abrimos uma coluna para os valores de yi e escrevemos zero na linha correspondente à classe onde se encontra o valor de x0. A sequência -1, -2, -3, ..., logo acima do zero, e a sequência 1, 2, 3, ..., logo abaixo; 4. Abrimos uma coluna para os valores do produto yi fi, conservando os sinais + ou -, e, em seguida, somamos algebricamente esses produtos; 5. Aplicamos a fórmula. Média Aritmética Média Aritmética para dados agrupados (com intervalos de classe): Processo Breve Com: x0 = 160; tendo h = 4. Temos então: X0 = 160; S yi*fi = 10; S fi = 40; h = 4. X = x0 + (S yi * fi) h / S fi X = 160 + (10 *4) /40 = 161 cm i Estaturas (cm) fi Xi yi yi * fi 1 150 à 154 4 152 -2 -8 2 154 à 158 9 156 -1 -9 3 158 à 162 11 160 0 0 4 162 à 166 8 164 1 8 5 166 à 170 5 168 2 10 6 170 à 174 3 172 3 9 X0 = 160 S = 40 S = 10 Moda Denominamos Moda (Mo) o valor que ocorre com maior frequência em uma série de valores. Desse modo, o salário modal dos empregados de uma indústria é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa indústria. 1) Dados não agrupados Quando lidamos com valores não agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, procurar o valor que mais se repete. Da série de dados: 7,8,9,10,10,10,11,12,13,15 tem moda igual a 10. Podemos no entanto, encontrar séries que não apresentem valor modal (série amodal), exemplo: 1,2,3,4,5,8 Em outros casos, podem haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais: 2,3,4,4,4,5,6,7,7,7,8,9 (série bimodal – 4 e 7) Moda 2) Dados agrupados (sem intervalos de classe) Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior frequência. 3) Dados agrupados (com intervalos de classe) A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Temos então: Mo = (l* + L*) / 2 Onde l* é o limite inferior da classe modal e L* é o limite superior da classe modal. Mediana 1) Dados não agrupados Dada uma série de valores, como, por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9 De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores. Optamos pela crescente neste exemplo: 2, 5, 6, 9, 10, 13, 15, 16, 18. Em seguida, tomamos aquele valor central: 10 (existem 4 elementos à direita e 4 elementos à esquerda deste valor na nossa série. Logo, Md = 10 Se, porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio. Assim, a série de valores 2,6,7,10,12,13,18,21 tem como Mediana a Média Aritmética entre os valores 10 e 12 è (10 + 12) / 2 = 11 Mediana 2.1) Dados agrupados (sem intervalo de classe) Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Nº de Meninos fi Fi 0 2 2 1 6 8 2 10 18 3 12 30 4 4 34 S = 34 Sendo S fi / 2= 34 / 2 = 17 A menor frequência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo este o valor mediano. Logo: Md = 2 meninos Mediana 2.2) Dados agrupados (com intervalo de classe) i Estaturas (cm) fi Fi 1 150 à 154 4 4 2 154 à 158 9 13 3 158 à 162 11 24 4 162 à 166 8 32 5 166 à 170 5 37 6 170 à 174 3 40 S = 40 40 / 2 = 20 Como há 24 valores incluídos nas 3 primeiras classes da distribuição e como pretendemos determinar o valor que ocupa o 20º lugar, a partir do início da série, vemos que este deve estar localizado na 3ª classe (i=3), supondo que as frequências dessas classes estejam uniformemente distribuídas. Como há 11 elementos nessa classe e o intervalode classe é igual a 4, devemos tomar, a partir do limite inferior, a distância: ((20 – 13) / 11) x 4 = (7/11) x 4 Md = 158 + (7 / 11) x 4 = 158 + (28/11) = 158 + 2,54 = 160,5 Md = 160,5 cm 1º Calcular o ponto que divide a série em duas partes iguais è S fi / 2 è 40 / 2 = 20 2º Md = lclasse Mediana + (((S fi / 2)-F2) / f3) * h Md Os quartis Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Há, portanto, três quartis: a) O primeiro Quartil (Q1) – valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e as três quartas partes restantes (75%) são maiores. b) O segundo Quartil (Q2) – evidentemente, coincide com a mediana (Q2 = Md); c) O terceiro Quartil (Q3) – valor situado de tal modo que as três quartas partes (75%) dos termos são menores que ele e uma quarta parte (25%) é maior. Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, S fi / 2 por: K S fi / 4 Sendo k o número de ordem do quartil Os quartis i Estaturas (cm) fi Fi 1 150 à 154 4 4 2 154 à 158 9 13 3 158 à 162 11 24 4 162 à 166 8 32 5 166 à 170 5 37 6 170 à 174 3 40 S = 40 Q1 = l + [ (S fi / 4) – F (anterior) ] h / f Q2 = l + [ (3 * S fi / 4) – F (anterior) ] h / f Primeiro Quartil: S fi / 4 = 40 / 4 = 10 Q1 = 154 + (10 – 4) * 4 / 9 = 156,7 cm Segundo Quartil = Mediana (já calculado) = 160,5 cm Terceiro Quartil: 3 * S fi / 4 = 30 Q3 = 162 + (30– 24) * 4 / 8 = 165 cm Md Os percentis Denominamos percentis os 99 valores que separam uma série em 100 partes iguais. Indicamos: P1, P2, P3, ....., P99 É evidente que: P50 = Md P25 = Q1 P75 = Q3 O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém, a fórmula será substituída por: K S fi / 100 Sendo k o número de ordem do percentil Exercícios ü Correção exercícios da Aula 07; ü Lista de Exercícios da Aula 08 – Tarefa (Forms). Fundamentos de Estatística Até a Próxima Aula... Bráulio Machado brl.machado@gmail.com
Compartilhar