Baixe o app para aproveitar ainda mais
Prévia do material em texto
Métodos Estatı́sticos Prof. Dr. Hélio Doyle Pereira da Silva http://lattes.cnpq.br/5161139844851891 Medidas de Posição, Separatrizes e Variabilidade Notável Mestre - 2023 Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 1-31 http://lattes.cnpq.br/5161139844851891 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de tendência central MÉDIA MEDIANA MODA Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 2-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de tendência central MÉDIA (MÉDIA ARITMÉTICA) Para Amostra Para População x̄ = ∑n i=1 xi n µ = ∑N i=1 xi N onde: xi = i-ésimo valor observado n = número de elementos da amostra N = número de elementos da população Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 3-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de tendência central MÉDIA Para dados agrupados x̄ = ∑k i=1 fixi∑k i=1 fi onde: k = número de classes da distribuição de frequência fi = frequência da i-ésima classe xi = - P/ dados agrupados sem perda de informação, é o valor da i-ésima classe - P/ dados agrupados com perda de informação, é o valor do ponto médio da i-ésima classe Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 4-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de tendência central MÉDIA Propriedades da média A média de um conjunto de números pode ser sempre calculada. Para um dado conjunto de dados a média é única. A soma algébrica dos desvios de um conjunto de números em relação à média aritmética é zero. Multiplicando-se todos os valores de uma variável por uma constante, a média do conjunto fica multiplicada por essa constante. Somando-se ou subtraindo-se uma constante a todos os valores de uma variável, a média do conjunto fica acrescida ou diminuı́da dessa constante. Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 5-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de tendência central MEDIANA Divide um conjunto ordenado de dados em duas partes iguais. É o valor da variável X que divide o histograma em duas partes de áreas iguais. Determinação da mediana para dados não agrupados Ordenar os valores (geralmente em ordem crescente). Se o número de valores for ı́mpar, a mediana é o valor do meio do conjunto de dados (ocupa a posição n+12 ). Se o número de valores for par, a mediana é a média dos dois valores do meio do conjunto de dados (valores que ocupam as posições n2 e n 2 + 1). Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 6-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de tendência central MEDIANA Determinação da mediana para dados agrupados Calcular a posição da mediana no conjunto de dados (PM = n2 ). Identificar a classe que contém a mediana, determinando: • o limite inferior da classe (L); • a frequência da classe (fm); • a amplitude da classe (c); • a frequência acumulada da classe anterior (F ). Assumindo que os valores que pertencem à classe da mediana são equiespaçados, a mediana (Md) é obtida por: Md = L + PM − F fm c Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 7-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de tendência central MODA É o valor que ocorre com maior frequência num conjunto de dados. Indica o valor “tı́pico” em termos da maior ocorrência. Para dados agrupados com perda de informação, determina-se a classe modal, que é aquela que apresenta a maior frequência. A moda pode: não existir; ser única (distribuição unimodal); ou ser múltipla (distribuição multimodal). Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 8-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Calcule a média, a mediana e a moda 4 6 7 3 9 5 6 1 Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 9-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Separatrizes PERCENTIS QUARTIS Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 9-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Separatrizes PERCENTIS Os percentis dividem os dados ordenados em 100 subgrupos iguais. O P-ésimo percentil é o valor do conjunto de dados para o qual “P” porcento dos dados são menores que ele e (100− P) são maiores. Exemplo: P85 percentil = valor para o qual 85% dos valores do conjunto de dados são menores que ele. Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 10-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Separatrizes PERCENTIS Determinação do p-ésimo percentil Ordenar os valores do conjunto de dados (em geral, ordem crescente). O valor do p-ésimo percentil é o valor que ocupa a posição “i” no conjunto ordenado de dados, onde: i = p 100 n p = percentil n = no de elementos do conjunto de dados. Se “i” não for inteiro, o próximo inteiro maior do que “i” fornece a posição do p-ésimo percentil. Se “i” for inteiro, o p-ésimo percentil é dado pela média dos valores que se encontram nas posições “i” e “i + 1”. Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 11-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Separatrizes PERCENTIS Determinação do p-ésimo percentil para dados agrupados Calcular a posição do p-ésimo percentil (i) no conjunto de dados. i = p 100 n p = percentil n = no de elementos do conjunto de dados. Identificar a classe que contém o p-ésimo percentil, determinando: • o limite inferior da classe (L); • a frequência da classe (fp); • a amplitude da classe (c); • a frequência acumulada da classe anterior (F ). Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 12-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Separatrizes PERCENTIS Determinação do p-ésimo percentil para dados agrupados Assumindo que os valores que pertencem à classe do p-ésimo percentil são equiespaçados, o percentil (Pi ) é obtido por: Pi = L + i − F fp c Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 13-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Separatrizes QUARTIS Os quartis dividem os dados ordenados em 4 subgrupos iguais. Q1 = Primeiro quartil = 25% Percentil Q2 = Segundo quartil = 50% Percentil = Mediana Q3 = Terceiro quartil = 75% Percentil Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 14-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Calcule os quartis (Q1,Q2,Q3) 2 3 5 7 8 10 11 12 15 67 Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 15-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão As medidas de dispersão permitem verificar se os valores de um conjunto de dados estão próximos uns dos outros, ou separados. INTERVALO DESVIO MÉDIO ABSOLUTO VARIÂNCIA DESVIO PADRÃO︸ ︷︷ ︸ A média é o ponto de referência︸ ︷︷ ︸ O valor zero indica ausência de dispersão Quanto maior o valor da medida, maior a dispersão Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 15-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão INTERVALO Pode ser expresso pela diferença entre o maior e o menor valor do conjunto, ou pela identificação desses dois valores. A diferença entre o maior e o menor valor do conjunto de dados também é chamada AMPLITUDE TOTAL (At ): At = Xmáximo − Xmı́nimo Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica16-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão INTERVALO DETERMINAÇÃO DA AMPLITUDE DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA Quando se dispõe dos dados originais: At = Xmáximo − Xmı́nimo Quando não se dispõe dos dados originais: At = Limite inferior da primeira classe− Limite superior da última classe Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 17-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão INTERVALO (AMPLITUDE TOTAL) VANTAGEM: É fácil de calcular e de entender. RESTRIÇÕES AO USO: Apresenta grande instabilidade, pois leva em conta apenas os valores extremos do conjunto de dados. A amplitude total é sensı́vel ao tamanho da amostra. Ela tende a aumentar com o tamanho da amostra, embora não proporcionalmente. A amplitude total apresenta grande variabilidade entre amostras retiradas da mesma população. Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 18-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão DESVIO MÉDIO ABSOLUTO O desvio médio absoluto (DMA) é a média aritmética dos valores absolutos dos desvios tomados em relação à média aritmética (ou mediana) do conjunto de dados. DMA = ∑n i=1 |xi − x̄ | n ou DMA = ∑n i=1 |xi −Md | n Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 19-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão DESVIO MÉDIO ABSOLUTO DETERMINAÇÃO DO DESVIO MÉDIO ABSOLUTO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA DMA = ∑n i=1 |xi − x̄ |fi n ou DMA = ∑n i=1 |xi −Md |fi n onde: n = tamanho da amostra (número de valores observados); k = número de classes da distribuição de frequência; xi = representa um valor individual ou o ponto médio da classe; fi = frequência da i-ésima classe. Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 20-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão VARIÂNCIA A variância é a média dos quadrados dos desvios dos valores tomados a partir da média. No caso da variância amostral, esta média é calculada usando-se (n − 1) no denominador. Variância Populacional (σ2) Variância Amostral (S2) σ2 = ∑N i=1(xi − µ)2 N S2 = ∑n i=1(xi − x̄)2 n − 1 onde N é o número de elementos da população e n é o número de elementos da amostra. Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 21-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão VARIÂNCIA DETERMINAÇÃO DA VARIÂNCIA DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA Variância Populacional (σ2) Variância Amostral (S2) σ2 = ∑N i=1(xi − µ)2fi N S2 = ∑n i=1(xi − x̄)2fi n − 1 onde: k = número de classes da distribuição de frequência; xi = representa um valor individual ou o ponto médio da classe; fi = frequência da i-ésima classe. Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 22-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão DESVIO PADRÃO O desvio padrão é obtido pela raiz quadrada positiva da variância. Desvio Padrão Populacional (σ) Desvio Padrão Amostral (S) σ = √∑N i=1(xi − µ)2 N S = √∑n i=1(xi − x̄)2 n − 1 O desvio padrão é a medida de dispersão mais utilizada. A sua unidade é a mesma da média. Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 23-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão DESVIO PADRÃO DETERMINAÇÃO DO DESVIO PADRÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA Desvio Padrão Populacional (σ) Desvio Padrão Amostral (S) σ = √∑k i=1(xi − µ)2fi N S = √∑k i=1(xi − x̄)2fi n − 1 onde: k = número de classes da distribuição de frequência; xi = representa um valor individual ou o ponto médio da classe; fi = frequência da i-ésima classe. Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 24-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão DESVIO PADRÃO PROPRIEDADES DO DESVIO PADRÃO A adição (ou subtração) de um valor constante e arbitrário a cada elemento do conjunto de dados não altera o valor do desvio padrão. A multiplicação (ou divisão) de cada elemento do conjunto por um valor constante e arbitrário não altera o valor do desvio padrão. O desvio padrão é maior do que o desvio médio. Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 25-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Calcule o desvio médio e o desvio padrão amostral xi |xi − x̄ | (xi − x̄)2 2 9 1 6 5 (DESVIO AMOSTRAL) Médio absoluto Padrão DMA = ∑n i=1 |xi − x̄ | n S = √∑n i=1(xi − x̄)2 n − 1 Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 26-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão MEDIDAS DE DISPERSÃO RELATIVA A dispersão relativa permite comparar duas ou mais distribuições, mesmo quando os dados destas distribuições são expressos em unidades diferentes. COEFICIENTE DE VARIAÇÃO DE PEARSON (CVp) Para população // CVp = σ µ 100 Para amostra // CVp = S x̄ 100 Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 26-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Medidas de dispersão MEDIDAS DE DISPERSÃO RELATIVA COEFICIENTE DE VARIAÇÃO DE THORNDIKE (CVT ) Para população // CVT = σ Md 100 Para amostra // CVT = S Md 100 Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 27-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Diagrama em caixas Fonte: Barbetta, 2002 (Fig. 6.8a) Onde: ES (extremo superior) = maior va- lor do conjunto de dados; EI (extremo inferior) = menor valor do conjunto de dados; QS (quartil superior) = terceiro quartil; Md (mediana) = segundo quartil; QI (quartil inferior) = primeiro quar- til; dQ = desvio entre quartis. dQ = QS −QI Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 28-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Diagrama em caixas Os valores que estão afastados do primeiro ou terceiro quartis mais do que 1,5dQ podem ser considerados valores discrepantes. Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 29-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Diagrama em caixas Forma do diagrama em caixas para uma distribuição simétrica: Fonte: Barbetta, 2002 (Fig. 6.9) Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 30-31 Medidas de Tendência Central Separatrizes Medidas de Dispersão Diagrama em Caixas Diagrama em caixas Forma do diagrama em caixas para uma distribuição assimétrica: Fonte: Barbetta, 2002 (Fig. 6.9) Hélio Doyle Pereira da Silva Fundamentos de Estatı́stica 31-31
Compartilhar