Baixe o app para aproveitar ainda mais
Prévia do material em texto
Disciplina: Análise Estatística Aula 2: Revisão das Medidas de Tendência Central e de Posição Apresentação Na aula 1 foram compreendidas as fases do método estatístico como a coleta, crítica, apuração, apresentação e análise dos dados. Nesta aula, você aprenderá como as medidas de posição central (média aritmética e ponderada, mediana e moda) são determinadas e como permitem uma melhor compreensão dos dados de uma análise estatística. Aprenderá ainda as relações entre média, moda e mediana. Abordaremos as medidas de ordenamento quartis, decis e percentis. Veremos, por fim, como calcular as medidas estatísticas em Microsoft Excel. As medidas de posição central nos apontam a tendência de comportamento dos dados, enquanto as separatrizes nos auxiliam na decisão de qual a cobertura dos dados poderemos atingir ou selecionar. Objetivos Apresentar o cálculo das medidas de posição central e suas relações; Conhecer as medidas de ordenamento quartis, decis e percentis; Apresentar o cálculo das medidas estatísticas em Microsoft Excel. Medidas de Posição Central Em uma dada distribuição amostral, é possível fazer várias observações, no intuito de entender o comportamento dos seus valores. Podemos, por exemplo, tentar localizar a maior concentração de valores de uma determinada distribuição. Entretanto, para que tenhamos parâmetros de comparação entre as tendências características de cada distribuição, é necessário introduzir conceitos que se expressem através de números. Veremos então as medidas de posição . As serem estudadas são as medidas de tendência central e as separatrizes. Média aritmética Moda Mediana Iremos estudar as separatrizes: Quartis Decis Percentis Medidas de Tendência Central As medidas de tendência central são valores que, de maneira condensada, trazem informações contidas nos dados estatísticos. É um valor que tende a melhor representar um conjunto de números. Funcionam como um resumo, 1 passando a ideia do comportamento geral dos dados. Representam um valor central em torno do qual os dados se concentram e se distribuem, mostrando se essa concentração ocorre no inicio, no meio ou no final da distribuição, ou até mesmo se estão distribuídos de forma igual ao longo da amplitude considerada. Quando esses valores estão associados a uma população, chamamos de parâmetros; quando estão ligados a uma amostra, são chamados de estatísticas. Como o cálculo dos parâmetros é feito em cima de todos os números, os parâmetros são valores constantes, fixos. Já os valores estatísticos são obtidos dos dados selecionados da população, e como para cada amostra temos dados diferentes, que irão influenciar no cálculo dos valores estatísticos, esses valores não são fixos. Média Para uma distribuição de dados estatísticos a ser analisada, composta por n valores 𝑥 , i = 1, 2 ..., n. É interessante, sempre que possível, ordenar os dados de modo que 𝑥 seja o menor valor e 𝑥 seja o maior valor da relação de valores da distribuição. Muitas vezes existe uma concentração maior dos dados em torno de um valor; outras vezes os dados estão equilibradamente distribuídos entre a faixa de valores compreendido pela amplitude dos dados (Amplitude =𝑥 - 𝑥 ). Esta informação quanto à distribuição muitas vezes é importante, sendo calculada através da média aritmética, ou apenas média. Outro tipo de média, também bastante utilizada, é a média aritmética ponderada. A média ponderada é muito usada em situações em que os dados são agrupados por frequência, ou em situações em que os dados possuem importâncias diferentes, sendo representados na forma de pesos. Média Aritmética e Ponderada 𝑖 𝑖 𝑛 𝑛 1 A média aritmética é usada para distribuições simétricas, ou quase simétricas, ou para distribuições que têm um único pico dominante. É determinada somando-se todas as observações e dividindo-se pelo número total de observações. O cálculo da média se dá pela fórmula: ͞𝑥 = Média aritmética da amostra (𝜇 é usado para a população); 𝑥 = Valor representativo de cada variável de dados (𝑥 , 𝑥 , 𝑥 ,..., 𝑥 ); n = Número total de itens da amostra (N é usado para a população). Exemplo: Sabendo-se que a quantidade de garrafas de refrigerante vendidas no mercado, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 garrafas, temos para a venda média da semana: Logo... ͞𝑥 = 14 litros ... É a média diária nesta semana. A média ponderada ( ͞𝑥 para amostra e 𝜇 para população ) é usada em várias ocasiões como por exemplo, em situações em que os dados possuem níveis de importância diferentes dentro do grupo para os diversos dados da distribuição, explicitando essa importância na forma de peso 𝑤 . μ = = ∑ x i i=1 N N + +...+x 1 x 2 x n N μ = = ∑ x i i=1 n n + +...+x 1 x 2 x n n 𝑖 1 2 3 𝑛 = = = 14x 10+14+13+15+16+18+12 7 98 7 𝑤 𝑤 𝑖 = =x w ∑ i=1 n x i w i ∑ i=1 n w i . + . +...+x 1 w 1 x 2 w 2 x n. w n + +...+w 1 w 2 w n Exemplo: Um concurso de três etapas possui peso 2 na primeira etapa, peso 1 na segunda etapa e peso 3 na terceira etapa. Qual a nota final do candidato que tire 5,9 na primeira, 8,4 na segunda e 6,7 na terceira etapa do concurso? Moda Denominamos moda o valor que ocorre com a maior frequência em uma relação de dados. Muitas vezes é utilizada por ser a medida de posição de mais rápida visualização. A moda (Mo) é usada quando temos distribuições extremamente assimétricas, ou nas situações irregulares em que dois ou mais pontos de concentração de dados são verificados na série de dados. Ou até mesmo nas situações em que se deseja eliminar os efeitos de valores extremos que destoam da normalidade da série de valores. A moda também pode ser designada como valor típico, valor dominante ou norma. Quanto à classificação modal, um conjunto pode ser considerado unimodal, quando apresenta apenas uma moda. Exemplo: X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) → Mo = 6 (o valor de maior frequência) Pode ser considerado bimodal quando possui duas modas. = = = = 6, 7x w ∑ i=1 n x i w i ∑ i=1 n w i 11,8.+8,4.+20,1 2+1+3 40,3 6 Exemplo: X = (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) → Mo = 2 e Mo = 4 (os valores de maior frequência) É considerada plurimodal ou multimodal quando apresenta mais de duas modas. Exemplo: X = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) → Mo = 2, Mo = 3 e Mo = 4 (os valores de maior frequência) Quando todos os valores apresentam a mesma frequência, o conjunto é considerado amodal. Exemplo: X = (1, 2, 3, 4, 5, 6) (não apresenta valor predominante) Mediana A mediana é o valor central da distribuição quando os dados estão ordenados de forma crescente ou decrescente. Normalmente é usada quando se deseja obter o ponto que divide a distribuição em duas partes iguais, ou quando existem valores extremos que afetam a média de forma acentuada. Também existe uma tendência a utilizar a mediana quando o valor a ser analisado ou estudado é salário, ou para informações que possam ser ordenadas de alguma forma, mas que não possuem valores mensuráveis (cor, nomes etc.). Exemplo: 1) Considere o conjunto de dados: X = (6, 2, 7, 10, 3, 4, 1, 12). Determine a mediana. 2) Colocar os valores em ordem crescente ou decrescente: X = (1, 2, 3, 4, 6, 7, 10, 12); 3) Determinar a ordem ou a posição do elemento (E) da mediana: 4) Localizar a mediana e calcular o seu valor (para o ocaso de n par): 5) Determinar x4,5, sabendo que: Comparação entre a Média, a Mediana e a Moda MEDIDA DEPOSIÇÃO VANTAGENS DESVANTAGENS USAR QUANDO MÉDIA Reflete cada valor observado na distribuição É influenciada porvalores extremos • Deseja-se a medida de posição com a maior estabilidade; • Necessita de um posterior tratamento algébrico. MEDIANA Menos sensível a valores extremos do que a Média Difícil de determinar para grande quantidade de dados • Deseja-se o ponto que divide o conjunto em partes iguais; • Há valores extremos que afetam de maneira acentuada e média; • A variável em estudo é o salário. E = = 4, 5 n+1 2 8+1 2 = 4 e = 6 → Med = = = 5x 4 x 5 +x 4 x 5 2 4+6 2 MODA Maior quantidade de valores concentrados neste ponto Não se presta à análise Matemática. Nem sempre a distribuição possui moda • Deseja-se uma medida rápida e aproximada da posição; • A medida de posição deve ser o valor mais típico da distribuição. Relação entre a Média, a Mediana e a Moda Com essas três medidas de posição é possível determinar a assimetria da curva de distribuição de frequência. A tabela de distribuição de frequências é composta de uma coluna contendo os valores que compõem a relação de dados e uma coluna com as correspondentes quantidades que cada valor aparece na relação de dados. As medidas de assimetria complementam as informações dadas pelas medidas de posição, a fim de permitir uma melhor compreensão das distribuições de frequências. A mediana se localiza na posição central da distribuição, devendo estar entre os valores da média e moda e podendo até mesmo ser igual a ambas. Nesta situação temos três casos possíveis: 1º Caso Média = Mediana =Moda A curva da distribuição é simétrica 2º Caso Média < Mediana <Moda A curva da distribuição tem assimetria negativa 3º Caso Média > Mediana >Moda A curva da distribuição tem assimetria positiva O coeficiente de assimetria pode ser calculado pela fórmula do primeiro coeficiente de Pearson, tornando mais fácil determinar se a assimetria da distribuição é positiva ou negativa: Atenção No denominador da fórmula temos um símbolo que representa o desvio padrão da distribuição. Quando for apresentado o estudo sobre as medidas de dispersão, veremos mais detalhes sobre o cálculo do desvio padrão e seu significado. No momento podemos adiantar que terá sempre um valor positivo (ou seja, não é possível ocorrer desvio padrão negativo). Assim sendo o que vai determinar o sinal da fração é o sinal do numerador. 1º Caso Média = Moda → ͞𝑥 - Mo = 0 → Assimétrica nula = Simétrica 2º Caso Média < Moda → ͞𝑥 - Mo < 0 → Assimetria negativa 3º Caso Média > Moda → ͞𝑥 - Mo > 0 → Assimetria positiva Curva da distribuição é simétrica Curva da distribuição é assimétrica positiva e negativa Quando a distribuição de frequência é assimétrica à direita da curva, dizemos que a distribuição tem assimetria positiva; Quando a distribuição de frequência é assimétrica à esquerda da curva, dizemos que a distribuição tem assimetria negativa. Outro coeficiente de assimetria de Pearson indica se esta é forte ou fraca: AS = 3( − Md)x S 0 < || AS || ≤ 0,15 → Assimetria Fraca 0,15 < || AS || ≤ 1 → Assimetria Moderada || AS || > 1 → Assimetria Forte Quartis Dividem a distribuição de frequência depois de ordenados em quatro partes iguais, contendo a mesma quantidade de elementos. Nesta divisão, o 1° quartil deixa 25% dos dados abaixo dele; o 2° quartil coincide com a mediana e deixa 50% dos dados abaixo dele; o 3° quartil deixa 75% dos dados abaixo dele. A forma de determinação dos quartis é: 𝑄 = determina o elemento que separa o quartil i e o quartil seguinte + 1); n = número de dados. Se o índice não é um valor inteiro, então se calcula a média entre os dados anterior e posterior ao determinado. 1º quadril: 2º quadril: 3º quadril: = Q i X ( + ) in 4 1 2 𝑖 ( + ) in 4 1 2 =Q 1 X ( + ) n 4 1 2 = =Q 2 X ( + ) 2n 4 1 2 X ( + ) n 2 1 2 Decis Dividem a distribuição de frequência depois de ordenados em dez partes iguais, contendo a mesma quantidade de elementos. Mantendo o raciocínio usado para a determinação dos quartis, a forma de determinação dos decis é: Se o índice não é um valor inteiro, então se calcula a média entre os dados anterior e posterior ao determinado. Percentis Dividem a distribuição de frequência depois de ordenados em 100 partes iguais, contendo a mesma quantidade de elementos. Mantendo o raciocínio usado para a determinação dos quartis, a forma de determinação dos percentis é: Se o índice não é um valor inteiro, então se calcula a média entre os dados anterior e posterior ao determinado. Exemplo usando Excel Determine a média, a moda e a mediana da amostra abaixo, usando a planilha do Excel: =Q 3 X ( + ) 3n 4 1 2 =D 1 X ( + ) in 10 1 2 =P 1 X ( + ) in 100 1 2 44 48 53 54 56 56 56 57 60 60 62 63 63 63 63 65 66 67 68 68 69 69 70 71 72 74 77 78 80 81 82 85 90 93 95 95 97 100 106 107 Cálculo da Média: Utilizando a função média (num1; num2; ...) e marcando a relação de dados para calcularmos a média, teremos o resultado desejado. Cálculo da Mediana: Utilizando a função MED (num1; num2; ...) e marcando a relação de dados para calcularmos a mediana, teremos o resultado desejado. Cálculo da Moda: Utilizando a função MODO (num1; num2; ...) e marcando a relação de dados para calcularmos a moda, teremos o resultado desejado. Resposta... Notas Medidas de posição São valores que vão orientar quanto à posição da distribuição dos dados numa sequência ordenada. Referências BRUNI, Adriano Leal; PAIXÃO, Roberto Brazileiro. Excel aplicado à gestão empresarial. 1.ed. São Paulo: Atlas, 2008. CRESPO, Antônio Arnot. Estatística fácil. 19.ed. São Paulo: Saraiva, 2009. KAZMIER, Leonard J. Estatística aplicada à Economia e Administração. 4.ed. Porto Alegre: Artmed, 2007. 1 Próximos Passos Medidas de dispersão; Amplitude total e interquartil; Desvio médio, variância, desvio padrão e coeficiente de variação; Cálculo das medidas de dispersão em Microsoft Excel. Explore mais
Compartilhar