Buscar

Análise Estatística Aula 02 Online

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Aula 2: Revisão das Medidas de Tendência Central e de Posição
Medidas de Posição Central
Em uma dada distribuição amostral, é possível fazer várias observações, no intuito de entender o comportamento dos seus valores. Podemos, por exemplo, tentar localizar a maior concentração de valores de uma determinada distribuição. Entretanto, para que tenhamos parâmetros de comparação entre as tendências características de cada distribuição, é necessário introduzir conceitos que se expressem através de números.
Veremos então as medidas de posição. As serem estudadas são as medidas de tendência central e as separatrizes.
São valores que vão orientar quanto à posição da distribuição dos dados numa sequência ordenada.
Iremos estudar apenas três medidas de tendência central:
- Média Aritmética e Ponderada
- Moda
 - Mediana
Iremos estudar as separatrizes:
- Quartis
- Decis
- Percentis
Medidas de Tendência Central
As medidas de tendência central são valores que, de maneira condensada, trazem informações contidas nos dados estatísticos. É um valor que tende a melhor representar um conjunto de números. Funcionam como um resumo, passando a ideia do comportamento geral dos dados. Representam um valor central em torno do qual os dados se concentram e se distribuem, mostrando se essa concentração ocorre no início, no meio ou no final da distribuição, ou até mesmo se estão distribuídos de forma igual ao longo da amplitude considerada.
Quando esses valores estão associados a uma população, chamamos de parâmetros, quando estão ligados a uma amostra, são chamados de estatísticas. Como o cálculo dos parâmetros é feito em cima de todos os números, os parâmetros são valores constantes, fixos. Já os valores estatísticos são obtidos dos dados selecionados da população, e como para cada amostra temos dados diferentes, que irão influenciar no cálculo dos valores estatísticos, esses valores não são fixos.
Média
Para uma distribuição de dados estatísticos a ser analisada, composta por n valores Xi, = 1, 2 ..., n. E interessante, sempre que possível, ordenar os dados de modo que xi seja o menor valor e x seja o maior valor da relação de valores da distribuição. 
Muitas vezes existe uma concentração maior dos dados em torno de um valor; outras vezes os dados estão equilibradamente distribuídos entre a faixa de valores compreendido pela amplitude dos dados (Amplitude = Xn Xi). Esta informação quanto à distribuição muitas vezes é importante, sendo calculada através da média aritmética, ou apenas média.
Outro tipo de média, também bastante utilizada, é a média aritmética ponderada. A média ponderada é muito usada em situações em que os dados são agrupados por frequência, ou em situações em que os dados possuem importâncias diferentes, sendo representados na forma de pesos.
Média Aritmética
A média aritmética é usada para distribuições simétricas, ou quase simétricas, ou para distribuições que têm um único pico dominante. É determinada somando-se todas as observações e dividindo-se pelo número total de observações.
Média Ponderada
A média ponderada é usada em várias ocasiões como por exemplo, em situações em que os dados possuem níveis de importância diferentes dentro do grupo para os diversos dados da distribuição, explicitando essa importância na forma de peso (wi).
Moda
Multiplicação por Escalar
Denominamos moda o valor que ocorre com a maior frequência em uma relação de dados. Muitas vezes é utilizada por ser a medida de posição de mais rápida visualização.
A moda (Mo) é usada quando temos distribuições extremamente assimétricas, ou nas situações irregulares em que dois ou mais pontos de concentração de dados são verificados na série de dados. Ou até mesmo nas situações em que se deseja eliminar os efeitos de valores extremos que destoam da normalidade da série de valores.
A moda também pode ser designada como valor típico, valor dominante ou norma.
Unimodal
Quanto à classificação modal, um conjunto pode ser considerado unimodal, quando apresenta apenas uma moda.
Exemplo: X = (4,5, 5,6,6,6,7,7,8, 8) Mo = 6 (o valor de maior frequência).
Bimodal
Pode ser considerado bimodal quando possui duas modas.
Exemplo: X= (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) Mo = 2 e Mo = 4 (os valores de maior frequência).
Plurimodal ou Multimodal
É considerada plurimodal ou multimodal quando apresenta mais de duas modas. 
Exemplo: X= (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) Mo = 2, Mo = 3 e Mo = 4 (os valores de maior frequência).
Amodal
Quando todos os valores apresentam a mesma frequência, o conjunto é considerado amodal.
Exemplo: X = (1,2, 3,4, 5,6) (não apresenta valor predominante)
Mediana
A mediana é o valor central da distribuição quando os dados estão ordenados de forma crescente ou decrescente. Normalmente é usada quando se deseja obter o ponto que divide a distribuição em duas partes iguais, ou quando existem valores extremos que afetam a média de forma acentuada. Também existe uma tendência a utilizar a mediana quando o valor a ser analisado ou estudado é salário, ou para informações que possam ser ordenadas de alguma forma, mas que não possuem valores mensuráveis (cor, nomes etc.).
Comparação entre a Média, a Mediana e a Moda
Relação entre a Média, a Mediana e a Moda
Com essas três medidas de posição é possível determinar a assimetria da curva de distribuição de frequência. A tabela de distribuição de frequências é composta de uma coluna contendo os valores que compõem a relação de dados e uma coluna com as correspondentes quantidades que cada valor aparece na relação de dados. As medidas de assimetria complementam as informações dadas pelas medidas de posição, a fim de permitir uma melhor compreensão das distribuições de frequências. A mediana se localiza na posição central da distribuição, devendo estar entre os valores da média e moda e podendo até mesmo ser igual a ambas.
Nesta situação temos três casos possíveis:
1º Caso – Média = Mediana = Moda – A curva da distribuição é SIMÉTRICA
2º Caso – Média < Mediana < Moda – A curva da distribuição tem ASSIMETRIA NEGATIVA
3º Caso – Média > Mediana > Moda – A curva da distribuição tem ASSIMETRIA POSITIVA
O coeficiente de assimetria pode ser calculado pela fórmula do primeiro coeficiente de Pearson, tornando mais fácil determinar se a assimetria da distribuição é positiva ou negativa:
No denominador da fórmula temos um símbolo que representa o desvio padrão da distribuição. Quando for apresentado o estudo sobre as medidas de dispersão, veremos mais detalhes sobre o cálculo do desvio padrão e seu significado. No momento podemos adiantar que terá sempre um valor positivo (ou seja, não é possível ocorrer desvio padrão negativo). Assim sendo o que vai determinar o sinal da fração é o sinal do numerador.
Quando a distribuição de frequência é assimétrica à direita da curva, dizemos que a distribuição tem assimetria positiva;
Quando a distribuição de frequência é assimétrica à esquerda da curva, dizemos que a distribuição tem assimetria negativa;
Outro coeficiente de assimetria de Pearson indica se esta é forte ou fraca:
Separatrizes
Quartis
Dividem a distribuição de frequência depois de ordenados em quatro partes iguais, contendo a mesma quantidade de elementos. Nesta divisão, o 1º quartil deixa 25% dos dados abaixo dele; o 2° quartil coincide com a mediana e deixa 50% dos dados abaixo dele; o 3° quartil deixa 75% dos dados abaixo dele.
Decis
Dividem a distribuição de frequência depois de ordenados em dez partes iguais, contendo a mesma quantidade de elementos. 
 Mantendo o raciocínio usado para a determinação dos quartis, a forma de determinação dos decis é:
Se o índice não é um valor inteiro, então se calcula a média entre os dados anterior e posterior ao determinado.
Percentis
Dividem a distribuição de frequência depois de ordenados em 100 partes iguais, contendo a mesma quantidade de elementos. 
 Mantendo o raciocínio usado para a determinação dos quartis, a forma de determinação
dos percentis é:
Se o índice não é um valor inteiro, então se calcula a média entre os dados anterior e posterior ao determinado.
Exemplo usando Excel
Cálculo da Média:
Utilizando a função média (num1; num2; ...) e marcando a relação de dados para calcularmos a média, teremos o resultado desejado.
Cálculo da Mediana:
Utilizando a função MED (num1; num2; ...) e marcando a relação de dados para calcularmos a mediana, teremos o resultado desejado.
Cálculo da Moda:
Utilizando a função MODO (num1; num2; ...) e marcando a relação de dados para calcularmos a moda, teremos o resultado desejado.
Resposta
Determine a média, a moda e a mediana da amostra abaixo, usando a planilha do Excel:
Cálculo da média = 72,10
Cálculo da mediana = 68,5
Cálculo da moda = 63

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais