Buscar

aula2 Nesta aula, você aprenderá como as medidas de posição central (média aritmética e ponderada, mediana e moda)

Prévia do material em texto

Disciplina: Análise Estatística
Aula 2: Revisão das Medidas de Tendência Central e de Posição
Apresentação
Na aula 1 foram compreendidas as fases do método estatístico como a coleta, crítica,
apuração, apresentação e análise dos dados.
Nesta aula, você aprenderá como as medidas de posição central (média aritmética e
ponderada, mediana e moda) são determinadas e como permitem uma melhor
compreensão dos dados de uma análise estatística. Aprenderá ainda as relações
entre média, moda e mediana. Abordaremos as medidas de ordenamento quartis,
decis e percentis. Veremos, por fim, como calcular as medidas estatísticas em
Microsoft Excel.
As medidas de posição central nos apontam a tendência de comportamento dos
dados, enquanto as separatrizes nos auxiliam na decisão de qual a cobertura dos
dados poderemos atingir ou selecionar.
Objetivos
Apresentar o cálculo das medidas de posição central e suas relações;
Conhecer as medidas de ordenamento quartis, decis e percentis;
Apresentar o cálculo das medidas estatísticas em Microsoft Excel.
Medidas de Posição Central
Em uma dada distribuição amostral, é possível fazer várias observações, no
intuito de entender o comportamento dos seus valores. Podemos, por
exemplo, tentar localizar a maior concentração de valores de uma
determinada distribuição. Entretanto, para que tenhamos parâmetros de
comparação entre as tendências características de cada distribuição, é
necessário introduzir conceitos que se expressem através de números.
Veremos então as medidas de posição . As serem estudadas são as
medidas de tendência central e as separatrizes.
Média aritmética
Moda
Mediana
Iremos estudar as separatrizes:
Quartis
Decis
Percentis
Medidas de Tendência Central
As medidas de tendência central são valores que, de maneira condensada,
trazem informações contidas nos dados estatísticos. É um valor que tende a
melhor representar um conjunto de números. Funcionam como um resumo,
1
passando a ideia do comportamento geral dos dados. Representam um valor
central em torno do qual os dados se concentram e se distribuem, mostrando
se essa concentração ocorre no inicio, no meio ou no final da distribuição, ou
até mesmo se estão distribuídos de forma igual ao longo da amplitude
considerada.
Quando esses valores estão associados a uma população, chamamos de
parâmetros; quando estão ligados a uma amostra, são chamados de
estatísticas. Como o cálculo dos parâmetros é feito em cima de todos os
números, os parâmetros são valores constantes, fixos. Já os valores
estatísticos são obtidos dos dados selecionados da população, e como para
cada amostra temos dados diferentes, que irão influenciar no cálculo dos
valores estatísticos, esses valores não são fixos.
Média
Para uma distribuição de dados estatísticos a ser analisada, composta por
n valores 𝑥 , i = 1, 2 ..., n. É interessante, sempre que possível, ordenar
os dados de modo que 𝑥 seja o menor valor e 𝑥 seja o maior valor da
relação de valores da distribuição.
Muitas vezes existe uma concentração maior dos dados em torno de um
valor; outras vezes os dados estão equilibradamente distribuídos entre a
faixa de valores compreendido pela amplitude dos dados (Amplitude =𝑥 
- 𝑥 ). Esta informação quanto à distribuição muitas vezes é importante,
sendo calculada através da média aritmética, ou apenas média.
Outro tipo de média, também bastante utilizada, é a média aritmética
ponderada. A média ponderada é muito usada em situações em que os
dados são agrupados por frequência, ou em situações em que os dados
possuem importâncias diferentes, sendo representados na forma de
pesos.
Média Aritmética e Ponderada
𝑖
𝑖 𝑛
𝑛
1
A média aritmética é usada para distribuições simétricas, ou quase
simétricas, ou para distribuições que têm um único pico dominante. É
determinada somando-se todas as observações e dividindo-se pelo
número total de observações.
O cálculo da média se dá pela fórmula:
͞𝑥 = Média aritmética da amostra (𝜇 é usado para a população);
𝑥 = Valor representativo de cada variável de dados (𝑥 , 𝑥 , 𝑥 ,..., 𝑥 
);
n = Número total de itens da amostra (N é usado para a população).
Exemplo: Sabendo-se que a quantidade de garrafas de refrigerante
vendidas no mercado, durante uma semana, foi de 10, 14, 13, 15, 16, 18
e 12 garrafas, temos para a venda média da semana:
Logo...
͞𝑥 = 14 litros
... É a média diária nesta semana.
A média ponderada ( ͞𝑥 para amostra e 𝜇 para população ) é usada em
várias ocasiões como por exemplo, em situações em que os dados
possuem níveis de importância diferentes dentro do grupo para os
diversos dados da distribuição, explicitando essa importância na forma de
peso 𝑤 .
μ  = =
∑ x
i
i=1
N
N
+ +...+x
1
x
2
x
n
N
μ  = =
∑ x
i
i=1
n
n
+ +...+x
1
x
2
x
n
n
𝑖 1 2 3 𝑛
= = = 14x
10+14+13+15+16+18+12
7
98
7
𝑤 𝑤
𝑖
= =x
w
∑
i=1
n
x
i
w
i
∑
i=1
n
w
i
. + . +...+x
1
w
1
x
2
w
2
x
n.
w
n
+ +...+w
1
w
2
w
n
Exemplo: Um concurso de três etapas possui peso 2 na primeira etapa,
peso 1 na segunda etapa e peso 3 na terceira etapa. Qual a nota final do
candidato que tire 5,9 na primeira, 8,4 na segunda e 6,7 na terceira
etapa do concurso?
Moda
Denominamos moda o valor que ocorre com a maior frequência em uma
relação de dados. Muitas vezes é utilizada por ser a medida de posição
de mais rápida visualização.
A moda (Mo) é usada quando temos distribuições extremamente
assimétricas, ou nas situações irregulares em que dois ou mais pontos de
concentração de dados são verificados na série de dados. Ou até mesmo
nas situações em que se deseja eliminar os efeitos de valores extremos
que destoam da normalidade da série de valores.
A moda também pode ser designada como valor típico, valor dominante
ou norma.
Quanto à classificação modal, um conjunto pode ser considerado
unimodal, quando apresenta apenas uma moda.
Exemplo:
X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) → Mo = 6
(o valor de maior frequência)
Pode ser considerado bimodal quando possui duas modas.
= = = = 6, 7x
w
∑
i=1
n
x
i
w
i
∑
i=1
n
w
i
11,8.+8,4.+20,1
2+1+3
40,3
6
Exemplo:
X = (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) → Mo = 2 e Mo = 4
(os valores de maior frequência)
É considerada plurimodal ou multimodal quando apresenta mais de
duas modas.
Exemplo:
X = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) → Mo = 2, Mo = 3 e Mo = 4
(os valores de maior frequência)
Quando todos os valores apresentam a mesma frequência, o conjunto
é considerado amodal.
Exemplo:
X = (1, 2, 3, 4, 5, 6)
(não apresenta valor predominante)
Mediana
A mediana é o valor central da distribuição quando os dados estão
ordenados de forma crescente ou decrescente. Normalmente é usada
quando se deseja obter o ponto que divide a distribuição em duas partes
iguais, ou quando existem valores extremos que afetam a média de
forma acentuada. Também existe uma tendência a utilizar a mediana
quando o valor a ser analisado ou estudado é salário, ou para
informações que possam ser ordenadas de alguma forma, mas que não
possuem valores mensuráveis (cor, nomes etc.).
Exemplo:
1) Considere o conjunto de dados: X = (6, 2, 7, 10, 3, 4, 1, 12).
Determine a mediana.
2) Colocar os valores em ordem crescente ou decrescente: X = (1, 2, 3,
4, 6, 7, 10, 12);
3) Determinar a ordem ou a posição do elemento (E) da mediana:
4) Localizar a mediana e calcular o seu valor (para o ocaso de n par):
5) Determinar x4,5, sabendo que:
Comparação entre a Média, a
Mediana e a Moda
MEDIDA
DEPOSIÇÃO VANTAGENS DESVANTAGENS
USAR
QUANDO
MÉDIA
Reflete cada
valor observado
na distribuição
É influenciada porvalores extremos
• Deseja-se a
medida de posição
com a maior
estabilidade;
• Necessita de um
posterior
tratamento
algébrico.
MEDIANA
Menos sensível a
valores
extremos do que
a Média
Difícil de determinar
para grande
quantidade de dados
• Deseja-se o ponto
que divide o
conjunto em partes
iguais;
• Há valores
extremos que
afetam de maneira
acentuada e média;
• A variável em
estudo é o salário.
E = = 4, 5
n+1
2
8+1
2
=  4 e    =  6  →  Med  =   = = 5x
4
x
5
+x
4
x
5
2
4+6
2
MODA
Maior
quantidade de
valores
concentrados
neste ponto
Não se presta à
análise Matemática.
Nem sempre a
distribuição possui
moda
• Deseja-se uma
medida rápida e
aproximada da
posição;
• A medida de
posição deve ser o
valor mais típico da
distribuição.
Relação entre a Média, a Mediana e
a Moda
Com essas três medidas de posição é possível determinar a assimetria da
curva de distribuição de frequência. A tabela de distribuição de frequências é
composta de uma coluna contendo os valores que compõem a relação de
dados e uma coluna com as correspondentes quantidades que cada valor
aparece na relação de dados. As medidas de assimetria complementam as
informações dadas pelas medidas de posição, a fim de permitir uma melhor
compreensão das distribuições de frequências. A mediana se localiza na
posição central da distribuição, devendo estar entre os valores da média e
moda e podendo até mesmo ser igual a ambas.
Nesta situação temos três casos possíveis:
1º Caso  Média = Mediana =Moda 
A curva da distribuição é
simétrica
2º Caso  Média < Mediana <Moda 
A curva da distribuição tem
assimetria negativa
3º Caso  Média > Mediana >Moda 
A curva da distribuição tem
assimetria positiva
O coeficiente de assimetria pode ser calculado pela fórmula do primeiro
coeficiente de Pearson, tornando mais fácil determinar se a assimetria da
distribuição é positiva ou negativa:

Atenção
No denominador da fórmula temos um símbolo que representa o desvio
padrão da distribuição. Quando for apresentado o estudo sobre as
medidas de dispersão, veremos mais detalhes sobre o cálculo do desvio
padrão e seu significado. No momento podemos adiantar que terá
sempre um valor positivo (ou seja, não é possível ocorrer desvio padrão
negativo). Assim sendo o que vai determinar o sinal da fração é o sinal
do numerador.
1º Caso
Média = Moda → ͞𝑥 - Mo = 0 → Assimétrica nula = Simétrica
2º Caso
Média < Moda → ͞𝑥 - Mo < 0 → Assimetria negativa
3º Caso
Média > Moda → ͞𝑥 - Mo > 0 → Assimetria positiva
Curva da distribuição é simétrica
Curva da distribuição é assimétrica positiva e negativa
Quando a distribuição de frequência é assimétrica à direita da curva,
dizemos que a distribuição tem assimetria positiva;
Quando a distribuição de frequência é assimétrica à esquerda da curva,
dizemos que a distribuição tem assimetria negativa.
Outro coeficiente de assimetria de Pearson indica se esta é forte ou fraca:
AS =
3(  − Md)x
S
0 < || AS || ≤ 0,15 → Assimetria Fraca
0,15 < || AS || ≤ 1 → Assimetria Moderada
|| AS || > 1 → Assimetria Forte
Quartis
Dividem a distribuição de frequência depois de ordenados em quatro
partes iguais, contendo a mesma quantidade de elementos. Nesta
divisão, o 1° quartil deixa 25% dos dados abaixo dele; o 2° quartil
coincide com a mediana e deixa 50% dos dados abaixo dele; o 3° quartil
deixa 75% dos dados abaixo dele.
A forma de determinação dos quartis é:
𝑄 = determina o elemento que separa o quartil i e o quartil seguinte +
1);
n = número de dados.
Se o índice
não é um valor inteiro, então se calcula a média entre os dados anterior
e posterior ao determinado.
1º quadril:
2º quadril:
3º quadril:
=  Q
i
X
( + )
in
4
1
2
𝑖
( + )
in
4
1
2
=Q
1
X
( + )
n
4
1
2
= =Q
2
X
( + )
2n
4
1
2
X
( + )
n
2
1
2
Decis
Dividem a distribuição de frequência depois de ordenados em dez partes
iguais, contendo a mesma quantidade de elementos.
Mantendo o raciocínio usado para a determinação dos quartis, a forma de
determinação dos decis é:
Se o índice não é um valor inteiro, então se calcula a média entre os
dados anterior e posterior ao determinado.
Percentis
Dividem a distribuição de frequência depois de ordenados em 100 partes
iguais, contendo a mesma quantidade de elementos. Mantendo o
raciocínio usado para a determinação dos quartis, a forma de
determinação dos percentis é:
Se o índice não é um valor inteiro, então se calcula a média entre os
dados anterior e posterior ao determinado.
Exemplo usando Excel
Determine a média, a moda e a mediana da amostra abaixo, usando a
planilha do Excel:
=Q
3
X
( + )
3n
4
1
2
=D
1
X
( + )
in
10
1
2
=P
1
X
( + )
in
100
1
2
44 48 53 54 56 56
56 57 60 60 62 63
63 63 63 65 66 67
68 68 69 69 70 71
72 74 77 78 80 81
82 85 90 93 95 95
97 100 106 107
Cálculo da Média:
Utilizando a função média (num1; num2; ...) e marcando a relação de
dados para calcularmos a média, teremos o resultado desejado.
Cálculo da Mediana:
Utilizando a função MED (num1; num2; ...) e marcando a relação de
dados para calcularmos a mediana, teremos o resultado desejado.
Cálculo da Moda:
Utilizando a função MODO (num1; num2; ...) e marcando a relação de
dados para calcularmos a moda, teremos o resultado desejado.
Resposta...
Notas
Medidas de posição 
São valores que vão orientar quanto à posição da distribuição dos dados numa
sequência ordenada.
Referências
BRUNI, Adriano Leal; PAIXÃO, Roberto Brazileiro. Excel aplicado à gestão
empresarial. 1.ed. São Paulo: Atlas, 2008.
CRESPO, Antônio Arnot. Estatística fácil. 19.ed. São Paulo: Saraiva, 2009.
KAZMIER, Leonard J. Estatística aplicada à Economia e Administração. 4.ed. Porto
Alegre: Artmed, 2007.
1
Próximos Passos
Medidas de dispersão;
Amplitude total e interquartil;
Desvio médio, variância, desvio padrão e coeficiente de variação;
Cálculo das medidas de dispersão em Microsoft Excel.
Explore mais

Outros materiais