Apostila UNIJUÍ -Métodos estaísticos e a administração
164 pág.

Apostila UNIJUÍ -Métodos estaísticos e a administração


DisciplinaEstatística Aplicada9.074 materiais80.465 seguidores
Pré-visualização35 páginas
analisando agora o padrão estadual a partir do banco de dados número 6, que 
contém os dados das 35 microrregiões do Estado do RS. Vamos utilizá-lo e as variáveis presentes 
para responder à seguinte questão e poder comparar com o resultado da Mesorregião Noroeste 
Rio-Grandense tratada a partir de uma análise descritiva realizada em série numérica, pois n=13 
microrregiões que fazem parte da mesma. 
Questão em estudo: Qual é o comportamento padrão do Estado do Rio Grande do Sul em 
termos de desenvolvimento?
EaD
71
MÉtodos estatísticos e a adMinistração
Neste momento, ao tratar do âmbito estadual, vamos trabalhar com dados agrupados em 
faixas empregando a Distribuição de Frequências. Não vamos desenvolver os cálculos para a 
construção da DF, mas apresentaremos as informações básicas necessárias para você refazer 
essa construção.
As medidas de Tendência Central são medidas de posição, porque posicionam o conjunto 
de dados na reta, isto é, nos informam sobre os pontos em que ocorrem as respostas de nossas 
variáveis, neste caso, as mesmas utilizadas anteriormente: IDH-médio, PIB per capita e Densi-
dade populacional. O tratamento estatístico vai partir de uma DF, com os cálculos necessários 
para realizar a análise pretendida.
a1. Variável X: IDH-médio
Vamos começar pelo procedimento usual de agrupamento de dados (construção da Dis-
tribuição de Frequências).
Quadro10: informações básicas sobre o idH-médio das microrregiões do rs
N 35
Li 0,744
Ls 0,852
At 0,108
Raiz n 5,916079783
Hi 0,018255332 \u2245 0,02
Fonte: Elaboração da autora.
Depois destas informações construímos a Distribuição de Frequências com 6 intervalos 
de tamanho 0,02, iniciando em 0,74, pois Li = 0,744, e finalizando em 0,86, uma vez que Ls = 
0,852.
tabela 1: distribuição do idH-médio do rs por microrregião
Valores de Xi fi fa fr% fr%ac Xi fi*xi fi*xi²
0,74 |------- 0,76 5 5 14,29 14,29 0,75 3,75 2,8125
0,76 |------- 0,78 11 16 31,43 45,72 0,77 8,47 6,5219
0,78 |------- 0,80 12 28 34,29 80,00 0,79 9,48 7,4892
0,80 |------- 0,82 3 31 8,57 88,58 0,81 2,43 1,9683
0,82 |------- 0,84 3 34 8,57 97,15 0,83 2,49 2,0667
0,84 |------- 0,86 1 35 2,86 100,00 0,85 0,85 0,7225
Total 35 100,00 27,47 21,5811
Fonte: Elaboração da autora com dados do IBGE.
EaD
ruth Marilda Fricke \u2013 iara denise endruweit Battisti \u2013 antonio Édson corrente
72
\u2022	Média Aritmética ( x )
Para preparar a DF para o cálculo da Média precisamos da coluna do Xi, ponto médio (soma 
dos limites do intervalo dividida por 2). Após obter o ponto médio, multiplicamos cada um pela 
frequência (fi*xi), que será a soma dos valores nesse intervalo. Após o cálculo do último produto 
somamos e obtemos a soma geral que será utilizada na fórmula, como evidenciamos a seguir:
1
27,47
0,785
35
n
i i
i
f x
X
n=
= = =\u2211 , IDH-médio do Estado do RS.
Apesar de ser um valor alto, ainda não se encontra na faixa dos melhores IDHs, que se inicia 
em 0,8. O \u201cBrasil entrou pela primeira vez para o grupo de países com elevado desenvolvimento 
humano, com um índice medido em 0,800 no ano de 2005. Em 2006 obteve uma melhora no 
índice de 0,007, com uma pontuação de 0,807. Encontra-se na 70ª colocação mundial, posição 
que já mantinha no ano anterior\u201d(Wikipédia, IDH, 14/7/2009).
\u2022	Mediana (Md)
O cálculo da Mediana numa DF deve ser feito a partir de uma fórmula que recupere o 
valor que separa o grupo em duas partes, com 50% cada. Inicialmente precisamos encontrar o 
ponto central, ou seja, sua posição (P), que vai nos indicar em qual intervalo se encontra o valor 
mediano. 
Sua localização será feita na coluna do fa, aquele que contém o p-ésimo valor. Nossa refe-
rência é que o valor que se encontra naquele intervalo é a posição do último valor que foi contado 
naquele intervalo. Nesse caso, o intervalo deve conter o valor P. Explicando mais concretamente, 
se os valores do fa são 1, 5, 20,... isto significa que no primeiro intervalo só entrou um dado, do 
2º ao 5º entrou no segundo intervalo, do 6º ao 20º no terceiro intervalo e assim por diante. Com 
isso, se n=30, P = 15º, valor que estará contido no 3º intervalo. Do intervalo mediano, que foi o 
selecionado, retiraremos toda a informação necessária. A única informação que não segue este 
critério é o faa (frequência acumulada do intervalo anterior ao mediano). Quando o intervalo 
mediano ocorrer no primeiro intervalo o faa será zero.
P = 
35
17,5
2 2
n = = \u2192 localiza o af no terceiro intervalo, pois as micror regiões 
17 até a 28 se encontram nesse intervalo mediano, o imd. Seleciona o intervalo 
e ret i ra todos os dados do mesmo com exceção da faa, que é o fa anterior.
( ) (17,5 16)0,02
0,78 0,7825
12
aa i
i
i
P f h
Md l
f
\u2212 \u2212= + = + =
EaD
73
MÉtodos estatísticos e a adMinistração
Com isso entende-se que 50% das microrregiões do RS não ultrapassam um IDH-médio 
de 0,783, têm índices inferiores, mas no limite de 0,75, informando-nos que no RS nenhuma 
microrregião é muito problemática em termos de desenvolvimento humano.
\u2022	Moda (Mo)
Para obtermos informação sobre o valor que mais ocorre no conjunto de dados, após o 
agrupamento dos valores, devemos nos concentrar no intervalo que agrega o maior número de 
informações (> fi). Este será denominado de intervalo modal (Imo). Esta localização independe 
da localização da Mediana, pois são duas informações diferentes, no entanto algumas vezes, 
principalmente em função da simetria da distribuição, as duas medidas utilizam o mesmo in-
tervalo como referência para o cálculo. É uma coincidência, não uma regra. Quando o intervalo 
modal ocorrer no primeiro intervalo o fant será zero, e o mesmo ocorre se o> fi se encontrar no 
último, nesse caso, fpos t será zero.
if \u2192 localizar no > if que é 12, no terceiro intervalo, 
o mesmo da Mediana neste caso, este é considerado 
em relação a ele o Imo (Intervalo modal). Seleciona o 
intervalo e retira todos os dados.
1
1 2
1
0,78 *0,02 0,782
1 9i i
d
Mo l h
d d
\uf8eb \uf8f6 \uf8eb \uf8f6= + = + =\uf8ec \uf8f7\uf8ec \uf8f7 \uf8ed \uf8f8+ +\uf8ed \uf8f8
 
1 12 11 1m antd f f= \u2212 = \u2212 =
2 12 3 9m postd f f= \u2212 = \u2212 =
mf : frequência máxima
antf : frequência anterior à máxima
postf : frequência posterior à máxima
Comparando-se as três informações ( 0,785.. .. 0,783.. ... 0,782x Md Mo= \u2245 = \u2245 = ) verificamos 
que se trata de uma curva simétrica, pois a Moda não difere significativamente da Média e da 
Mediana e podemos concluir que:
X Md Mo\u2245 \u2245
Esta igualdade nos informa que estamos diante de dados com muita simetria, cuja concen-
tração central apresenta todas as 3 medidas, logo a curva dos dados tende à normal, simétrica 
com concentração central, concluindo-se que o grupo é bastante homogêneo.
EaD
ruth Marilda Fricke \u2013 iara denise endruweit Battisti \u2013 antonio Édson corrente
74
Tendo em vista a necessidade de nos reportarmos à Tabela 1 para avaliar a validade da 
Média, vamos calcular logo a variação em torno da Média por meio das Medidas de Variabili-
dade, antes de fazermos o tratamento das outras variáveis.
Com as Medidas de Variabilidade queremos responder à seguinte questão:
O IDH médio do RS é válido como padrão para analisar o Estado?
\u2022	Variância absoluta (s²)
Para calcular a variância absoluta precisamos de uma coluna com o produto de cada fi 
pelo quadrado do Xi, ponto médio. Ao finalizarmos todos os produtos, é a soma dos mesmos que 
vai ser utilizada na fórmula. Se n > 30, não há necessidade de aplicar o Fator de Correção \u2013 [n/
(n-1)]. Neste caso n=35, então a variância será calculada sem ele.
( )
2
22
1
(21,5811)
(0,785)² 0,000377857
35
n
i i
i
f x
S x
n=
= \u2212 = \u2212 =\u2211
\u2022	Desvio Padrão (s)
Ao calcular o desvio padrão, ou seja, a informação que nos dirá qual é, em média, o afas-
tamento dos dados em relação à média, comumente vamos lembrar que nas pesquisas eleitorais 
os resultados são informados num intervalo, por exemplo: (3% para mais ou 3% para menos). 
Isto nos auxilia a perceber a importância do desvio padrão.
 
² 0,000377857 0,019438544S s= = =
\u2022	Coeficiente de