Apostila UNIJUÍ -Métodos estaísticos e a administração
164 pág.

Apostila UNIJUÍ -Métodos estaísticos e a administração

Disciplina:Estatística Aplicada7.429 materiais64.132 seguidores
Pré-visualização35 páginas
analisando agora o padrão estadual a partir do banco de dados número 6, que

contém os dados das 35 microrregiões do Estado do RS. Vamos utilizá-lo e as variáveis presentes

para responder à seguinte questão e poder comparar com o resultado da Mesorregião Noroeste

Rio-Grandense tratada a partir de uma análise descritiva realizada em série numérica, pois n=13

microrregiões que fazem parte da mesma.

Questão em estudo: Qual é o comportamento padrão do Estado do Rio Grande do Sul em

termos de desenvolvimento?

EaD

71

MÉtodos estatísticos e a adMinistração

Neste momento, ao tratar do âmbito estadual, vamos trabalhar com dados agrupados em

faixas empregando a Distribuição de Frequências. Não vamos desenvolver os cálculos para a

construção da DF, mas apresentaremos as informações básicas necessárias para você refazer

essa construção.

As medidas de Tendência Central são medidas de posição, porque posicionam o conjunto

de dados na reta, isto é, nos informam sobre os pontos em que ocorrem as respostas de nossas

variáveis, neste caso, as mesmas utilizadas anteriormente: IDH-médio, PIB per capita e Densi-

dade populacional. O tratamento estatístico vai partir de uma DF, com os cálculos necessários

para realizar a análise pretendida.

a1. Variável X: IDH-médio

Vamos começar pelo procedimento usual de agrupamento de dados (construção da Dis-

tribuição de Frequências).

Quadro10: informações básicas sobre o idH-médio das microrregiões do rs

N 35
Li 0,744
Ls 0,852

At 0,108

Raiz n 5,916079783

Hi 0,018255332 ≅ 0,02

Fonte: Elaboração da autora.

Depois destas informações construímos a Distribuição de Frequências com 6 intervalos

de tamanho 0,02, iniciando em 0,74, pois Li = 0,744, e finalizando em 0,86, uma vez que Ls =

0,852.

tabela 1: distribuição do idH-médio do rs por microrregião

Valores de Xi fi fa fr% fr%ac Xi fi*xi fi*xi²
0,74 |------- 0,76 5 5 14,29 14,29 0,75 3,75 2,8125
0,76 |------- 0,78 11 16 31,43 45,72 0,77 8,47 6,5219
0,78 |------- 0,80 12 28 34,29 80,00 0,79 9,48 7,4892
0,80 |------- 0,82 3 31 8,57 88,58 0,81 2,43 1,9683
0,82 |------- 0,84 3 34 8,57 97,15 0,83 2,49 2,0667
0,84 |------- 0,86 1 35 2,86 100,00 0,85 0,85 0,7225

Total 35 100,00 27,47 21,5811

Fonte: Elaboração da autora com dados do IBGE.

EaD
ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente

72

•	Média Aritmética ( x )

Para preparar a DF para o cálculo da Média precisamos da coluna do Xi, ponto médio (soma

dos limites do intervalo dividida por 2). Após obter o ponto médio, multiplicamos cada um pela

frequência (fi*xi), que será a soma dos valores nesse intervalo. Após o cálculo do último produto

somamos e obtemos a soma geral que será utilizada na fórmula, como evidenciamos a seguir:

1

27,47
0,785

35

n
i i

i

f x
X

n=
= = =∑ , IDH-médio do Estado do RS.

Apesar de ser um valor alto, ainda não se encontra na faixa dos melhores IDHs, que se inicia

em 0,8. O “Brasil entrou pela primeira vez para o grupo de países com elevado desenvolvimento

humano, com um índice medido em 0,800 no ano de 2005. Em 2006 obteve uma melhora no

índice de 0,007, com uma pontuação de 0,807. Encontra-se na 70ª colocação mundial, posição

que já mantinha no ano anterior”(Wikipédia, IDH, 14/7/2009).

•	Mediana (Md)

O cálculo da Mediana numa DF deve ser feito a partir de uma fórmula que recupere o

valor que separa o grupo em duas partes, com 50% cada. Inicialmente precisamos encontrar o

ponto central, ou seja, sua posição (P), que vai nos indicar em qual intervalo se encontra o valor

mediano.

Sua localização será feita na coluna do fa, aquele que contém o p-ésimo valor. Nossa refe-

rência é que o valor que se encontra naquele intervalo é a posição do último valor que foi contado

naquele intervalo. Nesse caso, o intervalo deve conter o valor P. Explicando mais concretamente,

se os valores do fa são 1, 5, 20,... isto significa que no primeiro intervalo só entrou um dado, do

2º ao 5º entrou no segundo intervalo, do 6º ao 20º no terceiro intervalo e assim por diante. Com

isso, se n=30, P = 15º, valor que estará contido no 3º intervalo. Do intervalo mediano, que foi o

selecionado, retiraremos toda a informação necessária. A única informação que não segue este

critério é o faa (frequência acumulada do intervalo anterior ao mediano). Quando o intervalo

mediano ocorrer no primeiro intervalo o faa será zero.

P =
35

17,5
2 2

n = = → localiza o af no terceiro intervalo, pois as micror regiões
17 até a 28 se encontram nesse intervalo mediano, o imd. Seleciona o intervalo

e ret i ra todos os dados do mesmo com exceção da faa, que é o fa anterior.

( ) (17,5 16)0,02
0,78 0,7825

12
aa i

i
i

P f h
Md l

f

− −= + = + =

EaD

73

MÉtodos estatísticos e a adMinistração

Com isso entende-se que 50% das microrregiões do RS não ultrapassam um IDH-médio

de 0,783, têm índices inferiores, mas no limite de 0,75, informando-nos que no RS nenhuma

microrregião é muito problemática em termos de desenvolvimento humano.

•	Moda (Mo)

Para obtermos informação sobre o valor que mais ocorre no conjunto de dados, após o

agrupamento dos valores, devemos nos concentrar no intervalo que agrega o maior número de

informações (> fi). Este será denominado de intervalo modal (Imo). Esta localização independe

da localização da Mediana, pois são duas informações diferentes, no entanto algumas vezes,

principalmente em função da simetria da distribuição, as duas medidas utilizam o mesmo in-

tervalo como referência para o cálculo. É uma coincidência, não uma regra. Quando o intervalo

modal ocorrer no primeiro intervalo o fant será zero, e o mesmo ocorre se o> fi se encontrar no

último, nesse caso, fpos t será zero.

if → localizar no > if que é 12, no terceiro intervalo,
o mesmo da Mediana neste caso, este é considerado

em relação a ele o Imo (Intervalo modal). Seleciona o

intervalo e retira todos os dados.

1

1 2

1
0,78 *0,02 0,782

1 9i i
d

Mo l h
d d

   = + = + =    + + 

1 12 11 1m antd f f= − = − =

2 12 3 9m postd f f= − = − =

mf : frequência máxima

antf : frequência anterior à máxima

postf : frequência posterior à máxima

Comparando-se as três informações ( 0,785.. .. 0,783.. ... 0,782x Md Mo= ≅ = ≅ = ) verificamos
que se trata de uma curva simétrica, pois a Moda não difere significativamente da Média e da

Mediana e podemos concluir que:

X Md Mo≅ ≅

Esta igualdade nos informa que estamos diante de dados com muita simetria, cuja concen-

tração central apresenta todas as 3 medidas, logo a curva dos dados tende à normal, simétrica

com concentração central, concluindo-se que o grupo é bastante homogêneo.

EaD
ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente

74

Tendo em vista a necessidade de nos reportarmos à Tabela 1 para avaliar a validade da

Média, vamos calcular logo a variação em torno da Média por meio das Medidas de Variabili-

dade, antes de fazermos o tratamento das outras variáveis.

Com as Medidas de Variabilidade queremos responder à seguinte questão:

O IDH médio do RS é válido como padrão para analisar o Estado?

•	Variância absoluta (s²)

Para calcular a variância absoluta precisamos de uma coluna com o produto de cada fi

pelo quadrado do Xi, ponto médio. Ao finalizarmos todos os produtos, é a soma dos mesmos que

vai ser utilizada na fórmula. Se n > 30, não há necessidade de aplicar o Fator de Correção – [n/

(n-1)]. Neste caso n=35, então a variância será calculada sem ele.

( )
2

22

1

(21,5811)
(0,785)² 0,000377857

35

n
i i

i

f x
S x

n=
= − = − =∑

•	Desvio Padrão (s)

Ao calcular o desvio padrão, ou seja, a informação que nos dirá qual é, em média, o afas-

tamento dos dados em relação à média, comumente vamos lembrar que nas pesquisas eleitorais

os resultados são informados num intervalo, por exemplo: (3% para mais ou 3% para menos).

Isto nos auxilia a perceber a importância do desvio padrão.

² 0,000377857 0,019438544S s= = =

•	Coeficiente de