Apostila UNIJUÍ -Métodos estaísticos e a administração
164 pág.

Apostila UNIJUÍ -Métodos estaísticos e a administração

Disciplina:Estatística Aplicada7.459 materiais64.570 seguidores
Pré-visualização35 páginas
das fórmulas necessárias para o cálculo das estatísticas desta unidade vamos iniciar

com um quadro-resumo de fórmulas.

As fórmulas para o cálculo das medidas descritivas são apresentadas somente para variáveis

quantitativas com duas opções: para série numérica (n< 20) e distribuição de frequências (n ≥
20), em dois quadros: um para as Medidas de Tendência Central: Média ( X ), Mediana (Md)

e Moda (Mo), outro para as Medidas de Variabilidade: Variância absoluta (s²), Desvio padrão

(s) e Coeficiente de Variação (CV).

Quadro 1: Quadro-resumo das fórmulas das Medidas de tendência central – Mtc

Medidas Série Numérica Distribuição de freqüências

Média Aritmética

( na amostra e µ
na população)

1

n
i

i

x
X

n=
= ∑ ( )

2
,...

1

si

i

n

i

ii
ll

X
n

xf
X

+
== ∑

=

Mediana (Md)

N par → P = 2

n

, a Mediana é

a média dos dois valores cen-

trais, i .é. , do P-ésimo valor e o

seguinte.

N ímpar → P =
1

2

n +
, a Media-

na é o P-ésimo valor.

P =
2

n
→ localizar no af o imd,

intervalo mediano. Seleciona o in-

tervalo e retira todos os dados com

exceção da faa que é o fa anterior.

 ( )
i

iaa
i f

hfP
lMd

−+=

Moda (Mo)

A moda numa série numérica é

o valor mais repetido, i .é, com

concentração máxima. A série

pode ser:

Amodal – sem moda

Unimodal – um valor modal

Bimodal – dois valores modais

Plurimodal – mais de dois valo -

res mais repetidos

if → localizar no > if o imo, inter-
valo modal. Seleciona o intervalo e

retira todos os dados.

ii hdd

d
lMo 





+
+=

21

1

 ,
antm ffd −=1 postm ffd −=2

mf : frequência máxima

antf : frequência anterior à máxima

postf : frequência posterior à máxima

Fonte: Elaboração da autora a partir da literatura estatística.

EaD

57

MÉtodos estatísticos e a adMinistração

Entendemos que será fácil para o estudante visualizar e comparar as diferenças que as fór-

mulas apresentam quando são utilizadas em séries numéricas ou distribuições de frequências.

Fundamentalmente, compreendemos que a série não apresenta grande dificuldade de

obtenção das informações e de compreensão de seu significado e do que elas indicam no caso

da tendência central, pois apresenta uma listagem dos dados. A maior complexidade do cálcu-

lo na distribuição de frequências deve-se ao fato de que os intervalos não dão visibilidade ao

valor em si, mas ao número de ocorrências dentro do intervalo, à respectiva faixa de variação

e principalmente ao fato de que não trabalhamos com o próprio valor, mas sim com um valor

representativo, que é o ponto médio. Isso exige uma certa disposição para recriar a informação.

As fórmulas servem para recuperá-la. Observa-se que para a Média Aritmética e para a Variância

as fórmulas se modificam apenas pela inclusão do Xi ponto médio no caso da DF.

Quadro 2: Quadro-resumo das fórmulas das Medidas de variabilidade ou dispersão – Mv

Medidas Série Numérica Distribuição de frequências

Variância Absoluta

(s² ou σ²)

( )
2

22

1

n
i

i

x
S x

n=
= −∑

se pequena amostra )30( <n , aplica
Fator de Correção –

1−
=
n

n
FC

 FCSS .2* =

( )2
1

2
2 x

n

xf
S

n

i

ii −= ∑
=

se pequena amostra )30( <n , aplica
Fator de Correção –

1−
=
n

n
FC

 FCSS .2* =

Desvio padrão

(s ou σ)
2S S= 2SS =

Coeficiente de

Variação (CV)
CV > 60%, Moda é padrão

100
S

CV
X

 =   

100
S

CV
X

 =   

CV < 30%, Média é padrão

30% ≤CV ≤ 60%, Mediana é padrão

CV > 60%, Moda é padrão

Intervalo de Nor-

malidade (IN)*

65% ;IN X S X S= − +

95% 2* ; 2*IN X S X S= − +

99% 3* ; 3*IN X S X S= − +

65% ;IN X S X S= − +

95% 2* ; 2*IN X S X S= − +
99% 3* ; 3*IN X S X S= − +

Fonte: Elaboração da autora a partir da literatura estatística.

* O Intervalo de Normalidade só é aplicável quando a média é válida, isto é, CV < 30%.

EaD
ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente

58

Alguns conceitos básicos são importantes e serão apresentados num quadro, permitindo

um debate e sua ampliação em pesquisa conceitual.

A seção a seguir vai tratar principalmente do cálculo e interpretação dessas medidas. É

importante para uma boa aprendizagem que todos os exemplos sejam retomados por você.

seção 3.2

Medida de tendência central e de variabilidade
– conceitos e operacionalização

Iniciamos com uma apresentação dos conceitos, propiciando que sejam discutidas as razões

que levam a sua utilização. A ideia principal, como já foi expresso anteriormente, é a de resumir

o comportamento dos dados em números que sirvam de parâmetro para sua análise.

Como a informação mais usualmente empregada, e observa-se que ela é influenciada pelos

valores extremos da variável, é importante que verifiquemos como os dados se concentram ou

se dispersam em relação à média para avaliar a adequabilidade de seu uso ou a necessidade de

buscar medidas alternativas, como a mediana ou a moda.

Cada uma das Medidas de Tendência Central vai olhar a centralidade dos dados por uma

ótica:

•	Média – centro em termos de massa

•	Mediana – centro real

•	Moda – centro em termos de concentração

A variabilidade vai permitir concluir sobre a homogeneidade ou heterogeneidade dos va-

lores obtidos em relação à média aritmética:

•	em sendo homogêneos, a distribuição dos valores se concentra em torno da média;

•	em sendo heterogêneos, a distribuição dos valores se dispersa em torno da média.

EaD

59

MÉtodos estatísticos e a adMinistração

Quadro 3: Quadro-resumo de conceitos básicos para Medidas de tendência central
e das Medidas de variabilidade ou dispersão

MEDIDAS DE TENDÊNCIA CENTRAL
MÉDIA ARITMÉTICA Ponto de equilíbrio da variável em termos de massa

MEDIANA
Ponto central da distribuição de dados separa o conjunto em dois grupos

de 50% cada
MODA É o valor mais frequente no conjunto de dados

MEDIDAS DE VARIABILIDADE
VARIÂNCIA ABSOLUTA Mede os desvios quadráticos dos valores em relação à média
DESVIO PADRãO Informa o desvio médio dos valores em relação à média

COEFICIENTE DE VARIAçãO
Valor relativo da variabilidade em torno da média, permite obter uma

conclusão sobre a validade da média

INTERVALO DE NORMALIDADE
Intervalo em torno da média considerando um afastamento médio em

relação a ela

Fonte: Elaboração da autora com base em literatura estatística.

As fórmulas para o cálculo das medidas descritivas são apresentados com duas variações:

para Série Numérica e para Distribuição de Frequências (DF). Como podemos observar no

quadro resumo das fórmulas, a principal diferença é que na série temos os valores individual-

mente e podemos somá-los diretamente, enquanto que na DF eles estão dentro de um intervalo

de valores e o que sabemos é a sua frequência, isto é, a sua repetição. Nesse caso, temos de

encontrar um valor que represente o intervalo. Este valor será denominado de Xi, ponto médio.

É na verdade o meio do intervalo que adotamos como se todos os valores do intervalo fossem

iguais a ele. Por exemplo: num intervalo de 10 |-----– 20 o ponto central é 15 pois (10+20)/2

= 15,
( )

2

i s

i

l l
X

+
= ; logo, se nesse intervalo forem contados 5 valores, fi = 5, então a soma dos

mesmos será 5*15=75.

Vamos trabalhar com a aplicação desses conteúdos num banco de dados que traz informa-

ções sobre o desenvolvimento das microrregiões do RS e respectivas mesorregiões.

EaD
ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente

60

Quadro 4: variáveis, seus conceitos, categorias e tipo de variável do banco de dados nº 5
com as microrregiões do rs e respectivas mesorregiões

Microrregião

Microrregião é, de acordo com a Constituição Brasileira de 1988, um agrupamento de

municípios limítrofes. Sua finalidade é integrar a organização, o planejamento e a exe-

cução de funções públicas de interesse comum, definidas por lei complementar estadu-

al. VA qualitativa não ordenável. Significado dos códigos estão no banco de dados.

Mesorregião

Mesorregião é uma subdivisão dos Estados brasileiros