LIVRO Estatistica Basica Para Ciências Agrárias
359 pág.

LIVRO Estatistica Basica Para Ciências Agrárias


DisciplinaBioestatística I3.594 materiais30.169 seguidores
Pré-visualização50 páginas
por definic¸a\u2dco o ponto me´dio dessa classe. A utilidade da moda ocorre quando num conjunto
de dados, um, dois, ou um grupo de valores, ocorrem com muito maior frequ¨e\u2c6ncia do que
outros.
79
Rendimento médio (kg/ha)
Fr
eq
üê
nc
ia
 a
bs
ol
ut
a 
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
3,13%
37,5%
40,63%
9,37% 9,37%
Q1=4738 Md=5051Q3=5348
Figura 2.29: Representac¸a\u2dco geome´trica da mediana, do primeiro quartil e do terceiro quartil
2.2.2 Medidas de Dispersa\u2dco
2.2.2.1 Varia\u2c6ncia, Desvio Padra\u2dco, Coeficiente de Variac¸a\u2dco e Desvio Interquart´\u131lico
Quando apresentamos uma medida de tende\u2c6ncia central para representar um conjunto
de dados, e´ necessa´rio que esta medida seja acompanhada de um outra medida que resuma
a variabilidade dos dados, ou seja, a dispersa\u2dco dos dados. Na figura 2.26 esta\u2dco representados
os pesos ao nascer de bezerros das rac¸as Charoleza e Gir, duas rac¸as leiteiras. Observa-se
que as duas distribuic¸o\u2dces te\u2c6m a mesma me´dia amostral, pore´m, os valores para a rac¸a Gir
esta\u2dco bem mais esparramados (dispersos) do que os valores da rac¸a Charoleza. Dizemos que a
variabilidade na rac¸a Gir e´ maior do que na rac¸a Charoleza. Enfim, os dois conjuntos de dados
sa\u2dco bastante diferentes, apesar de apresentarem a mesma me´dia amostral. Com isso, fica
claro que sa\u2dco necessa´rios, pelo menos dois tipos de medidas para descrever razoavelmente bem
um conjunto de dados. Uma medida de dispersa\u2dco quantifica a magnitude da variabilidade
dos dados. Vamos apresentar as seguintes medidas de dispersa\u2dco:
\u2022 Varia\u2c6ncia
\u2022 Desvio padra\u2dco
\u2022 Coeficiente de variac¸a\u2dco
\u2022 Desvio interquart´\u131lico
Para os me´todos estat´\u131sticos, a medida de dispersa\u2dco e´ de fundamental importa\u2c6ncia, pois a
necessidade do uso da estat´\u131stica, e´ devida a existe\u2c6ncia de variabilidade nos dados observados.
80
Xi 5,4 5,4 5,8 6,4 6,4 6,6 6,6 6,8 6,8 7,0 7,3 7,3 7,5 8,2 8,8 8,8
x 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94 6,94
)( xxi \u2212 -1,54 -1,54 -1,14 -0,54 -0,54 -0,34 -0,34 -0,14 -0,14 0,06 0,36 0,36 0,56 1,26 1,86 1,86
2)( xxi \u2212 2,37 2,37 1,30 0,29 0,29 0,12 0,12 0,02 0,02 0,00 0,13 0,13 0,31 1,59 3,46 3,46
Figura 2.30: Ca´lculo da varia\u2c6ncia do dia\u2c6metro da roseta foliar de brome´lias expostas ao sol
Para a varia\u2c6ncia e o desvio padra\u2dco, o princ´\u131pio ba´sico e´ analisar os desvios das observac¸o\u2dces
em relac¸a\u2dco a` me´dia aritme´tica. Em cada caso, o valor zero para a varia\u2c6ncia ou desvio padra\u2dco,
indica ause\u2c6ncia de variac¸a\u2dco; a variac¸a\u2dco vai aumentando a` medida que aumenta o valor da
medida de dispersa\u2dco.
A varia\u2c6ncia e´ uma medida de dispersa\u2dco que nos fornece uma ide´ia da variabilidade dos
dados em torno da me´dia. Ela e´ o quociente entre a soma dos quadrados dos desvios dos
dados observados, tomados em relac¸a\u2dco a sua me´dia aritme´tica, e o nu´mero de dados (n)
menos 1. E´ representada por s2 quando os dados sa\u2dco oriundos de uma amostra e por \u3c32,
leia-se sigma ao quadrado, quando os dados representam a populac¸a\u2dco. Vamos ilustrar os
passos para o ca´lculo da varia\u2c6ncia atrave´s de um exemplo.
Exemplo. Vamos calcular a varia\u2c6ncia para os dados de uma amostra de tamanho,
n = 16, do dia\u2c6metro (em cm) da roseta foliar de brome´lias expostas ao sol. Os dados
amostrais obtidos foram:
5,4 5,4 5,8 6,4 6,4 6,6 6,6 6,8
6,8 7,0 7,3 7,3 7,5 8,2 8,8 8,8
Os passos para o ca´lculo da varia\u2c6ncia sa\u2dco dados na figura 2.30. Precisamos do valor da
me´dia aritme´tica dos dados, no exemplo temos x = 6, 94 cm. Apo´s sa\u2dco calculados os desvios
dos dados em relac¸a\u2dco a` me´dia, (xi\u2212x), onde x1 = 5, 4, x2 = 5, 4, x3 = 5, 8, ..., x16 = 8, 8; em
seguida estes desvios sa\u2dco elevados ao quadrado, (xi\u2212x)2. Finalmente, aplicamos a expressa\u2dco
da varia\u2c6ncia amostral que e´ dada por:
s2 =
(x1 \u2212 x¯)2 + (x2 \u2212 x¯)2 + ...+ (xn \u2212 x¯)2
n\u2212 1 =
\u2211n
i=1(xi \u2212 x¯)2
n\u2212 1 . (2.6)
No exemplo, com base nos resultados de 2.30, temos:
s2 =
15, 98
15
= 1, 065 cm2.
Foi tambe´m selecionada uma outra amostra de 16 valores de dia\u2c6metros da roseta foliar
de brome´lias em ambiente de sombra. Os resultados foram:
13,4 13,7 14,4 14,6 14,6 14,8 15,2 15,2
15,4 15,7 16,2 16,4 16,7 17,5 17,8 17,8
81
Para esses dados o valor da varia\u2c6ncia e´ s2 = 1, 893 cm2. Obtenha esse valor. A conclusa\u2dco
que podemos tirar e´ que, para a varia´vel dia\u2c6metro, as brome´lias em ambiente de sombra sa\u2dco
mais heteroge\u2c6neas (apresentam maior variabilidade) do que as expostas ao sol.
Para os dados de peso ao nascer de bezerros, representados na figura 2.11, obtemos
s2CH = 6, 92 kg
2 e s2G = 36, 48 kg
2, para as rac¸as Charoleza e Gir, respectivamente. Portanto,
a rac¸a Gir e´ muito mais heteroge\u2c6nea do que a rac¸a Charoleza, para peso no nascimento.
A varia\u2c6ncia apresenta um inconveniente de ordem pra´tica, pois como ela e´ expressa
em unidades ao quadrado, isto causa problemas de interpretac¸a\u2dco. Uma outra medida de
variabilidade, calculada atrave´s da varia\u2c6ncia, e´ o desvio padra\u2dco da amostra (s). Na pra´tica o
desvio padra\u2dco e´ preferido em relac¸a\u2dco a varia\u2c6ncia, pois ele e´ expresso na mesma unidade dos
dados originais. O desvio padra\u2dco nada mais e´ do que a ra´\u131z quadrada da varia\u2c6ncia, logo:
s =
\u221a
s2. (2.7)
Exemplo. Para os dados amostrais do dia\u2c6metro da roseta foliar de brome´lias, em cm,
expostas ao sol e em ambiente de sombra, os valores do desvio padra\u2dco sa\u2dco, sSol = 1, 032 cm
e sSombra = 1, 376 cm, respectivamente. O desvio padra\u2dco e´ uma medida relativa, assim, so´
faz sentido afirmar que um desvio e´ grande (ou pequeno) comparativamente a` outro. Nesse
exemplo, o desvio padra\u2dco para expostas ao sol e´ menor do que para ambiente de sombra.
Podemos dizer que, para expostas ao sol, a dispersa\u2dco dos valores em torno da me´dia e´, em
me´dia igual a 1,032 cm e, para ambiente de sombra, a dispersa\u2dco dos valores em torno da
me´dia e´, em me´dia, igual a 1,376 cm.
Existe uma expressa\u2dco mais geral para o ca´lculo da varia\u2c6ncia e desvio padra\u2dco dada por:
s2 =
\u2211k
i=1(xi \u2212 x¯)2ni
n\u2212 1 , (2.8)
onde k e´ o nu´mero de valores diferentes de xi; ni e´ a freque\u2c6ncia de ocorre\u2c6ncia do i-e´simo
valor. Para os dados de dia\u2c6metro de roseta expostas ao sol, tambe´m podemos calcular a
varia\u2c6ncia usando 2.8, da seguinte forma:
s2 =
(2× 2, 37) + (1× 1, 30) + (2× 0, 29) + (2× 0, 12) + ...+ (2× 3, 46)
16\u2212 1 = 1, 065 cm
2.
Em algumas situac¸o\u2dces, como por exemplo, quando a populac¸a\u2dco na\u2dco e´ muito grande, e´ pre-
fer´\u131vel realizar o censo, isto e´, obter as informac¸o\u2dces sobre todos os elementos, plantas, pessoas
etc. que constituem esta populac¸a\u2dco. Por exemplo, num estudo sobre a consanguinidade na
comunidade da Costa da Lagoa da Conceic¸a\u2dco, Floriano´polis, SC, foram levantados os dados
de todos os moradores (populac¸a\u2dco). Nesse caso temos a varia\u2c6ncia populacional, representada
82
por \u3c32, leia-se sigma ao quadrado, e e´ calculada atrave´s da expressa\u2dco:
\u3c32 =
\u2211N
i=1(xi \u2212 µ)2
N
, (2.9)
onde µ (leia-se \u201dmi\u201d) e´ calculada por: µ =
\u2211N
i=1 xi/N , e´ a me´dia obtida com todos os dados
da populac¸a\u2dco, N e´ o tamanho da populac¸a\u2dco, isto e´, o nu´mero total de dados. Da mesma
forma, o desvio padra\u2dco populacional e´ obtido atrave´s da ra´\u131z quadrada da varia\u2c6ncia e e´
representado por \u3c3.
O coeficiente de variac¸a\u2dco e´ utilizado quando temos interesse em comparar variabilidades
em situac¸o\u2dces onde as me´dias sa\u2dco muito diferentes ou as unidades de medida sa\u2dco diferentes.
Nesse caso, utilizamos o coeficiente de variac¸a\u2dco, pois e´ uma medida relativa percentual da
variabilidade dos dados em torno da me´dia, isto e´,
CV (%) =
s
x¯
× 100. (2.10)
E´ uma medida de dispersa\u2dco relativa porque estabelece uma relac¸a\u2dco entre o desvio padra\u2dco
(s), e a me´dia (x¯). Sendo uma