Buscar

Lista 1 B2023 - Casa gabarito

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

MAE0116 – Noções de Estatística
Lista de exercícios 1 – Estatística Descritiva I – Casa (Gabarito)
Exercício 1
(2,5 pontos)
O Hospital X realizou um estudo para comparar dois tratamentos (A e B) utilizados no controle do
colesterol. Um grupo de 200 pacientes recebeu o tratamento A, enquanto que um outro grupo de 200
pacientes recebeu o tratamento B. Todos os 400 pacientes possuiam níveis altos de colesterol antes
do início do tratamento. Após 3 meses de tratamento, o nível de colesterol total (mg/dL) de todos os
pacientes foi medido. A análise desses dados mostrou que:
• No grupo A, os níveis de colesterol variaram entre 160 mg/dL e 260 mg/dL, com média igual a
200 mg/dL e coeficiente de variação (CV) igual a 10%. Verificou-se que, no grupo A, metade
dos pacientes tem nível de colesterol de até 195 mg/dL e que 25% tem nível de colesterol abaixo
de 180 mg/dL.
• No grupo B, os níveis de colesterol variaram entre 180 mg/dL e 300 mg/dL, com média igual
a 240 mg/dL e coeficiente de variação (CV) igual a 12%, sendo que metade dos pacientes
deste grupo tem nível de colesterol de até 230 mg/dL e que 75% tem colesterol abaixo de 270
mg/dL. Verificou-se também que 10% dos pacientes apresentam nível de colesterol maior que
280 mg/dL no grupo B.
(a) (0,5) A qual medida descritiva se refere a frase: ’Verificou-se também que 10% dos paci-
entes apresentam nível de colesterol maior que 280 mg/dL no grupo B?
Resolução. Note que a medida comentada no texto divide os dados entre 90% dos pacientes
do grupo B que apresentaram níveis de colesterol abaixo de 280 mg/dL e 10% dos pacientes
do grupo B que apresentaram níveis de colesterol acima de 280 mg/dL. Portanto, se refere ao
percentil 90.
(b) (1,0) Complete a tabela a seguir com os dados dos grupos A e B:
Grupo Média Desvio Padrão CV (%) Min Q1 Mediana Q3 Máx
A 220
B 195
1
Resolução.
Primeiramente, vamos completar os dados do grupo A:
Com base no texto, temos a informação de que os dados variam entre 160 (valor mínimo) e 260
(valor máximo) com média igual a 200. Denote por x̄A e sA a média e o desvio padrão amostral
dos níveis de colesterol, respectivamente. Temos que o CV é dado por:
CVA =
sA
x̄A
= 0, 10
Como temos informação sobre a média e o CV, podemos então encontrar o valor do desvio
padrão utilizando a seguinte relação:
sA = CVA × x̄A = 0, 10× 200 = 20
A mediana é o valor que divide os dados ordenados em dois conjuntos de mesmo tamanho,
portanto, igual a 195 mg/dL. . Já o primeiro quartil divide os dados entre 25% dos níveis de
colesterol mais baixos e 75% dos níveis de colesterol mais altos, portanto, igual a 180 mg/dL.
Agora, vamos completar os dados do grupo B:
Com base no texto, temos a informação de que os dados variam entre 180 (valor mínimo) e 300
(valor máximo) com média igual a 240. Denote por x̄B e sB a média e o desvio padrão amostral
dos níveis de colesterol, respectivamente. Temos que o CV é dado por:
CVB =
sB
x̄B
= 0, 12
Como temos informação sobre a média e o CV, podemos então encontrar o valor do desvio
padrão utilizando a seguinte relação:
sB = CVB × x̄A = 0, 12× 240 = 28, 8
A mediana é o valor que divide os dados ordenados em dois conjuntos de mesmo tamanho,
portanto, igual a 230 mg/dL. Já o terceiro quartil divide os dados entre 75% dos níveis de
colesterol mais baixos e 25% dos níveis de colesterol mais altos, portanto, igual a 270 mg/dL.
Assim, a tabela completa é dada por:
Grupo Média Desvio Padrão CV (%) Min Q1 Mediana Q3 Máx
A 200 20 10 160 180 195 220 260
B 240 28,8 12 180 195 230 270 300
2
(c) (0,5) Com base nos coeficientes de variação dos grupos A e B, discuta qual grupo de
pacientes apresenta menor variabilidade nos níveis de colesterol após o tratamento.
Resolução.
O grupo A apresenta menor variabilidade nos níveis de colesterol, pois possui um coeficiente
de variação (CV) de 10%, enquanto o grupo B possui um CV de 12%. Quanto menor o valor do
CV, menor é a variabilidade dos dados em torno da média, o que indica maior homogeneidade
nos níveis de colesterol no grupo A.
(d) (0,5) Qual dos dois tratamentos parece ser o mais eficiente? Justifique.
Resolução. O tratamento A parece ser mais eficiente, pois além de apresentar maior homogenei-
dade nos níveis de colesterol entre os pacientes, nota-se que os níveis de colesterol são menores no
grupo A do que os níveis de colesterol do grupo B, com base nas estatísticas descritivas.
Exercício 2
(2,5 pontos)
Uma clínica especializada em fisioterapia está realizando um estudo sobre o tempo de recuperação
de seus pacientes após sofrerem determinadas lesões. Para isso, analisaram o número de meses de
tratamento (X) até a completa recuperação de 180 pacientes que realizam 10 sessões de fisioterapia
por mês. Os dados coletados são os seguintes:
Número de meses de fisioterapia (x) ni
1 80
2 50
3 35
4 10
5 5
(a) (0,5) Qual é a variável de interesse do estudo? Classifique-a.
Resolução. A variável de interesse do estudo é o número de meses meses de tratamento até a
completa recuperação dos pacientes, representado por "X". Observe que temos uma contagem,
logo podemos caracterizar a variável X como sendo uma variável quantitativa discreta.
(b) (1,0) Calcule a média, a mediana, a moda, a variância e o desvio padrão do número de
meses de fisioterapia dos pacientes. (Utilize 3 casas decimais no cálculo da média e da
variância)
3
Resolução.
Média:
Como os valores observados se repetem, a média pode ser calculada da seguinte forma:
x̄ =
5∑
i=1
xi × ni
n
=
1× 80 + 2× 50 + 3× 35 + 4× 10 + 5× 5
80 + 50 + 35 + 10 + 5
≈ 1, 944 meses,
ou seja, em média, os pacientes fazem fisioterapia por cerca de 1,944 meses.
Mediana:
Para calcularmos a mediana neste caso, precisamos primeiro obter a posição da mediana que é
dada por 0,5 × (n + 1) = 0,5 × 181 = 90,5. Logo, a mediana será a média aritmética entre os
valores das posições 90 e 91 dos dados ordenados. Note que a tabela já apresenta os dados de
forma ordenada, e que as obervações 90 e 91 são iguais a 2 meses de fisioterapia. Portanto:
Md =
2 + 2
2
= 2
Moda:
A moda é o valor que ocorre com maior frequência nos dados. Neste caso, a moda é 1 mês,
pois esse valor aparece com maior frequência (80 vezes).
Variância:
Pela fórmula da variância, temos:
s2 =
∑n
i=1(xi − x̄)2
n− 1
Observe que neste caso em particular, fazemos 80 vezes a diferença (1 − 1, 944)2 , 50 vezes a
diferença (2− 1, 944)2 , e assim sucessivamente. Então, podemos reescrever a nossa expressão
para o cálculo da variância amostral como sendo:
s2 =
∑5
i=1 ni(xi − x̄)2
n− 1
= 80×(1−1,944)
2+50×(2−1,944)2+35×(3−1,944)2+10×(4−1,944)2+5×(5−1,944)2
180−1
≈ 1, 114 (meses)2
Desvio-padrão:
s =
√
1, 114 ≈ 1, 055 meses
4
(c) (1,0) A clínica tem interesse em saber o custo mensal por paciente que sofreu lesões e que
realiza 10 sessões de fisioterapia por mês. Suponha, para simplificar, que a clínica possui
um gasto fixo mensal por paciente de R$ 200,00 e mais R$ 40,00 por sessão. Desta forma,
tem-se que o custo mensal por paciente é dado por c = 200 + 400x. Calcule a média, a
mediana, a moda, a variância e o desvio padrão do custo mensal por paciente.(Utilize 2
casas decimais para calcular a média e a variância)
Resolução.
Número de meses de fisioterapia (x) ni Custo (ci)
1 80 200 + 400× 1 = 600
2 50 200 + 400× 2 = 1000
3 35 200 + 400× 3 = 1400
4 10 200 + 400× 4 = 1800
5 5 200 + 400× 5 = 2200
Média:
c̄ =
5∑
i=1
ci × ni
n
=
80× 600 + 50× 1000 + 35× 1400 + 10× 1800 + 5× 2200
180
≈ 977, 78 reais,
ou seja, a média do custo mensal por paciente é de cerca de R$977,78.
Mediana:
Para calcularmos a mediana neste caso, precisamos primeiro obter a posição da mediana que é
dada por 0,5 × (n + 1) = 0,5 × 181 = 90,5. Logo:
Mc =
1000 + 1000
2
= 1000
Assim, metade do custo mensal por paciente foi de até R$ 1000.
Moda:
A moda de c é o valor do custo mais frequente. Logo, a moda é R$ 600.
Variância:
Pela fórmula da variância, temos:
s2 =
∑5
i=1 ni(ci − c̄)2
n− 1
= 80×(600−977,78)
2+50×(1000−977,78)2+35×(1400−977,78)2+10×(1800−977,78)2+5×(2200−977,78)2180−1
≈ 178247, 36 (reais)2
Desvio-padrão:
5
s =
√
178247, 36 ≈ 422, 19 reais
Formas alternativas para o cálculo da média e do desvio padrão de uma variável y = a + bx:
A seguir apresentamos uma forma alternativa para o cálculo da média e do desvio padrão para o
item (c), levando em consideração as propriedades desssas medidas.
Pode-se mostrar que se c = a + bx, então c̄ = a + bx̄. Além disso, s2c = b
2s2x, bem como
sc = bsx. Portanto, voltando ao nosso exemplo e sendo c = 200+400x, teremos que c̄ = 200+400x̄,
s2c = 400
2s2x e sc = 400sx. Logo:
c̄ = 200 + 400× x̄ = 200 + 400× 1, 944 = 977, 6,
s2c = 400
2s2x ≈ 178240
sc ≈ 422, 18
Obs.: os valores diferem ligeriramente por causa das aproximações.
Também considerar a versão em que c = 600x. Então, temos:
Número de meses de fisioterapia (x) ni Custo (ci)
1 80 600× 1 = 600
2 50 600× 2 = 1200
3 35 600× 3 = 1800
4 10 600× 4 = 2400
5 5 600× 5 = 3000
Média:
c̄ =
5∑
i=1
ci × ni
n
=
80× 600 + 50× 1200 + 35× 1800 + 10× 2400 + 5× 3000
180
≈ 1166, 67 reais,
ou seja, a média do custo mensal por paciente é de cerca de R$1166,67.
Mediana:
Para calcularmos a mediana neste caso, precisamos primeiro obter a posição da mediana que é
dada por 0,5 × (n + 1) = 0,5 × 181 = 90,5. Logo:
Mc =
1200 + 1200
2
= 1200
Assim, metade do custo mensal por paciente foi de até R$ 1200.
6
Moda:
A moda de c é o valor do custo mais frequente. Logo, a moda é R$ 600.
Variância:
Pela fórmula da variância, temos:
s2 =
∑5
i=1 ni(ci − c̄)2
n− 1
= 80×(600−1166,67)
2+50×(1200−1166,67)2+35×(1800−1166,67)2+10×(2400−1166,67)2+5×(3000−1166,67)2
180−1
≈ 401117, 32 (reais)2
Desvio-padrão:
s =
√
401117, 32 ≈ 633, 34 reais
Formas alternativas para o cálculo da média e do desvio padrão de uma variável y = a + bx:
A seguir apresentamos uma forma alternativa para o cálculo da média e do desvio padrão para o
item (c), levando em consideração as propriedades desssas medidas.
Pode-se mostrar que se c = a+ bx, então c̄ = a+ bx̄. Além disso, s2c = b
2s2x, bem como sc = bsx.
Portanto, voltando ao nosso exemplo e sendo c = 600x, teremos que c̄ = 600x̄, s2c = 600
2s2x e
sc = 600sx. Logo:
c̄ = 600× x̄ = 600× 1, 944 = 1166, 4,
s2c = 600
2s2x ≈ 401040
sc ≈ 633, 28
Obs.: os valores diferem ligeriramente por causa das aproximações.
Exercício 3
(2,5 pontos)
A tabela a seguir apresenta dados do lucro, em milhares de reais, de 13 comerciantes de uma
região:
Comerciante 1 2 3 4 5 6 7 8 9 10 11 12 13
Lucro 28,5 32,2 29,8 24,6 33,9 27,2 52,1 30,0 29,3 31,8 25,9 24,8 28,7
7
(a) (1,0) Calcule a média, a mediana, o desvio padrão e os quartis. Considere 2 casas decimais.
Resolução.
Média:
x̄ =
1
n
n∑
i=1
xi
=
(28, 5 + 32, 2 + 29, 8 + 24, 6 + 33, 9 + 27, 2 + 52, 1 + 30, 0 + 29, 3 + 31, 8 + 25, 9 + 24, 8 + 28, 7)
13
≈ 30, 68
ou seja, o lucro médio dos comerciantes foi de 30,68 mil reais.
Mediana:
A primeira coisa que devemos fazer é ordenar os dados:
24,6 24,8 25,9 27,2 28,5 28,7 29,3 29,8 30,0 31,8 32,2 33,9 52,1
Em seguida, calculamos a posição da mediana nos dados ordenados:
n+ 1
2
=
13 + 1
2
= 7
Assim, a mediana será igual ao sétimo valor ordenado, portanto, igual a 29,3 mil reais.
Desvio-padrão:
O desvio padrão corresponde à raiz quadrada da variância,
s =
√√√√ 1
n− 1
n∑
i=1
(xi − x̄)2
=
√
1
12 [(24,6−30,68)
2+(24,8−30,68)2+(25,9−30,68)2+(27,2−30,68)2+(28,5−30,68)2+...+(52,1−30,68)2]
≈ 7, 02 mil reais
Quartis:
Os quartis são obtidos quando dividimos o conjunto de dados ordenados em quatro partes
iguais. Os três quartis resultantes correspondem aos percentis 25, 50 e 75 que ocupam as
posições p× (n+ 1), com p = 0, 25, p = 0, 50 e p = 0, 75, respectivamente.
Dados ordenados:
24,6 24,8 25,9 27,2 28,5 28,7 29,3 29,8 30,0 31,8 32,2 33,9 52,1
8
• Primeiro Quartil:
Q1 = Percentil 25 ⇒ posição 0, 25× (13 + 1) = 3,5 ⇒ Q1 = (25,9 + 27,2)/2 = 26,55.
Assim, 25% dos comerciantes obtiveram um lucro de até 26,55 mil reais.
• Segundo Quartil:
Q2 = Percentil 50 = Mediana (já calculada).
Assim, 50% dos comerciantes obtiveram um lucro de até 29,3 mil reais.
• Terceiro Quartil:
Q3 = Percentil 75 ⇒ posição 0,75×(13 + 1) = 10,5 ⇒ Q3 = (31,8 + 32,2)/2 = 32.
Assim, 75% dos comerciantes obtiveram um lucro de até 32 mil reais.
(b) (1,5) Note que o comerciante 7 apresenta um lucro atípico. Remova esse valor e refaça o
item anterior. Comente as diferenças encontradas. Considere 2 casas decimais.
Resolução.
Média:
x̄ =
1
n
n∑
i=1
xi
=
(28, 5 + 32, 2 + 29, 8 + 24, 6 + 33, 9 + 27, 2 + 30, 0 + 29, 3 + 31, 8 + 25, 9 + 24, 8 + 28, 7)
12
≈ 28, 89
ou seja, com a exclusão do comerciante 7, o lucro médio dos comerciantes foi de cerca de 28,89
mil reais. Assim, a retirada do valor do comerciante 7 provocou uma redução na média do lucro anual
de quase de 2 mil reais.
Mediana:
A primeira coisa que devemos fazer é ordenar os dados:
24,6 24,8 25,9 27,2 28,5 28,7 29,3 29,8 30,0 31,8 32,2 33,9
Em seguida, calculamos a posição da mediana nos dados ordenados:
n+ 1
2
=
12 + 1
2
= 6, 5
Como n = 12 é par, a mediana será dada pela média dos valores das duas observações centrais,
isto é, os valores que ocupam as posições 6 e 7 nos dados ordenados. Assim, temos que,
Md =
28, 7 + 29, 3
2
= 29
Desvio-padrão:
9
O desvio padrão corresponde à raiz quadrada da variância,
s =
√√√√ 1
n− 1
n∑
i=1
(xi − x̄)2
=
√
1
11 [(24,6−28,89)
2+(24,8−28,89)2+(25,9−28,89)2+(27,2−28,89)2+(28,5−28,89)2+...+(33,9−28,89)2]
≈ 2, 92 mil reais
A exclusão do comerciante 7 provocou uma redução no desvio padrão de mais de 4 mil reais.
Quartis:
Os quartis são obtidos quando dividimos o conjunto de dados ordenados em quatro partes iguais.
Os três quartis resultantes correspondem aos percentis 25, 50 e 75 que ocupam as posições p×(n+1),
com p = 0, 25, p = 0, 50 e p = 0, 75, respectivamente.
Dados ordenados:
24,6 24,8 25,9 27,2 28,5 28,7 29,3 29,8 30,0 31,8 32,2 33,9
• Primeiro Quartil:
Q1 = Percentil 25 ⇒ posição 0, 25× (12 + 1) = 3,25 ⇒ Q1 = (25,9 + 27,2)/2 = 26,55.
Assim, com a exclusão do comerciante 7, 25% dos comerciantes obtiveram um lucro de até 26,55
mil reais. O primeiro quartil não sofreu alteração com a exclusão do comerciante 7.
• Segundo Quartil:
Q2 = Percentil 50 = Mediana (já calculada).
Assim, 50% dos comerciantes obtiveram um lucro de até 29 mil reais. A mediana sofre uma
alteração de R$300,00.
• Terceiro Quartil:
Q3 = Percentil 75 ⇒ posição 0,75×(12 + 1) = 9,75 ⇒ Q3 = (30 + 31,8)/2 = 30,9.
Assim, 75% dos comerciantes obtiveram um lucro de até 30,9 mil reais. Em relação ao item
anterior, a exclusão do comerciante 7 provocou uma redução no terceiro quartil de 1,1 mil reais.
Comentários gerais:
Podemos observar que a média e a mediana dos dados são mais próximas quando a observação
7 é retirada (item (b)). Com a presença desta observação discrepante (item (a)), note que a média se
afasta um pouco da mediana. Este exemplo ilustra o fato de que a média é influenciada por valores
atípicos. A maior diferença que podemos observar entre os itens está relacionada ao desvio padrão,
que passou de 7,02 para 2,92 com a remoção da observação 7. Essa redução do desvio padrão já
era esperada, pois o conjunto de dados com a presença da observação discrepante possui uma maior
variabilidade do que quando a retiramos.
10
Exercício 4
(2,5 pontos)
Um estudo analisou a concentração, em mg/kg, de chumbo nos sedimentos do rio Amazonas em
45 diferentes locais de coleta entre as cidades de Manaus/AM e Santarém/PA. As amostras foram
colhidas nas estações de inverno e verão. Os resultados do estudo estão resumidos na Tabela a seguir:
Tabela 1: Estatísticas descritivas do estudo.
Estação n Média Desvio Padrão Min Q1 Mediana Q3 Máx
Inverno 45 21,35 6,78 8,14 15,56 19,87 25,43 35,91
Verão 45 31,78 9,22 17,89 27,14 30,75 36,98 52,77
(a) (0,25) Quais são as variáveis do estudo? Classifique-as.
Resolução.
Para cada estação, estamos interessados em analisar a concentração de chumbo nos sedimentos
ao longo dos 45 locais de coleta. Portanto, temos as seguintes variáveis:
• Concentração,que corresponde a uma variável quantitativa contínua;
• Estação, que corresponde a uma variável qualitativa nominal formada pelas categorias inverno
e verão.
(b) (0,5) 50% das observações coletadas na estação de inverno apresentam concentração de
chumbo inferior a qual valor? E se considerarmos 75% das observações?
Resolução.
Note que o valor que divide os dados em 50% é a mediana. Com base na Tabela 1, observa-se
que 50% das observações coletadas na estação de inverno apresentam concentração inferior ou
igual a 19,87 mg/kg. Já o valor que divide os dados no percentil 75% corresponde ao terceiro
quartil. Neste caso, observa-se na Tabela 1 que 75% das observações coletadas na estação
inverno apresentam concentração de chumbo inferior ou igual a 25,43 mg/kg.
(c) (0,5) 25% das observações coletadas na estação de verão apresentam concentração de
chumbo superior a qual valor? E se considerarmos 75%?
Resolução.
Podemos observar na Tabela 1 que 25% das observações coletadas na estação verão apresentam
concentração de chumbo superior ou igual a 36,98 mg/kg (terceiro quartil), enquanto que 75%
das observações coletadas na estação verão apresentam concentração de chumbo superior ou
igual a 27,14 mg/kg (primeiro quartil).
11
(d) (0,5) Utilizando o desvio padrão, compare as duas estações quanto à homogeneidade.
Resolução. Note que para a estação de inverno temos um desvio padrão de 6,78 mg/kg, e para
a estação de verão o desvio padrão é de 9,22 mg/kg. Logo, observando esses dois valores, po-
demos concluir que a estação de inverno é mais homogênea quanto à concentração de chumbo,
pois apresenta uma menor dispersão absoluta.
(e) (0,5) Calcule o coeficiente de variação para cada estação. A conclusão é a mesma do item
anterior? Qual é a medida de variabilidade mais adequada? Justifique.
Resolução.
O coeficiente de variação (CV) é obtido como a razão entre o desvio padrão e a média. Denote
por s1 e x̄1, o desvio padrão e a média da concentração de chumbo coletada na estação de
inverno, e por s2 e x̄2, o desvio padrão e a média da concentração de chumbo coletada na
estação de verão. Com base na Tabela 1, temos que:
• CV para a estação de inverno:
CV1 =
s1
x̄1
=
6, 78
21, 35
≈ 0, 3176 = 31, 76%
• CV para a estação de verão:
CV2 =
s2
x̄2
=
9, 22
31, 78
≈ 0, 2901 = 29, 01%
Logo, com base no coeficiente de variação podemos concluir que a estação de verão é mais ho-
mogênea (possui menor variação em relação à média) em relação às concentrações de chumbo.
Note que a conclusão difere de quando usado o desvio padrão. A medida de dispersão mais
adequada para comparar dois (ou mais) grupos é o CV, pois este nos fornece uma medida de
variabilidade relativa à média. Além disso, o CV elimina o efeito de magnitude dos dados e
corresponde a uma medida adimensional.
(f) (0,25) Você diria que a concentração de chumbo está associada à estação de coleta? Justi-
fique.
Resolução.
Com base nas estatísticas descritivas apresentadas na Tabela 1, nota-se que as concentrações ob-
servadas na estação de verão são maiores do que as concentrações coletadas na estação de inverno.
Assim, as medidas sugerem que há uma relevante diferença nas concentrações de chumbo compa-
rando as duas estações, e portanto, existe a indicação de associação entre as variáveis.
12

Continue navegando