Buscar

Estatística para Análise de Dados na Administração Pública módulo 3

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Estatística para Análise de Dados na 
Administração Pública 
Questão 1 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Analise o script abaixo. 
 
library(tidyverse) 
 
#O objeto url abaixo indica onde está na internet a tabela com os dados sobre municípios 
brasileiros 
url<- 
"https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_
municipios.csv" 
 
#O comando read_csv permite ler para a sua máquina o conteúdo de uma tabela que está no 
endereço especificado no objeto url 
#o conteúdo da tabela é passado para o dataframe dados_municipios 
dados_municipios<- read_csv(url) 
 
dados_municipios%>% 
filter(sigla_uf == "CE") %>% 
select(sigla_uf,nome, populacao) %>% 
arrange(desc(populacao)) 
 
Qual o resultado da execução do script acima? 
Escolha uma opção: 
a. 
# A tibble: 185 x 3 
 
sigla_uf nome populacao 
# A tibble: 185 x 3 
 
sigla_uf nome populacao 
 
<chr> <chr> <dbl> 
1 PE Recife 1653461 
2 PE Jaboatão dos Guararapes 706867 
3 PE Olinda 393115 
4 PE Caruaru 365278 
5 PE Petrolina 354317 
6 PE Paulista 334376 
7 PE Cabo de Santo Agostinho 208944 
8 PE Camaragibe 158899 
9 PE Garanhuns 140577 
10 PE Vitória de Santo Antão 139583 
# ... with 175 more rows 
 
 
b. 
# A tibble: 184 x 2 
 
nome populacao 
 
<chr> <dbl> 
1 Fortaleza 2686612 
2 Caucaia 365212 
3 Juazeiro do Norte 276264 
4 Maracanaú 229458 
# A tibble: 184 x 2 
 
nome populacao 
5 Sobral 210711 
6 Crato 133031 
7 Itapipoca 130539 
8 Maranguape 130346 
9 Iguatu 103074 
10 Quixadá 88321 
# ... with 174 more rows 
 
 
c. 
# A tibble: 184 x 3 
 
sigla_uf nome populacao 
 
<chr> <chr> <dbl> 
1 CE Abaiara 11853 
2 CE Acarape 15036 
3 CE Acaraú 63104 
4 CE Acopiara 54481 
5 CE Aiuaba 17493 
6 CE Alcântaras 11781 
7 CE Altaneira 7650 
8 CE Alto Santo 17196 
9 CE Amontada 43829 
# A tibble: 184 x 3 
 
sigla_uf nome populacao 
10 CE Antonina do Norte 7378 
# ... with 174 more rows 
 
 
d. 
# A tibble: 369 x 3 
 
sigla_uf nome populacao 
 
<chr> <chr> <dbl> 
1 CE Fortaleza 2686612 
2 CE Recife 1653461 
3 CE Jaboatão dos Guararapes 706867 
4 CE Olinda 393115 
5 CE Caruaru 365278 
6 CE Caucaia 365212 
7 CE Petrolina 354317 
8 CE Paulista 334376 
9 CE Juazeiro do Norte 276264 
10 CE Maracanaú 229458 
# ... with 359 more rows 
 
 
e. 
# A tibble: 184 x 3 
 
sigla_uf nome populacao 
 
<chr> <chr> <dbl> 
1 CE Fortaleza 2686612 
2 CE Caucaia 365212 
3 CE Juazeiro do Norte 276264 
4 CE Maracanaú 229458 
5 CE Sobral 210711 
6 CE Crato 133031 
7 CE Itapipoca 130539 
8 CE Maranguape 130346 
9 CE Iguatu 103074 
10 CE Quixadá 88321 
# ... with 174 more rows 
 
 
Feedback 
Sua resposta está correta. 
 
A opção “e” corresponde aos filtros de coluna e linha aplicados no script, bem como traz os 
valores de população em ordem decrescente, tal como indicado no script. 
 
A resposta correta é: 
# A tibble: 184 x 3 
 
sigla_uf nome populacao 
 
<chr> <chr> <dbl> 
# A tibble: 184 x 3 
 
sigla_uf nome populacao 
1 CE Fortaleza 2686612 
2 CE Caucaia 365212 
3 CE Juazeiro do Norte 276264 
4 CE Maracanaú 229458 
5 CE Sobral 210711 
6 CE Crato 133031 
7 CE Itapipoca 130539 
8 CE Maranguape 130346 
9 CE Iguatu 103074 
10 CE Quixadá 88321 
# ... with 174 more rows 
 
Questão 2 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Execute o script indicado nesta atividade. Em seguida julgue as alternativas como verdadeiras 
ou falsas: 
 
#O objeto url abaixo indica onde está na internet a tabela com os dados sobre municípios 
brasileiros 
url<- 
"https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_
municipios.csv" 
 
#O comando read_csv permite ler para a sua máquina o conteúdo de uma tabela que está no 
endereço especificado no objeto url 
#o conteúdo da tabela é passado para o dataframe dados_municipios 
dados_municipios<- read_csv(url) 
 
 
dados_municipios%>% 
filter(sigla_uf != "DF") %>% 
group_by(sigla_uf) %>% 
summarise( 
media_populacao_municipios = mean(populacao) 
) %>% 
 
arrange(desc(media_populacao_municipios)) 
a. O estado de São Paulo possui a 
maior média de população dos seus 
municípios. 
Resposta 1
Falsa
 
b. O estado do Acre está entre os dez 
estados com maior média de 
população nos seus municípios. 
Resposta 2
Verdadeira
 
c. O Rio de Janeiro é o único estado 
que tem uma média de população dos 
seus municípios maior do que 
100.000 habitantes. 
Resposta 3
Verdadeira
 
d. Todos os 10 estados com maior 
média de população nos seus 
municípios têm essa média acima dos 
50.000 habitantes. 
Resposta 4
Falsa
 
e. A Bahia não aparece na lista dos 
dez estados com maior média de 
população por município. 
Resposta 5
Verdadeira
 
Feedback 
Sua resposta está correta. 
 
A afirmativa “a” é falsa – o estado do Rio de Janeiro ocupa a primeira posição. A opção “b” é 
verdadeira – o Acre é o décimo do ranking. A opção “c” é verdadeira – o Rio de Janeiro, com 
média de 188763 habitantes nos seus municípios, é o único com esta medida acima de 
100.000 habitantes. A opção “d” é falsa – CE, RR e AC possuem uma média inferior a 50.000 
habitantes. A opção “e” é verdadeira – a lista dos 10 estados compreende: RJ, SP, AM, PA, 
ES, PE, CE, RR, AC. 
 
A resposta correta é: a. O estado de São Paulo possui a maior média de população dos seus 
municípios. → Falsa, b. O estado do Acre está entre os dez estados com maior média de 
população nos seus municípios. → Verdadeira, c. O Rio de Janeiro é o único estado que tem 
uma média de população dos seus municípios maior do que 100.000 habitantes. → Verdadeira, 
d. Todos os 10 estados com maior média de população nos seus municípios têm essa média 
acima dos 50.000 habitantes. → Falsa, e. A Bahia não aparece na lista dos dez estados com 
maior média de população por município. → Verdadeira. 
Questão 3 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Gráficos de ranking em formato de barras horizontal ajudam você a identificar de forma rápida 
as ocorrências mais relevantes de uma dada variável categórica, tendo como referência 
alguma variável quantitativa. 
Assinale a alternativa que apresenta o gráfico que melhor descreve um ranking de população 
das 10 cidades mais populosas do Brasil: 
Escolha uma opção: 
a. 
 
 
b. 
 
 
c. 
 
 
d. 
 
 
e. 
Feedback 
Sua resposta está correta. 
 
O gráfico da alternativa “c” traz as dez cidades mais populosas do Brasil, como também lista os 
municípios em ordem decrescente de população. 
 
A resposta correta é: 
 
 
Questão 4 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Assinale a alternativa que apresenta o script que permite analisar a evolução da expectativa de 
vida no Brasil ao longo do tempo. 
Escolha uma opção: 
a. library(dados) 
library(tidyverse) 
dados_gapminder %>% 
filter(pais=="Brasil") %>% 
ggplot()+ 
geom_point(aes(x=pib_per_capita, y=expectativa_de_vida)) 
b. library(dados) 
library(tidyverse) 
dados_gapminder %>% 
filter(ano==2007) %>% 
slice_max(order_by = expectativa_de_vida, n=10) %>% 
mutate(pais = reorder(pais,expectativa_de_vida)) %>% 
ggplot()+ 
geom_col(aes(x=expectativa_de_vida, y=pais)) 
c. library(dados) 
library(tidyverse) 
dados_gapminder %>% 
filter(pais=="Brasil") %>% 
ggplot()+ 
geom_line(aes(x=ano, y=pib_per_capita)) 
d. library(dados) 
library(tidyverse) 
dados_gapminder %>% 
filter(pais=="Brasil") %>% 
ggplot()+ 
geom_line(aes(x=ano, y=expectativa_de_vida)) + 
geom_point(aes(x=ano, y=expectativa_de_vida )) 
e. library(dados) 
library(tidyverse) 
dados_gapminder %>% 
filter(pais=="Argentina") %>% 
ggplot()+ 
geom_point(aes(x=ano, y=expectativa_de_vida)) 
Feedback 
Sua resposta está correta. 
 
Na opção “d” é feito um filtro para que permaneçam apenas os dados do Brasil. O gráfico de 
linha possui o ano no eixo x e a expectativade vida no eixo y. 
 
A resposta correta é: library(dados) 
library(tidyverse) 
dados_gapminder %>% 
filter(pais=="Brasil") %>% 
ggplot()+ 
geom_line(aes(x=ano, y=expectativa_de_vida)) + 
geom_point(aes(x=ano, y=expectativa_de_vida )) 
Questão 5 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Observe atentamente o gráfico box-plot a seguir. 
 
Esse é o script que gerou o gráfico anterior: 
 
library(dados) 
library(tidyverse) 
dados_gapminder %>% 
mutate(ano = as.character(ano)) %>% 
ggplot() + 
geom_boxplot(aes(x=ano, y= expectativa_de_vida)) + 
scale_y_continuous(breaks=(seq(0,80,20))) + 
ylim(c(0,NA)) 
a. As linhas horizontais inferiores de 
cada um dos quadrados representam o 
primeiro quartil, ou seja, 25% dos 
valores de expectativa de vida dos 
países estão abaixo do valor 
Resposta 1
Verdadeira
 
representado por essa linha. 
b. As medianas não se alteram ao 
longo dos anos. 
Resposta 2
Falsa
 
c. Não são percebidos pontos extremos 
ao longo dos anos. 
Resposta 3
Falsa
 
d. Pode-se perceber que no eixo 
vertical foi aplicada a escala linear 
com os valores apresentados ao longo 
do eixo variando de 20 em 20 
unidades, não tendo sido necessário, 
portanto, o uso da escala logarítmica. 
Resposta 4
Verdadeira
 
e. A diferença entre a mediana e o 
terceiro quartil foi diminuindo ao 
longo dos anos. 
Resposta 5
Verdadeira
 
Feedback 
Sua resposta está correta. 
 
A primeira afirmação é verdadeira: a primeira linha horizontal num box-plot de fato marca o 
primeiro quartil. 
 
A segunda é falsa: as medianas aumentam ao longo dos anos. A terceira afirmativa é falsa: o 
gráfico apresenta um ponto extremo inferior no ano de 1992. A quarta é verdadeira: não foi 
preciso usar a escala logarítmica para o eixo vertical já que a amplitude, diferença entre os 
valores mínimos e máximos, em cada ano não apresenta valor muito elevado. A última 
informação é verdadeira: nos primeiros anos a mediana era mais próxima do primeiro quartil, 
porém os últimos anos disponíveis já mostram que a mediana se aproxima cada vez mais do 
terceiro quartil. 
 
A resposta correta é: a. As linhas horizontais inferiores de cada um dos quadrados 
representam o primeiro quartil, ou seja, 25% dos valores de expectativa de vida dos países 
estão abaixo do valor representado por essa linha. → Verdadeira, b. As medianas não se 
alteram ao longo dos anos. → Falsa, c. Não são percebidos pontos extremos ao longo dos 
anos. → Falsa, d. Pode-se perceber que no eixo vertical foi aplicada a escala linear com os 
valores apresentados ao longo do eixo variando de 20 em 20 unidades, não tendo sido 
necessário, portanto, o uso da escala logarítmica. → Verdadeira, e. A diferença entre a 
mediana e o terceiro quartil foi diminuindo ao longo dos anos. → Verdadeira. 
Questão 6 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
O script abaixo gera um histograma que mostra a distribuição da quantidade de países de 
acordo com a renda per capita em dólares. 
 
library(dados) 
library(tidyverse) 
 
dados_gapminder %>% 
 
filter(ano==2007) %>% 
ggplot() + 
geom_histogram(aes(x= pib_per_capita), color="white") + 
scale_y_continuous(breaks = c(seq(0,10,1)))+ 
scale_x_log10() 
 
De acordo com o que está escrito no código e com o gráfico gerado, assinale a alternativa 
correta. 
Escolha uma opção: 
a. A figura mostra a distribuição de “pib_per_capita” para todos os anos disponíveis na tabela. 
b. Existe apenas um país com “pib_per_capita” menor do que 300 dólares. 
c. Não existem países com “pib_per_capita” maior do que 30000 dólares. 
d. O gráfico não utiliza escala logarítmica no eixo x. 
e. Existem vinte países com renda “per_capita_menor” do que 1000 dólares. 
Feedback 
Sua resposta está correta. 
 
A alternativa correta é a letra “b”, pois o gráfico de histograma revela apenas uma ocorrência à 
esquerda do valor 300 dólares. 
 
A resposta correta é: Existe apenas um país com “pib_per_capita” menor do que 300 dólares. 
Questão 7 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
O código abaixo inclui a leitura de uma tabela sobre cidades brasileiras no ano 2020. Entre 
outras variáveis estão presentes a população e o percentual do gasto municipal com saúde. 
Além disso, todo o código também gera um gráfico que mostra uma associação entre duas 
variáveis e o coeficiente de correlação. Analise com atenção. 
 
library(tidyverse) 
 
url<- 
"https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_s
aude_municipio.csv" 
 
dados_saude_municipio<- 
read_csv(url) 
 
dados_saude_municipio%>% 
ggplot()+ 
geom_point(aes(x=populacao, y=perc))+ 
scale_x_log10() 
cor(log10(dados_saude_municipio$populacao), dados_saude_municipio$perc) 
 
Sobre a execução do código no programa RStudio, é possível afirmar que: 
Escolha uma opção: 
a. O código usa escala logarítmica no eixo Y. 
b. Pelo gráfico gerado percebe-se uma forte inclinação positiva (quanto maior a população 
maior o percentual gasto com saúde) que é corroborado pelo coeficiente de correlação 
calculado cujo valor é maior que 0.9. 
c. O coeficiente de correlação calculado ao final do código indica uma correlação desprezível 
entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o gráfico. 
d. Há uma correlação negativa entre população e percentual gasto com saúde. 
e. Como a correlação mediu um valor entre 0.5 e 0.7, há uma associação moderada entre as 
duas variáveis. 
Feedback 
Sua resposta está correta. 
 
O coeficiente de correlação medido é de 0.1117601, o que é considerado desprezível, portanto 
a alternativa correta é a letra “c”. 
 
A resposta correta é: O coeficiente de correlação calculado ao final do código indica uma 
correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se 
analisar o gráfico. 
Questão 8 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
O código abaixo trabalha com a mesma tabela da questão anterior, só que agora se dedica a 
analisar a associação entre população e o valor gasto com saúde. 
 
library(tidyverse) 
 
url<- 
"https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_s
aude_municipio.csv" 
 
dados_saude_municipio<- 
read_csv(url) 
 
dados_saude_municipio%>% 
ggplot()+ 
geom_point(aes(x=populacao, y=valor))+ 
scale_x_log10() + 
scale_y_log10() 
cor(log10(dados_saude_municipio$populacao), log10(dados_saude_municipio$valor)) 
 
Sobre a execução do código no programa RStudio, é possível afirmar que: 
Escolha uma opção: 
a. O código não usa escala logarítmica. 
b. Pelo gráfico gerado percebe-se uma forte inclinação positiva (quanto maior a população 
maior o percentual gasto com saúde) que é corroborado pelo coeficiente de correlação 
calculado cujo valor é maior que 0.9. 
c. O coeficiente de correlação calculado ao final do código indica uma correlação desprezível 
entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o gráfico. 
d. Há uma correlação negativa entre população e valor gasto com saúde. 
e. Como a correlação mediu um valor entre 0.5 e 0.7 há uma associação moderada entre as 
duas variáveis. 
Feedback 
Sua resposta está correta. 
 
O gráfico revela uma inclinação fortemente positiva com um coeficiente de correlação medido 
em 0.9449733, portanto a alternativa correta é a letra “b”. 
 
A resposta correta é: Pelo gráfico gerado percebe-se uma forte inclinação positiva (quanto 
maior a população maior o percentual gasto com saúde) que é corroborado pelo coeficiente de 
correlação calculado cujo valor é maior que 0.9.

Continue navegando