Prévia do material em texto
Iniciado em domingo, 24 set. 2023, 16:03 Estado Finalizada Concluída em domingo, 24 set. 2023, 16:10 Tempo empregado 7 minutos 12 segundos Notas 5,00/8,00 Avaliar 15,63 de um máximo de 25,00(62,5%) S l i idi Questão 1 Incorreto Atingiu 0,00 de 1,00 Analise o script abaixo. library(tidyverse) #O objeto url abaixo indica onde está na internet a tabela com os dados sobre municípios brasileiros url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv" #O comando read_csv permite ler para a sua máquina o conteúdo de uma tabela que está no endereço especi�cado no objeto url #o conteúdo da tabela é passado para o dataframe dados_municipios dados_municipios<- read_csv(url) dados_municipios%>% �lter(sigla_uf == "CE") %>% select(sigla_uf,nome, populacao) %>% arrange(desc(populacao)) Qual o resultado da execução do script acima? Escolha uma opção: a. # A tibble: 185 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 PE Recife 1653461 2 PE Jaboatão dos Guararapes 706867 3 PE Olinda 393115 4 PE Caruaru 365278 5 PE Petrolina 354317 6 PE Paulista 334376 7 PE Cabo de Santo Agostinho 208944 8 PE Camaragibe 158899 9 PE Garanhuns 140577 10 PE Vitória de Santo Antão 139583 # ... with 175 more rows b. # A tibble: 184 x 2 nome populacao <chr> <dbl> 1 Fortaleza 2686612 2 Caucaia 365212 3 Juazeiro do Norte 276264 4 Maracanaú 229458 5 Sobral 210711 6 Crato 133031 7 Itapipoca 130539 8 Maranguape 130346 9 Iguatu 103074 10 Quixadá 88321 # ... with 174 more rows Selecione o idioma Powered by Tradutor https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv https://translate.google.com/ c. # A tibble: 184 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 CE Abaiara 11853 2 CE Acarape 15036 3 CE Acaraú 63104 4 CE Acopiara 54481 5 CE Aiuaba 17493 6 CE Alcântaras 11781 7 CE Altaneira 7650 8 CE Alto Santo 17196 9 CE Amontada 43829 10 CE Antonina do Norte 7378 # ... with 174 more rows d. # A tibble: 369 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 CE Fortaleza 2686612 2 CE Recife 1653461 3 CE Jaboatão dos Guararapes 706867 4 CE Olinda 393115 5 CE Caruaru 365278 6 CE Caucaia 365212 7 CE Petrolina 354317 8 CE Paulista 334376 9 CE Juazeiro do Norte 276264 10 CE Maracanaú 229458 # ... with 359 more rows e. # A tibble: 184 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 CE Fortaleza 2686612 2 CE Caucaia 365212 3 CE Juazeiro do Norte 276264 4 CE Maracanaú 229458 5 CE Sobral 210711 6 CE Crato 133031 7 CE Itapipoca 130539 8 CE Maranguape 130346 9 CE Iguatu 103074 10 CE Quixadá 88321 # ... with 174 more rows Sua resposta está incorreta. A opção “e” corresponde aos �ltros de coluna e linha aplicados no script, bem como traz os valores de população em ordem decrescente, tal como indicado no script. A resposta correta é: # A tibble: 184 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 CE Fortaleza 2686612 2 CE Caucaia 365212 3 CE Juazeiro do Norte 276264 4 CE Maracanaú 229458 5 CE Sobral 210711 6 CE Crato 133031 7 CE Itapipoca 130539 8 CE Maranguape 130346 9 CE Iguatu 103074 10 CE Quixadá 88321 # ... with 174 more rows Questão 2 Parcialmente correto Atingiu 0,20 de 1,00 Execute o script indicado nesta atividade. Em seguida julgue as alternativas como verdadeiras ou falsas: #O objeto url abaixo indica onde está na internet a tabela com os dados sobre municípios brasileiros url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv" #O comando read_csv permite ler para a sua máquina o conteúdo de uma tabela que está no endereço especi�cado no objeto url #o conteúdo da tabela é passado para o dataframe dados_municipios dados_municipios<- read_csv(url) dados_municipios%>% �lter(sigla_uf != "DF") %>% group_by(sigla_uf) %>% summarise( media_populacao_municipios = mean(populacao) ) %>% arrange(desc(media_populacao_municipios)) a. O estado de São Paulo possui a maior média de população dos seus municípios. b. O estado do Acre está entre os dez estados com maior média de população nos seus municípios. c. O Rio de Janeiro é o único estado que tem uma média de população dos seus municípios maior do que 100.000 habitantes. d. Todos os 10 estados com maior média de população nos seus municípios têm essa média acima dos 50.000 habitantes. e. A Bahia não aparece na lista dos dez estados com maior média de população por município. Verdadeira Falsa Falsa Verdadeira Verdadeira Sua resposta está parcialmente correta. Você selecionou corretamente 1. A a�rmativa “a” é falsa – o estado do Rio de Janeiro ocupa a primeira posição. A opção “b” é verdadeira – o Acre é o décimo do ranking. A opção “c” é verdadeira – o Rio de Janeiro, com média de 188763 habitantes nos seus municípios, é o único com esta medida acima de 100.000 habitantes. A opção “d” é falsa – CE, RR e AC possuem uma média inferior a 50.000 habitantes. A opção “e” é verdadeira – a lista dos 10 estados compreende: RJ, SP, AM, PA, ES, PE, CE, RR, AC. A resposta correta é: a. O estado de São Paulo possui a maior média de população dos seus municípios. → Falsa, b. O estado do Acre está entre os dez estados com maior média de população nos seus municípios. → Verdadeira, c. O Rio de Janeiro é o único estado que tem uma média de população dos seus municípios maior do que 100.000 habitantes. → Verdadeira, d. Todos os 10 estados com maior média de população nos seus municípios têm essa média acima dos 50.000 habitantes. → Falsa, e. A Bahia não aparece na lista dos dez estados com maior média de população por município. → Verdadeira. https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv Questão 3 Correto Atingiu 1,00 de 1,00 Grá�cos de ranking em formato de barras horizontal ajudam você a identi�car de forma rápida as ocorrências mais relevantes de uma dada variável categórica, tendo como referência alguma variável quantitativa. Assinale a alternativa que apresenta o grá�co que melhor descreve um ranking de população das 10 cidades mais populosas do Brasil: Escolha uma opção: a. b. c. d. e. Sua resposta está correta. O grá�co da alternativa “c” traz as dez cidades mais populosas do Brasil, como também lista os municípios em ordem decrescente de população. A resposta correta é: Questão 4 Correto Atingiu 1,00 de 1,00 Assinale a alternativa que apresenta o script que permite analisar a evolução da expectativa de vida no Brasil ao longo do tempo. Escolha uma opção: a. library(dados) library(tidyverse) dados_gapminder %>% �lter(pais=="Brasil") %>% ggplot()+ geom_point(aes(x=pib_per_capita, y=expectativa_de_vida)) b. library(dados) library(tidyverse) dados_gapminder %>% �lter(ano==2007) %>% slice_max(order_by = expectativa_de_vida, n=10) %>% mutate(pais = reorder(pais,expectativa_de_vida)) %>% ggplot()+ geom_col(aes(x=expectativa_de_vida, y=pais)) c. library(dados) library(tidyverse) dados_gapminder %>% �lter(pais=="Brasil") %>% ggplot()+ geom_line(aes(x=ano, y=pib_per_capita)) d. library(dados) library(tidyverse) dados_gapminder %>% �lter(pais=="Brasil") %>% ggplot()+ geom_line(aes(x=ano, y=expectativa_de_vida)) + geom_point(aes(x=ano, y=expectativa_de_vida )) e. library(dados) library(tidyverse) dados_gapminder %>% �lter(pais=="Argentina") %>% ggplot()+ geom_point(aes(x=ano, y=expectativa_de_vida)) Sua resposta está correta. Na opção “d” é feito um �ltro para que permaneçam apenas os dados do Brasil. O grá�co de linha possui o ano no eixo x e a expectativa de vida no eixo y. A resposta correta é: library(dados) library(tidyverse) dados_gapminder %>% �lter(pais=="Brasil") %>% ggplot()+ geom_line(aes(x=ano, y=expectativa_de_vida)) + geom_point(aes(x=ano, y=expectativa_de_vida )) Questão 5 Parcialmente correto Atingiu 0,80 de 1,00 Observe atentamente o grá�cobox-plot a seguir. Esse é o script que gerou o grá�co anterior: library(dados) library(tidyverse) dados_gapminder %>% mutate(ano = as.character(ano)) %>% ggplot() + geom_boxplot(aes(x=ano, y= expectativa_de_vida)) + scale_y_continuous(breaks=(seq(0,80,20))) + ylim(c(0,NA)) a. As linhas horizontais inferiores de cada um dos quadrados representam o primeiro quartil, ou seja, 25% dos valores de expectativa de vida dos países estão abaixo do valor representado por essa linha. b. As medianas não se alteram ao longo dos anos. c. Não são percebidos pontos extremos ao longo dos anos. d. Pode-se perceber que no eixo vertical foi aplicada a escala linear com os valores apresentados ao longo do eixo variando de 20 em 20 unidades, não tendo sido necessário, portanto, o uso da escala logarítmica. e. A diferença entre a mediana e o terceiro quartil foi diminuindo ao longo dos anos. Verdadeira Falsa Verdadeira Verdadeira Verdadeira Sua resposta está parcialmente correta. Você selecionou corretamente 4. A primeira a�rmação é verdadeira: a primeira linha horizontal num box-plot de fato marca o primeiro quartil. A segunda é falsa: as medianas aumentam ao longo dos anos. A terceira a�rmativa é falsa: o grá�co apresenta um ponto extremo inferior no ano de 1992. A quarta é verdadeira: não foi preciso usar a escala logarítmica para o eixo vertical já que a amplitude, diferença entre os valores mínimos e máximos, em cada ano não apresenta valor muito elevado. A última informação é verdadeira: nos primeiros anos a mediana era mais próxima do primeiro quartil, porém os últimos anos disponíveis já mostram que a mediana se aproxima cada vez mais do terceiro quartil. Questão 6 Correto Atingiu 1,00 de 1,00 A resposta correta é: a. As linhas horizontais inferiores de cada um dos quadrados representam o primeiro quartil, ou seja, 25% dos valores de expectativa de vida dos países estão abaixo do valor representado por essa linha. → Verdadeira, b. As medianas não se alteram ao longo dos anos. → Falsa, c. Não são percebidos pontos extremos ao longo dos anos. → Falsa, d. Pode-se perceber que no eixo vertical foi aplicada a escala linear com os valores apresentados ao longo do eixo variando de 20 em 20 unidades, não tendo sido necessário, portanto, o uso da escala logarítmica. → Verdadeira, e. A diferença entre a mediana e o terceiro quartil foi diminuindo ao longo dos anos. → Verdadeira. O script abaixo gera um histograma que mostra a distribuição da quantidade de países de acordo com a renda per capita em dólares. library(dados) library(tidyverse) dados_gapminder %>% �lter(ano==2007) %>% ggplot() + geom_histogram(aes(x= pib_per_capita), color="white") + scale_y_continuous(breaks = c(seq(0,10,1)))+ scale_x_log10() De acordo com o que está escrito no código e com o grá�co gerado, assinale a alternativa correta. Escolha uma opção: a. A �gura mostra a distribuição de “pib_per_capita” para todos os anos disponíveis na tabela. b. Existe apenas um país com “pib_per_capita” menor do que 300 dólares. c. Não existem países com “pib_per_capita” maior do que 30000 dólares. d. O grá�co não utiliza escala logarítmica no eixo x. e. Existem vinte países com renda “per_capita_menor” do que 1000 dólares. Sua resposta está correta. A alternativa correta é a letra “b”, pois o grá�co de histograma revela apenas uma ocorrência à esquerda do valor 300 dólares. A resposta correta é: Existe apenas um país com “pib_per_capita” menor do que 300 dólares. Questão 7 Incorreto Atingiu 0,00 de 1,00 O código abaixo inclui a leitura de uma tabela sobre cidades brasileiras no ano 2020. Entre outras variáveis estão presentes a população e o percentual do gasto municipal com saúde. Além disso, todo o código também gera um grá�co que mostra uma associação entre duas variáveis e o coe�ciente de correlação. Analise com atenção. library(tidyverse) url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv" dados_saude_municipio<- read_csv(url) dados_saude_municipio%>% ggplot()+ geom_point(aes(x=populacao, y=perc))+ scale_x_log10() cor(log10(dados_saude_municipio$populacao), dados_saude_municipio$perc) Sobre a execução do código no programa RStudio, é possível a�rmar que: Escolha uma opção: a. O código usa escala logarítmica no eixo Y. b. Pelo grá�co gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde) que é corroborado pelo coe�ciente de correlação calculado cujo valor é maior que 0.9. c. O coe�ciente de correlação calculado ao �nal do código indica uma correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o grá�co. d. Há uma correlação negativa entre população e percentual gasto com saúde. e. Como a correlação mediu um valor entre 0.5 e 0.7, há uma associação moderada entre as duas variáveis. Sua resposta está incorreta. O coe�ciente de correlação medido é de 0.1117601, o que é considerado desprezível, portanto a alternativa correta é a letra “c”. A resposta correta é: O coe�ciente de correlação calculado ao �nal do código indica uma correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o grá�co. https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv Questão 8 Correto Atingiu 1,00 de 1,00 O código abaixo trabalha com a mesma tabela da questão anterior, só que agora se dedica a analisar a associação entre população e o valor gasto com saúde. library(tidyverse) url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv" dados_saude_municipio<- read_csv(url) dados_saude_municipio%>% ggplot()+ geom_point(aes(x=populacao, y=valor))+ scale_x_log10() + scale_y_log10() cor(log10(dados_saude_municipio$populacao), log10(dados_saude_municipio$valor)) Sobre a execução do código no programa RStudio, é possível a�rmar que: Escolha uma opção: a. O código não usa escala logarítmica. b. Pelo grá�co gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde) que é corroborado pelo coe�ciente de correlação calculado cujo valor é maior que 0.9. c. O coe�ciente de correlação calculado ao �nal do código indica uma correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o grá�co. d. Há uma correlação negativa entre população e valor gasto com saúde. e. Como a correlação mediu um valor entre 0.5 e 0.7 há uma associação moderada entre as duas variáveis. Sua resposta está correta. O grá�co revela uma inclinação fortemente positiva com um coe�ciente de correlação medido em 0.9449733, portanto a alternativa correta é a letra “b”. A resposta correta é: Pelo grá�co gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde) que é corroborado pelo coe�ciente de correlação calculado cujo valor é maior que 0.9. https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv