Prévia do material em texto
29/06/2023, 10:36 Exercício avaliativo - Módulo 3: Revisão da tentativa https://mooc38.escolavirtual.gov.br/mod/quiz/review.php?attempt=11026217&cmid=227243 1/10 Painel / Meus cursos / Estatística para Análise de Dados na Administração Pública / Módulo 3: Modelando Dados e Gráficos / Exercício avaliativo - Módulo 3 Iniciado em quarta, 28 jun 2023, 12:57 Estado Finalizada Concluída em quarta, 28 jun 2023, 13:03 Tempo empregado 6 minutos 8 segundos Notas 1,60/8,00 Avaliar 5,00 de um máximo de 25,00(20%) Selecione o idioma Powered by Tradutor https://mooc38.escolavirtual.gov.br/my/ https://mooc38.escolavirtual.gov.br/course/view.php?id=12015 https://mooc38.escolavirtual.gov.br/course/view.php?id=12015#section-3 https://mooc38.escolavirtual.gov.br/mod/quiz/view.php?id=227243 https://translate.google.com/ 29/06/2023, 10:36 Exercício avaliativo - Módulo 3: Revisão da tentativa https://mooc38.escolavirtual.gov.br/mod/quiz/review.php?attempt=11026217&cmid=227243 2/10 Questão 1 Incorreto Atingiu 0,00 de 1,00 Analise o script abaixo. library(tidyverse) #O objeto url abaixo indica onde está na internet a tabela com os dados sobre municípios brasileiros url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv" #O comando read_csv permite ler para a sua máquina o conteúdo de uma tabela que está no endereço especificado no objeto url #o conteúdo da tabela é passado para o dataframe dados_municipios dados_municipios<- read_csv(url) dados_municipios%>% filter(sigla_uf == "CE") %>% select(sigla_uf,nome, populacao) %>% arrange(desc(populacao)) Qual o resultado da execução do script acima? Escolha uma opção: a. # A tibble: 185 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 PE Recife 1653461 2 PE Jaboatão dos Guararapes 706867 3 PE Olinda 393115 4 PE Caruaru 365278 5 PE Petrolina 354317 6 PE Paulista 334376 7 PE Cabo de Santo Agostinho 208944 8 PE Camaragibe 158899 9 PE Garanhuns 140577 10 PE Vitória de Santo Antão 139583 # ... with 175 more rows b. # A tibble: 184 x 2 nome populacao <chr> <dbl> 1 Fortaleza 2686612 2 Caucaia 365212 3 Juazeiro do Norte 276264 4 Maracanaú 229458 5 Sobral 210711 6 Crato 133031 7 Itapipoca 130539 8 Maranguape 130346 9 Iguatu 103074 10 Quixadá 88321 # ... with 174 more rows Powered by Tradutor https://translate.google.com/ 29/06/2023, 10:36 Exercício avaliativo - Módulo 3: Revisão da tentativa https://mooc38.escolavirtual.gov.br/mod/quiz/review.php?attempt=11026217&cmid=227243 3/10 c. # A tibble: 184 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 CE Abaiara 11853 2 CE Acarape 15036 3 CE Acaraú 63104 4 CE Acopiara 54481 5 CE Aiuaba 17493 6 CE Alcântaras 11781 7 CE Altaneira 7650 8 CE Alto Santo 17196 9 CE Amontada 43829 10 CE Antonina do Norte 7378 # ... with 174 more rows d. # A tibble: 369 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 CE Fortaleza 2686612 2 CE Recife 1653461 3 CE Jaboatão dos Guararapes 706867 4 CE Olinda 393115 5 CE Caruaru 365278 6 CE Caucaia 365212 7 CE Petrolina 354317 8 CE Paulista 334376 9 CE Juazeiro do Norte 276264 10 CE Maracanaú 229458 # ... with 359 more rows e. # A tibble: 184 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 CE Fortaleza 2686612 2 CE Caucaia 365212 3 CE Juazeiro do Norte 276264 4 CE Maracanaú 229458 Powered by Tradutor https://translate.google.com/ 29/06/2023, 10:36 Exercício avaliativo - Módulo 3: Revisão da tentativa https://mooc38.escolavirtual.gov.br/mod/quiz/review.php?attempt=11026217&cmid=227243 4/10 sigla_uf nome populacao 5 CE Sobral 210711 6 CE Crato 133031 7 CE Itapipoca 130539 8 CE Maranguape 130346 9 CE Iguatu 103074 10 CE Quixadá 88321 # ... with 174 more rows Sua resposta está incorreta. A opção “e” corresponde aos filtros de coluna e linha aplicados no script, bem como traz os valores de população em ordem decrescente, tal como indicado no script. A resposta correta é: # A tibble: 184 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 CE Fortaleza 2686612 2 CE Caucaia 365212 3 CE Juazeiro do Norte 276264 4 CE Maracanaú 229458 5 CE Sobral 210711 6 CE Crato 133031 7 CE Itapipoca 130539 8 CE Maranguape 130346 9 CE Iguatu 103074 10 CE Quixadá 88321 # ... with 174 more rows Powered by Tradutor https://translate.google.com/ 29/06/2023, 10:36 Exercício avaliativo - Módulo 3: Revisão da tentativa https://mooc38.escolavirtual.gov.br/mod/quiz/review.php?attempt=11026217&cmid=227243 5/10 Questão 2 Correto Atingiu 1,00 de 1,00 Execute o script indicado nesta atividade. Em seguida julgue as alternativas como verdadeiras ou falsas: #O objeto url abaixo indica onde está na internet a tabela com os dados sobre municípios brasileiros url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv" #O comando read_csv permite ler para a sua máquina o conteúdo de uma tabela que está no endereço especificado no objeto url #o conteúdo da tabela é passado para o dataframe dados_municipios dados_municipios<- read_csv(url) dados_municipios%>% filter(sigla_uf != "DF") %>% group_by(sigla_uf) %>% summarise( media_populacao_municipios = mean(populacao) ) %>% arrange(desc(media_populacao_municipios)) a. O estado de São Paulo possui a maior média de população dos seus municípios. b. O estado do Acre está entre os dez estados com maior média de população nos seus municípios. c. O Rio de Janeiro é o único estado que tem uma média de população dos seus municípios maior do que 100.000 habitantes. d. Todos os 10 estados com maior média de população nos seus municípios têm essa média acima dos 50.000 habitantes. e. A Bahia não aparece na lista dos dez estados com maior média de população por município. Falsa Verdadeira Verdadeira Falsa Verdadeira Sua resposta está correta. A afirmativa “a” é falsa – o estado do Rio de Janeiro ocupa a primeira posição. A opção “b” é verdadeira – o Acre é o décimo do ranking. A opção “c” é verdadeira – o Rio de Janeiro, com média de 188763 habitantes nos seus municípios, é o único com esta medida acima de 100.000 habitantes. A opção “d” é falsa – CE, RR e AC possuem uma média inferior a 50.000 habitantes. A opção “e” é verdadeira – a lista dos 10 estados compreende: RJ, SP, AM, PA, ES, PE, CE, RR, AC. A resposta correta é: a. O estado de São Paulo possui a maior média de população dos seus municípios. → Falsa, b. O estado do Acre está entre os dez estados com maior média de população nos seus municípios. → Verdadeira, c. O Rio de Janeiro é o único estado que tem uma média de população dos seus municípios maior do que 100.000 habitantes. → Verdadeira, d. Todos os 10 estados com maior média de população nos seus municípios têm essa média acima dos 50.000 habitantes. → Falsa, e. A Bahia não aparece na lista dos dez estados com maior média de população por município. → Verdadeira. Powered by Tradutor https://translate.google.com/ 29/06/2023, 10:36 Exercício avaliativo - Módulo 3: Revisão da tentativa https://mooc38.escolavirtual.gov.br/mod/quiz/review.php?attempt=11026217&cmid=227243 6/10 Questão 3 Incorreto Atingiu 0,00 de 1,00 Gráficos de ranking em formato de barras horizontal ajudam você a identificar de forma rápida as ocorrências mais relevantes de uma dada variável categórica, tendo como referência alguma variável quantitativa. Assinale a alternativa que apresenta o gráfico que melhor descreve um ranking de população das 10 cidades mais populosas do Brasil: Escolha uma opção: a. b. c. d. e. Sua resposta está incorreta. O gráfico da alternativa “c” traz as dez cidades mais populosas do Brasil, como também lista os municípios em Powered by Tradutor https://translate.google.com/ 29/06/2023, 10:36 Exercício avaliativo - Módulo 3: Revisão da tentativa https://mooc38.escolavirtual.gov.br/mod/quiz/review.php?attempt=11026217&cmid=227243 7/10 Questão 4 Incorreto Atingiu 0,00 de 1,00 ordem decrescente de população. A respostacorreta é: Assinale a alternativa que apresenta o script que permite analisar a evolução da expectativa de vida no Brasil ao longo do tempo. Escolha uma opção: a. library(dados) library(tidyverse) dados_gapminder %>% filter(pais=="Brasil") %>% ggplot()+ geom_point(aes(x=pib_per_capita, y=expectativa_de_vida)) b. library(dados) library(tidyverse) dados_gapminder %>% filter(ano==2007) %>% slice_max(order_by = expectativa_de_vida, n=10) %>% mutate(pais = reorder(pais,expectativa_de_vida)) %>% ggplot()+ geom_col(aes(x=expectativa_de_vida, y=pais)) c. library(dados) library(tidyverse) dados_gapminder %>% filter(pais=="Brasil") %>% ggplot()+ geom_line(aes(x=ano, y=pib_per_capita)) d. library(dados) library(tidyverse) dados_gapminder %>% filter(pais=="Brasil") %>% ggplot()+ geom_line(aes(x=ano, y=expectativa_de_vida)) + geom_point(aes(x=ano, y=expectativa_de_vida )) e. library(dados) library(tidyverse) dados_gapminder %>% filter(pais=="Argentina") %>% ggplot()+ geom_point(aes(x=ano, y=expectativa_de_vida)) Sua resposta está incorreta. Na opção “d” é feito um filtro para que permaneçam apenas os dados do Brasil. O gráfico de linha possui o ano no eixo x e a expectativa de vida no eixo y. A resposta correta é: library(dados) library(tidyverse) dados_gapminder %>% filter(pais=="Brasil") %>% ggplot()+ geom_line(aes(x=ano, y=expectativa_de_vida)) + geom_point(aes(x=ano, y=expectativa_de_vida )) Powered by Tradutor https://translate.google.com/ 29/06/2023, 10:36 Exercício avaliativo - Módulo 3: Revisão da tentativa https://mooc38.escolavirtual.gov.br/mod/quiz/review.php?attempt=11026217&cmid=227243 8/10 Questão 5 Parcialmente correto Atingiu 0,60 de 1,00 Observe atentamente o gráfico box-plot a seguir. Esse é o script que gerou o gráfico anterior: library(dados) library(tidyverse) dados_gapminder %>% mutate(ano = as.character(ano)) %>% ggplot() + geom_boxplot(aes(x=ano, y= expectativa_de_vida)) + scale_y_continuous(breaks=(seq(0,80,20))) + ylim(c(0,NA)) a. As linhas horizontais inferiores de cada um dos quadrados representam o primeiro quartil, ou seja, 25% dos valores de expectativa de vida dos países estão abaixo do valor representado por essa linha. b. As medianas não se alteram ao longo dos anos. c. Não são percebidos pontos extremos ao longo dos anos. d. Pode-se perceber que no eixo vertical foi aplicada a escala linear com os valores apresentados ao longo do eixo variando de 20 em 20 unidades, não tendo sido necessário, portanto, o uso da escala logarítmica. e. A diferença entre a mediana e o terceiro quartil foi diminuindo ao longo dos anos. Verdadeira Verdadeira Verdadeira Verdadeira Verdadeira Sua resposta está parcialmente correta. Você selecionou corretamente 3. A primeira afirmação é verdadeira: a primeira linha horizontal num box-plot de fato marca o primeiro quartil. A segunda é falsa: as medianas aumentam ao longo dos anos. A terceira afirmativa é falsa: o gráfico apresenta um ponto extremo inferior no ano de 1992. A quarta é verdadeira: não foi preciso usar a escala logarítmica para o eixo vertical já que a amplitude, diferença entre os valores mínimos e máximos, em cada ano não apresenta valor muito elevado. A última informação é verdadeira: nos primeiros anos a mediana era mais próxima do primeiro quartil, porém os últimos anos disponíveis já mostram que a mediana se aproxima cada vez mais do terceiro quartil. A resposta correta é: a. As linhas horizontais inferiores de cada um dos quadrados representam o primeiro quartil, ou seja, 25% dos valores de expectativa de vida dos países estão abaixo do valor representado por essa linha. → Verdadeira, b. As medianas não se alteram ao longo dos anos. → Falsa, c. Não são percebidos pontos extremos ao longo dos anos. → Falsa, d. Pode-se perceber que no eixo vertical foi aplicada a escala linear com os valores apresentados ao longo do eixo variando de 20 em 20 unidades, não tendo sido necessário, portanto, o uso da escala logarítmica. → Verdadeira, e. A diferença entre a mediana e o terceiro quartil foi diminuindo ao longo dos anos. → Verdadeira. Powered by Tradutor https://translate.google.com/ 29/06/2023, 10:36 Exercício avaliativo - Módulo 3: Revisão da tentativa https://mooc38.escolavirtual.gov.br/mod/quiz/review.php?attempt=11026217&cmid=227243 9/10 Questão 6 Incorreto Atingiu 0,00 de 1,00 Questão 7 Incorreto Atingiu 0,00 de 1,00 O script abaixo gera um histograma que mostra a distribuição da quantidade de países de acordo com a renda per capita em dólares. library(dados) library(tidyverse) dados_gapminder %>% filter(ano==2007) %>% ggplot() + geom_histogram(aes(x= pib_per_capita), color="white") + scale_y_continuous(breaks = c(seq(0,10,1)))+ scale_x_log10() De acordo com o que está escrito no código e com o gráfico gerado, assinale a alternativa correta. Escolha uma opção: a. A figura mostra a distribuição de “pib_per_capita” para todos os anos disponíveis na tabela. b. Existe apenas um país com “pib_per_capita” menor do que 300 dólares. c. Não existem países com “pib_per_capita” maior do que 30000 dólares. d. O gráfico não utiliza escala logarítmica no eixo x. e. Existem vinte países com renda “per_capita_menor” do que 1000 dólares. Sua resposta está incorreta. A alternativa correta é a letra “b”, pois o gráfico de histograma revela apenas uma ocorrência à esquerda do valor 300 dólares. A resposta correta é: Existe apenas um país com “pib_per_capita” menor do que 300 dólares. O código abaixo inclui a leitura de uma tabela sobre cidades brasileiras no ano 2020. Entre outras variáveis estão presentes a população e o percentual do gasto municipal com saúde. Além disso, todo o código também gera um gráfico que mostra uma associação entre duas variáveis e o coeficiente de correlação. Analise com atenção. library(tidyverse) url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv" dados_saude_municipio<- read_csv(url) dados_saude_municipio%>% ggplot()+ geom_point(aes(x=populacao, y=perc))+ scale_x_log10() cor(log10(dados_saude_municipio$populacao), dados_saude_municipio$perc) Sobre a execução do código no programa RStudio, é possível afirmar que: Escolha uma opção: a. O código usa escala logarítmica no eixo Y. b. Pelo gráfico gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde) que é corroborado pelo coeficiente de correlação calculado cujo valor é maior que 0.9. c. O coeficiente de correlação calculado ao final do código indica uma correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o gráfico. d. Há uma correlação negativa entre população e percentual gasto com saúde. e. Como a correlação mediu um valor entre 0.5 e 0.7, há uma associação moderada entre as duas variáveis. Sua resposta está incorreta. O coeficiente de correlação medido é de 0.1117601, o que é considerado desprezível, portanto a alternativa correta é a letra “c”. A resposta correta é: O coeficiente de correlação calculado ao final do código indica uma correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o gráfico. Powered by Tradutor https://translate.google.com/ 29/06/2023, 10:36 Exercício avaliativo - Módulo 3: Revisão da tentativa https://mooc38.escolavirtual.gov.br/mod/quiz/review.php?attempt=11026217&cmid=227243 10/10 Questão 8 Incorreto Atingiu 0,00 de 1,00 O código abaixo trabalha com a mesma tabela da questão anterior, só que agora se dedica a analisar a associação entre população e o valor gasto com saúde. library(tidyverse) url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv" dados_saude_municipio<- read_csv(url) dados_saude_municipio%>% ggplot()+ geom_point(aes(x=populacao, y=valor))+ scale_x_log10() + scale_y_log10() cor(log10(dados_saude_municipio$populacao), log10(dados_saude_municipio$valor))Sobre a execução do código no programa RStudio, é possível afirmar que: Escolha uma opção: a. O código não usa escala logarítmica. b. Pelo gráfico gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde) que é corroborado pelo coeficiente de correlação calculado cujo valor é maior que 0.9. c. O coeficiente de correlação calculado ao final do código indica uma correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o gráfico. d. Há uma correlação negativa entre população e valor gasto com saúde. e. Como a correlação mediu um valor entre 0.5 e 0.7 há uma associação moderada entre as duas variáveis. Sua resposta está incorreta. O gráfico revela uma inclinação fortemente positiva com um coeficiente de correlação medido em 0.9449733, portanto a alternativa correta é a letra “b”. A resposta correta é: Pelo gráfico gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde) que é corroborado pelo coeficiente de correlação calculado cujo valor é maior que 0.9. ◄ Conteúdo - Módulo 3 Seguir para... Conteúdo - Módulo 4 ► Powered by Tradutor https://mooc38.escolavirtual.gov.br/mod/url/view.php?id=227242&forceview=1 https://mooc38.escolavirtual.gov.br/mod/url/view.php?id=227244&forceview=1 https://translate.google.com/