Baixe o app para aproveitar ainda mais
Prévia do material em texto
1. estatistica_ad | - Turma FEV/2024 2. Exercício avaliativo - Módulo 3 QUESTIONÁRIO Exercício avaliativo - Módulo 3 Iniciado em domingo, 4 fev. 2024, 11:09 Estado Finalizada Concluída em domingo, 4 fev. 2024, 11:15 Tempo empregado 6 minutos 10 segundos Notas 8,00/8,00 Avaliar 25,00 de um máximo de 25,00(100%) Parte superior do formulário Questão 1 Correto Atingiu 1,00 de 1,00 Marcar questão Texto da questão Analise o script abaixo. library(tidyverse) #O objeto url abaixo indica onde está na internet a tabela com os dados sobre municípios brasileiros url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv" #O comando read_csv permite ler para a sua máquina o conteúdo de uma tabela que está no endereço especificado no objeto url #o conteúdo da tabela é passado para o dataframe dados_municipios dados_municipios<- read_csv(url) dados_municipios%>% filter(sigla_uf == "CE") %>% select(sigla_uf,nome, populacao) %>% arrange(desc(populacao)) Qual o resultado da execução do script acima? Escolha uma opção: a. # A tibble: 185 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 PE Recife 1653461 2 PE Jaboatão dos Guararapes 706867 3 PE Olinda 393115 4 PE Caruaru 365278 5 PE Petrolina 354317 6 PE Paulista 334376 7 PE Cabo de Santo Agostinho 208944 8 PE Camaragibe 158899 9 PE Garanhuns 140577 10 PE Vitória de Santo Antão 139583 # ... with 175 more rows b. # A tibble: 184 x 2 nome populacao <chr> <dbl> 1 Fortaleza 2686612 2 Caucaia 365212 3 Juazeiro do Norte 276264 4 Maracanaú 229458 5 Sobral 210711 6 Crato 133031 7 Itapipoca 130539 8 Maranguape 130346 9 Iguatu 103074 10 Quixadá 88321 # ... with 174 more rows c. # A tibble: 184 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 CE Abaiara 11853 2 CE Acarape 15036 3 CE Acaraú 63104 4 CE Acopiara 54481 5 CE Aiuaba 17493 6 CE Alcântaras 11781 7 CE Altaneira 7650 8 CE Alto Santo 17196 9 CE Amontada 43829 10 CE Antonina do Norte 7378 # ... with 174 more rows d. # A tibble: 369 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 CE Fortaleza 2686612 2 CE Recife 1653461 3 CE Jaboatão dos Guararapes 706867 4 CE Olinda 393115 5 CE Caruaru 365278 6 CE Caucaia 365212 7 CE Petrolina 354317 8 CE Paulista 334376 9 CE Juazeiro do Norte 276264 10 CE Maracanaú 229458 # ... with 359 more rows e. # A tibble: 184 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 CE Fortaleza 2686612 2 CE Caucaia 365212 3 CE Juazeiro do Norte 276264 4 CE Maracanaú 229458 5 CE Sobral 210711 6 CE Crato 133031 7 CE Itapipoca 130539 8 CE Maranguape 130346 9 CE Iguatu 103074 10 CE Quixadá 88321 # ... with 174 more rows Feedback Sua resposta está correta. A opção “e” corresponde aos filtros de coluna e linha aplicados no script, bem como traz os valores de população em ordem decrescente, tal como indicado no script. A resposta correta é: # A tibble: 184 x 3 sigla_uf nome populacao <chr> <chr> <dbl> 1 CE Fortaleza 2686612 2 CE Caucaia 365212 3 CE Juazeiro do Norte 276264 4 CE Maracanaú 229458 5 CE Sobral 210711 6 CE Crato 133031 7 CE Itapipoca 130539 8 CE Maranguape 130346 9 CE Iguatu 103074 10 CE Quixadá 88321 # ... with 174 more rows Questão 2 Correto Atingiu 1,00 de 1,00 Marcar questão Texto da questão Execute o script indicado nesta atividade. Em seguida julgue as alternativas como verdadeiras ou falsas: #O objeto url abaixo indica onde está na internet a tabela com os dados sobre municípios brasileiros url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv" #O comando read_csv permite ler para a sua máquina o conteúdo de uma tabela que está no endereço especificado no objeto url #o conteúdo da tabela é passado para o dataframe dados_municipios dados_municipios<- read_csv(url) dados_municipios%>% filter(sigla_uf != "DF") %>% group_by(sigla_uf) %>% summarise( media_populacao_municipios = mean(populacao) ) %>% arrange(desc(media_populacao_municipios)) a. O estado de São Paulo possui a maior média de população dos seus municípios. Resposta 1 b. O estado do Acre está entre os dez estados com maior média de população nos seus municípios. Resposta 2 c. O Rio de Janeiro é o único estado que tem uma média de população dos seus municípios maior do que 100.000 habitantes. Resposta 3 d. Todos os 10 estados com maior média de população nos seus municípios têm essa média acima dos 50.000 habitantes. Resposta 4 e. A Bahia não aparece na lista dos dez estados com maior média de população por município. Resposta 5 Feedback Sua resposta está correta. A afirmativa “a” é falsa – o estado do Rio de Janeiro ocupa a primeira posição. A opção “b” é verdadeira – o Acre é o décimo do ranking. A opção “c” é verdadeira – o Rio de Janeiro, com média de 188763 habitantes nos seus municípios, é o único com esta medida acima de 100.000 habitantes. A opção “d” é falsa – CE, RR e AC possuem uma média inferior a 50.000 habitantes. A opção “e” é verdadeira – a lista dos 10 estados compreende: RJ, SP, AM, PA, ES, PE, CE, RR, AC. A resposta correta é: a. O estado de São Paulo possui a maior média de população dos seus municípios. → Falsa, b. O estado do Acre está entre os dez estados com maior média de população nos seus municípios. → Verdadeira, c. O Rio de Janeiro é o único estado que tem uma média de população dos seus municípios maior do que 100.000 habitantes. → Verdadeira, d. Todos os 10 estados com maior média de população nos seus municípios têm essa média acima dos 50.000 habitantes. → Falsa, e. A Bahia não aparece na lista dos dez estados com maior média de população por município. → Verdadeira. Questão 3 Correto Atingiu 1,00 de 1,00 Marcar questão Texto da questão Gráficos de ranking em formato de barras horizontal ajudam você a identificar de forma rápida as ocorrências mais relevantes de uma dada variável categórica, tendo como referência alguma variável quantitativa. Assinale a alternativa que apresenta o gráfico que melhor descreve um ranking de população das 10 cidades mais populosas do Brasil: Escolha uma opção: a. b. c. d. e. Feedback Sua resposta está correta. O gráfico da alternativa “c” traz as dez cidades mais populosas do Brasil, como também lista os municípios em ordem decrescente de população. A resposta correta é: Questão 4 Correto Atingiu 1,00 de 1,00 Marcar questão Texto da questão Assinale a alternativa que apresenta o script que permite analisar a evolução da expectativa de vida no Brasil ao longo do tempo. Escolha uma opção: a. library(dados) library(tidyverse) dados_gapminder %>% filter(pais=="Brasil") %>% ggplot()+ geom_point(aes(x=pib_per_capita, y=expectativa_de_vida)) b. library(dados) library(tidyverse) dados_gapminder %>% filter(ano==2007) %>% slice_max(order_by = expectativa_de_vida, n=10) %>% mutate(pais = reorder(pais,expectativa_de_vida)) %>% ggplot()+ geom_col(aes(x=expectativa_de_vida, y=pais)) c. library(dados) library(tidyverse) dados_gapminder %>% filter(pais=="Brasil") %>% ggplot()+ geom_line(aes(x=ano, y=pib_per_capita)) d. library(dados) library(tidyverse) dados_gapminder %>% filter(pais=="Brasil") %>% ggplot()+ geom_line(aes(x=ano, y=expectativa_de_vida)) + geom_point(aes(x=ano, y=expectativa_de_vida )) e. library(dados) library(tidyverse) dados_gapminder %>% filter(pais=="Argentina") %>% ggplot()+ geom_point(aes(x=ano, y=expectativa_de_vida)) Feedback Sua resposta está correta. Na opção “d” é feito um filtro para que permaneçam apenas os dados do Brasil. O gráfico de linha possui o ano no eixo x e a expectativa de vida no eixo y. A resposta correta é: library(dados) library(tidyverse) dados_gapminder%>% filter(pais=="Brasil") %>% ggplot()+ geom_line(aes(x=ano, y=expectativa_de_vida)) + geom_point(aes(x=ano, y=expectativa_de_vida )) Questão 5 Correto Atingiu 1,00 de 1,00 Marcar questão Texto da questão Observe atentamente o gráfico box-plot a seguir. Esse é o script que gerou o gráfico anterior: library(dados) library(tidyverse) dados_gapminder %>% mutate(ano = as.character(ano)) %>% ggplot() + geom_boxplot(aes(x=ano, y= expectativa_de_vida)) + scale_y_continuous(breaks=(seq(0,80,20))) + ylim(c(0,NA)) a. As linhas horizontais inferiores de cada um dos quadrados representam o primeiro quartil, ou seja, 25% dos valores de expectativa de vida dos países estão abaixo do valor representado por essa linha. Resposta 1 b. As medianas não se alteram ao longo dos anos. Resposta 2 c. Não são percebidos pontos extremos ao longo dos anos. Resposta 3 d. Pode-se perceber que no eixo vertical foi aplicada a escala linear com os valores apresentados ao longo do eixo variando de 20 em 20 unidades, não tendo sido necessário, portanto, o uso da escala logarítmica. Resposta 4 e. A diferença entre a mediana e o terceiro quartil foi diminuindo ao longo dos anos. Resposta 5 Feedback Sua resposta está correta. A primeira afirmação é verdadeira: a primeira linha horizontal num box-plot de fato marca o primeiro quartil. A segunda é falsa: as medianas aumentam ao longo dos anos. A terceira afirmativa é falsa: o gráfico apresenta um ponto extremo inferior no ano de 1992. A quarta é verdadeira: não foi preciso usar a escala logarítmica para o eixo vertical já que a amplitude, diferença entre os valores mínimos e máximos, em cada ano não apresenta valor muito elevado. A última informação é verdadeira: nos primeiros anos a mediana era mais próxima do primeiro quartil, porém os últimos anos disponíveis já mostram que a mediana se aproxima cada vez mais do terceiro quartil. A resposta correta é: a. As linhas horizontais inferiores de cada um dos quadrados representam o primeiro quartil, ou seja, 25% dos valores de expectativa de vida dos países estão abaixo do valor representado por essa linha. → Verdadeira, b. As medianas não se alteram ao longo dos anos. → Falsa, c. Não são percebidos pontos extremos ao longo dos anos. → Falsa, d. Pode-se perceber que no eixo vertical foi aplicada a escala linear com os valores apresentados ao longo do eixo variando de 20 em 20 unidades, não tendo sido necessário, portanto, o uso da escala logarítmica. → Verdadeira, e. A diferença entre a mediana e o terceiro quartil foi diminuindo ao longo dos anos. → Verdadeira. Questão 6 Correto Atingiu 1,00 de 1,00 Marcar questão Texto da questão O script abaixo gera um histograma que mostra a distribuição da quantidade de países de acordo com a renda per capita em dólares. library(dados) library(tidyverse) dados_gapminder %>% filter(ano==2007) %>% ggplot() + geom_histogram(aes(x= pib_per_capita), color="white") + scale_y_continuous(breaks = c(seq(0,10,1)))+ scale_x_log10() De acordo com o que está escrito no código e com o gráfico gerado, assinale a alternativa correta. Escolha uma opção: a. A figura mostra a distribuição de “pib_per_capita” para todos os anos disponíveis na tabela. b. Existe apenas um país com “pib_per_capita” menor do que 300 dólares. c. Não existem países com “pib_per_capita” maior do que 30000 dólares. d. O gráfico não utiliza escala logarítmica no eixo x. e. Existem vinte países com renda “per_capita_menor” do que 1000 dólares. Feedback Sua resposta está correta. A alternativa correta é a letra “b”, pois o gráfico de histograma revela apenas uma ocorrência à esquerda do valor 300 dólares. A resposta correta é: Existe apenas um país com “pib_per_capita” menor do que 300 dólares. Questão 7 Correto Atingiu 1,00 de 1,00 Marcar questão Texto da questão O código abaixo inclui a leitura de uma tabela sobre cidades brasileiras no ano 2020. Entre outras variáveis estão presentes a população e o percentual do gasto municipal com saúde. Além disso, todo o código também gera um gráfico que mostra uma associação entre duas variáveis e o coeficiente de correlação. Analise com atenção. library(tidyverse) url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv" dados_saude_municipio<- read_csv(url) dados_saude_municipio%>% ggplot()+ geom_point(aes(x=populacao, y=perc))+ scale_x_log10() cor(log10(dados_saude_municipio$populacao), dados_saude_municipio$perc) Sobre a execução do código no programa RStudio, é possível afirmar que: Escolha uma opção: a. O código usa escala logarítmica no eixo Y. b. Pelo gráfico gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde) que é corroborado pelo coeficiente de correlação calculado cujo valor é maior que 0.9. c. O coeficiente de correlação calculado ao final do código indica uma correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o gráfico. d. Há uma correlação negativa entre população e percentual gasto com saúde. e. Como a correlação mediu um valor entre 0.5 e 0.7, há uma associação moderada entre as duas variáveis. Feedback Sua resposta está correta. O coeficiente de correlação medido é de 0.1117601, o que é considerado desprezível, portanto a alternativa correta é a letra “c”. A resposta correta é: O coeficiente de correlação calculado ao final do código indica uma correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o gráfico. Questão 8 Correto Atingiu 1,00 de 1,00 Marcar questão Texto da questão O código abaixo trabalha com a mesma tabela da questão anterior, só que agora se dedica a analisar a associação entre população e o valor gasto com saúde. library(tidyverse) url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv" dados_saude_municipio<- read_csv(url) dados_saude_municipio%>% ggplot()+ geom_point(aes(x=populacao, y=valor))+ scale_x_log10() + scale_y_log10() cor(log10(dados_saude_municipio$populacao), log10(dados_saude_municipio$valor)) Sobre a execução do código no programa RStudio, é possível afirmar que: Escolha uma opção: a. O código não usa escala logarítmica. b. Pelo gráfico gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde) que é corroborado pelo coeficiente de correlação calculado cujo valor é maior que 0.9. c. O coeficiente de correlação calculado ao final do código indica uma correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o gráfico. d. Há uma correlação negativa entre população e valor gasto com saúde. e. Como a correlação mediu um valor entre 0.5 e 0.7 há uma associação moderada entre as duas variáveis. Feedback Sua resposta está correta. O gráfico revela uma inclinação fortemente positiva com um coeficiente de correlação medido em 0.9449733, portanto a alternativa correta é a letra “b”. A resposta correta é: Pelo gráfico gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde) que é corroborado pelo coeficiente de correlação calculado cujo valor é maior que 0.9. Parte inferior do formulário Falsa Verdadeira Falsa
Compartilhar