Logo Passei Direto
Buscar

estatistica_ad-Exercício avaliativo - Módulo 3_ Revisão da tentativa

User badge image
Renan Araujo

em

Ferramentas de estudo

Questões resolvidas

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Prévia do material em texto

Iniciado em domingo, 1 out. 2023, 11:21
Estado Finalizada
Concluída em domingo, 1 out. 2023, 11:26
Tempo
empregado
5 minutos 3 segundos
Notas 3,20/8,00
Avaliar 10,00 de um máximo de 25,00(40%)
Questão 1
Correto
Atingiu 1,00 de 1,00
Analise o script abaixo. 
library(tidyverse)
#O objeto url abaixo indica onde está na internet a tabela com os dados sobre municípios brasileiros
url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv"
#O comando read_csv permite ler para a sua máquina o conteúdo de uma tabela que está no endereço especi�cado no objeto url
#o conteúdo da tabela é passado para o dataframe dados_municipios
dados_municipios<- read_csv(url)
dados_municipios%>%
�lter(sigla_uf == "CE") %>%
select(sigla_uf,nome, populacao) %>%
arrange(desc(populacao))
Qual o resultado da execução do script acima?  
Escolha uma opção:
a.
# A tibble: 185 x 3
sigla_uf nome populacao
<chr> <chr> <dbl>
1 PE Recife 1653461
2 PE Jaboatão dos Guararapes 706867
3 PE Olinda 393115
4 PE Caruaru 365278
5 PE Petrolina 354317
6 PE Paulista 334376
7 PE Cabo de Santo Agostinho 208944
8 PE Camaragibe 158899
9 PE Garanhuns 140577
10 PE Vitória de Santo Antão 139583
# ... with 175 more rows
b.
# A tibble: 184 x 2
nome populacao
<chr> <dbl>
1 Fortaleza 2686612
2 Caucaia 365212
3 Juazeiro do Norte 276264
4 Maracanaú 229458
5 Sobral 210711
6 Crato 133031
7 Itapipoca  130539
8 Maranguape 130346
9 Iguatu 103074
10 Quixadá 88321
# ... with 174 more rows
Selecione o idioma
Powered by Tradutor
https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv
https://translate.google.com/
https://translate.google.com/
c.
# A tibble: 184 x 3
sigla_uf nome populacao
<chr> <chr> <dbl>
1 CE Abaiara 11853
2 CE Acarape 15036
3 CE Acaraú 63104
4 CE Acopiara 54481
5 CE Aiuaba 17493
6 CE Alcântaras 11781
7 CE Altaneira 7650
8 CE Alto Santo 17196
9 CE Amontada 43829
10 CE Antonina do Norte 7378
# ... with 174 more rows
d.
# A tibble: 369 x 3 
sigla_uf nome populacao
<chr> <chr> <dbl>
1 CE Fortaleza 2686612
2 CE Recife 1653461
3 CE Jaboatão dos Guararapes 706867
4 CE Olinda 393115
5 CE Caruaru 365278
6 CE Caucaia 365212
7 CE Petrolina 354317
8 CE Paulista 334376
9 CE Juazeiro do Norte 276264
10 CE Maracanaú 229458
# ... with 359 more rows
e.
# A tibble: 184 x 3 
sigla_uf nome populacao
<chr> <chr> <dbl>
1 CE Fortaleza 2686612
2 CE Caucaia 365212
3 CE Juazeiro do Norte 276264
4 CE Maracanaú 229458
5 CE Sobral 210711
6 CE Crato 133031
7 CE Itapipoca 130539
8 CE Maranguape 130346
9 CE Iguatu 103074
10 CE Quixadá 88321
# ... with 174 more rows

Sua resposta está correta.
A opção “e” corresponde aos �ltros de coluna e linha aplicados no script, bem como traz os valores de população em ordem decrescente,
tal como indicado no script.
A resposta correta é:
# A tibble: 184 x 3 
sigla_uf nome populacao
<chr> <chr> <dbl>
1 CE Fortaleza 2686612
2 CE Caucaia 365212
3 CE Juazeiro do Norte 276264
4 CE Maracanaú 229458
5 CE Sobral 210711
6 CE Crato 133031
7 CE Itapipoca 130539
8 CE Maranguape 130346
9 CE Iguatu 103074
10 CE Quixadá 88321
# ... with 174 more rows
Questão 2
Parcialmente correto
Atingiu 0,20 de 1,00
Execute o script indicado nesta atividade. Em seguida julgue as alternativas como verdadeiras ou falsas:
#O objeto url abaixo indica onde está na internet a tabela com os dados sobre municípios brasileiros
url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv"
#O comando read_csv permite ler para a sua máquina o conteúdo de uma tabela que está no endereço especi�cado no objeto url
#o conteúdo da tabela é passado para o dataframe dados_municipios
dados_municipios<- read_csv(url)
dados_municipios%>%
�lter(sigla_uf != "DF") %>%
group_by(sigla_uf) %>%
summarise(
media_populacao_municipios = mean(populacao)
) %>%
arrange(desc(media_populacao_municipios))
a. O estado de São Paulo possui a maior média de população dos seus municípios.

b. O estado do Acre está entre os dez estados com maior média de população nos seus municípios.

c. O Rio de Janeiro é o único estado que tem uma média de população dos seus municípios maior do que 100.000
habitantes.

d. Todos os 10 estados com maior média de população nos seus municípios têm essa média acima dos 50.000
habitantes.

e. A Bahia não aparece na lista dos dez estados com maior média de população por município.

Verdadeira
Falsa
Falsa
Verdadeira
Verdadeira
Sua resposta está parcialmente correta.
Você selecionou corretamente 1.
A a�rmativa “a” é falsa – o estado do Rio de Janeiro ocupa a primeira posição. A opção “b” é verdadeira – o Acre é o décimo do ranking. A
opção “c” é verdadeira – o Rio de Janeiro, com média de 188763 habitantes nos seus municípios, é o único com esta medida acima de
100.000 habitantes. A opção “d” é falsa – CE, RR e AC possuem uma média inferior a 50.000 habitantes. A opção “e” é verdadeira – a lista
dos 10 estados compreende: RJ, SP, AM, PA, ES, PE, CE, RR, AC. 
A resposta correta é: a. O estado de São Paulo possui a maior média de população dos seus municípios. → Falsa, b. O estado do Acre está
entre os dez estados com maior média de população nos seus municípios. → Verdadeira, c. O Rio de Janeiro é o único estado que tem
uma média de população dos seus municípios maior do que 100.000 habitantes. → Verdadeira, d. Todos os 10 estados com maior média
de população nos seus municípios têm essa média acima dos 50.000 habitantes. → Falsa, e. A Bahia não aparece na lista dos dez
estados com maior média de população por município. → Verdadeira.
https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv
Questão 3
Incorreto
Atingiu 0,00 de 1,00
Grá�cos de ranking em formato de barras horizontal ajudam você a identi�car de forma rápida as ocorrências mais relevantes de uma
dada variável categórica, tendo como referência alguma variável quantitativa. 
Assinale a alternativa que apresenta o grá�co que melhor descreve um ranking de população das 10 cidades mais populosas do Brasil:
Escolha uma opção:
a. 
b.
c.
d.
e.
Sua resposta está incorreta.
O grá�co da alternativa “c” traz as dez cidades mais populosas do Brasil, como também lista os municípios em ordem decrescente de
população. 
A resposta correta é: 
Questão 4
Correto
Atingiu 1,00 de 1,00
Assinale a alternativa que apresenta o script que permite analisar a evolução da expectativa de vida no Brasil ao longo do tempo.
Escolha uma opção:
a. library(dados)
library(tidyverse)
dados_gapminder %>%
�lter(pais=="Brasil") %>%
ggplot()+
geom_point(aes(x=pib_per_capita, y=expectativa_de_vida))
b. library(dados)
library(tidyverse)
dados_gapminder %>%
�lter(ano==2007) %>%
slice_max(order_by = expectativa_de_vida, n=10) %>%
mutate(pais = reorder(pais,expectativa_de_vida)) %>%
ggplot()+
geom_col(aes(x=expectativa_de_vida, y=pais))
c. library(dados)
library(tidyverse)
dados_gapminder %>%
�lter(pais=="Brasil") %>%
ggplot()+
geom_line(aes(x=ano, y=pib_per_capita))
d. library(dados)
library(tidyverse)
dados_gapminder %>%
�lter(pais=="Brasil") %>%
ggplot()+
geom_line(aes(x=ano, y=expectativa_de_vida)) +
geom_point(aes(x=ano, y=expectativa_de_vida ))

e. library(dados)
library(tidyverse)
dados_gapminder %>%
�lter(pais=="Argentina") %>%
ggplot()+
geom_point(aes(x=ano, y=expectativa_de_vida))
Sua resposta está correta.
Na opção “d” é feito um �ltro para que permaneçam apenas os dados do Brasil. O grá�co de linha possui o ano no eixo x  e a expectativa
de vida no eixo y.
A resposta correta é: library(dados)
library(tidyverse)
dados_gapminder %>%
�lter(pais=="Brasil") %>%
ggplot()+
geom_line(aes(x=ano, y=expectativa_de_vida)) +
geom_point(aes(x=ano, y=expectativa_de_vida ))
Questão 5
Correto
Atingiu 1,00 de 1,00
Observe atentamente ográ�co box-plot a seguir.
Esse é o script que gerou o grá�co anterior:
library(dados)
library(tidyverse)
dados_gapminder %>%
mutate(ano = as.character(ano)) %>%
ggplot() +
geom_boxplot(aes(x=ano, y= expectativa_de_vida)) +
scale_y_continuous(breaks=(seq(0,80,20))) +
ylim(c(0,NA)) 
a. As linhas horizontais inferiores de cada um dos quadrados representam o primeiro quartil, ou seja, 25% dos
valores de expectativa de vida dos países estão abaixo do valor representado por essa linha.

b. As medianas não se alteram ao longo dos anos.

c. Não são percebidos pontos extremos ao longo dos anos.

d. Pode-se perceber que no eixo vertical foi aplicada a escala linear com os valores apresentados ao longo do eixo
variando de 20 em 20 unidades, não tendo sido necessário, portanto, o uso da escala logarítmica.

e. A diferença entre a mediana e o terceiro quartil foi diminuindo ao longo dos anos.

Verdadeira
Falsa
Falsa
Verdadeira
Verdadeira
Sua resposta está correta.
A primeira a�rmação  é verdadeira: a primeira linha horizontal num box-plot de fato marca o primeiro quartil.  
A segunda  é falsa: as medianas aumentam ao longo dos anos. A terceira a�rmativa é falsa: o grá�co apresenta um ponto extremo
inferior no ano de 1992. A quarta é verdadeira: não foi preciso usar a escala logarítmica para o eixo vertical já que a amplitude, diferença
entre os valores mínimos e máximos, em cada ano não apresenta valor muito elevado. A última informação é verdadeira: nos primeiros
anos a mediana era mais próxima do primeiro quartil, porém os últimos anos disponíveis já mostram que a mediana se aproxima cada
vez mais do terceiro quartil. 
A resposta correta é: a. As linhas horizontais inferiores de cada um dos quadrados representam o primeiro quartil, ou seja, 25% dos
valores de expectativa de vida dos países estão abaixo do valor representado por essa linha. → Verdadeira, b. As medianas não se
alteram ao longo dos anos. → Falsa, c. Não são percebidos pontos extremos ao longo dos anos. → Falsa, d. Pode-se perceber que no eixo
Questão 6
Incorreto
Atingiu 0,00 de 1,00
vertical foi aplicada a escala linear com os valores apresentados ao longo do eixo variando de 20 em 20 unidades, não tendo sido
necessário, portanto, o uso da escala logarítmica. → Verdadeira, e. A diferença entre a mediana e o terceiro quartil foi diminuindo ao
longo dos anos. → Verdadeira.
O script abaixo gera um histograma que mostra a distribuição da quantidade de países de acordo com a renda per capita em dólares. 
library(dados)
library(tidyverse)
dados_gapminder %>%
�lter(ano==2007) %>%
ggplot() +
geom_histogram(aes(x= pib_per_capita), color="white") +
scale_y_continuous(breaks = c(seq(0,10,1)))+
scale_x_log10()
De acordo com o que está escrito no código e com o grá�co gerado, assinale a alternativa correta.
Escolha uma opção:
a. A �gura mostra a distribuição de “pib_per_capita” para todos os anos disponíveis na tabela.
b. Existe apenas um país com “pib_per_capita” menor do que 300 dólares.
c. Não existem países com “pib_per_capita” maior do que 30000 dólares.
d. O grá�co não utiliza escala logarítmica no eixo x.
e. Existem vinte países com renda “per_capita_menor” do que 1000 dólares. 
Sua resposta está incorreta.
A alternativa correta é a letra “b”, pois o grá�co de histograma revela apenas uma ocorrência à esquerda do valor 300 dólares.  
A resposta correta é: Existe apenas um país com “pib_per_capita” menor do que 300 dólares.
Questão 7
Incorreto
Atingiu 0,00 de 1,00
O código abaixo inclui a leitura de uma tabela sobre cidades brasileiras no ano 2020. Entre outras variáveis estão presentes a população
e o percentual do gasto municipal com saúde. Além disso, todo o código também gera um grá�co que mostra uma associação entre duas
variáveis e o coe�ciente de correlação. Analise com atenção. 
library(tidyverse)
url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv"
dados_saude_municipio<-
read_csv(url)
dados_saude_municipio%>%
ggplot()+
geom_point(aes(x=populacao, y=perc))+
scale_x_log10()
cor(log10(dados_saude_municipio$populacao), dados_saude_municipio$perc)
Sobre a execução do código no programa RStudio, é possível a�rmar que: 
Escolha uma opção:
a. O código usa escala logarítmica no eixo Y.
b. Pelo grá�co gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com
saúde) que é corroborado pelo coe�ciente de correlação calculado cujo valor é maior que 0.9. 

c. O coe�ciente de correlação calculado ao �nal do código indica uma correlação desprezível entre as duas variáveis, o que
corrobora a conclusão tirada ao se analisar o grá�co.  
d. Há uma correlação negativa entre população e percentual gasto com saúde.
e. Como a correlação mediu um valor entre 0.5 e 0.7, há uma associação moderada entre as duas variáveis.
Sua resposta está incorreta.
O coe�ciente de correlação medido é de 0.1117601, o que é considerado desprezível, portanto a alternativa correta é a letra “c”. 
A resposta correta é: O coe�ciente de correlação calculado ao �nal do código indica uma correlação desprezível entre as duas variáveis,
o que corrobora a conclusão tirada ao se analisar o grá�co.  
https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv
Questão 8
Incorreto
Atingiu 0,00 de 1,00
O código abaixo trabalha com a mesma tabela da questão anterior, só que agora se dedica a analisar a associação entre população e o
valor gasto com saúde. 
library(tidyverse)
url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv"
dados_saude_municipio<-
read_csv(url)
dados_saude_municipio%>%
ggplot()+
geom_point(aes(x=populacao, y=valor))+
scale_x_log10() +
scale_y_log10()
cor(log10(dados_saude_municipio$populacao), log10(dados_saude_municipio$valor))
Sobre a execução do código no programa RStudio, é possível a�rmar que: 
Escolha uma opção:
a. O código não usa escala logarítmica.
b. Pelo grá�co gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde)
que é corroborado pelo coe�ciente de correlação calculado cujo valor é maior que 0.9.
c. O coe�ciente de correlação calculado ao �nal do código indica uma correlação desprezível entre as duas variáveis, o que
corrobora a conclusão tirada ao se analisar o grá�co.  
d. Há uma correlação negativa entre população e valor gasto com saúde.
e. Como a correlação mediu um valor entre 0.5 e 0.7 há uma associação moderada entre as duas variáveis. 
Sua resposta está incorreta.
O grá�co revela uma inclinação fortemente positiva com um coe�ciente de correlação medido em 0.9449733, portanto a alternativa
correta é a letra “b”.  
A resposta correta é: Pelo grá�co gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto
com saúde) que é corroborado pelo coe�ciente de correlação calculado cujo valor é maior que 0.9.
https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv

Mais conteúdos dessa disciplina