Buscar

estatistica para analise de dados adm pública

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 14 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 14 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 14 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1. estatistica_ad | - Turma FEV/2024
2. Exercício avaliativo - Módulo 3
QUESTIONÁRIO
Exercício avaliativo - Módulo 3
	Iniciado em
	domingo, 4 fev. 2024, 11:09
	Estado
	Finalizada
	Concluída em
	domingo, 4 fev. 2024, 11:15
	Tempo empregado
	6 minutos 10 segundos
	Notas
	8,00/8,00
	Avaliar
	25,00 de um máximo de 25,00(100%)
Parte superior do formulário
Questão 1
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Analise o script abaixo. 
library(tidyverse)
#O objeto url abaixo indica onde está na internet a tabela com os dados sobre municípios brasileiros
url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv"
#O comando read_csv permite ler para a sua máquina o conteúdo de uma tabela que está no endereço especificado no objeto url
#o conteúdo da tabela é passado para o dataframe dados_municipios
dados_municipios<- read_csv(url)
dados_municipios%>%
filter(sigla_uf == "CE") %>%
select(sigla_uf,nome, populacao) %>%
arrange(desc(populacao))
Qual o resultado da execução do script acima?  
Escolha uma opção:
a.
	# A tibble: 185 x 3
	
	sigla_uf
	nome
	populacao
	
	<chr>
	<chr>
	<dbl>
	1
	PE
	Recife
	1653461
	2
	PE
	Jaboatão dos Guararapes
	706867
	3
	PE
	Olinda
	393115
	4
	PE
	Caruaru
	365278
	5
	PE
	Petrolina
	354317
	6
	PE
	Paulista
	334376
	7
	PE
	Cabo de Santo Agostinho
	208944
	8
	PE
	Camaragibe
	158899
	9
	PE
	Garanhuns
	140577
	10
	PE
	Vitória de Santo Antão
	139583
	# ... with 175 more rows
b.
	# A tibble: 184 x 2
	
	nome
	populacao
	
	<chr>
	<dbl>
	1
	Fortaleza
	2686612
	2
	Caucaia
	365212
	3
	Juazeiro do Norte
	276264
	4
	Maracanaú
	229458
	5
	Sobral
	210711
	6
	Crato
	133031
	7
	Itapipoca 
	130539
	8
	Maranguape
	130346
	9
	Iguatu
	103074
	10
	Quixadá
	88321
	# ... with 174 more rows
c.
	# A tibble: 184 x 3
	
	sigla_uf
	nome
	populacao
	
	<chr>
	<chr>
	<dbl>
	1
	CE
	Abaiara
	11853
	2
	CE
	Acarape
	15036
	3
	CE
	Acaraú
	63104
	4
	CE
	Acopiara
	54481
	5
	CE
	Aiuaba
	17493
	6
	CE
	Alcântaras
	11781
	7
	CE
	Altaneira
	7650
	8
	CE
	Alto Santo
	17196
	9
	CE
	Amontada
	43829
	10
	CE
	Antonina do Norte
	7378
	# ... with 174 more rows
d.
	# A tibble: 369 x 3 
	
	sigla_uf
	nome
	populacao
	
	<chr>
	<chr>
	<dbl>
	1
	CE
	Fortaleza
	2686612
	2
	CE
	Recife
	1653461
	3
	CE
	Jaboatão dos Guararapes
	706867
	4
	CE
	Olinda
	393115
	5
	CE
	Caruaru
	365278
	6
	CE
	Caucaia
	365212
	7
	CE
	Petrolina
	354317
	8
	CE
	Paulista
	334376
	9
	CE
	Juazeiro do Norte
	276264
	10
	CE
	Maracanaú
	229458
	# ... with 359 more rows
e.
	# A tibble: 184 x 3 
	
	sigla_uf
	nome
	populacao
	
	<chr>
	<chr>
	<dbl>
	1
	CE
	Fortaleza
	2686612
	2
	CE
	Caucaia
	365212
	3
	CE
	Juazeiro do Norte
	276264
	4
	CE
	Maracanaú
	229458
	5
	CE
	Sobral
	210711
	6
	CE
	Crato
	133031
	7
	CE
	Itapipoca
	130539
	8
	CE
	Maranguape
	130346
	9
	CE
	Iguatu
	103074
	10
	CE
	Quixadá
	88321
	# ... with 174 more rows
Feedback
Sua resposta está correta.
A opção “e” corresponde aos filtros de coluna e linha aplicados no script, bem como traz os valores de população em ordem decrescente, tal como indicado no script.
A resposta correta é:
	# A tibble: 184 x 3 
	
	sigla_uf
	nome
	populacao
	
	<chr>
	<chr>
	<dbl>
	1
	CE
	Fortaleza
	2686612
	2
	CE
	Caucaia
	365212
	3
	CE
	Juazeiro do Norte
	276264
	4
	CE
	Maracanaú
	229458
	5
	CE
	Sobral
	210711
	6
	CE
	Crato
	133031
	7
	CE
	Itapipoca
	130539
	8
	CE
	Maranguape
	130346
	9
	CE
	Iguatu
	103074
	10
	CE
	Quixadá
	88321
	# ... with 174 more rows
Questão 2
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Execute o script indicado nesta atividade. Em seguida julgue as alternativas como verdadeiras ou falsas:
#O objeto url abaixo indica onde está na internet a tabela com os dados sobre municípios brasileiros
url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_municipios.csv"
#O comando read_csv permite ler para a sua máquina o conteúdo de uma tabela que está no endereço especificado no objeto url
#o conteúdo da tabela é passado para o dataframe dados_municipios
dados_municipios<- read_csv(url)
 
dados_municipios%>%
filter(sigla_uf != "DF") %>%
group_by(sigla_uf) %>%
summarise(
media_populacao_municipios = mean(populacao)
) %>%
arrange(desc(media_populacao_municipios))
	a. O estado de São Paulo possui a maior média de população dos seus municípios.
	Resposta 1 
	b. O estado do Acre está entre os dez estados com maior média de população nos seus municípios.
	Resposta 2 
	c. O Rio de Janeiro é o único estado que tem uma média de população dos seus municípios maior do que 100.000 habitantes.
	Resposta 3 
	d. Todos os 10 estados com maior média de população nos seus municípios têm essa média acima dos 50.000 habitantes.
	Resposta 4 
	e. A Bahia não aparece na lista dos dez estados com maior média de população por município.
	Resposta 5 
Feedback
Sua resposta está correta.
A afirmativa “a” é falsa – o estado do Rio de Janeiro ocupa a primeira posição. A opção “b” é verdadeira – o Acre é o décimo do ranking. A opção “c” é verdadeira – o Rio de Janeiro, com média de 188763 habitantes nos seus municípios, é o único com esta medida acima de 100.000 habitantes. A opção “d” é falsa – CE, RR e AC possuem uma média inferior a 50.000 habitantes. A opção “e” é verdadeira – a lista dos 10 estados compreende: RJ, SP, AM, PA, ES, PE, CE, RR, AC. 
A resposta correta é: a. O estado de São Paulo possui a maior média de população dos seus municípios. → Falsa, b. O estado do Acre está entre os dez estados com maior média de população nos seus municípios. → Verdadeira, c. O Rio de Janeiro é o único estado que tem uma média de população dos seus municípios maior do que 100.000 habitantes. → Verdadeira, d. Todos os 10 estados com maior média de população nos seus municípios têm essa média acima dos 50.000 habitantes. → Falsa, e. A Bahia não aparece na lista dos dez estados com maior média de população por município. → Verdadeira.
Questão 3
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Gráficos de ranking em formato de barras horizontal ajudam você a identificar de forma rápida as ocorrências mais relevantes de uma dada variável categórica, tendo como referência alguma variável quantitativa. 
Assinale a alternativa que apresenta o gráfico que melhor descreve um ranking de população das 10 cidades mais populosas do Brasil:
Escolha uma opção:
a.
b.
c.
d.
e.
Feedback
Sua resposta está correta.
O gráfico da alternativa “c” traz as dez cidades mais populosas do Brasil, como também lista os municípios em ordem decrescente de população. 
A resposta correta é: 
Questão 4
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Assinale a alternativa que apresenta o script que permite analisar a evolução da expectativa de vida no Brasil ao longo do tempo.
Escolha uma opção:
a.
library(dados)
library(tidyverse)
dados_gapminder %>%
filter(pais=="Brasil") %>%
ggplot()+
geom_point(aes(x=pib_per_capita, y=expectativa_de_vida))
b.
library(dados)
library(tidyverse)
dados_gapminder %>%
filter(ano==2007) %>%
slice_max(order_by = expectativa_de_vida, n=10) %>%
mutate(pais = reorder(pais,expectativa_de_vida)) %>%
ggplot()+
geom_col(aes(x=expectativa_de_vida, y=pais))
c.
library(dados)
library(tidyverse)
dados_gapminder %>%
filter(pais=="Brasil") %>%
ggplot()+
geom_line(aes(x=ano, y=pib_per_capita))
d.
library(dados)
library(tidyverse)
dados_gapminder %>%
filter(pais=="Brasil") %>%
ggplot()+
geom_line(aes(x=ano, y=expectativa_de_vida)) +
geom_point(aes(x=ano, y=expectativa_de_vida ))
e.
library(dados)
library(tidyverse)
dados_gapminder %>%
filter(pais=="Argentina") %>%
ggplot()+
geom_point(aes(x=ano, y=expectativa_de_vida))
Feedback
Sua resposta está correta.
Na opção “d” é feito um filtro para que permaneçam apenas os dados do Brasil. O gráfico de linha possui o ano no eixo x  e a expectativa de vida no eixo y.
A resposta correta é: library(dados)
library(tidyverse)
dados_gapminder%>%
filter(pais=="Brasil") %>%
ggplot()+
geom_line(aes(x=ano, y=expectativa_de_vida)) +
geom_point(aes(x=ano, y=expectativa_de_vida ))
Questão 5
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Observe atentamente o gráfico box-plot a seguir.
Esse é o script que gerou o gráfico anterior:
library(dados)
library(tidyverse)
dados_gapminder %>%
mutate(ano = as.character(ano)) %>%
ggplot() +
geom_boxplot(aes(x=ano, y= expectativa_de_vida)) +
scale_y_continuous(breaks=(seq(0,80,20))) +
ylim(c(0,NA)) 
	a. As linhas horizontais inferiores de cada um dos quadrados representam o primeiro quartil, ou seja, 25% dos valores de expectativa de vida dos países estão abaixo do valor representado por essa linha.
	Resposta 1 
	b. As medianas não se alteram ao longo dos anos.
	Resposta 2 
	c. Não são percebidos pontos extremos ao longo dos anos.
	Resposta 3 
	d. Pode-se perceber que no eixo vertical foi aplicada a escala linear com os valores apresentados ao longo do eixo variando de 20 em 20 unidades, não tendo sido necessário, portanto, o uso da escala logarítmica.
	Resposta 4 
	e. A diferença entre a mediana e o terceiro quartil foi diminuindo ao longo dos anos.
	Resposta 5 
Feedback
Sua resposta está correta.
A primeira afirmação  é verdadeira: a primeira linha horizontal num box-plot de fato marca o primeiro quartil.  
A segunda  é falsa: as medianas aumentam ao longo dos anos. A terceira afirmativa é falsa: o gráfico apresenta um ponto extremo inferior no ano de 1992. A quarta é verdadeira: não foi preciso usar a escala logarítmica para o eixo vertical já que a amplitude, diferença entre os valores mínimos e máximos, em cada ano não apresenta valor muito elevado. A última informação é verdadeira: nos primeiros anos a mediana era mais próxima do primeiro quartil, porém os últimos anos disponíveis já mostram que a mediana se aproxima cada vez mais do terceiro quartil. 
A resposta correta é: a. As linhas horizontais inferiores de cada um dos quadrados representam o primeiro quartil, ou seja, 25% dos valores de expectativa de vida dos países estão abaixo do valor representado por essa linha. → Verdadeira, b. As medianas não se alteram ao longo dos anos. → Falsa, c. Não são percebidos pontos extremos ao longo dos anos. → Falsa, d. Pode-se perceber que no eixo vertical foi aplicada a escala linear com os valores apresentados ao longo do eixo variando de 20 em 20 unidades, não tendo sido necessário, portanto, o uso da escala logarítmica. → Verdadeira, e. A diferença entre a mediana e o terceiro quartil foi diminuindo ao longo dos anos. → Verdadeira.
Questão 6
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
O script abaixo gera um histograma que mostra a distribuição da quantidade de países de acordo com a renda per capita em dólares. 
library(dados)
library(tidyverse)
dados_gapminder %>%
filter(ano==2007) %>%
ggplot() +
geom_histogram(aes(x= pib_per_capita), color="white") +
scale_y_continuous(breaks = c(seq(0,10,1)))+
scale_x_log10()
De acordo com o que está escrito no código e com o gráfico gerado, assinale a alternativa correta.
Escolha uma opção:
a.
A figura mostra a distribuição de “pib_per_capita” para todos os anos disponíveis na tabela.
b.
Existe apenas um país com “pib_per_capita” menor do que 300 dólares.
c.
Não existem países com “pib_per_capita” maior do que 30000 dólares.
d.
O gráfico não utiliza escala logarítmica no eixo x.
e.
Existem vinte países com renda “per_capita_menor” do que 1000 dólares.
Feedback
Sua resposta está correta.
A alternativa correta é a letra “b”, pois o gráfico de histograma revela apenas uma ocorrência à esquerda do valor 300 dólares.  
A resposta correta é: Existe apenas um país com “pib_per_capita” menor do que 300 dólares.
Questão 7
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
O código abaixo inclui a leitura de uma tabela sobre cidades brasileiras no ano 2020. Entre outras variáveis estão presentes a população e o percentual do gasto municipal com saúde. Além disso, todo o código também gera um gráfico que mostra uma associação entre duas variáveis e o coeficiente de correlação. Analise com atenção. 
library(tidyverse)
url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv"
dados_saude_municipio<-
read_csv(url)
dados_saude_municipio%>%
ggplot()+
geom_point(aes(x=populacao, y=perc))+
scale_x_log10()
cor(log10(dados_saude_municipio$populacao), dados_saude_municipio$perc)
Sobre a execução do código no programa RStudio, é possível afirmar que: 
Escolha uma opção:
a.
O código usa escala logarítmica no eixo Y.
b.
Pelo gráfico gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde) que é corroborado pelo coeficiente de correlação calculado cujo valor é maior que 0.9. 
c.
O coeficiente de correlação calculado ao final do código indica uma correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o gráfico.  
d.
Há uma correlação negativa entre população e percentual gasto com saúde.
e.
Como a correlação mediu um valor entre 0.5 e 0.7, há uma associação moderada entre as duas variáveis.
Feedback
Sua resposta está correta.
O coeficiente de correlação medido é de 0.1117601, o que é considerado desprezível, portanto a alternativa correta é a letra “c”. 
A resposta correta é: O coeficiente de correlação calculado ao final do código indica uma correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o gráfico.  
Questão 8
Correto
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
O código abaixo trabalha com a mesma tabela da questão anterior, só que agora se dedica a analisar a associação entre população e o valor gasto com saúde. 
library(tidyverse)
url<- "https://raw.githubusercontent.com/fernandobarbalho/enap_auto_instucional/main/data/dados_saude_municipio.csv"
dados_saude_municipio<-
read_csv(url)
dados_saude_municipio%>%
ggplot()+
geom_point(aes(x=populacao, y=valor))+
scale_x_log10() +
scale_y_log10()
cor(log10(dados_saude_municipio$populacao), log10(dados_saude_municipio$valor))
Sobre a execução do código no programa RStudio, é possível afirmar que: 
Escolha uma opção:
a.
O código não usa escala logarítmica.
b.
Pelo gráfico gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde) que é corroborado pelo coeficiente de correlação calculado cujo valor é maior que 0.9.
c.
O coeficiente de correlação calculado ao final do código indica uma correlação desprezível entre as duas variáveis, o que corrobora a conclusão tirada ao se analisar o gráfico.  
d.
Há uma correlação negativa entre população e valor gasto com saúde.
e.
Como a correlação mediu um valor entre 0.5 e 0.7 há uma associação moderada entre as duas variáveis.
Feedback
Sua resposta está correta.
O gráfico revela uma inclinação fortemente positiva com um coeficiente de correlação medido em 0.9449733, portanto a alternativa correta é a letra “b”.  
A resposta correta é: Pelo gráfico gerado percebe-se uma forte inclinação positiva (quanto maior a população maior o percentual gasto com saúde) que é corroborado pelo coeficiente de correlação calculado cujo valor é maior que 0.9.
Parte inferior do formulário
Falsa
Verdadeira
Falsa

Continue navegando