Buscar

Estatística para Análise de Dados na Administração Pública módulo 4

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Estatística para Análise de Dados na 
Administração Pública 
Questão 1 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
O tema de dados abertos ainda é recente e passa por amadurecimento em suas práticas e 
concepções, porém já há alguns direcionamentos aceitos por grande parte da Academia e do 
Governo. 
Sobre os conceitos e temas relacionados a dados abertos, selecione a alternativa correta. 
Escolha uma opção: 
a. Os usuários precisam se cadastrar em uma página de Internet para ter acesso a dados 
abertos. 
b. O campo de dados abertos se desenvolveu de forma independente de outras inciativas 
abertas, tais como código aberto e inovação aberta. 
c. A sociedade civil organizada não tem participação no ecossistema de dados abertos. 
d. A Lei de Acesso à Informação (LAI) favoreceu a consolidação da disponibilização de dados 
abertos no Brasil. 
e. Não é possível fazer download de portais de dados abertos utilizando códigos em R. 
Feedback 
Sua resposta está correta. 
 
O artigo 8º da LAI, por prever aspectos de dados abertos, favoreceu a expansão da abertura de 
dados no Brasil, Sendo assim a alternativa correta é a letra “c” . 
 
A resposta correta é: A sociedade civil organizada não tem participação no ecossistema de 
dados abertos. 
Questão 2 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
O código abaixo mostra como se pode utilizar dados vindos do principal portal de dados 
abertos no Brasil, o site dados.gov.br. Execute o e, em seguida, analise o código e o resultado 
para indicar qual a alternativa correta. 
 
##Dados abertos de dados.gov.br 
 
#url do dado 
url_habitacao<- "http://sishab.mdr.gov.br/dados_abertos/_contratacoes_pcmv_pcva.csv" 
 
#download do dado a partir do endereço da url 
download.file(url = url_habitacao, destfile = "contratacoes_pcmv_pcva.csv", mode="wb") 
 
library(readr) 
library(tidyverse) 
library(questionr) 
 
#gera um dataframe a partir do arquivo csv baixado 
contratacoes_pcmv_pcva <- read_delim("contratacoes_pcmv_pcva.csv", 
 delim = "|", escape_double = FALSE, locale = locale(decimal_mark = ",", 
 grouping_mark = ".", encoding = 
"LATIN1"), 
 trim_ws = TRUE) 
 
 
contratacoes_2013<- 
 contratacoes_pcmv_pcva %>% 
 filter(num_ano_assinatura_contrato==2013) 
 
library(questionr) 
 
questionr::freq(contratacoes_2013$txt_modalidade_programa , cum = TRUE, sort = "dec", total 
= TRUE) 
 
Sobre a execução do código acima no programa RStudio, é possível afirmar que: 
Escolha uma opção: 
a. O ano a que o script se refere nesse dado é 2020. 
b. A tabela de frequência mostra que os seis tipos de modalidade de programa possuem a 
mesma distribuição de contratos. 
c. A modalidade de programa Rural possui a maior quantidade de contratos. 
d. Quando somados os contratos das modalidades CCFGTS e Rural percebe-se que mais de 
80% dos contratos relacionam-se com esses dois tipos. 
e. O grupo Rural está associado a 2000 contratos. 
Feedback 
Sua resposta está correta. 
 
A alternativa correta é a letra “d” pois a tabela de frequência demonstra que as modalidades de 
programa Rural e CCFGTS juntas estão associados a 84,7% de todos os contratos realizados 
em 2021. 
 
A resposta correta é: Quando somados os contratos das modalidades CCFGTS e Rural 
percebe-se que mais de 80% dos contratos relacionam-se com esses dois tipos. 
Questão 3 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
O script abaixo gera um gráfico que mostra as principais despesas obrigatórias do governo 
central brasileiro. Execute o script e analise o gráfico gerado. Em seguida, escolha a alternativa 
correta. 
 
library(rtn) 
library(tidyverse) 
 
#Códigos de contas associadas a despesas obrigatórias com controle de fluxo 
despesas_obrigatorias<- c("4.4.1.1", "4.4.1.2", "4.4.1.3","4.4.1.4","4.4.1.5" ) 
 
#gera valores acumulados em 12 meses para as contas selecionadas 
rtn::get_12_month_accumulated_account_data_by_month(despesas_obrigatorias, 
month = c(1:12), #indica que quer o valor acumulado para todos os 12 meses do ano 
 
match_required = FALSE)%>% #indica que vai fazer o match sem precisar do nome completo 
da conta 
rtn::plot_rtn_series() #gera o gráfico de linha 
Escolha uma opção: 
a. A despesa obrigatória com Saúde apresenta valores superiores a todas as demais desde o 
início da série. 
b. A rubrica Bolsa Família e Auxílio Brasil apresenta um comportamento estável, com pouca 
variação durante toda a série. 
c. A rubrica Demais apresenta valores maiores do que Educação em todo o período analisado. 
d. As séries apresentam valores maiores que 0 desde o ano 2000. 
e. A despesa obrigatória com Educação apresenta um forte crescimento a partir do ano de 
2020. 
Feedback 
Sua resposta está correta. 
 
A letra “a” é a alternativa correta. Desde 2008 quando os dados começam a apresentar valores 
maiores que zero a despesa obrigatória com Saúde é maior do que todos os outros tipos de 
despesas obrigatórias. 
 
A resposta correta é: A despesa obrigatória com Saúde apresenta valores superiores a todas 
as demais desde o início da série. 
Questão 4 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
O gráfico logo abaixo é gerado a partir do seguinte código que utiliza a biblioteca {rcofog}. 
 
library(Rcofog) 
library(tidyverse) 
 
funcoes<- c("Saúde","Educação") 
 
Rcofog::dataTimeSeries(funcoes) %>% 
Rcofog::graphTimeSeries() 
 
 
Analise o gráfico e escolha a alternativa correta. 
Escolha uma opção: 
a. Os gastos com Saúde são maiores do que os com Educação durante todo o período 
analisado. 
b. Os gastos com Saúde sempre são superiores a 6% do gasto total. 
c. O pico do % gasto com Educação ocorre em 2014. 
d. Em 2020 o gasto com Saúde ultrapassa 7% do gasto total. 
e. Os gastos com Educação sempre são superiores a 6% do gasto total. 
Feedback 
Sua resposta está correta. 
 
Pelo gráfico percebe-se que em 2020 o gasto com Saúde apresenta valor entre 7% e 7,5% do 
gasto total, portanto a alternativa correta é a letra “d”. 
 
A resposta correta é: Em 2020 o gasto com Saúde ultrapassa 7% do gasto total. 
Questão 5 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Analise o script abaixo que gera o gráfico que você vê logo a seguir. O gráfico demonstra uma 
comparação entre as idades de homens e mulheres internados em hospitais de Goiás em 
dezembro de 2020, de acordo com o SIH-RD. 
 
library(microdatasus) 
library(tidyverse) 
 
 
ano_inicio<- 2020 
ano_fim <- 2020 
mes_inicio<-12 
mes_fim<-12 
estado<- "GO" 
 
#Traz dados sobre internações hospitalares: SIH-RD 
resultado<-microdatasus::fetch_datasus(year_start = ano_inicio, 
year_end = ano_fim, 
uf = estado, 
month_start = mes_inicio, 
month_end = mes_fim, 
information_system = "SIH-RD") 
 
dados_internacoes<- microdatasus::process_sih(resultado) 
 
dados_internacoes%>% 
filter(COD_IDADE=="Anos")%>% #filtrar para excluir bebês que ainda não completaram um 
ano 
mutate(IDADE = as.numeric(IDADE))%>% #converte idade de variável categórica para 
numérica 
ggplot() + 
geom_boxplot(aes(x=SEXO, y=IDADE)) + 
scale_y_continuous(breaks = seq(0,100,10)) 
 
 
 
Sobre a análise do gráfico, assinale qual a alternativa verdadeira. 
Escolha uma opção: 
a. A mediana de idade de pessoas do sexo masculino internadas é maior do que 70 anos. 
b. O primeiro quartil de idade de pessoas do sexo feminino internadas é menor do que 20 anos. 
c. Existem valores extremos (outliers) no gráfico para o box-plot do sexo feminino. 
d. O gráfico utiliza transformação logarítmica. 
e. A mediana de idade de pessoas internadas do sexo masculino é maior do que a do sexo 
feminino. 
Feedback 
Sua resposta está correta. 
 
Como se vê no gráfico, a medianada idade de internação para o sexo masculino é de 
aproximadamente 50 anos, portanto superior à do sexo feminino que no gráfico aponta para 
uma idade próxima de 40 anos. A alternativa correta é a letra “e”. 
 
A resposta correta é: A mediana de idade de pessoas internadas do sexo masculino é maior do 
que a do sexo feminino. 
Questão 6 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Execute o código abaixo que traz uma tabela de frequência de tipo de gestão de hospitais para 
o estado do Ceará em dezembro de 2020. 
 
library(microdatasus) 
library(tidyverse) 
library(questionr) 
 
ano_inicio<- 2020 
ano_fim <- 2020 
mes_inicio<-12 
mes_fim<-12 
estado<- "CE" 
 
#Traz dados sobre internações hospitalares: CNES-ST 
resultado<-microdatasus::fetch_datasus(year_start = ano_inicio, 
year_end = ano_fim, 
uf = estado, 
month_start = mes_inicio, 
 month_end = mes_fim, 
 information_system = "CNES-ST") 
 
dados_hospitais<- microdatasus::process_cnes(resultado) 
questionr::freq(dados_hospitais$TPGESTAO, cum = TRUE, sort = "dec", total = TRUE) 
 
Sobre o resultado da execução do código, assinale a alternativa correta. 
Escolha uma opção: 
a. Em dezembro de 2020 havia mais de 13000 hospitais da rede SUS ativos no Ceará. 
b. O número de hospitais estaduais no Ceará representa menos que 2% do número total de 
hospitais. 
c. O número de hospitais com dupla gestão no Ceará atinge 1% do total de hospitais. 
d. A quantidade de hospitais municipais e estaduais no Ceará corresponde conjuntamente a 
99,9% do total de estabelecimentos ligados ao SUS no estado. 
e. No Ceará havia 12650 hospitais municipais em funcionamento em dezembro de 2020. 
Feedback 
Sua resposta está correta. 
 
A tabela de frequência mostra que a frequência relativa acumulada para os hospitais 
municipais e estaduais em dezembro de 2020 é 99,9%. A alternativa correta é a letra “d”. 
 
A resposta correta é: A quantidade de hospitais municipais e estaduais no Ceará corresponde 
conjuntamente a 99,9% do total de estabelecimentos ligados ao SUS no estado. 
Questão 7 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
O script abaixo gera o gráfico que você vê em seguida. Trata-se de informação sobre o total de 
escolas em cada UF do Brasil. 
library(tidyverse) 
 
#Endereço onde está o arquivo com dados de censo escolar 
url_dados_2021<- 
"https://download.inep.gov.br/dados_abertos/microdados_censo_escolar_2021.zip" 
 
#Faz o download do arquivo 
download.file(url= url_dados_2021,destfile="censo_escolar_2021.zip", mode="wb") 
 
#Descompacta o arquivo zio 
unzip("censo_escolar_2021.zip", files = 
"microdados_ed_basica_2021/dados/microdados_ed_basica_2021.csv") 
 
 
#lê o arquivo csv que estava no arquivo zip e alimenta o dataframe 
microdados_ed_basica_2021 <- 
read_delim("microdados_ed_basica_2021/dados/microdados_ed_basica_2021.csv", 
 delim = ";", escape_double = FALSE, locale = locale(encoding = 
"LATIN1"), 
 trim_ws = TRUE) 
 
#Verificar uma amostra dos dados presentes no dataframe 
glimpse(microdados_ed_basica_2021) 
 
#Gera gráfico de ranking no número de escolas 
microdados_ed_basica_2021 %>% 
 group_by(SG_UF) %>% 
 summarise( 
 quantidade = n() 
 ) %>% 
 mutate(SG_UF = reorder(SG_UF, quantidade)) %>% 
 ungroup() %>% 
 ggplot() + 
 geom_col(aes(x=quantidade, y=SG_UF)) + 
 scale_x_continuous(breaks = seq(0,35000,5000)) 
 
 
 
 
A partir da análise do gráfico acima, assinale a alternativa correta. 
Escolha uma opção: 
a. Apenas São Paulo tem mais de 25.000 escolas. 
b. Rio de Janeiro ocupa a terceira colocação no número de escolas. 
c. Não existem estados com menos de 5.000 escolas. 
d. Roraima ocupa a última posição no ranking de número de escolas. 
e. Existem apenas dois estados com mais de 15.000 escolas. 
Feedback 
Sua resposta está correta. 
 
Como se vê no gráfico, São Paulo possui quase 35.000 escolas. A segunda colocação fica com 
o Estado de Minas Gerais que apresenta menos de 25.000 escolas. A alternativa correta é a 
letra “a”. 
 
A resposta correta é: Apenas São Paulo tem mais de 25.000 escolas. 
Questão 8 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
O gráfico abaixo mostra a distribuição de escolas entre federais, estaduais, municipais e 
privadas. Faça uma análise deste gráfico e considere a seguinte codificação. 
 
#TP_DEPENDENCIA 
#1 - Federal 
#2 - Estadual 
#3 - Municipal 
#4 – Privada 
 
A partir da análise do gráfico e da codificação, assinale a alternativa correta. 
Escolha uma opção: 
a. As escolas federais estão presentes em todos os estados. 
b. As escolas municipais são as mais numerosas em todos os estados com exceção do DF. 
c. O Maranhão tem mais escolas privadas do que o Rio de Janeiro. 
d. A Bahia tem mais escolas estaduais do que o Rio Grande do Sul. 
e. O Ceará tem mais escolas privadas do que Pernambuco. 
Feedback 
Sua resposta está correta. 
 
Fica claro no gráfico que não há escolas municipais, representadas pela cor verde, no DF. A 
alternativa correta é a letra “b”. 
 
A resposta correta é: As escolas municipais são as mais numerosas em todos os estados com 
exceção do DF.

Continue navegando