Buscar

LEANDRO ZAMBELLI RIBEIRO-MATRICULA01476523

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Fundamentos em Data Science e Análise Estatística de Dados 
SRAG 2019 - Banco de Dados de Síndrome 
Respiratória Aguda Grave
 
LEANDRO ZAMBELLI RIBEIRO
MATRICULA
01476523 
Ciência de Dados
 “2.1 ESTATÍSTICA DESCRITIVA A Estatística Descritiva se preocupa com a organização, apresentação e sintetização de dados. Utilizam gráficos, tabelas e medidas descritivas como ferramentas. Utilizada na etapa inicial da análise, destinada a obter informações que indicam possíveis modelos a serem utilizados numa fase final que seria a chamada inferência estatística.”
 A HYPERLINK "mailto:https://docs.ufpr.br/~benitoag/apostilamedri.pdf"postila HYPERLINK "mailto:https://docs.ufpr.br/~benitoag/apostilamedri.pdf"do professor DR. Waldir HYPERLINK "mailto:https://docs.ufpr.br/~benitoag/apostilamedri.pdf"Metri HYPERLINK "mailto:https://docs.ufpr.br/~benitoag/apostilamedri.pdf":
Apresento em previ linhas um resumo inicial dessa atividade contextualizada:
Projetando um ambiente de trabalho através de coleta de dados dentre de analise experimentais somando-se a uma massa de dados certificados, podendo ser esses fora de ordens, sendo brutos. Em modelagem bruta esses dados não dizem muitas coisas ou nada, ou seja, estar nesse prisma a importância de uma analise descritiva, para apresentar entre suas series de dados certificados de fontes oficiais para a geração de conhecimentos. 
Por suas freqüências que por meio de representação dos números de vezes entre um valor e/ou intervalo que ocorre em base de dados. Sendo apresentada em forma de tabela, fazendo uma associação entre os valores de uma variável. 
 
Todos os anos o Ministério da Saúde, por meio da Secretaria de Vigilância em Saúde (SVS), produz dados públicos de vigilância da Síndrome Respiratória Aguda Grave (SRAG) no Brasil a partir 2009, com o linear da pandemia de Influenza A(H1N1)pdm09. Com a implantação da vigilância de SRAG.
Partindo deste princípio analisei esses dados de 2019, para uma posterior analise comparativa com os dados do covid—2019 quando estiver disponível ao publico pelo Ministério da Saúde, com base nessa origem dos Dados: https://dados.gov.br/dados/conjuntos-dados/srag-2019.
Com base no arquivo csv baixado no link acima, faço uma análise de estatística de dados conforme o material estudado nas unidades, com prática na linguagem r, usando a IDE RSTUDIO. Importando um aquivo csv, poderia fazer essa importação para um banco de dados relacional, poderia usar a ide python com exemplo.
Seguindo com os estudos propostos nas unidades, vou fazer uma analise previa bem resumida sobre os dados de Síndrome de Respiratória Aguda Grave, tendo como fonte os dados do Governo Federal, como se segue:
Cruzamento de Dados SRAG 2019:
Faço um prévio levantamento desses dados publicados no ano de 2019, por Sexo, Estado, Idade e Regiões: 
Método aplicado RS STUDIO – SRAG 2019:
1 - Conectando o arquivo baixado no RSTUDIO:
av1 <- read.csv2("INFLUD19.csv"), incluir o campo idade, que calcula a idade dos pacientes com base no campo DT_NASC no arquivo do Excel (=(ANO(AGORA())-ANO(A2)-3)), detalhe o -3 significa que o ano atual (2022-3) = o ano da fonte de dados (2019).
CRIANDO FATORES:
av1$CS_SEXO <- factor(av1$CS_SEXO)
av1$DT_N ASC <- factor(av1$DT_NASC)
av1$IDADE <- factor(av1$IDADE)
str(av1)
tabelasexo=table(av1)
# Criar objeto com a tabela 
tabelasexo=table(av1$CS_SEXO) 
# Calcular o percentual 
percent=signif(tabelasexo /sum(tabelasexo)*100,3)
 #Criando array dos nomes da legenda 
nomesleg=c("ignorado","mulher","homem" )
 #Plota-se o gráfico de pizza
 pie(tabelasexo, labels = paste(percent, "%", sep=""), col = terrain.colors(5), # Determina cores radius = 1) legend(x="topright", # Determina posição da legenda legend=nomesleg, # Insere nomes da legenda cex = 0.65, # Tamanho do texto fill = terrain.colors(5)) # Determina cores
 
pie(tabelauf, labels = paste(percent, "%", sep=""), col = terrain.colors(5), # Determina cores radius = 1) legend(x="topright", # Determina posição da legenda legend=mesleg, # Insere nomes da legenda cex = 0.65, # Tamanho do texto fill = terrain.colors(5)) # Determina cores
#TABELA UNIDADES DA FEDERAÇÃO
#QUANTIDADE
tabelauf = table(av1$SG_UF)
#PORCENTAGEM UF
percentuf=signif(tabelauf /sum(tabelauf)*100,3)
#MÉDIA POR MÊS
tabelauf/12
	UF
FEDERAÇÃO
	 QUANTIDADE
	PORC (%)
	 MEDIA 
 MÊS 
	AC
	349
	0,70
	29,83
	AL
	245
	0,49
	20,41
	AM
	1917
	3,88
	159,50
	AP
	51
	0,10
	4,25
	BA
	1819
	3,68
	151,83
	CE
	1064
	2,15
	88,66
	DF
	1775
	3,59
	147,91
	ES
	842
	1,70
	70,16
	GO
	1371
	2,78
	114,25
	MA
	261
	0,53
	21,75
	MG
	4014
	8,13
	334,50
	MS
	1737
	3,52
	144,75
	MT
	332
	0,67
	27,66
	PA
	1082
	2,19
	90,16
	PB
	376
	0,76
	31,33
	PE
	2572
	5,21
	214,33
	PI
	465
	0,94
	38,75
	PR
	6797
	13,80
	566,41
	RJ
	2410
	4,88
	200,83
	RN
	337
	0,68
	28,08
	RO
	169
	0,34
	14,83
	RR
	33
	0,06
	2,75
	RS
	3573
	7,23
	297,75
	SC
	2151
	4,36
	179,25
	SE
	258
	0,52
	21,50
	SP
	12248
	24,80
	1020,66
	TO
	243
	0,49
	20,25
 Mês <- c(tabelauf/12)
 Summary(mês por Unidade da Federação)
 
	 Min. 1st Qu. Median Mean 3rd Qu. Max. 
	 2.75 26.19 81.71 146.99 164.62 1020.67
 ano <- c(tabelauf)
 Summary(ano por Unidade da Federação)
	 Min. 1st Qu. Median Mean 3rd Qu. Max. 
	 33.0 314.2 980.5 1763.9 1975.5 12248.0
 summary(por Idade)
 
	IDADE 
	 Min. : 0.00 
	Median : 7.00 
	Mean : 26.92 
	Qu.: 53.00 
Totais por Regiões - vigilância da Síndrome Respiratória Aguda Grave 
(SRAG) 2019:
	 Região
	 Quantitativo
	 % 
	 NORTE 
	 3844
	 7,94
	 NORDESTE
	 7297
	 15,80
	 SUDESTE
	 19514
	 40,32
	 CENTRO OESTE
	 5215
	 10,78
	 SUL
	 12521
	 25,88
	TOTAL
	 48391
	
Referências:
1 - Dados abertos, Governo Federal do Brasil. Estatística de analise de Dados, 2020, SRAG 2019 - Banco de Dados de Síndrome Respiratória Aguda Grave, Disponível em: 
https://dados.gov.br/dados/conjuntos-dados/srag-2019
Acesso em: 26/04/2023
2 - Landeiro, Victor Lemes. Estatística de analise de Dados. Introdução ao uso do programa R, 2011. Disponível em: 
https://cran.r-project.org/doc/contrib/Landeiro-Introducao.pdf. 
Acesso em: 27/04/2023
3 – Filho, Prof. Adriano Azevedo, Estatística de analise de Dados. Análise de Dados com o Software R e Métodos Estatísticos, Computacionais e Econométricos, sem ano. 
Disponível em:
http://rstudio-pubs-static.s3.amazonaws.com/7342_3aee84b4bc9549adb3080f06c69174e1.html
 Acesso em: 28/04/2023.
 4 – Ferreira, Eric Batista – de Oliveira, Marcelo Silva
 Introdução à Estatística com R, ano 2020.
Disponível em:
https://www.unifal-mg.edu.br/bibliotecas/wp-content/uploads/sites/125/2021/12/32-EBR_Unifal.pdf
 Acesso em: 28/04/2023.
5 – Medri, Dr. Waldir
 ANÁLISE EXPLORATÓRIA DE DADOS, ano 2011.
Disponível em:
https://docs.ufpr.br/~benitoag/apostilamedri.pdf
 Acesso em: 28/04/2023.

Continue navegando