Baixe o app para aproveitar ainda mais
Prévia do material em texto
Fundamentos em Data Science e Análise Estatística de Dados SRAG 2019 - Banco de Dados de Síndrome Respiratória Aguda Grave LEANDRO ZAMBELLI RIBEIRO MATRICULA 01476523 Ciência de Dados “2.1 ESTATÍSTICA DESCRITIVA A Estatística Descritiva se preocupa com a organização, apresentação e sintetização de dados. Utilizam gráficos, tabelas e medidas descritivas como ferramentas. Utilizada na etapa inicial da análise, destinada a obter informações que indicam possíveis modelos a serem utilizados numa fase final que seria a chamada inferência estatística.” A HYPERLINK "mailto:https://docs.ufpr.br/~benitoag/apostilamedri.pdf"postila HYPERLINK "mailto:https://docs.ufpr.br/~benitoag/apostilamedri.pdf"do professor DR. Waldir HYPERLINK "mailto:https://docs.ufpr.br/~benitoag/apostilamedri.pdf"Metri HYPERLINK "mailto:https://docs.ufpr.br/~benitoag/apostilamedri.pdf": Apresento em previ linhas um resumo inicial dessa atividade contextualizada: Projetando um ambiente de trabalho através de coleta de dados dentre de analise experimentais somando-se a uma massa de dados certificados, podendo ser esses fora de ordens, sendo brutos. Em modelagem bruta esses dados não dizem muitas coisas ou nada, ou seja, estar nesse prisma a importância de uma analise descritiva, para apresentar entre suas series de dados certificados de fontes oficiais para a geração de conhecimentos. Por suas freqüências que por meio de representação dos números de vezes entre um valor e/ou intervalo que ocorre em base de dados. Sendo apresentada em forma de tabela, fazendo uma associação entre os valores de uma variável. Todos os anos o Ministério da Saúde, por meio da Secretaria de Vigilância em Saúde (SVS), produz dados públicos de vigilância da Síndrome Respiratória Aguda Grave (SRAG) no Brasil a partir 2009, com o linear da pandemia de Influenza A(H1N1)pdm09. Com a implantação da vigilância de SRAG. Partindo deste princípio analisei esses dados de 2019, para uma posterior analise comparativa com os dados do covid—2019 quando estiver disponível ao publico pelo Ministério da Saúde, com base nessa origem dos Dados: https://dados.gov.br/dados/conjuntos-dados/srag-2019. Com base no arquivo csv baixado no link acima, faço uma análise de estatística de dados conforme o material estudado nas unidades, com prática na linguagem r, usando a IDE RSTUDIO. Importando um aquivo csv, poderia fazer essa importação para um banco de dados relacional, poderia usar a ide python com exemplo. Seguindo com os estudos propostos nas unidades, vou fazer uma analise previa bem resumida sobre os dados de Síndrome de Respiratória Aguda Grave, tendo como fonte os dados do Governo Federal, como se segue: Cruzamento de Dados SRAG 2019: Faço um prévio levantamento desses dados publicados no ano de 2019, por Sexo, Estado, Idade e Regiões: Método aplicado RS STUDIO – SRAG 2019: 1 - Conectando o arquivo baixado no RSTUDIO: av1 <- read.csv2("INFLUD19.csv"), incluir o campo idade, que calcula a idade dos pacientes com base no campo DT_NASC no arquivo do Excel (=(ANO(AGORA())-ANO(A2)-3)), detalhe o -3 significa que o ano atual (2022-3) = o ano da fonte de dados (2019). CRIANDO FATORES: av1$CS_SEXO <- factor(av1$CS_SEXO) av1$DT_N ASC <- factor(av1$DT_NASC) av1$IDADE <- factor(av1$IDADE) str(av1) tabelasexo=table(av1) # Criar objeto com a tabela tabelasexo=table(av1$CS_SEXO) # Calcular o percentual percent=signif(tabelasexo /sum(tabelasexo)*100,3) #Criando array dos nomes da legenda nomesleg=c("ignorado","mulher","homem" ) #Plota-se o gráfico de pizza pie(tabelasexo, labels = paste(percent, "%", sep=""), col = terrain.colors(5), # Determina cores radius = 1) legend(x="topright", # Determina posição da legenda legend=nomesleg, # Insere nomes da legenda cex = 0.65, # Tamanho do texto fill = terrain.colors(5)) # Determina cores pie(tabelauf, labels = paste(percent, "%", sep=""), col = terrain.colors(5), # Determina cores radius = 1) legend(x="topright", # Determina posição da legenda legend=mesleg, # Insere nomes da legenda cex = 0.65, # Tamanho do texto fill = terrain.colors(5)) # Determina cores #TABELA UNIDADES DA FEDERAÇÃO #QUANTIDADE tabelauf = table(av1$SG_UF) #PORCENTAGEM UF percentuf=signif(tabelauf /sum(tabelauf)*100,3) #MÉDIA POR MÊS tabelauf/12 UF FEDERAÇÃO QUANTIDADE PORC (%) MEDIA MÊS AC 349 0,70 29,83 AL 245 0,49 20,41 AM 1917 3,88 159,50 AP 51 0,10 4,25 BA 1819 3,68 151,83 CE 1064 2,15 88,66 DF 1775 3,59 147,91 ES 842 1,70 70,16 GO 1371 2,78 114,25 MA 261 0,53 21,75 MG 4014 8,13 334,50 MS 1737 3,52 144,75 MT 332 0,67 27,66 PA 1082 2,19 90,16 PB 376 0,76 31,33 PE 2572 5,21 214,33 PI 465 0,94 38,75 PR 6797 13,80 566,41 RJ 2410 4,88 200,83 RN 337 0,68 28,08 RO 169 0,34 14,83 RR 33 0,06 2,75 RS 3573 7,23 297,75 SC 2151 4,36 179,25 SE 258 0,52 21,50 SP 12248 24,80 1020,66 TO 243 0,49 20,25 Mês <- c(tabelauf/12) Summary(mês por Unidade da Federação) Min. 1st Qu. Median Mean 3rd Qu. Max. 2.75 26.19 81.71 146.99 164.62 1020.67 ano <- c(tabelauf) Summary(ano por Unidade da Federação) Min. 1st Qu. Median Mean 3rd Qu. Max. 33.0 314.2 980.5 1763.9 1975.5 12248.0 summary(por Idade) IDADE Min. : 0.00 Median : 7.00 Mean : 26.92 Qu.: 53.00 Totais por Regiões - vigilância da Síndrome Respiratória Aguda Grave (SRAG) 2019: Região Quantitativo % NORTE 3844 7,94 NORDESTE 7297 15,80 SUDESTE 19514 40,32 CENTRO OESTE 5215 10,78 SUL 12521 25,88 TOTAL 48391 Referências: 1 - Dados abertos, Governo Federal do Brasil. Estatística de analise de Dados, 2020, SRAG 2019 - Banco de Dados de Síndrome Respiratória Aguda Grave, Disponível em: https://dados.gov.br/dados/conjuntos-dados/srag-2019 Acesso em: 26/04/2023 2 - Landeiro, Victor Lemes. Estatística de analise de Dados. Introdução ao uso do programa R, 2011. Disponível em: https://cran.r-project.org/doc/contrib/Landeiro-Introducao.pdf. Acesso em: 27/04/2023 3 – Filho, Prof. Adriano Azevedo, Estatística de analise de Dados. Análise de Dados com o Software R e Métodos Estatísticos, Computacionais e Econométricos, sem ano. Disponível em: http://rstudio-pubs-static.s3.amazonaws.com/7342_3aee84b4bc9549adb3080f06c69174e1.html Acesso em: 28/04/2023. 4 – Ferreira, Eric Batista – de Oliveira, Marcelo Silva Introdução à Estatística com R, ano 2020. Disponível em: https://www.unifal-mg.edu.br/bibliotecas/wp-content/uploads/sites/125/2021/12/32-EBR_Unifal.pdf Acesso em: 28/04/2023. 5 – Medri, Dr. Waldir ANÁLISE EXPLORATÓRIA DE DADOS, ano 2011. Disponível em: https://docs.ufpr.br/~benitoag/apostilamedri.pdf Acesso em: 28/04/2023.
Compartilhar