Baixe o app para aproveitar ainda mais
Prévia do material em texto
Felipe dos Santos Alves Ferreira PROGRAMAÇÃO ESTATÍSTICA A Programação Estatística é uma linguagem muito dinâmica que permite o desenvolvimento de técnicas de manipulações, análises e visualizações de dados. Através desta linguagem, etapas muito importantes da análise podem ser executadas, permitindo uma interação com o banco de dados tais como a transformação, modelagem, criação de visualizações, e auxiliando também no resultado final. A linguagem definida para resolver a questão e criar o nosso modelo estatístico que envolve o estudo de caso foi o R. O R é uma linguagem de programação utilizada por especialistas na área de estatística. No entanto, com o passar dos tempos, muitos desenvolvedores começaram a fazer uso dessa ferramenta, o que a tornou atualmente uma das ferramentas mais populares no mercado voltada para a análise de grandes dados. Para automatizar o nosso modelo de dados, utilizamos a técnica de Machine Learning. Quando falamos em Machine Learning estamos associando também a estatística, e consequentemente ao sistema R, porque esse aprendizado de máquina só é criado a partir de uma grande variedade de técnicas que encontramos na estatística. É possível observar que a estatística utilizada no sistema R faz uso dos dados de uma forma que ajuda a identificar padrões e as suas correlações. Já o Machine Learning faz uso dos dados para aprender a fazer predições. A soma destas duas tecnologias só melhora a qualidade dos dados analisados, e traz uma variedade muito maior no desenvolvimento para os modelos estatísticos. Por fim, acreditamos que os ganhos obtidos com esse sistema para área operacional da empresa serão enormes, pois os dados de uma companhia são considerados um dos bens mais preciosos hoje em dia. Portanto, realizar com qualidade a manipulação dos dados, e garantir uma classificação precisa do perfil dos novos clientes com certeza se tornará uma tarefa mais segura e eficiente. Referências Bibliográficas BREIMAN, L. Statistical modeling: the two cultures. Quality control and applied statistics, v. 48, n. 1, p. 81-82, 2003. CONHEÇA 4 tipos de análise de dados de Big Data. Ascent Business Intelligence, jun. 2017. Disponível em: http://www.universidadebi.com.br/conheca-4-tipos-de-analise-de-dados- de-big-data/. Acesso em: 21 jul. 2020. DASU, T., JOHNSON, T. Exploratory Data Mining and Data Cleaning. New Jersey: John Wiley & Sons, 2003. GUAZZELLI, A. O que é análise preditiva? IBM Developer, ago. 2012. Disponível em: https://developer.ibm.com/br/technologies/predictive-analytics/articles/ba-predictive- analytics1. Acesso em: 21 jul. 2020. GUEDES, T. A. et al. Estatística descritiva, [2020]. Disponível em: https://www.ime.usp.br/~rvicente/Guedes_etal_Estatistica_Descritiva.pdf. Acesso em: 9 jul. 2020. http://www.universidadebi.com.br/conheca-4-tipos-de-analise-de-dados-de-big-data/ http://www.universidadebi.com.br/conheca-4-tipos-de-analise-de-dados-de-big-data/ https://developer.ibm.com/br/technologies/predictive-analytics/articles/ba-predictive-analytics1 https://developer.ibm.com/br/technologies/predictive-analytics/articles/ba-predictive-analytics1 https://www.ime.usp.br/~rvicente/Guedes_etal_Estatistica_Descritiva.pdf Felipe dos Santos Alves Ferreira LANEY, D. Application delivery strategies. META Group, 2001. Disponível em: https://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D-Data-Management- Controlling-Data-Volume-Velocity-and-Variety.pdf. Acesso em: 10 jul. 2020. LYRA, B. L. A. Uso de um processo ETL em um modelo Data Warehouse para a geração de dashboards de indicadores de redes de telefonia celular. Rio de Janeiro: UFRJ/Escola Politécnica, 2016. MITCHELL, T. Machine Learning. Porto Alegre: McGraw-Hill Science, 1997. PEREIRA, A. M. Framework de Big Data. Porto Alegre: Grupo A Educação S.A., 2019. ROSA, C. S. Estudo sobre as técnicas e métodos de análise de dados no contexto de Big Data. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Eletrônica e de Telecomunicações) − Faculdade de Engenharia Elétrica, Universidade Federal de Uberlândia, Patos de Minas, 2018. SILVESTRE, A. L. Análise de dados e estatística descritiva. São Paulo: Escolar Editora, 2007. SOUZA, E. F. M.; PETERNELLI, L. A.; MELLO, P. M. Software Livre R: aplicação estatística, [2020]. Disponível em: http://www.de.ufpb.br/~tarciana/MPIE/ApostilaR.pdf. Acesso em: 9 jul. 2020. VERT TECNOLOGIA, PERFORMANCE E RESULTADOS. As diferenças entre análise prescritiva, preditiva, descritiva e diagnóstica. Prof. Cordella, [2021]. Disponível em: http://www.profcordella.com.br/unisanta/textos/gin22_analise_preditiva_e_tipos_rev.html. Acesso em: 16 jun. 2021. WICKHAM, H. Tidy data. Journal of Statistical Software, v. 59, n. 10, 2014. Disponível em: https://www.jstatsoft.org/article/view/v059i10. Acesso em: 9 jul. 2020. WITTEN, I. H.; FRANK, E. Data Mining: practical machine learning tools and techniques. Bio Med Eng OnLine, v. 5, n. 51, 2006. https://doi.org/10.1186/1475-925X-5- 512005. Acesso em: 21 jul. 2020. https://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D-Data-Management-Controlling-Data-Volume-Velocity-and-Variety.pdf https://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D-Data-Management-Controlling-Data-Volume-Velocity-and-Variety.pdf http://www.de.ufpb.br/~tarciana/MPIE/ApostilaR.pdf http://www.profcordella.com.br/unisanta/textos/gin22_analise_preditiva_e_tipos_rev.html https://www.jstatsoft.org/article/view/v059i10 https://doi.org/10.1186/1475-925X-5-512005 https://doi.org/10.1186/1475-925X-5-512005
Compartilhar