Prévia do material em texto
Introdução a Ciência de Dados Prof. Me. Leandro Dias Lourenço 2 UNIDADE IV OBJETIVOS DE APRENDIZAGEM 3 ●Explorar as ferramentas em Python empregadas no Machine Learn. FERRAMENTAS PYTHON PARA MACHINE LEARNING 4 O ML é a base para aplicativos que apresentam o reconhecimento de sinais de voz, sons, fala, recursos faciais e outros objetos que não podem ser identificados com a ajuda de fórmulas matemáticas de linha única e expressões booleanas simples. Existem muitas ferramentas que auxiliam na criação de soluções baseadas no aprendizado de máquina na linguagem de programação Python. 5 Ferramentas de software para a criação de soluções baseadas em ML o TensorFlow - Apresenta ferramentas que permitem executar a análise de dados de entrada com a ajuda de dados enciclopédicos e os dados analisados anteriormente durante a interação com determinados usuários (supervisores). Shogun - Oferece numerosos algoritmos e estruturas de dados para problemas de aprendizado de máquina. Oferece interfaces para Octave, Python, R, Java, Lua, Ruby e C #. 6 Ferramentas de software para a criação de soluções baseadas em ML o Keras - É usado para a criação de redes neurais artificiais que imitam o processo de memória, semelhante ao que ocorre nos neurônios humanos. Scikit-Learn - Essa API é basicamente um assistente universal na resolução de tarefas de classificação, regressão e clusterização. http://scikit-learn.org/stable/index.html http://scikit-learn.org/stable/index.html http://scikit-learn.org/stable/index.html 7 Ferramentas de software para a criação de soluções baseadas em ML o Theano - Foi criado para o processamento de matrizes multidimensionais. Está intimamente integrado à solução de computação mais antiga NumPy. NLTK - Natural Language Toolkit é uma solução universal para processamento de fala em humanos. A NLTK(Natural e Text Analytics), pode ser usado mesmo para a criação de software estritamente especializado que requer identificação de terminologia difícil ou expressões de dialeto. https://www.nltk.org/ 8 Ferramentas de software para a criação de soluções baseadas em ML o Gensim - o Gensim é usado pelos desenvolvedores para modelar espaços vetoriais em Python e é baseado nas bibliotecas NumPy e SciPy. SciPy é uma biblioteca gratuita criada para implementar cálculos matemáticos e de engenharia complexos. Inclui os pacotes NumPy, IPython e Pandas, que fornecem uma abordagem abrangente para resolver tarefas científicas de várias etapas quando combinadas. https://radimrehurek.com/gensim/ 9 Ferramentas de software para a criação de soluções baseadas em ML o Dask - Este produto permite a implementação de processos de análise de dados multidimensionais. É por isso que é frequentemente empregado na criação de aplicativos de previsão. Numba - É um compilador JIT, que traduz um subconjunto de Python e Numpy em código de máquina rápido usando LLVM. 10 Ferramentas de software para a criação de soluções baseadas em ML o HPAT - O HPAT tambem é um compilador que aumenta a performance do software que atua em grandes volumes de dados. por que opera grandes volumes de dados. A grande vantagem das ferramentas de machine learning é a colaboração para com os programadores que estão iniciando na área de Análise de Dados. É muito importante que se realizem as perguntas certas e que procurem os dados nos lugares adequados, e também que seja realizado um estudo para escolher qual ferramenta irá atender ao seu propósito. https://github.com/IntelLabs/hpat 11 BORGES, Luiz Eduardo. Python para desenvolvedores. 2ª Edição, Rio de Janeiro. 2010. KLOSTERMAN, Stephen. Projetos de Ciência de Dados com Python: Abordagem de Estudo de Caso para a criação de projetos de Ciência de Dados bem-sucedidos usando Python, Pandas e Scikit-learn. Ed Novatec, 2020 FUNDAMENTOS DE PYTHON PARA ANÁLISE DE DADOS. geekhunter, 2020. Disponível em : https://blog.geekhunter.com.br/fundamentos-de-python-para-analise-de-dados/. Acesso em 10/08/2022. QUAL A MELHOR LINGUAGEM PARA CIÊNCIA DE DADOS? geekhunter, 2021. Disponível em : https://blog.geekhunter.com.br/qual-a-melhor-linguagem-para-ciencia-de-dados/ Acesso em 15/08/2022 REFERÊNCIAS 12 Obrigado! Leandro Dias Lourenço