Baixe o app para aproveitar ainda mais
Prévia do material em texto
Banco de dados e data warehouse · Modelo entidade-relacionamento · Mapeamento lógico relacional · Normalização · Linguagem de definição e manipulação de dados (SQL) · Conceitos de data warehousing e modelagem multidimensional (esquema estrela) · Conceitos gerais de Hadoop: HDFS, MapReduce, YARN e Spark · Conceitos de Bancos NoSQL e Armazenamento orientado a objeto (object store) Algoritmos e estrutura de dados · Complexidade de algoritmos e notação assintótica (Big O) Conceitos modernos de sistemas de informação · Conceitos Nuvem: IaaS, PaaS e SaaS · Conceitos de Containers: construção, registro, execução e orquestração · Conceitos básicos de DevOps: versionamento com git, pipeline e CI/CD Cálculo · Conjuntos, Coordenadas Cartesianas, Cônicas e Produtos Notáveis · Funções · Limites · Derivadas · Derivadas parciais · Máximos e Mínimos · Esboços de Gráficos de Funções · Integrais Álgebra Linear para Ciência de Dados · Notação de vetores e matrizes · Operações com vetores e matrizes; produto escalar e produto vetorial · Matriz identidade, inversa e transposta · Transformações lineares · Normas (L1, L2) · Autovalores e autovetores · Decomposição SVD · Álgebra linear e operações matriciais com Python Numpy Probabilidade e estatística · Modelo de probabilidade, Probabilidade Condicional, Independência, Variáveis Aleatórias, Esperança, Variância e Covariância · Distribuições Contínuas e Discretas: Normal, t-Student, Poisson, Exponencial, Binomial, Dirichlet · Distribuições multidimensionais; matriz de covariância · Estatísticas Descritivas · Inferência Estatística: Teorema do Limite Central, Teste de Hipótese e Intervalo de Confiança, Estimador de Máxima Verossimilhança, Inferência Bayesiana · Coeficiente de correlação de Pearson · Histogramas e curvas de frequência · Diagrama boxplot · Avaliação de outliers Aprendizado supervisionado: Regressão e Classificação · Métricas de avaliação · Overfitting e underfitting de modelos · Regularização · Seleção de modelos: Erro de Generalização · Validação Cruzada · Conjuntos de Treino, Validação e Teste · Trade off entre Variância e Viés · Algoritmos: Regressão Linear e Regressão Logística · Árvores de decisão e random forests · Máquina de suporte de vetores · Naive Bayes · K-NN · Ensembles · Aprendizado supervisionado com Python scikit-learn · Conceitos de otimização de hiperparâmetros Aprendizado não supervisionado · Redução de dimensionalidade: PCA · Agrupamento K-Means · Mistura de Gaussianas · Agrupamento Hierárquico · Regras de associação · Aprendizado não supervisionado com Python scikit-learn Redes neurais artificiais · Conceitos Básicos em Redes Neurais Artificiais: Definições e Arquitetura · Funções de Ativação · Otimização de Redes Neurais Artificiais: método do gradiente, método do gradiente estocástico, algoritmo backpropagation, métodos de inicialização dos pesos, Vanishing Gradients · Métodos de regularização: penalização com normas L1 e L2, Dropout e Early Stopping · Definições básicas de Redes Neurais Convolucionais · Definições básicas de Redes Neurais Recorrentes · Redes neurais com Python: treino de modelos com Keras e Pytorch Machine learning · Noções de Visão computacional com redes neurais convolucionais · Classificação de imagens · Detecção de objetos · Segmentação de objetos e instâncias · Noções de Processamento Natural de Linguagem · Stopwords, stemização e n-grams · TF-IDF · Modelagem de tópicos (LDA, NMF) · Word embeddings: CBOW e Skip Gram · Conceitos Básicos em Séries Temporais Manipulação, tratamento e visualização de dados · Técnicas de visualização de dados (questão 1/2) · Técnicas de visualização de dados (questão 2/2) · Lidando com valores faltantes · Lidando com dados categóricos · Normalização numérica · Detecção e tratamento de outliers · Manipulação de dataframes com Python Pandas: leitura de dados tabulares, seleção de linhas e colunas, agregação de dados, preenchimento de valores faltantes, remoção de duplicados, junção de dataframes
Compartilhar