Logo Passei Direto
Buscar

Edital de Data Science

Programa de Ciência de Dados: cobertura de bancos de dados e data warehouse (ER, SQL, NoSQL, Hadoop), algoritmos e complexidade, nuvem e containers, cálculo e álgebra linear, probabilidade e estatística, aprendizado supervisionado e não supervisionado, redes neurais, visão/NLP e visualização/manipulação de dados.

User badge image
Thais Joffe

em

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

Banco de dados e data warehouse
· Modelo entidade-relacionamento
· Mapeamento lógico relacional
· Normalização
· Linguagem de definição e manipulação de dados (SQL)
· Conceitos de data warehousing e modelagem multidimensional (esquema estrela)
· Conceitos gerais de Hadoop: HDFS, MapReduce, YARN e Spark
· Conceitos de Bancos NoSQL e Armazenamento orientado a objeto (object store)
Algoritmos e estrutura de dados
· Complexidade de algoritmos e notação assintótica (Big O)
Conceitos modernos de sistemas de informação
· Conceitos Nuvem: IaaS, PaaS e SaaS
· Conceitos de Containers: construção, registro, execução e orquestração
· Conceitos básicos de DevOps: versionamento com git, pipeline e CI/CD
Cálculo
· Conjuntos, Coordenadas Cartesianas, Cônicas e Produtos Notáveis
· Funções
· Limites
· Derivadas
· Derivadas parciais
· Máximos e Mínimos
· Esboços de Gráficos de Funções
· Integrais
Álgebra Linear para Ciência de Dados
· Notação de vetores e matrizes
· Operações com vetores e matrizes; produto escalar e produto vetorial
· Matriz identidade, inversa e transposta
· Transformações lineares
· Normas (L1, L2)
· Autovalores e autovetores
· Decomposição SVD
· Álgebra linear e operações matriciais com Python Numpy
Probabilidade e estatística
· Modelo de probabilidade, Probabilidade Condicional, Independência, Variáveis Aleatórias, Esperança, Variância e Covariância
· Distribuições Contínuas e Discretas: Normal, t-Student, Poisson, Exponencial, Binomial, Dirichlet
· Distribuições multidimensionais; matriz de covariância
· Estatísticas Descritivas
· Inferência Estatística: Teorema do Limite Central, Teste de Hipótese e Intervalo de Confiança, Estimador de Máxima Verossimilhança, Inferência Bayesiana
· Coeficiente de correlação de Pearson
· Histogramas e curvas de frequência
· Diagrama boxplot
· Avaliação de outliers
Aprendizado supervisionado: Regressão e Classificação
· Métricas de avaliação
· Overfitting e underfitting de modelos
· Regularização
· Seleção de modelos: Erro de Generalização
· Validação Cruzada
· Conjuntos de Treino, Validação e Teste
· Trade off entre Variância e Viés
· Algoritmos: Regressão Linear e Regressão Logística
· Árvores de decisão e random forests
· Máquina de suporte de vetores
· Naive Bayes
· K-NN
· Ensembles
· Aprendizado supervisionado com Python scikit-learn
· Conceitos de otimização de hiperparâmetros
Aprendizado não supervisionado
· Redução de dimensionalidade: PCA
· Agrupamento K-Means
· Mistura de Gaussianas
· Agrupamento Hierárquico
· Regras de associação
· Aprendizado não supervisionado com Python scikit-learn
Redes neurais artificiais
· Conceitos Básicos em Redes Neurais Artificiais: Definições e Arquitetura
· Funções de Ativação
· Otimização de Redes Neurais Artificiais: método do gradiente, método do gradiente estocástico, algoritmo backpropagation, métodos de inicialização dos pesos, Vanishing Gradients
· Métodos de regularização: penalização com normas L1 e L2, Dropout e Early Stopping
· Definições básicas de Redes Neurais Convolucionais
· Definições básicas de Redes Neurais Recorrentes
· Redes neurais com Python: treino de modelos com Keras e Pytorch
Machine learning
· Noções de Visão computacional com redes neurais convolucionais
· Classificação de imagens
· Detecção de objetos
· Segmentação de objetos e instâncias
· Noções de Processamento Natural de Linguagem
· Stopwords, stemização e n-grams
· TF-IDF
· Modelagem de tópicos (LDA, NMF)
· Word embeddings: CBOW e Skip Gram
· Conceitos Básicos em Séries Temporais
Manipulação, tratamento e visualização de dados
· Técnicas de visualização de dados (questão 1/2)
· Técnicas de visualização de dados (questão 2/2)
· Lidando com valores faltantes
· Lidando com dados categóricos
· Normalização numérica
· Detecção e tratamento de outliers
· Manipulação de dataframes com Python Pandas: leitura de dados tabulares, seleção de linhas e colunas, agregação de dados, preenchimento de valores faltantes, remoção de duplicados, junção de dataframes

Mais conteúdos dessa disciplina