Buscar

Edital de Data Science

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

Banco de dados e data warehouse
· Modelo entidade-relacionamento
· Mapeamento lógico relacional
· Normalização
· Linguagem de definição e manipulação de dados (SQL)
· Conceitos de data warehousing e modelagem multidimensional (esquema estrela)
· Conceitos gerais de Hadoop: HDFS, MapReduce, YARN e Spark
· Conceitos de Bancos NoSQL e Armazenamento orientado a objeto (object store)
Algoritmos e estrutura de dados
· Complexidade de algoritmos e notação assintótica (Big O)
Conceitos modernos de sistemas de informação
· Conceitos Nuvem: IaaS, PaaS e SaaS
· Conceitos de Containers: construção, registro, execução e orquestração
· Conceitos básicos de DevOps: versionamento com git, pipeline e CI/CD
Cálculo
· Conjuntos, Coordenadas Cartesianas, Cônicas e Produtos Notáveis
· Funções
· Limites
· Derivadas
· Derivadas parciais
· Máximos e Mínimos
· Esboços de Gráficos de Funções
· Integrais
Álgebra Linear para Ciência de Dados
· Notação de vetores e matrizes
· Operações com vetores e matrizes; produto escalar e produto vetorial
· Matriz identidade, inversa e transposta
· Transformações lineares
· Normas (L1, L2)
· Autovalores e autovetores
· Decomposição SVD
· Álgebra linear e operações matriciais com Python Numpy
Probabilidade e estatística
· Modelo de probabilidade, Probabilidade Condicional, Independência, Variáveis Aleatórias, Esperança, Variância e Covariância
· Distribuições Contínuas e Discretas: Normal, t-Student, Poisson, Exponencial, Binomial, Dirichlet
· Distribuições multidimensionais; matriz de covariância
· Estatísticas Descritivas
· Inferência Estatística: Teorema do Limite Central, Teste de Hipótese e Intervalo de Confiança, Estimador de Máxima Verossimilhança, Inferência Bayesiana
· Coeficiente de correlação de Pearson
· Histogramas e curvas de frequência
· Diagrama boxplot
· Avaliação de outliers
Aprendizado supervisionado: Regressão e Classificação
· Métricas de avaliação
· Overfitting e underfitting de modelos
· Regularização
· Seleção de modelos: Erro de Generalização
· Validação Cruzada
· Conjuntos de Treino, Validação e Teste
· Trade off entre Variância e Viés
· Algoritmos: Regressão Linear e Regressão Logística
· Árvores de decisão e random forests
· Máquina de suporte de vetores
· Naive Bayes
· K-NN
· Ensembles
· Aprendizado supervisionado com Python scikit-learn
· Conceitos de otimização de hiperparâmetros
Aprendizado não supervisionado
· Redução de dimensionalidade: PCA
· Agrupamento K-Means
· Mistura de Gaussianas
· Agrupamento Hierárquico
· Regras de associação
· Aprendizado não supervisionado com Python scikit-learn
Redes neurais artificiais
· Conceitos Básicos em Redes Neurais Artificiais: Definições e Arquitetura
· Funções de Ativação
· Otimização de Redes Neurais Artificiais: método do gradiente, método do gradiente estocástico, algoritmo backpropagation, métodos de inicialização dos pesos, Vanishing Gradients
· Métodos de regularização: penalização com normas L1 e L2, Dropout e Early Stopping
· Definições básicas de Redes Neurais Convolucionais
· Definições básicas de Redes Neurais Recorrentes
· Redes neurais com Python: treino de modelos com Keras e Pytorch
Machine learning
· Noções de Visão computacional com redes neurais convolucionais
· Classificação de imagens
· Detecção de objetos
· Segmentação de objetos e instâncias
· Noções de Processamento Natural de Linguagem
· Stopwords, stemização e n-grams
· TF-IDF
· Modelagem de tópicos (LDA, NMF)
· Word embeddings: CBOW e Skip Gram
· Conceitos Básicos em Séries Temporais
Manipulação, tratamento e visualização de dados
· Técnicas de visualização de dados (questão 1/2)
· Técnicas de visualização de dados (questão 2/2)
· Lidando com valores faltantes
· Lidando com dados categóricos
· Normalização numérica
· Detecção e tratamento de outliers
· Manipulação de dataframes com Python Pandas: leitura de dados tabulares, seleção de linhas e colunas, agregação de dados, preenchimento de valores faltantes, remoção de duplicados, junção de dataframes

Outros materiais