AV Machine Learning

•

ESTÁCIO

1

0

1

0

Marcel Costa

25/11/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Machine Learning

1.264 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

AV Machine Learning
1. Com o objetivo de obter informações por meio do aprendizado de máquina, verificou-se que o processo que estava
sendo realizado consistia em examinar as características dos objetos e agrupá-los de acordo com suas semelhanças;
verificou-se também o uso de algoritmos de aprendizado não supervisionados. Identifique que ação está sendo
realizada:
a) Redução dimensional
b) Clustering
c) Estimativa de densidade
d) Regressão
e) Classificação

2. Com o objetivo de obter informações por meio do aprendizado de máquina, verificou-se que o processo que estava
sendo realizado consistia em reduzir o número de características de determinado objeto, identificando quais as
características mais relevantes; verificou-se também o uso de algoritmos de aprendizado não supervisionados.
Identifique que ação está sendo realizada:
a) Estimativa de densidade
b) Clustering
c) Classificação
d) Redução dimensional
e) Regressão

3. Qual a função dos vetores de suporte no SVM?
a) Minimizar a distância entre a função de decisão e as amostras.
b) Maximizar a distância intra cluster e minimizar a distância inter cluster.
c) Definir margens de classificação para o cálculo do vetor de decisão.
d) Servem para a tomada de decisão.
e) Maximizar a métrica de avaliação do modelo.

4. Um SVM Não Linear deve ser usado somente se:
a) For uma regressão.
b) O dataset tiver mais outliers do que o normal.
c) O número de características for maior do que 10.
d) Os dados forem separáveis linearmente no espaço.
e) O conjunto de observações no espaço amostral não puder ser delineado por uma reta.

5. (Ano: 2018 Banca: FGV Prova: Prefeitura de Niterói - RJ - Analista de Políticas Públicas e Gestão Governamental -
Gestão de Tecnologia) No contexto das redes neurais, é comum o uso da função sigmoide no papel de função de
ativação. Assinale a definição correta dessa função na referida aplicação.

6. (Ano: 2018 Banca: FGV Prova: Prefeitura de Niterói - RJ - Analista de Políticas Públicas e Gestão Governamental -
Gestão de Tecnologia) Analise a rede neural exibida a seguir.
Sobre essa rede, analise as afirmativas a seguir.
I - Não possui camadas intermediárias (hidden layers).
II - Admite três sinais de entrada (input units) além do intercept term.
III - É apropriada para aplicações de deep learning.
Está correto o que se afirma em
a) I e II, apenas.
b) III, apenas.
c) II, apenas.
d) I, apenas.
e) I, II e III.

7. Em relação às ferramentas e os fundamentos de Data Mining, é correto afirmar:
a) A etapa de KDD do Data Mining consiste em aplicar técnicas que auxiliem na busca de relações entre os dados. De
forma geral, existem três tipos de técnicas: Estatísticas, Exploratórias e Intuitivas. Todas são devidamente
experimentadas e validadas para o processo de mineração.
b) As ferramentas de Data Mining permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados.
Esses tipos de ferramentas podem utilizar técnicas avançadas de computação como redes neurais, algoritmos
genéticos e lógica nebulosa, entre outras.
c) Os dados podem ser não estruturados (bancos de dados, CRM, ERP), estruturados (texto, documentos, arquivos,
mídias sociais, cloud) ou uma mistura de ambos (e-mails, SOA/web services, RSS). As ferramentas de Data Discovery
mais completas possuem conectividade para todas essas origens de dados de forma segura e controlada.
d) Estima-se que, atualmente, em média, 80% de todos os dados disponíveis são do tipo estruturado. Existem diversas
ferramentas open source e comerciais de Data Discovery. Dentre as open source está a InfoSphere Data Explorer, e
entre as comerciais está a Vivisimo, da IBM.
e) Data Mining é o processo de descobrir conhecimento em banco de dados, que envolve várias etapas. O KDD -
Knowledge Discovery in Database é uma destas etapas, portanto, a mineração de dados é um conceito que abrange o
KDD.

8. Acerca de Data Mining, assinale a opção correta:
a) As redes neurais são um recurso matemático/computacional usado na aplicação de técnicas estatísticas nos
processos de data mining e consistem em utilizar uma massa de dados para criar e organizar regras de classificação e
decisão em formato de diagrama de árvore, que vão classificar seu comportamento ou estimar resultados futuros.
b) As aplicações de Data Mining utilizam diversas técnicas de natureza estatística, como a análise de conglomerados
(cluster analysis), que tem como objetivo agrupar, em diferentes conjuntos de dados, os elementos identificados
como semelhantes entre si, com base nas características analisadas.
c) Os processos de data mining e OLAP têm os mesmos objetivos: trabalhar os dados existentes no data warehouse e
realizar inferências, buscando reconhecer correlações não explícitas nos dados do data warehouse.
d) A fase de preparação para implementação de um projeto de Data Mining consiste, entre outras tarefas, em coletar
os dados que serão garimpados, que devem estar exclusivamente em um data warehouse interno da empresa.
e) As séries temporais correspondem a técnicas estatísticas utilizadas no cálculo de previsão de um conjunto de
informações, analisando-se seus valores ao longo de determinado período. Nesse caso, para se obter uma previsão
mais precisa, devem ser descartadas eventuais sazonalidades no conjunto de informações.

9. Bases de dados com registros cujos atributos nem sempre têm valores sofrem do problema de dados:
a) flutuantes
b) fora da curva
c) aleatórios
d) repetidos
e) faltantes

10. Qual a primeira coisa a se fazer logo após validar o problema com os stakeholders?
a) Calcular a medida F.
b) Validar resultados.
c) Entender os dados.
d) Classificação.
e) Regressão e agrupamento.