Buscar

AV Estácio - Mineração de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Disc.: MINERAÇÃO DE DADOS 
Aluno: PAULO VINICIUS MEIRELES 
Professor: RAUL CARLOS COSTA QUEIROS Turma: 9001/AA 
 
 
Avaliação: 
10,00 
Nota Trab.: Nota Partic.: Nota SIA: 
10,0 pts 
 
 
 
 1. Ref.: 4329330 Pontos: 1,00 / 1,00 
 
Com o objetivo de obter informações por meio do aprendizado de máquina, verificou-se que o processo que estava 
sendo realizado consistia em reduzir o número de características de determinado objeto, identificando quais as 
características mais relevantes; verificou-se também o uso de algoritmos de aprendizado não supervisionados. 
Identifique que ação está sendo realizada: 
 
 
Estimativa de densidade 
 
Clustering 
 
Regressão 
 
Classificação 
 Redução dimensional 
Respondido em 23/05/2023 21:03:12 
 
 
 2. Ref.: 4332286 Pontos: 1,00 / 1,00 
 
Considere que a Sanasa busca realizar a gestão de recursos hídricos subterrâneos com base em parâmetros 
conhecidos que determinam a poluição das águas subterrâneas. Um desses parâmetros, para exemplificar, seria o 
nitrato, um indicador de poluição difusa de água subterrânea. Criando-se regras para realizar o aprendizado 
supervisionado do sistema de Data Mining utilizando-se uma certa técnica, chegar-se-á a um resultado que 
considera os diversos parâmetros para se descobrir se um certo aquífero tem água potável ou não, comparando-se 
com uma definição conhecida. Assinale a opção que identifica essa técnica: 
 
 
Regressão 
 Classificação 
 
Associação 
 
Clustering 
 
Prediction 
Respondido em 23/05/2023 21:03:52 
 
 
 3. Ref.: 4329332 Pontos: 1,00 / 1,00 
 
O aprendizado de máquina comporta vários métodos de aprendizagem de acordo com o sinal. Identifique a opção 
que exemplifica esses métodos: 
 
 
Método de aprendizado estruturado e não estruturado 
 
Método de aprendizado inteligente e não inteligente 
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%204329330.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%204332286.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%204329332.');
 
Método de aprendizado por associação e memorização 
 Método de aprendizado supervisionado e não supervisionado 
 
Método de aprendizado por classificação e regressão 
Respondido em 23/05/2023 21:04:06 
 
 
 4. Ref.: 4332289 Pontos: 1,00 / 1,00 
 
Uma das técnicas bastante utilizadas em sistemas de apoio à decisão é o aprendizado de máquina, que se constitui 
em uma técnica: 
 
 
Que visa sua distribuição e replicação em um cluster de servidores, visando aprimorar a disponibilidade de dados. 
 Para a exploração e análise de dados, visando descobrir padrões e regras, a princípio ocultos, importantes à aplicação. 
 
De transmissão e recepção de dados, permitindo a comunicação entre servidores, em tempo real. 
 
De compactação de dados, normalmente bastante eficiente, permitindo grande desempenho no armazenamento de dados. 
 
Para se realizar a criptografia inteligente de dados, objetivando a proteção da informação. 
Respondido em 23/05/2023 21:04:25 
 
 
 5. Ref.: 4329334 Pontos: 1,00 / 1,00 
 
Sobre os modelos analíticos de aprendizado de máquina, considere que um big data é alimentado com dados de um 
site de comércio eletrônico que armazena informações sobre navegação de usuários, produtos comprados e 
preferências. Sendo assim os dados coletados de redes sociais podem ser correlacionados e expostos pelo modelo 
de aprendizado de máquina: 
 
 
Montessoriano 
 
Tradicional 
 
Descritivo 
 Preditivo 
 
Estatístico 
Respondido em 23/05/2023 21:04:48 
 
 
 6. Ref.: 4392325 Pontos: 1,00 / 1,00 
 
A floresta aleatória é um dos modelos mais famosos da classe dos modelos incorporados. Qual seria o seu tipo de 
incorporação? 
 
 
Stacking e Voting. 
 
Voting somente. 
 Bagging e Voting. 
 
Stacking somente. 
 
Bagging somente. 
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%204332289.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%204329334.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%204392325.');
Respondido em 23/05/2023 21:05:14 
 
 
 7. Ref.: 4416306 Pontos: 1,00 / 1,00 
 
Qual o hiperparâmetro que podemos regularizar a fim de não deixar que a árvore de decisão aprenda padrões 
viciados e não tão relevantes? 
 
 
Número de Raízes. 
 
Métrica de Avaliação do Modelo. 
 
Função de decisão. 
 Profundidade Máxima. 
 
Peso dos nós da árvore. 
Respondido em 23/05/2023 21:05:38 
 
 
 8. Ref.: 4467275 Pontos: 1,00 / 1,00 
 
Dado um conjunto de dados cujas características são: Peso, Idade, Altura, e Densidade Óssea. Além do 
agrupamento da idade em grupos ou estratos, bem como sua codificação, que outra tarefa de pré-processamento 
deve ser feita a fim de otimizar o uso do PCA para redução da dimensionalidade? 
 
 Rescaling dos dados. 
 
Multiplicar a matriz por uma constante k. 
 
Remover os dados faltantes. 
 
Rotacionar o conjunto de dados. 
 
Binarização do conjunto por completo. 
Respondido em 23/05/2023 21:05:51 
 
 
 9. Ref.: 4392327 Pontos: 1,00 / 1,00 
 
Leonardo é chamado pelo Instituto de Matemática e Estatística Aplicada de sua universidade para auxiliar o 
departamento com uma pesquisa que está sendo feita em parceria com uma empresa de óleo e gás. A equipe de 
estatísticos é muito competente, porém não está muito familiarizada com o uso de computadores em suas pesquisas 
tradicionais, e visto que os dados desse estudo ultrapassaram o poder de processamento humano, devido às suas 
proporções, tiveram que pedir ajuda ao Departamento de Informática. Leonardo foi apresentado ao conjunto de 
dados cedido pela empresa de óleo e gás. O conjunto de dados tinha mais de 5.000.000.000 de registros e, como a 
coleta dos dados pelos sensores da empresa é muito cautelosa, a quantidade de características é de 
aproximadamente 200. Em seguida, os estatísticos experientes informaram Leonardo que haviam feito um estudo 
aproximado da dimensionalidade desses dados e que poderia haver overlap geométrico dos mesmos devido à sua 
alta dimensionalidade. Tendo isso em mente, qual algoritmo melhor se encaixaria no problema de redução de 
dimensionalidade de Leonardo? 
 
 
Rede Neural Convolucional. 
 
PCA Linear. 
 LLE. 
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%204416306.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%204467275.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%204392327.');
 
Árvore de Decisão. 
 
SVM Não Linear. 
Respondido em 23/05/2023 21:06:05 
 
 
 10. Ref.: 4392320 Pontos: 1,00 / 1,00 
 
Qual a função dos vetores de suporte no SVM? 
 
 
Servem para a tomada de decisão. 
 
Minimizar a distância entre a função de decisão e as amostras. 
 
Maximizar a distância intra cluster e minimizar a distância inter cluster. 
 
Maximizar a métrica de avaliação do modelo. 
 Definir margens de classificação para o cálculo do vetor de decisão. 
Respondido em 23/05/2023 21:06:36 
 
 
 
Anotações: Avaliação realizada no navegador SIA. 
 
 
 
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%204392320.');

Continue navegando