PROVA 29_06_2019_ 10. Machine Learning_Dimas 2

Rafael Cel

17/12/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Informetria

236 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018)
https://pucminas.instructure.com/courses/149/quizzes/22880 1/8
PROVA ONLINE 29/06/2019
Vencimento 29 jun em 18:20 Pontos 60 perguntas 10
Disponível 29 jun em 14:00 - 29 jun em 18:20 cerca de 4 horas
Limite de tempo 60 minutos
Instruções
Este teste foi travado 29 jun em 18:20.
Histórico de tentativas
Tentativa Hora Pontuação
MAIS RECENTE Tentativa 1 14 minutos 60 de 60
Pontuação deste teste: 60 de 60
Enviado 29 jun em 15:48
Esta tentativa levou 14 minutos.
ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento necessário
nesta disciplina.
Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa, será
identificado como uma prova extra e resultará em pagamento de taxa extra.
INSTRUÇÕES DA AVALIAÇÃO ONLINE
A prova tem a duração de 60 minutos e se realizará das 14 às 18:20 horas, horário de Brasília.
Ao clicar em PROVA ONLINE 29/06/2019, no menu “testes” você iniciará a prova. A partir daí não será
possível desistir de realizá-la.
A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos.
Ao final do teste não se esqueça de enviá-lo clicando no botão “ENVIAR TESTE”. Só utilize esse botão
quando tiver finalizado a avaliação.
Se necessário, durante a prova entre em contato pelo link “Atendimento”.
ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas, serão automaticamente
encerradas pelo sistema transcorridos os 60 minutos de duração, ou às 18:20 horas - horário em
que se encerra a aplicação.
Boa Prova!
6 / 6 ptsPergunta 1
Uma anomalia (ou outlier), no algoritmo DB-outlier, pode ser entendida
como:
https://pucminas.instructure.com/courses/149/quizzes/22880/history?version=1
30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018)
https://pucminas.instructure.com/courses/149/quizzes/22880 2/8

Um conjunto de atributos cujos valores estão definidos em ordens de
grandeza superiores à média da base de conhecimento.

Um atributo cuja medição possui valores extremos fora da faixa padrão de
distribuição dos dados da base de conhecimento.

Um ponto cujas características se distanciam um determinado número de
desvios padrões da média da base de conhecimento.

Um ponto de cuja vizinhança possui menos elementos que uma porcentagem
predeterminada da base de conhecimento.
Correto!Correto!
As anomalias não são atributos ou conjuntos de atributos, mas são
exemplos da base de dados. Esses exemplos são representados
como pontos no espaço de atributos, e uma anomalia é definida no
algoritmo DB-outlier em função da densidade de sua vizinhança.
6 / 6 ptsPergunta 2
Relacione os tipos de dados com os exemplos de atributos correspondentes:
Dado quantitativo de razão
peso
Correto!Correto!
Dado quantitativo intervalar
temperatura do ar
Correto!Correto!
Dado qualitativo ordinal
ordem de nascimento
Correto!Correto!
Dado qualitativo nominal
cor do olho
Correto!Correto!
30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018)
https://pucminas.instructure.com/courses/149/quizzes/22880 3/8
O peso é um dado numérico que possui um zero absoluto, e por isso
é considerado quantitativo de razão.
A ordem de nascimento, não é um dado quantitativo em si, uma vez
que ele não possui uma escala definida, mas expressa ordem, o que
o torna um dado ordinal.
A cor do olho não pode ser ordenada, e por isso é um dado nominal.
Finalmente a temperatura é um dado contínuo que não possui
necessariamente um zero absoluto, uma vez que não foi descrita a
escala utilizada. Neste caso, ele ´te um atributo intervalar.
6 / 6 ptsPergunta 3
Para se evitar o overfitting em um algoritmo de árvore de decisão, podemos:
Aumentar o número mínimo de amostras por nó folha. Correto!Correto!

Alterar a medida de seleção de atributos do Ganho da Informação para Taxa
de Ganho.
Permitir que atributos contínuos possam ser utilizados mais de uma vez.
Usar uma abordagem gulosa para seleção do melhor atributo.
30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018)
https://pucminas.instructure.com/courses/149/quizzes/22880 4/8
Ao aumentar o número mínimo de elementos em cada nó folha, será
produzida uma ação de poda da árvore, caso um atributo gere nós
com poucos registros. A medida de seleção de atributos pode alterar
a estrutura da árvore, mas não se evita overfitting. Toda árvore de
decisão adota uma abordagem gulosa para a escolha do melhor
atributo. Para se produzir classificadores mais fracos, poderia se
utilizar uma abordagem de amostragem de atributos, o que poderia
produzir árvores com menor overfitting. Atributos contínuos já são
utilizados mais de uma vez no algoritmo C4.5 ou J48. Entretanto,
quando mais subdivisões são feitas em um mesmo atributo, maior a
chance de overfitting.
6 / 6 ptsPergunta 4
Segundo Joe Blitzstein e Hanspeler Plister, “Introduction to Data Science”,
Harvard Data Science Course, as etapas do processo de ciência de dados
são:

b) Entender o negócio, preparar dados, modelar o problema, avaliar o modelo
e fazer a distribuição do modelo.

a) Coletar dados, explorar dados, modelar dados, comunicar e visualizar
resultados.
Correto!Correto!

c) Identificar as necessidades, selecionar, limpar e enriquecer dados,
identificar padrões e descrever resultados.

d) Amostrar dados, explorar dados, modificar dados, modelar dados, avaliar o
modelo.
30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018)
https://pucminas.instructure.com/courses/149/quizzes/22880 5/8
A ciência de dados em sua visão clássica tem como princípio base a
indução de modelos com a finalidade de comunicar e visualizar os
resultados, sem o objetivo específico de distribuir os modelos para
uso comercial. Por isso suas etapas são: "Coletar dados, explorar
dados, modelar dados, comunicar e visualizar resultados".
As etapas do CRIP-DM, usado no processo de mineração de dados
são: "Entender o negócio, preparar dados, modelar o problema,
avaliar o modelo e fazer a distribuição do modelo."
Finalmente, o processo de KDD consiste em: "Identificar as
necessidades, selecionar, limpar e enriquecer dados, identificar
padrões e descrever resultados".
6 / 6 ptsPergunta 5
Clustering, ou análise de agrupamentos é uma forma de se:
Identificar perfis de dados semelhantes. Correto!Correto!
Estimar o comportamento médio de uma população de dados.
Descrever a topologia da distribuição dos dados.
Identificar a correlação entre diversos atributos.
Técnicas de agrupamento são baseadas em uma medida de
distância ou de similaridade, que fazem com que dados semelhantes
sejam agrupados em umesmo cluster, enquanto dados distintos
sejam alocados em clústeres diferentes.
6 / 6 ptsPergunta 6
Em aprendizado de máquina,
30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018)
https://pucminas.instructure.com/courses/149/quizzes/22880 6/8
b) modelos computacionais são construídos a partir de exemplos. Correto!Correto!

d) algoritmos são construídos a partir de métodos de resolução de problema.
a) regras são construídas a partir do conhecimento de especialistas.
c) dados são descritos a partir de análises estatísticas.
A definição formal de aprendizado de máquina, conforme Tom
Mitchel, é que o aprendizado de máquina consiste de algoritmos que
aprendem com exemplos.
A presença do especialista não é necessária caso seja feito
aprendizado não supervisionado. Mesmo no aprendizado
supervisionado, fatos podem representar o conhecimento do
especialista.
Apesar da análise estatística ser componente básico da maioria dos
algoritmos de aprendizado de máquina, ela não é uma condição
obrigatória para a existência dos algoritmos de aprendizado.
No aprendizado de máquina o foco não é na construção de
algoritmos, mas na indução de modelos, utilizando-se algoritmos de
aprendizado já existentes.
6 / 6 ptsPergunta 7
Um atributo CONCEITO pode receber os valores: A, B, C, D e E; que
representam o conceito que um aluno obteve ao cursaruma disciplina. Esse
atributo é do tipo:
Quantitativo multivalorado.
Qualitativo categórico.
Quantitativo discreto.
Qualitativo ordinal. Correto!Correto!
30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018)
https://pucminas.instructure.com/courses/149/quizzes/22880 7/8
O conceito é um atributo polinominal, mas ele possui relação de
ordem entre seus valores, uma vez que o conceito A > B > C > D > E,
e por isso é considerado um dado ordinal.
6 / 6 ptsPergunta 8
Robot traders são programas de computadores capazes de operar de forma
autônoma na bolsa de valores. Eles podem ser desenvolvidos com regras
fixas baseadas em indicadores de análise técnica ou podem possuir um
modelo que combine esses indicadores de forma a maximizar o lucro do
robô em um período determinado. O problema de identificar os pesos dos
indicadores que maximizam o resultado do robô é um problema de:
Recomendação.
Regra de associação.
Regressão. Correto!Correto!
Classificação.
A tarefa de previsão de valores contínuos consiste em uma tarefa de
regressão.
6 / 6 ptsPergunta 9
São formas de Avaliação da qualidade de modelos, EXCETO:
Acurácia por classe.
Precisão e Revocação.
Índice de pureza. Correto!Correto!
30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018)
https://pucminas.instructure.com/courses/149/quizzes/22880 8/8
Log-loss.
Índice de pureza, ou Gini, é uma medida inicialmente criada para os
algoritmos CART de indução de árvore de decisão, e não avalia a
qualidade de um modelo.
6 / 6 ptsPergunta 10
São hiperparâmetros para a configuração de uma rede neural, EXCETO:
Número de neurônios na camada oculta.
Taxa de ajuste do erro. Correto!Correto!
Taxa de aprendizado.
Número de camadas ocultas da rede.
Os erros não são ajustados. O que são ajustados são os pesos da
rede. E estes pesos são ajustados em função do erro e da taxa de
aprendizado. O erro é dado pela saída da rede e pela saída real, e
não é um hiperparâmetro.
Pontuação do teste: 60 de 60