PUC_MINAS_PROVA ONLINE _ 09 Machine Learning (2019)_02

•

PUC-MINAS

7

1

7

1

KaLe Technology

12/11/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Machine Learning

1.260 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

11/11/2021 23:25 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 1/10
PROVA ONLINE
Entrega Sem prazo Pontos 60 Perguntas 10 Disponível depois 15 de mai de 2020 em 10:00
Limite de tempo 60 Minutos Tentativas permitidas Sem limite
Instruções
Histórico de tentativas
Tentativa Tempo Pontuação
MANTIDO Tentativa 2 43 minutos 42 de 60
ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento necessário nesta disciplina.
Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa, será identificado como uma prova extra e
resultará em pagamento de taxa extra.
INSTRUÇÕES DA AVALIAÇÃO ON-LINE
A prova tem a duração de 60 minutos.
Ao clicar em PROVA ON-LINE, no menu “Testes” você iniciará a prova. A partir daí não será possível desistir de realizá-la.
A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos.
Ao final do teste não se esqueça de enviá-lo, clicando no botão “ENVIAR TESTE”. Só utilize esse botão quando tiver finalizado a avaliação.
Se necessário, durante a prova, entre em contato pelo link “Atendimento”.
ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas serão automaticamente encerradas pelo sistema transcorridos os 60
minutos de duração.
Boa Prova!
Fazer o teste novamente
https://pucminas.instructure.com/courses/1765/quizzes/60824/history?version=2
https://pucminas.instructure.com/courses/1765/quizzes/60824/take?user_id=46471
11/11/2021 23:25 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 2/10
Tentativa Tempo Pontuação
MAIS RECENTE Tentativa 2 43 minutos 42 de 60
Tentativa 1 54 minutos 24 de 60
Pontuação desta tentativa: 42 de 60
Enviado 11 nov em 23:25
Esta tentativa levou 43 minutos.
0 / 6 ptsPergunta 1
O objetivo das técnicas de boosting é:
Combinar modelos mais fracos para obter alta acurácia. Resposta corretaResposta correta
Combinar diferentes algoritmos para tratar atributos com formatos diferentes.
Construir modelos para diversas partições de dados para evitar o overfitting. Você respondeuVocê respondeu
Combinar modelos independentes entre si para representar as diversas dimensões dos dados.
O objetivo do boosting é o de aumentar a acurácia do modelo. Ele precisa utilizar classificadores fracos para
que os modelos gerados sejam independentes entre si.
https://pucminas.instructure.com/courses/1765/quizzes/60824/history?version=2
https://pucminas.instructure.com/courses/1765/quizzes/60824/history?version=1
11/11/2021 23:25 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 3/10
6 / 6 ptsPergunta 2
São formas de Avaliação da qualidade de modelos, EXCETO:
Precisão e Revocação.
Log-loss.
Índice de pureza. Correto!Correto!
Acurácia por classe.
Índice de pureza, ou Gini, é uma medida inicialmente criada para os algoritmos CART de indução de árvore de
decisão, e não avalia a qualidade de um modelo.
6 / 6 ptsPergunta 3
Sobre medidas de distância, podemos afirmar que:
O Rank pode ser utilizado para permitir a utilização de distância binárias em dados categóricos não ordinais.
Similaridade de cossenos é adequada para dados esparsos, com um elevado número de dimensões. Correto!Correto!
Distância euclidiana é adequada para dados com elevada dimensão que não estejam normalizados.
11/11/2021 23:25 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 4/10
Distância de Jaccard é utilizada para variáveis binárias simétricas.
A distância de Jaccard é utilizada para dados assimétricos. A distância euclidiana sofre muito com a maldição
da dimensionalidade e é sensível à normalização dos dados. O rank só pode ser utilizado para dados
polinominais ordinais.
6 / 6 ptsPergunta 4
Em aprendizado de máquina,
dados são descritos a partir de análises estatísticas.
modelos computacionais são construídos a partir de exemplos. Correto!Correto!
algoritmos são construídos a partir de métodos de resolução de problema.
regras são construídas a partir do conhecimento de especialistas.
11/11/2021 23:25 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 5/10
A definição formal de aprendizado de máquina, conforme Tom Mitchel, é que o aprendizado de máquina
consiste de algoritmos que aprendem com exemplos.
A presença do especialista não é necessária caso seja feito aprendizado não supervisionado. Mesmo no
aprendizado supervisionado, fatos podem representar o conhecimento do especialista.
Apesar da análise estatística ser componente básico da maioria dos algoritmos de aprendizado de máquina,
ela não é uma condição obrigatória para a existência dos algoritmos de aprendizado.
No aprendizado de máquina o foco não é na construção de algoritmos, mas na indução de modelos, utilizando-
se algoritmos de aprendizado já existentes.
6 / 6 ptsPergunta 5
Robot traders são programas de computadores capazes de operar de forma autônoma na bolsa de valores. Eles
podem ser desenvolvidos com regras fixas baseadas em indicadores de análise técnica ou podem possuir um modelo
que combine esses indicadores de forma a maximizar o lucro do robô em um período determinado. Eles podem tomar
decisões de compra, venda e manutensão de posição, ou podem trabalhar na tentativa de estimar o preço ótimo para
se operar.

Supondo que um Robo foi desenvolvido com o propósito de estimar o valor futuro de uma moeda, a identificação dos
pesos dos indicadores que maximizam o resultado do robô é um problema de:
Regra de associação.
11/11/2021 23:25 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 6/10
Regressão. Correto!Correto!
Recomendação.
Classificação.
A tarefa de previsão de valores contínuos consiste em uma tarefa de regressão.
0 / 6 ptsPergunta 6
Uma universidade induziu um modelo para classificar se um aluno está propenso a cometer evasão. Após o
treinamento, o modelo produziu a seguinte matriz de confusão sobre os dados de validação.
EVADIU NÃO EVADIU
PREV. EVADIU 50 30
PREV. NÃO EVADIU 30 90
Sobre esse modelo, podemos afirmar que:

A precisão do modelo é 62,5%. Resposta corretaResposta correta
A acurária por classe do modelo é 70%. Você respondeuVocê respondeu
11/11/2021 23:25 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 7/10
70% é a acurácia total. A acurácia por classe é calculada pela média das acurácias de cada classe individualmente:
(50/80 + 90/120)/2 = 68,75%
A revocação ou recall é 75%.

Como a quantidade de falso negativos é a mesma que a quantidade de falso positivos, então a acurácia por classe será a
mesma que a acurácia geral.
0 / 6 ptsPergunta 7
Uma agência de empregos deseja utilizar aprendizado de máquina para prever a duração do tempo de desemprego
de um desempregado à procura de emprego, com o objetivo de atuar proativamente na interrupção do padrão de
desemprego.
O algoritmo que ele pode utilizar na resolução desse problema é:
Árvores de decisão.
Random Forest.
Regressão linear. Resposta corretaResposta correta
Regras de associação. Você respondeuVocê respondeu
11/11/2021 23:25 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 8/10
A tarefa de previsão da "duração do tempo de desemprego de um desempregado a procura de emprego" tem
por objetivo estimar o valor de um atributo alvo contínuo. Essa é uma tarefa de aprendizado supervisionado
que tem como um possível algoritmo a regressão linear.
Todas as demais opções da pergunta ilustram algoritmos baseados em regras, que não são adequados para
valores contínuos. As regras de associação não são nem mesmo um algoritmo de aprendizado supervisionado.
6 / 6 ptsPergunta 8
Para se evitar o overfitting em um algoritmo de árvorede decisão, podemos:
Alterar a medida de seleção de atributos do Ganho da Informação para Taxa de Ganho.
Permitir que atributos contínuos possam ser utilizados mais de uma vez.
Aumentar o número mínimo de amostras por nó folha. Correto!Correto!
Usar uma abordagem gulosa para seleção do melhor atributo.
11/11/2021 23:25 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 9/10
Ao aumentar o número mínimo de elementos em cada nó folha, será produzida uma ação de poda da árvore,
caso um atributo gere nós com poucos registros. A medida de seleção de atributos pode alterar a estrutura da
árvore, mas não se evita overfitting. Toda árvore de decisão adota uma abordagem gulosa para a escolha do
melhor atributo. Para se produzir classificadores mais fracos, poderia se utilizar uma abordagem de
amostragem de atributos, o que poderia produzir árvores com menor overfitting. Atributos contínuos já são
utilizados mais de uma vez no algoritmo C4.5 ou J48. Entretanto, quando mais subdivisões são feitas em um
mesmo atributo, maior a chance de overfitting.
6 / 6 ptsPergunta 9
Em um modelo de aprendizado baseado em regras de associação, um indicador de que uma regra é útil, ou seja, que
provê informação mais forte que a coocorrência aleatória dos antecedentes e consequentes é:
Se Convicção produzir um valor maior que um.
Se Lift possuir valor superior a um. Correto!Correto!
Se Ganho, para 𝜽=𝟐.𝟎 for maior que zero.
Se Suporte e Confiança forem altos, acima de um limiar.
O Lift é a medida de qualidade que mede a força de uma regra em relação à coocorrência aleatória dos
antecedentes e consequentes. Um valor maior que um indica que a regra possui relevância.
11/11/2021 23:25 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 10/10
6 / 6 ptsPergunta 10
Clustering, ou análise de agrupamentos, é uma forma de se:
Identificar a correlação entre diversos atributos.
Identificar perfis de dados semelhantes. Correto!Correto!
Descrever a topologia da distribuição dos dados.
Estimar o comportamento médio de uma população de dados.
Técnicas de agrupamento são baseadas em uma medida de distância ou de similaridade, que fazem com que
dados semelhantes sejam agrupados em umesmo cluster, enquanto dados distintos sejam alocados em
clústeres diferentes.
Pontuação do teste: 42 de 60