PROVA ON-LINE_ 07 - Machine Learning (2022)

•

PUC-MINAS

rafael rosenberg

23/09/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 9 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Machine Learning

1.265 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

9/12/22, 10:16 AM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 1/9
PROVA ON-LINE
Entrega Sem prazo Pontos 60 Perguntas 10
Disponível depois 1 ago em 10:00 Limite de tempo 60 Minutos
Tentativas permitidas Sem limite
Instruções
Histórico de tentativas
Tentativa Tempo Pontuação
MAIS RECENTE Tentativa 1 19 minutos 48 de 60
Pontuação desta tentativa: 48 de 60
Enviado 12 set em 10:14
Esta tentativa levou 19 minutos.
ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento necessário nesta
disciplina.
Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa, será identificado
como uma prova extra e resultará em pagamento de taxa extra.
INSTRUÇÕES DA AVALIAÇÃO ON-LINE
A prova tem a duração de 60 minutos.
Ao clicar em PROVA ON-LINE, no menu “Testes” você iniciará a prova. A partir daí não será
possível desistir de realizá-la.
A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos.
Ao final do teste não se esqueça de enviá-lo, clicando no botão “ENVIAR TESTE”. Só utilize esse
botão quando tiver finalizado a avaliação.
Se necessário, durante a prova, entre em contato pelo link “Atendimento”.
ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas serão
automaticamente encerradas pelo sistema transcorridos os 60 minutos de duração.
Boa Prova!
Fazer o teste novamente
https://pucminas.instructure.com/courses/90423/quizzes/322201/history?version=1
https://pucminas.instructure.com/courses/90423/quizzes/322201/take?user_id=196222
9/12/22, 10:16 AM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 2/9
6 / 6 ptsPergunta 1
Uma agência de empregos deseja utilizar aprendizado de máquina para
prever a duração do tempo de desemprego de um desempregado à
procura de emprego, com o objetivo de atuar proativamente na
interrupção do padrão de desemprego.
O algoritmo que ele pode utilizar na resolução desse problema é:
Regras de associação.
Árvores de decisão.
Regressão linear. Correto!Correto!
Random Forest.
A tarefa de previsão da "duração do tempo de desemprego de um
desempregado a procura de emprego" tem por objetivo estimar o
valor de um atributo alvo contínuo. Essa é uma tarefa de
aprendizado supervisionado que tem como um possível algoritmo
a regressão linear.
Todas as demais opções da pergunta ilustram algoritmos
baseados em regras, que não são adequados para valores
contínuos. As regras de associação não são nem mesmo um
algoritmo de aprendizado supervisionado.
6 / 6 ptsPergunta 2
Segundo Joe Blitzstein e Hanspeler Plister, “Introduction to Data
Science”, Harvard Data Science Course, as etapas do processo de
9/12/22, 10:16 AM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 3/9
ciência de dados são:

Coletar dados, explorar dados, modelar dados, comunicar e visualizar
resultados.
Correto!Correto!

Entender o negócio, preparar dados, modelar o problema, avaliar o
modelo e fazer a distribuição do modelo.

Amostrar dados, explorar dados, modificar dados, modelar dados e avaliar
o modelo.

Identificar as necessidades, selecionar, limpar e enriquecer dados,
identificar padrões e descrever resultados.
A ciência de dados em sua visão clássica tem como princípio base
a indução de modelos com a finalidade de comunicar e visualizar
os resultados, sem o objetivo específico de distribuir os modelos
para uso comercial. Por isso suas etapas são: "Coletar dados,
explorar dados, modelar dados, comunicar e visualizar
resultados".
As etapas do CRIP-DM, usado no processo de mineração de
dados são: "Entender o negócio, preparar dados, modelar o
problema, avaliar o modelo e fazer a distribuição do modelo."
Finalmente, o processo de KDD consiste em: "Identificar as
necessidades, selecionar, limpar e enriquecer dados, identificar
padrões e descrever resultados".
6 / 6 ptsPergunta 3
9/12/22, 10:16 AM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 4/9
São formas de Avaliação da qualidade de modelos, exceto:
Índice de pureza. Correto!Correto!
Precisão e Revocação.
Log-loss.
Acurácia por classe.
Índice de pureza, ou Gini, é uma medida inicialmente criada para
os algoritmos CART de indução de árvore de decisão, e não avalia
a qualidade de um modelo.
6 / 6 ptsPergunta 4
Uma medida de interesse para regras de associação é
Lift. Correto!Correto!
Correto. Lift indica a força de uma regra sobre a coocorrência
aleatória de seus antecedentes e consequentes, e é utilizada como
uma medida de interesse para as regras de associação. Valores
superiores a 1 indicam que a regra aumenta a capacidade de
previsão sobre o caso aleatório.
Completeza.
Acurácia.
Revocação.
9/12/22, 10:16 AM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 5/9
6 / 6 ptsPergunta 5
Se você possui um problema em que o objetivo é minimizar o erro de
estimação de um valor contínuo baseado em um conjunto de atributos, o
algoritmo mais adequado para o problema é:
K-means.
AGNES - Aglomerative Nesting.
Regressão linear. Correto!Correto!
Naïve Bayes.
A estimação de um valor contínuo consistem em uma tarefa de
previsão, em que a regressão linear pode ser um candidato
possível. AGNES e K-means são algoritmos de agrupamento.
Nayve Bayes, em sua versão contínua, que utiliza funções de
distribuição de probabilidade, pode ser utilizado para regressão
(FRANK, TRIGG, HOLMES & WITTEN, 1999), mas ele não se
baseia na minimização do erro de estimação e sua performance é
ruim.
6 / 6 ptsPergunta 6
Robot traders são programas de computadores capazes de operar de
forma autônoma na bolsa de valores. Eles podem ser desenvolvidos com
regras fixas baseadas em indicadores de análise técnica ou podem
9/12/22, 10:16 AM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 6/9
possuir um modelo que combine esses indicadores de forma a maximizar
o lucro do robô em um período determinado.
O problema de identificar os pesos dos indicadores que maximizam o
resultado do robô é um problema de:
Regressão. Correto!Correto!
Classificação.
Regra de associação.
Recomendação.
A tarefa de previsão de valores contínuos consiste em uma tarefa
de regressão.
0 / 6 ptsPergunta 7
É uma abordagem do aprendizado não supervisionado:
Mistura de dados rotulados e não rotulados.
Agrupamento de dados por densidade. esposta corretaesposta correta
Receber feedback do ambiente.
Indução de regras. ocê respondeuocê respondeu
9/12/22, 10:16 AM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 7/9
Agrupamento é uma tarefa típica de aprendizado não
supervisionado. A indução de regras pode ser não supervisionada,
como no caso de regras de associação, ou supervisionada, como
no caso de árvore de decisão. A mistura de dados não rotulados
com dados rotulados é chamado de aprendizado semi
supervisionado. Receber feedback do ambiente é uma tarefa
típica de aprendizado por reforço.
6 / 6 ptsPergunta 8
Em aprendizado de máquina,
regras são construídas a partir do conhecimento de especialistas.
dados são descritos a partir de análises estatísticas.

algoritmos são construídos a partir de métodos de resolução de problema.
modelos computacionais são construídos a partir de exemplos. Correto!Correto!
9/12/22, 10:16 AM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 8/9
A definição formal de aprendizado de máquina, conforme Tom
Mitchel, é que o aprendizado de máquina consiste de algoritmos
que aprendem com exemplos.
A presença do especialista não é necessária caso seja feito
aprendizado não supervisionado. Mesmo no aprendizado
supervisionado, fatos podemrepresentar o conhecimento do
especialista.
Apesar da análise estatística ser componente básico da maioria
dos algoritmos de aprendizado de máquina, ela não é uma
condição obrigatória para a existência dos algoritmos de
aprendizado.
No aprendizado de máquina o foco não é na construção de
algoritmos, mas na indução de modelos, utilizando-se algoritmos
de aprendizado já existentes.
0 / 6 ptsPergunta 9
Para se evitar o overfitting em um algoritmo de árvore de decisão,
podemos:

Alterar a medida de seleção de atributos do Ganho da Informação para
Taxa de Ganho.

Permitir que atributos contínuos possam ser utilizados mais de uma vez.
Usar uma abordagem gulosa para seleção do melhor atributo. ocê respondeuocê respondeu
Aumentar o número mínimo de amostras por nó folha. esposta corretaesposta correta
9/12/22, 10:16 AM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 9/9
Ao aumentar o número mínimo de elementos em cada nó folha,
será produzida uma ação de poda da árvore, caso um atributo
gere nós com poucos registros. A medida de seleção de atributos
pode alterar a estrutura da árvore, mas não se evita overfitting.
Toda árvore de decisão adota uma abordagem gulosa para a
escolha do melhor atributo. Para se produzir classificadores mais
fracos, poderia se utilizar uma abordagem de amostragem de
atributos, o que poderia produzir árvores com menor overfitting.
Atributos contínuos já são utilizados mais de uma vez no algoritmo
C4.5 ou J48. Entretanto, quando mais subdivisões são feitas em
um mesmo atributo, maior a chance de overfitting.
6 / 6 ptsPergunta 10
Clustering, ou análise de agrupamentos, é uma forma de se:
Identificar a correlação entre diversos atributos.
Identificar perfis de dados semelhantes. Correto!Correto!
Estimar o comportamento médio de uma população de dados.
Descrever a topologia da distribuição dos dados.
Técnicas de agrupamento são baseadas em uma medida de
distância ou de similaridade, que fazem com que dados
semelhantes sejam agrupados em um mesmo cluster, enquanto
dados distintos sejam alocados em clústeres diferentes.
Pontuação do teste: 48 de 60