Compilado - Provas 09 - Machine Learning (1)

•

PUC-MINAS

Marco Dias

19/07/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 62 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 62 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 62 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Administração

600.685 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

02/06/2020 PROVA ONLINE : 09. Machine Learning (2019)
file:///C:/Users/Dani & Edu/Downloads/PROVA ONLINE _ 09. Machine Learning (2019).html 1/9
PROVA ONLINE
Entrega Sem prazo Pontos 60 Perguntas 10
Disponível depois 15 mai em 10:00 Limite de tempo 60 Minutos
Tentativas permitidas Sem limite
Instruções
Histórico de tentativas
Tentativa Tempo Pontuação
MAIS
RECENTE
Tentativa 1
(https://pucminas.instructure.com/courses/1765/quizzes/60824/history?
9
minutos 42 de 60
Pontuação desta tentativa: 42 de 60
Enviado 2 jun em 17:22
Esta tentativa levou 9 minutos.
ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento
necessário nesta disciplina.
Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa,
será identificado como uma prova extra e resultará em pagamento de taxa extra.
INSTRUÇÕES DA AVALIAÇÃO ON-LINE
A prova tem a duração de 60 minutos.
Ao clicar em PROVA ON-LINE, no menu “Testes” você iniciará a prova. A partir daí não será
possível desistir de realizá-la.
A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos.
Ao final do teste não se esqueça de enviá-lo, clicando no botão “ENVIAR TESTE”. Só utilize
esse botão quando tiver finalizado a avaliação.
Se necessário, durante a prova, entre em contato pelo link “Atendimento”.
ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas serão
automaticamente encerradas pelo sistema transcorridos os 60 minutos de duração.
Boa Prova!
Fazer o teste novamente (https://pucminas.instructure.com/courses/1765/quizzes/60824/take?
user_id=47368)
6 / 6 ptsPergunta 1
https://pucminas.instructure.com/courses/1765/quizzes/60824/history?version=1
https://pucminas.instructure.com/courses/1765/quizzes/60824/take?user_id=47368
02/06/2020 PROVA ONLINE : 09. Machine Learning (2019)
file:///C:/Users/Dani & Edu/Downloads/PROVA ONLINE _ 09. Machine Learning (2019).html 2/9
Malwares são uma grande ameaça à segurança de dados. Uma forma
de detectar esses softwares maliciosos consiste em utilizar códigos de
Malwares já descobertos na construção de um modelo capaz de
identificar novas versões desses trechos de software.
O tipo de aprendizado que deve ser utilizado neste caso é:
Aprendizado supervisionado. Correto!Correto!Correto!Correto!
Aprendizado conexionista.
Aprendizado por reforço.
Aprendizado não supervisionado.
A detecção de malwares é uma tarefa de classificação, onde
trechos de código são classificados entre código malicioso e
não malicioso, por isso é uma tarefa de aprendizado
supervisionado. O aprendizado conexionista é o baseado em
redes neurais. Apesar das redes MLP realizarem aprendizado
supervisionado, existem topologias de rede como o SOM (Self
Organizing Maps), por exemplo, que realizam aprendizado não
supervisionado.
6 / 6 ptsPergunta 2
O objetivo das técnicas de boosting é:
Combinar modelos mais fracos para obter alta acurácia. Correto!Correto!Correto!Correto!

Construir modelos para diversas partições de dados para evitar o
overfitting.
02/06/2020 PROVA ONLINE : 09. Machine Learning (2019)
file:///C:/Users/Dani & Edu/Downloads/PROVA ONLINE _ 09. Machine Learning (2019).html 3/9

Combinar diferentes algoritmos para tratar atributos com formatos
diferentes.

Combinar modelos independentes entre si para representar as diversas
dimensões dos dados.
O objetivo do boosting é o de aumentar a acurácia do modelo.
Ele precisa utilizar classificadores fracos para que os modelos
gerados sejam independentes entre si.
0 / 6 ptsPergunta 3
Uma medida de interesse para regras de associação é
Acurácia. ocê respondeuocê respondeuocê respondeuocê respondeu
Errado. Acurácia é uma medida para aprendizado
supervisionado, e regras de associação é um tipo de aprendizado
não supervisionado.
Revocação.
Completeza.
Lift. esposta corretaesposta corretaesposta corretaesposta correta
0 / 6 ptsPergunta 4
São formas de separação entre base de treinamento e base de testes,
EXCETO:
02/06/2020 PROVA ONLINE : 09. Machine Learning (2019)
file:///C:/Users/Dani & Edu/Downloads/PROVA ONLINE _ 09. Machine Learning (2019).html 4/9
Percentage Split.
Amostragem com reposição. esposta corretaesposta corretaesposta corretaesposta correta
Cross Validation.
Amostragem estratificada. ocê respondeuocê respondeuocê respondeuocê respondeu
Na amostragem com reposição, um elemento pode ser
sorteado mais de uma vez. Isso permitiria que um mesmo
elemento fosse selecionado para a base de treinamento e de
teste simultaneamente, violando o princípio básico da avaliação
de modelos de aprendizado supervisionado.
6 / 6 ptsPergunta 5
São hiperparâmetros para a configuração de uma rede neural,
EXCETO:
Taxa de ajuste do erro. Correto!Correto!Correto!Correto!
Número de camadas ocultas da rede.
Número de neurônios na camada oculta.
Taxa de aprendizado.
Os erros não são ajustados. O que são ajustados são os pesos
da rede. E estes pesos são ajustados em função do erro e da
taxa de aprendizado. O erro é dado pela saída da rede e pela
saída real, e não é um hiperparâmetro.
02/06/2020 PROVA ONLINE : 09. Machine Learning (2019)
file:///C:/Users/Dani & Edu/Downloads/PROVA ONLINE _ 09. Machine Learning (2019).html 5/9
6 / 6 ptsPergunta 6
Em um modelo de aprendizado baseado em regras de associação, um
indicador de que uma regra é útil, ou seja, que provê informação mais
forte que a coocorrência aleatória dos antecedentes e consequentes é:
Se Suporte e Confiança forem altos, acima de um limiar.
Se Ganho, para 𝜽=𝟐.𝟎 for maior que zero.
Se Convicção produzir um valor maior que um.
Se Lift possuir valor superior a um. Correto!Correto!Correto!Correto!
O Lift é a medida de qualidade que mede a força de uma regra
em relação à coocorrência aleatória dos antecedentes e
consequentes. Um valor maior que um indica que a regra
possui relevância.
6 / 6 ptsPergunta 7
Se você possui um problema com uma grande base de dados, em que
o importante é a acurácia de classificação em detrimento da
interpretabilidade do modelo, o algoritmo mais adequado para o
problema é:
Árvore de decisão.
Rede Neural. Correto!Correto!Correto!Correto!
Naïve Bayes.
A-priori.
02/06/2020 PROVA ONLINE : 09. Machine Learning (2019)
file:///C:/Users/Dani & Edu/Downloads/PROVA ONLINE _ 09. Machine Learning (2019).html 6/9
A princípio a rede neural é o algoritmo mais adequado para se
obter uma alta acurácia, mas seu modelo não é interpretável. A
maior acurácia pode ser obtida aumentando-se o número de
neurônios na camada oculta ou até mesmo o número de
camadas ocultas. Entretanto, deve-se atentar para a
possibilidade de overfitting. É importante que se tenha a
quantidade de dados adequada para que o aprendizado possa
convergir sem a necessidade de muitas épocas.
O algoritmo de Naive Bayes por vezes se sai tão bem quanto
uma rede neural, ou pode obter até mesmo uma acurácia
superior à da rede neural, mas ele é muito sensível à
distribuição dos dados e pode sofrer com variáveis
condicionalmente dependentes.
6 / 6 ptsPergunta 8
Sobre o processo de aprendizado supervisionado, é correto afirmar
que:

Um modelo é generalizável se sua performance na base de testes for
superior à performance da base de treinamento.

Se a performance do modelo na base de treinamento for inferior à
performance do modelo na base de testes, então este modelo sofreu
underfitting.

Grid-search é uma técnica de ajustamento de modelo baseado na
utilização de uma cominação sistemática de valores de
hiperparâmetros.
Correto!Correto!Correto!Correto!
02/06/2020 PROVA ONLINE : 09. Machine Learning (2019)
file:///C:/Users/Dani & Edu/Downloads/PROVA ONLINE _ 09. Machine Learning (2019).html 7/9
A técnica de grid-search monta uma matriz que combina
diferentes valores de hiperparâmetros e busca a combinação que
produz o melhor desempenho.

A validação cruzada com 3 partes (3-fold) precisa de uma base de
dados com muitos exemplos para ser efetiva.
0 / 6 ptsPergunta 9
SegundoJoe Blitzstein e Hanspeler Plister, “Introduction to Data
Science”, Harvard Data Science Course, as etapas do processo de
ciência de dados são:

Amostrar dados, explorar dados, modificar dados, modelar dados e
avaliar o modelo.

Entender o negócio, preparar dados, modelar o problema, avaliar o
modelo e fazer a distribuição do modelo.
ocê respondeuocê respondeuocê respondeuocê respondeu

Coletar dados, explorar dados, modelar dados, comunicar e visualizar
resultados.
esposta corretaesposta corretaesposta corretaesposta correta

Identificar as necessidades, selecionar, limpar e enriquecer dados,
identificar padrões e descrever resultados.
02/06/2020 PROVA ONLINE : 09. Machine Learning (2019)
file:///C:/Users/Dani & Edu/Downloads/PROVA ONLINE _ 09. Machine Learning (2019).html 8/9
A ciência de dados em sua visão clássica tem como princípio
base a indução de modelos com a finalidade de comunicar e
visualizar os resultados, sem o objetivo específico de distribuir
os modelos para uso comercial. Por isso suas etapas são:
"Coletar dados, explorar dados, modelar dados, comunicar e
visualizar resultados".
As etapas do CRIP-DM, usado no processo de mineração de
dados são: "Entender o negócio, preparar dados, modelar o
problema, avaliar o modelo e fazer a distribuição do modelo."
Finalmente, o processo de KDD consiste em: "Identificar as
necessidades, selecionar, limpar e enriquecer dados, identificar
padrões e descrever resultados".
6 / 6 ptsPergunta 10
Um atributo CONCEITO pode receber os valores: A, B, C, D e E, que
representam o conceito que um aluno obteve ao cursar uma disciplina.
Esse atributo é do tipo:
Qualitativo categórico.
Qualitativo ordinal. Correto!Correto!Correto!Correto!
Quantitativo discreto.
Quantitativo multivalorado.
O conceito é um atributo polinominal, mas ele possui relação de
ordem entre seus valores, uma vez que o conceito A > B > C >
D > E, e por isso é considerado um dado ordinal.
02/06/2020 PROVA ONLINE : 09. Machine Learning (2019)
file:///C:/Users/Dani & Edu/Downloads/PROVA ONLINE _ 09. Machine Learning (2019).html 9/9
Pontuação do teste: 42 de 60
PROVA ONLINE 25/04/2020
Entrega 25 abr em 18:20 Pontos 60 Perguntas 10
Disponível 25 abr em 14:00 - 25 abr em 18:20 aproximadamente 4 horas
Limite de tempo 60 Minutos
Instruções
Este teste foi travado 25 abr em 18:20.
Histórico de tentativas
Tentativa Tempo Pontuação
MAIS RECENTE Tentativa 1 19 minutos 42 de 60
Pontuação deste teste: 42 de 60
Enviado 25 abr em 16:14
Esta tentativa levou 19 minutos.
ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento
necessário nesta disciplina.
Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa,
será identificado como uma prova extra e resultará em pagamento de taxa extra.
INSTRUÇÕES DA AVALIAÇÃO ONLINE
A prova tem a duração de 60 minutos e se realizará das 14 às 18:20 horas, horário de
Brasília.
Ao clicar em PROVA ONLINE 25/04/2020, no menu “testes” você iniciará a prova. A partir daí
não será possível desistir de realizá-la.
A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos.
Ao final do teste não se esqueça de enviá-lo clicando no botão “ENVIAR TESTE”. Só utilize
esse botão quando tiver finalizado a avaliação.
Se necessário, durante a prova entre em contato pelo link “Atendimento”.
ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas, serão
automaticamente encerradas pelo sistema transcorridos os 60 minutos de duração, ou às
18:20 horas – horário em que se encerra a aplicação.
Boa Prova!
https://pucminas.instructure.com/courses/1765/quizzes/46473/history?version=1
6 / 6 ptsPergunta 1
Sobre medidas de distância, podemos afirmar que:

Distância euclidiana é adequada para dados com elevada dimensão
que não estejam normalizados.

Similaridade de cossenos é adequada para dados esparsos, com um
elevado número de dimensões.
Correto!Correto!
Distância de Jaccard é utilizada para variáveis binárias simétricas.

O Rank pode ser utilizado para permitir a utilização de distância
binárias em dados categóricos não ordinais.
A distância de Jaccard é utilizada para dados assimétricos. A
distância euclidiana sofre muito com a maldição da
dimensionalidade e é sensível à normalização dos dados. O
rank só pode ser utilizado para dados polinominais ordinais.
6 / 6 ptsPergunta 2
Clustering, ou análise de agrupamentos, é uma forma de se:
Identificar perfis de dados semelhantes. Correto!Correto!
Estimar o comportamento médio de uma população de dados.
Identificar a correlação entre diversos atributos.
Descrever a topologia da distribuição dos dados.
Técnicas de agrupamento são baseadas em uma medida de
distância ou de similaridade, que fazem com que dados
semelhantes sejam agrupados em umesmo cluster, enquanto
dados distintos sejam alocados em clústeres diferentes.
6 / 6 ptsPergunta 3
Se você possui um problema com uma grande base de dados, em que
o importante é a acurácia de classificação em detrimento da
interpretabilidade do modelo, o algoritmo mais adequado para o
problema é:
A-priori.
Rede Neural. Correto!Correto!
Árvore de decisão.
Naïve Bayes.
A princípio a rede neural é o algoritmo mais adequado para se
obter uma alta acurácia, mas seu modelo não é interpretável. A
maior acurácia pode ser obtida aumentando-se o número de
neurônios na camada oculta ou até mesmo o número de
camadas ocultas. Entretanto, deve-se atentar para a
possibilidade de overfitting. É importante que se tenha a
quantidade de dados adequada para que o aprendizado possa
convergir sem a necessidade de muitas épocas.
O algoritmo de Naive Bayes por vezes se sai tão bem quanto
uma rede neural, ou pode obter até mesmo uma acurácia
superior à da rede neural, mas ele é muito sensível à
distribuição dos dados e pode sofrer com variáveis
condicionalmente dependentes.
6 / 6 ptsPergunta 4
Em um modelo de aprendizado baseado em regras de associação, um
indicador de que uma regra é útil, ou seja, que provê informação mais
forte que a coocorrência aleatória dos antecedentes e consequentes é:
Se Suporte e Confiança forem altos, acima de um limiar.
Se Lift possuir valor superior a um. Correto!Correto!
Se Ganho, para 𝜽=𝟐.𝟎 for maior que zero.
Se Convicção produzir um valor maior que um.
O Lift é a medida de qualidade que mede a força de uma regra
em relação à coocorrência aleatória dos antecedentes e
consequentes. Um valor maior que um indica que a regra
possui relevância.
6 / 6 ptsPergunta 5
São hiperparâmetros para a configuração de uma rede neural,
EXCETO:
Número de neurônios na camada oculta.
Taxa de aprendizado.
Número de camadas ocultas da rede.
Taxa de ajuste do erro. Correto!Correto!
Os erros não são ajustados. O que são ajustados são os pesos
da rede. E estes pesos são ajustados em função do erro e da
taxa de aprendizado. O erro é dado pela saída da rede e pela
saída real, e não é um hiperparâmetro.
6 / 6 ptsPergunta 6
Uma universidade induziu um modelo para classificar se um aluno está
propenso a cometer evasão. Após o treinamento, o modelo produziu a
seguinte matriz de confusão sobre os dados de validação.
EVADIU NÃO EVADIU
PREV. EVADIU 50 30
PREV. NÃO EVADIU 30 90
Sobre esse modelo, podemos afirmar que:

A precisão do modelo é 62,5%. Correto!Correto!
A precisão é calculada em função da quantidade de falsos
positivos: 50 / 80 = 62,5%.
A acurária por classe do modelo é 70%.

Como a quantidade de falso negativos é a mesma que a quantidade de
falso positivos, então a acurácia por classe será a mesma que a
acurácia geral.
A revocação ou recall é 75%.
6 / 6 ptsPergunta 7
Uma medida de interesse para regras de associação é
Completeza.
Acurácia.
Lift. Correto!Correto!
Correto. Lift indica a força de uma regra sobre a coocorrência
aleatória de seus antecedentes e consequentes, e é utilizada
como uma medida de interesse para as regras de associação.
Valores superiores a 1 indicamque a regra aumenta a capacidade
de previsão sobre o caso aleatório.
Revocação.
0 / 6 ptsPergunta 8
Em aprendizado de máquina,
modelos computacionais são construídos a partir de exemplos. esposta corretaesposta correta

algoritmos são construídos a partir de métodos de resolução de
problema.
regras são construídas a partir do conhecimento de especialistas.
dados são descritos a partir de análises estatísticas. ocê respondeuocê respondeu
A definição formal de aprendizado de máquina, conforme Tom
Mitchel, é que o aprendizado de máquina consiste de
algoritmos que aprendem com exemplos.
A presença do especialista não é necessária caso seja feito
aprendizado não supervisionado. Mesmo no aprendizado
supervisionado, fatos podem representar o conhecimento do
especialista.
Apesar da análise estatística ser componente básico da maioria
dos algoritmos de aprendizado de máquina, ela não é uma
condição obrigatória para a existência dos algoritmos de
aprendizado.
No aprendizado de máquina o foco não é na construção de
algoritmos, mas na indução de modelos, utilizando-se
algoritmos de aprendizado já existentes.
0 / 6 ptsPergunta 9
Para definir precisamente o problema a ser atacado e identificar
possibilidades de enriquecimento da base de conhecimento, podemos
utilizar como ferramenta:
ETL – extract, transform, load. ocê respondeuocê respondeu
Análise de fatos e julgamentos. esposta corretaesposta correta
Agregação de atributos.
Análise exploratória de dados.
Análise de fatos e julgamentos é uma técnica para definição do
problema de negócio a ser abordado, identificando uma
pergunta orientada a dados. As demais opções representam
diversas etapas do KDD e da ciência de dados.
0 / 6 ptsPergunta 10
Se você possui um problema em que o objetivo é minimizar o erro de
estimação de um valor contínuo baseado em um conjunto de atributos,
o algoritmo mais adequado para o problema é:

Regressão linear. esposta corretaesposta correta
Naïve Bayes. ocê respondeuocê respondeu
K-means.
AGNES - Aglomerative Nesting.
A estimação de um valor contínuo consistem em uma tarefa de
previsão, em que a regressão linear pode ser um candidato
possível. AGNES e K-means são algoritmos de agrupamento.
Nayve Bayes, em sua versão contínua, que utiliza funções de
distribuição de probabilidade, pode ser utilizado para regressão
(FRANK, TRIGG, HOLMES & WITTEN, 1999), mas ele não se
baseia na minimização do erro de estimação e sua performance
é ruim.
Pontuação do teste: 42 de 60
26/10/2019 Teste: PROVA ONLINE 26/10/2019
https://pucminas.instructure.com/courses/2747/quizzes/32091/take 1/5
PROVA ONLINE 26/10/2019
Iniciado: 26 out em 14:04
Instruções do teste
ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento necessário
nesta disciplina.
Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa, será
identificado como uma prova extra e resultará em pagamento de taxa extra.
INSTRUÇÕES DA AVALIAÇÃO ONLINE
A prova tem a duração de 60 minutos e se realizará das 14 às 18:20 horas, horário de Brasília.
Ao clicar em PROVA ONLINE 26/10/2019, no menu “testes” você iniciará a prova. A partir daí não será
possível desistir de realizá-la.
A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos.
Ao final do teste não se esqueça de enviá-lo clicando no botão “ENVIAR TESTE”. Só utilize esse botão
quando tiver finalizado a avaliação.
Se necessário, durante a prova entre em contato pelo link “Atendimento”.
ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas, serão automaticamente
encerradas pelo sistema transcorridos os 60 minutos de duração, ou às 18:20 horas – horário em
que se encerra a aplicação.
Boa Prova!
6 ptsPergunta 1
A precisão do modelo é 62,5%.
A acurária por classe do modelo é 70%.
A revocação ou recall é 75%.
Como a quantidade de falso negativos é a mesma que a quantidade de falso positivos, então a
acurácia por classe será a mesma que a acurácia geral.
Uma universidade induziu um modelo para classificar se um aluno está propenso a
cometer evasão. Após o treinamento, o modelo produziu a seguinte matriz de confusão
sobre os dados de validação.
EVADIU NÃO EVADIU
PREV. EVADIU 50 30
PREV. NÃO EVADIU 30 90
Sobre esse modelo, podemos afirmar que:

26/10/2019 Teste: PROVA ONLINE 26/10/2019
https://pucminas.instructure.com/courses/2747/quizzes/32091/take 2/5
6 ptsPergunta 2
Rede Neural.
Naïve Bayes.
Árvore de decisão.
A priori.
Se você possui um problema com uma grande base de dados, em que o importante é a
acurácia de classificação em detrimento da interpretabilidade do modelo, o algoritmo
mais adequado para o problema é:
6 ptsPergunta 3
Regressão linear.
Regras de associação.
Árvores de decisão.
Random Forest.
Uma agência de empregos deseja utilizar aprendizado de máquina para prever a
duração do tempo de desemprego de um desempregado à procura de emprego, com o
objetivo de atuar proativamente na interrupção do padrão de desemprego.
O algoritmo que ele pode utilizar na resolução desse problema é:
6 ptsPergunta 4
Taxa de ajuste do erro.
Taxa de aprendizado.
Número de camadas ocultas da rede.
São hiperparâmetros para a configuração de uma rede neural, EXCETO:
26/10/2019 Teste: PROVA ONLINE 26/10/2019
https://pucminas.instructure.com/courses/2747/quizzes/32091/take 3/5
Número de neurônios na camada oculta.
6 ptsPergunta 5
Identificar perfis de dados semelhantes.
Descrever a topologia da distribuição dos dados.
Estimar o comportamento médio de uma população de dados.
Identificar a correlação entre diversos atributos.
Clustering, ou análise de agrupamentos, é uma forma de se:
6 ptsPergunta 6
Métodos de combinação de modelos geralmente obtêm melhor performance com classificadores
fracos, porque eles combinam diferentes pontos de vista de cada classificador individual.
Boosting é um método de combinação de modelo que usa amostragem com reposição para
induzir de forma independente diversos classificadores.
Métodos de bossting aprendem um conjunto de classificadores usando bases de dados que
possuem subconjuntos dos atributos do dado original.
Para os algoritmos de boosting funcionarem as bases geradas devem ser o mais similar
possível.
Considerando os algoritmos de combinação de modelos baseados em boosting, é
correto afirmar que:
6 ptsPergunta 7
Amostragem com reposição.
Amostragem estratificada.
Cross Validation.
São formas de separação entre base de treinamento e base de testes, EXCETO:
26/10/2019 Teste: PROVA ONLINE 26/10/2019
https://pucminas.instructure.com/courses/2747/quizzes/32091/take 4/5
Percentage Split.
6 ptsPergunta 8
Qualitativo ordinal.
Qualitativo categórico.
Quantitativo discreto.
Quantitativo multivalorado.
Um atributo CONCEITO pode receber os valores: A, B, C, D e E, que representam o
conceito que um aluno obteve ao cursar uma disciplina.
Esse atributo é do tipo:
6 ptsPergunta 9
Agrupamento de dados por densidade.
Indução de regras.
Mistura de dados rotulados e não rotulados.
Receber feedback do ambiente.
É uma abordagem do aprendizado não supervisionado:
6 ptsPergunta 10
Grid-search é uma técnica de ajustamento de modelo baseado na utilização de uma cominação
sistemática de valores de hiperparâmetros.
A validação cruzada com 3 partes (3-fold) precisa de uma base de dados com muitos exemplos
para ser efetiva.
Um modelo é generalizável se sua performance na base de testes for superior à performance da
base de treinamento.
Sobre o processo de aprendizado supervisionado, é correto afirmar que:
26/10/2019 Teste: PROVA ONLINE 26/10/2019
https://pucminas.instructure.com/courses/2747/quizzes/32091/take 5/5
Nenhum dado novo para salvar. Última verificação às 14:20
Se a performance do modelo na base de treinamento for inferior à performance do modelo na
base de testes, então este modelo sofreu underfitting.
Enviar teste

PROVA ONLINE 25/04/2020
Entrega 25 abr em18:20 Pontos 60 Perguntas 10
Disponível 25 abr em 14:00 - 25 abr em 18:20 aproximadamente 4 horas
Limite de tempo 60 Minutos
Instruções
Este teste foi travado 25 abr em 18:20.
Histórico de tentativas
Tentativa Tempo Pontuação
MAIS
RECENTE
Tentativa 1
(https://pucminas.instructure.com/courses/1765/quizzes/46473/history?
39
minutos 54 de 60
Pontuação deste teste: 54 de 60
Enviado 25 abr em 15:01
Esta tentativa levou 39 minutos.
ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento
necessário nesta disciplina.
Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa,
será identificado como uma prova extra e resultará em pagamento de taxa extra.
INSTRUÇÕES DA AVALIAÇÃO ONLINE
A prova tem a duração de 60 minutos e se realizará das 14 às 18:20 horas, horário de
Brasília.
Ao clicar em PROVA ONLINE 25/04/2020, no menu “testes” você iniciará a prova. A partir daí
não será possível desistir de realizá-la.
A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos.
Ao final do teste não se esqueça de enviá-lo clicando no botão “ENVIAR TESTE”. Só utilize
esse botão quando tiver finalizado a avaliação.
Se necessário, durante a prova entre em contato pelo link “Atendimento”.
ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas, serão
automaticamente encerradas pelo sistema transcorridos os 60 minutos de duração, ou às
18:20 horas – horário em que se encerra a aplicação.
Boa Prova!
6 / 6 ptsPergunta 1
https://pucminas.instructure.com/courses/1765/quizzes/46473/history?version=1
Uma universidade induziu um modelo para classificar se um aluno está
propenso a cometer evasão. Após o treinamento, o modelo produziu a
seguinte matriz de confusão sobre os dados de validação.
EVADIU NÃO EVADIU
PREV. EVADIU 50 30
PREV. NÃO EVADIU 30 90
Sobre esse modelo, podemos afirmar que:

A acurária por classe do modelo é 70%.
A revocação ou recall é 75%.

Como a quantidade de falso negativos é a mesma que a quantidade de
falso positivos, então a acurácia por classe será a mesma que a
acurácia geral.
A precisão do modelo é 62,5%. Correto!Correto!Correto!Correto!
A precisão é calculada em função da quantidade de falsos
positivos: 50 / 80 = 62,5%.
0 / 6 ptsPergunta 2
Em aprendizado de máquina,
modelos computacionais são construídos a partir de exemplos. esposta corretaesposta corretaesposta corretaesposta correta
regras são construídas a partir do conhecimento de especialistas.

algoritmos são construídos a partir de métodos de resolução de
problema.
ocê respondeuocê respondeuocê respondeuocê respondeu
dados são descritos a partir de análises estatísticas.
A definição formal de aprendizado de máquina, conforme Tom
Mitchel, é que o aprendizado de máquina consiste de
algoritmos que aprendem com exemplos.
A presença do especialista não é necessária caso seja feito
aprendizado não supervisionado. Mesmo no aprendizado
supervisionado, fatos podem representar o conhecimento do
especialista.
Apesar da análise estatística ser componente básico da maioria
dos algoritmos de aprendizado de máquina, ela não é uma
condição obrigatória para a existência dos algoritmos de
aprendizado.
No aprendizado de máquina o foco não é na construção de
algoritmos, mas na indução de modelos, utilizando-se
algoritmos de aprendizado já existentes.
6 / 6 ptsPergunta 3
Robot traders são programas de computadores capazes de operar de
forma autônoma na bolsa de valores. Eles podem ser desenvolvidos
com regras fixas baseadas em indicadores de análise técnica ou
podem possuir um modelo que combine esses indicadores de forma a
maximizar o lucro do robô em um período determinado.
O problema de identificar os pesos dos indicadores que maximizam o
resultado do robô é um problema de:
Recomendação.
Regressão. Correto!Correto!Correto!Correto!
Classificação.
Regra de associação.
A tarefa de previsão de valores contínuos consiste em uma
tarefa de regressão.
6 / 6 ptsPergunta 4
Se você possui um problema em que o objetivo é minimizar o erro de
estimação de um valor contínuo baseado em um conjunto de atributos,
o algoritmo mais adequado para o problema é:

Naïve Bayes.
Regressão linear. Correto!Correto!Correto!Correto!
AGNES - Aglomerative Nesting.
K-means.
A estimação de um valor contínuo consistem em uma tarefa de
previsão, em que a regressão linear pode ser um candidato
possível. AGNES e K-means são algoritmos de agrupamento.
Nayve Bayes, em sua versão contínua, que utiliza funções de
distribuição de probabilidade, pode ser utilizado para regressão
(FRANK, TRIGG, HOLMES & WITTEN, 1999), mas ele não se
baseia na minimização do erro de estimação e sua performance
é ruim.
6 / 6 ptsPergunta 5
Para definir precisamente o problema a ser atacado e identificar
possibilidades de enriquecimento da base de conhecimento, podemos
utilizar como ferramenta:
Agregação de atributos.
Análise de fatos e julgamentos. Correto!Correto!Correto!Correto!
ETL – extract, transform, load.
Análise exploratória de dados.
Análise de fatos e julgamentos é uma técnica para definição do
problema de negócio a ser abordado, identificando uma
pergunta orientada a dados. As demais opções representam
diversas etapas do KDD e da ciência de dados.
6 / 6 ptsPergunta 6
Relacione os tipos de dados com os exemplos de atributos
correspondentes:
Dado quantitativo de
razão
pesoCorreto!Correto!Correto!Correto!
Dado quantitativo
intervalar
temperatura do arCorreto!Correto!Correto!Correto!
Dado qualitativo ordinal ordem de nascimentoCorreto!Correto!Correto!Correto!
Dado qualitativo nominal cor do olhoCorreto!Correto!Correto!Correto!
O peso é um dado numérico que possui um zero absoluto, e por
isso é considerado quantitativo de razão.
A ordem de nascimento, não é um dado quantitativo em si, uma
vez que ele não possui uma escala definida, mas expressa
ordem, o que o torna um dado ordinal.
A cor do olho não pode ser ordenada, e por isso é um dado
nominal.
Finalmente a temperatura é um dado contínuo que não possui
necessariamente um zero absoluto, uma vez que não foi
descrita a escala utilizada. Neste caso, ele ´te um atributo
intervalar.
6 / 6 ptsPergunta 7
Uma medida de interesse para regras de associação é
Revocação.
Lift. Correto!Correto!Correto!Correto!
Correto. Lift indica a força de uma regra sobre a coocorrência
aleatória de seus antecedentes e consequentes, e é utilizada
como uma medida de interesse para as regras de associação.
Valores superiores a 1 indicam que a regra aumenta a capacidade
de previsão sobre o caso aleatório.
Acurácia.
Completeza.
6 / 6 ptsPergunta 8
Malwares são uma grande ameaça à segurança de dados. Uma forma
de detectar esses softwares maliciosos consiste em utilizar códigos de
Malwares já descobertos na construção de um modelo capaz de
identificar novas versões desses trechos de software.
O tipo de aprendizado que deve ser utilizado neste caso é:
Aprendizado conexionista.
Aprendizado supervisionado. Correto!Correto!Correto!Correto!
Aprendizado por reforço.
Aprendizado não supervisionado.
A detecção de malwares é uma tarefa de classificação, onde
trechos de código são classificados entre código malicioso e
não malicioso, por isso é uma tarefa de aprendizado
supervisionado. O aprendizado conexionista é o baseado em
redes neurais. Apesar das redes MLP realizarem aprendizado
supervisionado, existem topologias de rede como o SOM (Self
Organizing Maps), por exemplo, que realizam aprendizado não
supervisionado.
6 / 6 ptsPergunta 9
Se você possui um problema com uma grande base de dados, em que
o importante é a acurácia de classificação em detrimento da
interpretabilidade do modelo, o algoritmo mais adequado para o
problema é:
Rede Neural. Correto!Correto!Correto!Correto!
Árvore de decisão.
Naïve Bayes.
A-priori.
A princípio a rede neural é o algoritmo mais adequado para se
obter uma alta acurácia, mas seu modelo não é interpretável. Amaior acurácia pode ser obtida aumentando-se o número de
neurônios na camada oculta ou até mesmo o número de
camadas ocultas. Entretanto, deve-se atentar para a
possibilidade de overfitting. É importante que se tenha a
quantidade de dados adequada para que o aprendizado possa
convergir sem a necessidade de muitas épocas.
O algoritmo de Naive Bayes por vezes se sai tão bem quanto
uma rede neural, ou pode obter até mesmo uma acurácia
superior à da rede neural, mas ele é muito sensível à
distribuição dos dados e pode sofrer com variáveis
condicionalmente dependentes.
6 / 6 ptsPergunta 10
Uma anomalia (ou outlier) no algoritmo DB-outlier pode ser entendida
como:

Um atributo cuja medição possui valores extremos fora da faixa padrão
de distribuição dos dados da base de conhecimento.

Um ponto de cuja vizinhança possui menos elementos que uma
porcentagem predeterminada da base de conhecimento.
Correto!Correto!Correto!Correto!

Um conjunto de atributos cujos valores estão definidos em ordens de
grandeza superiores à média da base de conhecimento.

Um ponto cujas características se distanciam um determinado número
de desvios padrões da média da base de conhecimento.
As anomalias não são atributos ou conjuntos de atributos, mas
são exemplos da base de dados. Esses exemplos são
representados como pontos no espaço de atributos, e uma
anomalia é definida no algoritmo DB-outlier em função da
densidade de sua vizinhança.
Pontuação do teste: 54 de 60
6 / 6 ptsPergunta 1
Um atributo CONCEITO pode receber os valores: A, B, C, D e E, que
representam o conceito que um aluno obteve ao cursar uma disciplina.
Esse atributo é do tipo:
Qualitativo categórico.
Quantitativo discreto.
Qualitativo ordinal. Correto!Correto!
Quantitativo multivalorado.
O conceito é um atributo polinominal, mas ele possui relação de
ordem entre seus valores, uma vez que o conceito A > B > C >
D > E, e por isso é considerado um dado ordinal.
6 / 6 ptsPergunta 2
Para se evitar o overfitting em um algoritmo de árvore de decisão,
podemos:
Aumentar o número mínimo de amostras por nó folha. Correto!Correto!
Usar uma abordagem gulosa para seleção do melhor atributo.

Permitir que atributos contínuos possam ser utilizados mais de uma
vez.

Alterar a medida de seleção de atributos do Ganho da Informação para
Taxa de Ganho.
Ao aumentar o número mínimo de elementos em cada nó folha,
será produzida uma ação de poda da árvore, caso um atributo
gere nós com poucos registros. A medida de seleção de
atributos pode alterar a estrutura da árvore, mas não se evita
overfitting. Toda árvore de decisão adota uma abordagem
gulosa para a escolha do melhor atributo. Para se produzir
classificadores mais fracos, poderia se utilizar uma abordagem
de amostragem de atributos, o que poderia produzir árvores
com menor overfitting. Atributos contínuos já são utilizados mais
de uma vez no algoritmo C4.5 ou J48. Entretanto, quando mais
subdivisões são feitas em um mesmo atributo, maior a chance
de overfitting.
6 / 6 ptsPergunta 3
Clustering, ou análise de agrupamentos, é uma forma de se:
Identificar a correlação entre diversos atributos.
Estimar o comportamento médio de uma população de dados.
Descrever a topologia da distribuição dos dados.
Identificar perfis de dados semelhantes. Correto!Correto!
Técnicas de agrupamento são baseadas em uma medida de
distância ou de similaridade, que fazem com que dados
semelhantes sejam agrupados em umesmo cluster, enquanto
dados distintos sejam alocados em clústeres diferentes.
6 / 6 ptsPergunta 4
Uma medida de interesse para regras de associação é
Completeza.
Acurácia.
Revocação.
Lift. Correto!Correto!
Correto. Lift indica a força de uma regra sobre a coocorrência
aleatória de seus antecedentes e consequentes, e é utilizada
como uma medida de interesse para as regras de associação.
Valores superiores a 1 indicam que a regra aumenta a capacidade
de previsão sobre o caso aleatório.
6 / 6 ptsPergunta 5
O objetivo das técnicas de boosting é:

Combinar diferentes algoritmos para tratar atributos com formatos
diferentes.
Combinar modelos mais fracos para obter alta acurácia. Correto!Correto!

Combinar modelos independentes entre si para representar as diversas
dimensões dos dados.

Métodos de combinação de modelos geralmente obtêm melhor
performance com classificadores fracos, porque eles combinam
diferentes pontos de vista de cada classificador individual.
Correto!Correto!

Para os algoritmos de boosting funcionarem as bases geradas devem
ser o mais similar possível.

Métodos de bossting aprendem um conjunto de classificadores usando
bases de dados que possuem subconjuntos dos atributos do dado
original.

Boosting é um método de combinação de modelo que usa amostragem
com reposição para induzir de forma independente diversos
classificadores.
0 / 6 ptsPergunta 7
É uma abordagem do aprendizado não supervisionado:
Mistura de dados rotulados e não rotulados.
Indução de regras. ocê respondeuocê respondeu
Receber feedback do ambiente.
Agrupamento de dados por densidade. esposta corretaesposta correta
Agrupamento é uma tarefa típica de aprendizado não
supervisionado. A indução de regras pode ser não
supervisionada, como no caso de regras de associação, ou
supervisionada, como no caso de árvore de decisão. A mistura
de dados não rotulados com dados rotulados é chamado de
aprendizado semi supervisionado. Receber feedback do
ambiente é uma tarefa típica de aprendizado por reforço.
6 / 6 ptsPergunta 8
Robot traders são programas de computadores capazes de operar de
forma autônoma na bolsa de valores. Eles podem ser desenvolvidos
com regras fixas baseadas em indicadores de análise técnica ou
podem possuir um modelo que combine esses indicadores de forma a
maximizar o lucro do robô em um período determinado. Eles podem
tomar decisões de compra, venda e manutensão de posição, ou
podem trabalhar na tentativa de estimar o preço ótimo para se operar.

Supondo que um Robo foi desenvolvido com o propósito de estimar o
valor futuro de uma moeda, a identificação dos pesos dos indicadores
que maximizam o resultado do robô é um problema de:
Classificação.
Regra de associação.
Recomendação.
Regressão. Correto!Correto!
A tarefa de previsão de valores contínuos consiste em uma
tarefa de regressão.
6 / 6 ptsPergunta 9
Se você possui um problema em que o objetivo é minimizar o erro de
estimação de um valor contínuo baseado em um conjunto de atributos,
o algoritmo mais adequado para o problema é:

Naïve Bayes.
Regressão linear. Correto!Correto!
AGNES - Aglomerative Nesting.
K-means.
A estimação de um valor contínuo consistem em uma tarefa de
previsão, em que a regressão linear pode ser um candidato
possível. AGNES e K-means são algoritmos de agrupamento.
Nayve Bayes, em sua versão contínua, que utiliza funções de
distribuição de probabilidade, pode ser utilizado para regressão
(FRANK, TRIGG, HOLMES & WITTEN, 1999), mas ele não se
baseia na minimização do erro de estimação e sua performance
é ruim.
6 / 6 ptsPergunta 10
Sobre medidas de distância, podemos afirmar que:

O Rank pode ser utilizado para permitir a utilização de distância
binárias em dados categóricos não ordinais.
Distância de Jaccard é utilizada para variáveis binárias simétricas.

Similaridade de cossenos é adequada para dados esparsos, com um
elevado número de dimensões.
Correto!Correto!

Distância euclidiana é adequada para dados com elevada dimensão
que não estejam normalizados.
A distância de Jaccard é utilizada para dados assimétricos. A
distância euclidianasofre muito com a maldição da
dimensionalidade e é sensível à normalização dos dados. O
rank só pode ser utilizado para dados polinominais ordinais.
Pontuação do teste: 54 de 60
27/05/2020 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 1/9
PROVA ONLINE
Entrega Sem prazo Pontos 60 Perguntas 10
Disponível depois 15 mai em 10:00 Limite de tempo 60 Minutos
Tentativas permitidas Sem limite
Instruções
Histórico de tentativas
Tentativa Tempo Pontuação
MAIS RECENTE Tentativa 1 22 minutos 60 de 60
Pontuação desta tentativa: 60 de 60
Enviado 27 mai em 19:27
Esta tentativa levou 22 minutos.
ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento
necessário nesta disciplina.
Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa,
será identificado como uma prova extra e resultará em pagamento de taxa extra.
INSTRUÇÕES DA AVALIAÇÃO ON-LINE
A prova tem a duração de 60 minutos.
Ao clicar em PROVA ON-LINE, no menu “Testes” você iniciará a prova. A partir daí não será
possível desistir de realizá-la.
A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos.
Ao final do teste não se esqueça de enviá-lo, clicando no botão “ENVIAR TESTE”. Só utilize
esse botão quando tiver finalizado a avaliação.
Se necessário, durante a prova, entre em contato pelo link “Atendimento”.
ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas serão
automaticamente encerradas pelo sistema transcorridos os 60 minutos de duração.
Boa Prova!
Fazer o teste novamente
6 / 6 ptsPergunta 1
https://pucminas.instructure.com/courses/1765/quizzes/60824/history?version=1
https://pucminas.instructure.com/courses/1765/quizzes/60824/take?user_id=66011
27/05/2020 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 2/9
Uma medida de interesse para regras de associação é
Completeza.
Lift. Correto!Correto!
Correto. Lift indica a força de uma regra sobre a coocorrência
aleatória de seus antecedentes e consequentes, e é utilizada
como uma medida de interesse para as regras de associação.
Valores superiores a 1 indicam que a regra aumenta a capacidade
de previsão sobre o caso aleatório.
Acurácia.
Revocação.
6 / 6 ptsPergunta 2
São formas de Avaliação da qualidade de modelos, EXCETO:
Precisão e Revocação.
Log-loss.
Índice de pureza. Correto!Correto!
Acurácia por classe.
Índice de pureza, ou Gini, é uma medida inicialmente criada
para os algoritmos CART de indução de árvore de decisão, e
não avalia a qualidade de um modelo.
6 / 6 ptsPergunta 3
27/05/2020 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 3/9
Relacione os tipos de dados com os exemplos de atributos
correspondentes:
Dado quantitativo de
razão

peso
Correto!Correto!
Dado quantitativo
intervalar

temperatura do ar
Correto!Correto!
Dado qualitativo ordinal
ordem de nascimento
Correto!Correto!
Dado qualitativo nominal
cor do olho
Correto!Correto!
O peso é um dado numérico que possui um zero absoluto, e por
isso é considerado quantitativo de razão.
A ordem de nascimento, não é um dado quantitativo em si, uma
vez que ele não possui uma escala definida, mas expressa
ordem, o que o torna um dado ordinal.
A cor do olho não pode ser ordenada, e por isso é um dado
nominal.
Finalmente a temperatura é um dado contínuo que não possui
necessariamente um zero absoluto, uma vez que não foi
descrita a escala utilizada. Neste caso, ele ´te um atributo
intervalar.
6 / 6 ptsPergunta 4
Uma agência de empregos deseja utilizar aprendizado de máquina
para prever a duração do tempo de desemprego de um desempregado
à procura de emprego, com o objetivo de atuar proativamente na
interrupção do padrão de desemprego.
O algoritmo que ele pode utilizar na resolução desse problema é:
27/05/2020 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 4/9
Regressão linear. Correto!Correto!
Regras de associação.
Árvores de decisão.
Random Forest.
A tarefa de previsão da "duração do tempo de desemprego de
um desempregado a procura de emprego" tem por objetivo
estimar o valor de um atributo alvo contínuo. Essa é uma tarefa
de aprendizado supervisionado que tem como um possível
algoritmo a regressão linear.
Todas as demais opções da pergunta ilustram algoritmos
baseados em regras, que não são adequados para valores
contínuos. As regras de associação não são nem mesmo um
algoritmo de aprendizado supervisionado.
6 / 6 ptsPergunta 5
O objetivo das técnicas de boosting é:

Combinar modelos independentes entre si para representar as diversas
dimensões dos dados.

Combinar diferentes algoritmos para tratar atributos com formatos
diferentes.
Combinar modelos mais fracos para obter alta acurácia. Correto!Correto!
27/05/2020 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 5/9

Construir modelos para diversas partições de dados para evitar o
overfitting.
O objetivo do boosting é o de aumentar a acurácia do modelo.
Ele precisa utilizar classificadores fracos para que os modelos
gerados sejam independentes entre si.
6 / 6 ptsPergunta 6
Se você possui um problema com uma grande base de dados, em que
o importante é a acurácia de classificação em detrimento da
interpretabilidade do modelo, o algoritmo mais adequado para o
problema é:
Naïve Bayes.
A-priori.
Árvore de decisão.
Rede Neural. Correto!Correto!
27/05/2020 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 6/9
A princípio a rede neural é o algoritmo mais adequado para se
obter uma alta acurácia, mas seu modelo não é interpretável. A
maior acurácia pode ser obtida aumentando-se o número de
neurônios na camada oculta ou até mesmo o número de
camadas ocultas. Entretanto, deve-se atentar para a
possibilidade de overfitting. É importante que se tenha a
quantidade de dados adequada para que o aprendizado possa
convergir sem a necessidade de muitas épocas.
O algoritmo de Naive Bayes por vezes se sai tão bem quanto
uma rede neural, ou pode obter até mesmo uma acurácia
superior à da rede neural, mas ele é muito sensível à
distribuição dos dados e pode sofrer com variáveis
condicionalmente dependentes.
6 / 6 ptsPergunta 7
Uma anomalia (ou outlier) no algoritmo DB-outlier pode ser entendida
como:

Um atributo cuja medição possui valores extremos fora da faixa padrão
de distribuição dos dados da base de conhecimento.

Um conjunto de atributos cujos valores estão definidos em ordens de
grandeza superiores à média da base de conhecimento.

Um ponto de cuja vizinhança possui menos elementos que uma
porcentagem predeterminada da base de conhecimento.
Correto!Correto!

Um ponto cujas características se distanciam um determinado número
de desvios padrões da média da base de conhecimento.
27/05/2020 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 7/9
As anomalias não são atributos ou conjuntos de atributos, mas
são exemplos da base de dados. Esses exemplos são
representados como pontos no espaço de atributos, e uma
anomalia é definida no algoritmo DB-outlier em função da
densidade de sua vizinhança.
6 / 6 ptsPergunta 8
Sobre medidas de distância, podemos afirmar que:

Distância euclidiana é adequada para dados com elevada dimensão
que não estejam normalizados.

O Rank pode ser utilizado para permitir a utilização de distância
binárias em dados categóricos não ordinais.

Similaridade de cossenos é adequada para dados esparsos, com um
elevado número de dimensões.
Correto!Correto!
Distância de Jaccard é utilizada para variáveis binárias simétricas.
A distância de Jaccard é utilizada para dados assimétricos. A
distância euclidiana sofre muito com a maldição da
dimensionalidade e é sensível à normalizaçãodos dados. O
rank só pode ser utilizado para dados polinominais ordinais.
6 / 6 ptsPergunta 9
27/05/2020 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 8/9
Sobre o processo de aprendizado supervisionado, é correto afirmar
que:

Um modelo é generalizável se sua performance na base de testes for
superior à performance da base de treinamento.

Grid-search é uma técnica de ajustamento de modelo baseado na
utilização de uma cominação sistemática de valores de
hiperparâmetros.
Correto!Correto!
A técnica de grid-search monta uma matriz que combina
diferentes valores de hiperparâmetros e busca a combinação que
produz o melhor desempenho.

Se a performance do modelo na base de treinamento for inferior à
performance do modelo na base de testes, então este modelo sofreu
underfitting.

A validação cruzada com 3 partes (3-fold) precisa de uma base de
dados com muitos exemplos para ser efetiva.
6 / 6 ptsPergunta 10
Clustering, ou análise de agrupamentos, é uma forma de se:
Descrever a topologia da distribuição dos dados.
Estimar o comportamento médio de uma população de dados.
Identificar a correlação entre diversos atributos.
Identificar perfis de dados semelhantes. Correto!Correto!
27/05/2020 PROVA ONLINE : 09. Machine Learning (2019)
https://pucminas.instructure.com/courses/1765/quizzes/60824 9/9
Técnicas de agrupamento são baseadas em uma medida de
distância ou de similaridade, que fazem com que dados
semelhantes sejam agrupados em umesmo cluster, enquanto
dados distintos sejam alocados em clústeres diferentes.
Pontuação do teste: 60 de 60
PROVA ONLINE
Due No due date Points 60 Questions 10
Available after 15 May at 10:00 Time limit 60 Minutes
Allowed attempts Unlimited
Instructions
Attempt history
Attempt Time Score
LATEST Attempt 1 19 minutes 54 out of 60
Score for this attempt: 54 out of 60
Submitted 2 Jul at 9:19
This attempt took 19 minutes.
ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento
necessário nesta disciplina.
Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa,
será identificado como uma prova extra e resultará em pagamento de taxa extra.
INSTRUÇÕES DA AVALIAÇÃO ON-LINE
A prova tem a duração de 60 minutos.
Ao clicar em PROVA ON-LINE, no menu “Testes” você iniciará a prova. A partir daí não será
possível desistir de realizá-la.
A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos.
Ao final do teste não se esqueça de enviá-lo, clicando no botão “ENVIAR TESTE”. Só utilize
esse botão quando tiver finalizado a avaliação.
Se necessário, durante a prova, entre em contato pelo link “Atendimento”.
ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas serão
automaticamente encerradas pelo sistema transcorridos os 60 minutos de duração.
Boa Prova!
Take the quiz again
0 / 6 ptsQuestion 1
https://pucminas.instructure.com/courses/1765/quizzes/60824/history?version=1
https://pucminas.instructure.com/courses/1765/quizzes/60824/take?user_id=47403
São formas de Avaliação da qualidade de modelos, EXCETO:
Índice de pureza. orrect answerorrect answer
Precisão e Revocação.
Log-loss. ou Answeredou Answered
Acurácia por classe.
Índice de pureza, ou Gini, é uma medida inicialmente criada
para os algoritmos CART de indução de árvore de decisão, e
não avalia a qualidade de um modelo.
6 / 6 ptsQuestion 2
Relacione os tipos de dados com os exemplos de atributos
correspondentes:
Dado quantitativo de
razão

peso
Correct!Correct!
Dado quantitativo
intervalar

temperatura do ar
Correct!Correct!
Dado qualitativo ordinal
ordem de nascimento
Correct!Correct!
Dado qualitativo nominal
cor do olho
Correct!Correct!
O peso é um dado numérico que possui um zero absoluto, e por
isso é considerado quantitativo de razão.
A ordem de nascimento, não é um dado quantitativo em si, uma
vez que ele não possui uma escala definida, mas expressa
ordem, o que o torna um dado ordinal.
A cor do olho não pode ser ordenada, e por isso é um dado
nominal.
Finalmente a temperatura é um dado contínuo que não possui
necessariamente um zero absoluto, uma vez que não foi
descrita a escala utilizada. Neste caso, ele ´te um atributo
intervalar.
6 / 6 ptsQuestion 3
Para definir precisamente o problema a ser atacado e identificar
possibilidades de enriquecimento da base de conhecimento, podemos
utilizar como ferramenta:
Agregação de atributos.
Análise exploratória de dados.
Análise de fatos e julgamentos. Correct!Correct!
ETL – extract, transform, load.
Análise de fatos e julgamentos é uma técnica para definição do
problema de negócio a ser abordado, identificando uma
pergunta orientada a dados. As demais opções representam
diversas etapas do KDD e da ciência de dados.
6 / 6 ptsQuestion 4
Uma anomalia (ou outlier) no algoritmo DB-outlier pode ser entendida
como:

Um atributo cuja medição possui valores extremos fora da faixa padrão
de distribuição dos dados da base de conhecimento.

Um conjunto de atributos cujos valores estão definidos em ordens de
grandeza superiores à média da base de conhecimento.

Um ponto cujas características se distanciam um determinado número
de desvios padrões da média da base de conhecimento.

Um ponto de cuja vizinhança possui menos elementos que uma
porcentagem predeterminada da base de conhecimento.
Correct!Correct!
As anomalias não são atributos ou conjuntos de atributos, mas
são exemplos da base de dados. Esses exemplos são
representados como pontos no espaço de atributos, e uma
anomalia é definida no algoritmo DB-outlier em função da
densidade de sua vizinhança.
6 / 6 ptsQuestion 5
Malwares são uma grande ameaça à segurança de dados. Uma forma
de detectar esses softwares maliciosos consiste em utilizar códigos de
Malwares já descobertos na construção de um modelo capaz de
identificar novas versões desses trechos de software.
O tipo de aprendizado que deve ser utilizado neste caso é:
Aprendizado não supervisionado.
Aprendizado supervisionado. Correct!Correct!
Aprendizado conexionista.
Aprendizado por reforço.
A detecção de malwares é uma tarefa de classificação, onde
trechos de código são classificados entre código malicioso e
não malicioso, por isso é uma tarefa de aprendizado
supervisionado. O aprendizado conexionista é o baseado em
redes neurais. Apesar das redes MLP realizarem aprendizado
supervisionado, existem topologias de rede como o SOM (Self
Organizing Maps), por exemplo, que realizam aprendizado não
supervisionado.
6 / 6 ptsQuestion 6
Para se evitar o overfitting em um algoritmo de árvore de decisão,
podemos:
Usar uma abordagem gulosa para seleção do melhor atributo.

Permitir que atributos contínuos possam ser utilizados mais de uma
vez.
Aumentar o número mínimo de amostras por nó folha. Correct!Correct!

Coletar dados, explorar dados, modelar dados, comunicar e visualizar
resultados.
Correct!Correct!

Amostrar dados, explorar dados, modificar dados, modelar dados e
avaliar o modelo.Identificar as necessidades, selecionar, limpar e enriquecer dados,
identificar padrões e descrever resultados.

Entender o negócio, preparar dados, modelar o problema, avaliar o
modelo e fazer a distribuição do modelo.
A ciência de dados em sua visão clássica tem como princípio
base a indução de modelos com a finalidade de comunicar e
visualizar os resultados, sem o objetivo específico de distribuir
os modelos para uso comercial. Por isso suas etapas são:
"Coletar dados, explorar dados, modelar dados, comunicar e
visualizar resultados".
As etapas do CRIP-DM, usado no processo de mineração de
dados são: "Entender o negócio, preparar dados, modelar o
problema, avaliar o modelo e fazer a distribuição do modelo."
Finalmente, o processo de KDD consiste em: "Identificar as
necessidades, selecionar, limpar e enriquecer dados, identificar
padrões e descrever resultados".
6 / 6 ptsQuestion 8
Uma medida de interesse para regras de associação é
Completeza.
Acurácia.
Lift. Correct!Correct!
Correto. Lift indica a força de uma regra sobre a coocorrência
aleatória de seus antecedentes e consequentes, e é utilizada
como uma medida de interesse para as regras de associação.
Valores superiores a 1 indicam que a regra aumenta a capacidade
de previsão sobre o caso aleatório.
Revocação.
6 / 6 ptsQuestion 9
Se você possui um problema com uma grande base de dados, em que
o importante é a acurácia de classificação em detrimento da
interpretabilidade do modelo, o algoritmo mais adequado para o
problema é:
Rede Neural. Correct!Correct!
A-priori.
Naïve Bayes.
Árvore de decisão.
A princípio a rede neural é o algoritmo mais adequado para se
obter uma alta acurácia, mas seu modelo não é interpretável. A
maior acurácia pode ser obtida aumentando-se o número de
neurônios na camada oculta ou até mesmo o número de
camadas ocultas. Entretanto, deve-se atentar para a
possibilidade de overfitting. É importante que se tenha a
quantidade de dados adequada para que o aprendizado possa
convergir sem a necessidade de muitas épocas.
O algoritmo de Naive Bayes por vezes se sai tão bem quanto
uma rede neural, ou pode obter até mesmo uma acurácia
superior à da rede neural, mas ele é muito sensível à
distribuição dos dados e pode sofrer com variáveis
condicionalmente dependentes.
6 / 6 ptsQuestion 10
Um atributo CONCEITO pode receber os valores: A, B, C, D e E, que
representam o conceito que um aluno obteve ao cursar uma disciplina.
Esse atributo é do tipo:
Quantitativo discreto.
Quantitativo multivalorado.
Qualitativo categórico.
Qualitativo ordinal. Correct!Correct!
O conceito é um atributo polinominal, mas ele possui relação de
ordem entre seus valores, uma vez que o conceito A > B > C >
D > E, e por isso é considerado um dado ordinal.
Quiz score: 54 out of 60