Logo Passei Direto
Buscar

PROVA ON-LINE_ 07 - Machine Learning (2022)

Ferramentas de estudo

Questões resolvidas

Considerando os algoritmos de combinação de modelos baseados em boosting, é correto afirmar que:
Métodos de bossting aprendem um conjunto de classificadores usando bases de dados que possuem subconjuntos dos atributos do dado original.
Métodos de combinação de modelos geralmente obtêm melhor performance com classificadores fracos, porque eles combinam diferentes pontos de vista de cada classificador individual.
Boosting é um método de combinação de modelo que usa amostragem com reposição para induzir de forma independente diversos classificadores.
Para os algoritmos de boosting funcionarem as bases geradas devem ser o mais similar possível.

São formas de separação entre base de treinamento e base de testes, EXCETO:
Amostragem estratificada.
Cross Validation.
Percentage Split.
Amostragem com reposição.

Para se evitar o overfitting em um algoritmo de árvore de decisão, podemos:
Alterar a medida de seleção de atributos do Ganho da Informação para Taxa de Ganho.
Permitir que atributos contínuos possam ser utilizados mais de uma vez.
Aumentar o número mínimo de amostras por nó folha.
Usar uma abordagem gulosa para seleção do melhor atributo.

O objetivo das técnicas de boosting é:
Combinar modelos mais fracos para obter alta acurácia.
Combinar diferentes algoritmos para tratar atributos com formatos diferentes.
Construir modelos para diversas partições de dados para evitar o overfitting.
Combinar modelos independentes entre si para representar as diversas dimensões dos dados.

Clustering, ou análise de agrupamentos, é uma forma de se:
Identificar a correlação entre diversos atributos.
Identificar perfis de dados semelhantes.
Descrever a topologia da distribuição dos dados.
Estimar o comportamento médio de uma população de dados.

Em aprendizado de máquina,
algoritmos são construídos a partir de métodos de resolução de problema.
modelos computacionais são construídos a partir de exemplos.
regras são construídas a partir do conhecimento de especialistas.
dados são descritos a partir de análises estatísticas.

Uma medida de interesse para regras de associação é
Lift.
Revocação.
Acurácia.
Completeza.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Considerando os algoritmos de combinação de modelos baseados em boosting, é correto afirmar que:
Métodos de bossting aprendem um conjunto de classificadores usando bases de dados que possuem subconjuntos dos atributos do dado original.
Métodos de combinação de modelos geralmente obtêm melhor performance com classificadores fracos, porque eles combinam diferentes pontos de vista de cada classificador individual.
Boosting é um método de combinação de modelo que usa amostragem com reposição para induzir de forma independente diversos classificadores.
Para os algoritmos de boosting funcionarem as bases geradas devem ser o mais similar possível.

São formas de separação entre base de treinamento e base de testes, EXCETO:
Amostragem estratificada.
Cross Validation.
Percentage Split.
Amostragem com reposição.

Para se evitar o overfitting em um algoritmo de árvore de decisão, podemos:
Alterar a medida de seleção de atributos do Ganho da Informação para Taxa de Ganho.
Permitir que atributos contínuos possam ser utilizados mais de uma vez.
Aumentar o número mínimo de amostras por nó folha.
Usar uma abordagem gulosa para seleção do melhor atributo.

O objetivo das técnicas de boosting é:
Combinar modelos mais fracos para obter alta acurácia.
Combinar diferentes algoritmos para tratar atributos com formatos diferentes.
Construir modelos para diversas partições de dados para evitar o overfitting.
Combinar modelos independentes entre si para representar as diversas dimensões dos dados.

Clustering, ou análise de agrupamentos, é uma forma de se:
Identificar a correlação entre diversos atributos.
Identificar perfis de dados semelhantes.
Descrever a topologia da distribuição dos dados.
Estimar o comportamento médio de uma população de dados.

Em aprendizado de máquina,
algoritmos são construídos a partir de métodos de resolução de problema.
modelos computacionais são construídos a partir de exemplos.
regras são construídas a partir do conhecimento de especialistas.
dados são descritos a partir de análises estatísticas.

Uma medida de interesse para regras de associação é
Lift.
Revocação.
Acurácia.
Completeza.

Prévia do material em texto

3/11/23, 3:03 PM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 1/10
PROVA ON-LINE
Entrega Sem prazo Pontos 60 Perguntas 10 Disponível depois 1 de ago de 2022 em 10:00
Limite de tempo 60 Minutos Tentativas permitidas Sem limite
Instruções
Histórico de tentativas
ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento necessário nesta disciplina.
Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa, será identificado como uma prova extra e resultará em
pagamento de taxa extra.
INSTRUÇÕES DA AVALIAÇÃO ON-LINE
A prova tem a duração de 60 minutos. 
Ao clicar em PROVA ON-LINE, no menu “Testes” você iniciará a prova. A partir daí não será possível desistir de realizá-la.
A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos.
Ao final do teste não se esqueça de enviá-lo, clicando no botão “ENVIAR TESTE”. Só utilize esse botão quando tiver finalizado a avaliação.
Se necessário, durante a prova, entre em contato pelo link “Atendimento”.
ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas serão automaticamente encerradas pelo sistema
transcorridos os 60 minutos de duração.
Boa Prova!
Fazer o teste novamente
https://pucminas.instructure.com/courses/90423/quizzes/322201/take?user_id=197796
3/11/23, 3:03 PM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 2/10
Tentativa Tempo Pontuação
MAIS RECENTE Tentativa 1 15 minutos 60 de 60
Pontuação desta tentativa: 60 de 60
Enviado 11 mar em 15:03
Esta tentativa levou 15 minutos.
6 / 6 ptsPergunta 1
Considerando os algoritmos de combinação de modelos baseados em boosting, é correto afirmar que:
 
Métodos de bossting aprendem um conjunto de classificadores usando bases de dados que possuem
subconjuntos dos atributos do dado original.
 
Métodos de combinação de modelos geralmente obtêm melhor performance com classificadores fracos, porque
eles combinam diferentes pontos de vista de cada classificador individual.
Correto!Correto!
 
Boosting é um método de combinação de modelo que usa amostragem com reposição para induzir de forma
independente diversos classificadores.
 Para os algoritmos de boosting funcionarem as bases geradas devem ser o mais similar possível. 
https://pucminas.instructure.com/courses/90423/quizzes/322201/history?version=1
3/11/23, 3:03 PM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 3/10
6 / 6 ptsPergunta 2
São formas de separação entre base de treinamento e base de testes, exceto:
 Cross Validation. 
 Amostragem estratificada. 
 Percentage Split. 
 Amostragem com reposição. Correto!Correto!
Na amostragem com reposição, um elemento pode ser sorteado mais de uma vez. Isso permitiria
que um mesmo elemento fosse selecionado para a base de treinamento e de teste simultaneamente,
violando o princípio básico da avaliação de modelos de aprendizado supervisionado.
6 / 6 ptsPergunta 3
Para se evitar o overfitting em um algoritmo de árvore de decisão, podemos:
3/11/23, 3:03 PM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 4/10
 Usar uma abordagem gulosa para seleção do melhor atributo. 
 Permitir que atributos contínuos possam ser utilizados mais de uma vez. 
 Aumentar o número mínimo de amostras por nó folha. Correto!Correto!
 Alterar a medida de seleção de atributos do Ganho da Informação para Taxa de Ganho. 
Ao aumentar o número mínimo de elementos em cada nó folha, será produzida uma ação de poda
da árvore, caso um atributo gere nós com poucos registros. A medida de seleção de atributos pode
alterar a estrutura da árvore, mas não se evita overfitting. Toda árvore de decisão adota uma
abordagem gulosa para a escolha do melhor atributo. Para se produzir classificadores mais fracos,
poderia se utilizar uma abordagem de amostragem de atributos, o que poderia produzir árvores com
menor overfitting. Atributos contínuos já são utilizados mais de uma vez no algoritmo C4.5 ou J48.
Entretanto, quando mais subdivisões são feitas em um mesmo atributo, maior a chance de
overfitting.
6 / 6 ptsPergunta 4
Se você possui um problema com uma grande base de dados, em que o importante é a acurácia de
classificação em detrimento da interpretabilidade do modelo, o algoritmo mais adequado para o problema é:
 Naïve Bayes. 
3/11/23, 3:03 PM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 5/10
 A priori. 
 Rede Neural. Correto!Correto!
 Árvore de decisão. 
A princípio a rede neural é o algoritmo mais adequado para se obter uma alta acurácia, mas seu
modelo não é interpretável. A maior acurácia pode ser obtida aumentando-se o número de neurônios
na camada oculta ou até mesmo o número de camadas ocultas. Entretanto, deve-se atentar para a
possibilidade de overfitting. É importante que se tenha a quantidade de dados adequada para que o
aprendizado possa convergir sem a necessidade de muitas épocas.
O algoritmo de Naive Bayes por vezes se sai tão bem quanto uma rede neural, ou pode obter até
mesmo uma acurácia superior à da rede neural, mas ele é muito sensível à distribuição dos dados e
pode sofrer com variáveis condicionalmente dependentes.
6 / 6 ptsPergunta 5
Malwares são uma grande ameaça à segurança de dados. Uma forma de detectar esses softwares
maliciosos consiste em utilizar códigos de Malwares já descobertos na construção de um modelo capaz de
identificar novas versões desses trechos de software.
O tipo de aprendizado que deve ser utilizado neste caso é o Aprendizado
3/11/23, 3:03 PM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 6/10
 não supervisionado. 
 por reforço. 
 supervisionado. Correto!Correto!
 conexionista. 
A detecção de malwares é uma tarefa de classificação, onde trechos de código são classificados
entre código malicioso e não malicioso, por isso é uma tarefa de aprendizado supervisionado. O
aprendizado conexionista é o baseado em redes neurais. Apesar das redes MLP realizarem
aprendizado supervisionado, existem topologias de rede como o SOM (Self Organizing Maps), por
exemplo, que realizam aprendizado não supervisionado.
6 / 6 ptsPergunta 6
O objetivo das técnicas de boosting é:
 Combinar modelos independentes entre si para representar as diversas dimensões dos dados. 
 Combinar modelos mais fracos para obter alta acurácia. Correto!Correto!
 Combinar diferentes algoritmos para tratar atributos com formatos diferentes. 
3/11/23, 3:03 PM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 7/10
 Construir modelos para diversas partições de dados para evitar o overfitting. 
O objetivo do boosting é o de aumentar a acurácia do modelo. Ele precisa utilizar classificadores
fracos para que os modelos gerados sejam independentes entre si.
6 / 6 ptsPergunta 7
Clustering, ou análise de agrupamentos, é uma forma de se:
 Descrever a topologia da distribuição dos dados. 
 Identificar a correlação entre diversos atributos. 
 Identificar perfis de dados semelhantes. Correto!Correto!
 Estimar o comportamento médio de uma população de dados. 
Técnicas de agrupamento são baseadas em uma medida de distância ou de similaridade, que fazem
com que dados semelhantes sejam agrupados em um mesmo cluster, enquanto dados distintos
sejam alocados em clústeres diferentes.
3/11/23, 3:03 PM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 8/10
6 / 6 ptsPergunta 8
Em aprendizado de máquina,
 modelos computacionais são construídos a partir de exemplos. Correto!Correto!
 algoritmos são construídos a partir de métodos de resolução de problema. 
 dados são descritos a partir de análises estatísticas. 
 regras são construídas a partirdo conhecimento de especialistas. 
A definição formal de aprendizado de máquina, conforme Tom Mitchel, é que o aprendizado de
máquina consiste de algoritmos que aprendem com exemplos.
A presença do especialista não é necessária caso seja feito aprendizado não supervisionado.
Mesmo no aprendizado supervisionado, fatos podem representar o conhecimento do especialista.
Apesar da análise estatística ser componente básico da maioria dos algoritmos de aprendizado de
máquina, ela não é uma condição obrigatória para a existência dos algoritmos de aprendizado.
No aprendizado de máquina o foco não é na construção de algoritmos, mas na indução de modelos,
utilizando-se algoritmos de aprendizado já existentes.
3/11/23, 3:03 PM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 9/10
6 / 6 ptsPergunta 9
Uma medida de interesse para regras de associação é
 Revocação. 
 Lift. Correto!Correto!
Correto. Lift indica a força de uma regra sobre a coocorrência aleatória de seus antecedentes e 
consequentes, e é utilizada como uma medida de interesse para as regras de associação. Valores 
superiores a 1 indicam que a regra aumenta a capacidade de previsão sobre o caso aleatório.
 Acurácia. 
 Completeza. 
6 / 6 ptsPergunta 10
Uma anomalia (ou outlier) no algoritmo DB-outlier pode ser entendida como:
 
Um ponto de cuja vizinhança possui menos elementos que uma porcentagem predeterminada da base de
conhecimento.
Correto!Correto!
3/11/23, 3:03 PM PROVA ON-LINE: 07 - Machine Learning (2022)
https://pucminas.instructure.com/courses/90423/quizzes/322201 10/10
 
Um ponto cujas características se distanciam um determinado número de desvios-padrões da média da base de
conhecimento.
 
Um atributo cuja medição possui valores extremos fora da faixa padrão de distribuição dos dados da base de
conhecimento.
 
Um conjunto de atributos cujos valores estão definidos em ordens de grandeza superiores à média da base de
conhecimento.
As anomalias não são atributos ou conjuntos de atributos, mas são exemplos da base de dados.
Esses exemplos são representados como pontos no espaço de atributos, e uma anomalia é definida
no algoritmo DB-outlier em função da densidade de sua vizinhança.
Pontuação do teste: 60 de 60

Mais conteúdos dessa disciplina