Baixe o app para aproveitar ainda mais
Prévia do material em texto
30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018) https://pucminas.instructure.com/courses/149/quizzes/22880 1/8 PROVA ONLINE 29/06/2019 Vencimento 29 jun em 18:20 Pontos 60 perguntas 10 Disponível 29 jun em 14:00 - 29 jun em 18:20 cerca de 4 horas Limite de tempo 60 minutos Instruções Este teste foi travado 29 jun em 18:20. Histórico de tentativas Tentativa Hora Pontuação MAIS RECENTE Tentativa 1 14 minutos 60 de 60 Pontuação deste teste: 60 de 60 Enviado 29 jun em 15:48 Esta tentativa levou 14 minutos. ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento necessário nesta disciplina. Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa, será identificado como uma prova extra e resultará em pagamento de taxa extra. INSTRUÇÕES DA AVALIAÇÃO ONLINE A prova tem a duração de 60 minutos e se realizará das 14 às 18:20 horas, horário de Brasília. Ao clicar em PROVA ONLINE 29/06/2019, no menu “testes” você iniciará a prova. A partir daí não será possível desistir de realizá-la. A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos. Ao final do teste não se esqueça de enviá-lo clicando no botão “ENVIAR TESTE”. Só utilize esse botão quando tiver finalizado a avaliação. Se necessário, durante a prova entre em contato pelo link “Atendimento”. ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas, serão automaticamente encerradas pelo sistema transcorridos os 60 minutos de duração, ou às 18:20 horas - horário em que se encerra a aplicação. Boa Prova! 6 / 6 ptsPergunta 1 Uma anomalia (ou outlier), no algoritmo DB-outlier, pode ser entendida como: https://pucminas.instructure.com/courses/149/quizzes/22880/history?version=1 30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018) https://pucminas.instructure.com/courses/149/quizzes/22880 2/8 Um conjunto de atributos cujos valores estão definidos em ordens de grandeza superiores à média da base de conhecimento. Um atributo cuja medição possui valores extremos fora da faixa padrão de distribuição dos dados da base de conhecimento. Um ponto cujas características se distanciam um determinado número de desvios padrões da média da base de conhecimento. Um ponto de cuja vizinhança possui menos elementos que uma porcentagem predeterminada da base de conhecimento. Correto!Correto! As anomalias não são atributos ou conjuntos de atributos, mas são exemplos da base de dados. Esses exemplos são representados como pontos no espaço de atributos, e uma anomalia é definida no algoritmo DB-outlier em função da densidade de sua vizinhança. 6 / 6 ptsPergunta 2 Relacione os tipos de dados com os exemplos de atributos correspondentes: Dado quantitativo de razão peso Correto!Correto! Dado quantitativo intervalar temperatura do ar Correto!Correto! Dado qualitativo ordinal ordem de nascimento Correto!Correto! Dado qualitativo nominal cor do olho Correto!Correto! 30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018) https://pucminas.instructure.com/courses/149/quizzes/22880 3/8 O peso é um dado numérico que possui um zero absoluto, e por isso é considerado quantitativo de razão. A ordem de nascimento, não é um dado quantitativo em si, uma vez que ele não possui uma escala definida, mas expressa ordem, o que o torna um dado ordinal. A cor do olho não pode ser ordenada, e por isso é um dado nominal. Finalmente a temperatura é um dado contínuo que não possui necessariamente um zero absoluto, uma vez que não foi descrita a escala utilizada. Neste caso, ele ´te um atributo intervalar. 6 / 6 ptsPergunta 3 Para se evitar o overfitting em um algoritmo de árvore de decisão, podemos: Aumentar o número mínimo de amostras por nó folha. Correto!Correto! Alterar a medida de seleção de atributos do Ganho da Informação para Taxa de Ganho. Permitir que atributos contínuos possam ser utilizados mais de uma vez. Usar uma abordagem gulosa para seleção do melhor atributo. 30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018) https://pucminas.instructure.com/courses/149/quizzes/22880 4/8 Ao aumentar o número mínimo de elementos em cada nó folha, será produzida uma ação de poda da árvore, caso um atributo gere nós com poucos registros. A medida de seleção de atributos pode alterar a estrutura da árvore, mas não se evita overfitting. Toda árvore de decisão adota uma abordagem gulosa para a escolha do melhor atributo. Para se produzir classificadores mais fracos, poderia se utilizar uma abordagem de amostragem de atributos, o que poderia produzir árvores com menor overfitting. Atributos contínuos já são utilizados mais de uma vez no algoritmo C4.5 ou J48. Entretanto, quando mais subdivisões são feitas em um mesmo atributo, maior a chance de overfitting. 6 / 6 ptsPergunta 4 Segundo Joe Blitzstein e Hanspeler Plister, “Introduction to Data Science”, Harvard Data Science Course, as etapas do processo de ciência de dados são: b) Entender o negócio, preparar dados, modelar o problema, avaliar o modelo e fazer a distribuição do modelo. a) Coletar dados, explorar dados, modelar dados, comunicar e visualizar resultados. Correto!Correto! c) Identificar as necessidades, selecionar, limpar e enriquecer dados, identificar padrões e descrever resultados. d) Amostrar dados, explorar dados, modificar dados, modelar dados, avaliar o modelo. 30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018) https://pucminas.instructure.com/courses/149/quizzes/22880 5/8 A ciência de dados em sua visão clássica tem como princípio base a indução de modelos com a finalidade de comunicar e visualizar os resultados, sem o objetivo específico de distribuir os modelos para uso comercial. Por isso suas etapas são: "Coletar dados, explorar dados, modelar dados, comunicar e visualizar resultados". As etapas do CRIP-DM, usado no processo de mineração de dados são: "Entender o negócio, preparar dados, modelar o problema, avaliar o modelo e fazer a distribuição do modelo." Finalmente, o processo de KDD consiste em: "Identificar as necessidades, selecionar, limpar e enriquecer dados, identificar padrões e descrever resultados". 6 / 6 ptsPergunta 5 Clustering, ou análise de agrupamentos é uma forma de se: Identificar perfis de dados semelhantes. Correto!Correto! Estimar o comportamento médio de uma população de dados. Descrever a topologia da distribuição dos dados. Identificar a correlação entre diversos atributos. Técnicas de agrupamento são baseadas em uma medida de distância ou de similaridade, que fazem com que dados semelhantes sejam agrupados em umesmo cluster, enquanto dados distintos sejam alocados em clústeres diferentes. 6 / 6 ptsPergunta 6 Em aprendizado de máquina, 30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018) https://pucminas.instructure.com/courses/149/quizzes/22880 6/8 b) modelos computacionais são construídos a partir de exemplos. Correto!Correto! d) algoritmos são construídos a partir de métodos de resolução de problema. a) regras são construídas a partir do conhecimento de especialistas. c) dados são descritos a partir de análises estatísticas. A definição formal de aprendizado de máquina, conforme Tom Mitchel, é que o aprendizado de máquina consiste de algoritmos que aprendem com exemplos. A presença do especialista não é necessária caso seja feito aprendizado não supervisionado. Mesmo no aprendizado supervisionado, fatos podem representar o conhecimento do especialista. Apesar da análise estatística ser componente básico da maioria dos algoritmos de aprendizado de máquina, ela não é uma condição obrigatória para a existência dos algoritmos de aprendizado. No aprendizado de máquina o foco não é na construção de algoritmos, mas na indução de modelos, utilizando-se algoritmos de aprendizado já existentes. 6 / 6 ptsPergunta 7 Um atributo CONCEITO pode receber os valores: A, B, C, D e E; que representam o conceito que um aluno obteve ao cursaruma disciplina. Esse atributo é do tipo: Quantitativo multivalorado. Qualitativo categórico. Quantitativo discreto. Qualitativo ordinal. Correto!Correto! 30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018) https://pucminas.instructure.com/courses/149/quizzes/22880 7/8 O conceito é um atributo polinominal, mas ele possui relação de ordem entre seus valores, uma vez que o conceito A > B > C > D > E, e por isso é considerado um dado ordinal. 6 / 6 ptsPergunta 8 Robot traders são programas de computadores capazes de operar de forma autônoma na bolsa de valores. Eles podem ser desenvolvidos com regras fixas baseadas em indicadores de análise técnica ou podem possuir um modelo que combine esses indicadores de forma a maximizar o lucro do robô em um período determinado. O problema de identificar os pesos dos indicadores que maximizam o resultado do robô é um problema de: Recomendação. Regra de associação. Regressão. Correto!Correto! Classificação. A tarefa de previsão de valores contínuos consiste em uma tarefa de regressão. 6 / 6 ptsPergunta 9 São formas de Avaliação da qualidade de modelos, EXCETO: Acurácia por classe. Precisão e Revocação. Índice de pureza. Correto!Correto! 30/08/2019 PROVA ONLINE 29/06/2019: 10. Machine Learning (2018) https://pucminas.instructure.com/courses/149/quizzes/22880 8/8 Log-loss. Índice de pureza, ou Gini, é uma medida inicialmente criada para os algoritmos CART de indução de árvore de decisão, e não avalia a qualidade de um modelo. 6 / 6 ptsPergunta 10 São hiperparâmetros para a configuração de uma rede neural, EXCETO: Número de neurônios na camada oculta. Taxa de ajuste do erro. Correto!Correto! Taxa de aprendizado. Número de camadas ocultas da rede. Os erros não são ajustados. O que são ajustados são os pesos da rede. E estes pesos são ajustados em função do erro e da taxa de aprendizado. O erro é dado pela saída da rede e pela saída real, e não é um hiperparâmetro. Pontuação do teste: 60 de 60
Compartilhar