Baixe o app para aproveitar ainda mais
Prévia do material em texto
Questão 1/10 - Machine Learning Os modelos de regressão linear apresentam uma característica de não permitir calcular o número de erro de acertos, pois os valores obtidos no processo de predição diferem de forma diferente dos valores reais. Assim, utilizar métodos como matriz de confusão, não é possível. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, uma medida que pode ser utilizada para avaliar a qualidade do modelo de regressão linear é o : Nota: 10.0 A coeficiente de erros B coeficiente de inércia C taxa de acertos D taxa de erros E coeficiente de determinação Você assinalou essa alternativa (E) Você acertou! Justificativa: Os modelos de regressão linear treinados, não devolvem um valor discreto, assim não é possível comparar o resultado da predição de forma direta com os dados anotados, mas sim a diferença do valor obtido para o valor real. Dessa maneira, a qualidade do modelo deve ser medida por uma outra técnica que considere o quão próximo das predições estão dos valores reais. Para isso, deve-se utilizar o coeficiente de determinação do modelo. Questão 2/10 – Machine Learning Você recebeu um grande conjunto de dados para realizar o treinamento de um modelo de aprendizagem, porém durante o processo de exploração dos dados, você percebeu que havia uma enorme discrepância entre os valores absolutos de alguns atributos. Valendo-se dos seus conhecimento de aprendizagem de máquina, para evitar que essas discrepâncias prejudiquem o desempenho do seu modelo, você deverá executar nos dados um processo de : Nota: 10.0 A separação B identificação C normalização Você assinalou essa alternativa © Você acertou! Justificativa: Quando os valores absolutos os atributos apresentam grandes discrepâncias é necessário fazer um processo de normalização, para assim evitar que essas diferenças de magnitude prejudiquem o processo de aprendizagem. D limpeza E redução · Questão 3/10 – Machine Learning Os modelos de regressão logística e regressão linear, apresentam semelhanças, além do nome. No entanto, utilizam funções diferentes para obtenção dos valores, apresentando outras diferenças entre si que determinam os diferentes uso para os quais os modelos podem ser aplicados. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, de maneria simplificada podemos dizer que a principal diferença entre os modelos é: Nota: 10.0 A o tipo treinamento B a predição de valores contínuos e discretos Você assinalou essa alternativa (B) Você acertou! Justificativa: A regressão logística realiza a predição de valores discretos, em intervalos determinados. Enquanto a regressão linear realiza a predição de valores contínuos. C vetores de atributos com tamanhos distintos D as categorias utilizadas E o número de categorias · Questão 4/10 – Machine Learning Durante o processo de treinamento supervisionado de uma rede neural para reconhecimento de imagens, os dados são preparados colocando uma indicação da categoria, a qual cada imagem pertence. Durante o processo de treinamento, milhares de imagens, contendo indicações erradas como a mostrada na imagem acima, foram fornecidas para uma rede neural, fazendo com que os resultados do modelo fossem muito ruins. De acordo com os seus conhecimentos sobre treinamento de redes neurais para reconhecimento de imagens, há muitas possibilidades, mas NÂO será de grande utilidade: Nota: 10.0 A correção das etiquetas incorretas e um novo treinamento B corrigir as etiquetas e testar novos hiperparâmetros C testar novos hiperparâmetros D um treinamento somente com as etiquetas incorretas Você assinalou essa alternativa (D) Você acertou! Justificativa: Em situações como a descrita, corrigir as etiquetas e treinar um novo modelo é uma boa estratégia, assim como realizar um treinamento apenas com etiquetas corretas. Mudar a taxa de aprendizagem e testar com novos hiperparâmetros pode ajudar a corrigir algumas distorções do modelo. Já treinar somente com instância com etiquetas incorretas, não ajudaria na melhora do modelo. E mudar a taxa de aprendizagem · Questão 5/10 - –achine Learning · Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a tradução de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos trechos que a equipe gostaria de compreender se refere ao seguinte código: from sklearn.neural_network import MLPClassifier X_treino_std, y_treino = carrega_dados_treino() mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hiiddenayer_sizes=(100,)) mlp_clf.fit(X_treino_std, y_treino) De acordo com os seus conhecimentos de aprendizagem de máquina, o código acima executa: Nota: 10.0 A um processo de treinamento dos dados Você assinalou essa alternativa (A) Você acertou! Justificativa: O código apresentado cria um modelo do tipo Multilayer Perceptron e execute o processo de treinamento do modelo por meio da chamada do método fit. B um processo de predição C um processo de normalização dos dados D um processo de expansão dos dados E não faz nada e pode ser comentado Questão 6/10 – Machine Learning Você necessita desenvolver um classificador bayesiano para detecção de spam baseado nas palavras contidas nos e-mails recebidos. Para isso o classificador deverá utilizar o teorema de Bayes, considerando as classes como spam e não-spam e o vetor de características como a presença ou ausência de uma palavra, de acordo com a imagem acima. Considerando do texto acima e valendo-se do seu conhecimento sobre classificação bayesiana, o elemento P(?) será corretamente substituído por : Nota: 10.0 A P(não-spam | spam) B P(spam) C P(palavra) D P(spam | não-spam) E P(palavra | spam) Você assinalou essa alternativa (E) Você acertou! Justificativa: Como o classificador bayesiano utiliza conhecimento prévio para fazer a predição, nesse caso ele utilizará a informação da probabilidade de um documento conter uma palavra, dado que ele é um spam, ou seja P(palavra | spam). · Questão 7/10 - Machine Learning Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a explanação de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos trechos que a equipe gostaria de compreender se refere a uma troca de códigos, onde o código: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden_layer_sizes=(100,)) Foi substituído por: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden_layer_sizes=(50,50)) De acordo com os seus conhecimentos de aprendizagem de máquina, a substituição de código foi feita para: Nota: 0.0Você não pontuou essa questão A alterar o tipo do classificador B aumentar a quantidade de camadas da rede Justificativa: O parâmetro hidden_layer_sizes é uma tupla na qual cada elemento indica a quantidade de neurônios em cada camada. Como o código apresentado o número de elementos aumenta, a quantidade de camadas da rede também. C diminuir a quantidade de camadas da rede D estabilizar as camadas da rede E aumentar o número de nós da rede Você assinalou essa alternativa (E) Questão 8/10 – Machine Learning Você necessita executar o treinamento de um modelo de aprendizagem. Sabendo que é precisodividir os dados em treinamento e em testes, você resolve utilizar uma proporção que é bastante utilizada e recomendada, na qual se fornece mais dados para treino que para testes. Valendo-se dos seus conhecimento de aprendizagem de máquina, para conseguir executar o treinamento do modelo você deverá: Nota: 10.0 A utilizar uma estratégia de validação cruzada B utilizar os dados na proporção 80-20 Você assinalou essa alternativa (B) Você acertou! Justificativa: A proporção 80% para treino e 20% para testes é comumente utilizada no processo de separação dos dados. Sendo inclusive recomendada, ainda que não seja a única forma de particionar os dados. C utilizar os dados na proporção 50-50 D treinar e testar com os mesmos dados E utilizar todos os dados para treino e não testar · Questão 9/10 – Machine Learning Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a explanação de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos trechos que a equipe gostaria de compreender se refere a uma troca de códigos, onde o código: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, idden_layer_sizes=(100,50,50)) Foi substituído por: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, idden_layer_sizes=(50,50)) De acordo com os seus conhecimentos de aprendizagem de máquina, a substituição de código foi feita para: Nota: 10.0 A alterar o tipo do classificador B aumentar a quantidade de camadas da rede C diminuir a quantidade de camadas da rede Você assinalou essa alternativa © Você acertou! Justificativa: O parâmetro idden_layer_sizes é uma tupla na qual cada elemento indica a quantidade de neurônios em cada camada. Como o código apresentado o número de elementos diminui, a quantidade de camadas da rede também. D estabilizar as camadas da rede E aumentar o número de nós da rede · Questão 10/10 - Machine Learning O termo one-hot descreve um grupo de bits onde apenas um dos bits é 1 (um) e todos os demais 0 (zero). Em aprendizagem de máquina, existe um método chamado one-hot enconding que é utilizada para lidar com dados categóricos.” Considere que você possui um conjunto de dados onde já um campo Idiomas que podem assumir 3 valores: português, espanhol e inglês. Valendo dos seus conhecimentos sobre dados categóricos, uma possível codificação one-hot para este campo seria: Nota: 10.0 A português (1), espanhol (2), francês (3) B português (00), espanhol (10), francês (11) C português (000), espanhol (001), francês (010) D português (001), espanhol (002), francês (003) E português (001), espanhol (010), francês (100) Você assinalou essa alternativa (E) Você acertou! Justificativa: Como se trata de 3 valores possíveis e a codificação one-hot exige que somente uma posição do valor seja igual a 1, logo a opção 001,010,100 seria a escolha correta.
Compartilhar