Baixe o app para aproveitar ainda mais
Prévia do material em texto
Questão 1/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi planejar um modelo de aprendizagem de máquina que consiga agrupar os clientes de um site de venda online eu grupos de interesse. As informações de navegação dos clientes no site foram coletadas e partir dessas informações devem ser criados os agrupamentos de clientes. Utilizando os seus conhecimentos de aprendizagem de máquina e sabendo que a sua equipe dispõe de capacidade de processamento e dados em abundância, você recomendaria a utilização de: Nota: 10.0 A um classificador bayesiano B um modelo do tipo k-Means Você assinalou essa alternativa (B) Você acertou! Justificativa: O agrupamento de dados exige o uso de um método de aprendizagem não-supervisionado como o k-Means. As demais opções apresentadas, ou são métodos de aprendizagem supervisionada. C uma classificador do tipo k-NN D uma rede neural do tipo LSTM E uma rede neura do tipo CNN Questão 2/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a tradução de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos trechos que a equipe gostaria de compreender se refere ao seguinte código: from sklearn.neural_network import MLPClassifier X_treino_std, y_treino = carrega_dados_treino() mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden_layer_sizes=(100,)) mlp_clf.fit(X_treino_std, y_treino) De acordo com os seus conhecimentos de aprendizagem de máquina, o código acima executa: Nota: 10.0 A um processo de treinamento dos dados Você assinalou essa alternativa (A) Você acertou! Justificativa: O código apresentado cria um modelo do tipo Multilayer Perceptron e execute o processo de treinamento do modelo por meio da chamada do método fit. B um processo de predição C um processo de normalização dos dados D um processo de expansão dos dados E não faz nada e pode ser comentado Questão 3/10 - Inteligência Artificial Aplicada Como um iniciante na área de ciência de dados, você recebeu uma tarefa de agrupar um conjunto de dados de pessoas, utilizando um algoritmo de agrupamento. Você executou a separação utilizando um tutorial de internet, mas os resultados não foram satisfatórios. Buscando melhorar os resultados você pediu ajuda a um expert que lhe disse apenas o seguinte: “Altere o seu k-means para usar Manhattan ou Mahalanobis”. De acordo com o seu conhecimento do algoritmo k-means, o expert estava sugerindo que você: Nota: 10.0 A utilizasse outro algoritmo B utilizasse métricas de distância diferentes Você assinalou essa alternativa (B) Você acertou! Justificativa: Manhattan e Mahalanobis se referem a dois tipos distintos de métricas de distância. C utilizasse uma outra linguagem de programação D utilizasse um método supervisionado E utilizasse um framework Questão 4/10 - Inteligência Artificial Aplicada Você necessita executar o treinamento de um modelo de aprendizagem. Sabendo que é preciso dividir os dados em treinamento e em testes, você resolve utilizar uma proporção que é bastante utilizada e recomendada, na qual se fornece mais dados para treino que para testes. Valendo-se dos seus conhecimento de aprendizagem de máquina, para conseguir executar o treinamento do modelo você deverá: Nota: 10.0 A utilizar uma estratégia de validação cruzada B utilizar os dados na proporção 80-20 Você assinalou essa alternativa (B) Você acertou! Justificativa: A proporção 80% para treino e 20% para testes é comumente utilizada no processo de separação dos dados. Sendo inclusive recomendada, ainda que não seja a única forma de particionar os dados. C utilizar os dados na proporção 50-50 D treinar e testar com os mesmos dados E utilizar todos os dados para treino e não testar Questão 5/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a explanação de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos trechos que a equipe gostaria de compreender se refere a uma troca de códigos, onde o código: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden_layer_sizes=(100,)) Foi substituído por: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden_layer_sizes=(50,50)) De acordo com os seus conhecimentos de aprendizagem de máquina, a substituição de código foi feita para: Nota: 10.0 A alterar o tipo do classificador B aumentar a quantidade de camadas da rede Você assinalou essa alternativa (B) Você acertou! Justificativa: O parâmetro hidden_layer_sizes é uma tupla na qual cada elemento indica a quantidade de neurônios em cada camada. Como o código apresentado o número de elementos aumenta, a quantidade de camadas da rede também. C diminuir a quantidade de camadas da rede D estabilizar as camadas da rede E aumentar o número de nós da rede Questão 6/10 - Inteligência Artificial Aplicada Durante o processo de treinamento supervisionado de uma rede neural para reconhecimento de imagens, os dados são preparados colocando uma indicação da categoria, a qual cada imagem pertence. Durante o processo de treinamento, milhares de imagens, contendo indicações erradas como a mostrada na imagem acima, foram fornecidas para uma rede neural, fazendo com que os resultados do modelo fossem muito ruins. De acordo com os seus conhecimentos sobre treinamento de redes neurais para reconhecimento de imagens, há muitas possibilidades, mas não será de grande utilidade: Nota: 10.0 A correção das etiquetas incorretas e um novo treinamento B testar novos hiperparâmetros C testar novos hiperparâmetros D um treinamento somente com as etiquetas incorretas Você assinalou essa alternativa (D) Você acertou! Justificativa: Em situações como a descrita, corrigir as etiquetas e treinar um novo modelo é uma boa estratégia, assim como realizar um treinamento apenas com etiquetas corretas. Mudar a taxa de aprendizagem e testar com novos hiperparâmetros pode ajudar a corrigir algumas distorções do modelo. Já treinar somente com instância com etiquetas incorretas, não ajudaria na melhora do modelo. E mudar a taxa de aprendizagem Questão 7/10 - Inteligência Artificial Aplicada “Determinar o preço de venda torna-se tarefa extremamente importante e constitui-se uma das peças fundamentais do planejamento empresarial, pois proporcionará rentabilidade, competitividade, crescimento e retorno do capital investido. O preço é fator importante na decisão de compra, pois, em mercados competitivos, o cliente considera seu desembolso financeiro altamente relevante. ” SEBRAE, Como Elaborar o Preço de Venda, 2013. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, caso você necessite de um modelo para determinar o preço de um determinado produto, em um ambiente de recursos limitados, sua escolha mais provável seria: Nota: 10.0 A modelo de Regressão Linear Você assinalou essa alternativa (A) Você acertou! Justificativa: Como o preçode um produto é um valor contínuo e considerando a limitação de recursos computacionais, um algoritmo de regressão linear será a melhor escolha. B rede do tipo LSTM C rede do tipo CNN D modelo k-Means E modelo HDBSCAN Questão 8/10 - Inteligência Artificial Aplicada Os modelos de regressão logística e regressão linear, apresentam semelhanças, além do nome. No entanto, utilizam funções diferentes para obtenção dos valores, apresentando outras diferenças entre si que determinam os diferentes uso para os quais os modelos podem ser aplicados. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, de maneria simplificada podemos dizer que a principal diferença entre os modelos é: Nota: 10.0 A o tipo treinamento B a predição de valores contínuos e discretos Você assinalou essa alternativa (B) Você acertou! Justificativa: A regressão logística realiza a predição de valores discretos, em intervalos determinados. Enquanto a regressão linear realiza a predição de valores contínuos. C vetores de atributos com tamanhos distintos D as categorias utilizadas E o número de categorias Questão 9/10 - Inteligência Artificial Aplicada Você recebeu um grande conjunto de dados para realizar o treinamento de um modelo de aprendizagem, porém durante o processo de exploração dos dados, você percebeu que havia uma enorme discrepância entre os valores absolutos de alguns atributos. Valendo-se dos seus conhecimento de aprendizagem de máquina, para evitar que essas discrepâncias prejudiquem o desempenho do seu modelo, você deverá executar nos dados um processo de : Nota: 10.0 A separação B identificação C normalização Você assinalou essa alternativa (C) Você acertou! Justificativa: Quando os valores absolutos os atributos apresentam grandes discrepâncias é necessário fazer um processo de normalização, para assim evitar que essas diferenças de magnitude prejudiquem o processo de aprendizagem. D limpeza E redução Questão 10/10 - Inteligência Artificial Aplicada Os modelos de aprendizagem de máquina, necessitam que os dados que lhe são fornecidos sejam convertidos para valores numéricos. Assim, quando temos dados que necessitam de conversão, pode-se utilizar um processo de categorizar uma variável. Representando cada possível valor por um número distinto, e que, se possível represente uma relação de hierarquia ou precedência entre os possíveis valores. De acordo com os seus conhecimentos sobre dados categóricos e one-hot encoding, podemos dizer que uma grande diferença entre representar uma variável categórica por valores numéricos e one-hot encoding é: Nota: 10.0 A que a primeira representa melhor que segunda B que a segunda representa melhor que a primeira C a primeira serve apenas determinados tipos de valores D a segunda serve apenas para determinados tipos de valores E a segunda cria variáveis derivadas, aumentando o número de atributos Você assinalou essa alternativa (E) Você acertou! Justificativa: Quando convertemos um atributo para one-hot encode, passamos a ter novos atributos que indicam a presença ou não daquele valor. Por exemplo, se tivermos uma variável com dois valores possíveis, ela seria representada como atributoN = 1 ou atributoN = 2. Quando temos a codificação one-hot encode para a mesma variável, ela será feita da seguinte forma, atributoN_valor1 = 0 ou atributoN_valor1 = 1, atributoN_valor2 = 0 ou atributoN_valor2 = 1. Assim temos novas variáveis derivadas a partir dos valores que a mesma pode assumir.
Compartilhar