Baixe o app para aproveitar ainda mais
Prévia do material em texto
Questão 1/10 - Inteligência Artificial Aplicada Como um iniciante na área de ciência de dados, você recebeu uma tarefa de agrupar um conjunto de dados de pessoas, utilizando um algoritmo de agrupamento. Você executou a separação utilizando um tutorial de internet, mas os resultados não foram satisfatórios. Buscando melhorar os resultados você pediu ajuda a um expert que lhe disse apenas o seguinte: “Altere o seu k-means para usar Manhattan ou Mahalanobis”. De acordo com o seu conhecimento do algoritmo k-means, o expert estava sugerindo que você: Nota: 10.0 A utilizasse outro algoritmo B utilizasse métricas de distância diferentes Você acertou! Justificativa: Manhattan e Mahalanobis se referem a dois tipos distintos de métricas de distância. C utilizasse uma outra linguagem de programação D utilizasse um método supervisionado E utilizasse um framework Questão 2/10 - Inteligência Artificial Aplicada O chefe de uma equipe de ciência de dados recebeu o resultado do treinamento de um modelo de aprendizagem de máquina, conforme a imagem acima. De acordo com os seus conhecimentos de aprendizagem de máquina, a acurácia deste modelo é de aproximadamente: Nota: 10.0 A 33% B 78% C 14% D 64% Você acertou! Justificativa: O valor da acurácia (AC) é obtido calculando (TP + TN)/(TP+TN+FP+FN), onde TP – True Positives (Verdadeiros Positivos) TN – True Negatives (Verdadeiros Negativos) FP – False Positives (Falsos Positivos) FN – False Negatives (Falsos Negativos) De acordo com a matriz de confusão dada: TP = 3301 TN = 1220 FP = 1403 FN = 1454 Logo, AC = (3301+1454)/(3301+1220+1403+1454) = 0,64 E 100% Questão 3/10 - Inteligência Artificial Aplicada “Determinar o preço de venda torna-se tarefa extremamente importante e constitui-se uma das peças fundamentais do planejamento empresarial, pois proporcionará rentabilidade, competitividade, crescimento e retorno do capital investido. O preço é fator importante na decisão de compra, pois, em mercados competitivos, o cliente considera seu desembolso financeiro altamente relevante. ” SEBRAE, Como Elaborar o Preço de Venda, 2013. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, caso você necessite de um modelo para determinar o preço de um determinado produto, em um ambiente de recursos limitados, sua escolha mais provável seria: Nota: 10.0 A modelo de Regressão Linear Você acertou! Justificativa: Como o preço de um produto é um valor contínuo e considerando a limitação de recursos computacionais, um algoritmo de regressão linear será a melhor escolha. B rede do tipo LSTM C rede do tipo CNN D modelo k-Means E modelo HDBSCAN Questão 4/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi planejar um modelo de aprendizagem de máquina que consiga agrupar os clientes de um site de venda online eu grupos de interesse. As informações de navegação dos clientes no site foram coletadas e partir dessas informações devem ser criados os agrupamentos de clientes. Utilizando os seus conhecimentos de aprendizagem de máquina e sabendo que a sua equipe dispõe de capacidade de processamento e dados em abundância, você recomendaria a utilização de: Nota: 0.0 A um classificador bayesiano B um modelo do tipo k-Means Justificativa: O agrupamento de dados exige o uso de um método de aprendizagem não-supervisionado como o k-Means. As demais opções apresentadas, ou são métodos de aprendizagem supervisionada. C uma classificador do tipo k-NN D uma rede neural do tipo LSTM E uma rede neura do tipo CNN Questão 5/10 - Inteligência Artificial Aplicada Durante o processo de treinamento supervisionado de uma rede neural para reconhecimento de imagens, os dados são preparados colocando uma indicação da categoria a qual cada imagem pertence. Durante o processo de treinamento, os dados da imagem acima foram fornecidos para uma rede neural, sendo a parte inferior da imagem a etiqueta de categoria. De acordo com os seus conhecimentos sobre treinamento de redes neurais para reconhecimento de imagens, a rede neural irá: Nota: 10.0 A descartar as imagens que estão com etiqueta incorreta B irá corrigir as etiquetas erradas C será treinada e indicará que há dados incorretos D não será treinada, retornando um erro E será treinada com as etiquetas incorretas Você acertou! Justificativa: Durante o fornecimento dos dados de treino para um modelo, se houver instâncias identificadas com categorias erradas, o modelo não conseguirá fazer a distinção entre instâncias que foram identificadas corretamente e aquelas que não foram. Assim, o modelo é treinado com os dados identificados de forma incorreta. Questão 6/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a tradução de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos trechos que a equipe gostaria de compreender se refere ao seguinte código: from sklearn.neural_network import MLPClassifier X_treino_std, y_treino = carrega_dados_treino() mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden_ layer_sizes=(100,)) mlp_clf.fit(X_treino_std, y_treino) De acordo com os seus conhecimentos de aprendizagem de máquina, o código acima executa: Nota: 0.0 A um processo de treinamento dos dados Justificativa: O código apresentado cria um modelo do tipo Multilayer Perceptron e execute o processo de treinamento do modelo por meio da chamada do método fit. B um processo de predição C um processo de normalização dos dados D um processo de expansão dos dados E não faz nada e pode ser comentado Questão 7/10 - Inteligência Artificial Aplicada Os modelos de regressão linear apresentam uma característica de não permitir calcular o número de erro de acertos, pois os valores obtidos no processo de predição diferem de forma diferente dos valores reais. Assim, utilizar métodos como matriz de confusão, não é possível. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, uma medida que pode ser utilizada para avaliar a qualidade do modelo de regressão linear é o : Nota: 0.0 A coeficiente de erros B coeficiente de inércia C taxa de acertos D taxa de erros E coeficiente de determinação Justificativa: Os modelos de regressão linear treinados, não devolvem um valor discreto, assim não é possível comparar o resultado da predição de forma direta com os dados anotados, mas sim a diferença do valor obtido para o valor real. Dessa maneira, a qualidade do modelo deve ser medida por uma outra técnica que considere o quão próximo das predições estão dos valores reais. Para isso, deve-se utilizar o coeficiente de determinação do modelo. Questão 8/10 - Inteligência Artificial Aplicada Você recebeu um grande conjunto de dados para realizar o treinamento de um modelo de aprendizagem, porém durante o processo de exploração dos dados, você percebeu que havia uma enorme discrepância entre os valores absolutos de alguns atributos. Valendo-se dos seus conhecimento de aprendizagem de máquina, para evitar que essas discrepâncias prejudiquem o desempenho do seu modelo, você deverá executar nos dados um processo de : Nota: 10.0 A separação B identificação C normalização Você acertou! Justificativa: Quando os valores absolutosos atributos apresentam grandes discrepâncias é necessário fazer um processo de normalização, para assim evitar que essas diferenças de magnitude prejudiquem o processo de aprendizagem. D limpeza E redução Questão 9/10 - Inteligência Artificial Aplicada Durante o processo de treinamento supervisionado de uma rede neural para reconhecimento de imagens, os dados são preparados colocando uma indicação da categoria, a qual cada imagem pertence. Durante o processo de treinamento, milhares de imagens, contendo indicações erradas como a mostrada na imagem acima, foram fornecidas para uma rede neural, fazendo com que os resultados do modelo fossem muito ruins. De acordo com os seus conhecimentos sobre treinamento de redes neurais para reconhecimento de imagens, há muitas possibilidades, mas não será de grande utilidade: Nota: 10.0 A correção das etiquetas incorretas e um novo treinamento B testar novos hiperparâmetros C testar novos hiperparâmetros D um treinamento somente com as etiquetas incorretas Você acertou! Justificativa: Em situações como a descrita, corrigir as etiquetas e treinar um novo modelo é uma boa estratégia, assim como realizar um treinamento apenas com etiquetas corretas. Mudar a taxa de aprendizagem e testar com novos hiperparâmetros pode ajudar a corrigir algumas distorções do modelo. Já treinar somente com instância com etiquetas incorretas, não ajudaria na melhora do modelo. E mudar a taxa de aprendizagem Questão 10/10 - Inteligência Artificial Aplicada O kNN é um algoritmo de aprendizagem supervisionada com a predição das classes feita por meio de voto. Ou seja, contabiliza-se as classes dos vizinhos e a instância em análise recebe a classe que teve maior número de votos. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, o k da sigla do kNN está relacionado ao hiperparâmetro que define: Nota: 10.0 A coeficiente de erros B o limite de erros C o número de vizinhos a serem comparados Você acertou! Justificativa: Hiperparâmetro é um parâmetro, cujo valor é utilizado para direcionar ou controlar o processo de aprendizagem. No caso do k -NN o número de vizinho a serem comparados é um hiperparâmetro que define quantas instâncias vizinhas serão comparadas com a instância sendo analisada. D a taxa de erros E o limite de acertos • Questão 1/10 - Inteligência Artificial Aplicada “Criada nos anos 1960, a tecnologia que usa computadores e algoritmos para reconhecer rostos humanos ganhou escala há pelo menos uma década, muito graças ao avanço das redes sociais e da internet. Com milhares de pessoas disponibilizando voluntariamente suas fotos na internet, existe hoje um banco de dados com bilhões de imagens que servem para treinar redes de inteligência artificial a detectar e reconhecer rostos.” Disponível em <https://revistagalileu.globo.com/>. Acesso em 19/04/2021 Apesar de ter sido criada na década de 60, a tecnologia de reconhecimento facial somente veio ser aplicada de fato e em larga escala nos tempos atuais. Dentre os motivos para que essa tecnologia não tenha sido melhor explorada na décadas passadas, podemos destacar como um fator de grande peso: Nota: 10.0 A a ausência de interesse em pesquisas B os erros contidos nos métodos de reconhecimento C não existir fotografia digital na época http://www.uninter.com/ D a baixa capacidade de armazenamento e processamento Você acertou! Justificativa: O processo de treinamento das redes neurais exige uma grande capacidade de processamento computacional por conta da quantidade de cálculos que devem ser executados para o correto ajuste dos pesos. Além disso, o processo de aprendizagem a partir dos dados necessita de um grande volume de dados, o que até algumas décadas atrás não era possível. E nenhuma das anteriores Questão 2/10 - Inteligência Artificial Aplicada Você recebeu um grande conjunto de dados para realizar o treinamento de um modelo de aprendizagem, porém durante o processo de exploração dos dados, você percebeu que havia uma enorme discrepância entre os valores absolutos de alguns atributos. Valendo-se dos seus conhecimento de aprendizagem de máquina, para evitar que essas discrepâncias prejudiquem o desempenho do seu modelo, você deverá executar nos dados um processo de : Nota: 10.0 A separação B identificação C normalização Você acertou! Justificativa: Quando os valores absolutos os atributos apresentam grandes discrepâncias é necessário fazer um processo de normalização, para assim evitar que essas diferenças de magnitude prejudiquem o processo de aprendizagem. D limpeza E redução Questão 3/10 - Inteligência Artificial Aplicada O chefe de uma equipe de ciência de dados recebeu o resultado do treinamento de um modelo de aprendizagem de máquina, conforme a imagem acima. De acordo com os seus conhecimentos de aprendizagem de máquina, a acurácia deste modelo é de aproximadamente: Nota: 10.0 A 33% B 78% C 14% D 64% Você acertou! Justificativa: O valor da acurácia (AC) é obtido calculando (TP + TN)/(TP+TN+FP+FN), onde TP – True Positives (Verdadeiros Positivos) TN – True Negatives (Verdadeiros Negativos) FP – False Positives (Falsos Positivos) FN – False Negatives (Falsos Negativos) De acordo com a matriz de confusão dada: TP = 3301 TN = 1220 FP = 1403 FN = 1454 Logo, AC = (3301+1454)/(3301+1220+1403+1454) = 0,64 E 100% Questão 4/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas foi a avaliação de modelos treinados. A imagem abaixo foi enviada junto com as informações do primeiro modelo que você deveria avaliar. Utilizando os seus conhecimentos de aprendizagem de máquina e as informações fornecidas pelo gráfico, você informou que o modelo treinado: Nota: 0.0 A deveria ser retreinado para predizer corretamente das as instâncias de treino B não tinha dados suficientes para treino C deveria ser substituído por um kNN D estava pronto para ser colocado em produção Justificativa: Quando analisamos visualmente o desempenho de um modelo como descrito no texto base, quanto mais alinhados com a reta diagonal, melhor pode ser considerado o desempenho do modelo. E apresentava um desempenho ruim e deveria ser retreinado Questão 5/10 - Inteligência Artificial Aplicada Você necessita executar o treinamento de um modelo de aprendizagem. Sabendo que é preciso dividir os dados em treinamento e em testes, você resolve utilizar uma proporção que é bastante utilizada e recomendada, na qual se fornece mais dados para treino que para testes. Valendo-se dos seus conhecimento de aprendizagem de máquina, para conseguir executar o treinamento do modelo você deverá: Nota: 10.0 A utilizar uma estratégia de validação cruzada B utilizar os dados na proporção 80-20 Você acertou! Justificativa: A proporção 80% para treino e 20% para testes é comumente utilizada no processo de separação dos dados. Sendo inclusive recomendada, ainda que não seja a única forma de particionar os dados. C utilizar os dados na proporção 50-50 D treinar e testar com os mesmos dados E utilizar todos os dados para treino e não testar Questão 6/10 - Inteligência Artificial Aplicada Os modelos de regressão logística e regressão linear, apresentam semelhanças, além do nome. No entanto, utilizam funções diferentes para obtenção dos valores, apresentando outras diferenças entre si que determinam os diferentes uso para os quais os modelos podem ser aplicados. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, de maneria simplificada podemos dizer que a principal diferençaentre os modelos é: Nota: 0.0 A o tipo treinamento B a predição de valores contínuos e discretos Justificativa: A regressão logística realiza a predição de valores discretos, em intervalos determinados. Enquanto a regressão linear realiza a predição de valores contínuos. C vetores de atributos com tamanhos distintos D as categorias utilizadas E o número de categorias Questão 7/10 - Inteligência Artificial Aplicada Como um iniciante na área de ciência de dados, você recebeu uma tarefa de agrupar um conjunto de dados de pessoas, utilizando um algoritmo de agrupamento. Você executou a separação utilizando um tutorial de internet, mas os resultados não foram satisfatórios. Buscando melhorar os resultados você pediu ajuda a um expert que lhe disse apenas o seguinte: “Altere o seu k-means para usar Manhattan ou Mahalanobis”. De acordo com o seu conhecimento do algoritmo k-means, o expert estava sugerindo que você: Nota: 10.0 A utilizasse outro algoritmo B utilizasse métricas de distância diferentes Você acertou! Justificativa: Manhattan e Mahalanobis se referem a dois tipos distintos de métricas de distância. C utilizasse uma outra linguagem de programação D utilizasse um método supervisionado E utilizasse um framework Questão 8/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi planejar um modelo de aprendizagem de máquina que consiga agrupar os clientes de um site de venda online eu grupos de interesse. As informações de navegação dos clientes no site foram coletadas e partir dessas informações devem ser criados os agrupamentos de clientes. Utilizando os seus conhecimentos de aprendizagem de máquina e sabendo que a sua equipe dispõe de capacidade de processamento e dados em abundância, você recomendaria a utilização de: Nota: 0.0 A um classificador bayesiano B um modelo do tipo k-Means Justificativa: O agrupamento de dados exige o uso de um método de aprendizagem não-supervisionado como o k-Means. As demais opções apresentadas, ou são métodos de aprendizagem supervisionada. C uma classificador do tipo k-NN D uma rede neural do tipo LSTM E uma rede neura do tipo CNN Questão 9/10 - Inteligência Artificial Aplicada “Determinar o preço de venda torna-se tarefa extremamente importante e constitui-se uma das peças fundamentais do planejamento empresarial, pois proporcionará rentabilidade, competitividade, crescimento e retorno do capital investido. O preço é fator importante na decisão de compra, pois, em mercados competitivos, o cliente considera seu desembolso financeiro altamente relevante. ” SEBRAE, Como Elaborar o Preço de Venda, 2013. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, caso você necessite de um modelo para determinar o preço de um determinado produto, em um ambiente de recursos limitados, sua escolha mais provável seria: Nota: 10.0 A modelo de Regressão Linear Você acertou! Justificativa: Como o preço de um produto é um valor contínuo e considerando a limitação de recursos computacionais, um algoritmo de regressão linear será a melhor escolha. B rede do tipo LSTM C rede do tipo CNN D modelo k-Means E modelo HDBSCAN Questão 10/10 - Inteligência Artificial Aplicada Os modelos de regressão linear apresentam uma característica de não permitir calcular o número de erro de acertos, pois os valores obtidos no processo de predição diferem de forma diferente dos valores reais. Assim, utilizar métodos como matriz de confusão, não é possível. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, uma medida que pode ser utilizada para avaliar a qualidade do modelo de regressão linear é o : Nota: 10.0 A coeficiente de erros B coeficiente de inércia C taxa de acertos D taxa de erros E coeficiente de determinação Você acertou! Justificativa: Os modelos de regressão linear treinados, não devolvem um valor discreto, assim não é possível comparar o resultado da predição de forma direta com os dados anotados, mas sim a diferença do valor obtido para o valor real. Dessa maneira, a qualidade do modelo deve ser medida por uma outra técnica que considere o quão próximo das predições estão dos valores reais. Para isso, deve-se utilizar o coeficiente de determinação do modelo. • Questão 1/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi planejar um modelo de aprendizagem de máquina que consiga agrupar os clientes de um site de venda online eu grupos de interesse. As informações de navegação dos clientes no site foram coletadas e partir dessas informações devem ser criados os agrupamentos de clientes. Utilizando os seus conhecimentos de aprendizagem de máquina e sabendo que a sua equipe dispõe de capacidade de processamento e dados em abundância, você recomendaria a utilização de: Nota: 10.0 A um classificador bayesiano B um modelo do tipo k-Means Você acertou! Justificativa: O agrupamento de dados exige o uso de um método de aprendizagem não-supervisionado como o k-Means. As demais opções apresentadas, ou são métodos de aprendizagem supervisionada. C uma classificador do tipo k-NN http://www.uninter.com/ D uma rede neural do tipo LSTM E uma rede neura do tipo CNN Questão 2/10 - Inteligência Artificial Aplicada Durante o processo de treinamento supervisionado de uma rede neural para reconhecimento de imagens, os dados são preparados colocando uma indicação da categoria, a qual cada imagem pertence. Durante o processo de treinamento, milhares de imagens, contendo indicações erradas como a mostrada na imagem acima, foram fornecidas para uma rede neural, fazendo com que os resultados do modelo fossem muito ruins. De acordo com os seus conhecimentos sobre treinamento de redes neurais para reconhecimento de imagens, há muitas possibilidades, mas não será de grande utilidade: Nota: 10.0 A correção das etiquetas incorretas e um novo treinamento B testar novos hiperparâmetros C testar novos hiperparâmetros D um treinamento somente com as etiquetas incorretas Você acertou! Justificativa: Em situações como a descrita, corrigir as etiquetas e treinar um novo modelo é uma boa estratégia, assim como realizar um treinamento apenas com etiquetas corretas. Mudar a taxa de aprendizagem e testar com novos hiperparâmetros pode ajudar a corrigir algumas distorções do modelo. Já treinar somente com instância com etiquetas incorretas, não ajudaria na melhora do modelo. E mudar a taxa de aprendizagem Questão 3/10 - Inteligência Artificial Aplicada Os modelos de regressão linear apresentam uma característica de não permitir calcular o número de erro de acertos, pois os valores obtidos no processo de predição diferem de forma diferente dos valores reais. Assim, utilizar métodos como matriz de confusão, não é possível. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, uma medida que pode ser utilizada para avaliar a qualidade do modelo de regressão linear é o : Nota: 10.0 A coeficiente de erros B coeficiente de inércia C taxa de acertos D taxa de erros E coeficiente de determinação Você acertou! Justificativa: Os modelos de regressão linear treinados, não devolvem um valor discreto, assim não é possível comparar o resultado da predição de forma direta com os dados anotados, mas sim a diferença do valor obtido para o valor real. Dessa maneira, a qualidade do modelo deve ser medidapor uma outra técnica que considere o quão próximo das predições estão dos valores reais. Para isso, deve-se utilizar o coeficiente de determinação do modelo. Questão 4/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas foi a avaliação de modelos treinados. A imagem abaixo foi enviada junto com as informações do primeiro modelo que você deveria avaliar. Utilizando os seus conhecimentos de aprendizagem de máquina e as informações fornecidas pelo gráfico, você informou que o modelo treinado: Nota: 10.0 A deveria ser retreinado para predizer corretamente das as instâncias de treino B não tinha dados suficientes para treino C deveria ser substituído por um kNN D estava pronto para ser colocado em produção Você acertou! Justificativa: Quando analisamos visualmente o desempenho de um modelo como descrito no texto base, quanto mais alinhados com a reta diagonal, melhor pode ser considerado o desempenho do modelo. E apresentava um desempenho ruim e deveria ser retreinado Questão 5/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a explanação de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos trechos que a equipe gostaria de compreender se refere a uma troca de códigos, onde o código: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden _layer_sizes=(100,)) Foi substituído por: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden_layer_sizes=(50,50)) De acordo com os seus conhecimentos de aprendizagem de máquina, a substituição de código foi feita para: Nota: 0.0 A alterar o tipo do classificador B aumentar a quantidade de camadas da rede Justificativa: O parâmetro hidden_layer_sizes é uma tupla na qual cada elemento indica a quantidade de neurônios em cada camada. Como o código apresentado o número de elementos aumenta, a quantidade de camadas da rede também. C diminuir a quantidade de camadas da rede D estabilizar as camadas da rede E aumentar o número de nós da rede Questão 6/10 - Inteligência Artificial Aplicada O termo one-hot descreve um grupo de bits onde apenas um dos bits é 1 (um) e todos os demais 0 (zero). Em aprendizagem de máquina, existe um método chamado one-hot enconding que é utilizada para lidar com dados categóricos.” Considere que você possui um conjunto de dados onde já um campo Idiomas que podem assumir 3 valores: português, espanhol e inglês. Valendo dos seus conhecimentos sobre dados categóricos, uma possível codificação one-hot para este campo seria: Nota: 0.0 A português (1), espanhol (2), francês (3) B português (00), espanhol (10), francês (11) C português (000), espanhol (001), francês (010) D português (001), espanhol (002), francês (003) E português (001), espanhol (010), francês (100) Justificativa: Como se trata de 3 valores possíveis e a codificação one-hot exige que somente uma posição do valor seja igual a 1, logo a opção 001,010,100 seria a escolha correta. Questão 7/10 - Inteligência Artificial Aplicada “Determinar o preço de venda torna-se tarefa extremamente importante e constitui-se uma das peças fundamentais do planejamento empresarial, pois proporcionará rentabilidade, competitividade, crescimento e retorno do capital investido. O preço é fator importante na decisão de compra, pois, em mercados competitivos, o cliente considera seu desembolso financeiro altamente relevante. ” SEBRAE, Como Elaborar o Preço de Venda, 2013. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, caso você necessite de um modelo para determinar o preço de um determinado produto, em um ambiente de recursos limitados, sua escolha mais provável seria: Nota: 10.0 A modelo de Regressão Linear Você acertou! Justificativa: Como o preço de um produto é um valor contínuo e considerando a limitação de recursos computacionais, um algoritmo de regressão linear será a melhor escolha. B rede do tipo LSTM C rede do tipo CNN D modelo k-Means E modelo HDBSCAN Questão 8/10 - Inteligência Artificial Aplicada Como um iniciante na área de ciência de dados, você recebeu uma tarefa de agrupar um conjunto de dados de pessoas, utilizando um algoritmo de agrupamento. Você executou a separação utilizando um tutorial de internet, mas os resultados não foram satisfatórios. Buscando melhorar os resultados você pediu ajuda a um expert que lhe disse apenas o seguinte: “Altere o seu k-means para usar Manhattan ou Mahalanobis”. De acordo com o seu conhecimento do algoritmo k-means, o expert estava sugerindo que você: Nota: 10.0 A utilizasse outro algoritmo B utilizasse métricas de distância diferentes Você acertou! Justificativa: Manhattan e Mahalanobis se referem a dois tipos distintos de métricas de distância. C utilizasse uma outra linguagem de programação D utilizasse um método supervisionado E utilizasse um framework Questão 9/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a explanação de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos trechos que a equipe gostaria de compreender se refere a uma troca de códigos, onde o código: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden _layer_sizes=(100,50,50)) Foi substituído por: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden_layer_sizes=(50,50)) De acordo com os seus conhecimentos de aprendizagem de máquina, a substituição de código foi feita para: Nota: 10.0 A alterar o tipo do classificador B aumentar a quantidade de camadas da rede C diminuir a quantidade de camadas da rede Você acertou! Justificativa: O parâmetro hidden_layer_sizes é uma tupla na qual cada elemento indica a quantidade de neurônios em cada camada. Como o código apresentado o número de elementos diminui, a quantidade de camadas da rede também. D estabilizar as camadas da rede E aumentar o número de nós da rede Questão 10/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a explanação de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos trechos que a equipe gostaria de compreender se refere a uma troca de códigos, onde o código: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden _layer_sizes=(100,)) Foi substituído por: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden_layer_sizes=(50,50)) A equipe gostaria de saber se essa mudança, iria exigir mais memória. Ou seja, se o número de nós da rede aumentaria.De acordo com os seus conhecimentos de aprendizagem de máquina, a substituição de código fará com o número de nós do classificar perceptron de múltiplas camadas: Nota: 10.0 A irá diminuir B irá dobrar C reduzirá pela metade D permanecerá igual Você acertou! Justificativa: O número de nós do classificador é dado pela soma de todos os elementos do parâmetro hidden_layer_sizes. Como nos dois trechos de código o total de valores permanece constante, 100 e 50+10, não há alteração da quantidade de nós. E irá aumentar • Questão 1/10 - Inteligência Artificial Aplicada Os modelos de aprendizagem de máquina, necessitam que os dados que lhe são fornecidos sejam convertidos para valores numéricos. Assim, quando temos dados que necessitam de conversão, pode-se utilizar um processo de categorizar uma variável. http://www.uninter.com/ Representando cada possível valor por um número distinto, e que, se possível represente uma relação de hierarquia ou precedência entre os possíveis valores. De acordo com os seus conhecimentos sobre dados categóricos e one-hot encoding, podemos dizer que uma grande diferença entre representar uma variável categórica por valores numéricos e one-hot encoding é: Nota: 0.0 A que a primeira representa melhor que segunda B que a segunda representa melhor que a primeira C a primeira serve apenas determinados tipos de valores D a segunda serve apenas para determinados tipos de valores E a segunda cria variáveis derivadas, aumentando o número de atributos Justificativa: Quando convertemos um atributo para one-hot encode, passamos a ter novos atributos que indicam a presença ou não daquele valor. Por exemplo, se tivermos uma variável com dois valores possíveis, ela seria representada como atributoN = 1 ou atributoN = 2. Quando temos a codificação one-hot encode para a mesma variável, ela será feita da seguinte forma, atributoN_valor1 = 0 ou atributoN_valor1 = 1, atributoN_valor2 = 0 ou atributoN_valor2 = 1. Assim temos novas variáveis derivadas a partir dos valores que a mesma pode assumir. Questão 2/10 - Inteligência Artificial Aplicada Durante o processo de treinamento supervisionado de uma rede neural para reconhecimento de imagens, os dados são preparados colocando uma indicação da categoria, a qual cada imagem pertence. Durante o processo de treinamento, milhares de imagens, contendo indicações erradas como a mostrada na imagem acima, foram fornecidas para uma rede neural, fazendo com que os resultados do modelo fossem muito ruins. De acordo com os seus conhecimentos sobre treinamento de redes neurais para reconhecimento de imagens, há muitas possibilidades, mas não será de grande utilidade: Nota: 10.0 A correção das etiquetas incorretas e um novo treinamento B testar novos hiperparâmetros C testar novos hiperparâmetros D um treinamento somente com as etiquetas incorretas Você acertou! Justificativa: Em situações como a descrita, corrigir as etiquetas e treinar um novo modelo é uma boa estratégia, assim como realizar um treinamento apenas com etiquetas corretas. Mudar a taxa de aprendizagem e testar com novos hiperparâmetros pode ajudar a corrigir algumas distorções do modelo. Já treinar somente com instância com etiquetas incorretas, não ajudaria na melhora do modelo. E mudar a taxa de aprendizagem Questão 3/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi planejar um modelo de aprendizagem de máquina para buscar determinar o preço de produtos com os quais um cliente trabalha. Utilizando os seus conhecimentos de aprendizagem de máquina e sabendo que a sua equipe dispõe de capacidade de processamento e dados em abundância, você recomendaria a utilização de: Nota: 10.0 A um classificador bayesiano B um modelo de regressão linear Você acertou! Justificativa: A predição de preços é uma tarefa de predição continua, sendo necessário utilizar um modelo regressivo e não um categórico ou uma rede neural. Assim, o mais adequado seria um modelo de regressão linear. C uma classificador do tipo k-NN D uma rede neural do tipo LSTM E uma rede neura do tipo CNN Questão 4/10 - Inteligência Artificial Aplicada Você necessita desenvolver um classificador bayesiano para detecção de spam baseado nas palavras contidas nos e-mails recebidos. Para isso o classificador deverá utilizar o teorema de Bayes, considerando as classes como spam e não-spam e o vetor de características como a presença ou ausência de uma palavra, de acordo com a imagem acima. Considerando do texto acima e valendo-se do seu conhecimento sobre classificação bayesiana, o elemento P(?) será corretamente substituído por : Nota: 0.0 A P(não-spam | spam) B P(spam) C P(palavra) D P(spam | não-spam) E P(palavra | spam) Justificativa: Como o classificador bayesiano utiliza conhecimento prévio para fazer a predição, nesse caso ele utilizará a informação da probabilidade de um documento conter uma palavra, dado que ele é um spam, ou seja P(palavra | spam). Questão 5/10 - Inteligência Artificial Aplicada Os modelos de regressão logística e regressão linear, apresentam semelhanças, além do nome. No entanto, utilizam funções diferentes para obtenção dos valores, apresentando outras diferenças entre si que determinam os diferentes uso para os quais os modelos podem ser aplicados. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, de maneria simplificada podemos dizer que a principal diferença entre os modelos é: Nota: 10.0 A o tipo treinamento B a predição de valores contínuos e discretos Você acertou! Justificativa: A regressão logística realiza a predição de valores discretos, em intervalos determinados. Enquanto a regressão linear realiza a predição de valores contínuos. C vetores de atributos com tamanhos distintos D as categorias utilizadas E o número de categorias Questão 6/10 - Inteligência Artificial Aplicada Durante o processo de treinamento supervisionado de uma rede neural para reconhecimento de imagens, os dados são preparados colocando uma indicação da categoria a qual cada imagem pertence. Durante o processo de treinamento, os dados da imagem acima foram fornecidos para uma rede neural, sendo a parte inferior da imagem a etiqueta de categoria. De acordo com os seus conhecimentos sobre treinamento de redes neurais para reconhecimento de imagens, a rede neural irá: Nota: 10.0 A descartar as imagens que estão com etiqueta incorreta B irá corrigir as etiquetas erradas C será treinada e indicará que há dados incorretos D não será treinada, retornando um erro E será treinada com as etiquetas incorretas Você acertou! Justificativa: Durante o fornecimento dos dados de treino para um modelo, se houver instâncias identificadas com categorias erradas, o modelo não conseguirá fazer a distinção entre instâncias que foram identificadas corretamente e aquelas que não foram. Assim, o modelo é treinado com os dados identificados de forma incorreta. Questão 7/10 - Inteligência Artificial Aplicada Você necessita implementar um módulo de detecção de spam. Como o volume e a frequência de e-mails muito alta, você precisa de um algoritmo de classificação que permita obter de forma rápida a identificação se o e-mail recebida se trata ou não de um spam, ainda que alguns falsos positivos possam ocorrer. Usando os seus conhecimentos de aprendizagem de máquina, você optaria por um algoritmo de: Nota: 10.0 A classificador bayesiano Você acertou! Justificativa: Modelos de agrupamento hierárquico e do tipo k-NN não são indicados, pois eles comparam uma instância com todos as outras instâncias,não respondendo de forma rápida. Métodos de redes neurais (MLP, CNN) tendem a necessitar de muita memória e processamento, o que faz com que demorem em dar uma resposta rápida. Já modelos do tipo classificador bayesiano tendem a ser mais rápidos que os demais, ainda que a sua precisão e taxa de erros seja maior que outros algoritmos. B agrupamento hierárquico C rede neural profunda D k-NN E rede neural do tipo CNN Questão 8/10 - Inteligência Artificial Aplicada “Determinar o preço de venda torna-se tarefa extremamente importante e constitui-se uma das peças fundamentais do planejamento empresarial, pois proporcionará rentabilidade, competitividade, crescimento e retorno do capital investido. O preço é fator importante na decisão de compra, pois, em mercados competitivos, o cliente considera seu desembolso financeiro altamente relevante. ” SEBRAE, Como Elaborar o Preço de Venda, 2013. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, caso você necessite de um modelo para determinar o preço de um determinado produto, em um ambiente de recursos limitados, sua escolha mais provável seria: Nota: 10.0 A modelo de Regressão Linear Você acertou! Justificativa: Como o preço de um produto é um valor contínuo e considerando a limitação de recursos computacionais, um algoritmo de regressão linear será a melhor escolha. B rede do tipo LSTM C rede do tipo CNN D modelo k-Means E modelo HDBSCAN Questão 9/10 - Inteligência Artificial Aplicada O chefe de uma equipe de ciência de dados recebeu o resultado do treinamento de um modelo de aprendizagem de máquina, conforme a imagem acima. De acordo com os seus conhecimentos de aprendizagem de máquina, a acurácia deste modelo é de aproximadamente: Nota: 10.0 A 33% B 78% C 14% D 64% Você acertou! Justificativa: O valor da acurácia (AC) é obtido calculando (TP + TN)/(TP+TN+FP+FN), onde TP – True Positives (Verdadeiros Positivos) TN – True Negatives (Verdadeiros Negativos) FP – False Positives (Falsos Positivos) FN – False Negatives (Falsos Negativos) De acordo com a matriz de confusão dada: TP = 3301 TN = 1220 FP = 1403 FN = 1454 Logo, AC = (3301+1454)/(3301+1220+1403+1454) = 0,64 E 100% Questão 10/10 - Inteligência Artificial Aplicada O gráfico acima mostra o resultado da execução de um algoritmo k-means, indicando a soma das distâncias intra-clusters x nº de clusters. De acordo com o seu conhecimento do algoritmo k-means e do método do cotovelo para determinar o melhor número de clusters, o valor mais adequado se encontra no intervalo: Nota: 0.0 A entre 6 e 8 B acima de 10 C abaixo de 2 D entre 2 e 4 E entre 4 e 6 Justificativa: De acordo com o método do cotovelo deve escolher o valor onde ocorre a maior inflexão do gráfico. Neste caso, entre os valores 4 e 6. • Questão 1/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi planejar um modelo de aprendizagem de máquina que consiga agrupar os clientes de um site de venda online eu grupos de interesse. As informações de navegação dos clientes no site foram coletadas e partir dessas informações devem ser criados os agrupamentos de clientes. Utilizando os seus conhecimentos de aprendizagem de máquina e sabendo que a sua equipe dispõe de capacidade de processamento e dados em abundância, você recomendaria a utilização de: Nota: 10.0 A um classificador bayesiano B um modelo do tipo k-Means Você acertou! Justificativa: O agrupamento de dados exige o uso de um método de aprendizagem não-supervisionado como o k-Means. As demais opções apresentadas, ou são métodos de aprendizagem supervisionada. C uma classificador do tipo k-NN D uma rede neural do tipo LSTM http://www.uninter.com/ E uma rede neura do tipo CNN Questão 2/10 - Inteligência Artificial Aplicada O chefe de uma equipe de ciência de dados recebeu o resultado do treinamento de um modelo de aprendizagem de máquina, conforme a imagem acima. De acordo com os seus conhecimentos de aprendizagem de máquina, a acurácia deste modelo é de aproximadamente: Nota: 10.0 A 33% B 78% C 14% D 64% Você acertou! Justificativa: O valor da acurácia (AC) é obtido calculando (TP + TN)/(TP+TN+FP+FN), onde TP – True Positives (Verdadeiros Positivos) TN – True Negatives (Verdadeiros Negativos) FP – False Positives (Falsos Positivos) FN – False Negatives (Falsos Negativos) De acordo com a matriz de confusão dada: TP = 3301 TN = 1220 FP = 1403 FN = 1454 Logo, AC = (3301+1454)/(3301+1220+1403+1454) = 0,64 E 100% Questão 3/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a tradução de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos trechos que a equipe gostaria de compreender se refere ao seguinte código: from sklearn.neural_network import MLPClassifier X_treino_std, y_treino = carrega_dados_treino() mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden_ layer_sizes=(100,)) mlp_clf.fit(X_treino_std, y_treino) De acordo com os seus conhecimentos de aprendizagem de máquina, o código acima executa: Nota: 0.0 A um processo de treinamento dos dados Justificativa: O código apresentado cria um modelo do tipo Multilayer Perceptron e execute o processo de treinamento do modelo por meio da chamada do método fit. B um processo de predição C um processo de normalização dos dados D um processo de expansão dos dados E não faz nada e pode ser comentado Questão 4/10 - Inteligência Artificial Aplicada Durante o processo de treinamento supervisionado de uma rede neural para reconhecimento de imagens, os dados são preparados colocando uma indicação da categoria, a qual cada imagem pertence. Durante o processo de treinamento, milhares de imagens, contendo indicações erradas como a mostrada na imagem acima, foram fornecidas para uma rede neural, fazendo com que os resultados do modelo fossem muito ruins. De acordo com os seus conhecimentos sobre treinamento de redes neurais para reconhecimento de imagens, há muitas possibilidades, mas não será de grande utilidade: Nota: 10.0 A correção das etiquetas incorretas e um novo treinamento B testar novos hiperparâmetros C testar novos hiperparâmetros D um treinamento somente com as etiquetas incorretas Você acertou! Justificativa: Em situações como a descrita, corrigir as etiquetas e treinar um novo modelo é uma boa estratégia, assim como realizar um treinamento apenas com etiquetas corretas. Mudar a taxa de aprendizagem e testar com novos hiperparâmetros pode ajudar a corrigir algumas distorções do modelo. Já treinar somente com instância com etiquetas incorretas, não ajudaria na melhora do modelo. E mudar a taxa de aprendizagem Questão 5/10 - Inteligência Artificial Aplicada Você recebeu um grande conjunto de dados para realizar o treinamento de um modelo de aprendizagem, porém durante o processo de exploração dos dados, você percebeu que havia uma enorme discrepância entre os valores absolutos de alguns atributos. Valendo-se dos seus conhecimento de aprendizagem de máquina, para evitar que essas discrepâncias prejudiquem o desempenho do seu modelo, você deverá executar nos dados um processo de : Nota: 10.0 A separação B identificação C normalização Vocêacertou! Justificativa: Quando os valores absolutos os atributos apresentam grandes discrepâncias é necessário fazer um processo de normalização, para assim evitar que essas diferenças de magnitude prejudiquem o processo de aprendizagem. D limpeza E redução Questão 6/10 - Inteligência Artificial Aplicada “Determinar o preço de venda torna-se tarefa extremamente importante e constitui-se uma das peças fundamentais do planejamento empresarial, pois proporcionará rentabilidade, competitividade, crescimento e retorno do capital investido. O preço é fator importante na decisão de compra, pois, em mercados competitivos, o cliente considera seu desembolso financeiro altamente relevante. ” SEBRAE, Como Elaborar o Preço de Venda, 2013. Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, caso você necessite de um modelo para determinar o preço de um determinado produto, em um ambiente de recursos limitados, sua escolha mais provável seria: Nota: 10.0 A modelo de Regressão Linear Você acertou! Justificativa: Como o preço de um produto é um valor contínuo e considerando a limitação de recursos computacionais, um algoritmo de regressão linear será a melhor escolha. B rede do tipo LSTM C rede do tipo CNN D modelo k-Means E modelo HDBSCAN Questão 7/10 - Inteligência Artificial Aplicada “Criada nos anos 1960, a tecnologia que usa computadores e algoritmos para reconhecer rostos humanos ganhou escala há pelo menos uma década, muito graças ao avanço das redes sociais e da internet. Com milhares de pessoas disponibilizando voluntariamente suas fotos na internet, existe hoje um banco de dados com bilhões de imagens que servem para treinar redes de inteligência artificial a detectar e reconhecer rostos.” Disponível em <https://revistagalileu.globo.com/>. Acesso em 19/04/2021 Apesar de ter sido criada na década de 60, a tecnologia de reconhecimento facial somente veio ser aplicada de fato e em larga escala nos tempos atuais. Dentre os motivos para que essa tecnologia não tenha sido melhor explorada na décadas passadas, podemos destacar como um fator de grande peso: Nota: 10.0 A a ausência de interesse em pesquisas B os erros contidos nos métodos de reconhecimento C não existir fotografia digital na época D a baixa capacidade de armazenamento e processamento Você acertou! Justificativa: O processo de treinamento das redes neurais exige uma grande capacidade de processamento computacional por conta da quantidade de cálculos que devem ser executados para o correto ajuste dos pesos. Além disso, o processo de aprendizagem a partir dos dados necessita de um grande volume de dados, o que até algumas décadas atrás não era possível. E nenhuma das anteriores Questão 8/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a explanação de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos trechos que a equipe gostaria de compreender se refere a uma troca de códigos, onde o código: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden _layer_sizes=(100,50,50)) Foi substituído por: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden_layer_sizes=(50,50)) De acordo com os seus conhecimentos de aprendizagem de máquina, a substituição de código foi feita para: Nota: 0.0 A alterar o tipo do classificador B aumentar a quantidade de camadas da rede C diminuir a quantidade de camadas da rede Justificativa: O parâmetro hidden_layer_sizes é uma tupla na qual cada elemento indica a quantidade de neurônios em cada camada. Como o código apresentado o número de elementos diminui, a quantidade de camadas da rede também. D estabilizar as camadas da rede E aumentar o número de nós da rede Questão 9/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi planejar um modelo de aprendizagem de máquina para buscar determinar o preço de produtos com os quais um cliente trabalha. Utilizando os seus conhecimentos de aprendizagem de máquina e sabendo que a sua equipe dispõe de capacidade de processamento e dados em abundância, você recomendaria a utilização de: Nota: 10.0 A um classificador bayesiano B um modelo de regressão linear Você acertou! Justificativa: A predição de preços é uma tarefa de predição continua, sendo necessário utilizar um modelo regressivo e não um categórico ou uma rede neural. Assim, o mais adequado seria um modelo de regressão linear. C uma classificador do tipo k-NN D uma rede neural do tipo LSTM E uma rede neura do tipo CNN Questão 10/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas foi a avaliação de modelos treinados. A imagem abaixo foi enviada junto com as informações do primeiro modelo que você deveria avaliar. Utilizando os seus conhecimentos de aprendizagem de máquina e as informações fornecidas pelo gráfico, você informou que o modelo treinado: Nota: 10.0 A deveria ser retreinado para predizer corretamente das as instâncias de treino B não tinha dados suficientes para treino C deveria ser substituído por um kNN D estava pronto para ser colocado em produção Você acertou! Justificativa: Quando analisamos visualmente o desempenho de um modelo como descrito no texto base, quanto mais alinhados com a reta diagonal, melhor pode ser considerado o desempenho do modelo. E apresentava um desempenho ruim e deveria ser retreinado • http://www.uninter.com/
Compartilhar