Prévia do material em texto
Apol Inteligencia artificial 2022 Questão 1/10 - Inteligência Artificial Aplicada “Machine Learning atualmente é considerada como uma subárea da Inteligência Artificial, e nós devemos diferenciá-la dos métodos de Inteligência Artificial (IA) que lidam com problemas de busca, agentes inteligentes e resolução de problemas, como por exemplo fazer com que o computador consiga definir a melhor jogada em uma partida de xadrez ou encontrar a saída de um labirinto.” (Material impresso da Aula 1 – Tema 2). Sobre ML é correto afirmar: Nota: 10.0 A Uma grande vantagem dos métodos de Machine Learning é que o processo de aprendizagem pode ser automatizado à medida que novos exemplos são identificados e apresentados ao algoritmo. Você assinalou essa alternativa (A) Você acertou! Conforme Aula 1 Tema 2.1. B Machine Learning pode ser compreendida como um conjunto de técnicas ou métodos que permitem às máquinas obter a capacidade de raciocínio líquido, utilizando o conhecimento armazenado, permitindo novas conclusões, durante a comunicação. C Uma grande vantagem dos métodos de Machine Learning é que o processo de aprendizagem não depende de visão computacional ligada as estruturas de busca mas sim buscas em sistemas especialistas. D Machine Learning não pode ser totalmente compreendida uma vez que técnicas ou métodos que permitem às máquinas obter a capacidade de raciocínio líquido, ainda não são conhecidas, nem mesmo durante a comunicação. Questão 2/10 - Inteligência Artificial Aplicada “Dado categórico é o tipo de dado estatístico que consiste em variáveis categóricas ou em dados que foram convertidos para esse formato, por exemplo, como dados agrupados. Mais especificamente, os dados categóricos podem derivar de observações feitas de dados qualitativos que são resumidos como contagens ou tabulações cruzadas, ou de observações de dados quantitativos agrupados em determinados intervalos.” Disponível em <https://pt.wikipedia.org/>. Como um profissional da área de ciência de dados você sabe que variáveis categóricas podem receber valores de 1 até o limite dos possíveis valores, ainda que a descrição ou valor real do campo seja diferente do número que a representa. Assim, podemos considerar como um exemplo de variável categórica : Nota: 0.0Você não pontuou essa questão A o preço de um produto Você assinalou essa alternativa (A) B o tipo sanguíneo de uma pessoa Justificativa: O tipo sanguíneo de uma pessoa pode assumir valores limitados, divididos em 8 tipos diferentes (A+,A-,B+,B-,AB+, AB-, O+, O-) se consideramos o fator Rh. O preço de um produto é um valor contínuo. A idade e o peso de uma pessoa é apesar de assumir valores limitados, não pode ser considerado como categórico. Assim como nome também não pode. C a idade de uma pessoa D o nome de uma pessoa E o peso de uma pessoa Questão 3/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a tradução de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos trechos que a equipe gostaria de decifrar se refere ao seguinte código: from sklearn.preprocessing import StandardScaler X = carrega_dataset() sc = StandardScaler() sc.fit(X) De acordo com os seus conhecimentos de aprendizagem de máquina, o código acima executa: Nota: 10.0 A um processo de treinamento dos dados B um processo de predição C um processo de normalização dos dados Você assinalou essa alternativa (C) Você acertou! Justificativa: O uso do método fit da classe StandardScaler executa um processo de normalização de dados. D um processo de expansão dos dados E não faz nada e pode ser comentado Questão 4/10 - Inteligência Artificial Aplicada A figura acima mostra um modelo de árvore de decisão aplicado a um conjunto de dados. Valendo-se dos seus conhecimentos de aprendizagem de máquina e de modelos de árvores de decisão, podemos afirmar que o campo samples na raiz e nas folhas indicam respectivamente: Nota: 10.0 A o total de amostras do conjunto e o total de amostras de um agrupamento final B o total de amostras do conjunto e o total de amostras de uma classe Você assinalou essa alternativa (B) Você acertou! Justificativa: Na raiz da árvores de decisão se considera todo o conjunto de dados que vai sendo dividido e nas folhas aparecem todas as instâncias que se enquadram naquela categoria. C o total de amostras de treino e o total de amostras de uma classe D metade das amostras do conjunto e o total de amostras de uma classe E o total de amostras que o modelo suporta e o total de amostras de uma classe Questão 5/10 - Inteligência Artificial Aplicada Você necessita executar o treinamento de um modelo de aprendizagem. Para isso você coletou uma quantidade considerável de dados, e os dividiu em duas partes: uma para treino e outra para testes. Ao consultar um colega mais experiente sobre o processo de treinamento, ele perguntou se você havia executado a etapa de preparação dos dados. Valendo-se dos seus conhecimento de aprendizagem de máquina você ponderou sobre o conselho do seu colega e: Nota: 10.0 A não executou a fase de preparação pois ela não é necessária B resolveu executar uma fase de preparação, pois ela é importante Você assinalou essa alternativa (B) Você acertou! Justificativa: Os dados utilizados no processo de treinamento e a sua preparação são de extrema importância em processos de aprendizagem supervisionada. Assim, sempre deve ser feita uma fase de preparação dos dados para uma obtenção de melhores resultados. C não executou uma fase de preparação, pois a quantidade de dados é suficiente D executou a fase de preparação apenas nos dados de treino E executou a fase de preparação apenas nos dados de teste Questão 6/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a explanação de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um dos membros da equipe gostaria de retirar um parâmetro, que aparentemente não faz nada. O código em questão era: mlp_clf = MLPClassifier(warm_start=True, max_iter=500, hidden_layer_sizes=(50,50), learning_rate = 'adaptive') E o parâmetro a ser eliminado era: learning_rate = 'adaptive' Contudo este membro não possui conhecimento de métodos de aprendizagem de máquina e recorreu a você para o explicasse da importância desse parâmetro. De acordo com os seus conhecimentos de aprendizagem de máquina e de treinamento de modelos do tipo perceptron de múltiplas camadas, esse parâmetro: Nota: 10.0 A deve ser eliminado, pois atrapalha B deve ser mantido, pois determina como o modelo aprende Você assinalou essa alternativa (B) Você acertou! Justificativa: O parâmetro learning_rate diz respeito à velocidade com que o modelo aprende, por meio da determinar da forma como são feitos os incrementos nos pesos dos neurônios. C deve ser corrigido, pois está errado D pode ser mantido ou excluído, não faz diferença E não serve para esse tipo de modelo Questão 7/10 - Inteligência Artificial Aplicada Você necessita executar o treinamento de um modelo de aprendizagem, porém a quantidade de dados disponíveis é muito pequena e não há como obter novos dados. Valendo-se dos seus conhecimento de aprendizagem de máquina, para conseguir executar o treinamento do modelo você deverá: Nota: 10.0 A utilizar uma estratégia de validação cruzada Você assinalou essa alternativa (A) Você acertou! Justificativa: Quando a quantidade de dados é muito pequena é aconselhável utilizar umprocesso de validação cruzada, onde se divide o conjunto de treino em n partes, e n-1 partes são utilizadas para treino e 1 parte é utilizada para testes. Esse processo deve ser repetido de forma que todas as partes, possam pelo menos uma vez serem utilizadas como teste e o processo de aprendizagem utilizando as n partes seja cumulativo. B utilizar os dados na proporção 80-20 C utilizar os dados na proporção 50-50 D treinar e testar com os mesmos dados E utilizar todos os dados para treino e não testar Questão 8/10 - Inteligência Artificial Aplicada Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas foi a explanação de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina. Um modelo de árvore de decisão estava apresentando resultados muito ruins, errando grande parte das predições. O modelo foi definido usando o seguinte código: from sklearn import tree clf = tree.DecisionTreeClassifier(criterion = "gini", splitter = "best", max_depth = 5) Analisando melhor os nós e folhas gerados no processo, que o modelo não estava realizando divisões suficientes que permitissem separar bem as categorias. Para obter melhores resultados com esse modelo você sugere que a definição dele seja feita da alterando o parâmetro: Nota: 10.0 A max_depth para 10 Você assinalou essa alternativa (A) Você acertou! Justificativa: Para obter um número maior de divisões da árvore de decisões deve-se aumentar a sua profundidade através do parâmetro max_depth. B max_depth para 1 C max_depth para 4 D splitter para maximum E splitter para None Questão 9/10 - Inteligência Artificial Aplicada “Após a extração e seleção de atributos, os vetores de atributos servem como entradas para os métodos de aprendizagem de máquina. Esses métodos utilizam as informações fornecidas para criar um conhecimento sobre como os dados fornecidos estão organizados e distribuídos. A escolha do método que será utilizado, assim como no caso dos atributos, depende do problema.” (Material impresso da Aula 1 – Tema 4). Sobre tipos de aprendizagem é correto afirmar: Nota: 10.0 A Aprendizagem supervisionada é aquela que se assemelha a escolha de uma caminho em grafos. Sempre que fazemos uma busca em profundidade se obtém a completitude ótima B Machine Learning pode ser compreendida como um conjunto de técnicas ou métodos que permitem às máquinas aprender por meio da visão computacional. C A aprendizagem por reforço é um tipo de machine learning voltado a redes neureais naturais baseadas no Perceptron de Rosemblatt. D Os métodos de aprendizagem supervisionada são aqueles cujos dados fornecidos para o processo de aprendizagem e incluem exemplos com a identificação da solução desejada Você assinalou essa alternativa (D) Você acertou! Conforme Aula 1 Tema 4.1. Questão 10/10 - Inteligência Artificial Aplicada “A inferência Bayesiana permite uma eficaz filtragem preditiva de mensagens através de palavras-chave com um número reduzido de falso positivos. Definindo um limiar conservador ainda assim mantêm-se grande parte das mensagens de spam fora da caixa de entrada, sendo bastante improvável que uma mensagem seja erroneamente enviada à caixa de spam; o que seria impossível com filtros simples. Para que o filtro possa funcionar corretamente é necessário que se tenha um bom banco de dados para a inferência das probabilidades, com uma amostragem considerável de mensagens que sejam e que não sejam spam.” Disponível em <https://pt.wikipedia.org/>. Acesso em 19/04/2021. Muitos programas de e-mail eletrônico online, quando marcam um mensagem como spam solicitam ao usuário que confirme se a ação de marcação daquele e-mail como spam está correta ou não. Considerando as informações acima e valendo-se do seu conhecimento de treinamento de modelos de aprendizagem, quando você confirma que a marcação do sistema anti-spam está correta, na verdade você está: Nota: 10.0 A apenas movendo um e-mail para o local correto B organizando melhor a caixa de e-mails C ajudando a melhorar o modelo de detecção de spam Você assinalou essa alternativa (C) Você acertou! Justificativa: O processo citado serve para validar o resultado do modelo. Assim, a informação da confirmação ou rejeição da marcação feita pelo sistema anti-spam é utilizada para novos treinamentos, permitindo a melhora do modelo. D dando uma nota para o modelo utilizado E permitindo que os spam sejam apagados