Baixe o app para aproveitar ainda mais
Prévia do material em texto
13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 1/14 Avaliação Online 2 Entrega 14 jun em 23:59 Pontos 20 Perguntas 10 Disponível 8 jun em 0:00 - 14 jun em 23:59 7 dias Limite de tempo 120 Minutos Tentativas permitidas 2 Instruções Histórico de tentativas Tentativa Tempo Pontuação MANTIDO Tentativa 2 15 minutos 18 de 20 MAIS RECENTE Tentativa 2 15 minutos 18 de 20 Tentativa 1 42 minutos 12 de 20 As respostas corretas estarão disponíveis em 15 jun em 0:00. Pontuação desta tentativa: 18 de 20 Enviado 13 jun em 11:27 Esta tentativa levou 15 minutos. Leia com atenção as orientações abaixo antes de iniciar esta prova: Serão permitidas duas tentativas para realizar esta avaliação, prevalecendo a maior nota. Programe-se para realizar suas avaliações com tranquilidade, pois você terá 120 minutos cronometrados (por tentativa) para conclusão e envio das respostas. Ao iniciar a avaliação o cronômetro não para, independentemente da plataforma estar aberta ou não; Durante a realização da prova: Será exibido uma questão por vez, podendo “Avançar” ou “Voltar” quando necessário dentro do período da tentativa; A tentativa somente será contabilizada após clicar no botão “Enviar”. 2 / 2 ptsPergunta 1 Considere o seguinte conjunto de dados abaixo como sendo o resultado da classificação de um conjunto de testes ao passar por um classificador supervisionado. https://newtonpaiva.instructure.com/courses/11634/quizzes/26202/history?version=2 https://newtonpaiva.instructure.com/courses/11634/quizzes/26202/history?version=2 https://newtonpaiva.instructure.com/courses/11634/quizzes/26202/history?version=1 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 2/14 Tempo Temperatura Vento Pedalar Classificador Sol Calor Fraco Sim Sim Sol Calor Forte Não Sim Nublado Calor Fraco Sim Sim Chuva Amena Fraco Sim Não Chuva Frio Fraco Não Não Chuva Frio Forte Não Sim Nublado Frio Forte Sim Sim Sol Amena Fraco Não Não Nublado Frio Forte Não Não Chuva Amena Fraco Sim Sim Escolha a alternativa que melhor representa a Matriz de Confusão que representa o cenário anterior: Classe classificador Sim Não Classe predita Sim 3 2 Não 1 4 Classe esperada Sim Não Classe original Sim 4 1 Não 2 3 Classe esperada Sim Não Classe predita Não 4 1 Sim 2 3 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 3/14 Classe esperada Sim Não Classe predita Sim 3 2 Não 1 4 Classe esperada Sim Não Classe predita Sim 4 1 Não 2 3 Como apresentado na unidade 4, tópico 3, a classe original dada ao algoritmo de aprendizado de máquina supervisionado é chamado de classe esperada, rótulo, classe original, label, variável dependente, consequência etc. Já a classe calculada pelo algoritmo de aprendizado de máquina supervisionado é chamada de classe predita, calculada, descoberta etc. Dessa forma: • VP = verdadeiro positivo, ou seja, número de exemplos para os quais classe predita = classe esperada = “Sim”; • VN = verdadeiro negativo, ou seja, número de exemplos para os quais classe predita = classe esperada = “Não”; • FP = falso positivo, ou seja, número de exemplos para os quais classe predita = “Sim”, mas a classe esperada = “Não”; • FN = falso negativo, ou seja, número de exemplos para os quais classe predita = “Não”, mas a classe esperada = “Sim”. 2 / 2 ptsPergunta 2 O aprendizado de máquina supervisionado é uma classe de problemas de aprendizado no qual se procura inferir o valor da variável dependente a partir das variáveis independentes. Considere as asserções abaixo: I - Determinar a doença de um paciente com base nos resultados dos exames. II - Determinar as características de compras dos consumidores de um supermercado. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 4/14 III - Determinar a direção de um robô em um ambiente com base nas respostas dos sensores. IV - Determinar o risco de intrusão em uma rede de computadores com base nos ataques anteriores dos hackers. Em relação às asserções anteriores, quais dizem respeito ao aprendizado de máquina supervisionado? III e IV. II e IV. I e III. II e III. I e IV. No aprendizado de máquina supervisionado, a característica básica que o define é a relação existente entre uma variável dependente e outras variáveis independentes, sendo o trabalho do algoritmo estabelecer de forma computacional essa relação de causa-consequência, como apresentado na unidade 4, tópico 1.1. 0 / 2 ptsPergunta 3IncorretaIncorreta O aprendizado de máquina não supervisionado é uma classe de problemas de aprendizado na qual se procura estabelecer agrupamentos de informações que compartilham das mesmas características. Considere as asserções abaixo: I - Determinar grupos de pacientes com base nos resultados dos exames. II - Determinar as características de compras dos consumidores de um supermercado, agregando-os. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 5/14 III - Determinar a direção de um carro autônomo em uma rodovia com base nas respostas dos sensores. IV - Determinar o risco de intrusão em uma rede de computadores com base nos ataques anteriores dos hackers. Em relação às asserções anteriores, quais dizem respeito ao aprendizado de máquina não supervisionado? I e II. II e IV. I e III. III e IV. II e III. 2 / 2 ptsPergunta 4 Fonte: adaptado de https://encrypted-tbn0.gstatic.com/images? 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 6/14 q=tbn%3AANd9GcTCkQ7P_O-rTJYb586nhxz0UKSEaCTwI_nQ4Q&usqp=CAU Acesso em: 23 jul. 2020. A ilustração acima possui duas situações com um veículo autônomo ingressando em uma rotatória. Um veículo ingressou pela esquerda e acabou indo parar no canteiro da rotatória. O outro veículo (poderia ser o mesmo em outra situação) já adentrou na rotatória, no que parece estar correto até aquele momento. Nas duas situações há uma sinalização de reprova ou aprovação a depender do sucesso da direção do veículo até aquele ponto. Qual a alternativa que melhor descreve o tipo de aprendizado sendo utilizado? Aprendizado supervisionado, porque existe uma variável simbolizada pelos sinais de aprovação e rejeição, indicando o caminho correto a ser percorrido pelo veículo autônomo. Aprendizado por reforço, porque existe uma variável simbolizada pelos sinais de aprovação e rejeição indicando o caminho a ser percorrido pelo veículo autônomo. Aprendizado supervisionado, porque, diante da ação tomada pelo agente inteligente, tem-se um retorno de rejeição ou aprovação relativo às consequências decorrentes daquela ação. Aprendizado por reforço, porque, diante da ação tomada pelo agente inteligente, tem-se um estímulo de rejeição ou aprovação relativo às consequências decorrentes daquela ação. Aprendizado não supervisionado, porque o veículo autônomo irá seguir o mesmo caminho de outros veículos que já passaram pela rotatória e que são do mesmo grupo indicado pelos sinais de aprovação e rejeição. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 7/14 No aprendizado por reforço em aprendizado de máquina, derivado da teoria de aprendizagem criada pelo psicólogo behaviorista B. F. Skinner, o elemento-chave é o estímulo- resposta, no qual um agente produz respostas comportamentais a depender de estímulos positivos ou negativos, os quais,por sua vez, vão gerar novas respostas em um ciclo, de acordo com a unidade 4, tópico 1.4. 2 / 2 ptsPergunta 5 Nos conjuntos de dados, é preciso observar, além da distribuição dos dados, a ordem de grandeza das variáveis (colunas) que os contêm, em especial quando houver discrepância entre as próprias variáveis de um mesmo conjunto de dados. Para remediar isso, é possível empregar técnicas de padronização e normalização. Se você utilizar uma técnica de normalização baseada em Min-Max, em uma determinada coluna, o que se pode afirmar em relação aos valores da média e do desvio padrão mínimo e máximo? Nada se pode afirmar, porque não se conhece a distribuição dos dados. O mínimo será 0 e o máximo será 1. O mínimo será o valor da média menos o desvio padrão e o máximo será o valor da média mais o desvio padrão. A média será igual a 1 e o desvio padrão será igual a 0. A média será igual a 0 e o desvio padrão será igual a 1. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 8/14 Pela própria característica da fórmula do Min-Max, a normalização é feita de forma que os novos valores são calculados dentro de um regime intervalar entre o mínimo e o máximo da distribuição. Isso faz com que os novos valores fiquem sempre dentro do intervalo [0,1], ou seja, mínimo = 0 e máximo = 1. Reveja esses conceitos na unidade 5, tópico 2. 2 / 2 ptsPergunta 6 A presença de dados ausentes em conjuntos de dados é algo presente na maior parte das informações provenientes do mundo real. É possível remediar a existência de dados ausentes utilizando técnicas estatísticas, como a média, a mediana e a moda. Marque a alternativa INCORRETA a respeito das razões que propiciam a ocorrência de dados ausentes: Campos não obrigatórios que, ao serem preenchidos, são deixados em branco ou zerados, como idade, endereço, renda etc. Campos obrigatórios, mas sem a correta consistência que obrigue a correta captura do preenchimento (nome completo, CPF, RG etc.). Campos com opção correta faltante, por exemplo, uma lista de cidades onde não consta uma delas em particular. A pessoa, ao preencher e notar que não tem a sua cidade, provavelmente irá deixar em branco. Campos que possuam cálculo automático dependente de outros campos do conjunto de dados e que o sistema aleatoriamente possa estar deixando de executar essa tarefa, que fica pré-agendada no sistema. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 9/14 Campos que dependem de uma ação temporal, por exemplo, os dados de navegação em um e-commerce, em que o nome do produto adquirido e o valor somente existirão no conjunto de dados se o cliente fizer a compra, senão eles estarão em branco até que o referido evento ocorra. A existência de dados ausentes sempre envolve uma questão de modelagem do sistema para fazer a aquisição das informações, seja por negligência de validação dos campos e/ou pela coleta esparsa em tabelas pré-formatadas. Os sistemas de informação simplesmente vão fazer o que o programador mandou e não o que ele desejaria que pudesse ser feito, já que os sistemas não agem por conta própria e de forma aleatória. Reveja esses conceitos na unidade 5, tópico 1.1. 2 / 2 ptsPergunta 7 O trecho de código em Python a seguir, desenvolvido dentro do Jupyter Notebook, está relacionado ao tratamento de dados ausentes dentro de um DataFrame. Fonte: elaborado pelo autor. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 10/14 Considerando os valores mostrados dentro do Jupyter Notebook para o método df.isnull().sum() e, na sequência, a chamada do método df.dropna(), pode-se afirmar que o DataFrame resultante: Terá somente a coluna ’Cliente’ do DataFrame inicial, já que as demais serão removidas por conter dados ausentes. Terá somente os dados cujas linhas do DataFrame contenham ao menos um valor ausente. Terá os mesmos dados do DataFrame inicial, exceto a coluna ‘Cliente’, porque não contém valores ausentes. Terá os mesmos dados do DataFrame inicial, exceto: as 14 linhas que continham ‘Região’ sem informação; as 16 linhas que continham ‘Mês’ sem informação; e as 28 linhas que continham ‘Valor Compra’ sem informação, totalizando, portanto, 58 linhas removidas do DataFrame inicial. Terá os mesmos dados do DataFrame inicial, exceto que as linhas que continham algum tipo de valor ausente não estarão mais presentes. O método dropna() remove do DataFrame todas as linhas que contêm ao menos algum valor ausente (NaN) e retorna um novo DataFrame com essa característica. Assim, o novo DataFrame é exatamente o mesmo do original, exceto pela supressão das linhas com algum valor ausente. Não se pode deduzir o total de linhas a serem removidas somente com as informações prestadas, porque uma mesma linha pode conter mais que um valor ausente, então, a soma dos valores ausentes não é necessariamente o total de linhas a serem removidas. Reveja esses conceitos na unidade 5, tópico 1.1. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 11/14 2 / 2 ptsPergunta 8 Ao definir os hiperparâmetros para a construção de uma árvore de decisão, a biblioteca sklearn (scikit-learn), através do construtor DecisionTreeClassifier(), admite uma série de parâmetros, entre eles o max_depth, que serve para regular a profundidade máxima que uma árvore pode atingir. A respeito de como esse hiperparâmetro pode afetar o desempenho do classificador, julgue as asserções abaixo: I. Quanto maior o valor de max_depth, melhor será o desempenho da árvore de decisão para ficar bem ajustada aos dados. II. Um valor muito pequeno de max_depth pode fazer com que a árvore de decisão não tenha nós suficientes para adquirir o conhecimento do conjunto de dados e sofrerá com o fenômeno do underfitting. III. Por padrão, é melhor utilizar max_depth = 10, que é um valor praticado pela comunidade acadêmica e profissional por produzir sempre árvores de decisão com o máximo desempenho. Pode-se afirmar que são falsas as asserções: I e III. I e II. Somente III. Somente II. II e III. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 12/14 O desempenho de uma árvore de decisão está intimamente ligado à profundidade, que normalmente é um parâmetro automático que o próprio indutor decide qual o melhor. Entretanto, ajustes manuais são necessários porque o indutor olha apenas para os dados de treinamento e não os de testes a fim de evitar overfitting. Então, profundidades elevadas podem levar a esse fenômeno (overfitting), o que não é bom e, por isso, a asserção I é falsa. Não existe padrão para configurar a profundidade da árvore porque é uma questão muito sensível aos dados, por isso a asserção III é falsa. Árvores de decisão rasas podem não aprender toda a informação dos dados, causando underfitting, por isso a asserção (II) é verdadeira. Reveja esse conceito na unidade 6, tópico 3. 2 / 2 ptsPergunta 9 A validação do modelo utilizando K-fold cross-validation é uma estimativa de erro bem aceita por produzir uma estatística confiável e normalizada em relação à predição de exemplos futuros. A respeito das partições, é correto afirmar que: Cada exemplo é uma partição individual que participa, portanto, (K) vezes do processo de treinamento e teste, em que n é o número de linhas do conjunto de dados. n Cada exemplo do conjunto de dados participa uma única vez da partição de teste e (K-1) vezes da partição de treinamento. Cada exemplo do conjunto de dados participa uma única vez da partição de treinamento e (K-1) vezes da partição de teste. Cadaexemplo do conjunto de dados participa K vezes das partições de treinamento e teste. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 13/14 Cada exemplo é uma partição individual que participa, portanto, (n) vezes do processo de treinamento e teste, em que n é o número de linhas do conjunto de dados. K A avaliação por k fold cross-validation divide o conjunto de dados em K partições iguais e sem repetição dos dados entre as partições. O classificador é testado K vezes sobre as partições de modo que em cada iteração o classificador é treinado sobre (K-1) partições e testado sobre uma única partição. Reveja esse conceito na unidade 6, tópico 4. 2 / 2 ptsPergunta 10 O overfitting possui uma característica muito marcante quando estamos validando um classificador. Essa característica é fundamental para sabermos se a principal funcionalidade de um classificador está de acordo com seu papel esperado. Então, pense em um caso hipotético em que possa estar ocorrendo overfitting e aponte abaixo o que identificaria corretamente o overfitting no desempenho do um classificador: Não é possível identificar uma situação de overfitting com as informações fornecidas no enunciado da questão. O desempenho do classificador sobre os dados de treinamento é bom, mas muito superior ao desempenho do classificador sobre os dados de teste que não foram previamente vistos. O desempenho do classificador sobre os dados de treinamento é tão ruim quanto o desempenho do classificador sobre os dados de teste que não foram previamente vistos. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 14/14 A situação descrita no enunciado da questão faz remeter ao conceito de underfitting e não de overfitting. O desempenho do classificador sobre os dados de treinamento é tão bom quanto o desempenho do classificador sobre os dados de teste que não foram previamente vistos. Para detectar se está ocorrendo overfitting, basta você comparar o desempenho do classificador sobre os dados de treinamento e comparar o desempenho do mesmo classificador sobre os dados de teste. Se o desempenho sobre os dados de teste for muito pior que sobre os dados de treinamento, significa que o classificador decorou os dados de treinamento, ocorrendo o fenômeno chamado overfitting. Reveja esse conceito na unidade 6, tópico 4. Pontuação do teste: 18 de 20
Compartilhar