Baixe o app para aproveitar ainda mais
Prévia do material em texto
13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 1/14 Avaliação Online 2 Entrega 14 jun em 23:59 Pontos 20 Perguntas 10 Disponível 8 jun em 0:00 - 14 jun em 23:59 7 dias Limite de tempo 120 Minutos Tentativas permitidas 2 Instruções Histórico de tentativas Tentativa Tempo Pontuação MAIS RECENTE Tentativa 1 120 minutos 8 de 20 As respostas corretas estarão disponíveis em 15 jun em 0:00. Pontuação desta tentativa: 8 de 20 Enviado 13 jun em 17:49 Esta tentativa levou 120 minutos. Leia com atenção as orientações abaixo antes de iniciar esta prova: Serão permitidas duas tentativas para realizar esta avaliação, prevalecendo a maior nota. Programe-se para realizar suas avaliações com tranquilidade, pois você terá 120 minutos cronometrados (por tentativa) para conclusão e envio das respostas. Ao iniciar a avaliação o cronômetro não para, independentemente da plataforma estar aberta ou não; Durante a realização da prova: Será exibido uma questão por vez, podendo “Avançar” ou “Voltar” quando necessário dentro do período da tentativa; A tentativa somente será contabilizada após clicar no botão “Enviar”. Fazer o teste novamente 2 / 2 ptsPergunta 1 A respeito da Matriz de Confusão, considere as asserções abaixo: I - A Matriz de Confusão recebe esse nome porque é necessária muita atenção para o seu entendimento. II - A Matriz de Confusão, para ser obtida, é necessário que o desempenho do classificador seja calculado a partir do conjunto de dados de treinamento. III - A Matriz de Confusão que melhor retrata o desempenho do classificador deve ser obtida pela aplicação do classificador sobre o conjunto de dados de teste. IV - A Matriz de Confusão tem em cada uma de suas células a média https://newtonpaiva.instructure.com/courses/11634/quizzes/26202/history?version=1 https://newtonpaiva.instructure.com/courses/11634/quizzes/26202/take?user_id=14567 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 2/14 do resultado do cálculo do desempenho do classificador sobre os conjuntos de dados de treinamento e de teste. Sobre essas asserções, escolha a alternativa abaixo que melhor retrata o julgamento sobre a veracidade delas: II e IV são verdadeiras. I e III são falsas. III e IV são verdadeiras. I e II são falsas. Somente a II é verdadeira. I, III e IV são falsas. Somente a IV é verdadeira. I, II e III são falsas. Somente a III é verdadeira. I, II e IV são falsas. A Matriz de Confusão que melhor retrata o desempenho do classificador deve ser obtida pela aplicação do classificador sobre o conjunto de dados de teste, de forma que o classificador é obtido pelos dados de treinamento, ou seja, o aprendizado ocorre pelos dados de treinamento para verificar o desempenho, ou seja, se houve realmente aprendizado ou se o classificador simplesmente decorou os dados a validação, usando a Matriz de Confusão, é feita com os dados de treinamento, como apresentado na unidade 4, tópico 3. 0 / 2 ptsPergunta 2IncorretaIncorreta O aprendizado de máquina supervisionado é uma classe de problemas de aprendizado no qual se procura inferir o valor da variável dependente a partir das variáveis independentes. Considere as asserções abaixo: I - Determinar a doença de um paciente com base nos resultados dos exames. II - Determinar as características de compras dos consumidores de um supermercado. III - Determinar a direção de um robô em um ambiente com base nas respostas dos sensores. IV - Determinar o risco de intrusão em uma rede de computadores com base nos ataques anteriores dos hackers. Em relação às asserções anteriores, quais dizem respeito ao aprendizado de máquina supervisionado? 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 3/14 II e IV. II e III. I e IV. III e IV. I e III. 0 / 2 ptsPergunta 3IncorretaIncorreta Considere o seguinte conjunto de dados abaixo como sendo o resultado da classificação de um conjunto de testes ao passar por um classificador supervisionado. Tempo Temperatura Vento Pedalar Classificador Sol Calor Fraco Sim Sim Sol Calor Forte Não Sim Nublado Calor Fraco Sim Sim Chuva Amena Fraco Sim Não Chuva Frio Fraco Não Não Chuva Frio Forte Não Sim Nublado Frio Forte Sim Sim Sol Amena Fraco Não Não Nublado Frio Forte Não Não Chuva Amena Fraco Sim Sim 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 4/14 Escolha a alternativa que melhor representa a Matriz de Confusão que representa o cenário anterior: Classe esperada Sim Não Classe original Sim 4 1 Não 2 3 Classe esperada Sim Não Classe predita Sim 3 2 Não 1 4 Classe esperada Sim Não Classe predita Sim 4 1 Não 2 3 Classe classificador Sim Não Classe predita Sim 3 2 Não 1 4 Classe esperada Sim Não Classe predita Não 4 1 Sim 2 3 0 / 2 ptsPergunta 4IncorretaIncorreta Considere o conjunto de dados a seguir como sendo o conjunto de dados original a ser utilizado por um algoritmo de aprendizado de máquina supervisionado: Dia Tempo Temperatura Vento Pedalar D1 Sol Calor Fraco Sim D2 Sol Calor Forte Não D3 Nublado Calor Fraco Sim D4 Chuva Amena Fraco Sim 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 5/14 D5 Chuva Frio Fraco Não D6 Chuva Frio Forte Não D7 Nublado Frio Forte Sim D8 Sol Amena Fraco Não D9 Nublado Frio Forte Não D10 Chuva Amena Fraco Sim Considerando o que já foi estudado e a prática usual sobre os conjuntos de dados de treinamento e de teste, uma representação deles pode ser encontrada em: Conjunto de treinamento Dia Tempo Temperatura vento Pedalar D1 Sol Calor Fraco Sim D2 Sol Calor Forte Não D3 Nublado Calor Fraco Sim D4 Chuva Amena Fraco Sim D5 Chuva Frio Fraco Não D6 Chuva Frio Forte Não D7 Nublado Frio Forte Sim D8 Sol Amena Fraco Não D9 Nublado Frio Forte Não D10 Chuva Amena Fraco Sim Conjunto de teste Dia Tempo Temperatura vento Pedalar D1 Sol Calor Fraco Sim D2 Sol Calor Forte Não D3 Nublado Calor Fraco Sim D4 Chuva Amena Fraco Sim D5 Chuva Frio Fraco Não D6 Chuva Frio Forte Não D7 Nublado Frio Forte Sim D8 Sol Amena Fraco Não D9 Nublado Frio Forte Não D10 Chuva Amena Fraco Sim 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 6/14 Conjunto de treinamento Dia Tempo Temperatura vento Pedalar D3 Nublado Calor Fraco Sim D4 Chuva Amena Fraco Sim D5 Chuva Frio Fraco Não D6 Chuva Frio Forte Não D7 Nublado Frio Forte Sim D8 Sol Amena Fraco Não D9 Nublado Frio Forte Não D10 Chuva Amena Fraco Sim Conjunto de teste Dia Tempo Temperatura vento Pedalar D1 Sol Calor Fraco Sim D2 Sol Calor Forte Não Conjunto de treinamento Dia Tempo Temperatura vento Pedalar D1 Sol Calor Fraco Sim D3 Nublado Calor Fraco Sim D4 Chuva Amena Fraco Sim D7 Nublado Frio Forte Sim D10 Chuva Amena Fraco Sim Conjunto de teste Dia Tempo Temperatura vento Pedalar D2 Sol Calor Forte Não D5 Chuva Frio Fraco Não D6 Chuva Frio Forte Não D8 Sol Amena Fraco Não D9 Nublado Frio Forte Não 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 7/14 Conjunto de treinamento Dia Tempo Temperatura vento Pedalar D1 Sol Calor Fraco Sim D2 Sol Calor Forte Não D3 Nublado Calor Fraco Sim D4 Chuva Amena Fraco Sim D5 Chuva Frio Fraco Não D6 Chuva Frio Forte Não D7 Nublado Frio Forte Sim D8 Sol Amena Fraco Não Conjunto de teste Dia Tempo Temperatura vento Pedalar D1 Sol Calor Fraco Sim D2 Sol Calor ForteNão Conjunto de treinamento Dia Tempo Temperatura vento Pedalar D1 Sol Calor Fraco Sim D2 Sol Calor Forte Não D3 Nublado Calor Fraco Sim D4 Chuva Amena Fraco Sim D5 Chuva Frio Fraco Não Conjunto de teste Dia Tempo Temperatura vento Pedalar D6 Chuva Frio Forte Não D7 Nublado Frio Forte Sim D8 Sol Amena Fraco Não D9 Nublado Frio Forte Não D10 Chuva Amena Fraco Sim 0 / 2 ptsPergunta 5IncorretaIncorreta A presença de dados ausentes em conjuntos de dados é algo presente na maior parte das informações provenientes do mundo real. É possível remediar a existência de dados ausentes utilizando técnicas estatísticas, como a média, a mediana e a moda. Marque a alternativa INCORRETA a respeito das razões que propiciam a ocorrência de dados ausentes: 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 8/14 Campos não obrigatórios que, ao serem preenchidos, são deixados em branco ou zerados, como idade, endereço, renda etc. Campos obrigatórios, mas sem a correta consistência que obrigue a correta captura do preenchimento (nome completo, CPF, RG etc.). Campos que dependem de uma ação temporal, por exemplo, os dados de navegação em um e-commerce, em que o nome do produto adquirido e o valor somente existirão no conjunto de dados se o cliente fizer a compra, senão eles estarão em branco até que o referido evento ocorra. Campos com opção correta faltante, por exemplo, uma lista de cidades onde não consta uma delas em particular. A pessoa, ao preencher e notar que não tem a sua cidade, provavelmente irá deixar em branco. Campos que possuam cálculo automático dependente de outros campos do conjunto de dados e que o sistema aleatoriamente possa estar deixando de executar essa tarefa, que fica pré-agendada no sistema. 0 / 2 ptsPergunta 6IncorretaIncorreta Analise o trecho de código a seguir em Python, desenvolvido dentro do Jupyter Notebook. Há uma informação básica a respeito do DataFrame e também alguns dados estatísticos com relação à coluna ‘Valor Compra’ do mesmo DataFrame. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 9/14 Fonte: elaborado pelo autor. Após a sua análise, considere as asserções a seguir: I. A contagem de valores do campo ‘Valor Compra’ é inferior ao total de linhas do DataFrame, indicando que na coluna ‘Valor Compra’ há exatamente 28 valores ausentes. II. Supondo dados expressos em moeda brasileira, o valor médio das compras feitas presentes nesse DataFrame é de aproximadamente R$3.131,60. III. Supondo dados expressos em moeda brasileira, o valor mais comum (standard, std) para a coluna ‘Valor Compra’ é de aproximadamente R$1.279,90. As asserções corretas são: Todas estão incorretas. Apenas II e III. Apenas I e II. Apenas I e III. Todas estão corretas. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 10/14 2 / 2 ptsPergunta 7 O trecho de código em Python a seguir, desenvolvido dentro do Jupyter Notebook, está relacionado ao tratamento de dados ausentes dentro de um DataFrame. Fonte: elaborado pelo autor. Considerando os valores mostrados dentro do Jupyter Notebook para o método df.isnull().sum() e, na sequência, a chamada do método df.dropna(), pode-se afirmar que o DataFrame resultante: Terá os mesmos dados do DataFrame inicial, exceto que as linhas que continham algum tipo de valor ausente não estarão mais presentes. Terá somente os dados cujas linhas do DataFrame contenham ao menos um valor ausente. Terá somente a coluna ’Cliente’ do DataFrame inicial, já que as demais serão removidas por conter dados ausentes. Terá os mesmos dados do DataFrame inicial, exceto a coluna ‘Cliente’, porque não contém valores ausentes. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 11/14 Terá os mesmos dados do DataFrame inicial, exceto: as 14 linhas que continham ‘Região’ sem informação; as 16 linhas que continham ‘Mês’sem informação; e as 28 linhas que continham ‘Valor Compra’ sem informação, totalizando, portanto, 58 linhas removidas do DataFrame inicial. O método dropna() remove do DataFrame todas as linhas que contêm ao menos algum valor ausente (NaN) e retorna um novo DataFrame com essa característica. Assim, o novo DataFrame é exatamente o mesmo do original, exceto pela supressão das linhas com algum valor ausente. Não se pode deduzir o total de linhas a serem removidas somente com as informações prestadas, porque uma mesma linha pode conter mais que um valor ausente, então, a soma dos valores ausentes não é necessariamente o total de linhas a serem removidas. Reveja esses conceitos na unidade 5, tópico 1.1. 2 / 2 ptsPergunta 8 Ao definir os hiperparâmetros para a construção de uma árvore de decisão, a biblioteca sklearn (scikit-learn), através do construtor DecisionTreeClassifier(), admite uma série de parâmetros, entre eles o max_depth, que serve para regular a profundidade máxima que uma árvore pode atingir. A respeito de como esse hiperparâmetro pode afetar o desempenho do classificador, julgue as asserções abaixo: I. Quanto maior o valor de max_depth, melhor será o desempenho da árvore de decisão para ficar bem ajustada aos dados. II. Um valor muito pequeno de max_depth pode fazer com que a árvore de decisão não tenha nós suficientes para adquirir o conhecimento do conjunto de dados e sofrerá com o fenômeno do underfitting. III. Por padrão, é melhor utilizar max_depth = 10, que é um valor praticado pela comunidade acadêmica e profissional por produzir sempre árvores de decisão com o máximo desempenho. Pode-se afirmar que são falsas as asserções: II e III. I e III. I e II. Somente II. 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 12/14 Somente III. O desempenho de uma árvore de decisão está intimamente ligado à profundidade, que normalmente é um parâmetro automático que o próprio indutor decide qual o melhor. Entretanto, ajustes manuais são necessários porque o indutor olha apenas para os dados de treinamento e não os de testes a fim de evitar overfitting. Então, profundidades elevadas podem levar a esse fenômeno (overfitting), o que não é bom e, por isso, a asserção I é falsa. Não existe padrão para configurar a profundidade da árvore porque é uma questão muito sensível aos dados, por isso a asserção III é falsa. Árvores de decisão rasas podem não aprender toda a informação dos dados, causando underfitting, por isso a asserção (II) é verdadeira. Reveja esse conceito na unidade 6, tópico 3. 0 / 2 ptsPergunta 9IncorretaIncorreta As avaliações do modelo por k-fold cross-validation e leave-one out são conhecidas por serem validações cruzadas de forma que os dados são divididos em partições que se revezam para serem usadas no processo de treinamento e teste do classificador. A respeito dessas duas avaliações cruzadas, podemos dizer que a semelhança entre elas: É que a avaliação por k-fold cross-validation divide os dados em k partições enquanto a avaliação por leave-one out divide os dados em n partições, sendo n o número de exemplos do conjunto de dados. É que a avaliação por k-fold cross-validation divide os dados em k partições enquanto a avaliação por leave-one out divide os dados em (k-1) partições. É que a avaliação por k-fold cross-validation divide os dados em (k-1) partições enquanto a avaliação por leave-one out divide os dados em k partições. É que a avaliação por k-fold cross-validation divide os dados em k partições enquanto a avaliação por leave-one out divide os dados em n partições, sendo n igual a k partições menos 1 exemplo. 13/06/2021 AvaliaçãoOnline 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 13/14 É que a avaliação por k-fold cross-validation divide os dados em k partições enquanto a avaliação por leave-one out divide os dados em (n-1) partições, sendo n o número de exemplos do conjunto de dados.k 2 / 2 ptsPergunta 10 A validação do modelo utilizando K-fold cross-validation é uma estimativa de erro bem aceita por produzir uma estatística confiável e normalizada em relação à predição de exemplos futuros. A respeito das partições, é correto afirmar que: Cada exemplo do conjunto de dados participa K vezes das partições de treinamento e teste. Cada exemplo é uma partição individual que participa, portanto, (n) vezes do processo de treinamento e teste, em que n é o número de linhas do conjunto de dados. K Cada exemplo do conjunto de dados participa uma única vez da partição de treinamento e (K-1) vezes da partição de teste. Cada exemplo do conjunto de dados participa uma única vez da partição de teste e (K-1) vezes da partição de treinamento. Cada exemplo é uma partição individual que participa, portanto, (K) vezes do processo de treinamento e teste, em que n é o número de linhas do conjunto de dados. n A avaliação por k fold cross-validation divide o conjunto de dados em K partições iguais e sem repetição dos dados entre as partições. O classificador é testado K vezes sobre as partições de modo que em cada iteração o classificador é treinado sobre (K-1) partições e testado sobre uma única partição. Reveja esse conceito na unidade 6, tópico 4. Pontuação do teste: 8 de 20 13/06/2021 Avaliação Online 2: G.MAI.FIAR.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/11634/quizzes/26202 14/14
Compartilhar