Baixe o app para aproveitar ainda mais
Prévia do material em texto
20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 1/16 AV1 Entrega 20 mar em 23:59 Pontos 40 Perguntas 16 Disponível 14 mar em 0:00 - 20 mar em 23:59 7 dias Limite de tempo 120 Minutos Tentativas permitidas 2 Instruções Histórico de tentativas Tentativa Tempo Pontuação MANTIDO Tentativa 2 15 minutos 40 de 40 MAIS RECENTE Tentativa 2 15 minutos 40 de 40 Tentativa 1 95 minutos 37 de 40 Pontuação desta tentativa: 40 de 40 Enviado 20 mar em 21:05 Esta tentativa levou 15 minutos. Leia com atenção as orientações abaixo antes de iniciar esta prova: Esta prova contem 16 perguntas. Serão permitidas duas tentativas para realizar esta avaliação, prevalecendo a maior nota. Programe-se para realizar suas avaliações com tranquilidade, pois você terá 120 minutos cronometrados para conclusão e envio das respostas. Ao iniciar a avaliação o cronômetro não para, independentemente da plataforma estar aberta ou não. Durante a realização da prova: Será exibido uma questão por vez, podendo “Avançar” ou “Voltar” quando necessário dentro do período da tentativa. A tentativa somente será contabilizada após clicar no botão “Enviar”. 2 / 2 ptsPergunta 1 O algoritmo K-Means tem como objetivo: https://newtonpaiva.instructure.com/courses/13744/quizzes/33452/history?version=2 https://newtonpaiva.instructure.com/courses/13744/quizzes/33452/history?version=2 https://newtonpaiva.instructure.com/courses/13744/quizzes/33452/history?version=1 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 2/16 Encontrar agrupamentos rotulados entre os dados e separá-los conforme o número de agrupamentos definidos pelo argumento k. Predizer as diferenças entre os dados e alocá-las conforme o número de cluster passado pela variável k. Encontrar similaridades entre os dados e agrupá-los conforme o número de cluster passado pelo argumento k. Correto!Correto! Encontrar classificadores rotulados entre os dados e juntá-los conforme o valor do argumento k. Predizer as classes de agrupamentos mais próximos do hiperparâmetro K. 2 / 2 ptsPergunta 2 Um analista de IA gerou uma matriz de confusão para um algoritmo de aprendizado de máquina. Ele não vai conseguir calcular: A acurácia do modelo preditivo. A precisão do modelo preditivo. A fórmula do modelo preditivo. Correto!Correto! O F-Score do modelo preditivo. O recall do modelo preditivo. 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 3/16 2 / 2 ptsPergunta 3 Os descritores estatísticos como frequência, medidas de tendência central e medidas de variabilidades são importantes para a análise descritiva de dados em Data Science. Avalie a seguintes afirmações e a relação entre elas I – Um conjunto de dados que apresenta alguns valores ausentes podem ser tratados e preenchidos com medidas de tendência central como média, mediana ou moda PORQUE II – As medidas de tendência central como média, mediana ou moda são ótimas estratégias para se fazer o tratamento de dados ausentes sem que seja preciso o descarte destes dados. A respeito dessas asserções, assinale a opção correta. A asserção I é uma proposição falsa e a II é uma proposição verdadeira. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Correto!Correto! A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. As asserções I e II são proposições falsas. 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 4/16 2 / 2 ptsPergunta 4 A linguagem Python ganhou uma enorme popularidade na área de análise de dados e IA. Avalia as afirmações abaixo sobre Python e a relação entre elas: I – A linguagem Python é muito utilizada em análise de dados devido a sintaxe simples, uso de código enxuto, possuindo importantes bibliotecas como NumPy. PORQUE II – A linguagem Python incorpora diferentes bibliotecas como NumPy utilizadas para executar operações matemáticas e funções integradas para álgebra linear, porém, não incorpora bibliotecas para tratamento de medidas estatísticas como desvio padrão. A respeito dessas asserções, assinale a opção correta. As asserções I e II são proposições falsas. A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. Correto!Correto! A asserção I é uma proposição falsa e a II é uma proposição verdadeira. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. 2 / 2 ptsPergunta 5 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 5/16 Um analista de dados pode identificar os valores outiliers em conjuntos de dados utilizando a técnica de: Histograma. Machine Learning. BoxPlot. Correto!Correto! Simple AI. SciPy. 2 / 2 ptsPergunta 6 Sobre as medidas estatísticas avalie as seguintes afirmações: I. Quando a dispersão dos dados for muito grande então o desvio padrão será grande. II. O segundo quartil é igual a mediana. III. Quando a média é igual ao desvio padrão os dados não estarão dispersos. Estão corretas: Todas. Somente uma delas. II e III somente. I e II somente. Correto!Correto! I e III somente. 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 6/16 2 / 2 ptsPergunta 7 Sobre aprendizado de máquina é correto afirmar que: No aprendizado supervisionado o conjunto de dados devem ser divididos em base de testes e base de treino. Correto!Correto! No aprendizado não supervisionado, existem somente as variáveis dependentes que descrevem os dados. No aprendizado não supervisionado é fundamental rotular os dados. No aprendizado por reforço os algoritmos não precisam de dados. Tanto no aprendizado supervisionado como no não supervisionado o modelo gerado não apresenta predições incorretas. 2 / 2 ptsPergunta 8 Engenheiros de dados e Cientistas de dados tem, em geral, funções diferentes dentro das organizações. Neste contexto, julgue as afirmações que se seguem. I. Engenheiros de dados implementam a infraestrutura necessária para unificar todos os dados e executar os processos do cientista de dados. II. Cientistas de dados devem arquitetar e implementar soluções de sistemas distribuídos e programação paralela para análise de dados. III. Engenheiros de dados aplicam técnicas de aprendizado de máquina (machine learning). 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 7/16 IV. Cientistas de dados aplicam técnicas de aprendizado profundo (deep learning). Assinale a alternativa quem contem a(s) assertiva(s) correta(s): I e IV, somente. Correto!Correto! I, e III, somente. II e IV, somente. II e III, somente. III e IV, somente. 3 / 3 ptsPergunta 9 A mineração de dados é o processo de análise de grandes volumes de dados para descobrir inteligências que ajudem as empresas a resolver problemas, mitigar riscos e aproveitar novas oportunidades. Esse ramo da ciência de dados tem a nomenclatura derivada das semelhanças entre procurar informações valiosas em um grande banco de dados e extrair uma montanha de minério. Considerando as informações sobre mineração de dados, analise as asserções a seguir a respeito dos principais conceitos de mineração de dados. I. Usa aprendizado de máquina. II. Usa dados diretamente dos sistemas de processamentode transações. III. Ajuda os gerentes na tomada de decisões de rotina. IV. Limpeza e preparação de dados. Está correto o que se afirma em: 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 8/16 III e IV. II e III. I e IV. Correto!Correto! I e III. II e IV. Essa alternativa está correta porque limpeza e preparação de dados é uma etapa na qual os dados são transformados em um formulário adequado para análises e processamentos adicionais, como a identificação e a remoção de erros e a falta de dados (dados incompletos). Do mesmo modo, o aprendizado de máquina é um conceito de mineração de dados no qual um programa, usando probabilidades estatísticas, permite aos computadores ter a capacidade de "aprender" sem que sejam explicitamente programados. Você pode ler mais na unidade 1, tópico 3. 3 / 3 ptsPergunta 10 Uma empresa vendedora de produtos de praia deseja analisar a quantidade de vendas do produto bola de praia na cidade de Florianópolis. A empresa deseja analisar as vendas do mês de fevereiro do ano passado realizadas pelo vendedor José Camilo, comparada com os números da receita com o mesmo produto em fevereiro deste ano, também na cidade de Florianópolis. Após esta análise, a empresa fará uma comparação de outras vendas do mesmo produto em Florianópolis no mesmo período com o objetivo de realizar uma previsão de vendas. Considerando o caso apresentado e o conteúdo estudado, assinale a alternativa que indica a melhor ferramenta a ser utilizada por essa empresa para realizar essa ação: Monodimensional Data Analytic. Big Data. Mineração de dados. 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 9/16 Business Intelligence. Ferramentas OLAP. Correto!Correto! Essa alternativa está correta, pois o OLAP (Processamento Analítico Online) é um método de computação que permite aos usuários extrair e consultar dados de maneira fácil e seletiva a fim de analisá-los sob diferentes pontos de vista. As consultas de OLAP geralmente ajudam na análise de tendências, relatórios financeiros, previsão de vendas, orçamento e outros fins de planejamento. Você pode ler mais na unidade 1, tópico 3. 3 / 3 ptsPergunta 11 A respeito da linguagem python, analise as a�rmativas. I- Possui bibliotecas como pandas e numpy. II- Disponibiliza documentação na Internet. III- É uma linguagem de baixo nível. Está correto o que se a�rma em Todas II e III, apenas. III, apenas. I e III, apenas. I e II, apenas. Correto!Correto! 3 / 3 ptsPergunta 12 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 10/16 Considere o seguinte fragmento de código fonte, escrito em linguagem python: a = 3 b = a * 2 a, b = b, a Após a execução de todos os comandos, qual é o resultado apresentado pelo comando abaixo? print(a) a 36 6 Correto!Correto! 3 63 3 / 3 ptsPergunta 13 Leia o trecho a seguir: Em uma pesquisa, o entrevistador fez a seguinte pergunta: “A caridade é o melhor meio de ajudar as pessoas que mais necessitam?”. Foi elaborado um questionário com 10 pontuações em uma escala, em que 1 (valor mínimo) é “Discordo totalmente” e 10 (valor máximo) é “Concordo totalmente”. A seguir encontram-se os dados coletados. 6 4 7 2 9 1 4 4 6 4 1 6 9 8 4 2 7 1 8 3 Considerando esses dados, bem como as informações fornecidas, pode-se considerar como informações corretas a respeito dos dados 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 11/16 da amostra: Pode-se dizer que pelo menos 60% das pessoas deram nota menor do que a média. O desvio padrão para essa amostra é igual ao valor da média e é obtido pelo método desvpad(). A mediana e a média possuem o mesmo valor. Nesse caso, podem ser obtidas pelo método median(). O valor modal (moda) é o que aparece com maior frequência e, nesse caso, foi o número 1. O valor modal (moda) é 4 e corresponde a 25% da amostra. Pode ser obtido com o método mode(). Correto!Correto! Para esse exercício, coloque todos os dados em ordem crescente. Como a amostra possui um número par de dados, haverá 2 números centrais cujo valor é 4. Ache a média desses dois valores e, então, teremos a mediana, que é 4. Na amostra temos 5 entradas para o número 4, logo 5/20 ou 1/4 ou 25% da amostra corresponde ao valor 4. Por fim, para obtermos o valor modal, utilizamos o método mode(). Veja mais no tópico 2 da unidade 3. 3 / 3 ptsPergunta 14 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 12/16 Ao lidar com dados estatísticos, é importante distinguir entre "população" dos conjuntos de dados e "amostra" dos conjuntos de dados. Em um volume de dados, a população contém todos os membros de um grupo específico. Por outro lado, a amostra de um grupo de dados contém uma parte, ou um subconjunto, de uma população. O tamanho de uma amostra é sempre menor do que o tamanho da população da qual é retirada. Considerando essas informações e os conteúdos estudados na disciplina, analise as asserções a seguir: I. A população pode ser todas as pessoas que vivem no Brasil. II. A amostra pode ser todas as pessoas que vivem no Nordeste. III. A amostra pode ser todas as pessoas entre 40 e 50 anos que vivem no Brasil. Está correto apenas o que se afirma em: II e III. I apenas. I e III. Correto!Correto! II apenas. III apenas. 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 13/16 A asserção I está correta, pois quando falamos de população estamos tratando o todo, ou seja, todas as pessoas que vivem no Brasil, sem exceção. Já a asserção II está incorreta, pois o conceito de amostra está relacionado a pegarmos uma parte da população, ou seja, uma parte do todo. A asserção diz “todas as pessoas que vivem no Nordeste”, logo isso caracteriza uma população. Se fosse afirmado: “todas as pessoas do Brasil que vivem no Nordeste”, teríamos o Brasil como população e as pessoas que vivem no Nordeste como amostra. Quanto a asserção III está correta, pois pega-se uma parte do todo. O todo (população) são as pessoas que vivem no Brasil. A amostra são as pessoas que vivem no Brasil e que possuem entre 40 e 50 anos. Veja mais sobre amostra e população no tópico 1 da unidade 3. 3 / 3 ptsPergunta 15 Considere o seguinte conjunto de dados abaixo como sendo o resultado da classificação de um conjunto de testes ao passar por um classificador supervisionado. Tempo Temperatura Vento Pedalar Classificador Sol Calor Fraco Sim Sim Sol Calor Forte Não Sim Nublado Calor Fraco Sim Sim Chuva Amena Fraco Sim Não Chuva Frio Fraco Não Não Chuva Frio Forte Não Sim Nublado Frio Forte Sim Sim 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 14/16 Sol Amena Fraco Não Não Nublado Frio Forte Não Não Chuva Amena Fraco Sim Sim Escolha a alternativa que melhor representa a Matriz de Confusão que representa o cenário anterior: Classe esperada Sim Não Classe predita Não 4 1 Sim 2 3 Classe esperada Sim Não Classe original Sim 4 1 Não 2 3 Classe esperada Sim Não Classe predita Sim 3 2 Não 1 4 Classe classificador Sim Não Classe predita Sim 3 2 Não 1 4 Classe esperada Sim Não Classe predita Sim 4 1 Não 2 3 Correto!Correto! 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 15/16 Feedback: Comoapresentado na unidade 4, tópico 3, a classe original dada ao algoritmo de aprendizado de máquina supervisionado é chamado de classe esperada, rótulo, classe original, label, variável dependente, consequência etc. Já a classe calculada pelo algoritmo de aprendizado de máquina supervisionado é chamada de classe predita, calculada, descoberta etc. Dessa forma: • VP = verdadeiro positivo, ou seja, número de exemplos para os quais classe predita = classe esperada = “Sim”; • VN = verdadeiro negativo, ou seja, número de exemplos para os quais classe predita = classe esperada = “Não”; • FP = falso positivo, ou seja, número de exemplos para os quais classe predita = “Sim”, mas a classe esperada = “Não”; • FN = falso negativo, ou seja, número de exemplos para os quais classe predita = “Não”, mas a classe esperada = “Sim”. 3 / 3 ptsPergunta 16 A respeito da Matriz de Confusão, considere as asserções abaixo: I - A Matriz de Confusão recebe esse nome porque é necessária muita atenção para o seu entendimento. II - A Matriz de Confusão, para ser obtida, é necessário que o desempenho do classificador seja calculado a partir do conjunto de dados de treinamento. III - A Matriz de Confusão que melhor retrata o desempenho do classificador deve ser obtida pela aplicação do classificador sobre o conjunto de dados de teste. IV - A Matriz de Confusão tem em cada uma de suas células a média do resultado do cálculo do desempenho do classificador sobre os conjuntos de dados de treinamento e de teste. Sobre essas asserções, escolha a alternativa abaixo que melhor retrata o julgamento sobre a veracidade delas: 20/03/2022 21:05 AV1: G.FEV.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/13744/quizzes/33452 16/16 II e IV são verdadeiras. I e III são falsas. Somente a IV é verdadeira. I, II e III são falsas. Somente a III é verdadeira. I, II e IV são falsas. Correto!Correto! III e IV são verdadeiras. I e II são falsas. Somente a II é verdadeira. I, III e IV são falsas. Feedback: A Matriz de Confusão que melhor retrata o desempenho do classificador deve ser obtida pela aplicação do classificador sobre o conjunto de dados de teste, de forma que o classificador é obtido pelos dados de treinamento, ou seja, o aprendizado ocorre pelos dados de treinamento para verificar o desempenho, ou seja, se houve realmente aprendizado ou se o classificador simplesmente decorou os dados a validação, usando a Matriz de Confusão, é feita com os dados de treinamento, como apresentado na unidade 4, tópico 3. Pontuação do teste: 40 de 40
Compartilhar