Prévia do material em texto
03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 1/15 * Algumas perguntas ainda não avaliadas AV I Entrega 7 mai em 23:59 Pontos 40 Perguntas 10 Disponível 29 abr em 0:00 - 7 mai em 23:59 Limite de tempo 120 Minutos Instruções Histórico de tentativas Tentativa Tempo Pontuação MAIS RECENTE Tentativa 1 53 minutos 24 de 40 * As respostas corretas estarão disponíveis em 8 mai em 0:00. Pontuação deste teste: 24 de 40 * Enviado 3 mai em 16:26 Esta tentativa levou 53 minutos. IMPORTANTE: • A tentativa será finalizada após clicar no botão ENVIAR • Programe se para realizar suas avaliações com tranquilidade, pois você terá 120 minutos cronometrados (por tentativa) para conclusão e envio das respostas. Após este prazo, a avaliação será automaticamente finalizada. • Será permitida apenas UMA tentativa para realizar esta avaliação. • Ao iniciar a avaliação o cronômetro não para, independentemente da plataforma estar aberta ou não. • Durante a realização da prova, será exibido uma questão por vez, podendo AVANÇAR ou RETORNAR quando necessário, dentro do período da tentativa. • Após abrir a avaliação mesmo não marcando nenhuma opção de resposta, será contabilizada uma tentativa. • Somente finalize a avaliação após conferir as alternativas marcadas por você. 3 / 3 ptsPergunta 1 ETL é a abreviação de Extract, Transform, Load que, em tradução livre, significa extração, transformação e carga, respectivamente. Essas são três funções de base de dados que https://newtonpaiva.instructure.com/courses/16808/quizzes/37658/history?version=1 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 2/15 são combinadas em uma ferramenta responsável por extrair os dados de uma base e colocá-los em outra base. Além disso, o ETL também é utilizado para converter bancos de dados de um formato ou tipo para outro. Considerando o exposto, analise as asserções a seguir quanto ao emprego de ETL: I. O ETL pode ser usado para centralizar os dados em um único repositório de dados, viabilizando o aprendizado de máquina. II. O ETL é usado para transformar dados de uma base de dados em um modelo .doc. III. ETL é uma técnica de mineração de dados que pode ser usada para descobrir padrões nos dados. IV. O ETL pode ajudar a mover dados de várias fontes de IoT (Internet of Things) para um único local onde você pode analisá-los. Está correto o que se afirma em: II, III, IV. I e IV. II e III. I e II. I, II e III. 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 3/15 Feedback: IoT significa Internet das Coisas e se refere ao uso de dispositivos e sistemas conectados que aproveitam os dados coletados por sensores e atuadores incorporados em máquinas e outros objetos físicos, como o sensor em um semáforo. O ETL pode mover todos os dados das diversas fontes e armazená-los em uma única base. O aprendizado de máquina é um método de análise de dados que automatiza a construção de modelos analíticos. Desse modo, o ETL pode centralizar os dados em um único repositório (por exemplo, Data Warehouse) para efetuar as análises. Você pode ler mais na unidade 1, tópico 3. 3 / 3 ptsPergunta 2 A mineração de dados é o processo de análise de grandes volumes de dados para descobrir inteligências que ajudem as empresas a resolver problemas, mitigar riscos e aproveitar novas oportunidades. Esse ramo da ciência de dados tem a nomenclatura derivada das semelhanças entre procurar informações valiosas em um grande banco de dados e extrair uma montanha de minério. Considerando as informações sobre mineração de dados, analise as asserções a seguir a respeito dos principais conceitos de mineração de dados. I. Usa aprendizado de máquina. II. Usa dados diretamente dos sistemas de processamento de transações. III. Ajuda os gerentes na tomada de decisões de rotina. IV. Limpeza e preparação de dados. Está correto o que se afirma em: 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 4/15 II e III. II e IV. III e IV. I e III. I e IV. Feedback: Limpeza e preparação de dados é uma etapa na qual os dados são transformados em um formulário adequado para análises e processamentos adicionais, como a identificação e a remoção de erros e a falta de dados (dados incompletos). Do mesmo modo, o aprendizado de máquina é um conceito de mineração de dados no qual um programa, usando probabilidades estatísticas, permite aos computadores ter a capacidade de "aprender" sem que sejam explicitamente programados. Você pode ler mais na unidade 1, tópico 3. 3 / 3 ptsPergunta 3 Desde os tempos mais remotos o ser humano produz dados. Os homens das cavernas escreviam nas paredes. Seus hieróglifos tornaram-se dados que permitem hoje compreendermos o modo como viviam. Tempos depois, os pergaminhos foram escritos e os dados contidos contam a história de povos antigos. Atualmente, milhões de dados são produzidos por hora; logo, armazená-los e tratá-los torna-se um desafio para todos. Há, porém, um desafio maior ainda, que é interpretar esses dados e tirar deles algum valor, assim como fizemos com os hieróglifos e pergaminhos antigos. De acordo com o seu conhecimento e os conceitos de ETL, assinale a 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 5/15 alternativa correta em relação aos tipos e exemplos de visualização de dados: A fase de extração é considerada a mais importante, pois é nela que os dados são enviados para o Data Warehouse. A extração de dados consiste em limpar os dados, resolvendo problemas como inconsistências nesses dados. Ao realizar a carga (load) para um Data Warehouse, os dados são organizados de acordo com o tipo, por exemplo, tipos de texto e tipos de números. A fase de transformação (Transform) do ETL é uma técnica de mineração de dados que pode ser usada para descobrir padrões nos dados. As ferramentas de ETL automatizam o processo de extração de dados dos diferentes bancos de dados e o entrega para um Data Warehouse. Feedback: O processo de ETL desempenha um papel fundamental nas estratégias de integração de dados. O ETL permite que as empresas coletem dados de várias fontes e os consolidem em um único local centralizado. O ETL também possibilita que diferentes tipos de dados trabalhem juntos. Você pode ler mais na unidade 1, tópico 4. 3 / 3 ptsPergunta 4 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 6/15 Leia o trecho a seguir: Os operadores aritméticos de soma, subtração, divisão e multiplicação podem ser utilizados nas operações com números inteiros e números reais. Se um número inteiro for dividido por um número real, teremos um número do tipo real como resultado. Esses operadores podem ser utilizados em uma cadeia de instruções, respeitando sempre a ordem de precedência matemática: primeiro a multiplicação, em seguida a divisão, a soma e, por fim, a subtração. De posse dessas informações e do conteúdo estudado sobre Python, analise as asserções a seguir e a relação proposta entre elas. I. Supondo os seguintes valores de variáveis do tipo string: A=”Bom” e B=”dia”, podemos somar A+B, obtendo C = A + B que é igual a “Bom dia”. PORQUE II. Quando realizamos a soma de strings, o resultado final é a concatenação das duas strings com comportamento semelhante ao símbolo de &. A seguir, assinale a alternativa correta: A asserção I é falsa e a II é verdadeira. A asserção I é verdadeira e a II é falsa. As asserções I e II são verdadeiras e a II é uma justificativa correta da I. As asserções I e II são verdadeiras,mas a II não é uma justificativa correta da I. As asserções I e II são falsas. 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 7/15 Feedback: Quando somamos duas strings na realidade estamos realizando uma junção. Desse modo, estamos juntando a palavra “Bom” com a palavra “dia” e o resultado é a frase “Bom dia”. Em Python o símbolo responsável por realizar a concatenação de strings é o sinal de adição +. O e-comercial “&” não realiza concatenação. Veja mais sobre variáveis e manipulação de string no tópico I na unidade 2. 3 / 3 ptsPergunta 5 As variáveis, em linguagem de programação, são representações textuais de espaços na memória onde podemos guardar valores. Temos as variáveis de tipo inteiro, responsável por guardar números inteiros, e variáveis do tipo real, que guardam números reais. Temos variáveis do tipo cadeia de caracteres, que armazenam palavras e frases. Também temos os tipos booleanos, os quais retornam os valores VERDADEIRO ou FALSO. Assim, analise com atenção o código a seguir: 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 8/15 Assim, considerando as informações apresentadas e os conteúdos estudados sobre estruturas condicionais, o que é correto falar sobre a saída desse código? Será apresentada na tela as mensagens “México Itália”. Será apresentada a mensagem “Brasil Itália”. Será apresentada na tela a mensagem “México”. Será apresentada na tela a mensagem “Itália”. Será apresentada na tela a mensagem “Inglaterra”. Feedback: A variável cond3 receberá na linha 3 e a variável cond4 receberá na linha 4 o valor igual a True. Entretanto, na linha 11 a condição if é uma condição interna a outro if, o da linha 9. Ou seja, a única possibilidade de realizar o teste da linha 11 é se o if da linha 9 for verdadeiro, o que não é, por isso não é impressa a mensagem México. Se retirarmos a tabulação do if da linha 11, dessa forma sim será apresentada a palavra México. Por outro lado, na linha 13, o if verificará se cond4 é verdadeiro e, como é verdadeiro, então mostra a mensagem Itália. Veja mais sobre estrutura condicional no tópico 2. 3 / 3 ptsPergunta 6 Leia o trecho a seguir: Em uma pesquisa, o entrevistador fez a seguinte pergunta: “A caridade é o melhor meio de ajudar as pessoas que mais necessitam?”. Foi elaborado um questionário com 10 pontuações em uma escala, em que 1 (valor mínimo) é “Discordo totalmente” e 10 (valor máximo) é “Concordo totalmente”. A seguir encontram-se os dados coletados. 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 9/15 6 4 7 2 9 1 4 4 6 4 1 6 9 8 4 2 7 1 8 3 Considerando esses dados, bem como as informações fornecidas, pode-se considerar como informações corretas a respeito dos dados da amostra: O valor modal (moda) é 4 e corresponde a 25% da amostra. Pode ser obtido com o método mode(). O valor modal (moda) é o que aparece com maior frequência e, nesse caso, foi o número 1. A mediana e a média possuem o mesmo valor. Nesse caso, podem ser obtidas pelo método median(). O desvio padrão para essa amostra é igual ao valor da média e é obtido pelo método desvpad(). Pode-se dizer que pelo menos 60% das pessoas deram nota menor do que a média. 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 10/15 Feedback: Para esse exercício, coloque todos os dados em ordem crescente. Como a amostra possui um número par de dados, haverá 2 números centrais cujo valor é 4. Ache a média desses dois valores e, então, teremos a mediana, que é 4. Na amostra temos 5 entradas para o número 4, logo 5/20 ou 1/4 ou 25% da amostra corresponde ao valor 4. Por fim, para obtermos o valor modal, utilizamos o método mode(). Veja mais no tópico 2 da unidade 3. 3 / 3 ptsPergunta 7 Uma mediana divide um conjunto de dados em duas partes iguais. O conjunto pode ser subdividido ainda mais em quatro partes iguais por valores chamados quartis. Os quartis dividem o conjunto de dados em quartos com cada quarto contendo um quarto (ou 25%) dos dados. Os quartis são como "medianas" adicionais da metade inferior e superior do conjunto de dados. Um quartil é um número e não é um intervalo de valores. Uma empresa deseja saber o número de acessos ao seu site. Para tanto, registrou o número de acessos (em milhares) durante 15 dias. Veja os dados coletados: 19, 12, 9, 7, 17, 10, 6, 18, 9, 14, 19, 8, 5, 17, 9. A partir dessas informações e do conhecimento estudado no livro da disciplina, responda qual alternativa apresenta o método para calcular o segundo quartil bem como quanto será o seu valor. Para encontrar o segundo quartil utilizamos df.quartile(0.5) e o seu valor será 10. 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 11/15 Para encontrar o segundo quartil utilizamos df.quartile(50) e o seu valor será 6. Para encontrar o segundo quartil utilizamos df.quartile(50) e o seu valor será 10. Para encontrar o segundo quartil utilizamos df.quartile(2) e o seu valor será 6. Para encontrar o segundo quartil utilizamos df.quartile(2) e o seu valor será 10. Feedback: Antes de tudo, vamos pegar os dados coletados e organizar em ordem crescente, ficando assim: 5, 6, 7, 8, 9, 9, 9, 10, 12, 14, 17, 17, 18, 19, 19. O valor do segundo quartil é o mesmo da mediana que, por sua vez, é o exato valor do meio que, para nós, é o 10. Logo, temos que a mediana será 10. Para encontrar um determinado quartil, utilizamos o método quartile, passando como parâmetro qual quartil desejamos, se o primeiro (0.25), se o segundo (0.5) ou o terceiro (0.75). Veja mais no tópico 2 da unidade 3. Não avaliado ainda / 13 ptsPergunta 8 aprendizado de máquina (ou machine learning) tem como premissa principal a aprendizagem a partir dos dados (MITCHELL, 1997). Dessa forma, procura-se inferir um conceito mais geral a partir da observação de dados e exemplos passados. Quando se fala em Ciência de dados, há basicamente três paradigmas do aprendizado 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 12/15 Sua Resposta: de máquina que são importantes conhecer. Explique brevemente cada uma delas. O aprendizado de máquina é um subcampo da inteligência artificial que envolve o desenvolvimento de algoritmos que podem aprender e fazer previsões ou decisões com base em dados. Existem três paradigmas ou abordagens principais para o aprendizado de máquina: aprendizado supervisionado, aprendizado não supervisionado e aprendizado por reforço. No aprendizado supervisionado, envolve o aprendizado de uma função que mapeia entradas para saídas tendo como base um conjunto de dados, o algoritmo inferirá o valor da variável dependente a partir de um conjunto de variáveis independentes. No aprendizado não supervisionado, O algoritmo não é fornecido com nenhuma orientação explícita, ou seja, existem somente as variáveis independentes que descrevem os dados. O aprendizado por reforço: envolve aprender por tentativa e erro cujo elemento chave é o estímulo-reposta, no qual um agente produz resposta comportamentais a depender de estímulos positivos ou negativos, os quais, por sua vez, vão gerar novas respostas em um ciclo. 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 13/15 PAG 77 No aprendizado supervisionado, tendo como base um conjunto de dados, o algoritmo procura inferir o valor da variável dependente a partir de um conjunto de variáveis independentes.No aprendizado não supervisionado, existem somente as variáveis independentes que descrevem os dados, O aprendizado por reforço o elemento-chave é o estímulo- resposta, no qual um agente produz respostas comportamentais a depender de estímulos positivos ou negativos, os quais, por sua vez, vão gerar novas respostas em um ciclo. 3 / 3 ptsPergunta 9 A presença de dados ausentes em conjuntos de dados é algo presente na maior parte das informações provenientes do mundo real. É possível remediar a existência de dados ausentes utilizando técnicas estatísticas, como a média, a mediana e a moda. Marque a alternativa INCORRETA a respeito das razões que propiciam a ocorrência de dados ausentes: Campos com opção correta faltante, por exemplo, uma lista de cidades onde não consta uma delas em particular. A pessoa, ao preencher e notar que não tem a sua cidade, provavelmente irá deixar em branco. Campos que possuam cálculo automático dependente de outros campos do conjunto de dados e que o sistema aleatoriamente possa estar deixando de executar essa tarefa, que fica pré-agendada no sistema. 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 14/15 Campos não obrigatórios que, ao serem preenchidos, são deixados em branco ou zerados, como idade, endereço, renda etc. Campos que dependem de uma ação temporal, por exemplo, os dados de navegação em um e-commerce, em que o nome do produto adquirido e o valor somente existirão no conjunto de dados se o cliente fizer a compra, senão eles estarão em branco até que o referido evento ocorra. Campos obrigatórios, mas sem a correta consistência que obrigue a correta captura do preenchimento (nome completo, CPF, RG etc.). Feedback: A existência de dados ausentes sempre envolve uma questão de modelagem do sistema para fazer a aquisição das informações, seja por negligência de validação dos campos e/ou pela coleta esparsa em tabelas pré-formatadas. Os sistemas de informação simplesmente vão fazer o que o programador mandou e não o que ele desejaria que pudesse ser feito, já que os sistemas não agem por conta própria e de forma aleatória. Reveja esses conceitos na unidade 5, tópico 1.1. 0 / 3 ptsPergunta 10IncorretaIncorreta Nos conjuntos de dados, é preciso observar, além da distribuição dos dados, a ordem de grandeza das variáveis (colunas) que os contêm, em especial quando houver discrepância entre as próprias variáveis de um mesmo conjunto de dados. Para remediar isso, é possível empregar técnicas de padronização e normalização. Se você utilizar uma técnica de normalização baseada em Min-Max, em uma determinada coluna, o que se pode afirmar em relação aos 03/05/2023, 16:28 AV I: G.37.A.FIA.5 - Fundamentos de Inteligência Artificial https://newtonpaiva.instructure.com/courses/16808/quizzes/37658 15/15 valores da média e do desvio padrão mínimo e máximo? A média será igual a 0 e o desvio padrão será igual a 1. O mínimo será o valor da média menos o desvio padrão e o máximo será o valor da média mais o desvio padrão. A média será igual a 1 e o desvio padrão será igual a 0. O mínimo será 0 e o máximo será 1. Nada se pode afirmar, porque não se conhece a distribuição dos dados. Feedback: Pela própria característica da fórmula do Min-Max, a normalização é feita de forma que os novos valores são calculados dentro de um regime intervalar entre o mínimo e o máximo da distribuição. Isso faz com que os novos valores fiquem sempre dentro do intervalo [0,1], ou seja, mínimo = 0 e máximo = 1. Reveja esses conceitos na unidade 5, tópico 2. Pontuação do teste: 24 de 40