Baixe o app para aproveitar ainda mais
Prévia do material em texto
11/10/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 1/5 Curso DATA MINING Teste Teste Final Iniciado 11/10/20 18:24 Enviado 11/10/20 19:45 Status Completada Resultado da tentativa 10 em 10 pontos Tempo decorrido 1 hora, 21 minutos Resultados exibidos Respostas enviadas, Respostas corretas, Comentários Pergunta 1 Resposta Selecionada: Resposta Correta: Feedback da resposta: A mineração de dados é um processo relacionado às áreas de Ciência de Dados e Big Data responsável por integrar um processamento maior dentro da análise de dados, que consiste em diferentes etapas. Esse processo permite que os dados sejam extraídos e trabalhados a partir de um dataset. Nesse sentido, assinale a alternativa que define a etapa imediatamente anterior à da mineração de dados. Transformar os dados conforme um padrão. Transformar os dados conforme um padrão. Resposta correta. Após as etapas de seleção de de pré-processamento, será na fase da transformação dos dados que ocorrerá a conversão dos dados brutos em um formato padrão que seja possível de filtrar e utilizar para a análise estatística,, de forma que os dados estejam melhor relacionados entre si e que possam ser analisados posteriormente. Pergunta 2 Resposta Selecionada: Resposta Correta: Feedback da resposta: Na atualidade, os dados são gerados continuamente pelas mais diversas fontes. Ao acessar um site, por exemplo, uma única pessoa gera dados relacionados aos cliques e movimentos do mouse, às palavras que escreve na tela, aos termos que busca no Google e aos conteúdos pelos quais se interessa. Pensando nos milhões de usuários que acessam a internet 24h por dia, o volume de dados gerado a cada segundo é impressionante. Com base nisso, assinale a alternativa correta. Big Data é a evolução das tecnologias e arquiteturas relacionadas às bases de dados. Big Data é a evolução das tecnologias e arquiteturas relacionadas às bases de dados. Resposta correta. Não é à toa que um dos “5 Vs” de Big Data seja Velocidade. Para comportar grandes volumes de dados, as tecnologias envolvidas também precisaram melhorar em termos de processamento - só assim foi possível acompanhar e dar suporte à entrada contínua de dados na rede. Pergunta 3 Leia o excerto a seguir sobre métodos de treinamento e teste: "Na maioria das redes neurais esses parâmetros correspondem aos valores dos pesos da rede e à sua arquitetura (número de camadas e/ou neurônios); nas árvores de decisão esses parâmetros são os nós da árvore, sua arquitetura (profundidade e conexões) e as condições a serem associadas a cada arco; e nas regras de decisão os parâmetros são os antecedentes e consequentes de cada regra e o número total de regras." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 175. 1 em 1 pontos 1 em 1 pontos 1 em 1 pontos 11/10/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 2/5 Resposta Selecionada: Resposta Correta: Feedback da resposta: Pensando nas possíveis aplicações das técnicas de treinamento, avalie as seguintes afirmações: I. Redes Neurais, Árvores de Decisão e Indução de Regras são técnicas que se utilizam de Inteligência Artificial. II. Agrupamento é o mesmo que classificação ou clustering, e serve para identificar subconjuntos de dados. III. A pontuação é uma técnica que pode variar a partir da integração com outro método - o HMEQ. IV. As Árvores de Decisão usam uma técnica estatística complexa, de modo que são pouco usadas em análise de dados. É correto o que se afirma em: I, II e III, apenas. I, II e III, apenas. Resposta correta. As técnicas de Árvore de Decisão, Indução de Regras e Redes Neurais usam inteligência artificial porque permitem inserir parâmetros de treinamento, ou seja, que envolve aprendizado de máquina. O uso das Árvores de Decisão envolve conceitos estatísticos simples, sendo uma técnica muito recorrente em análise de dados, e o agrupamento, também conhecido como clustering, permite identificar subconjuntos a partir de padrões, sendo que demais técnicas envolvem comparação de modelos, pontuação, pontuação HMEQ e lista de riscos. Pergunta 4 Resposta Selecionada: Resposta Correta: Feedback da resposta: A prática de análise de dados não é uma novidade para as empresas. Desde o tempo de arquivos em papel, era necessário ter uma equipe ou um especialista dedicado a organizar, filtrar e analisar as informações contidas nas bases de dados físicas. Para tanto, foi desenvolvido o método KDD, que consiste em um processo de descoberta de conhecimento dividido em várias etapas. Sobre as etapas de análise de dados pelo método KDD, avalie os itens a seguir: I. Mineração de dados II. Avaliação III. Seleção IV. Pré-processamento V. Transformação Agora assinale a alternativa que representa a ordem correta dessas etapas: IV, III, V, I, II. IV, III, V, I, II. Resposta correta. O KDD é um método que envolve a seleção dos dados, o pré- processamento, a transformação, a mineração dos dados e a avaliação dos resultados obtidos. Esse método funciona com qualquer quantidade de dados, e para qualquer finalidade. Sendo um padrão consistente, continua sendo adotado na Ciência de Dados. Pergunta 5 Sobre análise descritiva de dados, leia o parágrafo a seguir: "As análises descritivas permitem uma sumarização e compreensão dos objetos da base e seus atributos, como qual o salário médio dos professores universitários brasileiros ou qual a distribuição salarial desses professores.” CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29. Com base nisso, avalie as asserções a seguir e a relação proposta entre elas: I. A partir da análise descritiva de dados, é possível prever o maior período de vendas de um e- commerce PORQUE, II. havendo uma base de dados com informações sobre os períodos de venda anteriores, há como verificar a existência de padrões a partir da mineração de dados. 1 em 1 pontos 1 em 1 pontos 11/10/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 3/5 Resposta Selecionada: Resposta Correta: Feedback da resposta: Assinale a alternativa correta: A asserção II é uma proposição verdadeira e a asserção I é uma proposição falsa. A asserção II é uma proposição verdadeira e a asserção I é uma proposição falsa. Resposta correta. A análise descritiva de dados é usada junto à estatística exploratória, ou seja, usa medidas de centro e de variação para analisar frequências, probabilidades e compreender melhor os padrões de um conjunto de dados. Usa-se, para isso, da média, da moda e da mediana, além de medidas de dispersão para encontrar a Amplitude, a Variância e o Desvio Padrão. Assim sendo, a asserção II é verdadeira e justifica a asserção I, contudo a asserção I é falsa, pois não é a análise descritiva de dados que usamos para prever tendências, e sim a análise preditiva. Pergunta 6 Resposta Selecionada: Resposta Correta: Feedback da resposta: As etapas de mineração de dados de utilizam ferramentas, técnicas e algoritmos de algumas diferentes áreas do conhecimento para trabalhar com um conjunto de dados, a partir do qual serão extraídas as informações necessárias, conforme os objetivos de pesquisa ou de negócio. Sobre as áreas relacionadas à mineração de dados, associe os itens a seguir aos seus correspondentes: (1) Big Data. (2) Inteligência Artificial. (3) Estatística. ( ) Validação de dados. ( ) Aprendizado de máquina. ( ) Manipulação de dados. Assinale a alternativa correta. 3, 2, 1. 3, 2, 1. Resposta correta. Você realizou a associação correta entre 1. (Big Data - Manipulação de dados), 2. (Inteligência Artificial - Aprendizado de máquina) e 3. Estatística (Validação dedados). Isso porque, enquanto as tecnologias de banco de dados associadas ao Big Data evoluíram para acomodar grandes volumes a maiores taxas de processamento, a Estatística funciona para avaliar resultados e validá-los, e o aprendizado de máquina só é possível por conta dos estudos de inteligência artificial. Pergunta 7 Resposta Sobre as tecnologias relacionadas a mineração de dados e Big Data, leia o excerto a seguir: "Pesquisadores consideram que estamos vivenciando o início de uma nova revolução industrial, na qual os dados passam a ser elementos chaves dessa mudança. Podemos concluir, portanto, que esse é o momento ideal para criarmos oportunidades a partir dos dados." MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 8. Com base nisso, analise as asserções a seguir e a relação proposta entre elas: I. Big Data é uma área de inovações voltada ao processamento de grandes volumes de dados PORQUE II. as tecnologias e arquiteturas envolvidas permitem alta velocidade de coleta, novas descobertas e diversos processos de análise. A seguir, assinale a alternativa correta. 1 em 1 pontos 1 em 1 pontos 11/10/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 4/5 Selecionada: Resposta Correta: Feedback da resposta: As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. Resposta correta. Embora as suas afirmações sejam verdadeiras, o que é afirmado na asserção II não justifica o que foi exposto na I. Isso porque as tecnologias e arquiteturas relacionadas ao Big Data são o meio que permite que os bancos de dados funcionem e suportem o processamento ao grande volume de dados, mas essas tecnologias não promoveram a revolução do Big Data, em si - elas apenas evoluíram de modo a acompanhar essa tendência. Pergunta 8 Resposta Selecionada: Resposta Correta: Feedback da resposta: Leia o trecho a seguir: “É comum, ao ouvir pela primeira vez o termo Big Data, pensarmos que ele está unicamente relacionado a um grande volume de dados (o que é normal, já que o nome diz exatamente isso). Entretanto, o volume de dados não é sua única característica.”. MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 8. Esse trecho é uma introdução da autora aos termos que designam os “5 Vs” de Big Data, sendo um deles o volume, que costuma ser o mais associado a uma grande base de dados, por motivos óbvios. Entretanto, há outras características que devem ser consideradas. Nesse sentido, leia e relacione cada um dos termos dos “5 Vs” às suas características correspondentes: (1) Volume. (2) Velocidade. (3) Veracidade. (4) Variedade. (5) Valor. ( ) Confiabilidade. ( ) Eventos estatísticos. ( ) Tipos de dados. ( ) Registros. ( ) Coleta de dados. A partir das relações feitas anteriormente, assinale a alternativa que apresenta a sequência correta: 3, 5, 4, 1, 2. 3, 5, 4, 1, 2. Resposta correta. A confiabilidade está associada à integridade e Veracidade dos dados, sendo um dos “5 Vs”; o Valor está associado a eventos estatísticos, que permitem confirmar ou refutar uma hipótese, por exemplo; já os tipos de dados, que podem ser estruturados ou não estruturados, configuram a Variedade; e a Velocidade está relacionada a quão rapidamente os dados são coletados e posteriormente registrados em suas bases de dados; esses registros dizem respeito, assim, ao Volume. Pergunta 9 Sobre detecção de anomalias, leia o trecho a seguir: "Uma base de dados pode conter objetos que não seguem o comportamento ou não possuem a característica comum dos dados ou de um modelo que os represente. Esses dados são conhecidos como anomalias ou valores discrepantes (outliers)." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 31. Sobre os outliers (ou pontos fora da curva), analise as asserções a seguir e a relação proposta entre 1 em 1 pontos 1 em 1 pontos 11/10/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 5/5 Resposta Selecionada: Resposta Correta: Feedback da resposta: elas: I. Os outliers são considerados ruídos e às vezes filtrados automaticamente pela ferramenta utilizada, mas, em alguns casos devem ser mantidos PORQUE, II. em uma análise que objetiva a detecção de fraude, por exemplo, as anomalias podem conter informações significativas. Assinale a alternativa correta. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Resposta correta. Sabendo que no caso de detecção de fraude o ponto fora da curva é justamente aquele que pode indicar uma atividade fora do comum, os outliers podem, de fato, serem considerados dados importantes e significativos, de modo que a asserção II é uma justificativa correta da asserção I. Pergunta 10 Resposta Selecionada: Resposta Correta: Feedback da resposta: Leia o trecho a seguir: "A mineração de dados envolve conhecimento de áreas como banco de dados, estatística, aprendizagem de máquina, computação de alto desempenho, reconhecimento de padrões, computação natural, visualização de dados, recuperação de informação, processamento de imagens e de sinais, análise espacial de dados, inteligência artificial, entre outras." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 28. Nesse sentido, há muitos conteúdos que se cruzam e que dão respaldo à mineração de dados, de modo que um bom cientista de dados ou analista de B.I. - Business Intelligence deve apresentar habilidades que vão desde a noção de mercado e negócios até estatística e programação. Com isso em mente, assinale a palavra que resume a condição desse campo de atuação de Big Data: Multidisciplinar e interdisciplinar. Multidisciplinar e interdisciplinar. Resposta correta. A reunião dessas diversas áreas de conhecimento no campo de Big Data e mineração de dados faz com que essa seja uma disciplina multidisciplinar - uma vez que abrange conceitos de vários campos diferentes - e também interdisciplinar - uma vez que relaciona e interliga esses conceitos. 1 em 1 pontos
Compartilhar