Baixe o app para aproveitar ainda mais
Prévia do material em texto
02/07/2020 Revisar envio do teste: Teste Final – DATA MINING https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 1/6 Revisar envio do teste: Teste FinalDATA MINING Atividade e Certificado Revisar envio do teste: Teste Final Usuário Karen Cristina Gomes Caroba Karen Cristina Cristina Gomes Caroba Curso DATA MINING Teste Teste Final Iniciado 02/07/20 14:38 Enviado 02/07/20 15:21 Status Completada Resultado da tentativa 6 em 10 pontos Tempo decorrido 42 minutos Resultados exibidos Respostas enviadas, Respostas corretas, Comentários Pergunta 1 Resposta Selecionada: Resposta Correta: Feedback da resposta: Em Ciência de Dados, há basicamente dois formatos de análise possível, em que a análise de dados pode recorrer tanto a procedimentos estatísticos quanto a algoritmos de aprendizado de máquina (ou análise preditiva) para descobrir padrões e extrair conhecimento de uma base de dados. A partir do exposto, associe as técnicas de análise dados a seguir às suas possíveis associações: (1) Análise exploratória. (2) Análise de estimação. (3) Análise de classificação. ( ) Regressão estatística. ( ) Cálculo do desvio padrão. ( ) Predição de valores discretos. Agora indique a ordenação correta entre os tipos de análise e seus respectivos métodos: 2, 1, 3. 2, 1, 3. Resposta correta. Você associou corretamente as colunas 2. ( Análise de estimação ) Regressão estatística, 1. ( Análise exploratória ) Cálculo do desvio padrão e 3. ( Análise de classificação ) Predição de valores discretos. As análises de estimação e de classificação fazem parte do campo da Predição, sendo que a primeira lida com valores discretos e, a segunda, com valores contínuos; já a análise preditiva ou exploratória usa conceitos básicos da estatística, como as medidas centrais e de dispersão, para investigar as variáveis, sendo o Desvio Padrão associado à medida de Variância. 1 em 1 pontos https://anhembi.blackboard.com/webapps/blackboard/execute/courseMain?course_id=_607084_1 https://anhembi.blackboard.com/webapps/blackboard/content/listContent.jsp?course_id=_607084_1&content_id=_12924842_1&mode=reset 02/07/2020 Revisar envio do teste: Teste Final – DATA MINING https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 2/6 Pergunta 2 Resposta Selecionada: Resposta Correta: Feedback da resposta: Considere a seguinte situação hipotética para responder a questão: Periodicamente, o auditor de um banco tem a necessidade de avaliar elementos que possam ajudar na identificação de fraudes como desvio de verba e balanceamento incorreto de caixa. Diante de uma denúncia anônima, o auditor agora deseja aplicar técnicas de mineração de dados para conseguir encontrar alguma inconsistência nos registros. Assim sendo, assinale a alternativa que apresenta a ação a ser tomada pelo auditor dessa instituição financeira. o auditor deve valer-se de instrumentos preditivos de análise para comparar dados passados aos registros atuais. o auditor deve valer-se de instrumentos preditivos de análise para comparar dados passados aos registros atuais. Resposta correta. Os instrumentos de análise preditiva permitirão ao auditor prever como as movimentações deveriam estar se movimentando com base nos registros passados. Ao comparar esse resultado com os registros reais e encontrar uma diferença significativa, poderá descobrir o setor em que houve disparidade e encontrar o possível erro ou fraude nas movimentações. Pergunta 3 Resposta Selecionada: Resposta Correta: Feedback da resposta: Antigamente, as empresas mantinham grandes arquivos com dados de produtos, clientes, funcionários, relatórios de vendas, e assim por diante. Com o advento da internet, foi possível digitalizar e compartilhar essas informações. Contudo, o número de dados a serem arquivados também aumentou, o que gerou um problema de armazenamento e de processamento, exigindo que as empresas adequassem suas infraestruturas e aderissem a novas tecnologias. Esse é o início do Big Data. Nesse sentido, assinale a alternativa que apresenta as cinco características mais citadas do Big Data: Volume, Velocidade, Variedade, Valor e Veracidade. Volume, Velocidade, Variedade, Valor e Veracidade. Resposta correta. Quando nos referimos a Big Data, algumas características mais óbvias se destacam, como o Volume de dados, a Velocidade com que os dados são coletados, a Variedade de dados coletados, o Valor agregado a esses dados e a Veracidade que esses dados devem representar. Pergunta 4 Sobre as tecnologias relacionadas a mineração de dados e Big Data, leia o excerto a seguir: "Pesquisadores consideram que estamos vivenciando o início de uma nova revolução industrial, na qual os dados passam a ser elementos chaves dessa mudança. 1 em 1 pontos 1 em 1 pontos 1 em 1 pontos 02/07/2020 Revisar envio do teste: Teste Final – DATA MINING https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 3/6 Resposta Selecionada: Resposta Correta: Feedback da resposta: Podemos concluir, portanto, que esse é o momento ideal para criarmos oportunidades a partir dos dados." MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 8. Com base nisso, analise as asserções a seguir e a relação proposta entre elas: I. Big Data é uma área de inovações voltada ao processamento de grandes volumes de dados PORQUE II. as tecnologias e arquiteturas envolvidas permitem alta velocidade de coleta, novas descobertas e diversos processos de análise. A seguir, assinale a alternativa correta. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. Resposta correta. Embora as suas afirmações sejam verdadeiras, o que é afirmado na asserção II não justifica o que foi exposto na I. Isso porque as tecnologias e arquiteturas relacionadas ao Big Data são o meio que permite que os bancos de dados funcionem e suportem o processamento ao grande volume de dados, mas essas tecnologias não promoveram a revolução do Big Data, em si - elas apenas evoluíram de modo a acompanhar essa tendência. Pergunta 5 Resposta Selecionada: Resposta Correta: Feedback da resposta: A mineração de dados é um processo relacionado às áreas de Ciência de Dados e Big Data responsável por integrar um processamento maior dentro da análise de dados, que consiste em diferentes etapas. Esse processo permite que os dados sejam extraídos e trabalhados a partir de um dataset. Nesse sentido, assinale a alternativa que define a etapa imediatamente anterior à da mineração de dados. Selecionar os dados que serão utilizados. Transformar os dados conforme um padrão. Sua resposta está incorreta. As etapas de uma análise de dados se inicia com a seleção dos dados iniciais, passando pela etapa de pré- processamento (onde são obtidos os dados pré-processados), pela transformação desses dados e, em sequência, à mineração e à etapa de avaliação, que permite gerar conhecimento. A etapa anterior à da mineração de dados é, portanto, a de transformação. Pergunta 6 Leia o excerto a seguir sobre métodos de treinamento e teste: "Na maioria das redes neurais esses parâmetros correspondem aos valores dos pesos da rede e à sua arquitetura (número de camadas e/ou neurônios); nas árvores de decisão esses parâmetros são os nós da árvore, sua arquitetura (profundidade e conexões) e as condições a serem associadas a cada arco; e nas regras de decisão os parâmetros são os antecedentes e consequentes de cada regra e o número total de regras." 0 em 1 pontos 0 em 1 pontos 02/07/2020 Revisar envio do teste: Teste Final – DATA MINING https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 4/6 Resposta Selecionada: RespostaCorreta: Feedback da resposta: CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 175. Pensando nas possíveis aplicações das técnicas de treinamento, avalie as seguintes afirmações: I. Redes Neurais, Árvores de Decisão e Indução de Regras são técnicas que se utilizam de Inteligência Artificial. II. Agrupamento é o mesmo que classificação ou clustering, e serve para identificar subconjuntos de dados. III. A pontuação é uma técnica que pode variar a partir da integração com outro método - o HMEQ. IV. As Árvores de Decisão usam uma técnica estatística complexa, de modo que são pouco usadas em análise de dados. É correto o que se afirma em: II e III, apenas. I, II e III, apenas. Sua resposta está incorreta. As diferentes técnicas envolvidas em mineração de dados envolvem HMEQ, Agrupamento e Divisão de Dados, Árvore de Decisão, Indução de Regras, Redes Neurais, comparação de modelos, pontuação, pontuação HMEQ e lista de riscos. Dessas, somente a Árvore de Decisão, a Indução de Regras e as Redes Neurais estão relacionadas à inteligência artificial, e as Árvores de Decisão utilizam cálculos estatísticos simples, sendo um método bastante utilizado em Ciência de Dados. Portanto, os itens corretos são I, II e III. Pergunta 7 Resposta Selecionada: Resposta Correta: Feedback da resposta: Sobre agrupamento, leia o parágrafo a seguir: "Em um processo de agrupamento, os objetos são agrupados com o objetivo de maximizar a distância interclasse e minimizar a distância intraclasse, ou, dito de outra forma, maximizar a similaridade intraclasse e minimizar a similaridade interclasse." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 30. O processo de agrupamento ou clusterização é uma das técnicas utilizadas em mineração de dados. Esse processo faz parte da análise preditiva, que inclui classificação, regressão e segmentação de dados. A respeito dessas técnicas, indique a alternativa que apresenta o método comumente aplicado: classes estruturadas. redes neurais. Sua resposta está incorreta. O banco de dados relacional não é uma técnica, e sim o local em que os dados ficam armazenados; algoritmos relacionais não se referem a um método conhecido de análise de dados; computação em nuvem refere-se a um tipo de arquitetura com tecnologia de rede, e não a um método; e classes estruturadas também não indicam nenhum método conhecido de análise preditiva de dados. A resposta correta, portanto, é “redes neurais”, que estão associadas à inteligência artificial. Pergunta 8 Sobre bases de dados, leia o parágrafo a seguir: 0 em 1 pontos 1 em 1 pontos 02/07/2020 Revisar envio do teste: Teste Final – DATA MINING https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 5/6 Resposta Selecionada: Resposta Correta: Feedback da resposta: “Atualmente, grande parcela dos dados gerados por humanos é oriunda de mídias sociais, onde usuários podem publicar o que pensam sobre algo, gerar debates, publicar suas preferências e suas emoções. Essas informações são geradas em formatos de texto, imagem, áudio e vídeo, resultando em uma base de dados diversificada e volumosa.” MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 18. Assinale a alternativa que representa o tipo de dado que estaria nessa base de dados diversificada e volumosa: Dados não-estruturados. Dados não-estruturados. Resposta correta. Nas mídias sociais e nas páginas web é possível encontrar diversos tipos de dados, como textos, imagens, vídeos, áudios e outros formatos. Essa mistura de dados em uma organização precária configuram os dados não-estruturados, que precisarão passar por tratamento antes de poderem ser minerados e analisados. Pergunta 9 Resposta Selecionada: Resposta Correta: Feedback da resposta: Leia o trecho a seguir sobre mineração de dados: "Uma das famosas frases relacionadas a Big Data é: 'Big Data é o novo petróleo'. Podemos pensar que isso é uma analogia coerente, dado que, assim como o petróleo, o maior valor é obtido após um processo de refinamento, ou seja, após a transição de dados brutos para um determinado produto." MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 29. Sobre o termo data mining, analise as asserções a seguir e a relação proposta entre elas: I. O termo "mineração de dados" tem associação direta com a atividade de mineração de ouro, jazidas e pedras preciosas PORQUE II. encontrar os dados e a sua relação correta evoca informações que podem ser muito valiosas para as estratégias de uma empresa. Assinale a alternativa correta. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Sua resposta está incorreta. O termo “mineração de dados” foi escolhido justamente pela clara alusão às minas, uma vez que chegar ao conhecimento por meio dos dados disponíveis nas bases pode aprimorar imensamente os processos e as medidas que uma empresa toma para direcionar os negócios, podendo inovar e prever tendências a partir de informações provenientes de dados minerados. Pergunta 10 0 em 1 pontos 1 em 1 pontos 02/07/2020 Revisar envio do teste: Teste Final – DATA MINING https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 6/6 Quinta-feira, 2 de Julho de 2020 15h21min12s BRT Resposta Selecionada: Resposta Correta: Feedback da resposta: Dentre as possíveis metodologias existentes para proceder à análise de dados, o CRISP-DM ( Cross-Industry Standard Process of Data Mining , ou Processo Industrial Padrão de Mineração de Dados) é um método que diz respeito a um processo de fluxo unidirecional composto por ciclos ou etapas, assim como o método KDD. Sobre CRISP-DM, assinale a alternativa correta: Envolve preparação, implantação, pesquisa, modelagem e avaliação de dados. Envolve preparação, implantação, pesquisa, modelagem e avaliação de dados. Resposta correta. o CRISP-DM possui diversas etapas, assim como o método KDD, contudo essas fases, embora tenham um fluxo unidirecional, possuem etapas cíclicas, ou seja, que permitem ir e voltar entre si. Por exemplo, a fase de entendimento e pesquisa de dados pode se alternar com a de implantação e preparação de dados, uma vez que se tenha localizado uma inconsistência no momento da implantação que traga a exigência de uma nova pesquisa ou de um novo entendimento sobre o dado com erro. ← OK javascript:launch('/webapps/blackboard/content/listContent.jsp?content_id=_12924842_1&course_id=_607084_1&nolaunch_after_review=true');
Compartilhar