Baixe o app para aproveitar ainda mais
Prévia do material em texto
Curso DATA MINING Teste Teste Final Iniciado 20/05/20 12:12 Enviado 23/05/20 14:48 Status Completada Resultado da tentativa 10 em 10 pontos Tempo decorrido 74 horas, 36 minutos Resultados exibidos Respostas enviadas, Respostas corretas, Comentários Pergunta 1 Resposta Selecionada: Resposta Correta: Feedback da resposta: Sobre bases de dados, leia o parágrafo a seguir: “Atualmente, grande parcela dos dados gerados por humanos é oriunda de mídias sociais, onde usuários podem publicar o que pensam sobre algo, gerar debates, publicar suas preferências e suas emoções. Essas informações são geradas em formatos de texto, imagem, áudio e vídeo, resultando em uma base de dados diversificada e volumosa.” MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 18. Assinale a alternativa que representa o tipo de dado que estaria nessa base de dados diversificada e volumosa: Dados não-estruturados. Dados não-estruturados. Resposta correta. Nas mídias sociais e nas páginas web é possível encontrar diversos tipos de dados, como textos, imagens, vídeos, áudios e outros formatos. Essa mistura de dados em uma organização precária configuram os dados não-estruturados, que precisarão passar por tratamento antes de poderem ser minerados e analisados. Pergunta 2 Resposta Selecionada: Resposta Correta: Feedback da resposta: Na atualidade, os dados são gerados continuamente pelas mais diversas fontes. Ao acessar um site, por exemplo, uma única pessoa gera dados relacionados aos cliques e movimentos do mouse, às palavras que escreve na tela, aos termos que busca no Google e aos conteúdos pelos quais se interessa. Pensando nos milhões de usuários que acessam a internet 24h por dia, o volume de dados gerado a cada segundo é impressionante. Com base nisso, assinale a alternativa correta. Big Data é a evolução das tecnologias e arquiteturas relacionadas às bases de dados. Big Data é a evolução das tecnologias e arquiteturas relacionadas às bases de dados. Resposta correta. Não é à toa que um dos “5 Vs” de Big Data seja Velocidade. Para comportar grandes volumes de dados, as tecnologias envolvidas também precisaram melhorar em termos de processamento - só assim foi possível acompanhar e dar suporte à entrada contínua de dados na rede. Pergunta 3 Leia o trecho a seguir: "A mineração de dados envolve conhecimento de áreas como banco de dados, estatística, 1 em 1 pontos 1 em 1 pontos 1 em 1 pontos Resposta Selecionada: Resposta Correta: Feedback da resposta: aprendizagem de máquina, computação de alto desempenho, reconhecimento de padrões, computação natural, visualização de dados, recuperação de informação, processamento de imagens e de sinais, análise espacial de dados, inteligência artificial, entre outras." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 28. Nesse sentido, há muitos conteúdos que se cruzam e que dão respaldo à mineração de dados, de modo que um bom cientista de dados ou analista de B.I. - Business Intelligence deve apresentar habilidades que vão desde a noção de mercado e negócios até estatística e programação. Com isso em mente, assinale a palavra que resume a condição desse campo de atuação de Big Data: Multidisciplinar e interdisciplinar. Multidisciplinar e interdisciplinar. Resposta correta. A reunião dessas diversas áreas de conhecimento no campo de Big Data e mineração de dados faz com que essa seja uma disciplina multidisciplinar - uma vez que abrange conceitos de vários campos diferentes - e também interdisciplinar - uma vez que relaciona e interliga esses conceitos. Pergunta 4 Resposta Selecionada: Resposta Correta: Feedback da resposta: Sobre tomada de decisão estratégica, Provost e Fawcett explicam que a sigla DDD refere-se a Data- Driven Decision-mak ing, ou seja, tomada de decisão com base nos dados, e consiste na prática de usar a análise de dados como suporte ao posicionamento estratégico em vez da gestão baseada na intuição pura. PROVOST, F.; FAWCETT, T. Data Science for Business: What you need to know about data mining and data-analytic thinking. Califórnia: O'Reilly, 2013. Pensando nisso, assinale a alternativa que reflete a prática de DDD: Usa a análise de dados para promover decisões mais assertivas. Usa a análise de dados para promover decisões mais assertivas. Resposta correta. Uma vez que o gestor esteja com o resultado da análise de dados em mãos, ele consegue perceber detalhes que antes eram imperceptíveis, como um padrão ou uma tendência em relação a um tipo de serviço e/ou produto. A análise permite ao gestor, assim, pensar na melhor estratégia com base em fatores reais, e não somente em sua experiência e intuição como gestor. Pergunta 5 Resposta Sobre as tecnologias relacionadas a mineração de dados e Big Data, leia o excerto a seguir: "Pesquisadores consideram que estamos vivenciando o início de uma nova revolução industrial, na qual os dados passam a ser elementos chaves dessa mudança. Podemos concluir, portanto, que esse é o momento ideal para criarmos oportunidades a partir dos dados." MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 8. Com base nisso, analise as asserções a seguir e a relação proposta entre elas: I. Big Data é uma área de inovações voltada ao processamento de grandes volumes de dados PORQUE II. as tecnologias e arquiteturas envolvidas permitem alta velocidade de coleta, novas descobertas e diversos processos de análise. A seguir, assinale a alternativa correta. 1 em 1 pontos 1 em 1 pontos Selecionada: Resposta Correta: Feedback da resposta: As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. Resposta correta. Embora as suas afirmações sejam verdadeiras, o que é afirmado na asserção II não justifica o que foi exposto na I. Isso porque as tecnologias e arquiteturas relacionadas ao Big Data são o meio que permite que os bancos de dados funcionem e suportem o processamento ao grande volume de dados, mas essas tecnologias não promoveram a revolução do Big Data, em si - elas apenas evoluíram de modo a acompanhar essa tendência. Pergunta 6 Resposta Selecionada: Resposta Correta: Feedback da resposta: Dentre as possíveis metodologias existentes para proceder à análise de dados, o CRISP-DM ( Cross- Industry Standard Process of Data Mining , ou Processo Industrial Padrão de Mineração de Dados) é um método que diz respeito a um processo de fluxo unidirecional composto por ciclos ou etapas, assim como o método KDD. Sobre CRISP-DM, assinale a alternativa correta: Envolve preparação, implantação, pesquisa, modelagem e avaliação de dados. Envolve preparação, implantação, pesquisa, modelagem e avaliação de dados. Resposta correta. o CRISP-DM possui diversas etapas, assim como o método KDD, contudo essas fases, embora tenham um fluxo unidirecional, possuem etapas cíclicas, ou seja, que permitem ir e voltar entre si. Por exemplo, a fase de entendimento e pesquisa de dados pode se alternar com a de implantação e preparação de dados, uma vez que se tenha localizado uma inconsistência no momento da implantação que traga a exigência de uma nova pesquisa ou de um novo entendimento sobre o dado com erro. Pergunta 7 Resposta Selecionada: Resposta Correta: Feedback da resposta: Em Ciência de Dados, há basicamente dois formatos de análise possível, em que a análise de dados pode recorrer tanto a procedimentos estatísticos quanto a algoritmos de aprendizado de máquina (ou análise preditiva) para descobrir padrões e extrair conhecimento de uma base de dados. A partir do exposto, associe as técnicas de análise dados a seguir às suas possíveis associações: (1) Análise exploratória. (2) Análisede estimação. (3) Análise de classificação. ( ) Regressão estatística. ( ) Cálculo do desvio padrão. ( ) Predição de valores discretos. Agora indique a ordenação correta entre os tipos de análise e seus respectivos métodos: 2, 1, 3. 2, 1, 3. Resposta correta. Você associou corretamente as colunas 2. ( Análise de estimação ) Regressão estatística, 1. ( Análise exploratória ) Cálculo do desvio padrão e 3. ( Análise de classificação ) Predição de valores discretos. As análises de estimação e de classificação fazem parte do campo da Predição, sendo que a primeira lida com valores discretos e, a segunda, com valores contínuos; já a análise preditiva ou exploratória usa 1 em 1 pontos 1 em 1 pontos conceitos básicos da estatística, como as medidas centrais e de dispersão, para investigar as variáveis, sendo o Desvio Padrão associado à medida de Variância. Pergunta 8 Resposta Selecionada: Resposta Correta: Feedback da resposta: A prática de análise de dados não é uma novidade para as empresas. Desde o tempo de arquivos em papel, era necessário ter uma equipe ou um especialista dedicado a organizar, filtrar e analisar as informações contidas nas bases de dados físicas. Para tanto, foi desenvolvido o método KDD, que consiste em um processo de descoberta de conhecimento dividido em várias etapas. Sobre as etapas de análise de dados pelo método KDD, avalie os itens a seguir: I. Mineração de dados II. Avaliação III. Seleção IV. Pré-processamento V. Transformação Agora assinale a alternativa que representa a ordem correta dessas etapas: IV, III, V, I, II. IV, III, V, I, II. Resposta correta. O KDD é um método que envolve a seleção dos dados, o pré- processamento, a transformação, a mineração dos dados e a avaliação dos resultados obtidos. Esse método funciona com qualquer quantidade de dados, e para qualquer finalidade. Sendo um padrão consistente, continua sendo adotado na Ciência de Dados. Pergunta 9 Resposta Selecionada: Resposta Correta: Feedback da resposta: Antigamente, as empresas mantinham grandes arquivos com dados de produtos, clientes, funcionários, relatórios de vendas, e assim por diante. Com o advento da internet, foi possível digitalizar e compartilhar essas informações. Contudo, o número de dados a serem arquivados também aumentou, o que gerou um problema de armazenamento e de processamento, exigindo que as empresas adequassem suas infraestruturas e aderissem a novas tecnologias. Esse é o início do Big Data. Nesse sentido, assinale a alternativa que apresenta as cinco características mais citadas do Big Data: Volume, Velocidade, Variedade, Valor e Veracidade. Volume, Velocidade, Variedade, Valor e Veracidade. Resposta correta. Quando nos referimos a Big Data, algumas características mais óbvias se destacam, como o Volume de dados, a Velocidade com que os dados são coletados, a Variedade de dados coletados, o Valor agregado a esses dados e a Veracidade que esses dados devem representar. Pergunta 10 Sobre agrupamento, leia o parágrafo a seguir: "Em um processo de agrupamento, os objetos são agrupados com o objetivo de maximizar a distância interclasse e minimizar a distância intraclasse, ou, dito de outra forma, maximizar a similaridade intraclasse e minimizar a similaridade interclasse." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 30. O processo de agrupamento ou clusterização é uma das técnicas utilizadas em mineração de dados. Esse processo faz parte da análise preditiva, que inclui classificação, regressão e segmentação de dados. A respeito dessas técnicas, indique a alternativa que apresenta o método comumente aplicado: 1 em 1 pontos 1 em 1 pontos 1 em 1 pontos Resposta Selecionada: Resposta Correta: Feedback da resposta: redes neurais. redes neurais. Resposta correta. As redes neurais fazem parte do aprendizado de máquina, usado tanto para aprendizagem supervisionada quanto não-supervisionada, de modo que são aplicadas tanto em técnicas de classificação quanto em modelos de regressão e na segmentação de dados.
Compartilhar