Baixe o app para aproveitar ainda mais
Prévia do material em texto
Usuário ELSON GOMES CHIQUINI Curso POS0557 DATA MINING PG0377211 - 202112.ead-15434.01 Teste Teste Final (N2) Iniciado 23/02/21 08:35 Enviado 23/02/21 08:48 Status Completada Resultado da tentativa 10 em 10 pontos Tempo decorrido 13 minutos Resultados exibidos Respostas enviadas, Respostas corretas, Comentários · Pergunta 1 · 1 em 1 pontos Leia o excerto a seguir: "Os algoritmos de aprendizagem de máquina são ferramentas poderosas para a descoberta de conhecimentos em bases de dados. Entretanto, uma etapa inicial do processo de mineração que não requer elevado nível de sofisticação é a análise descritiva dos dados, ou seja, o uso de ferramentas capazes de medir, explorar e descrever características intrínsecas aos dados." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29. Sobre os métodos usados em mineração de dados, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. Para identificar grupos de dados de acordo com um padrão específico, é usada a técnica de agrupamento ou clustering. II. O mapeamento de um conjunto de dados com variáveis discretas é possível a partir da técnica de regressão. III. A classificação é usada para mapear os valores discretos de um conjunto de dados. IV. Regras de associação servem, unicamente, para identificar grupos de dados. V. Deep learning , ou aprendizado de máquina, é um recurso usado tanto em análises com aprendizado supervisionado quanto em análises de aprendizado não-supervisionado. Assinale a alternativa que apresenta a sequência correta: Resposta Selecionada: V, F, V, F, V. Resposta Correta: V, F, V, F, V. Comentário da resposta: Resposta correta. As afirmações I, III e V são verdadeiras porque falam corretamente sobre a técnica de clusterização e os tipos de variáveis envolvidas, bem como do uso de treinamento supervisionado ou não-supervisionado pelo aprendizado de máquina; já as afirmações II e IV são falsas, pois e estimação usa variáveis contínuas (e não discretas), e porque as regras de associação servem para analisar a significância (e não para identificar grupos de dados, em si). · Pergunta 2 · 1 em 1 pontos Leia o trecho a seguir sobre mineração de dados: "Uma das famosas frases relacionadas a Big Data é: 'Big Data é o novo petróleo'. Podemos pensar que isso é uma analogia coerente, dado que, assim como o petróleo, o maior valor é obtido após um processo de refinamento, ou seja, após a transição de dados brutos para um determinado produto." MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 29. Sobre o termo data mining, analise as asserções a seguir e a relação proposta entre elas: I. O termo "mineração de dados" tem associação direta com a atividade de mineração de ouro, jazidas e pedras preciosas PORQUE II. encontrar os dados e a sua relação correta evoca informações que podem ser muito valiosas para as estratégias de uma empresa. Assinale a alternativa correta. Resposta Selecionada: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Resposta Correta: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Comentário da resposta: Resposta correta. Empresas se beneficiam com a análise de dados justamente porque a mineração de dados leva à descoberta de novos padrões, informações e conhecimentos, o que permite não apenas alterar um processo interno da empresa, como também pode evidenciar um erro ou um padrão que não havia sido notado antes. · Pergunta 3 · 1 em 1 pontos As etapas de mineração de dados de utilizam ferramentas, técnicas e algoritmos de algumas diferentes áreas do conhecimento para trabalhar com um conjunto de dados, a partir do qual serão extraídas as informações necessárias, conforme os objetivos de pesquisa ou de negócio. Sobre as áreas relacionadas à mineração de dados, associe os itens a seguir aos seus correspondentes: (1) Big Data. (2) Inteligência Artificial. (3) Estatística. ( ) Validação de dados. ( ) Aprendizado de máquina. ( ) Manipulação de dados. Assinale a alternativa correta. Resposta Selecionada: 3, 2, 1. Resposta Correta: 3, 2, 1. Comentário da resposta: Resposta correta. Você realizou a associação correta entre 1. (Big Data - Manipulação de dados), 2. (Inteligência Artificial - Aprendizado de máquina) e 3. Estatística (Validação de dados). Isso porque, enquanto as tecnologias de banco de dados associadas ao Big Data evoluíram para acomodar grandes volumes a maiores taxas de processamento, a Estatística funciona para avaliar resultados e validá-los, e o aprendizado de máquina só é possível por conta dos estudos de inteligência artificial. · Pergunta 4 · 1 em 1 pontos Dentre as possíveis metodologias existentes para proceder à análise de dados, o CRISP-DM ( Cross-Industry Standard Process of Data Mining , ou Processo Industrial Padrão de Mineração de Dados) é um método que diz respeito a um processo de fluxo unidirecional composto por ciclos ou etapas, assim como o método KDD. Sobre CRISP-DM, assinale a alternativa correta: Resposta Selecionada: Envolve preparação, implantação, pesquisa, modelagem e avaliação de dados. Resposta Correta: Envolve preparação, implantação, pesquisa, modelagem e avaliação de dados. Comentário da resposta: Resposta correta. o CRISP-DM possui diversas etapas, assim como o método KDD, contudo essas fases, embora tenham um fluxo unidirecional, possuem etapas cíclicas, ou seja, que permitem ir e voltar entre si. Por exemplo, a fase de entendimento e pesquisa de dados pode se alternar com a de implantação e preparação de dados, uma vez que se tenha localizado uma inconsistência no momento da implantação que traga a exigência de uma nova pesquisa ou de um novo entendimento sobre o dado com erro. · Pergunta 5 · 1 em 1 pontos Sobre análise descritiva de dados, leia o parágrafo a seguir: "As análises descritivas permitem uma sumarização e compreensão dos objetos da base e seus atributos, como qual o salário médio dos professores universitários brasileiros ou qual a distribuição salarial desses professores.” CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29. Com base nisso, avalie as asserções a seguir e a relação proposta entre elas: I. A partir da análise descritiva de dados, é possível prever o maior período de vendas de um e-commerce PORQUE, II. havendo uma base de dados com informações sobre os períodos de venda anteriores, há como verificar a existência de padrões a partir da mineração de dados. Assinale a alternativa correta: Resposta Selecionada: A asserção II é uma proposição verdadeira e a asserção I é uma proposição falsa. Resposta Correta: A asserção II é uma proposição verdadeira e a asserção I é uma proposição falsa. Comentário da resposta: Resposta correta. A análise descritiva de dados é usada junto à estatística exploratória, ou seja, usa medidas de centro e de variação para analisar frequências, probabilidades e compreender melhor os padrões de um conjunto de dados. Usa-se, para isso, da média, da moda e da mediana, além de medidas de dispersão para encontrar a Amplitude, a Variância e o Desvio Padrão. Assim sendo, a asserção II é verdadeira e justifica a asserção I, contudo a asserção I é falsa, pois não é a análise descritiva de dados que usamos para prever tendências, e sim a análise preditiva. · Pergunta 6 · 1 em 1 pontos Sobre tomada de decisão estratégica, Provost e Fawcett explicam que a sigla DDD refere-se a Data-Driven Decision-making, ou seja, tomada de decisão com base nos dados, e consiste na prática de usar a análisede dados como suporte ao posicionamento estratégico em vez da gestão baseada na intuição pura. PROVOST, F.; FAWCETT, T. Data Science for Business: What you need to know about data mining and data-analytic thinking. Califórnia: O'Reilly, 2013. Pensando nisso, assinale a alternativa que reflete a prática de DDD: Resposta Selecionada: Usa a análise de dados para promover decisões mais assertivas. Resposta Correta: Usa a análise de dados para promover decisões mais assertivas. Comentário da resposta: Resposta correta. Uma vez que o gestor esteja com o resultado da análise de dados em mãos, ele consegue perceber detalhes que antes eram imperceptíveis, como um padrão ou uma tendência em relação a um tipo de serviço e/ou produto. A análise permite ao gestor, assim, pensar na melhor estratégia com base em fatores reais, e não somente em sua experiência e intuição como gestor. · Pergunta 7 · 1 em 1 pontos Em Ciência de Dados, há basicamente dois formatos de análise possível, em que a análise de dados pode recorrer tanto a procedimentos estatísticos quanto a algoritmos de aprendizado de máquina (ou análise preditiva) para descobrir padrões e extrair conhecimento de uma base de dados. A partir do exposto, associe as técnicas de análise dados a seguir às suas possíveis associações: (1) Análise exploratória. (2) Análise de estimação. (3) Análise de classificação. ( ) Regressão estatística. ( ) Cálculo do desvio padrão. ( ) Predição de valores discretos. Agora indique a ordenação correta entre os tipos de análise e seus respectivos métodos: Resposta Selecionada: 2, 1, 3. Resposta Correta: 2, 1, 3. Comentário da resposta: Resposta correta. Você associou corretamente as colunas 2. ( Análise de estimação ) Regressão estatística, 1. ( Análise exploratória ) Cálculo do desvio padrão e 3. ( Análise de classificação ) Predição de valores discretos. As análises de estimação e de classificação fazem parte do campo da Predição, sendo que a primeira lida com valores discretos e, a segunda, com valores contínuos; já a análise preditiva ou exploratória usa conceitos básicos da estatística, como as medidas centrais e de dispersão, para investigar as variáveis, sendo o Desvio Padrão associado à medida de Variância. · Pergunta 8 · 1 em 1 pontos Sobre agrupamento, leia o parágrafo a seguir: "Em um processo de agrupamento, os objetos são agrupados com o objetivo de maximizar a distância interclasse e minimizar a distância intraclasse, ou, dito de outra forma, maximizar a similaridade intraclasse e minimizar a similaridade interclasse." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 30. O processo de agrupamento ou clusterização é uma das técnicas utilizadas em mineração de dados. Esse processo faz parte da análise preditiva, que inclui classificação, regressão e segmentação de dados. A respeito dessas técnicas, indique a alternativa que apresenta o método comumente aplicado: Resposta Selecionada: redes neurais. Resposta Correta: redes neurais. Comentário da resposta: Resposta correta. As redes neurais fazem parte do aprendizado de máquina, usado tanto para aprendizagem supervisionada quanto não-supervisionada, de modo que são aplicadas tanto em técnicas de classificação quanto em modelos de regressão e na segmentação de dados. · Pergunta 9 · 1 em 1 pontos A mineração de dados é um processo relacionado às áreas de Ciência de Dados e Big Data responsável por integrar um processamento maior dentro da análise de dados, que consiste em diferentes etapas. Esse processo permite que os dados sejam extraídos e trabalhados a partir de um dataset. Nesse sentido, assinale a alternativa que define a etapa imediatamente anterior à da mineração de dados. Resposta Selecionada: Transformar os dados conforme um padrão. Resposta Correta: Transformar os dados conforme um padrão. Comentário da resposta: Resposta correta. Após as etapas de seleção de de pré-processamento, será na fase da transformação dos dados que ocorrerá a conversão dos dados brutos em um formato padrão que seja possível de filtrar e utilizar para a análise estatística,, de forma que os dados estejam melhor relacionados entre si e que possam ser analisados posteriormente. · Pergunta 10 · 1 em 1 pontos Na atualidade, os dados são gerados continuamente pelas mais diversas fontes. Ao acessar um site, por exemplo, uma única pessoa gera dados relacionados aos cliques e movimentos do mouse, às palavras que escreve na tela, aos termos que busca no Google e aos conteúdos pelos quais se interessa. Pensando nos milhões de usuários que acessam a internet 24h por dia, o volume de dados gerado a cada segundo é impressionante. Com base nisso, assinale a alternativa correta. Resposta Selecionada: Big Data é a evolução das tecnologias e arquiteturas relacionadas às bases de dados. Resposta Correta: Big Data é a evolução das tecnologias e arquiteturas relacionadas às bases de dados. Comentário da resposta: Resposta correta. Não é à toa que um dos “5 Vs” de Big Data seja Velocidade. Para comportar grandes volumes de dados, as tecnologias envolvidas também precisaram melhorar em termos de processamento - só assim foi possível acompanhar e dar suporte à entrada contínua de dados na rede.
Compartilhar