Prévia do material em texto
Sobre tomada de decisão estratégica, Provost e Fawcett explicam que a sigla DDD refere-se a Data-Driven Decision-making, ou seja, tomada de decisão com base nos dados, e consiste na prática de usar a análise de dados como suporte ao posicionamento estratégico em vez da gestão baseada na intuição pura. PROVOST, F.; FAWCETT, T. Data Science for Business: What you need to know about data mining and data-analytic thinking. Califórnia: O'Reilly, 2013. Pensando nisso, assinale a alternativa que reflete a prática de DDD: ( ) Usa a análise de dados para promover decisões mais assertivas. ( ) Permite manipular os dados para que se adequem aos objetivos. ( ) Cria um sistema de decisões automáticas a partir dos dados. ( ) Promove a inteligência artificial como substituta do gestor humano.F ( ) Ampara decisões intuitivas com base nos resultados da análise de dados. Sobre bases de dados, leia o parágrafo a seguir: “Atualmente, grande parcela dos dados gerados por humanos é oriunda de mídias sociais, onde usuários podem publicar o que pensam sobre algo, gerar debates, publicar suas preferências e suas emoções. Essas informações são geradas em formatos de texto, imagem, áudio e vídeo, resultando em uma base de dados diversificada e volumosa.” MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 18. Assinale a alternativa que representa o tipo de dado que estaria nessa base de dados diversificada e volumosa: Dados categóricos. Dados semiestruturados. Dados não-estruturados. Dados miscigenados. Dados estruturados. Em Ciência de Dados, há basicamente dois formatos de análise possível, em que a análise de dados pode recorrer tanto a procedimentos estatísticos quanto a algoritmos de aprendizado de máquina (ou análise preditiva) para descobrir padrões e extrair conhecimento de uma base de dados. A partir do exposto, associe as técnicas de análise dados a seguir às suas possíveis associações: (1) Análise exploratória. (2) Análise de estimação. (3) Análise de classificação. ( 2 ) Regressão estatística. ( 1 ) Cálculo do desvio padrão. ( 3) Predição de valores discretos. Agora indique a ordenação correta entre os tipos de análise e seus respectivos métodos: 1. Leia o trecho a seguir: "A mineração de dados envolve conhecimento de áreas como banco de dados, estatística, aprendizagem de máquina, computação de alto desempenho, reconhecimento de padrões, computação natural, visualização de dados, recuperação de informação, processamento de imagens e de sinais, análise espacial de dados, inteligência artificial, entre outras." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 28. Nesse sentido, há muitos conteúdos que se cruzam e que dão respaldo à mineração de dados, de modo que um bom cientista de dados ou analista de B.I. - Business Intelligence deve apresentar habilidades que vão desde a noção de mercado e negócios até estatística e programação. Com isso em mente, assinale a palavra que resume a condição desse campo de atuação de Big Data: Metodológica e múltipla. Multidisciplinar e interdisciplinar. Lógica e interdisciplinar. Humanística e lógica. Hipotética e multidisciplinar. Leia o trecho a seguir sobre mineração de dados: "Uma das famosas frases relacionadas a Big Data é: 'Big Data é o novo petróleo'. Podemos pensar que isso é uma analogia coerente, dado que, assim como o petróleo, o maior valor é obtido após um processo de refinamento, ou seja, após a transição de dados brutos para um determinado produto." MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 29. Sobre o termo data mining, analise as asserções a seguir e a relação proposta entre elas: I. O termo "mineração de dados" tem associação direta com a atividade de mineração de ouro, jazidas e pedras preciosas PORQUE II. encontrar os dados e a sua relação correta evoca informações que podem ser muito valiosas para as estratégias de uma empresa. Assinale a alternativa correta. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. As asserções I e II são proposições falsas. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. A asserção II é uma proposição falsa, e a I é uma proposição verdadeira. Leia o excerto a seguir: "Os algoritmos de aprendizagem de máquina são ferramentas poderosas para a descoberta de conhecimentos em bases de dados. Entretanto, uma etapa inicial do processo de mineração que não requer elevado nível de sofisticação é a análise descritiva dos dados, ou seja, o uso de ferramentas capazes de medir, explorar e descrever características intrínsecas aos dados." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29. Sobre os métodos usados em mineração de dados, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. Para identificar grupos de dados de acordo com um padrão específico, é usada a técnica de agrupamento ou clustering. II. O mapeamento de um conjunto de dados com variáveis discretas é possível a partir da técnica de regressão. III. A classificação é usada para mapear os valores discretos de um conjunto de dados. IV. Regras de associação servem, unicamente, para identificar grupos de dados. V. Deep learning , ou aprendizado de máquina, é um recurso usado tanto em análises com aprendizado supervisionado quanto em análises de aprendizado não-supervisionado. Assinale a alternativa que apresenta a sequência correta: V, F, V, F, V. F, V, V, V, F. V, F, V, F, F. F, V, F, V, F. V, F, F, V, V. Dentre as possíveis metodologias existentes para proceder à análise de dados, o CRISP-DM ( Cross-Industry Standard Process of Data Mining , ou Processo Industrial Padrão de Mineração de Dados) é um método que diz respeito a um processo de fluxo unidirecional composto por ciclos ou etapas, assim como o método KDD. Sobre CRISP-DM, assinale a alternativa correta: Envolve preparação, implantação, pesquisa, modelagem e avaliação de dados. É composto por fases cíclicas, sendo um processo idêntico ao método KDD. É um software proprietário com ferramentas que facilitam a análise de dados. Tem fases cíclicas, mas não conta com a etapa de preparação dos dados. Passa por várias fases, as quais vão se alternando entre si continuamente. Na atualidade, os dados são gerados continuamente pelas mais diversas fontes. Ao acessar um site, por exemplo, uma única pessoa gera dados relacionados aos cliques e movimentos do mouse, às palavras que escreve na tela, aos termos que busca no Google e aos conteúdos pelos quais se interessa. Pensando nos milhões de usuários que acessam a internet 24h por dia, o volume de dados gerado a cada segundo é impressionante. Com base nisso, assinale a alternativa correta. Não é necessário investir em novos recursos e tecnologias para dar suporte ao Big Data. Big Data é a evolução das tecnologias e arquiteturas relacionadas às bases de dados. Caso seja mantido o ritmo atual, futuramente não haverá suporte ao volume de dados. Bancos de dados sempre estiveram aptos a lidar com maiores volumes de informação. Mesmo que uma empresa não tenha dados para analisar, é possível prever tendências. Leia o excerto a seguir sobre métodos de treinamento e teste: "Na maioria das redes neurais esses parâmetros correspondem aos valores dos pesos da rede e à sua arquitetura (número de camadas e/ou neurônios); nas árvores de decisão esses parâmetros são os nós da árvore, sua arquitetura (profundidadee conexões) e as condições a serem associadas a cada arco; e nas regras de decisão os parâmetros são os antecedentes e consequentes de cada regra e o número total de regras." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 175. Pensando nas possíveis aplicações das técnicas de treinamento, avalie as seguintes afirmações: I. Redes Neurais, Árvores de Decisão e Indução de Regras são técnicas que se utilizam de Inteligência Artificial. II. Agrupamento é o mesmo que classificação ou clustering, e serve para identificar subconjuntos de dados. III. A pontuação é uma técnica que pode variar a partir da integração com outro método - o HMEQ. IV. As Árvores de Decisão usam uma técnica estatística complexa, de modo que são pouco usadas em análise de dados. É correto o que se afirma em: I, II e III, apenas. III, e IV, apenas. I, II e IV, apenas. II e III, apenas. I, III e IV, apenas. PERGUNTA 10 1. Considere a seguinte situação hipotética para responder a questão: Periodicamente, o auditor de um banco tem a necessidade de avaliar elementos que possam ajudar na identificação de fraudes como desvio de verba e balanceamento incorreto de caixa. Diante de uma denúncia anônima, o auditor agora deseja aplicar técnicas de mineração de dados para conseguir encontrar alguma inconsistência nos registros. Assim sendo, assinale a alternativa que apresenta a ação a ser tomada pelo auditor dessa instituição financeira. o auditor deve valer-se de instrumentos preditivos de análise para comparar dados passados aos registros atuais. o auditor deverá analisar o percentual de movimentação total do caixa, comparando projeções atuais e futuras. o auditor deverá comparar as informações da média de movimentação financeira entre os diferentes postos. o auditor pode contar com o fator surpresa para abordar um determinado posto e tentar constatar a fraude no ato. o auditor deve reportar imediatamente sua desconfiança à equipe de TI e solicitar varredura de toda a base de dados. Leia o trecho a seguir: “É comum, ao ouvir pela primeira vez o termo Big Data, pensarmos que ele está unicamente relacionado a um grande volume de dados (o que é normal, já que o nome diz exatamente isso). Entretanto, o volume de dados não é sua única característica.”. MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 8. Esse trecho é uma introdução da autora aos termos que designam os “5 Vs” de Big Data, sendo um deles o volume, que costuma ser o mais associado a uma grande base de dados, por motivos óbvios. Entretanto, há outras características que devem ser consideradas. Nesse sentido, leia e relacione cada um dos termos dos “5 Vs” às suas características correspondentes: (1) Volume. (2) Velocidade. (3) Veracidade. (4) Variedade. (5) Valor. ( ) Confiabilidade. ( ) Eventos estatísticos. ( ) Tipos de dados. ( ) Registros. ( ) Coleta de dados. A partir das relações feitas anteriormente, assinale a alternativa que apresenta a sequência correta: 2, 3, 4, 1, 5. 3, 5, 4, 1, 2. 5, 4, 1, 2, 3. 1, 3, 5, 2, 2. 3, 1, 2, 4, 5. Sobre análise descritiva de dados, leia o parágrafo a seguir: "As análises descritivas permitem uma sumarização e compreensão dos objetos da base e seus atributos, como qual o salário médio dos professores universitários brasileiros ou qual a distribuição salarial desses professores.” CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29. Com base nisso, avalie as asserções a seguir e a relação proposta entre elas: I. A partir da análise descritiva de dados, é possível prever o maior período de vendas de um e-commerce PORQUE, II. havendo uma base de dados com informações sobre os períodos de venda anteriores, há como verificar a existência de padrões a partir da mineração de dados. Assinale a alternativa correta: A asserção II é uma proposição verdadeira e a asserção I é uma proposição falsa. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. A asserção II é uma proposição falsa, e a I é uma proposição verdadeira. As asserções I e II são proposições falsas. Leia o trecho a seguir: “Após ter identificado o foco do projeto de Big Data e definido as respostas que deseja obter por meio de dados, você pode dar início à identificação de quais dados deverão ser capturados.” MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 35. Nesse trecho é afirmado que saber identificar o foco de um projeto de Big Data, ou seja, os objetivos da mineração de dados, é um passo fundamental para obter as respostas procuradas em um conjunto de dados. Sobre os objetivos do data mining , avalie e assinale a alternativa correta: Resposta Selecionada: Encontrar padrões nos dados visando o aprimoramento estatístico das hipóteses. Resposta Correta: Descobrir novas regras e padrões visando a aquisição de conhecimento indutivo. Feedback da resposta: Sua resposta está incorreta. A mineração de dados não visa o aprimoramento estatístico, nem confirma ou refuta hipóteses, nem segrega informações por si só - a mineração de dados serve para detectar padrões em uma base desconhecida ou que já tenha sido visitada, de modo a fornecer informações que serão transformadas em conhecimento após a análise final dos dados. Aplicar novas regras a informações anteriormente analisadas, embora possa ser objeto de um projeto de análise de dados, também não faz parte dos objetivos da etapa de mineração de dados, em si.