Baixe o app para aproveitar ainda mais
Prévia do material em texto
· Pergunta 1 1 em 1 pontos Sobre as tecnologias relacionadas a mineração de dados e Big Data, leia o excerto a seguir: "Pesquisadores consideram que estamos vivenciando o início de uma nova revolução industrial, na qual os dados passam a ser elementos chaves dessa mudança. Podemos concluir, portanto, que esse é o momento ideal para criarmos oportunidades a partir dos dados." MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 8. Com base nisso, analise as asserções a seguir e a relação proposta entre elas: I. Big Data é uma área de inovações voltada ao processamento de grandes volumes de dados PORQUE II. as tecnologias e arquiteturas envolvidas permitem alta velocidade de coleta, novas descobertas e diversos processos de análise. A seguir, assinale a alternativa correta. Resposta Selecionada: As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. Resposta Correta: As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. Comentário da resposta: Resposta correta. Embora as suas afirmações sejam verdadeiras, o que é afirmado na asserção II não justifica o que foi exposto na I. Isso porque as tecnologias e arquiteturas relacionadas ao Big Data são o meio que permite que os bancos de dados funcionem e suportem o processamento ao grande volume de dados, mas essas tecnologias não promoveram a revolução do Big Data, em si - elas apenas evoluíram de modo a acompanhar essa tendência. · Pergunta 2 1 em 1 pontos Leia o trecho a seguir: “É comum, ao ouvir pela primeira vez o termo Big Data, pensarmos que ele está unicamente relacionado a um grande volume de dados (o que é normal, já que o nome diz exatamente isso). Entretanto, o volume de dados não é sua única característica.”. MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 8. Esse trecho é uma introdução da autora aos termos que designam os “5 Vs” de Big Data, sendo um deles o volume, que costuma ser o mais associado a uma grande base de dados, por motivos óbvios. Entretanto, há outras características que devem ser consideradas. Nesse sentido, leia e relacione cada um dos termos dos “5 Vs” às suas características correspondentes: (1) Volume. (2) Velocidade. (3) Veracidade. (4) Variedade. (5) Valor. ( ) Confiabilidade. ( ) Eventos estatísticos. ( ) Tipos de dados. ( ) Registros. ( ) Coleta de dados. A partir das relações feitas anteriormente, assinale a alternativa que apresenta a sequência correta: Resposta Selecionada: 3, 5, 4, 1, 2. Resposta Correta: 3, 5, 4, 1, 2. Comentário da resposta: Resposta correta. A confiabilidade está associada à integridade e Veracidade dos dados, sendo um dos “5 Vs”; o Valor está associado a eventos estatísticos, que permitem confirmar ou refutar uma hipótese, por exemplo; já os tipos de dados, que podem ser estruturados ou não estruturados, configuram a Variedade; e a Velocidade está relacionada a quão rapidamente os dados são coletados e posteriormente registrados em suas bases de dados; esses registros dizem respeito, assim, ao Volume. · Pergunta 3 1 em 1 pontos Sobre agrupamento, leia o parágrafo a seguir: "Em um processo de agrupamento, os objetos são agrupados com o objetivo de maximizar a distância interclasse e minimizar a distância intraclasse, ou, dito de outra forma, maximizar a similaridade intraclasse e minimizar a similaridade interclasse." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 30. O processo de agrupamento ou clusterização é uma das técnicas utilizadas em mineração de dados. Esse processo faz parte da análise preditiva, que inclui classificação, regressão e segmentação de dados. A respeito dessas técnicas, indique a alternativa que apresenta o método comumente aplicado: Resposta Selecionada: redes neurais. Resposta Correta: redes neurais. Comentário da resposta: Resposta correta. As redes neurais fazem parte do aprendizado de máquina, usado tanto para aprendizagem supervisionada quanto não-supervisionada, de modo que são aplicadas tanto em técnicas de classificação quanto em modelos de regressão e na segmentação de dados. · Pergunta 4 1 em 1 pontos Sobre tomada de decisão estratégica, Provost e Fawcett explicam que a sigla DDD refere-se a Data-Driven Decision-making, ou seja, tomada de decisão com base nos dados, e consiste na prática de usar a análise de dados como suporte ao posicionamento estratégico em vez da gestão baseada na intuição pura. PROVOST, F.; FAWCETT, T. Data Science for Business: What you need to know about data mining and data-analytic thinking. Califórnia: O'Reilly, 2013. Pensando nisso, assinale a alternativa que reflete a prática de DDD: Resposta Selecionada: Usa a análise de dados para promover decisões mais assertivas. Resposta Correta: Usa a análise de dados para promover decisões mais assertivas. Comentário da resposta: Resposta correta. Uma vez que o gestor esteja com o resultado da análise de dados em mãos, ele consegue perceber detalhes que antes eram imperceptíveis, como um padrão ou uma tendência em relação a um tipo de serviço e/ou produto. A análise permite ao gestor, assim, pensar na melhor estratégia com base em fatores reais, e não somente em sua experiência e intuição como gestor. · Pergunta 5 0 em 1 pontos Dentre as possíveis metodologias existentes para proceder à análise de dados, o CRISP-DM ( Cross-Industry Standard Process of Data Mining , ou Processo Industrial Padrão de Mineração de Dados) é um método que diz respeito a um processo de fluxo unidirecional composto por ciclos ou etapas, assim como o método KDD. Sobre CRISP-DM, assinale a alternativa correta: Resposta Selecionada: É um software proprietário com ferramentas que facilitam a análise de dados. Resposta Correta: Envolve preparação, implantação, pesquisa, modelagem e avaliação de dados. Comentário da resposta: Sua resposta está incorreta.Sendo um método industrial, o CRISP-DM não diz respeito a um software, e sim a etapas que devem estar contidas no processo de análise de dados, de modo a permitir que os dados sejam sempre coletados, preparados, modelados e avaliados conforme um padrão, mantendo a qualidade. · Pergunta 6 1 em 1 pontos Em Ciência de Dados, há basicamente dois formatos de análise possível, em que a análise de dados pode recorrer tanto a procedimentos estatísticos quanto a algoritmos de aprendizado de máquina (ou análise preditiva) para descobrir padrões e extrair conhecimento de uma base de dados. A partir do exposto, associe as técnicas de análise dados a seguir às suas possíveis associações: (1) Análise exploratória. (2) Análise de estimação. (3) Análise de classificação. ( ) Regressão estatística. ( ) Cálculo do desvio padrão. ( ) Predição de valores discretos. Agora indique a ordenação correta entre os tipos de análise e seus respectivos métodos: Resposta Selecionada: 2, 1, 3. Resposta Correta: 2, 1, 3. Comentário da resposta: Resposta correta. Você associou corretamente as colunas 2. ( Análise de estimação ) Regressão estatística, 1. ( Análise exploratória ) Cálculo do desvio padrão e 3. ( Análise de classificação ) Predição de valores discretos. As análises de estimação e de classificação fazem parte do campo da Predição, sendo que a primeira lida com valores discretos e, a segunda, com valores contínuos; já a análise preditiva ou exploratória usa conceitos básicos da estatística, como as medidas centrais e de dispersão, para investigar as variáveis, sendo o Desvio Padrão associado à medida de Variância. · Pergunta 7 1 em 1 pontos Sobrebases de dados, leia o parágrafo a seguir: “Atualmente, grande parcela dos dados gerados por humanos é oriunda de mídias sociais, onde usuários podem publicar o que pensam sobre algo, gerar debates, publicar suas preferências e suas emoções. Essas informações são geradas em formatos de texto, imagem, áudio e vídeo, resultando em uma base de dados diversificada e volumosa.” MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 18. Assinale a alternativa que representa o tipo de dado que estaria nessa base de dados diversificada e volumosa: Resposta Selecionada: Dados não-estruturados. Resposta Correta: Dados não-estruturados. Comentário da resposta: Resposta correta. Nas mídias sociais e nas páginas web é possível encontrar diversos tipos de dados, como textos, imagens, vídeos, áudios e outros formatos. Essa mistura de dados em uma organização precária configuram os dados não-estruturados, que precisarão passar por tratamento antes de poderem ser minerados e analisados. · Pergunta 8 1 em 1 pontos Sobre detecção de anomalias, leia o trecho a seguir: "Uma base de dados pode conter objetos que não seguem o comportamento ou não possuem a característica comum dos dados ou de um modelo que os represente. Esses dados são conhecidos como anomalias ou valores discrepantes (outliers)." CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 31. Sobre os outliers (ou pontos fora da curva), analise as asserções a seguir e a relação proposta entre elas: I. Os outliers são considerados ruídos e às vezes filtrados automaticamente pela ferramenta utilizada, mas, em alguns casos devem ser mantidos PORQUE, II. em uma análise que objetiva a detecção de fraude, por exemplo, as anomalias podem conter informações significativas. Assinale a alternativa correta. Resposta Selecionada: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Resposta Correta: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Comentário da resposta: Resposta correta. Sabendo que no caso de detecção de fraude o ponto fora da curva é justamente aquele que pode indicar uma atividade fora do comum, os outliers podem, de fato, serem considerados dados importantes e significativos, de modo que a asserção II é uma justificativa correta da asserção I. · Pergunta 9 0 em 1 pontos Leia o trecho a seguir: “Após ter identificado o foco do projeto de Big Data e definido as respostas que deseja obter por meio de dados, você pode dar início à identificação de quais dados deverão ser capturados.” MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 35. Nesse trecho é afirmado que saber identificar o foco de um projeto de Big Data, ou seja, os objetivos da mineração de dados, é um passo fundamental para obter as respostas procuradas em um conjunto de dados. Sobre os objetivos do data mining , avalie e assinale a alternativa correta: Resposta Selecionada: Encontrar padrões nos dados visando o aprimoramento estatístico das hipóteses. Resposta Correta: Descobrir novas regras e padrões visando a aquisição de conhecimento indutivo. Comentário da resposta: Sua resposta está incorreta. A mineração de dados não visa o aprimoramento estatístico, nem confirma ou refuta hipóteses, nem segrega informações por si só - a mineração de dados serve para detectar padrões em uma base desconhecida ou que já tenha sido visitada, de modo a fornecer informações que serão transformadas em conhecimento após a análise final dos dados. Aplicar novas regras a informações anteriormente analisadas, embora possa ser objeto de um projeto de análise de dados, também não faz parte dos objetivos da etapa de mineração de dados, em si. · Pergunta 10 0 em 1 pontos Sobre análise descritiva de dados, leia o parágrafo a seguir: "As análises descritivas permitem uma sumarização e compreensão dos objetos da base e seus atributos, como qual o salário médio dos professores universitários brasileiros ou qual a distribuição salarial desses professores.” CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29. Com base nisso, avalie as asserções a seguir e a relação proposta entre elas: I. A partir da análise descritiva de dados, é possível prever o maior período de vendas de um e-commerce PORQUE, II. havendo uma base de dados com informações sobre os períodos de venda anteriores, há como verificar a existência de padrões a partir da mineração de dados. Assinale a alternativa correta: Resposta Selecionada: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Resposta Correta: A asserção II é uma proposição verdadeira e a asserção I é uma proposição falsa. Comentário da resposta: Sua resposta está incorreta. Quando falamos em análise descritiva de dados, estamos falando em obter informações a partir da estatística exploratória, que usa as medidas centrais e de dispersão, por exemplo, para investigar frequências e probabilidades dentro de um conjunto de dados. Assim sendo, é a análise preditiva de dados que é utilizada para prever uma tendência e, embora a asserção II seja uma justificativa correta da I, a asserção I é falsa.
Compartilhar