Prévia do material em texto
Atividade módulo 2 - Introdução a ciência de dados 1- Informações obtidas por meio de análise de Big Data podem se reverter em benefícios tanto para as empresas quanto para seus clientes. Nesse contexto, analise as afirmações a seguir: I – Os clientes de uma empresa que utiliza Big Data podem ter suas necessidades atendidas de forma mais específica. II – Uma empresa que utiliza Big Data tem o potencial de aumentar a sua margem operacional, que é relacionada com o lucro operacional. III – O Big Data pode ser colocado em prática tanto em organizações públicas quanto em privadas, pois auxilia na melhoria dos serviços prestados. IV – Quanto menor a quantidade de dados analisados pelo Big Data, melhores serão os resultados das análises realizadas. Está correto apenas o que se afirma em: Escolha uma opção: e: I, II e III. A resposta correta é: I, II e III. 2- A união de bases de dados similares, para tentar melhorar a análise dos dados, é uma tarefa comum em ciência de dados. Dado que uma base de dados A contém dados íntegros, com grande confiabilidade e com campos similares aos de uma base de dados B, ambas as bases poderiam ser usadas para analisar um conjunto de dados. No entanto, na base B, verifica-se que 65% de seu total de campos está nulo, e muitos dados contêm erros relacionados ao formato. Qual seria uma boa estratégia a ser adotada dentro dos processos de ciência de dados? Escolha uma opção: A resposta correta é: A base A será mantida, pois contém dados confiáveis, e a base B será descartada. 3= A visualização de dados, também chamada de DataViz, precisa ser muito bem elaborada, pois ela é o produto do esforço do cientista de dados. Pensando nisso, entre as bibliotecas a seguir, quais têm foco em visualização de dados? Escolha uma opção: d: Matplotlib e Seaborn. A resposta correta é: Matplotlib e Seaborn. 4-No contexto da robótica, uma mão perfuradora pode realizar trabalhos específicos na indústria petroleira a fim de encontrar combustível. O contexto se refere a tentativa e erro por pessoas, em que o padrão não é gravado, pois é somente manipulado por uma pessoa. Ao falar do contexto da aprendizagem de máquina, o que pode ser aplicado? Escolha uma opção: A resposta correta é: Pode-se aplicar o aprendizado por reforço, pois, a cada ação da mão perfuradora, recompensa-se ou pune-se a fim de que tenha um padrão para o encontro de combustível. 5-O machine learning pode ser usado como uma tecnologia para identificar transações que podem ser fraudulentas. Uma instituição que faz operações de crédito precisa analisar se um novo cliente tem potencial de tornar-se inadimplente; assim, utiliza-se de uma base que contém dados de transações bancárias de 5 mil clientes dos últimos cinco anos, em que há a informação completa de financiamentos, cartões de crédito e compras realizadas e, ainda, se houve dívidas não pagas. Nesse contexto, pode-se afirmar: A resposta correta é: O problema tem uma base catalogada, e, assim pode-se utilizar o aprendizado supervisionado e, ainda, o algoritmo Naive Bayes ou SVM na classificação. 6- O RStudio é um ambiente de desenvolvimento integrado para a linguagem R. Nele há áreas para editor de código, console, histórico, files, plots, packages, help, viewer, etc. O que faz a aba packages? Escolha uma opção: A resposta correta é: Exibe as bibliotecas e a descrição e a versão de cada uma. Uma das ferramentas que ganhou mais notoriedade nos últimos anos é o Apache Spark. Qual é o seu diferencial? Escolha uma opção: A resposta correta é: O Apache Spark tem como diferencial o uso da escrita em memória, em vez de fazer várias chamadas ao disco rígido, aumentando sua velocidade no processamento dos dados. 8 - Ultimamente, com a crescente utilização de técnicas e ferramentas de Big Data, grande parte das empresas estão decidindo armazenar seus dados em nuvem e mais recentemente em bancos de dados NoSQL. Qual profissional está apto a trabalhar e manter sistemas de dados com essas tecnologias? Escolha uma opção: A resposta correta é: Engenheiro de dados. Tecnologias de Big Data não são utilizadas apenas para a análise de dados para a criação de novos produtos ou serviços, mas também para aperfeiçoar as atividades já realizadas. Nesse sentido, assinale a alternativa que apresenta uma das possíveis aplicações de Big Data: Escolha uma opção: A resposta correta é: Controle automático e preciso de preços de produtos com base no valor de suas matérias-primas e no consumo em tempo real. 10-Em um contexto geral, o Data Lake representa um repositório para grandes quantidades de dados. Portanto, pode-se afirmar que o Data Lake é: Em um contexto geral, o Data Lake representa um repositório para grandes quantidades de dados. Portanto, pode-se afirmar que o Data Lake é: