Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prova Impressa GABARITO | Avaliação I - Individual (Cod.:822555) Peso da Avaliação 1,50 Prova 63520966 Qtd. de Questões 10 Acertos/Erros 8/1 Canceladas 1 Nota 9,00 Percebe-se que as pessoas estão cada vez mais dependentes da tecnologia para executar suas atividades diárias, tanto profissionais, domésticas e de lazer. Para isso, as pessoas utilizam computadores, dispositivos móveis, armazenam os dados na nuvem, utilizam cartão de crédito, acessam redes sociais etc. Um conceito que representa esse cenário é o termo Big Data. O Big Data pode ser conceituado por volume, variedade e velocidade, formando os 3Vs. Essa definição é mais abrangente e quebra o mito de que o Big Data se refere apenas ao tamanho dos dados do armazenamento. Além disso, cada um dos 3Vs tem suas próprias ramificações para análises. Referente a cada um dos 3Vs, assinale a alternativa CORRETA: A O V da Velocidade é referente a se exigir velocidade de processamento em tempo real. B O V do Volume é referente a se ter diferentes tipos de dados, sendo eles estruturados ou não estruturados. C O V do Volume é porque são considerados apenas os dados estruturados que existem em grande quantidade. D O V da Variedade é oriundo do fato de se ter um grande volume de dados. A preparação de dados é necessária devido à presença de dados não formatados do mundo real. Sobre a composição desses dados do mundo real, analise as sentenças a seguir: I- Dados imprecisos (dados ausentes). II- A presença de dados ruidosos (dados errôneos e outliers). VOLTAR A+ Alterar modo de visualização 1 2 III- Dados inconsistentes. IV- Dados estruturados. Assinale a alternativa CORRETA: A As sentenças II e IV estão corretas. B As sentenças III e IV estão corretas. C As sentenças I, II e III estão corretas. D As sentenças I, II e IV estão corretas. Podemos destacar diversos exemplos de dados semiestruturados e não estruturados. Considerando esses exemplos, analise as opções a seguir: I- Arquivos .mp3. II- Arquivos textos, padrão .txt. III- Arquivos de vídeos. IV- Banco de dados. Assinale a alternativa CORRETA: A As opções I, III e IV estão corretas. B As opções I, II e IV estão corretas. C As opções I, II e III estão corretas. 3 D As opções III e IV estão corretas. Um gerente deseja conhecer o perfil dos clientes e dos possíveis clientes para criar campanhas de marketing direcionado. Os objetivos são aumentar a carteira de clientes da empresa e fidelizar os clientes existentes. Esse gerente não sabe como resolver o problema, porém, ele sabe que a área de TI da empresa pode o auxiliar. Digamos que o profissional de TI consiga identificar os dados relacionados com o problema que se referente aos dados estruturados, semiestruturados e não estruturados, bem como dados de redes sociais e de bases externas. Com base nos diferentes tipos de dados identificados e suas fontes, analise as sentenças a seguir: I- Somente as bases internas dizem respeito aos tipos de dados que são identificados no mapeamento do problema. II- Na identificação do problema, podemos nos deparar com dados estruturados, dados semiestruturados, dados não estruturados e também dados oriundos de redes sociais e de bases externas. III- Nesta identificação, os dados estruturados são oriundos de bancos de dados relacionais da organização. IV- Os dados não estruturados e semiestruturados podem ser provenientes das mais diversas fontes, como de arquivos de texto, imagem, áudio, vídeo, planilhas, além de pesquisas realizadas de mercado. Assinale a alternativa CORRETA: A As sentenças I e IV estão corretas. B As sentenças II, III e IV estão corretas. C As sentenças I e II estão corretas. D Somente a sentença III está correta. 4 Às vezes, o que pensamos ser um problema não é o problema real. Portanto, para chegar ao problema real, é necessário investigar. A análise de causa raiz é um método eficaz de análise: ajuda a identificar o que, como e por que algo aconteceu. Segundo Etmann (2018), chegar a um problema claramente definido é uma ação orientada a descobertas. Comece com uma definição conceitual e, por meio da análise (causa, análise de impacto etc.), você forma e redefine o problema em termos de questões. Um problema se torna conhecido quando uma pessoa observa uma discrepância entre a maneira como as coisas são e como deveriam ser. FONTE: ETMANN, Al. Big Data: The analytics life cycle. 2018. Disponível em: https://www.linkedin.com/pulse/big-datathe-analytics-life-cycle-alaa-etman/. Acesso em: 27 maio 2022. Sobre como podem ser identificados os problemas segundo Etmann (2018), assinale a alternativa INCORRETA: A Estudos comparativos e benchmarking. B Relatório de desempenho para avaliar o desempenho atual em relação às metas e objetivos. C Relatórios de desempenho visando futuras projeções da empresa, portanto, não precisa estar se pensando na identificação dos problemas. D Análise Strengths, Weaknesses, Opportunities e Threats (SWOT), que consiste em uma ferramenta para avaliar os pontos fortes, que são as Forças e Oportunidades, e os pontos fracos, que são Fraquezas e Ameaças (FOFA). Atenção: Esta questão foi cancelada, porém a pontuação foi considerada. A linguagem Python é uma linguagem de código aberto, possuindo compatibilidade multiplataforma e sintaxe simples. Além disso, a linguagem Python é uma linguagem orientada a objetos, de alto nível, e interpretada de script, servindo para diferentes fins, como de computação gráfica e estatística. Tanto as funcionalidades da linguagem Python quanto as funcionalidades da linguagem R são adicionadas por meio de bibliotecas (package). Referente aos comandos utilizados nas bibliotecas ggplot2 e pandas, assinale a alternativa INCORRETA: A O comando pip install pandas instala a biblioteca pandas. 5 6 B O comando import pandas as pd somente importa a biblioteca pandas. C O comando install.packages(“ggplot2) instala a biblioteca ggplot2. D O comando library(ggplot2) importa a biblioteca ggplot2. Existe uma ampla variedade de ferramentas de preparação de dados disponíveis, utilizadas para descobrir, processar, mesclar, refinar, enriquecer e transformar dados, possibilitando uma melhor integração, uso e análise de conjuntos de dados, além de linguagens utilizadas no processo. Embora o Python seja uma ferramenta popular entre os cientistas de dados, existe todo um ecossistema de ferramentas de ciências de dados. Para que você esteja preparado para o mercado de trabalho, é importante conhecer as principais ferramentas referentes ao ecossistema da preparação de dados. Com relação às ferramentas ALTERYX, DATAROBOT e LUMEN DATA, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Os principais recursos da ferramenta Lumen Data são experiência em gerenciamento de dados corporativos, governança e qualidade dos dados, integrações construídas e especialização em nuvem. ( ) A ferramenta Alteryx pode ser utilizada no desenvolvimento e nos testes de centenas de soluções que combinam preparação de dados em nível especializado com algoritmos de Machine Learning de R, Python, Spark, H20, TensorFlow etc. ( ) A ferramenta DataRobot é uma plataforma de gerenciamento de informações que adota uma abordagem em fases por meio de sua metodologia específica para Master Data Management (MDM). ( ) A ferramenta Alteryx é utilizada para descobrir, preparar os dados, realizar a análise e permitir compartilhar analytics e implantação. Assinale a alternativa que apresenta a sequência CORRETA: A V - F - V - F. B V - V - F - V. Revisar Conteúdo do Livro 7 C V - F - V - V. D V - F - F - V. A linguagem R é uma linguagem para manipulação de dados e análises estatísticas, de código aberto “[...] para computação estatística e construção de gráficos que pode ser baixada e distribuída gratuitamente, de acordo com a licença GNU. O R está disponível para as plataformas UNIX, Windows e MacOS” (LANDEIRO, 2011, sp). Com relaçãoà Linguagem R, classifique V para as sentenças verdadeiras e F para as falsas: ( ) A linguagem R possibilita que sejam gerados gráficos, mas estes não podem ser exportados para relatórios. ( ) A Linguagem R possui um amplo conjunto de bibliotecas para análise e visualização de dados. ( ) A linguagem R também é um conjunto de facilitadores para manipulação de dados. ( ) A linguagem R possui bibliotecas de manipulação e armazenamento de dados (arquivos de texto, bancos de dados etc.). Assinale a alternativa que apresenta a sequência CORRETA: FONTE: LANDEIRO, Victor Lemes. Introdução ao uso do programa R. Manaus: Instituto Nacional de Pesquisas da Amazônia, 2011. A F - F - V - V. B V - F - F - V. C F - V - V - V. Revisar Conteúdo do Livro 8 D F - V - V - F. Segundo Bi4all (2021, s.p.), "sabia que em 2020, a cada minuto, foram publicadas 347 mil novas Stories no Instagram, 147 mil fotos no Facebook e 41 milhões de mensagens foram trocadas no WhatsApp?". Cabe destacar "que mais de 4,5 biliões de pessoas usam internet, enquanto os utilizadores das redes sociais ultrapassaram já os 3,8 biliões com quase 60% da população mundial on-line. Estes números ilustram bem a quantidade de dados que circulam no mundo, o que oferece imensas oportunidades e desafios às empresas que transformam estes dados em valor para o negócio" (BI4ALL, 2021, s.p.). Com base no volume de dados que não significa qualidade de dados, classifique V para as sentenças verdadeiras e F para as sentenças falsas. ( ) A preparação de dados é essencial para todo e qualquer projeto que envolver a análise exploratória de dados. ( ) A qualidade do insumo interfere diretamente na qualidade do produto. ( ) Quanto maior a quantidade de dados melhor será o produto final. ( ) A qualidade do produto final está diretamente relacionada a se ter o maior número possível de informação. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: BI4ALL. 2021: A Soberania dos dados. 2021. Disponível em: https://www.bi4all.pt/noticias/blog/2021-a-soberania-dos-dados/. Acesso em: 25 maio 2021. A V - F - V - V. B V - V - F - F. C F - V - V - V. 9 D F - V - V - F. Segundo Bi4all (2021, s.p.), "sabia que em 2020, a cada minuto, foram publicadas 347 mil novas Stories no Instagram, 147 mil fotos no Facebook e 41 milhões de mensagens foram trocadas no WhatsApp?". Cabe destacar "que mais de 4,5 biliões de pessoas usam internet, enquanto os utilizadores das redes sociais ultrapassaram já os 3,8 biliões com quase 60% da população mundial on-line. Estes números ilustram bem a quantidade de dados que circulam no mundo, o que oferece imensas oportunidades e desafios às empresas que transformam estes dados em valor para o negócio" (BI4ALL, 2021, s.p.). Com base no volume de dados que não significa qualidade de dados, assinale a alternativa CORRETA: FONTE: BI4ALL. 2021: A Soberania dos dados. 2021. Disponível em: https://www.bi4all.pt/noticias/blog/2021-a-soberania-dos-dados/. Acesso em: 25 maio 2021. A Quanto maior a quantidade de dados, melhor será o produto final. B A qualidade do insumo não interfere na qualidade do produto. C A qualidade do produto final está diretamente relacionada a se ter o maior número possível de informação. D A preparação de dados é essencial para todo e qualquer projeto que envolver a análise exploratória de dados. 10 Imprimir
Compartilhar