Prévia do material em texto
<p>Questão 1/10 - Big Data (E)</p><p>Quando pensamos em produção de dados, devemos lembrar dos dispositivos que estão interligados ao computador como: teclados, mouses, escâner, telas</p><p>sensíveis ao toque, leitores de códigos de barra, identificadores de radiofrequência, mesas digitalizadoras, entre outros. Ainda existem dispositivos que não estão</p><p>necessariamente conectados ao computador como: câmeras de vídeo, máquinas fotográficas e dispositivos portáteis. Os sensores são uma seção a parte, sendo</p><p>que os telefones celulares têm uma série destes sensores. Um exemplo, os smartphones podem executar atividades de vários dispositivos em um único</p><p>equipamento.</p><p>O telefone celular pode ter os seguintes sensores:</p><p>Nota: 10.0</p><p>A Câmeras, touch screen, sonar e radar.</p><p>B GPS, bússola, telescópio e filmadora.</p><p>C Câmeras, GPS, touch screen e bússola.</p><p>Você assinalou essa alternativa (C)</p><p>D Magnetômetro, giroscópio, acelerômetro e radar.</p><p>Questão 2/10 - Big Data (E)</p><p>A meta da governança de dados em um projeto de big data é criar processos capazes de garantir que esta estrutura de governança de dados seja mais um ponto de</p><p>ajuda a todos os envolvidos no projeto do que ser uma barreira que crie dificuldades às atividades do projeto. Ao longo do projeto de big data, muitos processos são</p><p>executados, em consonância com metodologias ágeis de desenvolvimento, elencamos alguns passos a serem seguidos para o sucesso do projeto:</p><p>Nota: 10.0</p><p>A Acesso a dados, integração de dados, limpeza de dados, controlador de dados, segurança de dados, análise de dados, avaliar</p><p>necessidade de negócio e compreensão do projeto.</p><p>Você assinalou essa alternativa (A)</p><p>B Estrutura, segurança, integração e qualidade de dados.</p><p>C Administração de dados, gerenciamento de dados, entrega de dados, análise de dados, e procesos big data.</p><p>D Variedade de dados, velocidade de processamento, veracidade de dados e conformidade.</p><p>Questão 3/10 - Big Data (E)</p><p>Analisar dados é aplicar algum tipo de transformação nos dados em busca de conhecimento. Existem alguns tipos de análises de dados e técnicas que são utilizados</p><p>dentro desse contexto, dessa forma marque a opção correta acerca desse tema:</p><p>Nota: 10.0</p><p>A Nas análises implícitas, a informação e o conhecimento estão disponíveis explicitamente nos dados, e normalmente só é necessária a</p><p>operação, de baixa complexidade, para ressaltar o dado e produzir a informação. A informação está lá, explicitamente, é preciso apenas de</p><p>la na “multidão”.</p><p>B O objetivo da análise exploratória é conhecer os dados antes de tentar analisa-los, para depois, usando técnicas explícitas ou imp</p><p>tirar alguma conclusão, a análise exploratória pode usar tanto técnicas quantitativas como técnicas visuais.</p><p>Você assinalou essa alternativa (B)</p><p>Você acertou!</p><p>Comentário: A lista abaixo apresenta os tipos de sensores encontrados em um smartphone:</p><p>Câmeras – esse sensor produz maior volume de dados;</p><p>Touch Screen: lê os toques da tela;</p><p>Acelerômetro: mede a aceleração do objeto em três eixos;</p><p>GPS: detecta a localização do celular. Pode utilizar a triangulação com as antenas de celular, ou conexão com três ou quatro satélites;</p><p>Giroscópio: detecta a orientação do celular em três eixos;</p><p>Magnetômetro: mede o campo magnética da terra. Tem aplicação para um aplicativo de bússola, por exemplo.</p><p>Você acertou!</p><p>Comentário:</p><p>Acesso a dados: conseguir todos os dados para o projeto, a captura, coleta, o armazenamento é a etapa inicial.</p><p>Integração de dados: sem dúvida é o processo mais difícil, pois envolve várias estruturas e formatos, fazer a normalização dos dados e garantir a</p><p>integração.</p><p>Limpeza de dados: alguns chamam de higienização dos dados, é um processo que elimina erros, duplicações, redundâncias, incompletude, imprecis</p><p>entre outros.</p><p>Controlador de dados: organizar os dados por áreas, departamentos, domínios a fim de estabelecer uma fonte de dados confiável. Organizar por pro</p><p>clientes, setores para que esses dados possam ser utilizados por outros sistemas.</p><p>Segurança de dados: aplicar regras de segurança, controle de acessos, classificar os dados confidenciais, usar criptografia e chaves de segurança c</p><p>necessário.</p><p>Análise de dados: o processo mais crucial de todo o projeto, é onde são feitas as descobertas, muito importante o papel dos analistas para traduzir o</p><p>dados brutos em informações confiáveis, gerando o conhecimento ao negócio.</p><p>Avaliar necessidades de negócio: ao longo do projeto é possível perceber outras necessidades de negócios, outras metas podem surgir durante as</p><p>análises e execução do projeto.</p><p>A compreensão do projeto: compreender o impacto que o projeto big data teve dentro da organização, fazer a documentação do projeto, o aprendiza</p><p>buscar melhorias contínuas e checar se a entrega do resultado chegou a todos os envolvidos no negócio e na TI.</p><p>C Já na análise explícita, a informação não está disponível claramente no conjunto de dados: mesmo que você olhe os dados de várias formas</p><p>selecione ou faça algum tipo de cálculo, a informação só será produzida com o uso de alguma função mais sofisticada.</p><p>D As técnicas quantitativas nunca usam as medidas como: dispersão, posição, média, mediana, amplitude e desvio padrão. A grande maio</p><p>ferramentas de análise de dados não utilizam medidas de dispersão de uma variável, como desvio padrão e variância.</p><p>Questão 4/10 - Big Data (E)</p><p>Os bancos de dados NoSQL (não relacionais) trouxeram uma mudança de paradigmas na sua utilização. É importante mostrar as características dos bancos de</p><p>dados NoSQL, por mais que haja poucas comparações entre os modelos de banco de dados, tais bancos de dados foram criados para atender outros cenários de</p><p>gerência de dados. São características do banco de dados Cassandra, exceto:</p><p>Nota: 10.0</p><p>A Alta escalabilidade e alta disponibilidade.</p><p>B Consistência ajustável e suporte para replicação, podendo estar em vários data centers.</p><p>C Seus modelos de dados são difíceis de serem alterados, sendo muito inflexíveis.</p><p>Você assinalou essa alternativa (C)</p><p>D Escalabilidade linear, podendo ser aumentada com a adição de novos nós.</p><p>Questão 5/10 - Big Data (E)</p><p>Podemos descrever as mídias sociais como tecnologias e práticas na internet, onde os usuários utilizam para expor suas opiniões, experiências, perspectivas, sendo</p><p>que o conteúdo publicado pode ter vários formatos incluindo: vídeos, fotos, animações, imagens e áudio. O crescimento dessas mídias possibilitou o</p><p>compartilhamento de ideias, construção de comunidades virtuais e uma democratização do conteúdo. A estrutura de coleta de dados é formada por três</p><p>componentes, assinale a alternativa que apresenta esses componentes:</p><p>Nota: 0.0 Você não pontuou essa questão</p><p>A Armazenamento de dados, organização e análise de dados.</p><p>B Armazenamento de dados, formatação e processamento de dados.</p><p>C Persistência de dados, estrutura de dados e simulação de dados.</p><p>D Captura de dados, organização e aplicação de dados.</p><p>Você assinalou essa alternativa (D)</p><p>Questão 6/10 - Big Data (E)</p><p>Segundo Davenport, tendo em vista os acontecimentos e todas as tendências tecnológicas estratégicas, o big data traz consigo uma gama de funcionalidades bem</p><p>especializadas que o difere dos sistemas legados. O big data é formado por diversos componentes que podem ser classificado em camadas, sendo estas:</p><p>Nota: 10.0</p><p>A Armazenamento, controle de dados, informações, linguagens de programação e aplicações.</p><p>B Física, enlace, rede, transporte, sessão, apresentação e aplicação.</p><p>C Hadoop, MapReduce, scripts, aprendizado de máquina, analytics, linguagem natural e aplicações.</p><p>Você acertou!</p><p>Comentário: Tema 5, Aula 2.</p><p>Você acertou!</p><p>Comentário: Seus modelos de dados são facilmente alterados, sendo muito flexível.</p><p>Comentário:</p><p>Armazenamento de dados: a estratégia de distribuição dos servidores, os sistemas, a rede, enfim todos os aspectos de infraestrutura de tecnologia, a</p><p>estruturado é um componente muito importante, uma boa distribuição garante que as informações serão armazenadas de forma adequada e segura,</p><p>políticas de backup, na maioria dos casos é necessário</p><p>um bom investimento em estruturas físicas dentro das organizações ou contratação de serviç</p><p>em computação na nuvem.</p><p>Organização: quando temos muitas informações existe a necessidade de categorizar e nivelar os dados não estruturados, semiestruturados e</p><p>estruturados, tudo isso vem para auxiliar e facilitar nos processos de análise e na distribuição desses dados dentro das plataformas como Hadoop e</p><p>banco de dados NoSQL.</p><p>Análise de Dados: com todos os dados devidamente armazenados e organizados, a análise trata da extração das informações e faz toda tradução de</p><p>informações em conhecimento, tendo como base os conceitos e regras de negócios, é bom comum o uso de estatística para auxiliar as organizações</p><p>tomada de decisão.</p><p>D Armazenamento, infraestrutura de plataforma, dados, código de aplicação, visão de negócios e aplicações.</p><p>Você assinalou essa alternativa (D)</p><p>Questão 7/10 - Big Data (E)</p><p>Grande parte das primeiras atividades em big data foi realizada por empresas de produtos e serviços na internet – Google, eBay, Yahoo!, Facebook, LinkedIn, entre</p><p>outras – e em startups que atuam na internet e em setores afins. Essas organizações consolidaram a área da ciência de dados e outras disciplinas do big data.</p><p>Dessa forma, muitas lições foram aprendidas no que se refere a big data nas empresas on-line e em startups. Marque ( V ) para as sentenças verdadeiras e ( F )</p><p>para as falsas:</p><p>( ) Utilizar o big data para a inovação de produtos e serviços;</p><p>( ) Trabalhar no desenvolvimento de ferramentas e não só de aplicações;</p><p>( ) Dar poder e autonomia para os cientistas de dados;</p><p>( ) Garantir a produtividade do trabalho com o big data;</p><p>( ) Não contribuir para o bem comum;</p><p>( ) Lembrar sempre que mesmo sendo ágil, ainda somos lentos demais;</p><p>( ) Usar e ter benefícios de ferramentas grátis e baratas;</p><p>( ) Não fazer experimentos em grande escala;</p><p>( ) Promover a colaboração e o conhecimento multidisciplinar.</p><p>A sequência correta é:</p><p>Nota: 0.0 Você não pontuou essa questão</p><p>A V, F, V, V, F, V, F, F, V</p><p>B V, V, F, V, F, F, V, F, V</p><p>C V, V, V, V, F, F, V, F, V</p><p>Você assinalou essa alternativa (C)</p><p>D V, V, V, V, F, V, V, F, V</p><p>Questão 8/10 - Big Data (E)</p><p>O termo Big Data começa a despertar muita atenção, mas ainda é um conceito mal definido e menos compreendido. Na definição de Big Data, utilizam-se</p><p>características ou atributos que alguns pesquisadores adotam como sendo os cinco Vs. Porém, a base necessária para o reconhecimento de Big Data é formada por</p><p>três propriedades:</p><p>Nota: 10.0</p><p>A valor, velocidade e volume.</p><p>B valor, veracidade e volume.</p><p>C variedade, valor e volume.</p><p>D variedade, velocidade e volume.</p><p>Você assinalou essa alternativa (D)</p><p>Questão 9/10 - Big Data (E)</p><p>Você acertou!</p><p>Comentário: Cada camada do empilhamento trabalha em conjunto, tudo é ajustado para que desde o armazenamento, incluindo o processamento</p><p>camada de aplicação.</p><p>Comentário:</p><p>Muitas lições foram aprendidas no que se refere a big data nas empresas on-line e em startups, entre elas podemos citar:</p><p>1. Utilizar o big data para a inovação de produtos e serviços;</p><p>2. Trabalhar no desenvolvimento de ferramentas e não só de aplicações;</p><p>3. Dar poder e autonomia para os cientistas de dados;</p><p>4. Garantir a produtividade do trabalho com o big data;</p><p>5. Contribuir para o bem comum;</p><p>6. Lembrar sempre que mesmo sendo ágil, ainda somos lentos demais;</p><p>7. Usar e ter benefícios de ferramentas grátis e baratas;</p><p>8. Fazer experimentos em grande escala;</p><p>9. Promover a colaboração e o conhecimento multidisciplinar.</p><p>Você acertou!</p><p>Comentário: Big Data, em geral, é definido como ativos de altos volume, velocidade e variedade de informação que exigem custo benefício, de f</p><p>inovadoras de processamento de informações para maior visibilidade e tomada de decisão. Big Data = volume + variedade + velocidade.</p><p>Segundo Machado, para o Big Data, temos que considerar como base cinco grandes pilares: são os 5 Vs: velocidade, volume, variedade, veracidade e valor.</p><p>Acrescentamos dois Vs importantíssimos: veracidade dos dados e valor destes para a empresa. Relacione o 5 Vs do Big Data com seus respectivos conceitos:</p><p>1) Velocidade 2) Volume 3) Variedade</p><p>4) Veracidade 5) Valor</p><p>( ) diz respeito às grandes quantidades de informação. Cada pessoa em suas atividades usuais do dia a dia produz uma infinidade de informações, diz respeito às</p><p>grandes quantidades de informação. Cada pessoa em suas atividades usuais do dia a dia produz uma infinidade de informações.</p><p>( ) se refere à grande agilidade com que os dados são produzidos: para se ter uma ideia, desde 2012, cerca de 2,5 hexabytes de dados (2,5 x 10^18) foram</p><p>produzidos pela humanidade todos os dias. Se dividirmos este valor por 86.400, que é a quantidade de segundos em um dia, pode-se concluir que 29 terabytes de</p><p>informação são produzidos a cada segundo – um número impressionante, mas que, segundo estimativas, poderá ainda crescer muito com o aumento da IoT</p><p>( ) é o ponto mais destacado em relação a aplicações de Big Data.</p><p>( ) é a necessidade que temos de garantir que os dados coletados sejam autênticos (com relação à fonte da informação) e que são verdadeiros naquele momento.</p><p>( ) define a grande diversidade de informações e que podem ser úteis para a geração de valor – seja um texto ou uma quantidade deles registrada em um site de</p><p>reclamações, uma “curtida” em uma rede social, coordenadas de um GPS, upload de fotos e gravações em um aplicativo de mensagens instantâneas, até as</p><p>filmagens transmitidas em tempo real por um drone conectado à rede.</p><p>A lacuna que relaciona corretamente os 5 Vs do Big Data e seu conceitos é a opção:</p><p>Nota: 10.0</p><p>A 1,3,4,2 e 5.</p><p>B 2,1,5,4 e 3.</p><p>Você assinalou essa alternativa (B)</p><p>C 2,1,4,5 e 3.</p><p>D 1,2,5,3 e 4.</p><p>Questão 10/10 - Big Data (E)</p><p>Dentro do contexto das tecnologias que desenvolvem e impulsionam o tratamento de grandes volumes de dados e que atuam com o “V” da velocidade do Big Data,</p><p>temos o conjunto de ferramentas (framework) de codificação e programação MapReduce. O MapReduce foi elaborado para atuar com computação paralela</p><p>distribuída, transformar grandes volumes de dados em pedaços menores. O MapReduce faz duas funções separadamente, sendo essas:</p><p>Nota: 10.0</p><p>A Processamento de dados e transporte de dados.</p><p>B Armazenamento de dados e depuração de dados.</p><p>C Formatação de dados e envio de dados.</p><p>D Mapeamento de dados e redução de dados.</p><p>Você assinalou essa alternativa (D)</p><p>Você acertou!</p><p>Comentário: Volume se refere a quantidade de informações, velocidade a agilidade de produção de dados, a veracidade garante a autenticidad</p><p>dados, a variedade está relacionada com a diversidade e o ponto mais destacado de um Big Data é o valor das informações.</p><p>Você acertou!</p><p>Comentário: O MapReduce foi projetado para trabalhar com problemas que podem ser fracionados em, digamos, subproblemas, de forma que poss</p><p>trabalhar com a aplicação de duas funções separadamente: mapeamento (Map) e redução (Reduce).</p>