Prévia do material em texto
Prova Impressa GABARITO | Avaliação da Disciplina (Cod.:645440) Peso da Avaliação 10,00 Prova 93298499 Qtd. de Questões 20 Nota 9,00 Nem sempre obter dados significa obter mais conhecimentos ou informações que acrescentem valor de negócio à tomada de decisões. Sendo preciso ir além de saber quais dados existem na sua empresa e quais ferramentas estão ou precisarão ser utilizadas, mas ainda avaliar a capacidade dos dados, identificando oportunidades para atender às necessidades de negócio e de fato gerar valor. Para isso, algumas questões devem ser respondidas, como: I- Quais dados sua empresa realmente precisa? II- Quais dados existem em sua empresa? III- Como é realizada a gestão dos dados da sua empresa? O que quer dizer cada item: P- Compreenda como seu negócio identifica prioridades para os dados melhorarem a tomada de decisões da empresa, podendo impulsionar os seus negócios. Q - É preciso definir, esclarecer e treinar sobre as políticas, os processos, sobre a gestão e a segurança dos dados confiados à sua empresa. R- Verifique quais dados dos seus consumidores proporcionam maiores engajamentos em sua empresa. Relacione os números I, II e III às letras P, Q e R e marque a opção com a relação correta: A I – P; II – R; III – Q. B I – R; II – P; III – Q. C I – P; II – Q; III – R. VOLTAR A+ Alterar modo de visualização 1 D I – Q; II – R; III – P. “As Coisas”, que englobam desde sensores (temperatura, umidade, luminosidade, etc.), os objetos do nosso dia a dia (geladeiras, TVs, carros, etc.) estarão conectados entre si em rede, de modo inteligente e passarão a “sentir” o mundo ao redor e a interagir.” (ASHTON, K., 1999). O trecho acima trata de que tecnologia? Marque a opção correta: A Data Science. B Machine Learning. C Internet das Coisas. D Big Data. Diversos são os dispositivos IoT, que juntamente com Big Data visam o tempo todo tornar nosso ambiente em todo o nosso entorno mais inteligente, no sentido de mais sensoriamentos. Neste contexto, dispositivos IoT apresentam três classes, a saber: A- Objetos puramente passivos com identificação de dados fixos, sendo identificados na Physical Internface Zone. B- Objetos dotados de moderado poder computacional e percepção de contexto, por meio de sensores que podem gerar mensagens e variar a informação associada a eles. C- Objetos que possuem conectividade em rede, sem a intervenção humana, possibilitando a emergência da inteligência nos sistemas de rede. Portanto, marque a alternativa correta: A As opções A e B estão corretas. B Somente a opção B está correta. 2 3 C Apenas a opção A está correta. D As opções A, B e C estão corretas. A arquitetura para o processamento de grandes volumes de dados apresenta características como: distribuição paralela para contornar o problema da pouca confiabilidade do hardware, e redundante, pois a falha de qualquer nó (um processador e uma unidade de armazenamento) não deve causar nenhum efeito sobre o desempenho do sistema (GHENAWAT; GOBIOFF; LEUNG, 2003). Neste contexto, alguns pontos sobre a Arquitetura de Processamento devem ser considerados, a saber: ( ) O sistema deve ser intrinsecamente tolerante a falhas. Dado o tamanho dos clusters e o tipo de hardware utilizado, considerando a probabilidade de ocorrer uma falha em algum dos nós é, para todos os efeitos, de 1 para 1000, portanto médio entre falhas (em inglês, mean time between failures, MTBF). ( ) A maior parte das alterações nos arquivos são acréscimos (appends). Ou seja, as escritas em posições aleatórias são praticamente inexistentes. Ou seja, a grande maioria dos acessos é para leitura e, geralmente, essa leitura é sequencial. ( ) O tipo mais comum de processamento é em lote, ou batch, ao invés de pequenos ciclos de leitura e escrita. Assim, o sistema deve ser otimizado para garantir uma resposta contínua em termos de consumo de banda, ao invés de ter uma latência pequena. ( ) A forma de armazenamento da informação deve ser flexível, podendo não armazenar dados estruturados e não estruturados, que serão processados com a utilização de diversas tecnologias. Classifique as sentenças acima como (V) verdadeiro ou (F) falso. Marque a opção correta: A V; F; F; V. B V; V; V; F. C V; V; F; F. 4 D F; F; F; V. O cientista de dados deve conhecer de tecnologia, de matemática, ter curiosidade e criatividade. Um cientista curioso é aquele que não se conforma com qualquer coisa, qualquer informação. Agora, conseguir um profissional com conhecimentos técnicos, quantitativos, curioso e colaborativo/comunicativo é bem difícil. Ao mesmo tempo, este cientista de dados deve saber atuar como um líder, juntamente com profissionais especializados no que fazem. Quais profissionais são aliados ao cientista de dados complementando uma equipe Analytics? Marque a alternativa correta. A Data Engineer; Equipe de Manutenção; Gerente de Projetos; Suporte Técnico; Matemático; Analista de Negócios; Designer. B Data Engineer; Advogado; DBA; Programador; Estatístico; Analista de Negócios; Designer. C Data Engineer; Equipe de Extração; DBA; Programador; Estatístico; Analista de Negócios; Designer. D Data Engineer; Equipe Testes; DBA; Administrador; Estatístico; Analista de Negócios; Contador. Um Big Data deve possuir pelo menos três aspectos, os chamados 3Vs do Big Data. Marque a alternativa que apresenta os 3Vs: A Variedade; Validez; Volume. B Volume; Variedade; Velocidade. C Variedade; Vencimento; Valor. 5 6 D Volume; Validade; Variedade. A integração de bases de dados diferentes pode apresentar ruídos, informações ambíguas, conflitantes ou mesmo errôneas. Portanto, a qualidade do processo de análise dos dados dependerá da qualidade dos dados armazenados nas bases. Neste contexto, quais das alternativas abaixo apresentam características importantes para se garantir a qualidade dos dados? Marque a opção correta: A Integridade; Granularidade; Confiabilidade; Funcionabilidade; Consistência; Flexibilidade. B Integridade; Granularidade; Tempestividade; Precisão; Consistência; Flexibilidade. C Integridade; Eficiência; Eficácia; Precisão; Consistência; Flexibilidade. D Integridade; Portabilidade; Tempestividade; Precisão; Usabilidade; Flexibilidade. O objetivo principal do modelo preditivo é ir além de saber o que aconteceu, ao fornecer uma melhor estimativa do que poderá acontecer no futuro. Usando dados, algoritmos e métodos oriundos da estatística, aprendizado de máquinas e mineração de dados para se determinar as chances de resultados futuros, ou desconhecidos, com base em dados passados. O modelo preditivo apresenta três aspectos importantes e que precisam ser compreendidos. Qual das alternativas apresenta os aspectos corretos? A Ensinar o Modelo; Fazer Análises; Gera Relatórios. B Coletar Dados; Treinar o Modelo; Fazer Predições. 7 8 C Coletar Dados; Gerir Dados; Prever Dados. D Fazer predições; Fazer Análise; Avaliar Custos. Compreendemos que as soluções tecnológicas que trabalham com Big Data permitem analisar um volume enorme de dados de forma rápida e ainda oferece um melhor controle para os gestores das informações. As alternativas abaixo representam aplicações de Big Data: ( ) Reduzir más contratações, analisar rapidamente todos os dados dos candidatos, inclusive se suas ideologias e metas estão de acordo com os princípios da empresa, maximizando a probabilidade de contratar o funcionário ideal. ( ) Serviços oferecidos por Fast Foods, como Burger King e McDonald’s estão se tornando otimizados, as unidades estão sendo monitoradas e mudando os recursos de menu, conforme o perfil do cliente. ( ) Prever performance, predizer se determinado colaborador será capaz de se destacar perante os demais do setor, se possui ideias inovadoras para o negócio ou talento para outras atividadesna empresa, necessita de uma análise minuciosa e constante. ( ) Gerar recomendações, utilizar o histórico de compras e buscas do cliente pelo navegador para gerar uma lista de produtos que também possam ser de interesse. Classifique as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa que apresenta a sequência correta: A V; F; V; V B V; V; V; V. C F; F; F; V. D F; V; F; F. 9 O armazenamento de dados, conforme alguns autores, influencia na qualidade dos dados, para auxiliar a recuperação, no descarte e na segurança. Portanto, alguns fatores para se obter qualidade dos dados devem ser levados em consideração, como: ( ) Cópias de segurança: é vital que sejam realizadas regularmente e que as instituições mantenham um programa de recuperação de cópia; em casos de desastres, não haverá perdas significativas. ( ) Arquivamento: é um processo contínuo que inclui também o descarte de dados obsoletos e contribui para que os dados se mantenham facilmente acessíveis e prontos para serem analisados. ( ) Integridade dos dados: busca proteger os dados não só de perdas, mas também de serem acessados por pessoas não autorizadas. Classifique as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa que apresenta a sequência correta: A V; F; F. B F; F; V. C V ; V; V. D F; V; F. O processo para obtenção dos dados possui diversas etapas, desde a coleta do dado até o seu descarte. Visando auxiliar estas necessidades para captar e gerar dados e atribuir valor junto à tomada de decisões, há um processo genérico no qual é estruturado o ciclo de vida dos dados. Quais etapas compõem esse processo genérico? Marque a alternativa correta. A Desenvolvimento, Armazenamento, Transformação, Transição, Descarte. 10 11 B Produção, Processamento, Transformação, Teste, Descarte. C Produção, Armazenamento, Transformação, Análise, Descarte. D Desenvolvimento, Processamento, Construção, Análise, Descarte. Uma forma de analisar dados com o objetivo de automatizar o desenvolvimento de modelos analíticos, de maneira que o aprendizado é realizado a partir de algoritmos que aprendem de maneira interativa, ou seja, com base na análise em tempo real dos dados, os computadores proporcionam informações importantes para apoiar áreas de negócios. O enunciado acima trata de que conceito? Marque a alternativa correta. A Data Analytics. B Machine Learning. C Big Data. D Machine Data. Nas palavras de Eric Siegel, em seu livro Predictive Analytics: “Os dados que coletamos atualmente nos permitem ver coisas que até pouco tempo atrás eram grandes demais para enxergarmos.” Quando estamos falando de Big Data, em uma das suas etapas tratamos a capacidade de análise dos dados. Há quatro tipos de análises em Big Data, uma delas é a Análise Preditiva. Assinale qual das opções abaixo descreve corretamente este tipo de análise. A Se preocupa exclusivamente com os dados passados, é utilizada com interesse em saber o motivo por que determinados eventos aconteceram, na tentativa de minimizar eventuais problemas presentes. Corresponde a um tipo mais avançado de análise, em que são utilizadas 12 13 técnicas como mineração, correlações, detalhamento e descoberta de dados em busca da descoberta das causas do problema. B Utiliza a otimização de forma a identificar as melhores alternativas e maximizar ou minimizar algum objetivo. Utilizam-se ferramentas estatísticas tanto de análise descritiva quanto a preditiva alinhada à gestão de negócios, para gerar recomendações automáticas buscando aperfeiçoar estratégias. Basicamente é uma forma de definir qual a escolha será mais efetiva em determinada situação. C Utilizada para perceber performances passadas e atuais de negócios, para tomada de decisões, categorizando, caracterizando, consolidando e classificando os dados em informação útil. Utilizam-se métricas e técnicas de estatística para gerar gráficos e relatórios sobre orçamentos, vendas, receitas, processamento analítico on-line (OLAP), painéis/scorecards e visualização de dados. Através desta análise, uma organização pode avaliar dados sobre a queda das vendas de um produto ou faturamento da empresa nas últimas semanas ou meses, por exemplo. D Avalia performances passadas, detectando padrões e relações entre os dados futuros. O objetivo é “prever” o futuro, por meio de mineração de dados, dados estatísticos e históricos. Para este modelo também são utilizadas técnicas como Machine Learning e Inteligência Artificial. Um exemplo seria a previsão do faturamento para o próximo trimestre ou a quantidade de chamadas que poderão ocorrer em uma central de call center para próxima campanha publicitária. São inúmeras aplicações em que Big Data vem auxiliando na resolução de problemas, que levariam anos, meses ou até mesmo não seriam possíveis de analisar. Entre as grandes empresas que empregam Big Data, podemos citar: a IBM, Google, SAP, Cloudera, Teradata, New Relic, Salesforce, Microsoft, Tableau Software e tantas outras. São diversas empresas que vêm desenvolvendo ou utilizando sistemas na área Big Data. Portanto, existe uma lista vasta para aplicações de Big Data, tais como: I. Análises de dados médicos. II. Análises de dados trafegados em redes. III. Publicidade e propaganda personalizados. IV. Uso de telefones celulares para telemarketing. 14 V. Informações sobre o tempo. VI. Informações sobre trânsito e modelos de tráfego. VII. Web Analytics (sites de e-commerce). Classifique as sentenças I a VII como (V) Verdadeiro ou (F) Falso e marque qual a opção apresenta a sequência correta: A V; F; V; F; V; V; V. B F; F; V; V; V; V; V. C V; V; F; V; F; V; F. D V; V; V; V; V; V; V. Cloud Computing ou Computação em Nuvem é caracterizado como a utilização da memória e da capacidade de armazenamento interligadas em uma Rede de Computadores por meio da Internet. Possibilitando o acesso a um conjunto compartilhado de recursos computacionais. Sobre Cloud Computing, podemos classificá-la em Cloud Privada e Cloud Pública. Marque qual opção representa uma Cloud Privada e Cloud Pública, também conhecida como Cloud Híbrida: A A empresa de Clotilde optou por armazenar seus dados de forma que todos os dados dos seus clientes, ou mais confidenciais, fossem armazenados em uma infraestrutura de serviços terceirizados. B A empresa de Maria optou por armazenar seus dados de forma que todos os dados administrativos fossem armazenados fora da empresa, juntamente com demais informações, também armazenadas em uma infraestrutura de serviços terceirizados. 15 C A empresa de João optou por armazenar seus dados de forma que todos os dados bancários, ou mais confidenciais, fossem armazenados dentro da própria empresa e as demais informações organizacionais pudessem ser armazenadas em uma infraestrutura de serviços terceirizados. D A empresa de Fernando optou por armazenar seus dados de forma que dados bancários, ou mais confidenciais, fossem armazenados dentro da sua própria empresa, assim como as demais informações pudessem também ser armazenadas em uma infraestrutura exclusiva da empresa. Tem aviões mandando informações de por onde estão voando e quais as condições climáticas, permitindo voos muito mais seguros e quase independentes dos pilotos. Até o seu carro pode transmitir quais são as condições da estrada em que você está dirigindo e acompanhar os dados do GPS de motoristas que ajudam a predizer os horários e locais que estarão mais congestionados, em parte é isso que você faz quando usa aplicativos para cortar caminhos. Quando estamos falando de Big Data, estamos tratando a capacidade de análise dos dados. Há quatro tipos de análises em Big Data, uma delas é a Análise Prescritiva. Assinale qual das opções abaixo descreve corretamente este tipo de análise. A Utilizadapara perceber performances passadas e atuais de negócios, para tomada de decisões, categorizando, caracterizando, consolidando e classificando os dados em informação útil. Utilizam-se métricas e técnicas de estatística para gerar gráficos e relatórios sobre orçamentos, vendas, receitas, processamento analítico on-line (OLAP), painéis/scorecards e visualização de dados. Através desta análise, uma organização pode avaliar dados sobre a queda das vendas de um produto ou faturamento da empresa nas últimas semanas ou meses, por exemplo. B Utiliza a otimização de forma a identificar as melhores alternativas e maximizar ou minimizar algum objetivo. Utilizam-se ferramentas estatísticas tanto de análise descritiva quanto a preditiva alinhada à gestão de negócios, para gerar recomendações automáticas buscando aperfeiçoar estratégias. Basicamente é uma forma de definir qual a escolha será mais efetiva em determinada situação. C Se preocupa com os dados passados, é utilizada com interesse em saber o motivo por que determinados eventos aconteceram na análise descritiva, na tentativa de minimizar eventuais problemas presentes. Corresponde a um tipo mais avançado de análise, em que são utilizadas técnicas como mineração, correlações, detalhamento e descoberta de dados em busca da descoberta das causas do problema. 16 D Avalia performances passadas, detectando padrões e relações entre os dados futuros. O objetivo é “prever” o futuro, por meio de mineração de dados, dados estatísticos e históricos. Para este modelo também são utilizadas técnicas como Machine Learning e Inteligência Artificial. Um exemplo seria a previsão do faturamento para o próximo trimestre ou a quantidade de chamadas que poderão ocorrer em uma central de call center para próxima campanha publicitária. Aprovado pelo plenário do Senado Federal, o PLC 53/2018 dispõe sobre a proteção de dados pessoais e altera a Lei 12.965/16 do Marco Civil da Internet, sendo consolidada como a Lei Geral de Proteção de Dados Brasileira (LGPD). Recentemente, Josefa Christina fez uma compra on-line em um site e-commerce, no qual forneceu seus principais dados pessoais, como: nome, CPF, e-mail, telefone, endereço. Logo em seguida, passou a receber diversas ofertas de outros sites parceiros do e-commerce no qual ela havia realizado a compra, mas em momento algum concordou em compartilhar os seus dados. Diante deste cenário e de acordo com a Lei Geral de Proteção de Dados Brasileiros, qual direito não foi atendido pelo site em que Josefa realizou suas compras on-line? Marque a opção correta: A Regras para empresas. B Direito do Consumidor. C Direito à Privacidade. D Segurança Jurídica. Uma outra ferramenta importante para o Universo Big Data é o HBase, um grande Banco de Dados distribuídos, que permite acessar grande volume de dados de maneira rápida. Ainda sobre o HBase, podemos afirmar: ( ) Tolerante a falhas; ( ) Realiza pesquisas somente em dados arquivados offline; 17 18 ( ) Faz exportações de métricas através de plug-ins de arquivo e ganglia; ( ) Modelo de dados acomoda ampla gama de casos de uso. Classifique as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa que apresenta a sequência correta: A F; V; V; F. B F; F; V; F. C V; V; V; V. D V; F; V; V. O objetivo das técnicas de Aprendizagem de Máquina ou Machine Learning é aprender um modelo (hipótese), usando o conjunto de treinamento para relacionar atributos da entrada a valores do atributo de saída. Para isso, alguns paradigmas de treinamento são utilizados. Marque a alternativa que apresenta os principais paradigmas de treinamento: A Naive Bayes; K-Nearest Neighbor; Semissupervisionado; Supervisionada; Reforço. B Aprendizagem Supervisionada; Reforço; Aprendizagem Não Supervisionada, Semissupervisionado. C Regressão Linear; Aprendizagem Não Supervisionada, Semissupervisionado; Reforço. 19 D Supervised Learning; Machine Learning; Unsupervisid Learning; Aprendizagem de Codificação. Ainda há desafios em inserir novas tecnologias com a IoT e Big Data para trazer melhorias na operação dos negócios, como a segurança e confiança dos dados dos clientes/usuários. Os principais desafios podem ser apontados como: I. A privacidade do consumidor poderá ser comprometida com o grande volume de dados trafegando com informações sobre o usuário desses dispositivos. II. A gestão de armazenamento se preocupa cada vez mais com a capacidade de armazenamento das empresas, se esta será suficiente para coletar e utilizar dados da IoT de forma eficaz em relação ao custo. III. A tecnologia dos servidores será focada em um crescente investimento em áreas essenciais e organizações relacionadas a IoT visando rendimento ou valores significativos. IV. Redes de data centers serão modificadas para permitir alto volume de dados de sensores de mensagens pequenas para processo em data center, afetando assim a largura de banda de entrada, que deverá aumentar no data center. Quanto às alternativas I, II, III e IV, marque a opção correta: A Apenas as alternativas III e IV estão corretas. B Todas as alternativas estão corretas. C Apenas as alternativas I e II estão corretas. D Alternativas I, II e III estão erradas. 20 Imprimir