Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! 1) São algumas das técnicas de preenchimento de dados aplicadas a valores faltantes: I. Descartar toda a tupla; II. Preencher o valor faltante manualmente; III. Descartar todos os dados; IV. Usar constante global para preencher o valor faltante; V. Preencher os dados faltantes com null. São verdadeiras: Alternativas: I, II, III e IV I, II, III e V I, II e IV CORRETO I, III e V I, II e III Resolução comentada: As afirmativas III e V estão incorretas. São algumas das técnicas de preenchimento de dados aplicados a valores faltantes o descarte de toda a tupla, preencher o valor faltante manualmente e utilizar uma constante global para preencher o valor faltante. A afirmativa III está incorreta pois descartar todos os dados não é uma técnica de preenchimento, e deixará o usuário sem dados para trabalhar. A afirmativa V está incorreta porque null não é um dado. Código da questão: 42841 2) São atividades de integração de dados: ( ) Identificar os sistemas de origem; ( ) Compreender os sistemas de origem; ( ) Criar e registrar a lógica de correspondência; ( ) Realizar a limpeza dos dados; ( ) Carregar a dimensão conformada. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – V – V V – V – V – V – F V – V – V – F – V CORRETO V – V – F – V – F V – V – V – F – F Resolução comentada: São atividades de integração de dados identificar o sistema de origem, compreender o sistema de origem, criar e registrar a lógica de correspondência, estabelecer as regras de negócio de atributos não chave e carregar dimensão conformada. Código da questão: 42837 3) O agrupamento (clustering) é utilizado para eliminar outliers. Porque Os dados são automaticamente divididos em grupos (clusters) e pontos que não pertencem a um dado grupo são eliminados. Alternativas: A primeira asserção está correta e a segunda está incorreta. As duas asserções estão corretas e a segunda justifica a primeira CORRETO As duas asserções estão corretas e a segunda não justifica a primeira. A primeira asserção está incorreta e a segunda está incorreta A primeira asserção está incorreta e a segunda está correta. Resolução comentada: As duas asserções estão corretas e a segunda justifica a primeira. O agrupamento (clustering) se utiliza para que sejam eliminados os outliers, porque dessa forma, os dados se dividem em grupos (clusters) e alguns pontos não pertencentes a um dado grupo são eliminados. Código da questão: 42843 4) A conformação de dados é a combinação de dados de diferentes fontes em uma base de dados única e coerente. São alguns problemas relacionados à conformação de dados: I. Identificação de Entidades. II. Redundância. III. Conflito de Valores. IV. Suavização. V. Agregação. São verdadeiras: Alternativas: I, II e IV. I, III e V. I, II, III e IV. I, II e III. CORRETO I, II, III e V. Resolução comentada: As afirmações IV e V são falsas. São alguns dos problemas relacionas à conformação de dados, a identificação de entidades, a redundância e o conflito de valores. Código da questão: 42846 5) Existem vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo real: ( ) Timestamps. ( ) Tabelas de log ETL. ( ) Log dos SGBD. ( ) Incompatibilidade de dados. ( ) Monitores de Rede. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – F – V. CORRETO V – V – V – V – V. V – V – V – F – F. V – V – F – V – F. V – V – F – V – V. Resolução comentada: Os vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo real são: Timestamps (método que permite gravações frequentes de registros de data e hora nos sistemas para as alterações e leituras frequentes), tabelas de log ETL (tabelas que contém o identificados do registro novo ou alterado), Log dos SGBD (usados para identificar novas transações e transações alteradas) e Monitores de Rede (utilitários que monitoram algum conjunto de tráfego em um rede, filtrando e registrando o tráfego). Código da questão: 42857 6) São produtos fornecidos como opção ao comprar software de banco de dados e algumas funcionalidades são incorporadas ao banco de dados e não estão disponíveis separadamente na própria ferramenta ETL. Assinale a alternativa que apresenta, corretamente, a categoria de ferramenta de ETL descrita: Alternativas: Ferramenta ETL Base de dados integrada CORRETO Ferramenta ETL Business Intelligence Integrada Ferramenta ETL Produto de Nicho Ferramenta de ETL codificada manualmente Ferramenta ETL Pura Resolução comentada: A Ferramenta ETL Base de dados integrada é um produto fornecido como opção ao comprar software de banco de dados e algumas funcionalidades são incorporadas ao banco de dados e não estão disponíveis separadamente na própria ferramenta ETL . Código da questão: 42825 7) O subsistema de limpeza de dados necessita ser minucioso em sua detecção, correção e documentação da qualidade das informações que publica. Os usuários finais querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual pode construir suas métricas, estratégias e políticas de gerenciamento. Assinale a alternativa que apresente, corretamente, o objetivo de qualidade de dados descrito acima: Alternativas: Transparência. Validade. Correção. Completude. CORRETO Rapidez. Resolução comentada: Ser completo (completude) tem como característica ser minucioso em sua detecção, correção e documentação da qualidade das informações que publica. Os usuários finais querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual pode construir suas métricas, estratégias e políticas de gerenciamento. Código da questão: 42839 8) O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados, projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. Porque A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. Alternativas: A primeira asserção está incorreta e a segunda está incorreta. As duas asserções estão corretas e a segunda não justifica a primeira. CORRETO A primeira asserção está incorreta e a segunda está correta. As duas asserções estão corretas e a segunda justifica a primeira. A primeira asserção está correta e a segunda está incorreta. Resolução comentada: O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. A segunda afirmação é a consequência do uso da arquitetura, sendo determinada no projeto do CTF. Código da questão: 42858 9) Indique corretamente em qual etapa do processo ETL são preparadas as estruturas de tabelas dimensionais de forma mais restrita: Alternativas: Conformação Extração Limpeza Transformação Entrega CORRETOResolução comentada: Na etapa de entrega de dados são preparadas as estruturas de tabelas dimensionais de forma mais restrita. Código da questão: 42852 10) O uso de banco de dados é essencial para o processo de manipulação de dados, porém para fins analíticos é de difícil uso, sendo indicado o uso de um data warehouse. Assinale a alternativa que apresenta, corretamente, o principal objetivo de um data warehouse: Alternativas: Alteração de dados Armazenamento de dados Auxiliar à tomada de decisões CORRETO Recuperação de dados Transformação de dados Resolução comentada: O principal objetivo de um data warehouse é auxiliar as organizações na tomada de decisões, pois fornece dados que podem ser utilizados para fins analíticos. Código da questão: 42817
Compartilhar