Prévia do material em texto
Questão 1 Você está fazendo uma análise dos dados de sua empresa, pois pretende implantar um data warehouse. A sua tarefa é criar uma documentação separando as informações em estruturadas, semiestruturadas e não estruturadas. Após verificação em todos os arquivos da empresa, você chegou às seguintes conclusões: sua empresa tem 5 planilhas em Excel, um enorme banco de dados relacional de 1TB, 312 documentos em pdf, 12.000 e- mails e 212 páginas arquivadas em XML. Analisando a situação apresentada, pode-se afirmar: Selecione a resposta: • a As suas informações estruturadas estão no banco de dados relacional, as informações não estruturadas estão nos 12.000 e-mails e nos 312 documentos em pdf, e as informações semiestruturadas estão nas 212 páginas XML. Esta é a resposta correta Comentários da resposta As informações não estruturadas estão nos 12.000 e-mails e nos 312 documentos em pdf, pois elas não seguem um formato padrão de dados, e as informações semiestruturadas estão nas 212 páginas XML. Nesse caso, o XML segue um padrão "semiestruturado" dos dados. • b As suas informações não estruturadas estão no banco de dados relacional, as informações estruturadas estão nos 12.000 e-mails e nos 312 documentos em pdf, e as informações semiestruturadas estão nas 212 páginas XML. Comentários da resposta As informações não estruturadas estão nos 12.000 e-mails e nos 312 documentos em pdf, pois elas não seguem um formato padrão de dados, e as informações semiestruturadas estão nas 212 páginas XML. Nesse caso, o XML segue um padrão "semiestruturado" dos dados. • c As suas informações semiestruturadas estão no banco de dados relacional, as informações não estruturadas estão nos 12.000 e-mails e nos 312 documentos em pdf, e as informações estruturadas estão nas 212 páginas XML. Comentários da resposta As informações não estruturadas estão nos 12.000 e-mails e nos 312 documentos em pdf, pois elas não seguem um formato padrão de dados, e as informações semiestruturadas estão nas 212 páginas XML. Nesse caso, o XML segue um padrão "semiestruturado" dos dados. • d As suas informações estruturadas estão no banco de dados relacional, as informações semiestruturadas estão nos 12.000 e-mails e nos 312 documentos em pdf, e as informações não estruturadas estão nas 212 páginas XML. Você não acertou Comentários da resposta As informações não estruturadas estão nos 12.000 e-mails e nos 312 documentos em pdf, pois elas não seguem um formato padrão de dados, e as informações semiestruturadas estão nas 212 páginas XML. Nesse caso, o XML segue um padrão "semiestruturado" dos dados. • e As suas informações redimensionadas estão no banco de dados relacional, as informações duplicadas estão nos 12.000 e-mails e nos 312 documentos em pdf, e as informações indefinidas estão nas 212 páginas XML. Comentários da resposta As informações não estruturadas estão nos 12.000 e-mails e nos 312 documentos em pdf, pois elas não seguem um formato padrão de dados, e as informações semiestruturadas estão nas 212 páginas XML. Nesse caso, o XML segue um padrão "semiestruturado" dos dados. Questão 2 Uma empresa brasileira especializada em vendas possui um enorme data warehouse que contém todas as informações sobre quaisquer negócios da empresa. Imagine que o pessoal de compras precise fazer uma análise de tempos em tempos e que a referida análise sempre é feita apenas na parte de fornecedores da empresa. Assinale a alternativa que apresenta a melhor solução: Selecione a resposta: • a Replicar a base do data warehouse, permitindo que a cópia dos dados seja apenas para leitura. Comentários da resposta Criar um data mart, que é uma parte especializada que contenha as informações relativas aos fornecedores, pois, além de aprofundar o assunto relativo à necessidade, irá tornar essa base de dados mais rápida e simples de pesquisar. Eliminar os dados do data warehouse (DW) também não deve ser feito, visto que o DW deve conter todos os dados já filtrados e processados e que os DW são somente para leitura (não voláteis). Replicar os dados em uma planilha Excel geralmente é inviável, em virtude do tamanho, e os consultores teriam muito menos opções que ao usarem o DW. A resposta que se refere a retirar da base de dados qualquer objeto semiestruturado não funciona, pois o DW não é volátil e recebe dados estruturados. • b Criar um data mart especializado que tenha as informações relativas aos fornecedores. Você acertou! Comentários da resposta Criar um data mart, que é uma parte especializada que contenha as informações relativas aos fornecedores, pois, além de aprofundar o assunto relativo à necessidade, irá tornar essa base de dados mais rápida e simples de pesquisar. Eliminar os dados do data warehouse (DW) também não deve ser feito, visto que o DW deve conter todos os dados já filtrados e processados e que os DW são somente para leitura (não voláteis). Replicar os dados em uma planilha Excel geralmente é inviável, em virtude do tamanho, e os consultores teriam muito menos opções que ao usarem o DW. A resposta que se refere a retirar da base de dados qualquer objeto semiestruturado não funciona, pois o DW não é volátil e recebe dados estruturados. • c Eliminar do data warehouse os dados que não condizem com dados de fornecedores. Comentários da resposta Criar um data mart, que é uma parte especializada que contenha as informações relativas aos fornecedores, pois, além de aprofundar o assunto relativo à necessidade, irá tornar essa base de dados mais rápida e simples de pesquisar. Eliminar os dados do data warehouse (DW) também não deve ser feito, visto que o DW deve conter todos os dados já filtrados e processados e que os DW são somente para leitura (não voláteis). Replicar os dados em uma planilha Excel geralmente é inviável, em virtude do tamanho, e os consultores teriam muito menos opções que ao usarem o DW. A resposta que se refere a retirar da base de dados qualquer objeto semiestruturado não funciona, pois o DW não é volátil e recebe dados estruturados. • d Replicar em uma planilha do Excel os dados dos fornecedores, pois isso garante a segurança do data warehouse em relação aos acessos de quem irá pesquisar os fornecedores. Comentários da resposta Criar um data mart, que é uma parte especializada que contenha as informações relativas aos fornecedores, pois, além de aprofundar o assunto relativo à necessidade, irá tornar essa base de dados mais rápida e simples de pesquisar. Eliminar os dados do data warehouse (DW) também não deve ser feito, visto que o DW deve conter todos os dados já filtrados e processados e que os DW são somente para leitura (não voláteis). Replicar os dados em uma planilha Excel geralmente é inviável, em virtude do tamanho, e os consultores teriam muito menos opções que ao usarem o DW. A resposta que se refere a retirar da base de dados qualquer objeto semiestruturado não funciona, pois o DW não é volátil e recebe dados estruturados. • e Retirar da base de dados do data warehouse qualquer objeto semiestruturado. Comentários da resposta Criar um data mart, que é uma parte especializada que contenha as informações relativas aos fornecedores, pois, além de aprofundar o assunto relativo à necessidade, irá tornar essa base de dados mais rápida e simples de pesquisar. Eliminar os dados do data warehouse (DW) também não deve ser feito, visto que o DW deve conter todos os dados já filtrados e processados e que os DW são somente para leitura (não voláteis). Replicar os dados em uma planilha Excel geralmente é inviável, em virtude do tamanho, e os consultores teriam muito menos opções que ao usarem o DW. A resposta que se refere a retirar da base de dados qualquer objeto semiestruturado não funciona, pois o DW não é volátil e recebe dados estruturados. Questão 3 Os data warehouses, conhecidos como armazéns de dados, são muito importantespara as empresas. Um data warehouse deve ser bem planejado, e, para criá-lo, é necessário escolher uma boa ferramenta que satisfaça todas as necessidades que a empresa verifica na fase de análise antes da implantação. As seguintes ferramentas são usadas na criação de um data warehouse: SSIS, DataStage, PowerCenter, Ab Initio e Oracle Data Integrator. Qual dessas ferramentas é a única que não é baseada em ETL (extração, transformação e carregamento)? Selecione a resposta: • a Oracle Data Integrator. Esta é a resposta correta Comentários da resposta O Oracle Data Integrator contém um recurso exclusivo baseado na tecnologia ELT, e não na tecnologia ETL. A eliminação do servidor ETL entre a origem e o destino torna o ODI menos oneroso. O ODI interage com o Hadoop pelo widget de configuração de Big Data. DataStage, PowerCenter, Ab Initio e SSIS usam a tecnologia ELT. • b DataStage. Comentários da resposta O Oracle Data Integrator contém um recurso exclusivo baseado na tecnologia ELT, e não na tecnologia ETL. A eliminação do servidor ETL entre a origem e o destino torna o ODI menos oneroso. O ODI interage com o Hadoop pelo widget de configuração de Big Data. DataStage, PowerCenter, Ab Initio e SSIS usam a tecnologia ELT. • c PowerCenter. Comentários da resposta O Oracle Data Integrator contém um recurso exclusivo baseado na tecnologia ELT, e não na tecnologia ETL. A eliminação do servidor ETL entre a origem e o destino torna o ODI menos oneroso. O ODI interage com o Hadoop pelo widget de configuração de Big Data. DataStage, PowerCenter, Ab Initio e SSIS usam a tecnologia ELT. • d Ab Initio. Você não acertou Comentários da resposta O Oracle Data Integrator contém um recurso exclusivo baseado na tecnologia ELT, e não na tecnologia ETL. A eliminação do servidor ETL entre a origem e o destino torna o ODI menos oneroso. O ODI interage com o Hadoop pelo widget de configuração de Big Data. DataStage, PowerCenter, Ab Initio e SSIS usam a tecnologia ELT. • e SSIS. Comentários da resposta O Oracle Data Integrator contém um recurso exclusivo baseado na tecnologia ELT, e não na tecnologia ETL. A eliminação do servidor ETL entre a origem e o destino torna o ODI menos oneroso. O ODI interage com o Hadoop pelo widget de configuração de Big Data. DataStage, PowerCenter, Ab Initio e SSIS usam a tecnologia ELT. Questão 4 Os conceitos de dado e informação são diferentes, apesar de complementares. Quando se fala em Tecnologia da Informação, não é possível pensar em um sem o outro. Analise as alternativas a seguir e indique qual delas pode ser considerada uma informação segundo os conceitos de dado e informação: Selecione a resposta: • a Azulado. Comentários da resposta A única alternativa correta é "A bola azul é do jogador Carlos", pois ela passa uma informação completa que por si só faz sentido. As alternativas "Rio Grande do Sul", "Jogadores com mais de 30 anos", "Jogadores do Rio Grande do Sul gostam mesmo" e "Azulado", por si sós, não têm um sentido completo, portanto são consideradas apenas dados, e não informações. • b Rio Grande do Sul. Comentários da resposta A única alternativa correta é "A bola azul é do jogador Carlos", pois ela passa uma informação completa que por si só faz sentido. As alternativas "Rio Grande do Sul", "Jogadores com mais de 30 anos", "Jogadores do Rio Grande do Sul gostam mesmo" e "Azulado", por si sós, não têm um sentido completo, portanto são consideradas apenas dados, e não informações. • c Jogadores com mais de 30 anos. Comentários da resposta A única alternativa correta é "A bola azul é do jogador Carlos", pois ela passa uma informação completa que por si só faz sentido. As alternativas "Rio Grande do Sul", "Jogadores com mais de 30 anos", "Jogadores do Rio Grande do Sul gostam mesmo" e "Azulado", por si sós, não têm um sentido completo, portanto são consideradas apenas dados, e não informações. • d A bola azul é do jogador Carlos. Você acertou! Comentários da resposta A única alternativa correta é "A bola azul é do jogador Carlos", pois ela passa uma informação completa que por si só faz sentido. As alternativas "Rio Grande do Sul", "Jogadores com mais de 30 anos", "Jogadores do Rio Grande do Sul gostam mesmo" e "Azulado", por si sós, não têm um sentido completo, portanto são consideradas apenas dados, e não informações. • e Jogadores do Rio Grande do Sul gostam mesmo. Comentários da resposta A única alternativa correta é "A bola azul é do jogador Carlos", pois ela passa uma informação completa que por si só faz sentido. As alternativas "Rio Grande do Sul", "Jogadores com mais de 30 anos", "Jogadores do Rio Grande do Sul gostam mesmo" e "Azulado", por si sós, não têm um sentido completo, portanto são consideradas apenas dados, e não informações. Questão 5 Um data warehouse é um armazém de dados capaz de "aumentar'" a inteligência da empresa e fazer com que ela se torne mais competitiva. Depois de conhecer as vantagens de um data warehouse e entender suas vantagens, dificilmente uma empresa que está apontando para o futuro deixaria de implementá-lo. Analise as alternativas a seguir sobre data warehouse e assinale a correta. Selecione a resposta: • a Um data warehouse é um armazém de dados que não é volátil e que, quando precisa ser especializado por áreas, é dividido em data mining, que também não é volátil. Comentários da resposta Um data warehouse (DW) é um armazém de dados que não é volátil e que, quando precisa ser especializado por áreas, é dividido em data marts, que também não é volátil. As outras alternativas falam que a divisão em data marts (partes menores e especializadas de um assunto) é volátil, o que não é verdade, pois também fica não volátil (não pode ser apagada). Sobre a divisão ser feita em data mining, não é verdade, pois a divisão de um DW é feita em data marts. A respeito de o DW ser volátil, também está incorreto, pois um de seus objetivos é a integridade, que seria corrompida com a volatilidade dos dados. • b Um data warehouse é um armazém de dados que não é volátil e que, quando precisa ser especializado por áreas, é dividido em data mining, que é volátil. Você não acertou Comentários da resposta Um data warehouse (DW) é um armazém de dados que não é volátil e que, quando precisa ser especializado por áreas, é dividido em data marts, que também não é volátil. As outras alternativas falam que a divisão em data marts (partes menores e especializadas de um assunto) é volátil, o que não é verdade, pois também fica não volátil (não pode ser apagada). Sobre a divisão ser feita em data mining, não é verdade, pois a divisão de um DW é feita em data marts. A respeito de o DW ser volátil, também está incorreto, pois um de seus objetivos é a integridade, que seria corrompida com a volatilidade dos dados. • c Um data warehouse é um armazém de dados que é volátil e que, quando precisa ser especializado por áreas, é dividido em data marts, que também não é volátil. Comentários da resposta Um data warehouse (DW) é um armazém de dados que não é volátil e que, quando precisa ser especializado por áreas, é dividido em data marts, que também não é volátil. As outras alternativas falam que a divisão em data marts (partes menores e especializadas de um assunto) é volátil, o que não é verdade, pois também fica não volátil (não pode ser apagada). Sobre a divisão ser feita em data mining, não é verdade, pois a divisão de um DW é feita em data marts. A respeito de o DW ser volátil, também está incorreto, pois um de seus objetivos é a integridade, que seria corrompida com a volatilidade dos dados. • d Um data warehouse é um armazém de dados que não é volátil e que, quando precisa ser especializado por áreas, é dividido em data marts, que, nesse caso, é volátil. Comentários da resposta Um data warehouse (DW) é um armazém de dados que não é volátile que, quando precisa ser especializado por áreas, é dividido em data marts, que também não é volátil. As outras alternativas falam que a divisão em data marts (partes menores e especializadas de um assunto) é volátil, o que não é verdade, pois também fica não volátil (não pode ser apagada). Sobre a divisão ser feita em data mining, não é verdade, pois a divisão de um DW é feita em data marts. A respeito de o DW ser volátil, também está incorreto, pois um de seus objetivos é a integridade, que seria corrompida com a volatilidade dos dados. • e Um data warehouse é um armazém de dados que não é volátil e que, quando precisa ser especializado por áreas, é dividido em data marts, que também não é volátil. Esta é a resposta correta Comentários da resposta Um data warehouse (DW) é um armazém de dados que não é volátil e que, quando precisa ser especializado por áreas, é dividido em data marts, que também não é volátil. As outras alternativas falam que a divisão em data marts (partes menores e especializadas de um assunto) é volátil, o que não é verdade, pois também fica não volátil (não pode ser apagada). Sobre a divisão ser feita em data mining, não é verdade, pois a divisão de um DW é feita em data marts. A respeito de o DW ser volátil, também está incorreto, pois um de seus objetivos é a integridade, que seria corrompida com a volatilidade dos dados.