Engenharia de Dados e Banco de Dados Aplicado AOL2 - Tentativa 1

Ciência de Dados

17/01/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Conteúdo do exercício
Ocultar opções de resposta
Pergunta 1 -- /0
Durante a etapa de Análise e Processamento e Big Data, os dados devem ser ajustados antes que sejam
efetivamente processados, o que envolve, dentre outras questões, a limpeza, preparação, indexação,
identificação de padrões, agrupamentos, correlações ou incoerências sobre os dados.
Considerando a etapa de Análise e Processamento de Big Data, ordene as etapas a seguir de acordo as
atividades de limpeza e preparação dos dados:
( ) Remoção de stopwords.
( ) Identificação de Termos Simples ou Compostos.
( ) Seleção de Termos Relevantes.
( ) Normalização Morfológica.
( ) Padronização do Vocabulário.
Agora, assinale a alternativa que apresenta a sequência correta:
1, 3, 5, 2, 4.
5, 2, 4, 3, 1.
3, 1, 2, 4, 5.
Resposta correta2, 1, 5, 3, 4.
2, 4, 3, 1, 5.
Pergunta 2 -- /0
Ocultar opções de resposta
Existem três tipos de dados disponíveis no mundo da tecnologia: Estruturados, não estruturados e
semiestruturados. Os dados estruturados são aqueles que contêm algum tipo de explicação para o seu
conteúdo, o metadado. Os não estruturados são aqueles livres de formato e explicações sobre seu
conteúdo. Já os semiestruturados são dados não estruturados que passaram por algum tipo de tratamento
para que possam ser processados.
Considerando as informações apresentadas e os conteúdos estudados, analise os exemplos a seguir e
associe-os com seus respectivos tipos de dados.
1) Estruturado.
2) Não Estruturado.
3) Semiestruturado.
( ) Arquivo em formato PDF.
( ) Data Lake.
( ) Tabela em Banco de Dados.
Agora, assinale a alternativa que apresenta a sequência correta:
Resposta correta2, 3, 1.
1, 3, 1.
2, 1, 3.
3, 1, 2.
1, 2, 3.
Pergunta 3 -- /0
Extração, Transformação e Carga (ETL) refere-se ao processo de extração de dados em diversas fontes,
transformação destes dados e carga em um armazém de dados. Na etapa de extração, os dados são
obtidos a partir de diferentes fontes e armazenados em uma área de transição, em que os dados passarão
pelo processo de transformação para serem posteriormente carregados em um Armazém de Dados.
Considerando os conceitos de ETL e o que foi estudado a respeito da fase de Extração, é correto afirmar
que existem três métodos de extração de dados. São eles:
Ocultar opções de resposta
Ocultar opções de resposta
total, parcial sem notificação de atualização e incremental com notificação de atualização.
Resposta correta
total, parcial sem notificação de atualização e parcial com notificação de
atualização.
inicial sem notificação de atualização, intermediária e final com notificação de atualização.
total, incremental com notificação de atualização e incompleta sem notificação de atualização.
incremental sem notificação de atualização, parcial e incompleta com notificação de atualização.
Pergunta 4 -- /0
Na área de Mineração de Dados (DM) existem os chamados algoritmos de agrupamento. Estes algoritmos
têm como objetivo agrupar conjuntos de dados, gerando os chamados Clusters, que deve conter dados
que apresentem algum nível de similaridade.
Assim, considerando as informações apresentadas e os conteúdos estudados, analise os algoritmos de
agrupamento a seguir e associe-os a suas respectivas características.
1) K-Means.
2) Aglomerativos.
3) Divisivos.
4) Métodos Baseados em Modelos.
( ) É um tipo de modelo hierárquico que utiliza a estratégia top-down (de cima para baixo).
( ) É selecionado um conjunto de registros a partir de um grupo de forma aleatória, no qual cada registro
selecionado representa um agrupamento.
( ) Utiliza a ideia de que os dados são gerados por uma série de distribuições, que tentam identificar qual o
melhor modelo para cada elemento.
( ) É um tipo de modelo hierárquico que utiliza a estratégia bottom-up (de baixo para cima).
Agora, assinale a alternativa que apresenta a sequência correta:
Resposta correta3, 1, 4, 2.
4, 1, 2, 3.
3, 1, 2, 4.
Ocultar opções de resposta
2, 4, 3, 1.
1, 2, 4, 3.
Pergunta 5 -- /0
Os Bancos de Dados comerciais mais comuns são aqueles que implementam o chamado Modelo de
Dados Relacional, cujos dados são armazenados em estruturas de tabelas (relações) com linhas e colunas
(metadado). Para processar os dados é utilizada a Linguagem de Consulta Estruturada (SQL). Entretanto,
sabemos que os dados processados no Big Data são, em sua imensa maioria, não estruturados. Logo, são
necessárias outras estruturas para seu armazenamento, como os Bancos de Dados NoSQL.
Considerando o conceito e objetivo dos Bancos de Dados NoSQL, assinale a alternativa correta:
O termo NoSQL refere-se ao fato de o Banco de Dados não oferecer suporte ao armazenamento
de dados em formato de tabelas.
Apesar de não oferecerem suporte à execução de comandos em linguagem SQL, os Bancos de
Dados NoSQL permitem armazenamento de dados em formato de tabela.
Os dados armazenados em Bancos de Dados NoSQL tendem a ser mais consistentes que os
dados armazenados em Bancos de Dados Relacionais.
Resposta correta
Bancos de Dados NoSQL são aqueles que não implementam o Modelo de Dados
Relacional, logo não fornecem nem executam comandos em linguagem SQL.
Os Bancos de Dados NoSQL são mais utilizados no contexto da área de Inteligência de
Negócios, uma vez que os dados ali armazenados são mais adequados ao processo de tomada
de decisão.
Pergunta 6 -- /0
Ocultar opções de resposta
O Big Data é uma estrutura em arquitetura distribuída, que geralmente tem mais poder de processamento
que as arquiteturas centralizadas. Seu processo tem como elemento central os chamados Data Lakes, que
são estruturas de armazenamento de todos os tipos de dados, estruturados e não estruturados. O
processo de transformação de dados em informações ocorre então a partir dos dados armazenados nos
Data Lakes.
Considerando o processo de Big Data, ordene as etapas a seguir de acordo as atividades de
processamento de dados realizadas:
( ) Carga e Armazenamento.
( ) Seleção de Fontes de Dados.
( ) Análise e Processamento.
( ) Visualização dos Dados.
Agora, assinale a alternativa que apresenta a sequência correta:
2, 4, 3, 1.
3, 1, 2, 4.
Resposta correta2, 1, 3, 4.
2, 4, 3, 1.
1, 3, 2, 4.
Pergunta 7 -- /0
Dados brutos extraídos a partir das fontes de dados não podem ser utilizados, uma vez que precisam ser
limpos, mapeados e transformados através de técnicas de transformação, que visam estruturar os dados
em um formato pronto para as atividades de processamento analítico, mineração de dados, consulta,
geração de relatórios e qualquer outro tipo processamento que vise extrair informações.
Com base nessas informações e no conteúdo estudado sobre as atividades de transformação de dados,
analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s).
I. ( ) Durante a etapa de transformação, são realizadas atividades de padronização dos dados e conversão
para o Character Set correto.
II. ( ) Durante a etapa de transformação, são realizadas atividades de conversão em unidades padrão para
datas, moedas e números.
III. ( ) Durante a etapa de transformação, são realizadas atividades de verificação se todos os campos
chave não possuem valores nulos.
Ocultar opções de resposta
Ocultar opções de resposta
IV. ( ) Durante a etapa de transformação, são realizadas atividades de verificação se todas as Visões
(Views) baseadas em tabelas alvo estão funcionando.
Agora, assinale a alternativa que apresenta a sequência correta:
V, F, V, F.
F, F, V, V.
F, V, F, V.
V, V, F, V.
Resposta corretaV, V, F, F.
Pergunta 8 -- /0
Leia o texto a seguir:
“A visão computacional é o processo de modelagem e replicação da visão humana usando software e
hardware. A visão computacional é uma disciplina que estuda como reconstruir, interromper e compreender
uma cena 3d a partir de suas imagens 2d em termos das propriedades da estrutura presente na cena.
”Fonte: DATA SCIENCE ACADEMY. O que é Visão Computacional? 28 jan. 2018. Disponível em:
<http://datascienceacademy.com.br/blog/o-que-e-visao-computacional/>.Acesso em: 12 jun. 2019.
A partir da leitura do fragmento acima, observamos que a área de Visão Computacional lida com a análise
de imagens e vídeos. Uma das principais técnicas utilizadas para esta finalidade é o Aprendizado de
Máquina (do inglês Machine Learning). Sobre esta técnica, podemos afirmar que:
Sua implementação é inviável, uma vez que é uma tecnologia muito nova e cara.
Incorreta:
Apresenta um modelo matemático baseado na estrutura neural de seres humanos inteligentes.
É mais adequada para contextos relacionados a reconhecimento facial.
Resposta correta
É um ramo da inteligência artificial que pode ser utilizado na identificação de
padrões em imagens e vídeos com o mínimo de intervenção humana.
Pode ser utilizada para substituir as técnicas de Deep Learning (Aprendizagem Profunda).
Ocultar opções de resposta
Pergunta 9 -- /0
Considerada uma subárea do Big Data, Analytics é o termo que se refere à utilização de dados, análises e
raciocínio como base para o processo de tomada de decisão mais eficiente. Suas técnicas podem ser
aplicadas em diversas áreas de negócios, como finanças (fintechs), vendas, marketing, etc.
Considerando o que foi estudado a respeito desse assunto, ordene as etapas a seguir de acordo as etapas
de análise do processo de Analytics:
( ) Análise Diagnóstica.
( ) Análise Descritiva.
( ) Análise Preditiva.
( ) Análise Prescritiva.
Agora, assinale a alternativa que apresenta a sequência correta:
2, 4, 3, 1.
1, 3, 2, 4.
2, 4, 3, 1.
3, 1, 2, 4.
Resposta correta2, 1, 3, 4.
Pergunta 10 -- /0
Técnicas tradicionais de ETL são utilizadas principalmente para dados estruturados, armazenados em
bancos de dados tradicionais. Estes dados, geralmente em menor número, são processados utilizando
técnicas como Mineração de Dados, por exemplo. Para os dados não estruturados, livres de formato, existe
o chamado Big Data, que é um conjunto massivo de dados em diferentes formatos.
Ocultar opções de resposta
Considerando os conceitos ETL e Big Data, podemos dizer que um projeto de Big Data se diferencia dos
demais em função das seguintes características:
disponibilidade, volume e variedade.
velocidade, disponibilidade e variedade.
velocidade, volume e disponibilidade.
Resposta corretavelocidade, volume e variedade.
disponibilidade, integridade e volume.