Atividade_02-Respostas - Anhembi Morumbi - Engenharia de Dados

•

UAM

Dedicado Sempre

05/10/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Engenharia de

15 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Usuário
Curso
Teste
Iniciado
Enviado
Status
GRA0691 ENGENHARIA DE DADOS
ATIVIDADE 2 (A2)

Completada
Resultado da tentativa 10 em 10 pontos
Tempo decorrido 17 minutos
Resultados exibidos Respostas enviadas, Respostas corretas, Comentários
Pergunta 1
Resposta Selecionada:
Resposta Correta:
Comentário
da
resposta:
No contexto da Ciência de Dados, o ciclo de vida de um projeto pode envolver noções básicas sobre
negócios, aquisição e compreensão de dados (modelagem e coleta), processamento de dados, exploração
de dados, comunicação dos resultados e feedback.
No contexto do ciclo de vida de um projeto de Data Science , podem ser citadas como metas a serem
atingidas:
I. Determinação dos recursos de dados, ideais para o modelo de aprendizado de máquina.
II. Criação de um modelo de aprendizado de máquina informativo, que preveja os objetivos de forma
precisa.
III. Criação de um modelo de aprendizado de máquina, adequado para a produção.
IV. Refatoração do modelo de aprendizado de máquina, com base nos resultados de sua execução.
Agora, assinale a alternativa que apresenta a sequência correta:
I, II e III.
I, II e III.
Resposta correta. Apesar de, em alguns casos, o modelo precisar ser refatorado, a refatoração não é
considerada uma meta a ser atingida. Como metas a serem atingidas, são consideradas a Determinação
dos recursos de dados, Criação de um modelo de aprendizado de máquina informativo e outro adequado
para a produção.
Pergunta 2
Resposta
Selecionada:

Resposta Correta:
Pode-se dizer que sistemas distribuídos são diferentes de sistemas centralizados, por possuírem
componentes espalhados geograficamente, com características bastantes heterogêneas entre si,
trazendo, além de grandes desafios, vantagens quanto à sua implementação.
Dadas as inúmeras diferenças possíveis entre os componentes de um sistema distribuído, é possível citar
como vantagens inerentes a tais sistemas:
Desempenho; con�abilidade; organização de componentes por função e melhora geral.
Desempenho; confiabilidade; organização de componentes por função e melhora
geral.
1 em 1 pontos
1 em 1 pontos
T38849
Riscado
Comentário
da
resposta:
Resposta correta. Apesar de trazerem alguns desa�os consideráveis, os sistemas distribuídos têm muitas
vantagens, que justi�cam e motivam o seu uso, tais como: desempenho, con�abilidade, organização de
componentes por função e melhora geral.
Pergunta 3
Resposta Selecionada:
Resposta Correta:
Comentário da
resposta:
É possível afirmar que os sistemas distribuídos são diferentes de sistemas centralizados por, entre outros
fatores, possuírem componentes espalhados geograficamente, com características bastantes
heterogêneas entre si, como diferentes sistemas operacionais, capacidades de processamento, hardware,
etc.
Dadas as inúmeras diferenças possíveis entre os componentes de um sistema distribuído, é possível citar
como desafios inerentes a estes sistemas:
Concorrência, inexistência de relógio global e falhas independentes.
Concorrência, inexistência de relógio global e falhas independentes.
Resposta Correta. A conexão concorrente de programas, fusos horários diferentes e falhas de rede são
grandes desa�os, quando se trata de computação distribuída.
Pergunta 4
Resposta Selecionada:
Resposta Correta:
Comentário da
resposta:
À medida que as arquiteturas de computação foram evoluindo, passaram a ter também novas
características e necessidades. Uma destas necessidades foi a descentralização do processamento, para
que fosse possível a sua divisão entre vários computadores, ainda que estes estivessem fisicamente
distantes entre si.
Dadas as características de descentralização e divisão do processamento entre computadores, podemos
afirmar que o elemento-base se refere a:
Sistemas Distribuídos.
Sistemas Distribuídos.
Resposta correta. Divisão de processamento e recursos (hardware e software) são pontos
fundamentais dos sistemas distribuídos.
Pergunta 5
Um modelo pode ser compreendido como uma representação simplificada e abstrata de um fenômeno
que, com base em uma descrição formal de objetos, relações e processos, permite a sua simulação. O
processo de treinamento do modelo inclui algumas etapas importantes.
Acerca das etapas de treinamento do modelo, analise as afirmativas a seguir e assinale V para a(s)
verdadeira(s) e F para a(s) falsa(s).
I. ( ) Uma das etapas é a divisão dos dados de entrada - segmentação de conjuntos de dados de
treinamento e de teste.
II. ( ) Uma das etapas é a criação dos modelos - com base nos dados de treinamento.
III. ( ) Uma das etapas é a avaliação do conjunto de dados de treinamento e de teste - uso de algoritmos
de aprendizado de máquinas concorrentes, para avaliar se o modelo teve êxito na execução de uma tarefa.
1 em 1 pontos
1 em 1 pontos
1 em 1 pontos
Resposta Selecionada:
Resposta Correta:
Comentário
da
resposta:
IV. ( ) Uma das etapas é a publicação dos resultados - compilado de informações a serem apresentadas
aos stakeholders sobre a efetividade do modelo.
V, V, V, F.
V, V, V, F.
Resposta correta. Além das etapas citadas no elemento-base, é fundamental analisar as métricas do
modelo, a �m de identi�car se outras alternativas podem ser mais interessantes para a situação em
questão.
Pergunta 6
Resposta Selecionada:
Resposta Correta:
Comentário da
resposta:
Dado o avanço das tecnologias de bancos de dados e de processamento de rede, surgiram cada vez mais
demandas para se trabalhar com dados de forma distribuída. Vale ressaltar que o projeto do banco de
dados distribuído deve ser realizado com bastante atenção aos detalhes envolvidos.
Considerando essas informações e o conteúdo estudado sobre bancos de dados distribuídos, analise as
afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s).
I. ( ) Bancos de dados distribuídos podem ser classificados em homogêneos ou heterogêneos.
II. ( ) Um sistema de gerenciamento de bancos de dados distribuídos torna a distribuição dos dados
transparente para os usuários.
III. ( ) Um componente é uma unidade modular (hardware ou software) com interfaces bem definidas.
IV. ( ) Um banco de dados distribuído é um conjunto de bancos de dados separados fisicamente e
interligados por uma rede de computadores.
Agora, assinale a alternativa que apresenta a sequência correta:
F, V, V, V.
F, V, V, V.
Resposta correta. Homogeneidade e Heterogeneidade não podem ser tidos como características
de banco de dados distribuídos.
Pergunta 7
A modelagem de dados é uma atividade de fundamental relevância, tanto no contexto de bancos de
dados quanto na engenharia de dados. A modelagem no contexto de bancos de dados busca definir um
banco de dados por meio da elaboração dos modelos conceitual, lógico e físico.
Acerca da temática de modelagem de dados, analise as afirmativas a seguir e assinale V para a(s)
verdadeira(s) e F para a(s) falsa(s).
I. ( ) O estágio final da elaboração do design de banco de dados é a modelagem de dados físicos, que é o
detalhamento dos designs das tabelas e seus relacionamentos, criados a partir das classes e seus
relacionamentos.
II. ( ) O modelo físico de dados possui tabelas com colunas bem definidas, chaves e índices.
III. ( ) Bancos de dados não relacionais são assim chamados por abolirem o uso da linguagem SQL.
IV. ( ) Ao trabalhar com bancos de dados não relacionais, é importante pensar, primeiramente, na
definição dos esquemas das tabelas.
Agora, assinale a alternativa que apresenta a sequência correta:
1 em 1 pontos
1 em 1 pontos
Resposta Selecionada:
Resposta Correta:
Comentário
da
resposta:
V, V, F, F.
V, V, F, F.
Resposta correta. Apesar do nome poder gerar alguma confusão em um primeiro momento, é importante
notar que o NoSQL implica, de certa forma, em ampliar as abordagens a serem utilizadas na persistência
de dados.
Pergunta 8
Resposta Selecionada:
Resposta Correta:
Comentário da
resposta:
Dadas as suas peculiaridades,os sistemas distribuídos podem ser classificados em cinco paradigmas. Um
destes paradigmas é caracterizado pelo fornecimento de dois níveis computacionais (maior e menor).
Diante disso, o sistema operacional decidirá em que computador um serviço será realizado; a
adequabilidade de cada máquina; custo relativo; taxa de transmissão e carga de trabalho de cada
máquina.
Considerando essas informações e o conteúdo estudado, pode-se afirmar que a descrição fornecida foi a
do paradigma:
Cache de CPU.
Cache de CPU.
Resposta Correta. É importante sempre estar atendo às palavras-chave de cada paradigma. O
elemento-base apresenta o paradigma Cache de CPU.
Pergunta 9
Resposta Selecionada:
Resposta Correta:
Comentário
da
resposta:
A ciência de dados tem conquistado destaque cada vez maior no setor corporativo na última década,
sendo parte integrante das estratégias de negócio de algumas das empresas mais bem-sucedidas do
mundo. Conforme o escopo da ciência de dados de uma empresa muda, mudam também as ferramentas
que os cientistas de dados utilizam para resolver problemas complexos.
Acerca do uso de ferramentas em Data Science, analise as afirmativas a seguir e assinale V para a(s)
verdadeira(s) e F para a(s) falsa(s).
I. ( ) A maturidade das soluções existentes no mercado possibilita que soluções de código aberto sejam
integradas facilmente a qualquer fluxo de trabalho de ciência de dados existente.
II. ( ) Uma dos principais vantagens de empresas orientadas a dados é a possibilidade de trabalhar com
várias ferramentas desconexas, aumentando a capacidade da sua equipe em agregar valor.
III. ( ) A adoção de software de código aberto traz alguns desafios, como o licenciamento de suas próprias
versões modificadas das ferramentas de código aberto, por exemplo.
IV. ( ) Provedores de software de banco de dados e de ciência de dados estão adotando o movimento de
código aberto em vez de combater seu crescimento.
Agora, assinale a alternativa que apresenta a sequência correta:
F, V, V, V.
F, V, V, V.
Resposta correta. As soluções de código aberto na área de Data Science têm crescido
bastante. Percebendo esta tendência, grandes players do setor têm apoiado seu
desenvolvimento, a fim de participar do processo de inovação e estar alinhado às
tendências.
1 em 1 pontos
1 em 1 pontos
Pergunta 10
Resposta Selecionada:
Resposta Correta:
Comentário
da
resposta:
Um banco de dados distribuído pode ser entendido como um conjunto de bancos de dados separados
fisicamente e conectados por uma rede de computadores, e um sistema de gerenciamento de bancos de
dados distribuídos é conceituado como um sistema que possibilita o gerenciamento de tais dados e que
transforma sua distribuição de forma transparente para os usuários.
OLIVEIRA , S. S. Bancos de dados não-relacionais : um novo paradigma para armazenamento de
dados em sistemas de ensino colaborativo. Revista da Escola de Administração Pública do Amapá. 2016.
Disponível em < https://www2.unifap.br/oliveira/files/2016/02/35-124-1-PB.pdf >. Acesso em 15 jun
2020. (Adaptado).
Considerando essas informações e o conteúdo estudado, pode-se afirmar que existem dois tipos de
distribuição dos dados, que são:
Distribuição particionada e distribuição replicada.
Distribuição particionada e distribuição replicada.
Resposta correta. No contexto dos bancos de dados distribuídos, podem dividir a base de dados em vários
“pedaços” diferentes ou podem existir cópias dos bancos de dados nos nós, portanto: distribuição
particionada e distribuição replicada.
1 em 1 pontos
https://www2.unifap.br/oliveira/files/2016/02/35-124-1-PB.pdf