Baixe o app para aproveitar ainda mais
Prévia do material em texto
Usuário Curso Teste Iniciado Enviado Status GRA0691 ENGENHARIA DE DADOS ATIVIDADE 2 (A2) Completada Resultado da tentativa 10 em 10 pontos Tempo decorrido 17 minutos Resultados exibidos Respostas enviadas, Respostas corretas, Comentários Pergunta 1 Resposta Selecionada: Resposta Correta: Comentário da resposta: No contexto da Ciência de Dados, o ciclo de vida de um projeto pode envolver noções básicas sobre negócios, aquisição e compreensão de dados (modelagem e coleta), processamento de dados, exploração de dados, comunicação dos resultados e feedback. No contexto do ciclo de vida de um projeto de Data Science , podem ser citadas como metas a serem atingidas: I. Determinação dos recursos de dados, ideais para o modelo de aprendizado de máquina. II. Criação de um modelo de aprendizado de máquina informativo, que preveja os objetivos de forma precisa. III. Criação de um modelo de aprendizado de máquina, adequado para a produção. IV. Refatoração do modelo de aprendizado de máquina, com base nos resultados de sua execução. Agora, assinale a alternativa que apresenta a sequência correta: I, II e III. I, II e III. Resposta correta. Apesar de, em alguns casos, o modelo precisar ser refatorado, a refatoração não é considerada uma meta a ser atingida. Como metas a serem atingidas, são consideradas a Determinação dos recursos de dados, Criação de um modelo de aprendizado de máquina informativo e outro adequado para a produção. Pergunta 2 Resposta Selecionada: Resposta Correta: Pode-se dizer que sistemas distribuídos são diferentes de sistemas centralizados, por possuírem componentes espalhados geograficamente, com características bastantes heterogêneas entre si, trazendo, além de grandes desafios, vantagens quanto à sua implementação. Dadas as inúmeras diferenças possíveis entre os componentes de um sistema distribuído, é possível citar como vantagens inerentes a tais sistemas: Desempenho; con�abilidade; organização de componentes por função e melhora geral. Desempenho; confiabilidade; organização de componentes por função e melhora geral. 1 em 1 pontos 1 em 1 pontos T38849 Riscado Comentário da resposta: Resposta correta. Apesar de trazerem alguns desa�os consideráveis, os sistemas distribuídos têm muitas vantagens, que justi�cam e motivam o seu uso, tais como: desempenho, con�abilidade, organização de componentes por função e melhora geral. Pergunta 3 Resposta Selecionada: Resposta Correta: Comentário da resposta: É possível afirmar que os sistemas distribuídos são diferentes de sistemas centralizados por, entre outros fatores, possuírem componentes espalhados geograficamente, com características bastantes heterogêneas entre si, como diferentes sistemas operacionais, capacidades de processamento, hardware, etc. Dadas as inúmeras diferenças possíveis entre os componentes de um sistema distribuído, é possível citar como desafios inerentes a estes sistemas: Concorrência, inexistência de relógio global e falhas independentes. Concorrência, inexistência de relógio global e falhas independentes. Resposta Correta. A conexão concorrente de programas, fusos horários diferentes e falhas de rede são grandes desa�os, quando se trata de computação distribuída. Pergunta 4 Resposta Selecionada: Resposta Correta: Comentário da resposta: À medida que as arquiteturas de computação foram evoluindo, passaram a ter também novas características e necessidades. Uma destas necessidades foi a descentralização do processamento, para que fosse possível a sua divisão entre vários computadores, ainda que estes estivessem fisicamente distantes entre si. Dadas as características de descentralização e divisão do processamento entre computadores, podemos afirmar que o elemento-base se refere a: Sistemas Distribuídos. Sistemas Distribuídos. Resposta correta. Divisão de processamento e recursos (hardware e software) são pontos fundamentais dos sistemas distribuídos. Pergunta 5 Um modelo pode ser compreendido como uma representação simplificada e abstrata de um fenômeno que, com base em uma descrição formal de objetos, relações e processos, permite a sua simulação. O processo de treinamento do modelo inclui algumas etapas importantes. Acerca das etapas de treinamento do modelo, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). I. ( ) Uma das etapas é a divisão dos dados de entrada - segmentação de conjuntos de dados de treinamento e de teste. II. ( ) Uma das etapas é a criação dos modelos - com base nos dados de treinamento. III. ( ) Uma das etapas é a avaliação do conjunto de dados de treinamento e de teste - uso de algoritmos de aprendizado de máquinas concorrentes, para avaliar se o modelo teve êxito na execução de uma tarefa. 1 em 1 pontos 1 em 1 pontos 1 em 1 pontos Resposta Selecionada: Resposta Correta: Comentário da resposta: IV. ( ) Uma das etapas é a publicação dos resultados - compilado de informações a serem apresentadas aos stakeholders sobre a efetividade do modelo. V, V, V, F. V, V, V, F. Resposta correta. Além das etapas citadas no elemento-base, é fundamental analisar as métricas do modelo, a �m de identi�car se outras alternativas podem ser mais interessantes para a situação em questão. Pergunta 6 Resposta Selecionada: Resposta Correta: Comentário da resposta: Dado o avanço das tecnologias de bancos de dados e de processamento de rede, surgiram cada vez mais demandas para se trabalhar com dados de forma distribuída. Vale ressaltar que o projeto do banco de dados distribuído deve ser realizado com bastante atenção aos detalhes envolvidos. Considerando essas informações e o conteúdo estudado sobre bancos de dados distribuídos, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). I. ( ) Bancos de dados distribuídos podem ser classificados em homogêneos ou heterogêneos. II. ( ) Um sistema de gerenciamento de bancos de dados distribuídos torna a distribuição dos dados transparente para os usuários. III. ( ) Um componente é uma unidade modular (hardware ou software) com interfaces bem definidas. IV. ( ) Um banco de dados distribuído é um conjunto de bancos de dados separados fisicamente e interligados por uma rede de computadores. Agora, assinale a alternativa que apresenta a sequência correta: F, V, V, V. F, V, V, V. Resposta correta. Homogeneidade e Heterogeneidade não podem ser tidos como características de banco de dados distribuídos. Pergunta 7 A modelagem de dados é uma atividade de fundamental relevância, tanto no contexto de bancos de dados quanto na engenharia de dados. A modelagem no contexto de bancos de dados busca definir um banco de dados por meio da elaboração dos modelos conceitual, lógico e físico. Acerca da temática de modelagem de dados, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). I. ( ) O estágio final da elaboração do design de banco de dados é a modelagem de dados físicos, que é o detalhamento dos designs das tabelas e seus relacionamentos, criados a partir das classes e seus relacionamentos. II. ( ) O modelo físico de dados possui tabelas com colunas bem definidas, chaves e índices. III. ( ) Bancos de dados não relacionais são assim chamados por abolirem o uso da linguagem SQL. IV. ( ) Ao trabalhar com bancos de dados não relacionais, é importante pensar, primeiramente, na definição dos esquemas das tabelas. Agora, assinale a alternativa que apresenta a sequência correta: 1 em 1 pontos 1 em 1 pontos Resposta Selecionada: Resposta Correta: Comentário da resposta: V, V, F, F. V, V, F, F. Resposta correta. Apesar do nome poder gerar alguma confusão em um primeiro momento, é importante notar que o NoSQL implica, de certa forma, em ampliar as abordagens a serem utilizadas na persistência de dados. Pergunta 8 Resposta Selecionada: Resposta Correta: Comentário da resposta: Dadas as suas peculiaridades,os sistemas distribuídos podem ser classificados em cinco paradigmas. Um destes paradigmas é caracterizado pelo fornecimento de dois níveis computacionais (maior e menor). Diante disso, o sistema operacional decidirá em que computador um serviço será realizado; a adequabilidade de cada máquina; custo relativo; taxa de transmissão e carga de trabalho de cada máquina. Considerando essas informações e o conteúdo estudado, pode-se afirmar que a descrição fornecida foi a do paradigma: Cache de CPU. Cache de CPU. Resposta Correta. É importante sempre estar atendo às palavras-chave de cada paradigma. O elemento-base apresenta o paradigma Cache de CPU. Pergunta 9 Resposta Selecionada: Resposta Correta: Comentário da resposta: A ciência de dados tem conquistado destaque cada vez maior no setor corporativo na última década, sendo parte integrante das estratégias de negócio de algumas das empresas mais bem-sucedidas do mundo. Conforme o escopo da ciência de dados de uma empresa muda, mudam também as ferramentas que os cientistas de dados utilizam para resolver problemas complexos. Acerca do uso de ferramentas em Data Science, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). I. ( ) A maturidade das soluções existentes no mercado possibilita que soluções de código aberto sejam integradas facilmente a qualquer fluxo de trabalho de ciência de dados existente. II. ( ) Uma dos principais vantagens de empresas orientadas a dados é a possibilidade de trabalhar com várias ferramentas desconexas, aumentando a capacidade da sua equipe em agregar valor. III. ( ) A adoção de software de código aberto traz alguns desafios, como o licenciamento de suas próprias versões modificadas das ferramentas de código aberto, por exemplo. IV. ( ) Provedores de software de banco de dados e de ciência de dados estão adotando o movimento de código aberto em vez de combater seu crescimento. Agora, assinale a alternativa que apresenta a sequência correta: F, V, V, V. F, V, V, V. Resposta correta. As soluções de código aberto na área de Data Science têm crescido bastante. Percebendo esta tendência, grandes players do setor têm apoiado seu desenvolvimento, a fim de participar do processo de inovação e estar alinhado às tendências. 1 em 1 pontos 1 em 1 pontos Pergunta 10 Resposta Selecionada: Resposta Correta: Comentário da resposta: Um banco de dados distribuído pode ser entendido como um conjunto de bancos de dados separados fisicamente e conectados por uma rede de computadores, e um sistema de gerenciamento de bancos de dados distribuídos é conceituado como um sistema que possibilita o gerenciamento de tais dados e que transforma sua distribuição de forma transparente para os usuários. OLIVEIRA , S. S. Bancos de dados não-relacionais : um novo paradigma para armazenamento de dados em sistemas de ensino colaborativo. Revista da Escola de Administração Pública do Amapá. 2016. Disponível em < https://www2.unifap.br/oliveira/files/2016/02/35-124-1-PB.pdf >. Acesso em 15 jun 2020. (Adaptado). Considerando essas informações e o conteúdo estudado, pode-se afirmar que existem dois tipos de distribuição dos dados, que são: Distribuição particionada e distribuição replicada. Distribuição particionada e distribuição replicada. Resposta correta. No contexto dos bancos de dados distribuídos, podem dividir a base de dados em vários “pedaços” diferentes ou podem existir cópias dos bancos de dados nos nós, portanto: distribuição particionada e distribuição replicada. 1 em 1 pontos https://www2.unifap.br/oliveira/files/2016/02/35-124-1-PB.pdf
Compartilhar