Logo Passei Direto
Buscar

Big Data Analytic e a Tomada de Decisões

User badge image
Eduardo Silva

em

Ferramentas de estudo

Questões resolvidas

Relacione as técnicas com os algoritmos que as compõem, associando os itens, conforme o código abaixo: I – Clusterização Paralela. II – Clusterização baseada em MapReduce.
A partir das alternativas abaixo, assinale a CORRETA:
A II – I – I – II.
B II – I – II – I.
C I – II – I – II.
D I – II – II – I.

Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código abaixo: I – Algoritmos DIANA, ROCK. II – Algoritmos DBSCAN, OPTICS. III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM) IV – Algoritmos K-Means, CLARANS. V – Algoritmos STING, WAVECLUSTER.
Assinale a alternativa que apresenta a sequência CORRETA:
A III – IV – II – I – V.
B I – IV – V – II – III.
C I – V – IV – III – II.
D II – V – III – IV – I.

As métricas de segmentação representam outra classe de medidas para análise de redes sociais. Em relação a essas métricas, associe os itens, conforme o código abaixo: I – Coeficiente de agrupamento. II – Coesão. III – Clique.
A partir das alternativas abaixo, assinale a CORRETA:
A II – I – III.
B II – III – I.
C I – II – III.
D III – II – I.

A demanda por profissionais de análise de dados ampliou o escopo de exigências destes profissionais. As empresas estão interessadas em profissionais capacitados e que tenham habilidades em trabalhar com dados. Tendo isso em mente, quais são as principais habilidades requeridas para um profissional de dados?
A partir das alternativas abaixo, assinale a CORRETA:
A Forte capacidade analítica, amplo conhecimento em ferramentas de visualização de dados e frameworks de Big Data como Apache Spark e PowerBI e domínio de bancos de dados não relacionais.
B Capacidade para manipulação de dados, conhecimentos em estatística e aprendizado de máquina, habilidades com ferramentas e/ou linguagens de programação e capacidade para transmitir resultados.
C Raciocínio lógico apurado, capacidade para extrair insights de dados não estruturados, experiência prévia em aprendizagem de máquina e pouco conhecimento do conceito de Big Data.
D Domínio de técnicas de aprendizagem de máquina, amplo conhecimento em matemática, experiência com todos os tipos de dados ou banco de dados (extração e manipulação) e amplo conhecimento do negócio.

Empresas de muitos ramos têm investido em tecnologias e análise de dados para expandirem seus negócios. Em geral, que circunstâncias-chave tem incentivado empresas a investirem parte de seus recursos em análise de dados? A partir das alternativas abaixo, assinale a CORRETA:

A Melhoria dos processos de negócio, aumento de competitividade e o valor que pode ser obtido.
B Algoritmos cada vez mais inteligentes, redução de mão de obra e incremento tecnológico.
C Automatização de processos, incentivos fiscais e mão de obra barata.
D Mensurar retorno de investimentos, incentivos governamentais e garantia de lucro.

Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma diversidade de algoritmos. Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código abaixo: I – Algoritmos DIANA, ROCK. II – Algoritmos DBSCAN, OPTICS. III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM) IV – Algoritmos K-Means, CLARANS. V – Algoritmos STING, WAVECLUSTER. ( ) Métodos hierárquicos. ( ) Métodos baseados em grid. ( ) Métodos de particionamento. ( ) Métodos baseados em modelos. ( ) Métodos baseados em densidade. Assinale a alternativa que apresenta a sequência CORRETA:

A I – IV – V – II – III.
B II – V – III – IV – I.
C I – V – IV – III – II.
D III – IV – II – I – V.

Em relação aos métodos hierárquicos é CORRETO afirmar que:

A Divide o cluster através de níveis, onde os objetos alocados nos níveis superiores da árvore são mais próximos entre si.
B Agrupa um conjunto de pontos de dados em uma estrutura de árvore (dendograma) e fornece boa capacidade para comunicação dos resultados.
C Apresenta como vantagem a simplicidade e o fato de ser eficiente, mesmo em situações onde o conjunto de dados é significativo.
D Define aleatoriamente um ponto de partida para o parâmetro K e assim tenta otimizar o resultado ao longo das iterações.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Relacione as técnicas com os algoritmos que as compõem, associando os itens, conforme o código abaixo: I – Clusterização Paralela. II – Clusterização baseada em MapReduce.
A partir das alternativas abaixo, assinale a CORRETA:
A II – I – I – II.
B II – I – II – I.
C I – II – I – II.
D I – II – II – I.

Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código abaixo: I – Algoritmos DIANA, ROCK. II – Algoritmos DBSCAN, OPTICS. III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM) IV – Algoritmos K-Means, CLARANS. V – Algoritmos STING, WAVECLUSTER.
Assinale a alternativa que apresenta a sequência CORRETA:
A III – IV – II – I – V.
B I – IV – V – II – III.
C I – V – IV – III – II.
D II – V – III – IV – I.

As métricas de segmentação representam outra classe de medidas para análise de redes sociais. Em relação a essas métricas, associe os itens, conforme o código abaixo: I – Coeficiente de agrupamento. II – Coesão. III – Clique.
A partir das alternativas abaixo, assinale a CORRETA:
A II – I – III.
B II – III – I.
C I – II – III.
D III – II – I.

A demanda por profissionais de análise de dados ampliou o escopo de exigências destes profissionais. As empresas estão interessadas em profissionais capacitados e que tenham habilidades em trabalhar com dados. Tendo isso em mente, quais são as principais habilidades requeridas para um profissional de dados?
A partir das alternativas abaixo, assinale a CORRETA:
A Forte capacidade analítica, amplo conhecimento em ferramentas de visualização de dados e frameworks de Big Data como Apache Spark e PowerBI e domínio de bancos de dados não relacionais.
B Capacidade para manipulação de dados, conhecimentos em estatística e aprendizado de máquina, habilidades com ferramentas e/ou linguagens de programação e capacidade para transmitir resultados.
C Raciocínio lógico apurado, capacidade para extrair insights de dados não estruturados, experiência prévia em aprendizagem de máquina e pouco conhecimento do conceito de Big Data.
D Domínio de técnicas de aprendizagem de máquina, amplo conhecimento em matemática, experiência com todos os tipos de dados ou banco de dados (extração e manipulação) e amplo conhecimento do negócio.

Empresas de muitos ramos têm investido em tecnologias e análise de dados para expandirem seus negócios. Em geral, que circunstâncias-chave tem incentivado empresas a investirem parte de seus recursos em análise de dados? A partir das alternativas abaixo, assinale a CORRETA:

A Melhoria dos processos de negócio, aumento de competitividade e o valor que pode ser obtido.
B Algoritmos cada vez mais inteligentes, redução de mão de obra e incremento tecnológico.
C Automatização de processos, incentivos fiscais e mão de obra barata.
D Mensurar retorno de investimentos, incentivos governamentais e garantia de lucro.

Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma diversidade de algoritmos. Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código abaixo: I – Algoritmos DIANA, ROCK. II – Algoritmos DBSCAN, OPTICS. III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM) IV – Algoritmos K-Means, CLARANS. V – Algoritmos STING, WAVECLUSTER. ( ) Métodos hierárquicos. ( ) Métodos baseados em grid. ( ) Métodos de particionamento. ( ) Métodos baseados em modelos. ( ) Métodos baseados em densidade. Assinale a alternativa que apresenta a sequência CORRETA:

A I – IV – V – II – III.
B II – V – III – IV – I.
C I – V – IV – III – II.
D III – IV – II – I – V.

Em relação aos métodos hierárquicos é CORRETO afirmar que:

A Divide o cluster através de níveis, onde os objetos alocados nos níveis superiores da árvore são mais próximos entre si.
B Agrupa um conjunto de pontos de dados em uma estrutura de árvore (dendograma) e fornece boa capacidade para comunicação dos resultados.
C Apresenta como vantagem a simplicidade e o fato de ser eficiente, mesmo em situações onde o conjunto de dados é significativo.
D Define aleatoriamente um ponto de partida para o parâmetro K e assim tenta otimizar o resultado ao longo das iterações.

Prévia do material em texto

Prova Impressa
GABARITO | Avaliação da Disciplina (Cod.:645387)
Peso da Avaliação 10,00
Prova 81530883
Qtd. de Questões 20
Nota 10,00
Inovar significa buscar resultados por meio de novas estratégias, novas ideias e novas ações, 
gerenciando estas de forma sistemática e contínua.
 
SCHERER, F. O.; CARLOMAGNO S. M. A gestão da inovação na prática: como aplicar conceitos 
para alancar a inovação. São Paulo: Atlas, 2009 (adaptado).
 Assinale a alternativa que corresponde ao conceito expresso no enunciado: 
A Modelos de negócios inovadores.
B Gerenciamento de processos.
C Business Model Canvas.
D Gestão da inovação.
No dia a dia as decisões para análise de Big Data precisam ser assertivas, ou seja, é necessário saber 
qual o objetivo da análise para que as soluções realmente possam atender ao real desejo da 
organização.
 
Nesse sentido, imagine um pequeno cenário: - Um gestor de uma grande empresa alimentícia possui 
diversos sistemas com grandes volumes de dados de TI (CRM, ERP, Bases relacionais e diversos 
formatos de arquivos). Ele gostaria de monitorar os clientes que são mais aderentes (ou mais fiéis) à 
empresa, com informações mais atualizadas possíveis. O objetivo é, além de manter aqueles clientes 
com maior aderência, aproximar aqueles que porventura estejam um pouco mais distantes da empresa 
e com real possibilidade de deixarem de ser clientes fixos.
 
Qual seria a solução mais viável para auxiliar esse gestor? A partir das alternativas abaixo, assinale a 
CORRETA:
A
 Monitoramento das atividades dos clientes nas redes sociais através da coleta de dados via Spark
Streaming, armazenar todos os dados (externos e internos) no HDFS para manter uma base
histórica e realizar análises preditivas atribuindo scores para mensurar a aderência do cliente à
organização.
B
 Aplicação de processos tradicionais de ETL e armazenamento de dados no Data Lake ou Data
Warehouse. Posteriormente esses dados podem ser processados via Hadoop MapReduce. Além
disso, modelos de Machine Learning podem ser aplicados para prever se um cliente sairá ou não
da empresa.
C
 Construção de uma arquitetura de BI híbrida (lote e dados em tempo real). A coleta de dados
poderia ficar a cargo do Sqoop e o armazenamento de dados a cargo do Spark. Os dados podem
ser analisados por algoritmos de mineração de dados para mapear as atividades dos clientes. 
 VOLTAR
A+ Alterar modo de visualização
1
2
05/05/2024, 20:25 Avaliação da Disciplina
about:blank 1/8
D
 Coleta dos dados estruturados utilizando o HiveQL e armazenamento em batch (lote) utilizando
o HDFS do Hadoop e análise tradicional em cluster para agrupar clientes com mais fidelidade em
um mesmo grupo, enquanto que outros formam um segundo grupo. 
Uma das principais vantagens da clusterização baseada em MapReduce é, sem dúvida, a transparência 
de toda complexidade de implementação envolvida com a distribuição dos dados entre os clusters ou 
mesmo a capacidade para detectar e corrigir falhas que eventualmente possam ocorrer durante o 
processo.
 
Relacione as técnicas com os algoritmos que as compõem, associando os itens, conforme o código 
abaixo:
 I – Clusterização Paralela. II – Clusterização baseada em MapReduce. ( ) GPMR. ( ) PBIRCH. 
( ) MR-DBSCAN. ( ) G-DBSCAN. A partir das alternativas abaixo, assinale a CORRETA: 
A II – I – I – II. 
B II – I – II – I. 
C I – II – I – II. 
D I – II – II – I.
Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma diversidade 
de algoritmos.
 Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código abaixo: 
I – Algoritmos DIANA, ROCK.II – Algoritmos DBSCAN, OPTICS.
III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM)
IV – Algoritmos K-Means, CLARANS.V – Algoritmos STING, WAVECLUSTER. 
( ) Métodos hierárquicos.( ) Métodos baseados em grid.( ) Métodos de particionamento.
( ) Métodos baseados em modelos.( ) Métodos baseados em densidade. 
Assinale a alternativa que apresenta a sequência CORRETA: 
A III – IV – II – I – V.
B I – IV – V – II – III.
C I – V – IV – III – II. 
D II – V – III – IV – I.
A análise de cluster pode ser utilizada em inúmeras aplicações do cotidiano. Além disso, as técnicas e 
algoritmos que podem ser empregados precisam ser bem escolhidos para aumentar as chances de 
sucesso. Diante disso, no que é necessário refletir antes de implementar uma aplicação para análise 
de cluster?
 A partir das alternativas abaixo, assinale a CORRETA:
3
4
5
05/05/2024, 20:25 Avaliação da Disciplina
about:blank 2/8
A Garantir uma arquitetura robusta para suportar o volume e variedade dos dados, bem como optar
por uma ferramenta que possa fornecer suporte à análise paralela em cluster. 
B
 Verificar a quantidade de dados que será processada, bem como a variedade, mensurar os
parâmetros que serão necessários para as próximas etapas, assim como avaliar a
dimensionalidade. 
C
 Checar a quantidade de parâmetros que serão úteis para a aplicação, decidir que tipo de banco de
dados (relacional ou não relacional) será utilizado e estruturar uma arquitetura capaz de suportar o
tráfego de dados.
D Verificar e validar requisitos da aplicação, assim como selecionar uma ferramenta de Big Data
adequada para garantir o rápido armazenamento e processamento dos dados.
Em métodos hierárquicos tradicionais a complexidade no espaço O(n²) e no tempo O(n³) é algo que 
limita o poder de ação dos algoritmos. E, em muitos casos, algumas circunstâncias tornam o processo 
de análise extremamente oneroso ou mesmo inviável. Essa limitação tem sido evidenciada por 
alguns fatores, quais destes é possível destacar?
 A partir das alternativas abaixo, assinale a CORRETA:
A A exigência cada vez mais recorrente de aplicações voltadas para detecção de eventos
anômalos.
B O crescente número de ferramentas voltadas para Big Data que substituem as formas de análise
tradicionais.
C O modelo de gestão de dados que impôs o uso de algoritmos distribuídos para ganhos de
performance.
D O volume intenso e variado de dados que estão sendo gerados e requeridos para análise. 
As métricas de segmentação representam outra classe de medidas para análise de redes sociais. 
Em relação a essas métricas, associe os itens, conforme o código abaixo: 
I – Coeficiente de agrupamento. II – Coesão. III – Clique. 
( ) É uma medida que representa o grau de ligação existente entre dois vértices. 
( ) É uma medida que indica a probabilidade de formação de clusters entre os vértices. 
( ) Quando um determinado vértice está diretamente conectado a todos os outros vértices. 
A partir das alternativas abaixo, assinale a CORRETA: 
A II – I – III. 
B II – III – I. 
C I – II – III. 
D III – II – I.
6
7
05/05/2024, 20:25 Avaliação da Disciplina
about:blank 3/8
A demanda por profissionais de análise de dados ampliou o escopo de exigências destes profissionais. 
As empresas estão interessadas em profissionais capacitados e que tenham habilidades em trabalhar 
com dados. Tendo isso em mente, quais são as principais habilidades requeridas para um 
profissional de dados?
A partir das alternativas abaixo, assinale a CORRETA:
A
 Forte capacidade analítica, amplo conhecimento em ferramentas de visualização de dados e
frameworks de Big Data como Apache Spark e PowerBI e domínio de bancos de dados não
relacionais.
B
 Capacidade para manipulação de dados, conhecimentos em estatística e aprendizado de máquina,
habilidades com ferramentas e/ou linguagens de programação e capacidade para transmitir
resultados.
C Raciocínio lógico apurado, capacidade para extrair insights de dados não estruturados,
experiência prévia em aprendizagem de máquina e pouco conhecimento do conceito de Big Data.
D
 Domínio de técnicas de aprendizagem de máquina, amplo conhecimento em matemática,
experiência com todos os tipos de dados ou banco de dados (extração e manipulação) e amplo
conhecimento do negócio.
O HDFS é um sistema de arquivosdo Hadoop que permite armazenar grandes volumes de dados e 
possui uma arquitetura que apresenta alguns componentes importantes.
 Dentre os componentes principais da arquitetura do HDFS, assinale a alternativa CORRETA.
A
 O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado vital, pois gerencia
todos os dados que chegam ao sistema e notifica aos escravos (Data Node) em caso de falha.
Estes apenas executam as tarefas solicitadas.
B
 O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro é responsável por agendar e
gerenciar as tarefas de armazenamento, enquanto que o segundo realiza as atividades diretamente
nas máquinas destino. 
C
 O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro está relacionado ao
armazenamento e processamento dos dados diretamente no cluster “pai”, enquanto que o segundo
apenas obedece às instruções do pai e o notifica quando for o caso. 
D
 O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado mestre porque
controla todas as atividades relacionadas ao armazenamento físico dos dados em cada nó,
enquanto o segundo processa os dados e comunica ao mestre. 
Empresas de muitos ramos têm investido em tecnologias e análise de dados para expandirem seus 
negócios. Em geral, que circunstâncias-chave tem incentivado empresas a investirem parte de seus 
recursos em análise de dados?
 A partir das alternativas abaixo, assinale a CORRETA: 
A Melhoria dos processos de negócio, aumento de competitividade e o valor que pode ser obtido. 
B Algoritmos cada vez mais inteligentes, redução de mão de obra e incremento tecnológico.
C Automatização de processos, incentivos fiscais e mão de obra barata. 
8
9
10
05/05/2024, 20:25 Avaliação da Disciplina
about:blank 4/8
D Mensurar retorno de investimentos, incentivos governamentais e garantia de lucro.
Benchmarking é o processo contínuo de comparação de produtos, serviços e práticas empresariais 
similares que são executadas eficientemente em determinada organização.
Sabendo disso, assinale a alternativa que traduz corretamente as fases do processo Benchmarking: 
A Pensar, sentir, ouvir, ver, falar e fazer.
B Entender, observar, definir, idealizar, prototipar e testar.
C Observar, planejar, entender, definir, pensar, ouvir, falar, testar, idealizar, sentir e coletar/analisar
informações externas.
D Planejamento, coleta/análise interna de informações, coleta/análise externa de informações,
melhoria do desempenho e melhoria contínua.
O radar da inovação permite avaliar o grau de maturidade inovadora das empresas, uma vez que 
considera a inovação um elemento fundamental no âmbito competitivo.
Dito isso, assinale a alternativa que apresenta as treze dimensões que compõem a metodologia do 
radar da inovação: 
A Venda, oferta, financeiro, clientes, alternativas, dimensão, radical, parcial, rede, processos,
produtos, serviços e incremento.
B Incremento, radical, parcial, gestão, comércio, serviços, financeiro, processos, marca,
colaboradores, sistemas, certificações e patentes.
C Organização, gestão, cadeia de fornecedores, planilha, rede de investimentos, estratégia, design,
marca, serviços, tecnologia, conhecimento, diferencial e qualidade.
D Oferta, plataforma, marca, clientes, soluções, relacionamento, agregação de valor, processos,
organização, cadeia de fornecimento, presença, rede e ambiente inovador.
Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma diversidade 
de algoritmos. Relacione a classe de algoritmos com os métodos, associando os itens, conforme o 
código abaixo:
 I – Algoritmos DIANA, ROCK. II – Algoritmos DBSCAN, OPTICS. 
III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM) 
IV – Algoritmos K-Means, CLARANS. V – Algoritmos STING, WAVECLUSTER. 
( ) Métodos hierárquicos. ( ) Métodos baseados em grid. ( ) Métodos de particionamento. 
( ) Métodos baseados em modelos. ( ) Métodos baseados em densidade. 
Assinale a alternativa que apresenta a sequência CORRETA: 
A I – IV – V – II – III. 
B II – V – III – IV – I. 
C I – V – IV – III – II. 
11
12
13
05/05/2024, 20:25 Avaliação da Disciplina
about:blank 5/8
D III – IV – II – I – V.
A transição da Web representou um importante mecanismo para a revolução dos dados e expôs um 
novo cenário de explosão e novos formatos para análise de dados nos meios digitais.
Nesse sentido, dentre as três fases da web, qual destas representou a gênese para explosão dos dados? 
A partir das alternativas abaixo, assinale a CORRETA:
A Na Web 2.0 onde os usuários passaram a gerar conteúdo a partir de sistemas dinâmicos. 
B Entre a Web 1.0 e Web 2.0 com o surgimento das primeiras redes sociais. 
C Na Web 1.0 que representou o primeiro contato dos usuários em relação à web. 
D Na Web 3.0 a partir da geração de conteúdo por parte do usuário e a compreensão semântica de
suas atividades na rede.
As fontes de dados podem ser externas - quando se referem a fontes em que a organização não tem 
total controle – ou internas, quando a organização possui total controle. Ambas são úteis para análise 
em Big Data, visto que podem fornecer uma visão mais ampla de como o negócio está posicionado no 
mercado. Sobre a estrutura dos dados contidos nas fontes, é possível classificar em: dados 
estruturados, semiestruturados e não estruturados.
 Com base nisso, associe os itens I,II e III com as descrições correspondentes abaixo:
I – Dados estruturados.II – Dados semiestruturados.III – Dados não estruturados.
( ) São dados que apresentam uma estrutura flexível e autodescritiva.
( ) São dados que apresentam uma estrutura bem definida com tamanho fixo.
( ) São dados que não apresentam uma estrutura e são descritos em linguagem natural. 
Assinale a alternativa que apresenta a sequência CORRETA dos itens:
A I – II – III. 
B II – I – III. 
C I – III – II. 
D II – III – I.
A inovação radical é um produto, processo ou serviço que apresenta características de desempenho 
sem precedentes.
Sabendo disso, assinale a alternativa que apresenta uma definição correta de inovação radical: 
A Trata-se da modificação, aperfeiçoamento, simplificação, consolidação e melhoria de sistemas
existentes.
B Trata-se da implementação de melhorias em um produto, serviço, sistema de gestão ou método
de produção existentes.
14
15
16
05/05/2024, 20:25 Avaliação da Disciplina
about:blank 6/8
C Trata-se da melhoria de sistemas existentes, tornando-os mais baratos, melhores e mais rápidos.
D Trata-se da implementação de um produto, serviço, sistema de gestão ou método de produção,
que até então não existia no mercado.
As técnicas de Multi Machine Clustering surgiram para otimizar e melhorar a escalabilidade e o 
desempenho das análises em cluster para atender às demandas do Big Data. Em relação às técnicas 
de Multi Machine Clustering, o que é possível afirmar?
 A partir das alternativas abaixo, assinale a CORRETA:
A É constituída pelas técnicas de clusterização paralela e baseada em MapReduce que tornam o
processo de paralelização menos complexo para o desenvolvedor.
B É composta pela clusterização paralela e pela clusterização baseada em MapReduce. A segunda,
inclusive, torna o processo de paralelização mais transparente para o desenvolvedor. 
C Apresentam como grande característica o alto poder de processamento com implementação de
baixa complexidade e algoritmos como PAM, DBSCAN e PIRBICH. 
D São mais velozes que as abordagens tradicionais de agrupamento, no entanto, a alta
complexidade de implementação inviabiliza projetos de análises mais amplos. 
Existem diversos métodos tradicionais que podem ser empregados para análise em cluster e são 
potencialmente interessantes em cenários de baixa complexidade - com quantidade de dados reduzida.
 Em relação aos métodos hierárquicos é CORRETO afirmar que:
A Divide o cluster através de níveis, onde os objetos alocados nos níveis superiores da árvore são
mais próximos entre si. 
B Agrupa um conjunto de pontos dedados em uma estrutura de árvore (dendograma) e fornece boa
capacidade para comunicação dos resultados. 
C Apresenta como vantagem a simplicidade e o fato de ser eficiente, mesmo em situações onde o
conjunto de dados é significativo.
D Define aleatoriamente um ponto de partida para o parâmetro K e assim tenta otimizar o
resultado ao longo das iterações.
Apesar do grande crescimento, o Big Data é um conceito amplo que se refere à forma como lidamos 
com a grande quantidade de dados disponível para uso. Além disso, a empresa precisa construir uma 
infraestrutura para lidar com uma infinidade de fontes e processá-las em um tempo razoável.
 
Diante disso, em qual cenário uma empresa pode estar diante de um Big Data? A partir das 
alternativas abaixo, assinale a CORRETA:
 
A Em situações onde a infraestrutura de dados da empresa apresenta elevada taxa de latência e/ou
inviabilidade para análises de dados de grande volume e em diferentes formatos e estruturas.
B
 Em circunstâncias onde o volume de dados da organização aumente significativamente,
tornando-se possível comprar novos servidores, o que poderia diminuir os custos com
armazenamento. 
17
18
19
05/05/2024, 20:25 Avaliação da Disciplina
about:blank 7/8
C Quando o conjunto de dados ultrapassar a casa dos 1PB e a empresa precise lidar com dados
estruturados, semiestruturados e/ou não estruturados.
D Quando a análise de dados tradicional não estiver mais trazendo real valor para a organização, o
que poderia indicar a possibilidade de trazer inovação com novas formas de analisar os dados.
Em épocas passadas as empresas conviviam com certas limitações, em termos de tecnologia, para que 
pudessem analisar seus dados.
Por outro lado, nos dias atuais, as tecnologias possibilitaram e estimularam a produção de conteúdo.
Tendo isso em mente, classifique V para as sentenças verdadeiras e F para as falsas: 
( ) As empresas precisam lidar com o alto volume e variedade de dados digitais propondo soluções 
automáticas de análise a fim de se manterem competitivas.
( ) As empresas orientadas a dados têm à disposição uma massiva quantidade de dados, porém, em 
muitos casos não sabem como gerenciá-los.
( ) A elevada produção de conteúdo implica em um problema de sobrecarga de informação, 
evidenciando as limitações da ação humana para lidar com isso.
 Assinale a alternativa correta:
A V – V – V.
B V – F – V.
C V – F – F.
D F – V – V.
20
Imprimir
05/05/2024, 20:25 Avaliação da Disciplina
about:blank 8/8

Mais conteúdos dessa disciplina