Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

30/07/2023, 12:11 Avaliação da Disciplina
about:blank 1/9
Prova Impressa
GABARITO | Avaliação da Disciplina (Cod.:645387)
Peso da Avaliação 10,00
Prova 67841139
Qtd. de Questões 20
Nota 8,00
Além da Internet das Coisas, as pesquisas apontam para o surgimento de diversas outras tendências 
para análise de Big Data.
 A respeito disso, classifique V para as sentenças verdadeiras e F para as falsas:
( ) A forma de processamento tradicional dos computadores poderá dar espaço para os computadores 
quânticos, que prometem alto poder de armazenamento e processamento.
( ) A computação de borda (“Edge Computing”) poderá ou não substituir a computação em nuvem. 
A ideia é tratar e analisar dados tão logo sejam coletados das fontes, por isso o termo “borda”, ou 
seja, próximo a elas.
( ) A intensificação do uso de análise preditiva é algo que será percebido ao longo dos anos. A 
aposta é de que esse campo da Inteligência Artificial seja incorporado nas empresas e se tornará 
onipresente dentro de seus processos.
( ) A presença dos chatbots é uma outra forte tendência, porque à medida que mais dados chegam e 
são apresentados a estes robôs, maiores são as chances de aprendizado e automação de tarefas 
cotidianas.
 A partir das alternativas abaixo, assinale a CORRETA: 
A F – V – F – F.
B V – V – V – V. 
C V – F – V – V.
D F – V – F – V.
Um processo de análise de dados pode ser representado em quatro etapas. Cada uma dessas etapas 
possui particularidades que vão desde a base para implementação de análise de dados nas empresas 
até profundos e sofisticados mecanismos de análise dentro das organizações.
 
Em se tratando dos tipos de análises existentes, qual a opção que descreve a análise prescritiva? A 
partir das alternativas abaixo, assinale a CORRETA:
A
 É um tipo de análise voltado para responder apenas perguntas de situações que ainda não
ocorreram, mas que provavelmente venham a ocorrer. Isso é obtido através da criação de modelos
de aprendizagem de máquina avançados.
B
 É um processo voltado para responder perguntas do passado para inferir situações que venham a
ocorrer. Por isso, a participação humana é importante para fornecer suporte e aprimorar as
decisões obtidas pelos algoritmos implementados.
C
 Análise prescritiva refere-se ao tipo de análise que é responsável por tomar as decisões com
independência. Procura responder perguntas como: “Por que esse evento aconteceu?” e obtém
respostas através de algoritmos de classificação.
 VOLTAR
A+ Alterar modo de visualização
1
2
30/07/2023, 12:11 Avaliação da Disciplina
about:blank 2/9
D
 Etapa mais avançada da análise de dados que fornece apoio à tomada de decisão de forma
automatizada com mínima intervenção humana. Isso é possível graças às experiências
desenvolvidas que são aperfeiçoadas ao longo do tempo.
O Apache Hadoop contém uma série de componentes que podem ser integrados ao framework. Esses 
componentes podem ser úteis para as mais diversas finalidades, como armazenamento, transferência 
de grandes volumes de dados ou até mesmo aplicação de algoritmos preditivos.
 A partir das opções abaixo, classifique V para as sentenças verdadeiras e F para as falsas: 
( ) O Apache Hive é um componente que pode ser integrado ao Hadoop para coletar dados de fontes 
estruturadas.
 
( ) O Apache HBase é um banco de dados não relacional propício a ambientes Big Data, uma vez 
que suporta um grande volume de dados mantendo alto desempenho.
 ( ) O Apache Sqoop permite mover grandes volumes de dados das fontes para o HDFS. 
( ) O Apache Mahout é um componente responsável por trabalhar diretamente com os dados da 
fonte: extraindo e coletando dados tanto para processamento em lote como em tempo real.
 A partir das alternativas abaixo, assinale a CORRETA: 
A V – V – V – F. 
B V – V – F – F. 
C F – V – F – V.
D F – F – V – V. 
O Apache Spark oferece não somente a capacidade de processamento, como também a possibilidade 
de realizar análises mais avançadas através de um conjunto de bibliotecas. Considerando isso, 
associe os itens, conforme o código abaixo:
 I – Spark SQL.II – Spark Streaming.III – Spark MLlib.IV – Spark GraphX. 
( ) Contém um conjunto de algoritmos otimizados de Machine Learning projetados para 
trabalharem em paralelo.
( ) Projetadas para processar estruturas em rede de forma otimizada e com elevada eficiência.
( ) É possível realizar consultas e processar dados estruturados em ambiente Big Data de forma ágil.
( ) Útil para manipular e processar dados de tempo real, analisando microbacths de dados de tempos 
em tempos.
 A partir das alternativas abaixo, assinale a CORRETA:
A II – III – IV – I. 
B III – II – I – IV.
C IV – III – I – II.
D III – IV – I – II. 
3
4
30/07/2023, 12:11 Avaliação da Disciplina
about:blank 3/9
“Estruturas teóricas linguísticas como a Teoria Texto-Sentido (MTT) para a construção de modelos de 
linguagem natural têm permitido que computadores possam processar a linguagem natural e começar 
a compreender o significado sobre a linguagem humana.”
INBENTA. Disponível em: < https://www.inbenta.com/pt/tecnologia/tecnologia-de-linguagem-
natural/ >.
 
“Ainda que o processamento de linguagem natural não seja uma ciência nova, essa tecnologia está 
avançando rapidamente graças ao interesse cada vez maior na comunicação homem-máquina, 
paralelamente à disponibilidade de big data, computação mais poderosa e algoritmos aprimorados.” 
SAS.
Disponível em: < https://www.sas.com/pt_br/insights/analytics/processamento-de-linguagem-
natural.html >.
 
Os textos acima expõem conceitos relacionados ao Processamento de Linguagem Natural (PLN), em 
relação a esse conceito e suas aplicações é correto afirmar que: 
A
 Um dos campos de aplicação é a análise de sentimentos, ao considerar a questão subjetiva
extraindo emoções de um discurso. É um tipo de aplicação ainda pouco consolidada e não possui
muitos cases, porém, apresenta grande potencial. 
B
 Tem como fundamento compreender o contexto no qual um discurso foi empregado, por meio
de análises léxicas, sintáticas, semânticas, etc., como é caso quando deseja-se converter voz em
texto. 
C
 Pode ser aplicada tanto em análise de dados estruturados como não estruturados e realiza
algumas etapas, como a extração semântica no texto que observa padrões de escrita em uma
frase.
D
 Basicamente, realiza a análise de texto em grandes volumes de dados, por exemplo, análise de
posts no Facebook. A PLN é um campo definitivamente consolidado e, portanto, a comunicação
homem-máquina é perfeitamente compreendida. 
As fontes de dados podem ser externas - quando se referem a fontes em que a organização não tem 
total controle – ou internas, quando a organização possui total controle. Ambas são úteis para análise 
em Big Data, visto que podem fornecer uma visão mais ampla de como o negócio está posicionado 
no mercado. Sobre a estrutura dos dados contidos nas fontes, é possível classificar em: dados 
estruturados, semiestruturados e não estruturados.
 Com base nisso, associe os itens I,II e III com as descrições correspondentes abaixo:
I – Dados estruturados.II – Dados semiestruturados.III – Dados não estruturados.
( ) São dados que apresentam uma estrutura flexível e autodescritiva.
( ) São dados que apresentam uma estrutura bem definida com tamanho fixo.
( ) São dados que não apresentam uma estrutura e são descritos em linguagem natural. 
Assinale a alternativa que apresenta a sequência CORRETA dos itens:
A II – III – I.
B I – II – III. 
C I – III – II. 
D II – I – III. 
5
6
30/07/2023, 12:11 Avaliação da Disciplina
about:blank 4/9
As técnicas de Multi Machine Clustering surgiram para otimizar e melhorar a escalabilidade e o 
desempenho das análises em cluster para atender às demandas do Big Data. Em relação às técnicas 
de Multi Machine Clustering, o que é possível afirmar?
 A partir das alternativas abaixo, assinale a CORRETA:
A São mais velozes que as abordagens tradicionais de agrupamento,no entanto, a alta
complexidade de implementação inviabiliza projetos de análises mais amplos. 
B Apresentam como grande característica o alto poder de processamento com implementação de
baixa complexidade e algoritmos como PAM, DBSCAN e PIRBICH. 
C É constituída pelas técnicas de clusterização paralela e baseada em MapReduce que tornam o
processo de paralelização menos complexo para o desenvolvedor.
D É composta pela clusterização paralela e pela clusterização baseada em MapReduce. A segunda,
inclusive, torna o processo de paralelização mais transparente para o desenvolvedor. 
Os meios digitais consistem em um grande potencial para geração e análise dos dados. Nos dias de 
hoje as empresas têm investido nesses meios para compreender melhor como seus clientes atuam 
nestas redes.
 Em relação à análise digital é correto afirmar que:
A
 Conhecida hoje como “Web Analytics” e compreende todas as páginas de um website. A análise
de dados nos websites é feita observando as diferentes métricas de ferramentas como Google
Analytics para avaliar o comportamento virtual do usuário dentro da página.
B
 Antigamente restringia-se apenas ao termo “web”, mas nos dias de hoje o termo digital expande
a todos os dispositivos capazes de conectar a web. A base dessas análises está relacionada a
indicadores ou métricas específicas, como: taxa de rejeição, usuários ativos por hora, informações
demográficas, etc. 
C
 Está relacionada a um conjunto de métricas e indicadores para avaliar o comportamento digital
de um usuário, como cliques de mouse, posts nas redes sociais, tempo de sessão e assim por
diante. Por ser uma área recente, ainda não possui ferramentas com recursos suficientes para
análise de grande volume de dados.
D
 Possui uma diversidade de APIs para acesso e exploração dos dados digitais. São dados como:
origens do tráfego, sites mais visitados, registros de compras em um site de vendas e assim por
diante. Apesar de todo o potencial, a complexidade e o custo para extrair esses dados impedem o
amplo uso desses recursos digitais.
Dados não estruturados ou desestruturados compreendem cerca de 80% de toda gama de dados 
disponíveis para extração e análise de dados.
 Em relação a esses tipos de dados é correto afirmar que: 
A
 São dados difíceis de serem decifrados ou compreendidos pela máquina, por conta da sua
estrutura. A linguagem humana é incompreensível pela máquina, o que torna o processo de
descoberta de conhecimento inviável. 
B
 São pouco percebidos pelas empresas por conta da complexidade em lidar com essas estruturas.
São extremamente custosos se comparados ao formato estruturado e carecem de técnicas para
melhorar o processo de análise. 
7
8
9
30/07/2023, 12:11 Avaliação da Disciplina
about:blank 5/9
C Apresentam formato livre e são produzidos pela linguagem humana. Para que seja possível
realizar a análise existe a necessidade de transformá-los em um formato estruturado. 
D
 São de vital importância para as empresas, porém, são pouco explorados e apresentam baixo
poder de aplicabilidade. Google e IBM são algumas das poucas empresas que investem recursos
em análise de dados textuais.
A demanda por profissionais de análise de dados ampliou o escopo de exigências destes profissionais. 
As empresas estão interessadas em profissionais capacitados e que tenham habilidades em trabalhar 
com dados. Tendo isso em mente, quais são as principais habilidades requeridas para um 
profissional de dados?
A partir das alternativas abaixo, assinale a CORRETA:
A
 Forte capacidade analítica, amplo conhecimento em ferramentas de visualização de dados e
frameworks de Big Data como Apache Spark e PowerBI e domínio de bancos de dados não
relacionais.
B
 Domínio de técnicas de aprendizagem de máquina, amplo conhecimento em matemática,
experiência com todos os tipos de dados ou banco de dados (extração e manipulação) e amplo
conhecimento do negócio.
C
 Capacidade para manipulação de dados, conhecimentos em estatística e aprendizado de máquina,
habilidades com ferramentas e/ou linguagens de programação e capacidade para transmitir
resultados.
D Raciocínio lógico apurado, capacidade para extrair insights de dados não estruturados,
experiência prévia em aprendizagem de máquina e pouco conhecimento do conceito de Big Data.
As métricas de segmentação representam outra classe de medidas para análise de redes sociais. 
Em relação a essas métricas, associe os itens, conforme o código abaixo: 
I – Coeficiente de agrupamento. II – Coesão. III – Clique. 
( ) É uma medida que representa o grau de ligação existente entre dois vértices. 
( ) É uma medida que indica a probabilidade de formação de clusters entre os vértices. 
( ) Quando um determinado vértice está diretamente conectado a todos os outros vértices. 
A partir das alternativas abaixo, assinale a CORRETA: 
A I – II – III. 
B III – II – I.
C II – III – I. 
D II – I – III. 
Uma das principais vantagens da clusterização baseada em MapReduce é, sem dúvida, a 
transparência de toda complexidade de implementação envolvida com a distribuição dos dados entre 
os clusters ou mesmo a capacidade para detectar e corrigir falhas que eventualmente possam ocorrer 
durante o processo.
 
10
11
12
30/07/2023, 12:11 Avaliação da Disciplina
about:blank 6/9
Relacione as técnicas com os algoritmos que as compõem, associando os itens, conforme o código 
abaixo:
 I – Clusterização Paralela. II – Clusterização baseada em MapReduce. ( ) GPMR. ( ) PBIRCH. 
( ) MR-DBSCAN. ( ) G-DBSCAN. A partir das alternativas abaixo, assinale a CORRETA: 
A I – II – I – II. 
B II – I – II – I. 
C II – I – I – II. 
D I – II – II – I.
Em métodos hierárquicos tradicionais a complexidade no espaço O(n²) e no tempo O(n³) é algo que 
limita o poder de ação dos algoritmos. E, em muitos casos, algumas circunstâncias tornam o processo 
de análise extremamente oneroso ou mesmo inviável. Essa limitação tem sido evidenciada por 
alguns fatores, quais destes é possível destacar?
 A partir das alternativas abaixo, assinale a CORRETA:
A O volume intenso e variado de dados que estão sendo gerados e requeridos para análise. 
B A exigência cada vez mais recorrente de aplicações voltadas para detecção de eventos
anômalos.
C O crescente número de ferramentas voltadas para Big Data que substituem as formas de análise
tradicionais.
D O modelo de gestão de dados que impôs o uso de algoritmos distribuídos para ganhos de
performance.
A clusterização é uma técnica de aprendizagem não supervisionada que visa classificar um conjunto 
de dados semelhantes em um mesmo grupo.
 No que se refere à clusterização é CORRETO afirmar que: 
A É útil para classificar um grupo de objetos com classes já definidas, por exemplo, prever a
média de vendas de casas em uma determinada região. 
B É empregada em situações onde não há conhecimento prévio de uma classe. A classificação é
feita mediante agrupamento através de alguma medida de distância. 
C Dados que fazem parte do mesmo grupo apresentam um grau de similaridade ou
dissimilaridade elevado. 
D Composto por várias medidas de distância, entre estas a distância Euclidiana que, devido à sua
popularidade, pode se aplicar a praticamente todas as classes de problemas.
Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma diversidade 
de algoritmos. Relacione a classe de algoritmos com os métodos, associando os itens, conforme o 
código abaixo:
13
14
15
30/07/2023, 12:11 Avaliação da Disciplina
about:blank 7/9
 I – Algoritmos DIANA, ROCK. II – Algoritmos DBSCAN, OPTICS. 
III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM) 
IV – Algoritmos K-Means, CLARANS. V – Algoritmos STING, WAVECLUSTER. 
( ) Métodos hierárquicos. ( ) Métodos baseados em grid. ( ) Métodos de particionamento. 
( ) Métodos baseados em modelos. ( ) Métodos baseados em densidade. 
Assinale a alternativa que apresenta a sequência CORRETA: 
A III – IV – II – I – V.
B II– V – III – IV – I. 
C I – IV – V – II – III. 
D I – V – IV – III – II. 
Empresas de muitos ramos têm investido em tecnologias e análise de dados para expandirem seus 
negócios. Em geral, que circunstâncias-chave tem incentivado empresas a investirem parte de seus 
recursos em análise de dados?
 A partir das alternativas abaixo, assinale a CORRETA: 
A Algoritmos cada vez mais inteligentes, redução de mão de obra e incremento tecnológico.
B Mensurar retorno de investimentos, incentivos governamentais e garantia de lucro.
C Melhoria dos processos de negócio, aumento de competitividade e o valor que pode ser obtido. 
D Automatização de processos, incentivos fiscais e mão de obra barata. 
A definição de uma arquitetura que atenda às necessidades é algo central em projetos de Big Data e 
pode ajudar diretamente gestores de negócio em suas tomadas de decisão.
 
Dessa forma, em termos de projetos: que requisitos e componentes principais uma arquitetura 
tradicional deve ter? A partir das alternativas abaixo, assinale a CORRETA: 
A
 Lidar com dados de quaisquer naturezas obtidos a partir de diversas fontes (internas e externas).
Implementação de estrutura que suporte armazenamento e processamento em larga escala tanto
para dados em lote quanto em fluxo contínuo. 
B
 Capacidade para armazenar e processar grandes volumes de dados entregando a informação certa
no tempo certo. Para isso é necessário definir uma camada de extração e ingestão de dados
eficiente, política de armazenamento, definição do tipo de análise e uma camada para
apresentação de resultados. 
C
 Alto investimento em infraestrutura para suportar as demandas de Big Data. Implementação de
um sólido mecanismo de coleta e armazenamento de dados no Hadoop para processar grandes
volumes de dados em tempo real e uma camada de visualização que será útil para gestores de
negócio extrair insights.
16
17
30/07/2023, 12:11 Avaliação da Disciplina
about:blank 8/9
D
 Forte mecanismo de integração de dados para entregar ao gestor de negócios informações de
forma transparente e única. É necessário alto investimento em máquinas que possam suportar o
armazenamento e processamento paralelo a fim de que seja possível analisar os dados e entregá-
los à camada de apresentação.
Grande parte do sucesso do Spark está relacionado à sua estrutura, que é composta por alguns 
componentes. O principal deles é o RDD.
 Sobre este componente, classifique V para as sentenças verdadeiras e F para as falsas:
( ) É uma estrutura física do Spark que guarda informações dos objetos do Spark. Sua única 
limitação é não possuir um mecanismo para tratamento de falhas.
( ) Possui uma estrutura similar a uma tabela, conhecida como dataset que pode armazenar dados de 
diferentes tipos.
( ) Fornece suporte a dois tipos de operações: transformação e ação. Quando se aplica uma 
transformação um novo RDD é criado, mas o conjunto de dados só é alterado se for aplicada uma 
etapa de ação.
( ) Algumas operações de transformação são: SortByKey, FlatMap e GroupByKey enquanto que 
collect, count e CountByKey são operações de ação.
 A partir das alternativas abaixo, assinale a CORRETA: 
A F – V – V – F.
B V – V – V – F. 
C F – V – V – V. 
D F – F – V – V.
O HDFS é um sistema de arquivos do Hadoop que permite armazenar grandes volumes de dados e 
possui uma arquitetura que apresenta alguns componentes importantes.
 Dentre os componentes principais da arquitetura do HDFS, assinale a alternativa CORRETA.
A
 O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado vital, pois gerencia
todos os dados que chegam ao sistema e notifica aos escravos (Data Node) em caso de falha.
Estes apenas executam as tarefas solicitadas.
B
 O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro está relacionado ao
armazenamento e processamento dos dados diretamente no cluster “pai”, enquanto que o segundo
apenas obedece às instruções do pai e o notifica quando for o caso. 
C
 O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro é responsável por agendar e
gerenciar as tarefas de armazenamento, enquanto que o segundo realiza as atividades diretamente
nas máquinas destino. 
D
 O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado mestre porque
controla todas as atividades relacionadas ao armazenamento físico dos dados em cada nó,
enquanto o segundo processa os dados e comunica ao mestre. 
18
19
30/07/2023, 12:11 Avaliação da Disciplina
about:blank 9/9
Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma diversidade 
de algoritmos.
 Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código abaixo: 
I – Algoritmos DIANA, ROCK.II – Algoritmos DBSCAN, OPTICS.
III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM)
IV – Algoritmos K-Means, CLARANS.V – Algoritmos STING, WAVECLUSTER. 
( ) Métodos hierárquicos.( ) Métodos baseados em grid.( ) Métodos de particionamento.
( ) Métodos baseados em modelos.( ) Métodos baseados em densidade. 
Assinale a alternativa que apresenta a sequência CORRETA: 
A II – V – III – IV – I.
B III – IV – II – I – V.
C I – IV – V – II – III.
D I – V – IV – III – II. 
20
Imprimir

Mais conteúdos dessa disciplina