Buscar

Avaliação da Disciplina Big Analytic


Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

29/11/23, 16:42 Avaliação da Disciplina
about:blank 1/1
Prova Impressa
GABARITO | Avaliação da Disciplina (Cod.:645387)
Peso da Avaliação 10,00
Prova 75321867
Qtd. de Questões 20
Nota 10,00
Existem diversos métodos tradicionais que podem ser empregados para análise em cluster e são potencialmente interessantes em cenários de baixa complexidade - com quantidade de dados reduzida. Em relação aos métodos hierárquicos é CORRETO afirmar que:
A Agrupa um conjunto de pontos de dados em uma estrutura de árvore (dendograma) e fornece boa capacidade para comunicação dos resultados. 
B Define aleatoriamente um ponto de partida para o parâmetro K e assim tenta otimizar o resultado ao longo das iterações.
C Divide o cluster através de níveis, onde os objetos alocados nos níveis superiores da árvore são mais próximos entre si. 
D Apresenta como vantagem a simplicidade e o fato de ser eficiente, mesmo em situações onde o conjunto de dados é significativo.
O gerenciamento da inovação é o processo de aquisição de capacidades relevantes para melhorar o desempenho da organização.Nesse sentido, assinale a alternativa que apresenta as cinco principais áreas de atuação do gerenciamento da inovação: 
A Oferta, processos, marca, clientes, produto.
B Imagem, sustentabilidade, processos, serviços e oferta.
C Organização, estratégias, processo, recursos e aprendizado.
D Design, projeto, produto e estratégia.
O HDFS é um sistema de arquivos do Hadoop que permite armazenar grandes volumes de dados e possui uma arquitetura que apresenta alguns componentes importantes. Dentre os componentes principais da arquitetura do HDFS, assinale a alternativa CORRETA.
A O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado mestre porque controla todas as atividades relacionadas ao armazenamento físico dos dados em cada nó, enquanto o segundo processa os dados e comunica ao mestre. 
B O HDFS é formado pelo NameNode e DataNode. O primeiro é considerado vital, pois gerencia todos os dados que chegam ao sistema e notifica aos escravos (Data Node) em caso de falha. Estes apenas executam as tarefas solicitadas.
C O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro é responsável por agendar e gerenciar as tarefas de armazenamento, enquanto que o segundo realiza as atividades diretamente nas máquinas destino. 
D O HDFS é formado pelo JobTracker e o TaskTrack. O primeiro está relacionado ao armazenamento e processamento dos dados diretamente no cluster “pai”, enquanto que o segundo apenas obedece às instruções do pai e o notifica quando for o caso. 
Para inovar, é preciso pensar fora da caixa, ser ousado, buscar por conhecimento, pesquisar, estabelecer parcerias e ter comprometimento. Isso posto, assinale V para verdadeiro e F para falso nas afirmações que seguem: ( ) O Manual de Oslo, editado pela Organização para a Cooperação e o Desenvolvimento Econômico (OCDE, 2005), responsável pela definição de inovação adotada mundialmente, fez uma alteração que expandiu o conceito de inovação, abrangendo o setor financeiro e acrescentando as mensurações estatísticas da definição.
( ) O Manual de Oslo fez uma alteração que expandiu o conceito de inovação, abrangendo o setor de serviços e removendo a palavra “tecnológica” da definição, estabelecendo como possível, a inovação em produtos, em processos, em serviços, em marketing e em sistemas organizacionais.( ) “A Lei do Bem”, define inovação tecnológica como a concepção de novo produto ou processo de fabricação, bem como agrega novas funcionalidades ou características ao produto ou processo, implicando melhorias incrementais e efetivo ganho de qualidade ou produtividade. Assinale a alternativa que apresenta a sequência correta de respostas: 
A F – V – V.
B V – V – F.
C F – V – F.
D V – V – V.
A clusterização é uma técnica de aprendizagem não supervisionada que visa classificar um conjunto de dados semelhantes em um mesmo grupo. No que se refere à clusterização é CORRETO afirmar que: 
A Composto por várias medidas de distância, entre estas a distância Euclidiana que, devido à sua popularidade, pode se aplicar a praticamente todas as classes de problemas.
B É útil para classificar um grupo de objetos com classes já definidas, por exemplo, prever a média de vendas de casas em uma determinada região. 
C Dados que fazem parte do mesmo grupo apresentam um grau de similaridade ou dissimilaridade elevado. 
D É empregada em situações onde não há conhecimento prévio de uma classe. A classificação é feita mediante agrupamento através de alguma medida de distância. 
A inovação que permeia toda a organização, que se alimenta de aprendizado (ao longo da vida), que se desenvolve por meio de ferramentas e metodologias específicas, que utiliza racionalmente tecnologias, que se valida por indicadores próprios, que persegue novos valores e é potencializada por meio dos novos processos gerenciais, deve ser vista como a principal alavanca do crescimento sustentável de uma organização. STAREC, Claudio (Org.). Gestão da informação, inovação e inteligência competitiva: como transformar a informação em vantagem competitiva nas organizações. São Paulo: Saraiva, 2012. Sobre inovação, analise as sentenças que seguem: 
I - A gestão para inovação se preocupa em respeitar a cultura organizacional, utilizando o modelo mais indicado à organização.II - Para inovar, é necessário repensar padrões e conceitos, romper barreiras e agregar valor.III - Para que as organizações consigam efetivamente implantar a inovação, é preciso, necessariamente, que desenvolvam novas tecnologias. Assinale a alternativa que apresenta a resposta correta: 
A As sentenças II e III estão corretas.
B As sentenças I e II estão corretas.
C As sentenças I e III estão corretas.
D As sentenças I, II e III estão corretas.
A definição de uma arquitetura que atenda às necessidades é algo central em projetos de Big Data e pode ajudar diretamente gestores de negócio em suas tomadas de decisão. Dessa forma, em termos de projetos: que requisitos e componentes principais uma arquitetura tradicional deve ter? A partir das alternativas abaixo, assinale a CORRETA: 
A Lidar com dados de quaisquer naturezas obtidos a partir de diversas fontes (internas e externas). Implementação de estrutura que suporte armazenamento e processamento em larga escala tanto para dados em lote quanto em fluxo contínuo. 
B Alto investimento em infraestrutura para suportar as demandas de Big Data. Implementação de um sólido mecanismo de coleta e armazenamento de dados no Hadoop para processar grandes volumes de dados em tempo real e uma camada de visualização que será útil para gestores de negócio extrair insights.
C Forte mecanismo de integração de dados para entregar ao gestor de negócios informações de forma transparente e única. É necessário alto investimento em máquinas que possam suportar o armazenamento e processamento paralelo a fim de que seja possível analisar os dados e entregá-los à camada de apresentação.
D Capacidade para armazenar e processar grandes volumes de dados entregando a informação certa no tempo certo. Para isso é necessário definir uma camada de extração e ingestão de dados eficiente, política de armazenamento, definição do tipo de análise e uma camada para apresentação de resultados. 
As técnicas de Multi Machine Clustering surgiram para otimizar e melhorar a escalabilidade e o desempenho das análises em cluster para atender às demandas do Big Data. Em relação às técnicas de Multi Machine Clustering, o que é possível afirmar? A partir das alternativas abaixo, assinale a CORRETA:
A É composta pela clusterização paralela e pela clusterização baseada em MapReduce. A segunda, inclusive, torna o processo de paralelização mais transparente para o desenvolvedor. 
B São mais velozes que as abordagens tradicionais de agrupamento, no entanto, a alta complexidade de implementação inviabiliza projetos de análises mais amplos. 
C Apresentam como grande característica o alto poder de processamento comimplementação de baixa complexidade e algoritmos como PAM, DBSCAN e PIRBICH. 
D É constituída pelas técnicas de clusterização paralela e baseada em MapReduce que tornam o processo de paralelização menos complexo para o desenvolvedor.
Empresas de muitos ramos têm investido em tecnologias e análise de dados para expandirem seus negócios. Em geral, que circunstâncias-chave tem incentivado empresas a investirem parte de seus recursos em análise de dados? A partir das alternativas abaixo, assinale a CORRETA: 
A Mensurar retorno de investimentos, incentivos governamentais e garantia de lucro.
B Melhoria dos processos de negócio, aumento de competitividade e o valor que pode ser obtido. 
C Automatização de processos, incentivos fiscais e mão de obra barata. 
D Algoritmos cada vez mais inteligentes, redução de mão de obra e incremento tecnológico.
As fontes de dados podem ser externas - quando se referem a fontes em que a organização não tem total controle – ou internas, quando a organização possui total controle. Ambas são úteis para análise em Big Data, visto que podem fornecer uma visão mais ampla de como o negócio está posicionado no mercado. Sobre a estrutura dos dados contidos nas fontes, é possível classificar em: dados estruturados, semiestruturados e não estruturados. Com base nisso, associe os itens I,II e III com as descrições correspondentes abaixo:I – Dados estruturados.II – Dados semiestruturados.III – Dados não estruturados.( ) São dados que apresentam uma estrutura flexível e autodescritiva.
( ) São dados que apresentam uma estrutura bem definida com tamanho fixo.( ) São dados que não apresentam uma estrutura e são descritos em linguagem natural. Assinale a alternativa que apresenta a sequência CORRETA dos itens:
A II – I – III. 
B II – III – I.
C I – II – III. 
D I – III – II. 
Ferramentas para inovação são metodologias de apoio ao processo de criação de novas concepções. Diante disso, analise e associe os itens que seguem: I – Estratégia do oceano azul II – Brainstorming III – Business Model Canvas IV – Design Thinking ( ) Metodologia de geração de ideias sobre novos produtos, serviços e campanhas publicitárias. Foca, prioritariamente, a quantidade de ideias geradas, desprezando a qualidade, em um primeiro momento. ( ) Metodologia baseada em ação criativa. É um processo interativo que exige experimentação e cujo foco principal se volta para o consumidor. 
( ) Consiste em um mapa dividido em nove blocos que definirão, de maneira rápida e prática, o modelo de negócios de uma organização. ( ) Apresenta uma nova maneira de pensar sobre estratégia, resultando na criação de novos espaços e na separação da concorrência. Assinale a alternativa que apresenta a sequência correta de respostas: 
A I – II – III – IV.
B II – IV – III – I.
C II – I – III – IV.
D I – II – IV – III.
Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma diversidade de algoritmos. Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código abaixo: I – Algoritmos DIANA, ROCK.II – Algoritmos DBSCAN, OPTICS.III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM)IV – Algoritmos K-Means, CLARANS.V – Algoritmos STING, WAVECLUSTER. ( ) Métodos hierárquicos.( ) Métodos baseados em grid.( ) Métodos de particionamento.( ) Métodos baseados em modelos.( ) Métodos baseados em densidade. Assinale a alternativa que apresenta a sequência CORRETA: 
A III – IV – II – I – V.
B I – IV – V – II – III.
C II – V – III – IV – I.
D I – V – IV – III – II. 
Em métodos hierárquicos tradicionais a complexidade no espaço O(n²) e no tempo O(n³) é algo que limita o poder de ação dos algoritmos. E, em muitos casos, algumas circunstâncias tornam o processo de análise extremamente oneroso ou mesmo inviável. Essa limitação tem sido evidenciada por alguns fatores, quais destes é possível destacar? A partir das alternativas abaixo, assinale a CORRETA:
A O crescente número de ferramentas voltadas para Big Data que substituem as formas de análise tradicionais.
B O modelo de gestão de dados que impôs o uso de algoritmos distribuídos para ganhos de performance.
C A exigência cada vez mais recorrente de aplicações voltadas para detecção de eventos anômalos.
D O volume intenso e variado de dados que estão sendo gerados e requeridos para análise. 
Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma diversidade de algoritmos. Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código abaixo: I – Algoritmos DIANA, ROCK. II – Algoritmos DBSCAN, OPTICS. III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM) IV – Algoritmos K-Means, CLARANS. V – Algoritmos STING, WAVECLUSTER. ( ) Métodos hierárquicos. ( ) Métodos baseados em grid. ( ) Métodos de particionamento. ( ) Métodos baseados em modelos. ( ) Métodos baseados em densidade. Assinale a alternativa que apresenta a sequência CORRETA: 
A I – IV – V – II – III. 
B I – V – IV – III – II. 
C II – V – III – IV – I. 
D III – IV – II – I – V.
As métricas de segmentação representam outra classe de medidas para análise de redes sociais. Em relação a essas métricas, associe os itens, conforme o código abaixo: I – Coeficiente de agrupamento. II – Coesão. III – Clique. ( ) É uma medida que representa o grau de ligação existente entre dois vértices. ( ) É uma medida que indica a probabilidade de formação de clusters entre os vértices. ( ) Quando um determinado vértice está diretamente conectado a todos os outros vértices. A partir das alternativas abaixo, assinale a CORRETA: 
A II – III – I. 
B II – I – III. 
C I – II – III. 
D III – II – I.
Os meios digitais consistem em um grande potencial para geração e análise dos dados. Nos dias de hoje as empresas têm investido nesses meios para compreender melhor como seus clientes atuam nestas redes. Em relação à análise digital é correto afirmar que:
A Conhecida hoje como “Web Analytics” e compreende todas as páginas de um website. A análise de dados nos websites é feita observando as diferentes métricas de ferramentas como Google Analytics para avaliar o comportamento virtual do usuário dentro da página.
B Está relacionada a um conjunto de métricas e indicadores para avaliar o comportamento digital de um usuário, como cliques de mouse, posts nas redes sociais, tempo de sessão e assim por diante. Por ser uma área recente, ainda não possui ferramentas com recursos suficientes para análise de grande volume de dados.
C Possui uma diversidade de APIs para acesso e exploração dos dados digitais. São dados como: origens do tráfego, sites mais visitados, registros de compras em um site de vendas e assim por diante. Apesar de todo o potencial, a complexidade e o custo para extrair esses dados impedem o amplo uso desses recursos digitais.
D Antigamente restringia-se apenas ao termo “web”, mas nos dias de hoje o termo digital expande a todos os dispositivos capazes de conectar a web. A base dessas análises está relacionada a indicadores ou métricas específicas, como: taxa de rejeição, usuários ativos por hora, informações demográficas, etc. 
Apesar do grande crescimento, o Big Data é um conceito amplo que se refere à forma como lidamos com a grande quantidade de dados disponível para uso. Além disso, a empresa precisa construir uma infraestrutura para lidar com uma infinidade de fontes e processá-las em um tempo razoável.
 
Diante disso, em qual cenário uma empresa pode estar diante de um Big Data? A partir das alternativas abaixo, assinale a CORRETA: 
A Quando a análise de dados tradicional não estiver mais trazendo real valor para a organização, o que poderia indicar a possibilidade de trazer inovação com novas formas de analisar os dados.
B Em situações onde a infraestrutura de dados da empresa apresenta elevada taxa de latência e/ou inviabilidade para análises de dados de grande volume e em diferentesformatos e estruturas.
C Quando o conjunto de dados ultrapassar a casa dos 1PB e a empresa precise lidar com dados estruturados, semiestruturados e/ou não estruturados.
D Em circunstâncias onde o volume de dados da organização aumente significativamente, tornando-se possível comprar novos servidores, o que poderia diminuir os custos com armazenamento. 
A demanda por profissionais de análise de dados ampliou o escopo de exigências destes profissionais. As empresas estão interessadas em profissionais capacitados e que tenham habilidades em trabalhar com dados. Tendo isso em mente, quais são as principais habilidades requeridas para um profissional de dados?A partir das alternativas abaixo, assinale a CORRETA:
A Raciocínio lógico apurado, capacidade para extrair insights de dados não estruturados, experiência prévia em aprendizagem de máquina e pouco conhecimento do conceito de Big Data.
B Capacidade para manipulação de dados, conhecimentos em estatística e aprendizado de máquina, habilidades com ferramentas e/ou linguagens de programação e capacidade para transmitir resultados.
C Forte capacidade analítica, amplo conhecimento em ferramentas de visualização de dados e frameworks de Big Data como Apache Spark e PowerBI e domínio de bancos de dados não relacionais.
D Domínio de técnicas de aprendizagem de máquina, amplo conhecimento em matemática, experiência com todos os tipos de dados ou banco de dados (extração e manipulação) e amplo conhecimento do negócio.
Em épocas passadas as empresas conviviam com certas limitações, em termos de tecnologia, para que pudessem analisar seus dados.Por outro lado, nos dias atuais, as tecnologias possibilitaram e estimularam a produção de conteúdo.Tendo isso em mente, classifique V para as sentenças verdadeiras e F para as falsas: ( ) As empresas precisam lidar com o alto volume e variedade de dados digitais propondo soluções automáticas de análise a fim de se manterem competitivas.( ) As empresas orientadas a dados têm à disposição uma massiva quantidade de dados, porém, em muitos casos não sabem como gerenciá-los.
( ) A elevada produção de conteúdo implica em um problema de sobrecarga de informação, evidenciando as limitações da ação humana para lidar com isso. Assinale a alternativa correta:
A V – V – V.
B V – F – V.
C F – V – V.
D V – F – F.
O Apache Spark oferece não somente a capacidade de processamento, como também a possibilidade de realizar análises mais avançadas através de um conjunto de bibliotecas. Considerando isso, associe os itens, conforme o código abaixo: I – Spark SQL.II – Spark Streaming.III – Spark MLlib.IV – Spark GraphX. ( ) Contém um conjunto de algoritmos otimizados de Machine Learning projetados para trabalharem em paralelo.( ) Projetadas para processar estruturas em rede de forma otimizada e com elevada eficiência.( ) É possível realizar consultas e processar dados estruturados em ambiente Big Data de forma ágil.
( ) Útil para manipular e processar dados de tempo real, analisando microbacths de dados de tempos em tempos. A partir das alternativas abaixo, assinale a CORRETA:
A II – III – IV – I. 
B III – IV – I – II. 
C III – II – I – IV.
D IV – III – I – II.
 VOLTAR
A+ Alterar modo de visualização
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Imprimir

Mais conteúdos dessa disciplina