Buscar

Big Data Analytic e a Tomada de Decisões - MBA GESTAO COMERCIAL

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
Existem diversos métodos tradicionais que podem ser empregados para análise em cluster e 
são potencialmente interessantes em cenários de baixa complexidade - com quantidade de 
dados reduzida. 
 
Em relação aos métodos hierárquicos é CORRETO afirmar que: 
A 
 Agrupa um conjunto de pontos de dados em uma estrutura de árvore (dendograma) e fornece 
boa capacidade para comunicação dos resultados. 
B 
 Divide o cluster através de níveis, onde os objetos alocados nos níveis superiores da árvore 
são mais próximos entre si. 
C 
 Define aleatoriamente um ponto de partida para o parâmetro K e assim tenta otimizar o 
resultado ao longo das iterações. 
D 
 Apresenta como vantagem a simplicidade e o fato de ser eficiente, mesmo em situações onde 
o conjunto de dados é significativo. 
2 
A clusterização é uma técnica de aprendizagem não supervisionada que visa classificar um 
conjunto de dados semelhantes em um mesmo grupo. 
 
No que se refere à clusterização é CORRETO afirmar que: 
A 
 Composto por várias medidas de distância, entre estas a distância Euclidiana que, devido à 
sua popularidade, pode se aplicar a praticamente todas as classes de problemas. 
B 
 É empregada em situações onde não há conhecimento prévio de uma classe. A classificação 
é feita mediante agrupamento através de alguma medida de distância. 
C 
 É útil para classificar um grupo de objetos com classes já definidas, por exemplo, prever a 
média de vendas de casas em uma determinada região. 
D 
 Dados que fazem parte do mesmo grupo apresentam um grau de similaridade ou 
dissimilaridade elevado. 
3 
Os meios digitais consistem em um grande potencial para geração e análise dos dados. Nos 
dias de hoje as empresas têm investido nesses meios para compreender melhor como seus 
clientes atuam nestas redes. 
 
Em relação à análise digital é correto afirmar que: 
A 
 Está relacionada a um conjunto de métricas e indicadores para avaliar o comportamento 
digital de um usuário, como cliques de mouse, posts nas redes sociais, tempo de sessão e 
assim por diante. Por ser uma área recente, ainda não possui ferramentas com recursos 
suficientes para análise de grande volume de dados. 
B 
 Possui uma diversidade de APIs para acesso e exploração dos dados digitais. São dados 
como: origens do tráfego, sites mais visitados, registros de compras em um site de vendas e 
assim por diante. Apesar de todo o potencial, a complexidade e o custo para extrair esses 
dados impedem o amplo uso desses recursos digitais. 
C 
 Conhecida hoje como “Web Analytics” e compreende todas as páginas de um website. A 
análise de dados nos websites é feita observando as diferentes métricas de ferramentas como 
Google Analytics para avaliar o comportamento virtual do usuário dentro da página. 
D 
 Antigamente restringia-se apenas ao termo “web”, mas nos dias de hoje o termo digital 
expande a todos os dispositivos capazes de conectar a web. A base dessas análises está 
relacionada a indicadores ou métricas específicas, como: taxa de rejeição, usuários ativos por 
hora, informações demográficas, etc. 
4 
Para inovar, é preciso pensar fora da caixa, ser ousado, buscar por conhecimento, pesquisar, 
estabelecer parcerias e ter comprometimento. Isso posto, assinale V para verdadeiro e F para 
falso nas afirmações que seguem: 
 
( ) O Manual de Oslo, editado pela Organização para a Cooperação e o Desenvolvimento 
Econômico (OCDE, 2005), responsável pela definição de inovação adotada mundialmente, 
fez uma alteração que expandiu o conceito de inovação, abrangendo o setor financeiro e 
acrescentando as mensurações estatísticas da definição. 
( ) O Manual de Oslo fez uma alteração que expandiu o conceito de inovação, abrangendo o 
setor de serviços e removendo a palavra “tecnológica” da definição, estabelecendo como 
possível, a inovação em produtos, em processos, em serviços, em marketing e em sistemas 
organizacionais. 
( ) “A Lei do Bem”, define inovação tecnológica como a concepção de novo produto ou 
processo de fabricação, bem como agrega novas funcionalidades ou características ao produto 
ou processo, implicando melhorias incrementais e efetivo ganho de qualidade ou 
produtividade. 
 
Assinale a alternativa que apresenta a sequência correta de respostas: 
A 
V – V – F. 
B 
F – V – F. 
C 
F – V – V. 
D 
V – V – V. 
5 
O gerenciamento da inovação é o processo de aquisição de capacidades relevantes para 
melhorar o desempenho da organização. 
Nesse sentido, assinale a alternativa que apresenta as cinco principais áreas de atuação do 
gerenciamento da inovação: 
A 
Organização, estratégias, processo, recursos e aprendizado. 
B 
Design, projeto, produto e estratégia. 
C 
Oferta, processos, marca, clientes, produto. 
D 
Imagem, sustentabilidade, processos, serviços e oferta. 
6 
As métricas de segmentação representam outra classe de medidas para análise de redes 
sociais. 
 
Em relação a essas métricas, associe os itens, conforme o código abaixo: 
 
I – Coeficiente de agrupamento. 
 
II – Coesão. 
 
III – Clique. 
 
( ) É uma medida que representa o grau de ligação existente entre dois vértices. 
 
( ) É uma medida que indica a probabilidade de formação de clusters entre os vértices. 
 
( ) Quando um determinado vértice está diretamente conectado a todos os outros vértices. 
 
A partir das alternativas abaixo, assinale a CORRETA: 
A 
 II – III – I. 
B 
 III – II – I. 
C 
 II – I – III. 
D 
 I – II – III. 
7 
Ferramentas para inovação são metodologias de apoio ao processo de criação de novas 
concepções. Diante disso, analise e associe os itens que seguem: 
 
I – Estratégia do oceano azul 
 
II – Brainstorming 
 
III – Business Model Canvas 
 
IV – Design Thinking 
 
( ) Metodologia de geração de ideias sobre novos produtos, serviços e campanhas 
publicitárias. Foca, prioritariamente, a quantidade de ideias geradas, desprezando a qualidade, 
em um primeiro momento. 
 
( ) Metodologia baseada em ação criativa. É um processo interativo que exige 
experimentação e cujo foco principal se volta para o consumidor. 
 
( ) Consiste em um mapa dividido em nove blocos que definirão, de maneira rápida e prática, 
o modelo de negócios de uma organização. 
 
( ) Apresenta uma nova maneira de pensar sobre estratégia, resultando na criação de novos 
espaços e na separação da concorrência. 
 
Assinale a alternativa que apresenta a sequência correta de respostas: 
A 
II – IV – III – I. 
B 
II – I – III – IV. 
C 
I – II – III – IV. 
D 
I – II – IV – III. 
8 
As fontes de dados podem ser externas - quando se referem a fontes em que a organização 
não tem total controle – ou internas, quando a organização possui total controle. Ambas são 
úteis para análise em Big Data, visto que podem fornecer uma visão mais ampla de como o 
negócio está posicionado no mercado. Sobre a estrutura dos dados contidos nas fontes, é 
possível classificar em: dados estruturados, semiestruturados e não estruturados. 
 
Com base nisso, associe os itens I,II e III com as descrições correspondentes abaixo: 
I – Dados estruturados. 
II – Dados semiestruturados. 
III – Dados não estruturados. 
( ) São dados que apresentam uma estrutura flexível e autodescritiva. 
( ) São dados que apresentam uma estrutura bem definida com tamanho fixo. 
( ) São dados que não apresentam uma estrutura e são descritos em linguagem natural. 
 
Assinale a alternativa que apresenta a sequência CORRETA dos itens: 
A 
 I – II – III. 
B 
 I – III – II. 
C 
 II – I – III. 
D 
 II – III – I. 
9 
A inovação que permeia toda a organização, que se alimenta de aprendizado (ao longo da 
vida), que se desenvolve por meio de ferramentas e metodologias específicas, que utiliza 
racionalmente tecnologias, que se valida por indicadores próprios, que persegue novos 
valores e é potencializada por meio dos novos processosgerenciais, deve ser vista como a 
principal alavanca do crescimento sustentável de uma organização. 
 
STAREC, Claudio (Org.). Gestão da informação, inovação e inteligência competitiva: 
como transformar a informação em vantagem competitiva nas organizações. São Paulo: 
Saraiva, 2012. 
 
Sobre inovação, analise as sentenças que seguem: 
 
I - A gestão para inovação se preocupa em respeitar a cultura organizacional, utilizando o 
modelo mais indicado à organização. 
II - Para inovar, é necessário repensar padrões e conceitos, romper barreiras e agregar valor. 
III - Para que as organizações consigam efetivamente implantar a inovação, é preciso, 
necessariamente, que desenvolvam novas tecnologias. 
 
Assinale a alternativa que apresenta a resposta correta: 
A 
As sentenças I, II e III estão corretas. 
B 
As sentenças II e III estão corretas. 
C 
As sentenças I e II estão corretas. 
D 
As sentenças I e III estão corretas. 
10 
Empresas de muitos ramos têm investido em tecnologias e análise de dados para expandirem 
seus negócios. Em geral, que circunstâncias-chave tem incentivado empresas a investirem 
parte de seus recursos em análise de dados? 
 
A partir das alternativas abaixo, assinale a CORRETA: 
 
A 
 Algoritmos cada vez mais inteligentes, redução de mão de obra e incremento tecnológico. 
B 
 Mensurar retorno de investimentos, incentivos governamentais e garantia de lucro. 
C 
 Automatização de processos, incentivos fiscais e mão de obra barata. 
D 
 Melhoria dos processos de negócio, aumento de competitividade e o valor que pode ser 
obtido. 
11 
“Estruturas teóricas linguísticas como a Teoria Texto-Sentido (MTT) para a construção de 
modelos de linguagem natural têm permitido que computadores possam processar a 
linguagem natural e começar a compreender o significado sobre a linguagem humana.” 
INBENTA. Disponível em: < https://www.inbenta.com/pt/tecnologia/tecnologia-de-
linguagem-natural/ >. 
 
“Ainda que o processamento de linguagem natural não seja uma ciência nova, essa tecnologia 
está avançando rapidamente graças ao interesse cada vez maior na comunicação homem-
máquina, paralelamente à disponibilidade de big data, computação mais poderosa e 
algoritmos aprimorados.” SAS. 
Disponível em: < https://www.sas.com/pt_br/insights/analytics/processamento-de-linguagem-
natural.html >. 
 
Os textos acima expõem conceitos relacionados ao Processamento de Linguagem Natural 
(PLN), em relação a esse conceito e suas aplicações é correto afirmar que: 
A 
 Pode ser aplicada tanto em análise de dados estruturados como não estruturados e realiza 
algumas etapas, como a extração semântica no texto que observa padrões de escrita em uma 
frase. 
B 
 Basicamente, realiza a análise de texto em grandes volumes de dados, por exemplo, análise 
de posts no Facebook. A PLN é um campo definitivamente consolidado e, portanto, a 
comunicação homem-máquina é perfeitamente compreendida. 
C 
 Um dos campos de aplicação é a análise de sentimentos, ao considerar a questão subjetiva 
extraindo emoções de um discurso. É um tipo de aplicação ainda pouco consolidada e não 
possui muitos cases, porém, apresenta grande potencial. 
D 
 Tem como fundamento compreender o contexto no qual um discurso foi empregado, por 
meio de análises léxicas, sintáticas, semânticas, etc., como é caso quando deseja-se converter 
voz em texto. 
12 
Um processo de análise de dados pode ser representado em quatro etapas. Cada uma dessas 
etapas possui particularidades que vão desde a base para implementação de análise de dados 
nas empresas até profundos e sofisticados mecanismos de análise dentro das organizações. 
 
Em se tratando dos tipos de análises existentes, qual a opção que descreve a análise 
prescritiva? A partir das alternativas abaixo, assinale a CORRETA: 
A 
 É um tipo de análise voltado para responder apenas perguntas de situações que ainda não 
ocorreram, mas que provavelmente venham a ocorrer. Isso é obtido através da criação de 
modelos de aprendizagem de máquina avançados. 
B 
 Etapa mais avançada da análise de dados que fornece apoio à tomada de decisão de forma 
automatizada com mínima intervenção humana. Isso é possível graças às experiências 
desenvolvidas que são aperfeiçoadas ao longo do tempo. 
C 
 Análise prescritiva refere-se ao tipo de análise que é responsável por tomar as decisões com 
independência. Procura responder perguntas como: “Por que esse evento aconteceu?” e 
obtém respostas através de algoritmos de classificação. 
D 
 É um processo voltado para responder perguntas do passado para inferir situações que 
venham a ocorrer. Por isso, a participação humana é importante para fornecer suporte e 
aprimorar as decisões obtidas pelos algoritmos implementados. 
13 
Em métodos hierárquicos tradicionais a complexidade no espaço O(n²) e no tempo O(n³) é 
algo que limita o poder de ação dos algoritmos. E, em muitos casos, algumas circunstâncias 
tornam o processo de análise extremamente oneroso ou mesmo inviável. Essa limitação tem 
sido evidenciada por alguns fatores, quais destes é possível destacar? 
 
A partir das alternativas abaixo, assinale a CORRETA: 
A 
 A exigência cada vez mais recorrente de aplicações voltadas para detecção de eventos 
anômalos. 
B 
 O crescente número de ferramentas voltadas para Big Data que substituem as formas de 
análise tradicionais. 
C 
 O volume intenso e variado de dados que estão sendo gerados e requeridos para análise. 
D 
 O modelo de gestão de dados que impôs o uso de algoritmos distribuídos para ganhos de 
performance. 
14 
A transição da Web representou um importante mecanismo para a revolução dos dados e 
expôs um novo cenário de explosão e novos formatos para análise de dados nos meios 
digitais. 
Nesse sentido, dentre as três fases da web, qual destas representou a gênese para explosão dos 
dados? 
 
A partir das alternativas abaixo, assinale a CORRETA: 
A 
 Na Web 3.0 a partir da geração de conteúdo por parte do usuário e a compreensão semântica 
de suas atividades na rede. 
B 
 Na Web 1.0 que representou o primeiro contato dos usuários em relação à web. 
C 
 Entre a Web 1.0 e Web 2.0 com o surgimento das primeiras redes sociais. 
D 
 Na Web 2.0 onde os usuários passaram a gerar conteúdo a partir de sistemas dinâmicos. 
15 
Uma das principais vantagens da clusterização baseada em MapReduce é, sem dúvida, a 
transparência de toda complexidade de implementação envolvida com a distribuição dos 
dados entre os clusters ou mesmo a capacidade para detectar e corrigir falhas que 
eventualmente possam ocorrer durante o processo. 
 
Relacione as técnicas com os algoritmos que as compõem, associando os itens, conforme o 
código abaixo: 
 
I – Clusterização Paralela. 
 
II – Clusterização baseada em MapReduce. 
 
( ) GPMR. 
 
( ) PBIRCH. 
 
( ) MR-DBSCAN. 
 
( ) G-DBSCAN. 
 
A partir das alternativas abaixo, assinale a CORRETA: 
A 
 II – I – II – I. 
B 
 I – II – I – II. 
C 
I – II – II – I. 
D 
 II – I – I – II. 
16 
Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma 
diversidade de algoritmos. 
 
Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código 
abaixo: 
 
I – Algoritmos DIANA, ROCK. 
II – Algoritmos DBSCAN, OPTICS. 
III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM) 
IV – Algoritmos K-Means, CLARANS. 
V – Algoritmos STING, WAVECLUSTER. 
 
( ) Métodos hierárquicos. 
( ) Métodos baseados em grid. 
( ) Métodos de particionamento. 
( ) Métodos baseados em modelos. 
( ) Métodos baseados em densidade. 
 
Assinale a alternativa que apresenta a sequência CORRETA: 
A 
 II – V – III – IV – I. 
B 
 III – IV – II – I – V. 
C 
 I – V – IV – III – II. 
D 
 I – IV – V – II – III. 
17 
A demanda por profissionais de análise de dados ampliou o escopo deexigências destes 
profissionais. As empresas estão interessadas em profissionais capacitados e que tenham 
habilidades em trabalhar com dados. Tendo isso em mente, quais são as principais 
habilidades requeridas para um profissional de dados? 
A partir das alternativas abaixo, assinale a CORRETA: 
A 
 Domínio de técnicas de aprendizagem de máquina, amplo conhecimento em matemática, 
experiência com todos os tipos de dados ou banco de dados (extração e manipulação) e amplo 
conhecimento do negócio. 
B 
 Capacidade para manipulação de dados, conhecimentos em estatística e aprendizado de 
máquina, habilidades com ferramentas e/ou linguagens de programação e capacidade para 
transmitir resultados. 
C 
 Raciocínio lógico apurado, capacidade para extrair insights de dados não estruturados, 
experiência prévia em aprendizagem de máquina e pouco conhecimento do conceito de Big 
Data. 
D 
 Forte capacidade analítica, amplo conhecimento em ferramentas de visualização de dados e 
frameworks de Big Data como Apache Spark e PowerBI e domínio de bancos de dados não 
relacionais. 
18 
A definição de uma arquitetura que atenda às necessidades é algo central em projetos de Big 
Data e pode ajudar diretamente gestores de negócio em suas tomadas de decisão. 
 
Dessa forma, em termos de projetos: que requisitos e componentes principais uma arquitetura 
tradicional deve ter? A partir das alternativas abaixo, assinale a CORRETA: 
A 
 Alto investimento em infraestrutura para suportar as demandas de Big Data. Implementação 
de um sólido mecanismo de coleta e armazenamento de dados no Hadoop para processar 
grandes volumes de dados em tempo real e uma camada de visualização que será útil para 
gestores de negócio extrair insights. 
B 
 Forte mecanismo de integração de dados para entregar ao gestor de negócios informações de 
forma transparente e única. É necessário alto investimento em máquinas que possam suportar 
o armazenamento e processamento paralelo a fim de que seja possível analisar os dados e 
entregá-los à camada de apresentação. 
C 
 Capacidade para armazenar e processar grandes volumes de dados entregando a informação 
certa no tempo certo. Para isso é necessário definir uma camada de extração e ingestão de 
dados eficiente, política de armazenamento, definição do tipo de análise e uma camada para 
apresentação de resultados. 
D 
 Lidar com dados de quaisquer naturezas obtidos a partir de diversas fontes (internas e 
externas). Implementação de estrutura que suporte armazenamento e processamento em larga 
escala tanto para dados em lote quanto em fluxo contínuo. 
19 
Em épocas passadas as empresas conviviam com certas limitações, em termos de tecnologia, 
para que pudessem analisar seus dados. 
Por outro lado, nos dias atuais, as tecnologias possibilitaram e estimularam a produção de 
conteúdo. 
Tendo isso em mente, classifique V para as sentenças verdadeiras e F para as falsas: 
 
( ) As empresas precisam lidar com o alto volume e variedade de dados digitais propondo 
soluções automáticas de análise a fim de se manterem competitivas. 
( ) As empresas orientadas a dados têm à disposição uma massiva quantidade de dados, 
porém, em muitos casos não sabem como gerenciá-los. 
( ) A elevada produção de conteúdo implica em um problema de sobrecarga de informação, 
evidenciando as limitações da ação humana para lidar com isso. 
 
Assinale a alternativa correta: 
A 
 F – V – V. 
B 
 V – F – V. 
C 
 V – V – V. 
D 
 V – F – F. 
20 
“O processo de Big Data Analytics é utilizado nos negócios para descobrir padrões. 
Encontrar as tendências de mercado e acompanhar o comportamento do consumidor ajuda os 
negócios em suas decisões estratégicas e de marketing”. 
Disponível em: < https://marketingconteudo.com/big-data-analytics/ > 
 
Em relação ao processo de Big Data, o que é possível afirmar? 
A partir das alternativas abaixo, assinale a CORRETA: 
A 
 É interativo devido às etapas de todo o processo serem independentes umas das outras, além 
de apresentar escopo bem reduzido, simplificando a análise. 
B 
 É interativo e constituído pelas etapas de extração, ingestão, transformação, limpeza, análise 
de dados e visualização de dados. 
C 
 É considerado iterativo de baixa complexidade se comparado à análise de dados tradicional, 
com etapas bem definidas e dependentes entre si. 
D 
 É interativa e constituída de etapas similares à análise tradicional, com a diferença de que 
pode manipular grandes conjuntos de dados em nuvem.

Continue navegando