Buscar

Data Discovery, Olap e visualização de dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Data Discovery, Olap e visualização de dados
Professor(a): Washington Henrique Carvalho Almeida (Mestrado acadêmico)
1)
2)
3)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação
Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até
cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode
responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo
estabelecido. Boa prova!
Para uma utilização apropriada de ferramentas de visualização, precisamos conhecer as
características dos dados manipulados. Considerando este contexto, avalie as asserções a
seguir.
A ferramenta de visualização apropriada para a apresentação de um resultado significativo
depende de se conhecer dois importantes fatores: a dimensão e o domínio dos dados tratados,
PORQUE 
a escolha da visualização adequada não depende da dimensão dos dados, nem, do domínio
dos mesmos.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira asserção está incorreta e a segunda está correta.
A primeira asserção está correta e a segunda está incorreta.  CORRETO
A duas asserções estão corretas e a segunda justifica a primeira.
As duas asserções estão incorretas.
As duas asserções estão corretas, mas a segunda não justifica a primeira.
Código da questão: 43764
Considerando o conceito de data discovery, avalie as afirmativas a seguir e classifique com
(V) se verdadeira e (F) se falsa.
( ) Um dos objetivos do data discovery é descobrir relações desconhecidas entre os dados. 
( ) O uso de planilhas de dados é considerado como forma tradicional de data discovery. 
( ) O produto Watson da IBM que realiza data discovery é conhecido como Watson. 
( ) Com visualizações avançadas os analistas podem identificar mais facilmente clusters.
( ) Visualização avançada de dados pode ser realizada por processos iterativos.
Assinale a alternativa que contenha a sequência correta.
Alternativas:
V – V – V – V – V.  CORRETO
F – V – V – V – F.
F – F – F – V – F.
V – V – F – V – F.
F – V – F – V – F.
Código da questão: 43788
U d hb d é d f d i li ã d d d b ili d i
Resolução comentada:
Para fazer uso de uma ferramenta de visualização de dados apropriada é necessário ter
conhecimento da dimensão e do domínio em que os dados foram produzidos.
Resolução comentada:
Um dos objetivos do data discovery é descobrir relações desconhecidas entre os dados.
O uso de planilhas de dados é considerado como forma tradicional de data discovery. O
super computador da IBM que realiza data discovery é conhecido como Watson. Com
visualizações avançadas os analistas podem identificar mais facilmente clusters e
visualização avançada de dados pode ser realizada por processos interativos.
3)
4)
5)
Um dashboard é uma das ferramentas de visualização de dados bastante utilizadas no meio
corporativo e de prestação de serviços. Para ser bem elaborado, precisa seguir algumas regras.
Sobre as características de um dashboard, avalie as afirmativas a seguir e assinale (V) se
verdadeira e (F) se falsa.
( ) Existem três tipos de dashboards: executivos, gerencias e operacionais.
( ) Um dashboard operacional contém informações que interessam a todos os indivíduos
envolvidos em um processo.
( ) Quanto mais cores contiver um dashboard, melhor será porque assim ele atrai mais a
atenção do seu público-alvo.
( ) A ênfase de um dashboard operacional é o de gerenciamento das atividades de um processo
de trabalho.
( ) O uso das cores para a elaboração de um dashboard deve ser aleatório e não proposital. 
Assinale a alternativa que contenha a sequência CORRETA:
Alternativas:
V – V – F – V – F.
F – V – F – F – F.  CORRETO
F – V – V – V – F.
F – F – F – F – F.
V – V – V – V – V.
Código da questão: 43773
Falar em data discovery é falar de conceitos e posturas diante do grande volume de
informações disponíveis para a extração de informações relevantes. Muitos especialistas
afirmam que um dos conceitos associados ao data discovery é a fundação das organizações.
Que conceito é este?
Assinale a alternativa CORRETA.
Alternativas:
Data visualization.
Business intelligence.  CORRETO
Data mining.
Data Science.
Business analytics.
Código da questão: 43785
Sobre a linguagem de programação R, a qual também é utilizada para produção de
visualização de dados, analise a afirmativa a seguir para completar suas lacunas corretamente.
A linguagem de programação R, conforme definem Oliveira, Guerra e McDonnell (2018, p. 10),
pode ser entendida como “um conjunto de ____________ e ferramentas ____________, munido de
funções que facilitam sua utilização, desde a criação de simples ____________ até análises de
dados complexas”.
Referência: OLIVEIRA P F ; GUERRA S ; McDONNELL R Ciência de dados com R: introdução
Resolução comentada:
A depender do público que se deseja atingir, pode-se dizer que existem três tipos de
dashboards: estratégicos, táticos e operacionais. Um dashboard operacional contém
informações que interessam a todos os indivíduos envolvidos em um processo e tem
ênfase em monitorar atividades de um processo de trabalho. Um dashboard com
excesso de cores pode atrapalhar a comunicação das informações que o compõem e o
uso de cores para a elaboração de um dashboard deve ser proposital, ou seja, deve ser
escolhida com interesses claros.
Resolução comentada:
Especialistas afirmam que o business intelligence é a fundação das organizações quando
compara com o data discovery. O conceito de business intelligence (BI) é o processo de
abordagem tradicional para suporte na tomada das melhores decisões baseadas em
dados.
6)
7)
Referência: OLIVEIRA, P.F.; GUERRA, S.; McDONNELL, R. Ciência de dados com R: introdução.
Brasília: IBPAD, 2018.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
pacotes; estatísticas; rotinas.  CORRETO
funções; matemáticas; rotinas.
funções; estatísticas; gráficos.
pacotes; matemáticas; gráficos.
expressões; algébricas; gráficos.
Código da questão: 43776
Taurion (2013) faz uma analogia entre Big Data e a medicina. O autor afirma que Big Data é
um determinado aparelho laboratorial que permite enxergar coisas que não se podia até então.
Qual o nome deste aparelho?
TAURION, Cezar. BIG DATA. Rio de Janeiro: Brasport, 2013. EPUB. Não paginado.
Assinale a alternativa CORRETA.
Alternativas:
Lupa.
Estetoscópio.
Binóculo.
Computador.
Microscópio.  CORRETO
Código da questão: 43765
A atividade de data Discovery é atribuída ao profissional capaz de extrair informações
significativas da exploração de dados. Considerando esta afirmação, avalie as asserções a seguir
e a relação entre elas.
I. O economista chefe da Google afirmou em 2016 que a profissão de estatístico seria a
profissão mais sexy do mundo nos dez anos subsequentes.
PORQUE
II. Davenport e Patil (2012) afirmaram algo mais amplo, disseram em um artigo publicado que
a profissão de cientista de dados seria o trabalho mais sexy do século 21.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira asserção está incorreta e a segunda está correta.
A primeira e a segunda asserção estão corretas e a segunda não justifica a primeira. 
CORRETO
A primeira e a segunda asserção estão corretas e a segunda justifica a primeira.
A primeira e a segunda asserção estão incorretas.
A primeira asserção está correta e a segunda asserção está incorreta.
Resolução comentada:
A linguagem de programação R, conforme definem Oliveira, Guerra e McDonnell (2018,
p. 10), pode ser entendida como “um conjunto de pacotes e ferramentas estatísticas,
munido de funções que facilitam sua utilização, desde a criação de simples rotinas até
análises de dados complexas”.
Resolução comentada:
Uma analogia feita por Taurion (2013) com respeito a Big Data e medicina é feita
quando o autor afirma que Big Data é um microscópio, o qual permitiu que se vissem
coisasque já existiam, como bactérias e vírus, mas que não se tinha conhecimento.
8)
9)
10)
Código da questão: 43789
O aplicativo Weka foi criado para trabalhar com inteligência artificial e mineração de dados.
Sobre ele, avalie as asserções a seguir e a relação existente entre elas.
I. O Weka tem umas especificidades em relação a outras bibliotecas próprias para elaboração
de visualização de dados para Web. 
PORQUE
II. O Weka tem algoritmos de classificação e regressão para realizar mineração de dados.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira asserção é falsa e a segunda é verdadeira.  CORRETO
As duas asserções são verdadeiras e a segunda não justifica a primeira.)
As duas asserções são falsas.
As duas asserções são verdadeiras e a segunda justifica a primeira.
A primeira asserção é verdadeira e a segunda é falsa.
Código da questão: 51585
Em se tratando do conceito OLAP, além da possibilidade de visualização multidimensional e
da exploração de dados, existem outras atividades associadas. Com respeito a isto, avalie a
afirmativa a seguir para completar suas lacunas apropriadamente.
Dentre as atividades que envolvem o conceito OLAP está o ____________ de dados, que também
é conhecido como ____________ ou como ____________ de dados digitais.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
Armazenamento; data warehouse; visualização.
Armazenamento; OLAP; depósito.
Tratamento; análise de dados; depósito.
Tratamento; análise de dados; visualização.
Armazenamento; data warehouse; depósito.  CORRETO
Código da questão: 43781
O avanço tecnológico das ferramentas de análise e produção visual de resultados é cada
vez mais rápido e dinâmico. Essa corrida por melhores equipamentos e melhores profissionais
traz uma série de benefícios, tanto para o meio acadêmico quanto o meio empresarial e
industrial. A partir deste contexto, considere as afirmativas a seguir.
I. A visualização de dados tem a intenção de facilitar a transmissão de um resultado encontrado
com o tratamento aplicado a um conjunto de dados. 
II U b i li ã d d d é l t it l t h d i ifi ti
Resolução comentada:
O economista chefe da Google afirmou que a profissão de estatístico seria a profissão
mais sexy do mundo nos dez anos seguintes, e Davenport e Patil afirmaram algo mais
amplo em 2012, afirmaram que a profissão de cientista de dados seria a profissão mais
sexy do século 21.
Resolução comentada:
A 1ª afirmativa está incorreta, porque o WEKA não produz dados para web, não gera
código fonte para web.
Resolução comentada:
A etapa do armazenamento de dados está mais vinculada a um outro conceito
conhecido como data warehouse, que em uma tradução literal significa depósito de
dados digitais.
II. Uma boa visualização de dados é aquela que transmite claramente um achado significativo.
III. Um gráfico bastante utilizado para apresentado de dados é conhecido como diagrama de
dispersão. Ele é apropriado para apresentar associação entre medidas quantitativas. 
IV. Uma das ferramentas de Business Intelligence são os dashboards, bastante utilizados para
visualização de dados.
V. O uso da ferramenta correta de visualização de dados depende do tipo de dado que está
sendo manipulado.
Estão CORRETAS as afirmações:
Alternativas:
III, IV e V.
I e II.
III e IV.
I, II e III.
I, II, III, IV e V.  CORRETO
Código da questão: 43763
Resolução comentada:
A principal motivação do uso de uma ferramenta de visualização de dados é a clareza
em que os resultados encontrados são transmitidos. Os dashboards são ferramentas de
Business Intelligence bastante utilizados para apresentar resultados visuais. Um
diagrama de dispersão é apropriado para apresentar visualmente como duas
informações quantitativas estão associadas.
Arquivos e Links

Continue navegando