Buscar

Avaliação I - Individual Analises Exploratoria de dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Prova Impressa
GABARITO | Avaliação I - Individual (Cod.:822555)
Peso da Avaliação 1,50
Prova 63520966
Qtd. de Questões 10
Acertos/Erros 8/1
Canceladas 1
Nota 9,00
Percebe-se que as pessoas estão cada vez mais dependentes da tecnologia para executar suas 
atividades diárias, tanto profissionais, domésticas e de lazer. Para isso, as pessoas utilizam 
computadores, dispositivos móveis, armazenam os dados na nuvem, utilizam cartão de crédito, 
acessam redes sociais etc. Um conceito que representa esse cenário é o termo Big Data. O Big Data 
pode ser conceituado por volume, variedade e velocidade, formando os 3Vs. Essa definição é mais 
abrangente e quebra o mito de que o Big Data se refere apenas ao tamanho dos dados do 
armazenamento. Além disso, cada um dos 3Vs tem suas próprias ramificações para análises. 
Referente a cada um dos 3Vs, assinale a alternativa CORRETA:
A O V da Velocidade é referente a se exigir velocidade de processamento em tempo real. 
B O V do Volume é referente a se ter diferentes tipos de dados, sendo eles estruturados ou não
estruturados. 
C O V do Volume é porque são considerados apenas os dados estruturados que existem em grande
quantidade. 
D O V da Variedade é oriundo do fato de se ter um grande volume de dados. 
A preparação de dados é necessária devido à presença de dados não formatados do mundo real. Sobre 
a composição desses dados do mundo real, analise as sentenças a seguir:
I- Dados imprecisos (dados ausentes).
II- A presença de dados ruidosos (dados errôneos e outliers).
 VOLTAR
A+ Alterar modo de visualização
1
2
III- Dados inconsistentes.
IV- Dados estruturados.
Assinale a alternativa CORRETA:
A As sentenças II e IV estão corretas.
B As sentenças III e IV estão corretas.
C As sentenças I, II e III estão corretas.
D As sentenças I, II e IV estão corretas.
Podemos destacar diversos exemplos de dados semiestruturados e não estruturados. Considerando 
esses exemplos, analise as opções a seguir:
I- Arquivos .mp3.
II- Arquivos textos, padrão .txt.
III- Arquivos de vídeos.
IV- Banco de dados.
Assinale a alternativa CORRETA:
A As opções I, III e IV estão corretas.
B As opções I, II e IV estão corretas.
C As opções I, II e III estão corretas.
3
D As opções III e IV estão corretas.
Um gerente deseja conhecer o perfil dos clientes e dos possíveis clientes para criar campanhas de 
marketing direcionado. Os objetivos são aumentar a carteira de clientes da empresa e fidelizar os 
clientes existentes. Esse gerente não sabe como resolver o problema, porém, ele sabe que a área de TI 
da empresa pode o auxiliar. Digamos que o profissional de TI consiga identificar os dados 
relacionados com o problema que se referente aos dados estruturados, semiestruturados e não 
estruturados, bem como dados de redes sociais e de bases externas. Com base nos diferentes tipos de 
dados identificados e suas fontes, analise as sentenças a seguir:
I- Somente as bases internas dizem respeito aos tipos de dados que são identificados no mapeamento 
do problema.
II- Na identificação do problema, podemos nos deparar com dados estruturados, dados 
semiestruturados, dados não estruturados e também dados oriundos de redes sociais e de bases 
externas.
III- Nesta identificação, os dados estruturados são oriundos de bancos de dados relacionais da 
organização.
IV- Os dados não estruturados e semiestruturados podem ser provenientes das mais diversas fontes, 
como de arquivos de texto, imagem, áudio, vídeo, planilhas, além de pesquisas realizadas de 
mercado. 
Assinale a alternativa CORRETA:
A As sentenças I e IV estão corretas.
B As sentenças II, III e IV estão corretas.
C As sentenças I e II estão corretas.
D Somente a sentença III está correta.
4
Às vezes, o que pensamos ser um problema não é o problema real. Portanto, para chegar ao problema 
real, é necessário investigar. A análise de causa raiz é um método eficaz de análise: ajuda a identificar 
o que, como e por que algo aconteceu. Segundo Etmann (2018), chegar a um problema claramente 
definido é uma ação orientada a descobertas. Comece com uma definição conceitual e, por meio da 
análise (causa, análise de impacto etc.), você forma e redefine o problema em termos de questões. Um 
problema se torna conhecido quando uma pessoa observa uma discrepância entre a maneira como as 
coisas são e como deveriam ser. 
FONTE: ETMANN, Al. Big Data: The analytics life cycle. 2018. Disponível 
em: https://www.linkedin.com/pulse/big-datathe-analytics-life-cycle-alaa-etman/. Acesso em: 27 maio 
2022. 
Sobre como podem ser identificados os problemas segundo Etmann (2018), assinale a 
alternativa INCORRETA:
A Estudos comparativos e benchmarking. 
B Relatório de desempenho para avaliar o desempenho atual em relação às metas e objetivos. 
C Relatórios de desempenho visando futuras projeções da empresa, portanto, não precisa estar se
pensando na identificação dos problemas. 
D
Análise Strengths, Weaknesses, Opportunities e Threats (SWOT), que consiste em uma
ferramenta para avaliar os pontos fortes, que são as Forças e Oportunidades, e os pontos fracos,
que são Fraquezas e Ameaças (FOFA). 
Atenção: Esta questão foi cancelada, porém a pontuação foi considerada.
A linguagem Python é uma linguagem de código aberto, possuindo compatibilidade multiplataforma e 
sintaxe simples. Além disso, a linguagem Python é uma linguagem orientada a objetos, de alto nível, e 
interpretada de script, servindo para diferentes fins, como de computação gráfica e estatística. Tanto 
as funcionalidades da linguagem Python quanto as funcionalidades da linguagem R são adicionadas 
por meio de bibliotecas (package). 
Referente aos comandos utilizados nas bibliotecas ggplot2 e pandas, assinale a 
alternativa INCORRETA:
A O comando pip install pandas instala a biblioteca pandas. 
5
6
B O comando import pandas as pd somente importa a biblioteca pandas. 
C O comando install.packages(“ggplot2) instala a biblioteca ggplot2.
D O comando library(ggplot2) importa a biblioteca ggplot2. 
Existe uma ampla variedade de ferramentas de preparação de dados disponíveis, utilizadas para 
descobrir, processar, mesclar, refinar, enriquecer e transformar dados, possibilitando uma melhor 
integração, uso e análise de conjuntos de dados, além de linguagens utilizadas no processo. Embora o 
Python seja uma ferramenta popular entre os cientistas de dados, existe todo um ecossistema de 
ferramentas de ciências de dados. Para que você esteja preparado para o mercado de trabalho, é 
importante conhecer as principais ferramentas referentes ao ecossistema da preparação de dados. Com 
relação às ferramentas ALTERYX, DATAROBOT e LUMEN DATA, classifique V para as sentenças 
verdadeiras e F para as falsas: 
( ) Os principais recursos da ferramenta Lumen Data são experiência em gerenciamento de dados 
corporativos, governança e qualidade dos dados, integrações construídas e especialização em nuvem. 
( ) A ferramenta Alteryx pode ser utilizada no desenvolvimento e nos testes de centenas de soluções 
que combinam preparação de dados em nível especializado com algoritmos de Machine Learning de 
R, Python, Spark, H20, TensorFlow etc. 
( ) A ferramenta DataRobot é uma plataforma de gerenciamento de informações que adota uma 
abordagem em fases por meio de sua metodologia específica para Master Data Management (MDM). 
( ) A ferramenta Alteryx é utilizada para descobrir, preparar os dados, realizar a análise e permitir 
compartilhar analytics e implantação. 
Assinale a alternativa que apresenta a sequência CORRETA:
A V - F - V - F. 
B V - V - F - V. 
Revisar Conteúdo do Livro
7
C V - F - V - V. 
D V - F - F - V. 
A linguagem R é uma linguagem para manipulação de dados e análises estatísticas, de código aberto 
“[...] para computação estatística e construção de gráficos que pode ser baixada e distribuída 
gratuitamente, de acordo com a licença GNU. O R está disponível para as plataformas UNIX, 
Windows e MacOS” (LANDEIRO, 2011, sp). Com relaçãoà Linguagem R, classifique V para as 
sentenças verdadeiras e F para as falsas: 
( ) A linguagem R possibilita que sejam gerados gráficos, mas estes não podem ser exportados para 
relatórios. 
( ) A Linguagem R possui um amplo conjunto de bibliotecas para análise e visualização de dados. 
( ) A linguagem R também é um conjunto de facilitadores para manipulação de dados. 
( ) A linguagem R possui bibliotecas de manipulação e armazenamento de dados (arquivos de texto, 
bancos de dados etc.). 
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: LANDEIRO, Victor Lemes. Introdução ao uso do programa R. Manaus: Instituto Nacional 
de Pesquisas da Amazônia, 2011. 
A F - F - V - V. 
B V - F - F - V. 
C F - V - V - V. 
Revisar Conteúdo do Livro
8
D F - V - V - F. 
Segundo Bi4all (2021, s.p.), "sabia que em 2020, a cada minuto, foram publicadas 347 mil novas 
Stories no Instagram, 147 mil fotos no Facebook e 41 milhões de mensagens foram trocadas no 
WhatsApp?". Cabe destacar "que mais de 4,5 biliões de pessoas usam internet, enquanto os 
utilizadores das redes sociais ultrapassaram já os 3,8 biliões com quase 60% da população mundial 
on-line. Estes números ilustram bem a quantidade de dados que circulam no mundo, o que oferece 
imensas oportunidades e desafios às empresas que transformam estes dados em valor para o negócio" 
(BI4ALL, 2021, s.p.). Com base no volume de dados que não significa qualidade de dados, 
classifique V para as sentenças verdadeiras e F para as sentenças falsas.
( ) A preparação de dados é essencial para todo e qualquer projeto que envolver a análise 
exploratória de dados.
( ) A qualidade do insumo interfere diretamente na qualidade do produto.
( ) Quanto maior a quantidade de dados melhor será o produto final.
( ) A qualidade do produto final está diretamente relacionada a se ter o maior número possível de 
informação. 
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: BI4ALL. 2021: A Soberania dos dados. 2021. Disponível em: 
https://www.bi4all.pt/noticias/blog/2021-a-soberania-dos-dados/. Acesso em: 25 maio 2021.
 
A V - F - V - V.
B V - V - F - F.
C F - V - V - V.
9
D F - V - V - F.
Segundo Bi4all (2021, s.p.), "sabia que em 2020, a cada minuto, foram publicadas 347 mil novas 
Stories no Instagram, 147 mil fotos no Facebook e 41 milhões de mensagens foram trocadas no 
WhatsApp?". Cabe destacar "que mais de 4,5 biliões de pessoas usam internet, enquanto os 
utilizadores das redes sociais ultrapassaram já os 3,8 biliões com quase 60% da população mundial 
on-line. Estes números ilustram bem a quantidade de dados que circulam no mundo, o que oferece 
imensas oportunidades e desafios às empresas que transformam estes dados em valor para o negócio" 
(BI4ALL, 2021, s.p.). 
Com base no volume de dados que não significa qualidade de dados, assinale a alternativa 
CORRETA:
FONTE: BI4ALL. 2021: A Soberania dos dados. 2021. Disponível em: 
https://www.bi4all.pt/noticias/blog/2021-a-soberania-dos-dados/. Acesso em: 25 maio 2021.
A Quanto maior a quantidade de dados, melhor será o produto final.
B A qualidade do insumo não interfere na qualidade do produto.
C A qualidade do produto final está diretamente relacionada a se ter o maior número possível de
informação.
D A preparação de dados é essencial para todo e qualquer projeto que envolver a análise
exploratória de dados.
10
Imprimir

Continue navegando