Buscar

Fundamentos de Big Data

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Prova Impressa
GABARITO | Avaliação da Disciplina (Cod.:645440)
Peso da Avaliação 10,00
Prova 33160300
Qtd. de Questões 20
Nota 7,50
O cientista de dados deve conhecer de tecnologia, de matemática, ter curiosidade e criatividade. Um 
cientista curioso é aquele que não se conforma com qualquer coisa, qualquer informação. Agora, 
conseguir um profissional com conhecimentos técnicos, quantitativos, curioso e 
colaborativo/comunicativo é bem difícil. Ao mesmo tempo, este cientista de dados deve saber atuar 
como um líder, juntamente com profissionais especializados no que fazem.
 
Quais profissionais são aliados ao cientista de dados complementando uma equipe Analytics? Marque 
a alternativa correta. 
A Data Engineer; Advogado; DBA; Programador; Estatístico; Analista de Negócios; Designer. 
B Data Engineer; Equipe Testes; DBA; Administrador; Estatístico; Analista de Negócios;
Contador. 
C Data Engineer; Equipe de Manutenção; Gerente de Projetos; Suporte Técnico; Matemático;
Analista de Negócios; Designer.
D Data Engineer; Equipe de Extração; DBA; Programador; Estatístico; Analista de Negócios;
Designer.
O objetivo das técnicas de Aprendizagem de Máquina ou Machine Learning é aprender um modelo 
(hipótese), usando o conjunto de treinamento para relacionar atributos da entrada a valores do atributo 
de saída.
 
Para isso, alguns paradigmas de treinamento são utilizados.
 
Marque a alternativa que apresenta os principais paradigmas de treinamento: 
 VOLTAR
A+ Alterar modo de visualização
1
2
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 1/13
A Aprendizagem Supervisionada; Reforço; Aprendizagem Não Supervisionada,
Semissupervisionado.
B Naive Bayes; K-Nearest Neighbor; Semissupervisionado; Supervisionada; Reforço. 
C Regressão Linear; Aprendizagem Não Supervisionada, Semissupervisionado; Reforço.
D Supervised Learning; Machine Learning; Unsupervisid Learning; Aprendizagem de
Codificação.
Uma forma de analisar dados com o objetivo de automatizar o desenvolvimento de modelos 
analíticos, de maneira que o aprendizado é realizado a partir de algoritmos que aprendem de maneira 
interativa, ou seja, com base na análise em tempo real dos dados, os computadores proporcionam 
informações importantes para apoiar áreas de negócios.
 
O enunciado acima trata de que conceito? Marque a alternativa correta. 
A Big Data. 
B Machine Data.
C Data Analytics. 
D Machine Learning. 
 A integração de bases de dados diferentes pode apresentar ruídos, informações ambíguas, conflitantes 
ou mesmo errôneas. Portanto, a qualidade do processo de análise dos dados dependerá da qualidade 
dos dados armazenados nas bases.
 
Neste contexto, quais das alternativas abaixo apresentam características importantes para se garantir a 
qualidade dos dados?
Marque a opção correta: 
3
4
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 2/13
A Integridade; Eficiência; Eficácia; Precisão; Consistência; Flexibilidade.
B Integridade; Granularidade; Tempestividade; Precisão; Consistência; Flexibilidade. 
C Integridade; Granularidade; Confiabilidade; Funcionabilidade; Consistência; Flexibilidade.
D Integridade; Portabilidade; Tempestividade; Precisão; Usabilidade; Flexibilidade. 
 Ainda há desafios em inserir novas tecnologias com a IoT e Big Data para trazer melhorias na 
operação dos negócios, como a segurança e confiança dos dados dos clientes/usuários. 
 
 Os principais desafios podem ser apontados como:
I. A privacidade do consumidor poderá ser comprometida com o grande volume de dados 
trafegando com informações sobre o usuário desses dispositivos.
 
II. A gestão de armazenamento se preocupa cada vez mais com a capacidade de armazenamento das 
empresas, se esta será suficiente para coletar e utilizar dados da IoT de forma eficaz em relação ao 
custo.
 
III. A tecnologia dos servidores será focada em um crescente investimento em áreas essenciais e 
organizações relacionadas a IoT visando rendimento ou valores significativos.
 
IV. Redes de data centers serão modificadas para permitir alto volume de dados de sensores de 
mensagens pequenas para processo em data center, afetando assim a largura de banda de entrada, que 
deverá aumentar no data center.
 
Quanto às alternativas I, II, III e IV, marque a opção correta:
A Apenas as alternativas III e IV estão corretas.
B Apenas as alternativas I e II estão corretas.
5
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 3/13
C Todas as alternativas estão corretas.
D Alternativas I, II e III estão erradas.
A aprendizagem de máquina permite acelerar o processo de análise em Big Data, por exemplo, é 
possível identificar um padrão de um consumidor que comprou um determinado produto e, através 
deste padrão, prever o comportamento de compra do consumidor para comprar futuramente outros 
produtos.
 
São exemplos de aplicações de Aprendizagem de Máquina:
 
( ) Recomendação de filmes, séries e vídeos;
 
( ) Tradução automática;
 
( ) Carros autônomos;
 
( ) Detecção de fraudes.
 
Classifique as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa 
que apresenta a sequência correta:
A F; F; V; V. 
B V; F; V; F.
C V; F; F; V. 
D V; V; V; V. 
6
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 4/13
 Um Big Data deve possuir pelo menos três aspectos, os chamados 3Vs do Big Data.
 
Marque a alternativa que apresenta os 3Vs: 
A Variedade; Vencimento; Valor.
B Volume; Variedade; Velocidade. 
C Volume; Validade; Variedade. 
D Variedade; Validez; Volume. 
O objetivo principal do modelo preditivo é ir além de saber o que aconteceu, ao fornecer uma melhor 
estimativa do que poderá acontecer no futuro. Usando dados, algoritmos e métodos oriundos da 
estatística, aprendizado de máquinas e mineração de dados para se determinar as chances de 
resultados futuros, ou desconhecidos, com base em dados passados.
 
O modelo preditivo apresenta três aspectos importantes e que precisam ser compreendidos.
 
Qual das alternativas apresenta os aspectos corretos? 
A Coletar Dados; Gerir Dados; Prever Dados. 
B Ensinar o Modelo; Fazer Análises; Gera Relatórios. 
C Coletar Dados; Treinar o Modelo; Fazer Predições. 
D Fazer predições; Fazer Análise; Avaliar Custos.
7
8
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 5/13
 Aprovado pelo plenário do Senado Federal, o PLC 53/2018 dispõe sobre a proteção de dados 
pessoais e altera a Lei 12.965/16 do Marco Civil da Internet, sendo consolidada como a Lei Geral de 
Proteção de Dados Brasileira (LGPD). 
 
 Recentemente, Josefa Christina fez uma compra on-line em um site e-commerce, no qual forneceu 
seus principais dados pessoais, como: nome, CPF, e-mail, telefone, endereço. Logo em seguida, 
passou a receber diversas ofertas de outros sites parceiros do e-commerce no qual ela havia realizado 
a compra, mas em momento algum concordou em compartilhar os seus dados. Diante deste cenário e 
de acordo com a Lei Geral de Proteção de Dados Brasileiros, qual direito não foi atendido pelo site 
em que Josefa realizou suas compras on-line? Marque a opção correta:
A Direito à Privacidade.
B Segurança Jurídica.
C Direito do Consumidor.
D Regras para empresas.
 “As Coisas”, que englobam desde sensores (temperatura, umidade, luminosidade, etc.), os objetos do 
nosso dia a dia (geladeiras, TVs, carros, etc.) estarão conectados entre si em rede, de modo inteligente 
e passarão a “sentir” o mundo ao redor e a interagir.” (ASHTON, K., 1999). 
O trecho acima trata de que tecnologia? Marque a opção correta: 
A Internet das Coisas. 
B Machine Learning.
C Big Data. 
D Data Science.
9
10
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 6/13
 Nas palavras de Eric Siegel, em seu livro Predictive Analytics: “Os dados que coletamos atualmente 
nos permitem ver coisas que até pouco tempo atrás eram grandes demais para enxergarmos.” 
 
 Quando estamos falando de BigData, em uma das suas etapas tratamos a capacidade de análise dos 
dados. Há quatro tipos de análises em Big Data, uma delas é a Análise Preditiva. Assinale qual das 
opções abaixo descreve corretamente este tipo de análise.
 
A
 Utilizada para perceber performances passadas e atuais de negócios, para tomada de decisões,
categorizando, caracterizando, consolidando e classificando os dados em informação útil.
Utilizam-se métricas e técnicas de estatística para gerar gráficos e relatórios sobre orçamentos,
vendas, receitas, processamento analítico on-line (OLAP), painéis/scorecards e visualização de
dados. Através desta análise, uma organização pode avaliar dados sobre a queda das vendas de
um produto ou faturamento da empresa nas últimas semanas ou meses, por exemplo.
B
 Utiliza a otimização de forma a identificar as melhores alternativas e maximizar ou minimizar
algum objetivo. Utilizam-se ferramentas estatísticas tanto de análise descritiva quanto a preditiva
alinhada à gestão de negócios, para gerar recomendações automáticas buscando aperfeiçoar
estratégias. Basicamente é uma forma de definir qual a escolha será mais efetiva em determinada
situação.
C
 Avalia performances passadas, detectando padrões e relações entre os dados futuros. O objetivo
é “prever” o futuro, por meio de mineração de dados, dados estatísticos e históricos. Para este
modelo também são utilizadas técnicas como Machine Learning e Inteligência Artificial. Um
exemplo seria a previsão do faturamento para o próximo trimestre ou a quantidade de chamadas
que poderão ocorrer em uma central de call center para próxima campanha publicitária. 
D
 Se preocupa exclusivamente com os dados passados, é utilizada com interesse em saber o
motivo por que determinados eventos aconteceram, na tentativa de minimizar eventuais
problemas presentes. Corresponde a um tipo mais avançado de análise, em que são utilizadas
técnicas como mineração, correlações, detalhamento e descoberta de dados em busca da
descoberta das causas do problema.
 Compreendemos que as soluções tecnológicas que trabalham com Big Data permitem analisar um 
volume enorme de dados de forma rápida e ainda oferece um melhor controle para os gestores das 
informações. 
 
 As alternativas abaixo representam aplicações de Big Data:
11
12
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 7/13
 ( ) Reduzir más contratações, analisar rapidamente todos os dados dos candidatos, inclusive se suas 
ideologias e metas estão de acordo com os princípios da empresa, maximizando a probabilidade de 
contratar o funcionário ideal.
 ( ) Serviços oferecidos por Fast Foods, como Burger King e McDonald’s estão se tornando 
otimizados, as unidades estão sendo monitoradas e mudando os recursos de menu, conforme o perfil 
do cliente.
 ( ) Prever performance, predizer se determinado colaborador será capaz de se destacar perante os 
demais do setor, se possui ideias inovadoras para o negócio ou talento para outras atividades na 
empresa, necessita de uma análise minuciosa e constante.
 ( ) Gerar recomendações, utilizar o histórico de compras e buscas do cliente pelo navegador para 
gerar uma lista de produtos que também possam ser de interesse.
 
Classifique as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa 
que apresenta a sequência correta:
A V; F; V; V 
B V; V; V; V.
C F; V; F; F. 
D F; F; F; V.
 Diversos são os dispositivos IoT, que juntamente com Big Data visam o tempo todo tornar nosso 
ambiente em todo o nosso entorno mais inteligente, no sentido de mais sensoriamentos. 
 Neste contexto, dispositivos IoT apresentam três classes, a saber:
A- Objetos puramente passivos com identificação de dados fixos, sendo identificados na Physical 
Internface Zone. 
B- Objetos dotados de moderado poder computacional e percepção de contexto, por meio de 
sensores que podem gerar mensagens e variar a informação associada a eles.
C- Objetos que possuem conectividade em rede, sem a intervenção humana, possibilitando a 
emergência da inteligência nos sistemas de rede.
 
Portanto, marque a alternativa correta:
A As opções A e B estão corretas.
13
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 8/13
B Somente a opção B está correta.
C As opções A, B e C estão corretas. 
D Apenas a opção A está correta.
 Cada vez mais organizações buscam formas sistemáticas para identificar, gerenciar e integrar dados 
que se encontram disponíveis em diversos meios. O que se torna um grande desafio diante de uma 
quantidade incalculável de dados.
 
 Neste contexto, pode-se afirmar que as organizações precisam buscar que tipo de apoio para captar, 
organizar, analisar e gerenciar dados dos seus consumidores e suas operações, trazendo de fato 
impactos decisivos para o mercado e a concorrência?
 
 Marque a alternativa correta:
 
A Profissionais, como equipes de analytics de forma integrada.
B Analista de Negócios e Administradores.
C Administrador de Banco de Dados e Desenvolvedores.
D Analista de Sistemas e Testers.
 O vasto uso de dispositivos móveis, de redes sociais e da web, em que vários dados são 
disponibilizados constantemente, gerou uma considerável elevação da quantidade de dados 
armazenados e trafegados no mundo. Há também uma crescente abundância de dados originados por 
organizações. Essa exponenciação de dados tornou-se um dos principais desafios para a Ciência da 
Computação (MCAFEE; BRYNJOLFSSON, 2012). 
 
 Mas o que são dados? Responda selecionando a alternativa correta:
14
15
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 9/13
 
A É a informação refinada por meio da análise, informação interpretada e aplicada a um fim.
B Conjunto de dados analisados é derivado de uma coleção de dados processados em que o
contexto e o significado foram adicionados aos fatos.
C São compostos por fatos coletados, estatísticas ou entradas aleatórias que detêm pouco valor.
D São compostos de informações coletadas, informações estatísticas, analisadas e processadas.
 Tem aviões mandando informações de por onde estão voando e quais as condições climáticas, 
permitindo voos muito mais seguros e quase independentes dos pilotos. Até o seu carro pode 
transmitir quais são as condições da estrada em que você está dirigindo e acompanhar os dados do 
GPS de motoristas que ajudam a predizer os horários e locais que estarão mais congestionados, em 
parte é isso que você faz quando usa aplicativos para cortar caminhos.
 
 Quando estamos falando de Big Data, estamos tratando a capacidade de análise dos dados. Há 
quatro tipos de análises em Big Data, uma delas é a Análise Prescritiva. Assinale qual das opções 
abaixo descreve corretamente este tipo de análise.
A
 Se preocupa com os dados passados, é utilizada com interesse em saber o motivo por que
determinados eventos aconteceram na análise descritiva, na tentativa de minimizar eventuais
problemas presentes. Corresponde a um tipo mais avançado de análise, em que são utilizadas
técnicas como mineração, correlações, detalhamento e descoberta de dados em busca da
descoberta das causas do problema.
B
 Utiliza a otimização de forma a identificar as melhores alternativas e maximizar ou minimizar
algum objetivo. Utilizam-se ferramentas estatísticas tanto de análise descritiva quanto a preditiva
alinhada à gestão de negócios, para gerar recomendações automáticas buscando aperfeiçoar
estratégias. Basicamente é uma forma de definir qual a escolha será mais efetiva em determinada
situação.
C
 Utilizada para perceber performances passadas e atuais de negócios, para tomada de decisões,
categorizando, caracterizando, consolidando e classificando os dados em informação útil.
Utilizam-se métricas e técnicas de estatística para gerar gráficos e relatórios sobre orçamentos,
vendas, receitas, processamento analítico on-line (OLAP), painéis/scorecards e visualização de
dados. Através desta análise, uma organização pode avaliardados sobre a queda das vendas de um
produto ou faturamento da empresa nas últimas semanas ou meses, por exemplo.
16
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 10/13
D
 Avalia performances passadas, detectando padrões e relações entre os dados futuros. O objetivo
é “prever” o futuro, por meio de mineração de dados, dados estatísticos e históricos. Para este
modelo também são utilizadas técnicas como Machine Learning e Inteligência Artificial. Um
exemplo seria a previsão do faturamento para o próximo trimestre ou a quantidade de chamadas
que poderão ocorrer em uma central de call center para próxima campanha publicitária.
 O processo para obtenção dos dados possui diversas etapas, desde a coleta do dado até o seu descarte. 
Visando auxiliar estas necessidades para captar e gerar dados e atribuir valor junto à tomada de 
decisões, há um processo genérico no qual é estruturado o ciclo de vida dos dados.
Quais etapas compõem esse processo genérico? Marque a alternativa correta.
 
A Produção, Processamento, Transformação, Teste, Descarte.
B Desenvolvimento, Armazenamento, Transformação, Transição, Descarte. 
C Desenvolvimento, Processamento, Construção, Análise, Descarte.
D Produção, Armazenamento, Transformação, Análise, Descarte.
 Nem sempre obter dados significa obter mais conhecimentos ou informações que acrescentem valor 
de negócio à tomada de decisões. Sendo preciso ir além de saber quais dados existem na sua empresa 
e quais ferramentas estão ou precisarão ser utilizadas, mas ainda avaliar a capacidade dos dados, 
identificando oportunidades para atender às necessidades de negócio e de fato gerar valor.
 
 Para isso, algumas questões devem ser respondidas, como:
 
I- Quais dados sua empresa realmente precisa?
II- Quais dados existem em sua empresa?
III- Como é realizada a gestão dos dados da sua empresa?
 
 O que quer dizer cada item:
17
18
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 11/13
 
P- Compreenda como seu negócio identifica prioridades para os dados melhorarem a tomada de 
decisões da empresa, podendo impulsionar os seus negócios.
Q - É preciso definir, esclarecer e treinar sobre as políticas, os processos, sobre a gestão e a segurança 
dos dados confiados à sua empresa.
R- Verifique quais dados dos seus consumidores proporcionam maiores engajamentos em sua 
empresa.
 
 Relacione os números I, II e III às letras P, Q e R e marque a opção com a relação correta:
A I – P; II – Q; III – R.
B I – Q; II – R; III – P.
C I – P; II – R; III – Q.
D I – R; II – P; III – Q.
 O armazenamento de dados, ou retenção de informações usando uma determinada tecnologia para 
guardar e manter dados acessíveis quando necessário, exige a atenção de alguns aspectos. 
 
 Que aspectos devem ser considerados para o armazenamento de dados? Marque a opção que 
apresenta corretamente os mesmos.
A Portabilidade, Alta Disponibilidade; Flexibilidade. 
B Facilidade, Escalabilidade, Flexibilidade.
C Escalabilidade; Alta Disponibilidade; Flexibilidade.
D Usabilidade, Flexibilidade, Segurança.
19
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 12/13
Uma outra ferramenta importante para o Universo Big Data é o HBase, um grande Banco de Dados 
distribuídos, que permite acessar grande volume de dados de maneira rápida.
 
Ainda sobre o HBase, podemos afirmar:
 
( ) Tolerante a falhas;
 
( ) Realiza pesquisas somente em dados arquivados offline;
 
( ) Faz exportações de métricas através de plug-ins de arquivo e ganglia;
 
( ) Modelo de dados acomoda ampla gama de casos de uso.
 
Classifique as sentenças acima como (V) verdadeiro ou (F) falso. Em seguida, marque a alternativa 
que apresenta a sequência correta: 
A V; F; V; V.
B F; F; V; F.
C V; V; V; V. 
D F; V; V; F.
20
Imprimir
30/04/2024, 09:31 Avaliação da Disciplina
about:blank 13/13

Continue navegando