Buscar

Intro_Program_BigData_N2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

Introdução à Programação em Big Data – N2
Questão 1
Tal como na matemática existem diferentes conjuntos (naturais, reais, inteiros etc.), no R a representação e o armazenamento desses valores fica a cargo dos tipos de dados. Desse modo, o R fornece suporte a uma determinada quantidade de tipos de dados para representação e armazenamento de valores.
 
Assinale a alternativa correta que apresenta quantos tipos de dados diferentes o R oferece suporte: 
Resp:
6
Questão 2
Na empresa fictícia EAD Corp S/A o analista de dados está realizando uma operação de concatenar dois vetores atômicos: x e y. O vetor x possui como valores  x <- c (1,3,5) e o vetor y possui como valores y <- c(2,4,6). O analista de dados sabe que o comando a ser utilizado para concatenar os vetores é o cbind(). O que será produzido pela expressão cbind (x, y)?
 
Assinale a alternativa que corresponde à opção correta: 
Resp:
Um dataframe com 3 linhas e 2 colunas
Questão 3
O estagiário da empresa fictícia EAD Corp S/A realizou uma análise dos dados da frequência de reclamações dos clientes nos projetos e encontrou informações relevantes. Ele apresentou um gráfico ao seu coordenador, que, após analisar e aprovar o gráfico e os dados, pediu que o alterasse para que pudesse apresentar na reunião de diretores.
Sendo assim, assinale a alternativa que indica uma justificativa para que o coordenador tenha feito essa solicitação. 
Resp:
Porque o gráfico estava em um formato errado, distorcendo a análise das informações.
Questão 4
Para buscar ajuda sobre funcionalidades e comandos no R, é possível consultar a vasta documentação disponível em listas de discussão, livros (muitas vezes gratuitos) e nos fóruns especializados na linguagem. Entretanto, o IDE RStudio fornece uma maneira de consultar a ajuda no R sobre um determinado comando. Assinale a alternativa que se refere a este comando: 
Resp: 
Help(“comando”) e ? comando
Questão 5
Analise o trecho a seguir:
 
Como medida de ___________ entre variáveis, os testes de ____________ são usados ​​em dados ____________ (ou seja, dados que são colocados em classes: por exemplo, sexo [masculino, feminino] e tipo de trabalho [não qualificado, semi-qualificado, qualificado]) para determinar se eles estão associados.
 
Assinale a alternativa que preenche corretamente as lacunas: 
Resp:
Associação, qui-quadrado, nominais
Questão 6
Com o passar do tempo, o Big Data deixou de apenas ser um repositório de informações diversas e “gerador de insights”. Essa evolução veio a partir da ciência de dados que, juntamente com o Big Data, mostrou-se uma área promissora na busca de novas soluções para problemas por meio da identificação de relacionamentos em dados. O alto volume de dados, vindo de diferentes fontes e formatos, propicia que o Big Data forneça os insumos para que a ciência de dados encontre as respostas para os problemas buscados. De acordo com o texto, assinale a afirmativa correta: 
Resp:
O uso de ciência de dados é um caminho natural de mercado partindo do Big Data.
Questão 7
A estrutura de dados conhecida como matriz possui a característica de armazenar as informações em um formato de linhas e colunas. Ao executar o comando: m <- matrix(1:6, nrow=2, ncol=3), será criada uma matriz com valores variando de 1 a 6, com 2 linhas e 3 colunas.
 
Ao exibir o conteúdo da variável m, assinale a alternativa com o resultado que seria apresentado: 
Resp:
[1] [2] [3]
[1] 1 3 5 
[2] 2 4 6
Questão 8
Analise o trecho a seguir:
 
“Um Cientista de Dados pode:
●     Utilizar de Machine Learning para otimizar a pesquisa de dados
●     Otimizar estratégias para alcançar os objetivos de negócio
●     Análise preditiva para prever futuros lucros ou prejuízos no negócio
●     Detectar fraudes ou anomalias na operação do negócio
●     Compreender a razão de variações extremas na análise de dados
●     Através da estatística, prever os próximos cliques de um usuário em um site de compras [...]”.
 
MATOS, D. Cientista de dados x engenheiro de dados. Ciência e Dados, ago. [2019]. Disponível em: http://www.cienciaedados.com/cientista-de-dados-x-engenheiro-de-dados/. Acesso em: 18 jan. 2020.
 
“Um Engenheiro de Dados pode:
●     Construir aplicações de larga escala SaaS (Software as a Service)
●     Construir e customizar aplicações Hadoop e MapReduce
●     Definir e construir bancos de dados relacionais com arquitetura distribuída para processamento de Big Data
●     Extrair, transformar e carregar (ETL) dados de um banco de dados para outro [...]”.
 
MATOS, D. Cientista de dados x engenheiro de dados. Ciência e Dados, ago. [2019]. Disponível em: http://www.cienciaedados.com/cientista-de-dados-x-engenheiro-de-dados/. Acesso em: 18 jan. 2020.
 
A respeito das atribuições do cientista e do engenheiro de dados, assinale a alternativa correta: 
Resp:
As atividades do engenheiro de dados e do cientista de dados são complementares.
Questão 9
O estagiário da empresa fictícia EAD Corp S/A possui dados sobre o consumo de gasolina dos veículos da empresa durante o ano. Ele deseja buscar no R os 20% maiores consumos da relação. Supondo que esses valores estejam armazenados em uma variável chamada “consumo”.
 
Assinale a alternativa que apresenta qual seria o comando utilizado por ele para mostrar somente os dados que equivalem a pelo menos 80% do maior consumo: 
Resp:
consumo[consumo >= 
max(consumo)*0.8]
Questão 10
Uma fábrica produz 150 dispositivos eletrônicos por dia. Os dispositivos eletrônicos com defeito devem ser reformulados. Sabe-se que existe uma taxa de erro de 5%. O primeiro passo é estimar quantos dispositivos eletrônicos precisam ser corrigidos todos os dias de uma semana. Nesse sentido, assinale a alternativa que indique qual o comando em R que deve ser utilizado para fazer essa simulação: 
Resp:
rbinom(7,150,.05)

Continue navegando