Buscar

Atividade 2 (A2) - INTRODUÇÃO A PROGRAMAÇÃO EM BIG DATA (ANHEMBI MORUMBI UAM) CURTA SE LHE AJUDOU! D

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Atividade 2 - INTRODUÇÃO A PROGRAMAÇÃO EM BIG DATA
1. Complete corretamente os espaços:
 
Uma ___________ é um pedaço de código escrito para executar uma tarefa específica; pode ou não aceitar argumentos ou parâmetros, assim como pode ou não retornar um ou mais valores.
No R, conforme o tipo de dado da variável, existem _________ específicas para manipular aquele valor. Elas podem se dividir em _______ e de  _________.
 
Assinale a alternativa que apresenta a sequência que melhor preenche as lacunas 
· chamada - chamadas - numéricas - texto.
· função - funções - numéricas - texto.
· rotina - rotinas - textuais - valor.
· macro - macros -  textuais - dados.
· operação - operações - numéricas - dados.
Resposta correta. A alternativa está correta, pois, segundo a regra, quando é escrito um trecho de código específico para executar uma tarefa, é dado o nome de função ou subrotina. Dessa forma, as funções em R podem tratar todos os tipos de dados aos quais o R tem suporte, como textos e números em geral.
2. Uma etapa básica porém essencial da programação é a atribuição de valores às variáveis. Sem isso, não é possível armazenar valores à memória para poder acessá-los posteriormente e utilizar nos cálculos, funções etc. No R existe uma sintaxe específica para realizar tal ação.
 
Assinale a alternativa correta que indica a atribuição de valores em R.
· a(10).
· a == 10.
· 10 -> a.
· a -> 10.
· a = 10.
Resposta correta. A alternativa está correta, pois nas linguagens de programação em geral, a atribuição de valores possui uma sintaxe em que o valor que encontra-se à direita será atribuído à variável que encontra-se à esquerda. No caso do R em específico, essa sintaxe funciona da mesma forma, e existem 2 operadores que podem ser utilizados para realizar a operação: <- e =.
3. Lidar com sequências de caracteres é uma parte importante da análise de texto, e dividir uma sequência de caracteres geralmente é uma das tarefas comuns executadas nesse processo, seja criando tokens, localizando textos etc. Suponha a existência de dois vetores A e B, conforme abaixo. Ao executar os comandos abaixo, qual será sua saída?
 
A <- paste(“alfa”,”beta”,”gama”,sep=” “)
B <- paste(“phi”,”teta”,”zeta”,sep=””)
partes <- strsplit(c(A,B),split=” ”)
partes[1]
 
Assinale a alternativa correta:
· phitetazeta.
· “alfa”, “beta”, “gama”.
· alfa.
· “alfa”, “beta”.
· phi.
Resposta correta. A alternativa está correta, pois o comando c(A.B) concatenaria A = "alfa beta gama" e B = "phetetazeta" separados por um espaço em branco. Ao usar strsplit, as duas sequências serão separadas no espaço em branco entre A e B em duas listas. Ao acessar, o elemento partes[1] nos diz para imprimir o elemento contido na primeira posição, que é a variável A separada em lista.
4. Analise o excerto a seguir:
A função ___________ substitui todas as correspondências de uma sequência, se o parâmetro for um vetor de sequência, retorna um vetor de sequência com o mesmo comprimento e com os mesmos atributos (após possível substituição com o caractere).
 
Complete as lacunas e assinale a opção correta:
· toupper().
· strsplit().
· gsub().
· find().
· c()
Resposta correta. A alternativa está correta, pois a busca e substituição de valores armazenados em vetores no R é possível por meio do comando gsub(). Na sua sintaxe, é necessário informar o padrão buscado nos textos, qual é o texto que substituirá o padrão encontrado e qual é a variável que contém os dados a serem pesquisados.
5. O estagiário da empresa fictícia EAD Corp S/A tem a tarefa de analisar as despesas com energia elétrica para a empresa. Em sua mesa, ele possui as 12 últimas contas de energia do escritório da empresa, e deve carregar seus valores para o R em uma estrutura que suporte esses dados.
 
Assinale a alternativa correta que indica qual função ele deverá usar:
· matrix().
· array().
· plot().
· c().
· data.frame().
Resposta correta. A alternativa está correta, pois no enunciado é informado que o estagiário possui em sua mesa as últimas 12 contas de energia. Com isso, podemos presumir que esses dados não constam em nenhum dataset, e por isso deverão ser importados para o R manualmente. Como os tipos de dados são iguais e de uma única dimensão, a estrutura indicada seria um vetor atômico.
6. O estagiário da empresa fictícia EAD Corp S/A necessita catalogar 10 produtos diferentes (1001, 1002, …, 1010) no R em um data frame. Ao conversar com o cientista de dados, ele recebeu a indicação de criar uma sequência para agilizar o trabalho, ao invés de inseri-los manualmente.
 
Assinale a alternativa que corresponde à única maneira que utiliza a criação manual de valores no data frame
· df <- data.frame(Codigo = c(1, 2, 3, 4 ,5, 6,7,8,9, 10), Produto=c(1001, 1002, 1003, 1004, 1005, 1006, 1007, 1008, 1009, 1010))
· df <- data.frame(Codigo = 1:10, Produto=c(1001:1010)).
· df <- data.frame(Codigo = c(1:10), Produto=c(1001:1010)).
· df <- data.frame(Codigo = c(1:10), Produto=c(1001:1010)).
· df <- data.frame(Codigo = 1:10, Produto=1001:1010).
 
Resposta correta. A alternativa está correta, pois, ao criar um data frame, a regra a ser seguida é informar o nome da coluna que receberá os valores e os valores a serem acrescentados. Segundo o enunciado, a ideia do cientista de dados é evitar que os dados sejam inseridos um a um no dataframe. Sendo assim, a alternativa escolhida não possui nenhuma forma de automatizar a criação de sequências.
7. Como em qualquer linguagem de programação, o R fornece suporte a diferentes tipos de dados. Cada variável de um tipo de dado diferente armazenará em seu conteúdo um valor com características diferentes. Os tipos de dados suportados no R são: integer, numeric, logical, complex, caracter e raw.
Sobre o tipo de dado numeric, assinale a alternativa correta:
· Suporta qualquer tipo de número.
· Suporta somente números reais.
· Suporta somente números complexos.
· Suporta somente números inteiros.
· Suporta somente números lógicos.
Resposta correta. A alternativa está correta, pois os tipos de dados em R definem qual o formato de dado que uma variável em R armazenará em memória. Na Matemática, existem diferentes tipos de conjuntos de números (como inteiros, reais, naturais etc.), tal comportamento é replicado no R, fazendo com que cada tipo de dado armazene um tipo de valor.
8. O estagiário da empresa fictícia EAD Corp S/A está realizando um trabalho de catalogação de informações. Para isso, ele está processando um vetor atômico de caracteres, porém, ao executar os comandos (conforme o exemplo abaixo), o R retorna uma mensagem de erro.
 
nomes <- (“Alberto”, “Jonas”, “Rodrigo”, “José”)
resultado <- paste(nomes, sep=” ”)
resultado
 
Assinale a alternativa correta, que corresponde ao que poderia estar acontecendo:
· O comando paste() não recebe atributos.
· O atributo sep não deve conter espaço em branco.
· Os textos devem ser informados dentro de apóstrofos (‘) ao invés de aspas.
· A sintaxe do comando para criar o vetor atômico está errada.
· O vetor atômico de nomes deve conter mais nomes dentro dele.
 
Resposta correta. A alternativa está correta, pois para a criação de um vetor atômico, independentemente do tipo de dados, a função a ser utilizada é c(). Como a função paste() necessita de um vetor atômico para concatená-lo, quando a variável nomes der erro pela falta da função c(), a função paste() informará que a variável nomes não foi encontrada, explicitando o erro.
9. O estagiário da empresa fictícia EAD Corp S/A possui dados sobre o consumo de gasolina dos veículos da empresa durante o ano. Ele deseja buscar no R os 20% maiores consumos da relação. Supondo que esses valores estejam armazenados em uma variável chamada “consumo”.
 
Assinale a alternativa que apresenta qual seria o comando utilizado por ele para mostrar somente os dados que equivalem a pelo menos 80% do maior consumo:
· min(consumo)*0.2.
· max(consumo) > 0.8.
· consumo[consumo >= max(consumo)*0.8].
· consumo[consumo >= max(consumo)*0.2].
· consumo[consumo > 8].
Resposta correta. A alternativaestá correta, pois a pesquisa dentro de vetores possui uma sintaxe que necessita que seja informada uma condição, sendo que os valores retornados serão aqueles que satisfazem essa condição. Desse modo, ao solicitar os 20% maiores, é necessário criar uma condição para identificar os 20% maiores (ou os que forem maior que 80% do maior valor).
10. O estagiário da empresa fictícia EAD Corp S/A está implementando em R uma solução para armazenar dados inteiros em um vetor. Para efeito de testes, ele criou um vetor v contendo os valores 1, 2, 3, 4 e exibiu seu conteúdo, obtendo 1.0, 2.0, 3.0 e 4.0 como resultados. Por desejar somente números inteiros, o resultado mostrou que algo não está certo, pois não deveriam ser exibidos os “.0”. Assinale a alternativa correta em relação ao motivo pelo qual esse resultado está acontecendo:
· É necessário consultar o valor do piso de v pelo comando floor(v).
· É necessário consultar o valor absoluto de v pelo comando abs(v).
· No momento da criação do vetor, faltou adicionar a letra “L” ao final de cada número.
· É necessário consultar o valor do teto de v pelo comando ceiling(v).
· Não está nada errado, pois os números exibidos são inteiros.
Resposta correta. A alternativa está correta, pois o R não necessita que o tipo de variável seja informado no momento de criação. Nesse caso, o aparecimento dos caracteres .0 no final de cada número indica que o vetor foi criado como um numeric e não um integer — que seria o tipo indicado, fazendo com que seja necessário adicionar a letra “L” em cada item do vetor no momento de sua criação.

Continue navegando