Prévia do material em texto
Curso GRA0806 INTRODUÇÃO A PROGRAMAÇÃO EM BIG DATA GR1708-212-9 - 202120.ead-17582.01 Teste ATIVIDADE 2 (A2) Status Completada • Pergunta 1 1 em 1 pontos Analise o excerto a seguir: A função ___________ substitui todas as correspondências de uma sequência, se o parâmetro for um vetor de sequência, retorna um vetor de sequência com o mesmo comprimento e com os mesmos atributos (após possível substituição com o caractere). Complete as lacunas e assinale a opção correta: Resposta Selecionada: gsub(). Resposta Correta: gsub(). Comentário da resposta: Resposta correta. A alternativa está correta, pois a busca e substituição de valores armazenados em vetores no R é possível por meio do comando gsub(). Na sua sintaxe, é necessário informar o padrão buscado nos textos, qual é o texto que substituirá o padrão encontrado e qual é a variável que contém os dados a serem pesquisados. • Pergunta 2 1 em 1 pontos Como em qualquer linguagem de programação, o R fornece suporte a diferentes tipos de dados. Cada variável de um tipo de dado diferente armazenará em seu conteúdo um valor com características diferentes. Os tipos de dados suportados no R são: integer, numeric, logical, complex, caracter e raw. Sobre o tipo de dado numeric, assinale a alternativa correta: Resposta Selecionada: Suporta somente números reais. Resposta Correta: Suporta somente números reais. Comentário da resposta: Resposta correta. A alternativa está correta, pois os tipos de dados em R definem qual o formato de dado que uma variável em R armazenará em memória. Na Matemática, existem diferentes tipos de conjuntos de números (como inteiros, reais, naturais etc.), tal comportamento é replicado no R, fazendo com que cada tipo de dado armazene um tipo de valor. • Pergunta 3 1 em 1 pontos Complete corretamente os espaços: Uma ___________ é um pedaço de código escrito para executar uma tarefa específica; pode ou não aceitar argumentos ou parâmetros, assim como pode ou não retornar um ou mais valores. No R, conforme o tipo de dado da variável, existem _________ específicas para manipular aquele valor. Elas podem se dividir em _______ e de _________. Assinale a alternativa que apresenta a sequência que melhor preenche as lacunas Resposta Selecionada: função - funções - numéricas - texto. Resposta Correta: função - funções - numéricas - texto. Comentário da resposta: Resposta correta. A alternativa está correta, pois, segundo a regra, quando é escrito um trecho de código específico para executar uma tarefa, é dado o nome de função ou subrotina. Dessa forma, as funções em R podem tratar todos os tipos de dados aos quais o R tem suporte, como textos e números em geral. • Pergunta 4 0 em 1 pontos Na empresa fictícia EAD Corp S/A o analista de dados criou um vetor contendo cinco elementos, v<- c(10, 20, 30, 40, 50). Agora ele necessita acessar pelo R o segundo elemento desse vetor de números. Uma vez que o vetor de números já está carregado na memória, qual é o comando que deve ser digitado? Assinale a alternativa que corresponde à opção correta: Resposta Selecionada: v[2]. Resposta Correta: v(2). Comentário da resposta: Sua resposta está incorreta. A alternativa está incorreta, pois a linguagem R define uma sintaxe para o acesso a dados em estruturas como o vetor atômico. Nessa sintaxe, deve-se informar dentro de colchetes a posição na qual deseja buscar o valor, imediatamente após informar o nome da variável que contém os dados que deseja buscar. • Pergunta 5 1 em 1 pontos No ambiente da empresa fictícia EAD Corp S/A existe um sistema Big Data que coleta informações de várias fontes de dados diferentes e as disponibiliza para as análises dos cientistas de dados. Um desses dados refere-se a informações sobre o histórico clínico de pessoas atendidas em um hospital, com registros sobre pressão arterial, idade, temperatura na hora do atendimento etc. Assinale a alternativa correta com a estrutura de dados em R que melhor se adéqua a carregar todos esses tipos de dados no R: Resposta Selecionada: Data Frame. Resposta Correta: Data Frame. Comentário da resposta: Resposta correta. A alternativa está correta, pois, uma vez que existem diferentes tipos de dados na informação (como idade — integer e temperatura — numeric), é necessário acomodá-los em um tipo de dado que comporte os dois formatos na mesma estrutura simultaneamente. Além disso, o formato dessa informação sugere uma estrutura com duas dimensões de informação (linhas e colunas). Assim, essa estrutura de dado é a mais indicada para armazenar as informações. • Pergunta 6 1 em 1 pontos O estagiário da empresa fictícia EAD Corp S/A tem a tarefa de analisar as despesas com energia elétrica para a empresa. Em sua mesa, ele possui as 12 últimas contas de energia do escritório da empresa, e deve carregar seus valores para o R em uma estrutura que suporte esses dados. Assinale a alternativa correta que indica qual função ele deverá usar: Resposta Selecionada: c(). Resposta Correta: c(). Comentário da resposta: Resposta correta. A alternativa está correta, pois no enunciado é informado que o estagiário possui em sua mesa as últimas 12 contas de energia. Com isso, podemos presumir que esses dados não constam em nenhum dataset, e por isso deverão ser importados para o R manualmente. Como os tipos de dados são iguais e de uma única dimensão, a estrutura indicada seria um vetor atômico. • Pergunta 7 1 em 1 pontos O estagiário da empresa fictícia EAD Corp S/A está realizando um trabalho de catalogação de informações. Para isso, ele está processando um vetor atômico de caracteres, porém, ao executar os comandos (conforme o exemplo abaixo), o R retorna uma mensagem de erro. nomes <- (“Alberto”, “Jonas”, “Rodrigo”, “José”) resultado <- paste(nomes, sep=” ”) resultado Assinale a alternativa correta, que corresponde ao que poderia estar acontecendo: Resposta Selecionada: A sintaxe do comando para criar o vetor atômico está errada. Resposta Correta: A sintaxe do comando para criar o vetor atômico está errada. Comentário da resposta: Resposta correta. A alternativa está correta, pois para a criação de um vetor atômico, independentemente do tipo de dados, a função a ser utilizada é c(). Como a função paste() necessita de um vetor atômico para concatená-lo, quando a variável nomes der erro pela falta da função c(), a função paste() informará que a variável nomes não foi encontrada, explicitando o erro. • Pergunta 8 1 em 1 pontos A estrutura de dados conhecida como matriz possui a característica de armazenar as informações em um formato de linhas e colunas. Ao executar o comando: m <- matrix(1:6, nrow=2, ncol=3), será criada uma matriz com valores variando de 1 a 6, com 2 linhas e 3 colunas. Ao exibir o conteúdo da variável m, assinale a alternativa com o resultado que seria apresentado: Resposta Selecionada: [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 Resposta Correta: [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 Comentário da resposta: Resposta correta. A alternativa está correta, pois, segundo a padronização de índices no R, todo vetor ou matriz deve começar seus índices a partir do valor 1, diferentemente de várias linguagens de programação que iniciam em 0. O preenchimento dos valores na matriz seguirá uma ordem de colunas, ou seja, primeiramente a coluna 1 será preenchida, seguida pela coluna 2, e assim por diante. • Pergunta 9 1 em 1 pontos Dentre as estruturas de dadosexistentes no R, as matrizes e os data frames se caracterizam por armazenarem informações em duas dimensões (linhas e colunas). Entretanto, do ponto de vista estrutural, existe diferença entre ambas, fazendo com que os dados armazenados no data frame possam ser armazenados na matriz sob uma única condição. Assinale a alternativa que corresponde a qual seria essa condição: Resposta Selecionada: É necessário que as colunas do data frame sejam do mesmo tipo de dado. Resposta Correta: É necessário que as colunas do data frame sejam do mesmo tipo de dado. Comentário da resposta: Resposta correta. A alternativa está correta; conforme o enunciado, matrizes e data frames são estruturas que armazenam dados em duas dimensões. Porém, a diferença entre as estruturas é que a matriz possui todas as colunas com o mesmo tipo de dado, enquanto o data frame permite diferentes tipos de dados entre as colunas. Assim, para que a matriz armazene os dados de um data frame, é necessário que esse data frame tenha todas as colunas com o mesmo tipo de dado. • Pergunta 10 1 em 1 pontos Lidar com sequências de caracteres é uma parte importante da análise de texto, e dividir uma sequência de caracteres geralmente é uma das tarefas comuns executadas nesse processo, seja criando tokens, localizando textos etc. Suponha a existência de dois vetores A e B, conforme abaixo. Ao executar os comandos abaixo, qual será sua saída? A <- paste(“alfa”,”beta”,”gama”,sep=” “) B <- paste(“phi”,”teta”,”zeta”,sep=””) partes <- strsplit(c(A,B),split=” ”) partes[1] Assinale a alternativa correta: Resposta Selecionada: “alfa”, “beta”, “gama”. Resposta Correta: “alfa”, “beta”, “gama”. Comentário da resposta: Resposta correta. A alternativa está correta, pois o comando c(A.B) concatenaria A = "alfa beta gama" e B = "phetetazeta" separados por um espaço em branco. Ao usar strsplit, as duas sequências serão separadas no espaço em branco entre A e B em duas listas. Ao acessar, o elemento partes[1] nos diz para imprimir o elemento contido na primeira posição, que é a variável A separada em lista.