Baixe o app para aproveitar ainda mais
Prévia do material em texto
03/12/2022 16:39 Colaborar - Aap2 - Análise Exploratória de Dados - Eda https://www.colaboraread.com.br/aluno/avaliacao/index/3079480703?atividadeDisciplinaId=13716062 1/2 Portal Digital do Aluno (/index/index) Início (/) Superior de Tecnologia em Ciência de Dados… Análise Exploratória de Dados - Eda (/aluno/… Aap2 - Análise Exploratória de Dados - Eda Aap2 - Análise Exploratória de Dados - Eda Sua avaliação foi confirmada com sucesso (/notificacao/index) 2 Meus Cursos (/index/index) Serviços Online Apoio ao Estudo Oportunidades Ajuda Area do Usuário Sair × Informações Adicionais Período: 03/10/2022 00:00 à 03/12/2022 23:59 Situação: Cadastrado Tentativas: 1 / 3 Protocolo: 821144441 Avaliar Material a) b) c) d) e) 1) a) b) c) d) e) 2) Durante a etapa de preparação de dados em um projeto de ciência de dados devem ser executadas atividades de busca por diversos tipos de inconsistências, tais como inconsistências de preenchimento e de formato, utilizando para isso funções em linguagens de programação como R e Python. Considerando a execução destas atividades na linguagem R, assinale a alternativa que traz funções que podem ser utilizadas para avaliar as inconsistências de preenchimento e formato, respectivamente. Alternativas: data.frame() e list(). plot() e hist(). library() e levels(). levels() e str(). Alternativa assinalada str() e data.frame(). Marcos é estudante de estatística e tem o hábito de registrar todas as notas obtidas ao longo da disciplina. Até agora, Marcos teve as seguintes notas: 89, 93, 93, 96 e 98. Por não ter estudado o suficiente, Marcos obteve nota 25 no último teste, que é um outlier dentro do conjunto das notas anteriores. Para quantificar o efeito da inclusão desta nota na sua média, Marcos construiu o seguinte código em linguagem R: dados1<-c(89,93,93,96,98) media1<-mean(dados1) media1 dados2<-c(89,93,93,96,98,25) media2<-mean(dados2) media2 media2-media1 Após executar o código, assinale a alternativa que aponta corretamente o resultado da inclusão desta nota na média geral de Marcos. Alternativas: Haverá redução da média em mais de 10 pontos. Alternativa assinalada A inclusão da nota não causará uma redução da média do conjunto de dados. Haverá redução da média em mais de 20 pontos. Haverá aumento da média em 5.5 pontos. A inclusão da média diminuirá a média em mais de 50 %. https://www.colaboraread.com.br/index/index https://www.colaboraread.com.br/ https://www.colaboraread.com.br/aluno/dashboard/index/3079480703 https://www.colaboraread.com.br/aluno/timeline/index/3079480703?ofertaDisciplinaId=1844068 https://www.colaboraread.com.br/notificacao/index https://www.colaboraread.com.br/index/index javascript:void(0); 03/12/2022 16:39 Colaborar - Aap2 - Análise Exploratória de Dados - Eda https://www.colaboraread.com.br/aluno/avaliacao/index/3079480703?atividadeDisciplinaId=13716062 2/2 a) b) c) d) e) 3) a) b) c) d) e) 4) O enriquecimento de dados utilizando fontes externas é uma alternativa muito valiosa para empresas que necessitam de dados para determinadas aplicações, mas que não podem arcar com custos de novos processos de coleta de dados. Neste processo, a principal atividade executada para enriquecer as bases de dados é a aplicação de funções de cruzamentos de dados em linguagens de programação como R e Python. Assinale a alternativa que aponta exemplos de funções da linguagem R que executam o cruzamento de dados: Alternativas: mean, var e sd. data.frame, list e matrix. left_join, right_join, full_join e inner_join. Alternativa assinalada boxplot e hist. ggplot e qplot. Diversos softwares de análise de dados como R e Python utilizam uma série de caracteres especiais como parte de sua linguagem, sendo utilizados como operadores para a realização de atividades associadas aos dados. Dessa forma, estes caracteres, assim como espaços entre palavras, devem ser evitados na nomenclatura de nomes de variáveis em conjuntos de dados a serem analisados. Neste contexto, considere a tabela abaixo que traz um conjunto de 5 observações de automóveis. Assinale a alternativa que traz o código em R que cria esta tabela utilizando nomes de colunas válidos na linguagem. Alternativas: data.frame(modelo%automovel=c(“A”, “B”, “C”, “D”, “E”), valor&automovel=c(50000, 42000, 39000, 45000, 85000)) data.frame(modelo-automovel=c(“A”, “B”, “C”, “D”, “E”), valor-automovel=c(50000, 42000, 39000, 45000, 85000)) data.frame(modelo_automovel=c(“A”, “B”, “C”, “D”, “E”), valor_automovel=c(50000, 42000, 39000, 45000, 85000)) Alternativa assinalada data.frame(modelo*automovel=c(“A”, “B”, “C”, “D”, “E”), valor&automovel=c(50000, 42000, 39000, 45000, 85000)) data.frame(modelo=automovel=c(“A”, “B”, “C”, “D”, “E”), valorautomovel=c(50000, 42000, 39000, 45000, 85000))
Compartilhar