Prévia do material em texto
Portal Digital do Aluno (/index/index) Início (/) Superior de Tecnologia em Ciência de Dados… Análise Exploratória de Dados - Eda (/aluno/… Adg2 - Análise Exploratória de Dados - Eda Adg2 - Análise Exploratória de Dados - Eda Sua avaliação foi confirmada com sucesso (/notificacao/index) 2 Meus Cursos (/index/index) Serviços Online Apoio ao Estudo Oportunidades Ajuda Area do Usuário Sair × Informações Adicionais Período: 26/09/2022 00:00 à 03/12/2022 23:59 Situação: Cadastrado Tentativas: 2 / 3 Protocolo: 821199942 Avaliar Material a) b) c) d) e) 1) a) b) c) d) e) 2) 3) A documentação de decisões relacionadas a correção e padronização de dados é uma etapa extremamente importante, com benefícios em curto, médio e longo prazo para as equipes de ciência de dados. Neste contexto, analise as os resultados de atividades de ciência de dados abaixo: I. Inconsistências encontradas e quais correções aplicadas. II. Correspondência de abreviações de colunas e categorias. III. Definições de diretrizes para dados futuros. IV. Dicionário de dados relativo à cada base de dados trabalhada. V. Resultados de análises estatísticas aplicada ao conjunto de dados. Assinale a alternativa que apresenta informações registradas nesta etapa da análise exploratória de dados. Alternativas: I e II, somente. I, II, III, IV e IV. I, II, III e IV. Alternativa assinalada II. III e IV. A identificação de outliers e quantificação de dados faltantes é uma atividade essencial dentro de projetos de ciências de dados, considerando o impacto que sua ocorrência pode ser na utilização dos dados em aplicações e análises. Assim, é importante que estas atividades sejam executadas quando a análise é realizada em softwares estatísticos que usem linguagens como R ou Python. Neste contexto, assinale a alternativa que corresponde a duas funções da linguagem R que podem ser utilizadas para apontas outliers e dados faltantes. Alternativas: data.frame() e levels(). boxplot() e summary(). Alternativa assinalada as.factor() e str(). summary() e str(). slice_max() e levels(). No processo de enriquecimento de dados por dados externos, a tabela local é combinada com dados externos, dos quais informações serão extraídas de forma a complementar os dados já existentes. Considere a figura abaixo que traz um exemplo de cruzamento entre duas bases de dados A e B. https://www.colaboraread.com.br/index/index https://www.colaboraread.com.br/ https://www.colaboraread.com.br/aluno/dashboard/index/3079480703 https://www.colaboraread.com.br/aluno/timeline/index/3079480703?ofertaDisciplinaId=1844068 https://www.colaboraread.com.br/notificacao/index https://www.colaboraread.com.br/index/index javascript:void(0); a) b) c) d) e) a) b) c) d) e) 4) Assinale a alternativa que aponta o código da linguagem R que faz o cruzamento que permite a obtenção da tabela resultante apresentada. Alternativas: left_join(A ,B, by="cod") rigth_join(B, A, by="valor") Alternativa assinalada right_join(A, B, by="cod") full_join(A, B, by="cod") inner_join(A, B, by="cod") A existência de dados faltantes é comum nas bases dados das empresas e organizações, afetando diversos aspectos da execução de projetos de ciência de dados. Nesta situação, as equipes de ciência devem tomar decisões sobre como lidar com os dados faltantes. Analise as afirmações abaixo que trazem formas de lidar com dados faltantes. I. Substituir os dados faltantes pela média dos demais registros, em caso de variáveis quantitativas. II. Substituir os dados faltantes pela categoria de maior frequência, em caso de variáveis qualitativas. III. Substituir os dados faltantes por zero, independentemente da variável ser quantitativa ou qualitativa. IV. Manter os registros com informação faltante vazios. Assinale a alternativa que aponta afirmativas com opções adequadas de lidar com dados faltantes. Alternativas: I e II. I, II e IV. Alternativa assinalada II e IV. IV. I, II, III e IV.