Buscar

Adg2 - Análise Exploratória de Dados - Eda

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

Portal Digital
do Aluno
(/index/index)
Início (/)   Superior de Tecnologia em Ciência de Dados…   Análise Exploratória de Dados - Eda (/aluno/…   Adg2 - Análise Exploratória de Dados - Eda
Adg2 - Análise Exploratória de Dados - Eda
Sua avaliação foi confirmada com sucesso

(/notificacao/index)
2
Meus Cursos (/index/index) Serviços Online Apoio ao Estudo Oportunidades Ajuda  Area do Usuário  Sair
×
Informações Adicionais
Período: 26/09/2022 00:00 à 03/12/2022 23:59
Situação: Cadastrado
Tentativas: 2 / 3
Protocolo: 821199942
Avaliar Material
a)
b)
c)
d)
e)
1)
a)
b)
c)
d)
e)
2)
3)
A documentação de decisões relacionadas a correção e padronização de dados é uma etapa extremamente importante, com benefícios em curto, médio e
longo prazo para as equipes de ciência de dados.
Neste contexto, analise as os resultados de atividades de ciência de dados abaixo:
I. Inconsistências encontradas e quais correções aplicadas.
II. Correspondência de abreviações de colunas e categorias.
III. Definições de diretrizes para dados futuros.
IV. Dicionário de dados relativo à cada base de dados trabalhada.
V. Resultados de análises estatísticas aplicada ao conjunto de dados.
Assinale a alternativa que apresenta informações registradas nesta etapa da análise exploratória de dados.
Alternativas:
I e II, somente.
I, II, III, IV e IV.
I, II, III e IV.  Alternativa assinalada
II.
III e IV.
A identificação de outliers e quantificação de dados faltantes é uma atividade essencial dentro de projetos de ciências de dados, considerando o impacto
que sua ocorrência pode ser na utilização dos dados em aplicações e análises. Assim, é importante que estas atividades sejam executadas quando a análise é
realizada em softwares estatísticos que usem linguagens como R ou Python.
Neste contexto, assinale a alternativa que corresponde a duas funções da linguagem R que podem ser utilizadas para apontas outliers e dados faltantes.
Alternativas:
 data.frame() e levels().
 boxplot() e summary().  Alternativa assinalada
 as.factor() e str().
 summary() e str().
 slice_max() e levels().
No processo de enriquecimento de dados por dados externos, a tabela local é combinada com dados externos, dos quais informações serão extraídas de
forma a complementar os dados já existentes. Considere a figura abaixo que traz um exemplo de cruzamento entre duas bases de dados A e B.
 
https://www.colaboraread.com.br/index/index
https://www.colaboraread.com.br/
https://www.colaboraread.com.br/aluno/dashboard/index/3079480703
https://www.colaboraread.com.br/aluno/timeline/index/3079480703?ofertaDisciplinaId=1844068
https://www.colaboraread.com.br/notificacao/index
https://www.colaboraread.com.br/index/index
javascript:void(0);
a)
b)
c)
d)
e)
a)
b)
c)
d)
e)
4)
Assinale a alternativa que aponta o código da linguagem R que faz o cruzamento que permite a obtenção da tabela resultante apresentada.
Alternativas:
left_join(A ,B, by="cod")
rigth_join(B, A, by="valor") Alternativa assinalada
right_join(A, B, by="cod")
full_join(A, B, by="cod") 
inner_join(A, B, by="cod")
A existência de dados faltantes é comum nas bases dados das empresas e organizações, afetando diversos aspectos da execução de projetos de ciência de
dados.  Nesta situação, as equipes de ciência devem tomar decisões sobre como lidar com os dados faltantes.
Analise as afirmações abaixo que trazem formas de lidar com dados faltantes.
 
I. Substituir os dados faltantes pela média dos demais registros, em caso de variáveis quantitativas.
II. Substituir os dados faltantes pela categoria de maior frequência, em caso de variáveis qualitativas.
III. Substituir os dados faltantes por zero, independentemente da variável ser quantitativa ou qualitativa.
IV. Manter os registros com informação faltante vazios.
Assinale a alternativa que aponta afirmativas com opções adequadas de lidar com dados faltantes.
Alternativas:
I e II.
I, II e IV.  Alternativa assinalada
II e IV.
IV.
I, II, III e IV.