Buscar

Aap2 - Análise Exploratória de Dados - Eda

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

03/12/2022 16:39 Colaborar - Aap2 - Análise Exploratória de Dados - Eda
https://www.colaboraread.com.br/aluno/avaliacao/index/3079480703?atividadeDisciplinaId=13716062 1/2
Portal Digital
do Aluno
(/index/index)
Início (/)   Superior de Tecnologia em Ciência de Dados…   Análise Exploratória de Dados - Eda (/aluno/…   Aap2 - Análise Exploratória de Dados - Eda
Aap2 - Análise Exploratória de Dados - Eda
Sua avaliação foi confirmada com sucesso

(/notificacao/index)
2
Meus Cursos (/index/index) Serviços Online Apoio ao Estudo Oportunidades Ajuda  Area do Usuário  Sair
×
Informações Adicionais
Período: 03/10/2022 00:00 à 03/12/2022 23:59
Situação: Cadastrado
Tentativas: 1 / 3
Protocolo: 821144441
Avaliar Material
a)
b)
c)
d)
e)
1)
a)
b)
c)
d)
e)
2)
Durante a etapa de preparação de dados em um projeto de ciência de dados devem ser executadas atividades de busca por diversos tipos de
inconsistências, tais como inconsistências de preenchimento e de formato, utilizando para isso funções em linguagens de programação como R e Python.
Considerando a execução destas atividades na linguagem R, assinale a alternativa que traz funções que podem ser utilizadas para avaliar as inconsistências de
preenchimento e formato, respectivamente.
Alternativas:
data.frame() e list().
plot() e hist().
library() e levels().
levels() e str().  Alternativa assinalada
str() e data.frame().
Marcos é estudante de estatística e tem o hábito de registrar todas as notas obtidas ao longo da disciplina. Até agora, Marcos teve as seguintes notas: 89,
93, 93, 96 e 98. Por não ter estudado o suficiente, Marcos obteve nota 25 no último teste, que é um outlier dentro do conjunto das notas anteriores.
Para quantificar o efeito da inclusão desta nota na sua média, Marcos construiu o seguinte código em linguagem R:
 
dados1<-c(89,93,93,96,98)
media1<-mean(dados1)
media1
dados2<-c(89,93,93,96,98,25)
media2<-mean(dados2)
media2
media2-media1
Após executar o código, assinale a alternativa que aponta corretamente o resultado da inclusão desta nota na média geral de Marcos.
Alternativas:
Haverá redução da média em mais de 10 pontos.  Alternativa assinalada
A inclusão da nota não causará uma redução da média do conjunto de dados.
Haverá redução da média em mais de 20 pontos.
Haverá aumento da média em 5.5 pontos.
A inclusão da média diminuirá a média em mais de 50 %.
https://www.colaboraread.com.br/index/index
https://www.colaboraread.com.br/
https://www.colaboraread.com.br/aluno/dashboard/index/3079480703
https://www.colaboraread.com.br/aluno/timeline/index/3079480703?ofertaDisciplinaId=1844068
https://www.colaboraread.com.br/notificacao/index
https://www.colaboraread.com.br/index/index
javascript:void(0);
03/12/2022 16:39 Colaborar - Aap2 - Análise Exploratória de Dados - Eda
https://www.colaboraread.com.br/aluno/avaliacao/index/3079480703?atividadeDisciplinaId=13716062 2/2
a)
b)
c)
d)
e)
3)
a)
b)
c)
d)
e)
4)
O enriquecimento de dados utilizando fontes externas é uma alternativa muito valiosa para empresas que necessitam de dados para determinadas
aplicações, mas que não podem arcar com custos de novos processos de coleta de dados. Neste processo, a principal atividade executada para enriquecer as
bases de dados é a aplicação de funções de cruzamentos de dados em linguagens de programação como R e Python.
Assinale a alternativa que aponta exemplos de funções da linguagem R que executam o cruzamento de dados:
Alternativas:
mean, var e sd.
data.frame, list e matrix.
left_join, right_join, full_join e inner_join.  Alternativa assinalada
boxplot e hist.
ggplot e qplot. 
Diversos softwares de análise de dados como R e Python utilizam uma série de caracteres especiais como parte de sua linguagem, sendo utilizados como
operadores para a realização de atividades associadas aos dados. Dessa forma, estes caracteres, assim como espaços entre palavras, devem ser evitados na
nomenclatura de nomes de variáveis em conjuntos de dados a serem analisados. Neste contexto, considere a tabela abaixo que traz um conjunto de 5
observações de automóveis.
Assinale a alternativa que traz o código em R que cria esta tabela utilizando nomes de colunas válidos na linguagem.
Alternativas:
data.frame(modelo%automovel=c(“A”, “B”, “C”, “D”, “E”),
                        valor&automovel=c(50000, 42000, 39000, 45000, 85000))
data.frame(modelo-automovel=c(“A”, “B”, “C”, “D”, “E”),
                        valor-automovel=c(50000, 42000, 39000, 45000, 85000))
data.frame(modelo_automovel=c(“A”, “B”, “C”, “D”, “E”),
                        valor_automovel=c(50000, 42000, 39000, 45000, 85000))
 Alternativa assinalada
data.frame(modelo*automovel=c(“A”, “B”, “C”, “D”, “E”),
                        valor&automovel=c(50000, 42000, 39000, 45000, 85000))
data.frame(modelo=automovel=c(“A”, “B”, “C”, “D”, “E”),
                        valorautomovel=c(50000, 42000, 39000, 45000, 85000))

Continue navegando