Buscar

Prova 2 - INTRODUÇÃO A CIÊNCIA DE DADOS

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

A analítica preditiva pode ser definida também como previsões com nível de granularidade mais detalhado, baseando-se em pontuações preditivas probabilísticas para cada elemento organizacional individual. A Previsão de Churn é um dos tipos de análise preditiva e caracteriza-se por:
I - Ser o estudo do percentual de clientes que solicita o cancelamento do serviço contratado em determinado intervalo de tempo.
II - Descrever e organizar os dados com objetivo de facilitar a compreensão e utilização das informações que serão extraídas.
III - Ofertar um modelo ou pacote de serviços mais moderno ou completo do que o cliente já possui ou esteja em processo de compra.
IV - Métrica que indica quantos clientes deixaram determinado produto
Assinale a alternativa correta:
a.
Apenas a I e III estão corretas.
b.
Apenas a II está correta.
c.
Apenas a I e IV estão corretas.
d.
Apenas a II e III estão corretas.
e.
Apenas a IV está correta.
Feedback
Sua resposta está correta.
A resposta correta é: Apenas a I e IV estão corretas.
Questão 2
Correto
Atingiu 0,60 de 0,60
Marcar questão
Texto da questão
Para que seja exibido a matriz abaixo:
Qual a biblioteca e atributo devem ser utilizados:
a.
Numpy e shape.
b.
Numpy e tensor.
c.
Pandas e shape.
d.
Pandas e Numpy.
e.
Pandas e tensor.
Feedback
Sua resposta está correta.
A resposta correta é: Numpy e shape.
Questão 3
Correto
Atingiu 0,60 de 0,60
Marcar questão
Texto da questão
É muito importante a escolha de uma plataforma ETL para qualquer empresa, em função da arquitetura de seus dados. As características das soluções são:
 
(a) SnowPlow, Segment
(b) Stitch, Fivetran e Kondado
(c) Spark, Dremio
(d) Oracle, Google BigQuery, PostgreSql, SnowFlake
 
( ) Armazenamento de Dados
( ) Transformação de Dados
( ) Extração e carregamento de dados
( ) Coleta de dados
a.
d; c; b; a.
b.
c; a; b; d.
c.
a; b; d; c.
d.
a; c; d; b.
e.
a; b; c; d.
Feedback
Sua resposta está correta.
A resposta correta é: d; c; b; a.
Questão 4
Correto
Atingiu 0,60 de 0,60
Marcar questão
Texto da questão
A proposta de uma solução de Big Data é oferecer uma abordagem consistente no tratamento do constante crescimento e da complexidade dos dados. Os dados podem ser encontrados de três formas:
a.
Fácil; Difícil e Avançado.
b.
Básico; Médio e Avançado.
c.
String; Numérico e Float.
d.
Char; Boolean e Avançado.
e.
Estruturado; Não estruturado e Semi-estruturado.
Feedback
Sua resposta está correta.
A resposta correta é:
Estruturado; Não estruturado e Semi-estruturado.
Questão 5
Correto
Atingiu 0,60 de 0,60
Marcar questão
Texto da questão
Para realizar o Planejamento do modelo de dados, existem diversas metodologias, técnicas e ferramentas para a concepção do modelo proposto. Sobre os  algoritmos CART (Classification and Regression Trees), CHAID (Chi Square Automatic Interaction Detection) é correto afirmar que:
a.
Utilizam árvores de decisão, que podem variar de acordo com o volume de dados.
b.
Definem a arquitetura para a realização do processamento de conjuntos de dados em paralelo
c.
Permitem executar aplicações em sistemas distribuídos através de diversos comptadores (nodes).
d.
Possuem dois módulos principais: o módulo de armazenamento e o de processamento
e.
É um aplicativo que funciona em ambientes de computação distribuída.
Feedback
Sua resposta está correta.
A resposta correta é: Utilizam árvores de decisão, que podem variar de acordo com o volume de dados.
Questão 6
Correto
Atingiu 0,60 de 0,60
Marcar questão
Texto da questão
Dentre os vários métodos de Machine Learning disponíveis na literatura, os mais conhecidos são classificação, regressão e clustering. É correto afirmar que:
 
( ) Classificação, são utilizados para a identificação do rótulo de determinadas observações com base em características e informações previamente conhecidas.
( ) O método regressão é um conjunto de dados não rotulados, este método encontra padrões e os dados são agrupados de acordo com as relações encontradas entre as variáveis.
( ) Agrupamento ou clustering utilizam um conjunto de dados não rotulados, este método encontra padrões e os dados são agrupados de acordo com as relações encontradas entre as variáveis.
( ) Agrupamento ou clustering, são utilizados para a identificação do rótulo de determinadas observações com base em características e informações previamente conhecidas.
 ( ) O método regressão é utilizado em algoritmos de aprendizagem supervisionada, que busca modelar relações entre variáveis dependentes e independentes através de métodos estatísticos.
a.
V; F; V; F; V.
b.
F; F; V; V; V.
c.
F; V; V; F; F.
d.
V; F; F; V; V.
e.
V; F; F; F; V.
Feedback
Sua resposta está correta.
A resposta correta é: V; F; V; F; V.
Questão 7
Correto
Atingiu 0,60 de 0,60
Marcar questão
Texto da questão
De acordo com o código Python abaixo, qual das bibliotecas deve ser importada? e porque?
 
df = pd.DataFrame({'calorias':[200, 350, 550], 'gordura (%)':[0, 15, 35]}, index=['banana', 'macarrão', 'cachorro quente'])
a.
A biblioteca Dataframe, porque ela  retorna um array serializado com índice.
b.
A biblioteca Série, porque ela  retorna um array serializado com índice.
c.
A biblioteca Numpy, porque ela  retorna um array alternado com índice.
d.
A biblioteca Pandas, porque ela  retorna um array serializado com índice.
e.
A biblioteca scikit-learn, porque ela  retorna um array alternado com índice.
Feedback
Sua resposta está correta.
A resposta correta é: A biblioteca Pandas, porque ela  retorna um array serializado com índice.
Questão 8
Correto
Atingiu 0,60 de 0,60
Marcar questão
Texto da questão
Vários métodos estatísticos são utilizados para o Machine Learning alcançar o desempenho esperado. Sobre o método clustering é correto afirmar:
a.
É útil quando o custo associado à rotulação é muito baixo para possibilitar um processo de treinamento totalmente rotulado.
b.
Todas as alternativas estão corretas.
c.
Esse método encontra padrões e os dados são agrupados de acordo com as relações encontradas entre as variáveis.
d.
É útil quando o custo associado à rotulação é muito alto para possibilitar um processo de treinamento totalmente rotulado.
e.
É feito um mapeamento das apenas de variáveis de saída.
Feedback
Sua resposta está correta.
A resposta correta é: Esse método encontra padrões e os dados são agrupados de acordo com as relações encontradas entre as variáveis.
Questão 9
Texto da questão
Inferir é deduzir um resultado, por lógica, com base na interpretação de outras informações, sobre Estatística inferencial é correto afirmar:
a.
Está focada na apresentação dos dados, mas não procura fazer inferências ou tirar sólidas conclusões que podem ser usadas para prever futuros dados da amostra.
b.
São os métodos usados para visualizar dados (data visualization
c.
Visa descrever e organizar os dados com objetivo de facilitar a compreensão e utilização das informações que serão extraídas.
d.
Pode ser definida como um conjunto de procedimentos estatísticos que têm por finalidade tirar sólidas conclusões que podem ser usadas para prever futuros dados de uma amostra para uma população.
e.
Permite a descrição de fenômenos aleatórios oriundos das incertezas.
A resposta correta é:
Pode ser definida como um conjunto de procedimentos estatísticos que têm por finalidade tirar sólidas conclusões que podem ser usadas para prever futuros dados de uma amostra para uma população.
Questão 10
Correto
Atingiu 0,60 de 0,60
Marcar questão
Texto da questão
Sobre o aprendizado não-supervisionado é correto afirmar:
I - O objetivo é de identificar os padrões existentes nos dados sob análise, suas similaridades (conforme critério estabelecido), suas diferenças e efetuar um agrupamento consistente das informações analisadas.
II- No aprendizado não-supervisionado, o algoritmo não recebe os rótulos de entrada e, portanto, não conhece os rótulos de saída que devem ser gerados
III - Têm o objetivo de fazer previsões baseados no conjunto de dados que estão sendo analisados, sejam eles dados históricos ou não,eles são treinados por meio de exemplos rotulados, como uma entrada na qual a saída desejada é conhecida.
IV - Os resultados desse tipo de algoritmo são geralmente marcados como classificação e regressão.
a.
Apenas a alternativa I está correta.
b.
Apenas as alternativas I e III estão corretas.
c.
Apenas as alternativas I e II estão corretas.
d.
Apenas as alternativas II e III estão corretas.
e.
Apenas a alternativa IV está correta.
Feedback
Sua resposta está correta.
A resposta correta é: Apenas as alternativas I e II estão corretas.

Continue navegando