Buscar

UNICSUL_AS_respostas_Disciplina_Ciências-de-Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

TESTE 01 
 
 Pergunta 1 
 Qual o outro nome que podemos dar à Ciência de Dados? 
Respostas: e. Analytics. 
Comentário da 
resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
A Ciência de Dados, que também pode ser chamada de Analytics, procura criar modelos capazes 
de extrair padrões de sistemas complexos e usar esses modelos em aplicações reais. Estuda 
princípios, métodos e sistemas computacionais para extrair conhecimento de dados. 
 
 Pergunta 2 
 O Big Data tem 5 características, os 5 Vs. Qual alternativa refere-se ao Volume? 
Respostas: a. Organizações coletam dados de uma grande variedade de fontes, incluindo transações 
comerciais, Redes Sociais e informações de sensores ou dados transmitidos de máquina a 
máquina. No passado, armazenar tamanha quantidade de informações teria sido um problema, mas 
novas Tecnologias (como o Hadoop) têm aliviado a carga. 
Comentário da 
resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
• Volume: Organizações coletam dados de uma grande variedade de fontes, incluindo transações 
comerciais, Redes Sociais e informações de sensores ou dados transmitidos de máquina a 
máquina. No passado, armazenar tamanha quantidade de informações teria sido um problema, mas 
novas tecnologias (como o Hadoop) têm aliviado a carga. 
 
 Pergunta 3 
 O Big Data tem 5 características, os 5 Vs. Qual alternativa refere-se à Variabilidade? 
Respostas: c. Além da velocidade e da variedade de dados cada vez maiores, os fluxos de dados 
podem ser altamente inconsistentes com picos periódicos. Existe algo em tendência 
nas Redes Sociais? Diariamente, picos de dados sazonais ou picos gerados com base 
em eventos podem ser um desafio de gerenciar. Ainda mais quando falamos de 
dados não estruturados. 
Comentário 
da resposta: 
Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material 
estudado para comentar a resposta. 
Variabilidade: Além da velocidade e da variedade de dados cada vez maiores, os 
fluxos de dados podem ser altamente inconsistentes com picos periódicos. Existe 
algo em tendência nas Redes Sociais? Diariamente, picos de dados sazonais ou picos 
gerados com base em eventos podem ser um desafio de gerenciar. Ainda mais 
quando falamos de dados não estruturados. 
 
 Pergunta 4 
 Para que servem os modelos preditivos? 
Respostas: d. Para identificar padrões e mostrar o que pode acontecer de acordo com os dados 
analisados. 
Comentário da 
resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
Os modelos preditivos, em geral, servem para identificar padrões e mostrar o que pode 
acontecer de acordo com os dados analisados. 
 
 
 
TESTE 02 
 Pergunta 1 
 A Staging Area I é necessária em qual etapa? 
 
Respostas: b. Extração. 
 
 
 Pergunta 2 
 Qual das alternativas a seguir descreve a definição de dado? 
Respostas: a. Dado: é o menor elemento a ser armazenado. É algo que sozinho não tem sentido. 
Comentário da 
resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
Dado: é o menor elemento a ser armazenado. É algo que sozinho não tem sentido. 
 
 Pergunta 3 
 Qual das alternativas a seguir descreve a definição de conhecimento? 
Respostas: c. conhecimento ocorre quando utilizamos a informação para chegar a alguma conclusão, 
ou até mesmo, reconhecer algum tipo de comportamento/padrão. 
Comentário da 
resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
Conhecimento: ocorre quando utilizamos a informação para chegar a alguma conclusão, ou 
até mesmo, para reconhecer algum tipo de comportamento/padrão. 
 
 Pergunta 4 
 Qual é a infraestrutura recomendada para armazenar dados em constante crescimento? 
Respostas: a. Nuvem pública. 
Comentário 
da resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
A computação em nuvem é a grande ferramenta para armazenamento de dados, pois as nuvens 
públicas, têm um alto poder de suportar volumes de dados enormes e as características de 
elasticidade que as nuvens permitem, quando necessário, é possível acionar servidores extras para 
atender a demanda de crescimento do momento. 
 
 Pergunta 5 
 Qual das alternativas a seguir descreve a definição de informação? 
Respostas: b. Informação: é o que obtemos do resultado da operação com o dado. 
Comentário da resposta: Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
Informação: é o que obtemos do resultado da operação com o dado. 
 
 Pergunta 6 
Depois que os dados passam pela Transformação, qual é a etapa sucessora? 
Respostas: d. Carga. 
Comentário da 
resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A etapa de 
carga ocorre em sequência à de transformação. 
 
 
 
 
 
 
 
 Pergunta 7 
Quais podem ser as fontes que um ETL precisa acessar? 
I. Banco de Dados. 
II. Arquivos .TXT. 
III. Redes Sociais. 
IV. Planilhas. 
Assinale a alternativa CORRETA: 
Respostas: e. Todas as afirmativas estão corretas. 
Comentário 
da 
resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
A maioria dessas fontes tendem a ser Bancos de Dados relacionais ou outros tipos de arquivos, mas 
podem existir outros tipos de fontes também. Um sistema ETL precisa ser capaz de se comunicar com 
bases de dados e ler diversos formatos de arquivos utilizados por toda a Organização. 
 
 Pergunta 8 
Qual das alternativas a seguir descreve a definição de dado? 
Respostas: b. Dado: é o menor elemento a ser armazenado. É algo que sozinho não tem sentido. 
Comentário 
da resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
Dado: é o menor elemento a ser armazenado. É algo que sozinho não tem sentido. 
 
 Pergunta 9 
Em qual etapa do processo de ETL ocorrem as ações de limpar, modificar e corrigir a informação? 
Respostas: b. Transformação. 
 
 
 
TESTE 03 
 Pergunta 1 
Quanto à definição de aprendizado supervisionado, podemos afirmar que: 
I. Existem exemplos da saída esperada para determinados casos da base de treinamento, onde a rede, pela comparação entre 
os resultados obtidos e esperados, pode adaptar os pesos das conexões para minimizar o erro, obtendo um aprendizado 
por exemplos. 
II. Esse tipo de aprendizado não possui exemplos para comparar seu erro, sendo baseado na auto-organização. O indutor 
analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma maneira, formando 
agrupamentos ou clusters. Após a determinação dos agrupamentos, em geral, é necessário uma análise para determinar o 
que cada agrupamento significa no contexto problema sendo analisado. 
III. Essa abordagem de aprendizagem de máquinas tenta aprender qual é a melhor ação a ser tomada, dependendo das 
circunstâncias na qual essa ação será executada, ou seja, é uma aprendizagem com base na interação com o ambiente. 
Respostas: c. Somente a alternativa I está correta. 
Comentário 
da resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
Como o próprio nome sugere, existem exemplos da saída esperada para determinados casos da base 
de treinamento, onde a rede, pela comparação entre os resultados obtidos e esperados, pode adaptar ospesos das conexões para minimizar o erro, obtendo um aprendizado por exemplos. O algoritmo de 
aprendizado (indutor) recebe um conjunto de exemplos de treinamento para os quais os rótulos da 
classe associada são conhecidos. Cada exemplo (instância ou padrão) é descrito por um vetor de 
valores (atributos) e pelo rótulo da classe associada. O objetivo do indutor é construir um classificador 
que possa determinar corretamente a classe de novos exemplos ainda não rotulados. 
 
 
 Pergunta 2 
Quais afirmativas podemos fazer na relação de mineraçao de dados com machine learning? 
I. Tanto a mineração de dados quanto o aprendizado de máquinas utilizam-se de muitos métodos da área de 
estatística. 
II. Quando essas duas áreas juntam-se, conseguimos atingir os objetivos de aprender e gerar hipóteses 
automaticamente a partir de grandes volumes de dados. 
Respostas: d. As afirmativas I e II estão corretas. 
Comentário 
da 
resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
Tanto a mineração de dados quanto o aprendizado de máquinas utilizam-se de muitos métodos da 
área de estatística. 
Então, quando essas duas áreas juntam-se, conseguimos atingir os objetivos de aprender e gerar 
hipóteses automaticamente a partir de grandes volumes de dados. 
 
 Pergunta 3 
Na definição de aprendizado, qual o significado das letras T, D e E? 
Respostas: c. Tarefa, Desempenho e Experiência 
Comentário 
da resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
Segundo Mitchell (1997), a tarefa de aprendizado significa: “ Melhorar na tarefa T, com respeito à 
métrica de desempenho D, baseado na experiência E”. 
 
 Pergunta 4 
Tarefas de classificação que precisam de exemplos de saída são realizadas por que tipo de aprendizado? 
Respostas: b. Aprendizado supervisionado 
Comentário Justificativa (comentário da resposta) 
da resposta: Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Exemplo de 
aprendizado supervisionado: 
Vamos pensar em um programa que usa aprendizado de máquina para classificar fotos de cavalos. 
Para isso, teremos dois tipos de dados de entrada para treinar o algoritmo: 
• Imagem: várias fotos de cavalos e outras não. 
• Dado Booleano (true/false): indicando se a figura é ou não de um cavalo. 
O treinamento acontece no momento em que o algoritmo analisa a imagem junto com a resposta, ou 
seja, o algoritmo faz a seguinte pergunta: essa figura é a de um cavalo? O algoritmo vai repetir essa 
pergunta para milhões e milhões de imagens diferentes. Até que chega a um ponto em que o 
algoritmo aprende quais são características que uma foto precisa apresentar para ser considerada a 
figura de um cavalo. 
 
 Pergunta 5 
Quais afirmativas podemos fazer na relação de mineraçao de dados com machine learning? 
I. Tanto a mineração de dados quanto o aprendizado de máquinas utilizam-se de muitos métodos da área de estatística. 
II. Quando essas duas áreas juntam-se, conseguimos atingir os objetivos de aprender e gerar hipóteses automaticamente 
a partir de grandes volumes de dados. 
 
Respostas: d. As afirmativas I e II estão corretas. 
Comentário da 
resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
Tanto a mineração de dados quanto o aprendizado de máquinas utilizam-se de muitos métodos da 
área de estatística. Então, quando essas duas áreas juntam-se, conseguimos atingir os objetivos de 
aprender e gerar hipóteses automaticamente a partir de grandes volumes de dados. 
 
 
 
 Pergunta 6 
Quanto à definição de aprendizado não supervisionado, podemos afirmar que: 
I. Existem exemplos da saída esperada para determinados casos da base de treinamento, onde a rede, pela 
comparação entre os resultados obtidos e esperados, pode adaptar os pesos das conexões para minimizar o erro, 
obtendo um aprendizado por exemplos. 
II. Esse tipo de aprendizado não possui exemplos para comparar seu erro, sendo baseado na auto-organização. O 
indutor analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma 
maneira, formando agrupamentos ou clusters. Após a determinação dos agrupamentos, em geral, é necessário 
uma análise para determinar o que cada agrupamento significa no contexto problema sendo analisado. 
III. Essa abordagem de aprendizagem de máquinas tenta aprender qual é a melhor ação a ser tomada, dependendo 
das circunstâncias na qual essa ação será executada, ou seja, é uma aprendizagem com base na interação com o 
ambiente. 
 
Respostas: b. Somente a alternativa II está correta. 
Comentário 
da resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
Ao contrário do supervisionado, esse tipo de aprendizado não possui exemplos para comparar seu 
erro, sendo baseado na auto-organização. O indutor analisa os exemplos fornecidos e tenta 
determinar se alguns deles podem ser agrupados de alguma maneira, formando agrupamentos 
ou clusters. Após a determinação dos agrupamentos, em geral, é necessário uma análise para 
determinar o que cada agrupamento significa no contexto problema sendo analisado. 
A aprendizagem não supervisionada consegue trabalhar com dados não rotulados, ou seja, não 
informamos ao algoritmo o que é aquele dado de entrada. 
 
 
 
 
TESTE 04 
 Pergunta 1 
Qual tipo de análise de dados é considerada o 1º nível das análises de dados? 
 
Respostas: c. Análise Descritiva 
Comentário 
da resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
Análise Descritiva É considerada como o primeiro nível de análise, onde é possível entender o que 
está acontecendo no negócio atualmente. 
 
 
 Pergunta 2 
Em analytics, quais são os quatro tipos de análise de dados, que podemos encontrar? 
Respostas: d. Descritiva, Preditiva, Prescritiva e Diagnóstica. 
Comentário 
da resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
As análises de dados podem ser classificadas como: descritiva, preditiva, prescritiva e diagnóstica. 
 
 Pergunta 3 
Quanto à junção da análise preditiva e análise prescritiva, podemos afirmar que: 
I. ajuda a criar uma estratégia e tomada de decisão baseada em dados. 
II. ajuda a criar uma estratégia e tomada de decisão baseada em fatos das redes sociais. 
III. ajuda a criar uma estratégia e tomada de decisão baseada em probabilidades estatísticas. 
 
Respostas: b. Somente a alternativa I está correta. 
Comentário 
da resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A análise prescritiva 
juntamente com a análise preditiva ajuda a criar uma estratégia e tomada de decisão baseada em dados. 
 
 
 Pergunta 4 
Qual o objetivo da Análise Preditiva? 
I. É possível entender o que está acontecendo no negócio atualmente. Tem como principal objetivo resumir, 
sumarizar e explorar o comportamento dos dados. Permite saber o que aconteceu no passado. Ela permite tomar 
decisões com base em estatísticas obtidas a partir de dados históricos. 
II. Esse tipo de análise é o mais indicado para quem precisa prever algum tipo de comportamento ou resultado. 
Essa técnica busca analisar dados relevantes ao longo do tempo, buscando padrões comportamentais e suas 
variações de acordo com cada contexto, a fim de prever como será o comportamento de seu público ou mercado 
no futuro, dadas as condições atuais. 
III. Essa análise busca trazer informações de consequências de um determinado acontecimento, fornece às empresas 
recomendações sobre ações ideaispara atingir objetivos de negócios. 
IV. O foco dessa análise está na relação de causas e consequências percebidas ao longo do tempo, dentro de um 
determinado tema. Sendo assim, funciona baseada na coleta de dados relacionados a um determinado assunto, 
cruzando informações com o objetivo de entender quais fatores influenciaram o resultado atual. 
 
Respostas: d. Somente a afirmativa II está correta. 
Comentário 
da resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. 
Este tipo de análise é o mais indicado para quem precisa prever algum tipo de comportamento ou 
resultado. Esta técnica busca analisar dados relevantes ao longo do tempo, buscando padrões 
comportamentais e suas variações de acordo com cada contexto, a fim de prever como será o 
comportamento de seu público ou mercado no futuro, dadas as condições atuais. Muito útil para 
avaliar tendências de consumo e flutuações econômicas. A análise preditiva é o uso de dados, 
algoritmos estatísticos e técnicas de machine learning para identificar a probabilidade de resultados 
futuros com base em dados históricos. 
 
 
TESTE 05 
 
 Pergunta 1 
Por que é necessário indicar que campo é o label na base de dados? 
 
Respostas: a. Para apontar que campo será a Classe de Atributo. 
Comentário 
da resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A indicação do label 
serve para apontar qual campo será a classe de atributo. 
 
 
 Pergunta 2 
Quais são os tipos de fontes de dados, que a ferramenta RapidMiner pode carregar? 
I. Banco de Dados 
II. Exemplos de base de dados 
III. Arquivos .TXT 
IV. Planilhas em Excel 
Respostas: b. Todas as afirmativas estão corretas. 
Comentário da 
resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A maioria das fontes 
tendem a ser bancos de dados relacionais ou outros tipos de arquivos como .TXT, .XLS etc. A 
ferramenta RapidMiner consegue trabalhar com todos esses tipos de fontes de dados. 
 
 Pergunta 3 
Ao usar a ferramenta RapidMiner, na etapa de pré-processamento de dados, devemos classificar os atributos, do 
tipo texto, em binominal ou polinominal. Analise as afirmativas abaixo. 
I. O Atributo polinominal pode ter 1,2,3,n valores diferentes. 
II. O Atributo polinominal pode ter 2 valores diferentes. 
III. O Atributo polinominal pode ter 1 valor diferente. 
IV. Essa classificação de atributo é opcional. 
Respostas: a. Somente a afirmativa I está correta. 
Comentário 
da resposta: 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Um atributo 
polinominal pode ter n valores diferentes. 
 
 Pergunta 4 
Quais os tipos de análises podemos realizar com a ferramenta RapidMiner? 
Respostas: b. Descritiva, Preditiva, Prescritiva e Diagnóstica. 
Comentário da 
resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. As análises de 
dados podem ser classificadas como: descritiva, preditiva, prescritiva e Diagnóstica. Todas essas 
podem ser executadas usando a ferramenta RapidMiner. 
 
 Pergunta 5 
Das atividades relacionadas abaixo, podemos usar a ferramentaRapidMiner, para realizar qual tarefa? 
 
Respostas: c. Fazer coleta de dados. 
 
 
 Pergunta 6 
Por que é necessário indicar que campo é o label na base de dados? 
 
Respostas: c. Para apontar que campo será a Classe de Atributo. 
 
 
 
 
 
 Pergunta 7 
Quais são os tipos de fontes de dados, que a ferramenta RapidMiner pode carregar? 
I. Banco de Dados 
II. Exemplos de base de dados 
III. Arquivos .TXT 
IV. Planilhas em Excel 
 
Respostas: b. Todas as afirmativas estão corretas. 
Comentário 
da 
resposta: 
Justificativa (comentário da resposta) 
Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A maioria 
das fontes tendem a ser bancos de dados relacionais ou outros tipos de arquivos 
como .TXT, .XLS etc. A ferramenta RapidMiner consegue trabalhar com todos esses tipos de 
fontes de dados. 
 
 
 Pergunta 8 
Quais os tipos de análises podemos realizar com a ferramenta RapidMiner? 
Respostas: a. Descritiva, Preditiva, Prescritiva e Diagnóstica.

Outros materiais