Buscar

Atividades Avaliativas Ciência de Dados Cruzeiro do Sul (2023)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Atividades Avaliativas – Ciência de Dados – Cruzeiro do Sul (2023) 
 
AS – Unidade I 
 
Pergunta 1 
I. Os modelos preditivos são aqueles que utilizam dados do passado para 
prever comportamentos, também detectam padrões, ainda que sutis, no conjunto de 
dados analisados. 
II. Os modelos descritivos ajudam a identificar relações. 
 
Assinale a alternativa CORRETA: 
 
a. Somente a afirmativa II é verdadeira. 
b. As afirmativas I e II são falsas. 
c. Somente a afirmativa I é verdadeira. 
d. A afirmativa I justifica a afirmativa II. 
e. As afirmativas I e II são verdadeiras. (Correta) 
 
Justificativa (comentário da resposta) 
Os modelos preditivos são aqueles que utilizam dados do passado para prever 
comportamentos de um cliente. Eles também detectam padrões, ainda que sutis, no 
conjunto de dados analisados. São usados, principalmente, para transações em 
tempo real, auxiliando na identificação de um consumidor com menos propensão a 
pagar, de fraudes ou de desistências do serviço. 
Os modelos descritivos, por sua vez, ajudam a identificar relações, sejam elas sobre 
os clientes ou os produtos e são aplicados, principalmente, para categorizar clientes 
e identificar potenciais públicos para prospecção. 
 
Pergunta 2 
Qual o outro nome que podemos dar à Ciência de Dados? 
 
a. Coleção de Dados. 
 b. Analytics. (Correta) 
c. Data Warehouse. 
d. Data Mart. 
e. Big Data. 
 
Justificativa (comentário da resposta) 
A Ciência de Dados, que também pode ser chamada de Analytics, procura criar 
modelos capazes de extrair padrões de sistemas complexos e usar esses modelos 
em aplicações reais. Estuda princípios, métodos e sistemas computacionais para 
extrair conhecimento de dados. 
 
Pergunta 3 
O Big Data tem 5 características, os 5 Vs. Qual alternativa refere-se à 
Velocidade? 
 
a. Os dados de hoje vêm de várias fontes, o que torna difícil estabelecer uma 
relação, corresponder, limpar e transformar dados entre diferentes sistemas. No 
entanto, para que seus dados não saiam rapidamente de controle, é necessário ligar 
e correlacionar relações, hierarquias e as várias ligações de dados. 
b. Além da velocidade e da variedade de dados cada vez maiores, os fluxos de 
dados podem ser altamente inconsistentes com picos periódicos. Existe algo em 
tendência nas Redes Sociais? Diariamente, picos de dados sazonais ou picos gerados 
com base em eventos podem ser um desafio de gerenciar. Ainda mais quando falamos 
de dados não estruturados. 
c. Organizações coletam dados de uma grande variedade de fontes, incluindo 
transações comerciais, Redes Sociais e informações de sensores ou dados 
transmitidos de máquina a máquina. No passado, armazenar tamanha quantidade de 
informações teria sido um problema, mas novas Tecnologias (como o Hadoop) têm 
aliviado a carga. 
d. Os dados são gerados em todos os tipos de formatos, de dados estruturados, 
dados numéricos em Bancos de Dados tradicionais, até documentos de texto não 
estruturados, e-mail, vídeo, áudio, dados de cotações da bolsa e transações 
financeiras. 
e. Os dados fluem em uma velocidade sem precedentes e devem ser 
tratados em tempo hábil. Tags de RFID, sensores, celulares e contadores 
inteligentes estão impulsionado a necessidade de lidar com imensas 
quantidades de dados em tempo real, ou quase real. (Correta) 
 
Justificativa (comentário da resposta) 
Velocidade: os dados fluem em uma velocidade sem precedentes e devem ser 
tratados em tempo hábil. Tags de RFID, sensores, celulares e contadores inteligentes 
estão impulsionado a necessidade de lidar com imensas quantidades de dados em 
tempo real, ou quase real. 
 
Pergunta 4 
O Big Data tem 5 características, os 5 Vs. Qual alternativa refere-se à 
Veracidade? 
 
a. Os dados de hoje vêm de várias fontes, o que torna difícil estabelecer 
uma relação, corresponder, limpar e transformar dados entre diferentes 
Sistemas. No entanto, para que seus dados não saiam rapidamente de controle, 
é necessário ligar e correlacionar relações, hierarquias e as várias ligações de 
dados. (Correta) 
b. Os dados fluem em uma velocidade sem precedentes e devem ser tratados 
em tempo hábil. Tags de RFID, sensores, celulares e contadores inteligentes estão 
impulsionado a necessidade de lidar com imensas quantidades de dados em tempo 
real, ou quase real. 
c. Além da velocidade e da variedade de dados cada vez maiores, os fluxos de 
dados podem ser altamente inconsistentes com picos periódicos. Existe algo em 
tendência nas Redes Sociais? Diariamente, picos de dados sazonais ou picos gerados 
com base em eventos podem ser um desafio de gerenciar. Ainda mais quando falamos 
de dados não estruturados. 
d. Os dados são gerados em todos os tipos de formatos, de dados estruturados, 
dados numéricos em Bancos de Dados tradicionais, até documentos de texto não 
estruturados, e-mail, vídeo, áudio, dados de cotações da bolsa e transações 
financeiras. 
e. Organizações coletam dados de uma grande variedade de fontes, incluindo 
transações comerciais, Redes Sociais e informações de sensores ou dados 
transmitidos de máquina a máquina. No passado, armazenar tamanha quantidade de 
informações teria sido um problema, mas novas Tecnologias (como o Hadoop) têm 
aliviado a carga. 
 
Justificativa (comentário da resposta) 
Veracidade: os dados de hoje vêm de várias fontes, o que torna difícil 
estabelecer uma relação, corresponder, limpar e transformar dados entre diferentes 
Sistemas. No entanto, para que seus dados não saiam rapidamente de controle, é 
necessário ligar e correlacionar relações, hierarquias e as várias ligações de dados. 
 
AS – Unidade II 
 
Pergunta 1 
Qual das alternativas a seguir descreve a definição de conhecimento? 
 
a. conhecimento é o que obtemos do resultado da operação da informação com 
o conhecimento. 
b. conhecimento: é o que obtemos do resultado da operação com o dado. 
c. conhecimento: é o que obtemos do resultado da operação de dado com 
conhecimento. 
d. conhecimento ocorre quando utilizamos a informação para chegar a 
alguma conclusão, ou até mesmo, reconhecer algum tipo de 
comportamento/padrão. (Correta) 
e. conhecimento: é o menor elemento a ser armazenado. É algo que sozinho 
não tem sentido. 
 
Justificativa (comentário da resposta) 
Conhecimento: ocorre quando utilizamos a informação para chegar a alguma 
conclusão, ou até mesmo, para reconhecer algum tipo de comportamento/padrão. 
 
Pergunta 2 
Quanto ao processo de extração, podemos dizer que: 
I. Ao extrair as informações de sistemas legados, muitas podem ser as fontes 
de dados, como, por exemplo: Banco de Dados relacionais, Sistemas Erp, Redes 
Sociais, vídeos, áudios, planilhas, documentos etc. 
II. Essa extração leva os dados para uma área de trabalho chamada de área 
de staging. Essa área é dedicada para que se possa trabalhar e aplicar técnicas aos 
dados coletados. 
 
Assinale a alternativa CORRETA: 
 
a. As afirmativas I e II estão corretas. (Correta) 
b. A afirmativa I é a negativa da afirmativa II. 
c. As afirmativas I e II estão erradas. 
d. Somente a afirmativa I está correta. 
e. Somente a afirmativa II está correta. 
 
Justificativa (comentário da resposta) 
E – Extração: ao extrair as informações de sistemas legados, muitas podem ser 
as fontes de dados, como, por exemplo: Banco de ados relacionais, Sistemas Erp, 
Redes Sociais, vídeos, áudios, planilhas, documentos etc. Essa extração leva os 
dados para uma área de trabalho chamada de área de staging. Essa área é dedicada 
para que se possa trabalhar e aplicar técnicas aos dados coletados. 
 
Pergunta 3 
Qual das alternativas a seguir descreve a definição de dado? 
 
a. Dado: é o menor elemento a ser armazenado. É algo que sozinho não 
tem sentido. (Correta) 
b. Dado: é o que obtemos do resultado da operação da informação com o dado. 
c. Dado: é o que obtemos do resultado da operação com a informação. 
d. Dado:ocorre quando utilizamos a informação para chegar a alguma 
conclusão, ou até mesmo, reconhecer algum tipo de comportamento/padrão. 
e. Dado: é o que obtemos do resultado da operação de informação com 
conhecimento. 
 
Justificativa (comentário da resposta) 
Dado: é o menor elemento a ser armazenado. É algo que sozinho não tem 
sentido. 
 
Pergunta 4 
Os ajustes dos dados ocorrem em qual etapa? 
 
a. Essas ações não ocorrem em nenhuma das etapas. 
b. Gerenciamento. 
c. Extração. 
d. Transformação. (Correta) 
e. Carga. 
 
Justificativa (comentário da resposta) 
Transformação: é nesta etapa que se realizam os devidos ajustes, podendo, 
assim, melhorar a qualidade dos dados e consolidar dados de duas ou mais fontes. O 
estágio de transformação aplica uma série de regras ou funções aos dados extraídos 
para ajustar os dados a serem carregados. Algumas fontes de dados necessitarão de 
pouca manipulação de dados. Em outros casos, podem ser necessários trabalhar 
algumas transformações, como, por exemplo, junção de dados provenientes de 
diversas fontes, seleção de apenas determinadas colunas e tradução de valores 
codificados (se o sistema de origem armazena 1 para sexo masculino e 2 para 
feminino, mas o datawarehouse armazena M para masculino e F para feminino, por 
exemplo). 
 
AS – Unidade III 
 
Pergunta 1 
Quanto à definição de aprendizado não supervisionado, podemos afirmar que: 
 
I. Existem exemplos da saída esperada para determinados casos da base de 
treinamento, onde a rede, pela comparação entre os resultados obtidos e esperados, 
pode adaptar os pesos das conexões para minimizar o erro, obtendo um aprendizado 
por exemplos. 
II. Esse tipo de aprendizado não possui exemplos para comparar seu erro, 
sendo baseado na auto-organização. O indutor analisa os exemplos fornecidos e tenta 
determinar se alguns deles podem ser agrupados de alguma maneira, formando 
agrupamentos ou clusters. Após a determinação dos agrupamentos, em geral, é 
necessário uma análise para determinar o que cada agrupamento significa no 
contexto problema sendo analisado. 
III. Essa abordagem de aprendizagem de máquinas tenta aprender qual é a 
melhor ação a ser tomada, dependendo das circunstâncias na qual essa ação será 
executada, ou seja, é uma aprendizagem com base na interação com o ambiente. 
 
a. As alternativas I e III estão corretas. 
b. Somente a alternativa I está correta. 
c. Somente a alternativa III está correta. 
d. Somente a alternativa II está correta. (correta) 
e. As alternativas I e II estão corretas. 
 
Justificativa (comentário da resposta) 
Ao contrário do supervisionado, esse tipo de aprendizado não possui exemplos 
para comparar seu erro, sendo baseado na auto-organização. O indutor analisa os 
exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de 
alguma maneira, formando agrupamentos ou clusters. Após a determinação dos 
agrupamentos, em geral, é necessário uma análise para determinar o que cada 
agrupamento significa no contexto problema sendo analisado. 
A aprendizagem não supervisionada consegue trabalhar com dados não 
rotulados, ou seja, não informamos ao algoritmo o que é aquele dado de entrada. 
 
Pergunta 2 
Quanto ao Aprendizado de Máquina, podemos afirmar que: 
 
I. É uma subdivisão da inteligência artificial, também conhecida como “machine 
learning”. 
II. Significa criar programas que aprendam um determinado comportamento ou 
padrão automaticamente a partir de exemplos ou observações. 
 
a. As afirmativas I e II estão erradas. 
b. Somente a afirmativa II está correta. 
c. A afirmativa I é a negativa da afirmativa II. 
d. As afirmativas I e II estão corretas. (Correta) 
e. Somente a afirmativa I está correta. 
 
Pergunta 3 
Tarefas de classificação que precisam de exemplos de saída são realizadas 
por que tipo de aprendizado? 
 
a. Aprendizado não vigiado 
b. Aprendizado vigiado 
c. Aprendizado não supervisionado 
d. Aprendizado supervisionado (Correta) 
e. Aprendizado por reforço 
 
Justificativa (comentário da resposta) 
Exemplo de aprendizado supervisionado: 
Vamos pensar em um programa que usa aprendizado de máquina para 
classificar fotos de cavalos. Para isso, teremos dois tipos de dados de entrada para 
treinar o algoritmo: 
• Imagem: várias fotos de cavalos e outras não. 
• Dado Booleano (true/false): indicando se a figura é ou não de um cavalo. 
O treinamento acontece no momento em que o algoritmo analisa a imagem 
junto com a resposta, ou seja, o algoritmo faz a seguinte pergunta: essa figura é a de 
um cavalo? O algoritmo vai repetir essa pergunta para milhões e milhões de imagens 
diferentes. Até que chega a um ponto em que o algoritmo aprende quais são 
características que uma foto precisa apresentar para ser considerada a figura de um 
cavalo. 
 
Pergunta 4 
Na definição de aprendizado, qual o significado das letras T, D e E? 
 
a. Titulação, Desempenho e Experiência 
b. Tarefa, Desempenho e Esforço 
c. Tarefa, Desempenho e Excelência 
d. Tarefa, Dinâmico e Experiência 
e. Tarefa, Desempenho e Experiência (Correta) 
 
Justificativa (comentário da resposta) 
Segundo Mitchell (1997), a tarefa de aprendizado significa: “ Melhorar na tarefa 
T, com respeito à métrica de desempenho D, baseado na experiência E”. 
 
AS – Unidade IV 
 
Pergunta 1 
Qual o objetivo da Análise Diagnóstica? 
 
I. É possível entender o que está acontecendo no negócio atualmente. Tem 
como principal objetivo resumir, sumarizar e explorar o comportamento dos dados. 
Permite saber o que aconteceu no passado. Ela permite tomar decisões com base em 
estatísticas obtidas a partir de dados históricos. 
II. Esse tipo de análise é o mais indicado para quem precisa prever algum tipo 
de comportamento ou resultado. Essa técnica busca analisar dados relevantes ao 
longo do tempo, buscando padrões comportamentais e suas variações de acordo com 
cada contexto, a fim de prever como será o comportamento de seu público ou mercado 
no futuro, dadas as condições atuais. 
III. Essa análise busca trazer informações de consequências de um 
determinado acontecimento, fornece às empresas recomendações sobre ações ideais 
para atingir objetivos de negócios. 
IV. O foco dessa análise está na relação de causas e consequências 
percebidas ao longo do tempo, dentro de um determinado tema. Sendo assim, 
funciona baseada na coleta de dados relacionados a um determinado assunto, 
cruzando informações com o objetivo de entender quais fatores influenciaram o 
resultado atual. 
 
a. Somente a afirmativa I está correta. 
b. Somente a afirmativa II está correta. 
c. Somente a afirmativa IV está correta. (Correta) 
d. As afirmativas I e II estão corretas. 
e. Somente a afirmativa III está correta. 
 
Justificativa (comentário da resposta) 
Esta análise é feita após o trabalho, de coleta de dados e outros tipos de 
análises, serem realizados. Perguntas importantes, como “Quem fez? Quando fez? 
Onde fez? Por que fez?”, são fundamentais para esse tipo de análise. Seu objetivo é 
responder à pergunta “Por que aconteceu?”. Neste modelo o foco está na relação de 
causas e consequências percebidas ao longo do tempo, dentro de um determinado 
tema. Assim, a análise diagnóstica funciona baseada na coleta de dados relacionados 
a um determinado assunto, cruzando informações com o objetivo de entender quais 
fatores influenciaram o resultado atual. Bastante utilizado em vendas, este modelo 
funciona bem em conjunto com análises preditivas, servindo de base para as 
projeções futuras. Análises diagnósticas também são úteis para entender quais 
fatores devem ser ajustados em determinadas ações, a fim de obter os resultados 
desejados. 
 
Pergunta 2 
Em analytics, quais são os quatro tipos de análise de dados, que podemos 
encontrar? 
 
a. Descritiva, Preditiva, Prescritiva e Diagnóstica. (Correta) 
b. Descritiva, Preditiva, Essencial e Diagnóstica.c. Orientada a Objetos, Preditiva, Prescritiva e Diagnóstica. 
d. Descritiva, Preditiva, Prescritiva e Conceitual. 
e. Descritiva, Estruturada, Prescritiva e Diagnóstica. 
 
Justificativa (comentário da resposta) 
As análises de dados podem ser classificadas como: descritiva, preditiva, 
prescritiva e diagnóstica. 
 
Pergunta 3 
Qual tipo de análise de dados é considerada o 1º nível das análises de dados? 
 
a. Análise Diagnóstica 
b. Análise Descritiva (Correta) 
c. Análise Estruturada 
d. Análise Preditiva 
e. Análise Prescritiva 
 
Justificativa (comentário da resposta) 
Análise Descritiva: É considerada como o primeiro nível de análise, onde é 
possível entender o que está acontecendo no negócio atualmente. 
 
Pergunta 4 
Quanto à junção da análise preditiva e análise prescritiva, podemos afirmar 
que: 
 
I. ajuda a criar uma estratégia e tomada de decisão baseada em dados. 
II. ajuda a criar uma estratégia e tomada de decisão baseada em fatos das 
redes sociais. 
III. ajuda a criar uma estratégia e tomada de decisão baseada em 
probabilidades estatísticas. 
 
a. Somente a alternativa II está correta. 
b. Somente a alternativa I está correta. (Correta) 
c. As alternativas I e II estão corretas. 
d. Somente a alternativa III está correta. 
e. As alternativas I e III estão corretas. 
 
Justificativa (comentário da resposta) 
A análise prescritiva juntamente com a análise preditiva ajuda a criar uma 
estratégia e tomada de decisão baseada em dados. 
 
AS – Unidade V 
 
Pergunta 1 
Quais são os tipos de fontes de dados, que a ferramenta RapidMiner pode 
carregar? 
 
I. Banco de Dados 
II. Exemplos de base de dados 
III. Arquivos .TXT 
IV. Planilhas em excel 
 
a. Todas as afirmativas estão corretas. (Correta) 
b. Somente a afirmativa II é verdadeira. 
c. Somente a afirmativa IV está correta. 
 d. Somente a afirmativa I é verdadeira. 
e. Somente a afirmativa III está correta. 
 
Justificativa (comentário da resposta) 
A maioria das fontes tendem a ser bancos de dados relacionais ou outros tipos 
de arquivos como .TXT, .XLS etc. A ferramenta RapidMiner consegue trabalhar com 
todos esses tipos de fontes de dados. 
 
Pergunta 2 
Por que é necessário indicar que campo é o label na base de dados? 
 
a. A indicação do label é opcional. 
b. Para apontar que campo será a Classe de Atributo. (Correta) 
c. Para apontar que campo será a Classe de Dados. 
d. Para apontar que campo será a Classe de Objetos. 
e. Para apontar que campo será a Classe de Informações. 
 
Justificativa (comentário da resposta) 
A indicação do label serve para apontar qual campo será a classe de atributo. 
 
Pergunta 3 
Ao usar a ferramenta RapidMiner, na etapa de pré-processamento de dados, 
devemos classificar os atributos, do tipo texto, em binominal ou polinominal. Analise 
as afirmativas abaixo. 
 
I. O Atributo binominal pode ter 1,2,3,n valores diferentes. 
II. O Atributo binominal pode ter 2 valores diferentes. 
III. O Atributo binominal pode ter 1 valor diferente. 
IV. Essa classificação de atributo é opcional. 
 
a. Somente a afirmativa II está correta. (Correta) 
b. Somente a afirmativa III está correta. 
c. As afirmativas II e III estão corretas. 
d. Somente a afirmativa I está correta. 
e. Somente a afirmativa IV está correta. 
 
Justificativa (comentário da resposta) 
Um atributo binominal só pode ter 2 valores diferentes. 
 
Pergunta 4 
Quais os tipos de análises podemos realizar com a ferramenta RapidMiner? 
 
a. Orientada a Objetos, Preditiva, Prescritiva e Diagnóstica 
b. Descritiva, Preditiva, Prescritiva e Diagnóstica. (Correta) 
c. Descritiva, Preditiva, Prescritiva e Conceitual. 
d. Descritiva, Estruturada, Prescritiva e Diagnóstica. 
e. Descritiva, Preditiva, Essencial e Diagnóstica. 
 
Justificativa (comentário da resposta) 
As análises de dados podem ser classificadas como: descritiva, preditiva, 
prescritiva e Diagnóstica. Todas essas podem ser executadas usando a ferramenta 
RapidMiner.

Continue navegando