Baixe o app para aproveitar ainda mais
Prévia do material em texto
Atividades Avaliativas – Ciência de Dados – Cruzeiro do Sul (2023) AS – Unidade I Pergunta 1 I. Os modelos preditivos são aqueles que utilizam dados do passado para prever comportamentos, também detectam padrões, ainda que sutis, no conjunto de dados analisados. II. Os modelos descritivos ajudam a identificar relações. Assinale a alternativa CORRETA: a. Somente a afirmativa II é verdadeira. b. As afirmativas I e II são falsas. c. Somente a afirmativa I é verdadeira. d. A afirmativa I justifica a afirmativa II. e. As afirmativas I e II são verdadeiras. (Correta) Justificativa (comentário da resposta) Os modelos preditivos são aqueles que utilizam dados do passado para prever comportamentos de um cliente. Eles também detectam padrões, ainda que sutis, no conjunto de dados analisados. São usados, principalmente, para transações em tempo real, auxiliando na identificação de um consumidor com menos propensão a pagar, de fraudes ou de desistências do serviço. Os modelos descritivos, por sua vez, ajudam a identificar relações, sejam elas sobre os clientes ou os produtos e são aplicados, principalmente, para categorizar clientes e identificar potenciais públicos para prospecção. Pergunta 2 Qual o outro nome que podemos dar à Ciência de Dados? a. Coleção de Dados. b. Analytics. (Correta) c. Data Warehouse. d. Data Mart. e. Big Data. Justificativa (comentário da resposta) A Ciência de Dados, que também pode ser chamada de Analytics, procura criar modelos capazes de extrair padrões de sistemas complexos e usar esses modelos em aplicações reais. Estuda princípios, métodos e sistemas computacionais para extrair conhecimento de dados. Pergunta 3 O Big Data tem 5 características, os 5 Vs. Qual alternativa refere-se à Velocidade? a. Os dados de hoje vêm de várias fontes, o que torna difícil estabelecer uma relação, corresponder, limpar e transformar dados entre diferentes sistemas. No entanto, para que seus dados não saiam rapidamente de controle, é necessário ligar e correlacionar relações, hierarquias e as várias ligações de dados. b. Além da velocidade e da variedade de dados cada vez maiores, os fluxos de dados podem ser altamente inconsistentes com picos periódicos. Existe algo em tendência nas Redes Sociais? Diariamente, picos de dados sazonais ou picos gerados com base em eventos podem ser um desafio de gerenciar. Ainda mais quando falamos de dados não estruturados. c. Organizações coletam dados de uma grande variedade de fontes, incluindo transações comerciais, Redes Sociais e informações de sensores ou dados transmitidos de máquina a máquina. No passado, armazenar tamanha quantidade de informações teria sido um problema, mas novas Tecnologias (como o Hadoop) têm aliviado a carga. d. Os dados são gerados em todos os tipos de formatos, de dados estruturados, dados numéricos em Bancos de Dados tradicionais, até documentos de texto não estruturados, e-mail, vídeo, áudio, dados de cotações da bolsa e transações financeiras. e. Os dados fluem em uma velocidade sem precedentes e devem ser tratados em tempo hábil. Tags de RFID, sensores, celulares e contadores inteligentes estão impulsionado a necessidade de lidar com imensas quantidades de dados em tempo real, ou quase real. (Correta) Justificativa (comentário da resposta) Velocidade: os dados fluem em uma velocidade sem precedentes e devem ser tratados em tempo hábil. Tags de RFID, sensores, celulares e contadores inteligentes estão impulsionado a necessidade de lidar com imensas quantidades de dados em tempo real, ou quase real. Pergunta 4 O Big Data tem 5 características, os 5 Vs. Qual alternativa refere-se à Veracidade? a. Os dados de hoje vêm de várias fontes, o que torna difícil estabelecer uma relação, corresponder, limpar e transformar dados entre diferentes Sistemas. No entanto, para que seus dados não saiam rapidamente de controle, é necessário ligar e correlacionar relações, hierarquias e as várias ligações de dados. (Correta) b. Os dados fluem em uma velocidade sem precedentes e devem ser tratados em tempo hábil. Tags de RFID, sensores, celulares e contadores inteligentes estão impulsionado a necessidade de lidar com imensas quantidades de dados em tempo real, ou quase real. c. Além da velocidade e da variedade de dados cada vez maiores, os fluxos de dados podem ser altamente inconsistentes com picos periódicos. Existe algo em tendência nas Redes Sociais? Diariamente, picos de dados sazonais ou picos gerados com base em eventos podem ser um desafio de gerenciar. Ainda mais quando falamos de dados não estruturados. d. Os dados são gerados em todos os tipos de formatos, de dados estruturados, dados numéricos em Bancos de Dados tradicionais, até documentos de texto não estruturados, e-mail, vídeo, áudio, dados de cotações da bolsa e transações financeiras. e. Organizações coletam dados de uma grande variedade de fontes, incluindo transações comerciais, Redes Sociais e informações de sensores ou dados transmitidos de máquina a máquina. No passado, armazenar tamanha quantidade de informações teria sido um problema, mas novas Tecnologias (como o Hadoop) têm aliviado a carga. Justificativa (comentário da resposta) Veracidade: os dados de hoje vêm de várias fontes, o que torna difícil estabelecer uma relação, corresponder, limpar e transformar dados entre diferentes Sistemas. No entanto, para que seus dados não saiam rapidamente de controle, é necessário ligar e correlacionar relações, hierarquias e as várias ligações de dados. AS – Unidade II Pergunta 1 Qual das alternativas a seguir descreve a definição de conhecimento? a. conhecimento é o que obtemos do resultado da operação da informação com o conhecimento. b. conhecimento: é o que obtemos do resultado da operação com o dado. c. conhecimento: é o que obtemos do resultado da operação de dado com conhecimento. d. conhecimento ocorre quando utilizamos a informação para chegar a alguma conclusão, ou até mesmo, reconhecer algum tipo de comportamento/padrão. (Correta) e. conhecimento: é o menor elemento a ser armazenado. É algo que sozinho não tem sentido. Justificativa (comentário da resposta) Conhecimento: ocorre quando utilizamos a informação para chegar a alguma conclusão, ou até mesmo, para reconhecer algum tipo de comportamento/padrão. Pergunta 2 Quanto ao processo de extração, podemos dizer que: I. Ao extrair as informações de sistemas legados, muitas podem ser as fontes de dados, como, por exemplo: Banco de Dados relacionais, Sistemas Erp, Redes Sociais, vídeos, áudios, planilhas, documentos etc. II. Essa extração leva os dados para uma área de trabalho chamada de área de staging. Essa área é dedicada para que se possa trabalhar e aplicar técnicas aos dados coletados. Assinale a alternativa CORRETA: a. As afirmativas I e II estão corretas. (Correta) b. A afirmativa I é a negativa da afirmativa II. c. As afirmativas I e II estão erradas. d. Somente a afirmativa I está correta. e. Somente a afirmativa II está correta. Justificativa (comentário da resposta) E – Extração: ao extrair as informações de sistemas legados, muitas podem ser as fontes de dados, como, por exemplo: Banco de ados relacionais, Sistemas Erp, Redes Sociais, vídeos, áudios, planilhas, documentos etc. Essa extração leva os dados para uma área de trabalho chamada de área de staging. Essa área é dedicada para que se possa trabalhar e aplicar técnicas aos dados coletados. Pergunta 3 Qual das alternativas a seguir descreve a definição de dado? a. Dado: é o menor elemento a ser armazenado. É algo que sozinho não tem sentido. (Correta) b. Dado: é o que obtemos do resultado da operação da informação com o dado. c. Dado: é o que obtemos do resultado da operação com a informação. d. Dado:ocorre quando utilizamos a informação para chegar a alguma conclusão, ou até mesmo, reconhecer algum tipo de comportamento/padrão. e. Dado: é o que obtemos do resultado da operação de informação com conhecimento. Justificativa (comentário da resposta) Dado: é o menor elemento a ser armazenado. É algo que sozinho não tem sentido. Pergunta 4 Os ajustes dos dados ocorrem em qual etapa? a. Essas ações não ocorrem em nenhuma das etapas. b. Gerenciamento. c. Extração. d. Transformação. (Correta) e. Carga. Justificativa (comentário da resposta) Transformação: é nesta etapa que se realizam os devidos ajustes, podendo, assim, melhorar a qualidade dos dados e consolidar dados de duas ou mais fontes. O estágio de transformação aplica uma série de regras ou funções aos dados extraídos para ajustar os dados a serem carregados. Algumas fontes de dados necessitarão de pouca manipulação de dados. Em outros casos, podem ser necessários trabalhar algumas transformações, como, por exemplo, junção de dados provenientes de diversas fontes, seleção de apenas determinadas colunas e tradução de valores codificados (se o sistema de origem armazena 1 para sexo masculino e 2 para feminino, mas o datawarehouse armazena M para masculino e F para feminino, por exemplo). AS – Unidade III Pergunta 1 Quanto à definição de aprendizado não supervisionado, podemos afirmar que: I. Existem exemplos da saída esperada para determinados casos da base de treinamento, onde a rede, pela comparação entre os resultados obtidos e esperados, pode adaptar os pesos das conexões para minimizar o erro, obtendo um aprendizado por exemplos. II. Esse tipo de aprendizado não possui exemplos para comparar seu erro, sendo baseado na auto-organização. O indutor analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma maneira, formando agrupamentos ou clusters. Após a determinação dos agrupamentos, em geral, é necessário uma análise para determinar o que cada agrupamento significa no contexto problema sendo analisado. III. Essa abordagem de aprendizagem de máquinas tenta aprender qual é a melhor ação a ser tomada, dependendo das circunstâncias na qual essa ação será executada, ou seja, é uma aprendizagem com base na interação com o ambiente. a. As alternativas I e III estão corretas. b. Somente a alternativa I está correta. c. Somente a alternativa III está correta. d. Somente a alternativa II está correta. (correta) e. As alternativas I e II estão corretas. Justificativa (comentário da resposta) Ao contrário do supervisionado, esse tipo de aprendizado não possui exemplos para comparar seu erro, sendo baseado na auto-organização. O indutor analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma maneira, formando agrupamentos ou clusters. Após a determinação dos agrupamentos, em geral, é necessário uma análise para determinar o que cada agrupamento significa no contexto problema sendo analisado. A aprendizagem não supervisionada consegue trabalhar com dados não rotulados, ou seja, não informamos ao algoritmo o que é aquele dado de entrada. Pergunta 2 Quanto ao Aprendizado de Máquina, podemos afirmar que: I. É uma subdivisão da inteligência artificial, também conhecida como “machine learning”. II. Significa criar programas que aprendam um determinado comportamento ou padrão automaticamente a partir de exemplos ou observações. a. As afirmativas I e II estão erradas. b. Somente a afirmativa II está correta. c. A afirmativa I é a negativa da afirmativa II. d. As afirmativas I e II estão corretas. (Correta) e. Somente a afirmativa I está correta. Pergunta 3 Tarefas de classificação que precisam de exemplos de saída são realizadas por que tipo de aprendizado? a. Aprendizado não vigiado b. Aprendizado vigiado c. Aprendizado não supervisionado d. Aprendizado supervisionado (Correta) e. Aprendizado por reforço Justificativa (comentário da resposta) Exemplo de aprendizado supervisionado: Vamos pensar em um programa que usa aprendizado de máquina para classificar fotos de cavalos. Para isso, teremos dois tipos de dados de entrada para treinar o algoritmo: • Imagem: várias fotos de cavalos e outras não. • Dado Booleano (true/false): indicando se a figura é ou não de um cavalo. O treinamento acontece no momento em que o algoritmo analisa a imagem junto com a resposta, ou seja, o algoritmo faz a seguinte pergunta: essa figura é a de um cavalo? O algoritmo vai repetir essa pergunta para milhões e milhões de imagens diferentes. Até que chega a um ponto em que o algoritmo aprende quais são características que uma foto precisa apresentar para ser considerada a figura de um cavalo. Pergunta 4 Na definição de aprendizado, qual o significado das letras T, D e E? a. Titulação, Desempenho e Experiência b. Tarefa, Desempenho e Esforço c. Tarefa, Desempenho e Excelência d. Tarefa, Dinâmico e Experiência e. Tarefa, Desempenho e Experiência (Correta) Justificativa (comentário da resposta) Segundo Mitchell (1997), a tarefa de aprendizado significa: “ Melhorar na tarefa T, com respeito à métrica de desempenho D, baseado na experiência E”. AS – Unidade IV Pergunta 1 Qual o objetivo da Análise Diagnóstica? I. É possível entender o que está acontecendo no negócio atualmente. Tem como principal objetivo resumir, sumarizar e explorar o comportamento dos dados. Permite saber o que aconteceu no passado. Ela permite tomar decisões com base em estatísticas obtidas a partir de dados históricos. II. Esse tipo de análise é o mais indicado para quem precisa prever algum tipo de comportamento ou resultado. Essa técnica busca analisar dados relevantes ao longo do tempo, buscando padrões comportamentais e suas variações de acordo com cada contexto, a fim de prever como será o comportamento de seu público ou mercado no futuro, dadas as condições atuais. III. Essa análise busca trazer informações de consequências de um determinado acontecimento, fornece às empresas recomendações sobre ações ideais para atingir objetivos de negócios. IV. O foco dessa análise está na relação de causas e consequências percebidas ao longo do tempo, dentro de um determinado tema. Sendo assim, funciona baseada na coleta de dados relacionados a um determinado assunto, cruzando informações com o objetivo de entender quais fatores influenciaram o resultado atual. a. Somente a afirmativa I está correta. b. Somente a afirmativa II está correta. c. Somente a afirmativa IV está correta. (Correta) d. As afirmativas I e II estão corretas. e. Somente a afirmativa III está correta. Justificativa (comentário da resposta) Esta análise é feita após o trabalho, de coleta de dados e outros tipos de análises, serem realizados. Perguntas importantes, como “Quem fez? Quando fez? Onde fez? Por que fez?”, são fundamentais para esse tipo de análise. Seu objetivo é responder à pergunta “Por que aconteceu?”. Neste modelo o foco está na relação de causas e consequências percebidas ao longo do tempo, dentro de um determinado tema. Assim, a análise diagnóstica funciona baseada na coleta de dados relacionados a um determinado assunto, cruzando informações com o objetivo de entender quais fatores influenciaram o resultado atual. Bastante utilizado em vendas, este modelo funciona bem em conjunto com análises preditivas, servindo de base para as projeções futuras. Análises diagnósticas também são úteis para entender quais fatores devem ser ajustados em determinadas ações, a fim de obter os resultados desejados. Pergunta 2 Em analytics, quais são os quatro tipos de análise de dados, que podemos encontrar? a. Descritiva, Preditiva, Prescritiva e Diagnóstica. (Correta) b. Descritiva, Preditiva, Essencial e Diagnóstica.c. Orientada a Objetos, Preditiva, Prescritiva e Diagnóstica. d. Descritiva, Preditiva, Prescritiva e Conceitual. e. Descritiva, Estruturada, Prescritiva e Diagnóstica. Justificativa (comentário da resposta) As análises de dados podem ser classificadas como: descritiva, preditiva, prescritiva e diagnóstica. Pergunta 3 Qual tipo de análise de dados é considerada o 1º nível das análises de dados? a. Análise Diagnóstica b. Análise Descritiva (Correta) c. Análise Estruturada d. Análise Preditiva e. Análise Prescritiva Justificativa (comentário da resposta) Análise Descritiva: É considerada como o primeiro nível de análise, onde é possível entender o que está acontecendo no negócio atualmente. Pergunta 4 Quanto à junção da análise preditiva e análise prescritiva, podemos afirmar que: I. ajuda a criar uma estratégia e tomada de decisão baseada em dados. II. ajuda a criar uma estratégia e tomada de decisão baseada em fatos das redes sociais. III. ajuda a criar uma estratégia e tomada de decisão baseada em probabilidades estatísticas. a. Somente a alternativa II está correta. b. Somente a alternativa I está correta. (Correta) c. As alternativas I e II estão corretas. d. Somente a alternativa III está correta. e. As alternativas I e III estão corretas. Justificativa (comentário da resposta) A análise prescritiva juntamente com a análise preditiva ajuda a criar uma estratégia e tomada de decisão baseada em dados. AS – Unidade V Pergunta 1 Quais são os tipos de fontes de dados, que a ferramenta RapidMiner pode carregar? I. Banco de Dados II. Exemplos de base de dados III. Arquivos .TXT IV. Planilhas em excel a. Todas as afirmativas estão corretas. (Correta) b. Somente a afirmativa II é verdadeira. c. Somente a afirmativa IV está correta. d. Somente a afirmativa I é verdadeira. e. Somente a afirmativa III está correta. Justificativa (comentário da resposta) A maioria das fontes tendem a ser bancos de dados relacionais ou outros tipos de arquivos como .TXT, .XLS etc. A ferramenta RapidMiner consegue trabalhar com todos esses tipos de fontes de dados. Pergunta 2 Por que é necessário indicar que campo é o label na base de dados? a. A indicação do label é opcional. b. Para apontar que campo será a Classe de Atributo. (Correta) c. Para apontar que campo será a Classe de Dados. d. Para apontar que campo será a Classe de Objetos. e. Para apontar que campo será a Classe de Informações. Justificativa (comentário da resposta) A indicação do label serve para apontar qual campo será a classe de atributo. Pergunta 3 Ao usar a ferramenta RapidMiner, na etapa de pré-processamento de dados, devemos classificar os atributos, do tipo texto, em binominal ou polinominal. Analise as afirmativas abaixo. I. O Atributo binominal pode ter 1,2,3,n valores diferentes. II. O Atributo binominal pode ter 2 valores diferentes. III. O Atributo binominal pode ter 1 valor diferente. IV. Essa classificação de atributo é opcional. a. Somente a afirmativa II está correta. (Correta) b. Somente a afirmativa III está correta. c. As afirmativas II e III estão corretas. d. Somente a afirmativa I está correta. e. Somente a afirmativa IV está correta. Justificativa (comentário da resposta) Um atributo binominal só pode ter 2 valores diferentes. Pergunta 4 Quais os tipos de análises podemos realizar com a ferramenta RapidMiner? a. Orientada a Objetos, Preditiva, Prescritiva e Diagnóstica b. Descritiva, Preditiva, Prescritiva e Diagnóstica. (Correta) c. Descritiva, Preditiva, Prescritiva e Conceitual. d. Descritiva, Estruturada, Prescritiva e Diagnóstica. e. Descritiva, Preditiva, Essencial e Diagnóstica. Justificativa (comentário da resposta) As análises de dados podem ser classificadas como: descritiva, preditiva, prescritiva e Diagnóstica. Todas essas podem ser executadas usando a ferramenta RapidMiner.
Compartilhar