Baixe o app para aproveitar ainda mais
Prévia do material em texto
TESTE 01 Pergunta 1 Qual o outro nome que podemos dar à Ciência de Dados? Respostas: e. Analytics. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A Ciência de Dados, que também pode ser chamada de Analytics, procura criar modelos capazes de extrair padrões de sistemas complexos e usar esses modelos em aplicações reais. Estuda princípios, métodos e sistemas computacionais para extrair conhecimento de dados. Pergunta 2 O Big Data tem 5 características, os 5 Vs. Qual alternativa refere-se ao Volume? Respostas: a. Organizações coletam dados de uma grande variedade de fontes, incluindo transações comerciais, Redes Sociais e informações de sensores ou dados transmitidos de máquina a máquina. No passado, armazenar tamanha quantidade de informações teria sido um problema, mas novas Tecnologias (como o Hadoop) têm aliviado a carga. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. • Volume: Organizações coletam dados de uma grande variedade de fontes, incluindo transações comerciais, Redes Sociais e informações de sensores ou dados transmitidos de máquina a máquina. No passado, armazenar tamanha quantidade de informações teria sido um problema, mas novas tecnologias (como o Hadoop) têm aliviado a carga. Pergunta 3 O Big Data tem 5 características, os 5 Vs. Qual alternativa refere-se à Variabilidade? Respostas: c. Além da velocidade e da variedade de dados cada vez maiores, os fluxos de dados podem ser altamente inconsistentes com picos periódicos. Existe algo em tendência nas Redes Sociais? Diariamente, picos de dados sazonais ou picos gerados com base em eventos podem ser um desafio de gerenciar. Ainda mais quando falamos de dados não estruturados. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Variabilidade: Além da velocidade e da variedade de dados cada vez maiores, os fluxos de dados podem ser altamente inconsistentes com picos periódicos. Existe algo em tendência nas Redes Sociais? Diariamente, picos de dados sazonais ou picos gerados com base em eventos podem ser um desafio de gerenciar. Ainda mais quando falamos de dados não estruturados. Pergunta 4 Para que servem os modelos preditivos? Respostas: d. Para identificar padrões e mostrar o que pode acontecer de acordo com os dados analisados. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Os modelos preditivos, em geral, servem para identificar padrões e mostrar o que pode acontecer de acordo com os dados analisados. TESTE 02 Pergunta 1 A Staging Area I é necessária em qual etapa? Respostas: b. Extração. Pergunta 2 Qual das alternativas a seguir descreve a definição de dado? Respostas: a. Dado: é o menor elemento a ser armazenado. É algo que sozinho não tem sentido. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Dado: é o menor elemento a ser armazenado. É algo que sozinho não tem sentido. Pergunta 3 Qual das alternativas a seguir descreve a definição de conhecimento? Respostas: c. conhecimento ocorre quando utilizamos a informação para chegar a alguma conclusão, ou até mesmo, reconhecer algum tipo de comportamento/padrão. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Conhecimento: ocorre quando utilizamos a informação para chegar a alguma conclusão, ou até mesmo, para reconhecer algum tipo de comportamento/padrão. Pergunta 4 Qual é a infraestrutura recomendada para armazenar dados em constante crescimento? Respostas: a. Nuvem pública. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A computação em nuvem é a grande ferramenta para armazenamento de dados, pois as nuvens públicas, têm um alto poder de suportar volumes de dados enormes e as características de elasticidade que as nuvens permitem, quando necessário, é possível acionar servidores extras para atender a demanda de crescimento do momento. Pergunta 5 Qual das alternativas a seguir descreve a definição de informação? Respostas: b. Informação: é o que obtemos do resultado da operação com o dado. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Informação: é o que obtemos do resultado da operação com o dado. Pergunta 6 Depois que os dados passam pela Transformação, qual é a etapa sucessora? Respostas: d. Carga. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A etapa de carga ocorre em sequência à de transformação. Pergunta 7 Quais podem ser as fontes que um ETL precisa acessar? I. Banco de Dados. II. Arquivos .TXT. III. Redes Sociais. IV. Planilhas. Assinale a alternativa CORRETA: Respostas: e. Todas as afirmativas estão corretas. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A maioria dessas fontes tendem a ser Bancos de Dados relacionais ou outros tipos de arquivos, mas podem existir outros tipos de fontes também. Um sistema ETL precisa ser capaz de se comunicar com bases de dados e ler diversos formatos de arquivos utilizados por toda a Organização. Pergunta 8 Qual das alternativas a seguir descreve a definição de dado? Respostas: b. Dado: é o menor elemento a ser armazenado. É algo que sozinho não tem sentido. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Dado: é o menor elemento a ser armazenado. É algo que sozinho não tem sentido. Pergunta 9 Em qual etapa do processo de ETL ocorrem as ações de limpar, modificar e corrigir a informação? Respostas: b. Transformação. TESTE 03 Pergunta 1 Quanto à definição de aprendizado supervisionado, podemos afirmar que: I. Existem exemplos da saída esperada para determinados casos da base de treinamento, onde a rede, pela comparação entre os resultados obtidos e esperados, pode adaptar os pesos das conexões para minimizar o erro, obtendo um aprendizado por exemplos. II. Esse tipo de aprendizado não possui exemplos para comparar seu erro, sendo baseado na auto-organização. O indutor analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma maneira, formando agrupamentos ou clusters. Após a determinação dos agrupamentos, em geral, é necessário uma análise para determinar o que cada agrupamento significa no contexto problema sendo analisado. III. Essa abordagem de aprendizagem de máquinas tenta aprender qual é a melhor ação a ser tomada, dependendo das circunstâncias na qual essa ação será executada, ou seja, é uma aprendizagem com base na interação com o ambiente. Respostas: c. Somente a alternativa I está correta. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Como o próprio nome sugere, existem exemplos da saída esperada para determinados casos da base de treinamento, onde a rede, pela comparação entre os resultados obtidos e esperados, pode adaptar ospesos das conexões para minimizar o erro, obtendo um aprendizado por exemplos. O algoritmo de aprendizado (indutor) recebe um conjunto de exemplos de treinamento para os quais os rótulos da classe associada são conhecidos. Cada exemplo (instância ou padrão) é descrito por um vetor de valores (atributos) e pelo rótulo da classe associada. O objetivo do indutor é construir um classificador que possa determinar corretamente a classe de novos exemplos ainda não rotulados. Pergunta 2 Quais afirmativas podemos fazer na relação de mineraçao de dados com machine learning? I. Tanto a mineração de dados quanto o aprendizado de máquinas utilizam-se de muitos métodos da área de estatística. II. Quando essas duas áreas juntam-se, conseguimos atingir os objetivos de aprender e gerar hipóteses automaticamente a partir de grandes volumes de dados. Respostas: d. As afirmativas I e II estão corretas. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Tanto a mineração de dados quanto o aprendizado de máquinas utilizam-se de muitos métodos da área de estatística. Então, quando essas duas áreas juntam-se, conseguimos atingir os objetivos de aprender e gerar hipóteses automaticamente a partir de grandes volumes de dados. Pergunta 3 Na definição de aprendizado, qual o significado das letras T, D e E? Respostas: c. Tarefa, Desempenho e Experiência Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Segundo Mitchell (1997), a tarefa de aprendizado significa: “ Melhorar na tarefa T, com respeito à métrica de desempenho D, baseado na experiência E”. Pergunta 4 Tarefas de classificação que precisam de exemplos de saída são realizadas por que tipo de aprendizado? Respostas: b. Aprendizado supervisionado Comentário Justificativa (comentário da resposta) da resposta: Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Exemplo de aprendizado supervisionado: Vamos pensar em um programa que usa aprendizado de máquina para classificar fotos de cavalos. Para isso, teremos dois tipos de dados de entrada para treinar o algoritmo: • Imagem: várias fotos de cavalos e outras não. • Dado Booleano (true/false): indicando se a figura é ou não de um cavalo. O treinamento acontece no momento em que o algoritmo analisa a imagem junto com a resposta, ou seja, o algoritmo faz a seguinte pergunta: essa figura é a de um cavalo? O algoritmo vai repetir essa pergunta para milhões e milhões de imagens diferentes. Até que chega a um ponto em que o algoritmo aprende quais são características que uma foto precisa apresentar para ser considerada a figura de um cavalo. Pergunta 5 Quais afirmativas podemos fazer na relação de mineraçao de dados com machine learning? I. Tanto a mineração de dados quanto o aprendizado de máquinas utilizam-se de muitos métodos da área de estatística. II. Quando essas duas áreas juntam-se, conseguimos atingir os objetivos de aprender e gerar hipóteses automaticamente a partir de grandes volumes de dados. Respostas: d. As afirmativas I e II estão corretas. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Tanto a mineração de dados quanto o aprendizado de máquinas utilizam-se de muitos métodos da área de estatística. Então, quando essas duas áreas juntam-se, conseguimos atingir os objetivos de aprender e gerar hipóteses automaticamente a partir de grandes volumes de dados. Pergunta 6 Quanto à definição de aprendizado não supervisionado, podemos afirmar que: I. Existem exemplos da saída esperada para determinados casos da base de treinamento, onde a rede, pela comparação entre os resultados obtidos e esperados, pode adaptar os pesos das conexões para minimizar o erro, obtendo um aprendizado por exemplos. II. Esse tipo de aprendizado não possui exemplos para comparar seu erro, sendo baseado na auto-organização. O indutor analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma maneira, formando agrupamentos ou clusters. Após a determinação dos agrupamentos, em geral, é necessário uma análise para determinar o que cada agrupamento significa no contexto problema sendo analisado. III. Essa abordagem de aprendizagem de máquinas tenta aprender qual é a melhor ação a ser tomada, dependendo das circunstâncias na qual essa ação será executada, ou seja, é uma aprendizagem com base na interação com o ambiente. Respostas: b. Somente a alternativa II está correta. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Ao contrário do supervisionado, esse tipo de aprendizado não possui exemplos para comparar seu erro, sendo baseado na auto-organização. O indutor analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma maneira, formando agrupamentos ou clusters. Após a determinação dos agrupamentos, em geral, é necessário uma análise para determinar o que cada agrupamento significa no contexto problema sendo analisado. A aprendizagem não supervisionada consegue trabalhar com dados não rotulados, ou seja, não informamos ao algoritmo o que é aquele dado de entrada. TESTE 04 Pergunta 1 Qual tipo de análise de dados é considerada o 1º nível das análises de dados? Respostas: c. Análise Descritiva Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Análise Descritiva É considerada como o primeiro nível de análise, onde é possível entender o que está acontecendo no negócio atualmente. Pergunta 2 Em analytics, quais são os quatro tipos de análise de dados, que podemos encontrar? Respostas: d. Descritiva, Preditiva, Prescritiva e Diagnóstica. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. As análises de dados podem ser classificadas como: descritiva, preditiva, prescritiva e diagnóstica. Pergunta 3 Quanto à junção da análise preditiva e análise prescritiva, podemos afirmar que: I. ajuda a criar uma estratégia e tomada de decisão baseada em dados. II. ajuda a criar uma estratégia e tomada de decisão baseada em fatos das redes sociais. III. ajuda a criar uma estratégia e tomada de decisão baseada em probabilidades estatísticas. Respostas: b. Somente a alternativa I está correta. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A análise prescritiva juntamente com a análise preditiva ajuda a criar uma estratégia e tomada de decisão baseada em dados. Pergunta 4 Qual o objetivo da Análise Preditiva? I. É possível entender o que está acontecendo no negócio atualmente. Tem como principal objetivo resumir, sumarizar e explorar o comportamento dos dados. Permite saber o que aconteceu no passado. Ela permite tomar decisões com base em estatísticas obtidas a partir de dados históricos. II. Esse tipo de análise é o mais indicado para quem precisa prever algum tipo de comportamento ou resultado. Essa técnica busca analisar dados relevantes ao longo do tempo, buscando padrões comportamentais e suas variações de acordo com cada contexto, a fim de prever como será o comportamento de seu público ou mercado no futuro, dadas as condições atuais. III. Essa análise busca trazer informações de consequências de um determinado acontecimento, fornece às empresas recomendações sobre ações ideaispara atingir objetivos de negócios. IV. O foco dessa análise está na relação de causas e consequências percebidas ao longo do tempo, dentro de um determinado tema. Sendo assim, funciona baseada na coleta de dados relacionados a um determinado assunto, cruzando informações com o objetivo de entender quais fatores influenciaram o resultado atual. Respostas: d. Somente a afirmativa II está correta. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Este tipo de análise é o mais indicado para quem precisa prever algum tipo de comportamento ou resultado. Esta técnica busca analisar dados relevantes ao longo do tempo, buscando padrões comportamentais e suas variações de acordo com cada contexto, a fim de prever como será o comportamento de seu público ou mercado no futuro, dadas as condições atuais. Muito útil para avaliar tendências de consumo e flutuações econômicas. A análise preditiva é o uso de dados, algoritmos estatísticos e técnicas de machine learning para identificar a probabilidade de resultados futuros com base em dados históricos. TESTE 05 Pergunta 1 Por que é necessário indicar que campo é o label na base de dados? Respostas: a. Para apontar que campo será a Classe de Atributo. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A indicação do label serve para apontar qual campo será a classe de atributo. Pergunta 2 Quais são os tipos de fontes de dados, que a ferramenta RapidMiner pode carregar? I. Banco de Dados II. Exemplos de base de dados III. Arquivos .TXT IV. Planilhas em Excel Respostas: b. Todas as afirmativas estão corretas. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A maioria das fontes tendem a ser bancos de dados relacionais ou outros tipos de arquivos como .TXT, .XLS etc. A ferramenta RapidMiner consegue trabalhar com todos esses tipos de fontes de dados. Pergunta 3 Ao usar a ferramenta RapidMiner, na etapa de pré-processamento de dados, devemos classificar os atributos, do tipo texto, em binominal ou polinominal. Analise as afirmativas abaixo. I. O Atributo polinominal pode ter 1,2,3,n valores diferentes. II. O Atributo polinominal pode ter 2 valores diferentes. III. O Atributo polinominal pode ter 1 valor diferente. IV. Essa classificação de atributo é opcional. Respostas: a. Somente a afirmativa I está correta. Comentário da resposta: Dica: É possível retirar fragmentos do material estudado para comentar a resposta. Um atributo polinominal pode ter n valores diferentes. Pergunta 4 Quais os tipos de análises podemos realizar com a ferramenta RapidMiner? Respostas: b. Descritiva, Preditiva, Prescritiva e Diagnóstica. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. As análises de dados podem ser classificadas como: descritiva, preditiva, prescritiva e Diagnóstica. Todas essas podem ser executadas usando a ferramenta RapidMiner. Pergunta 5 Das atividades relacionadas abaixo, podemos usar a ferramentaRapidMiner, para realizar qual tarefa? Respostas: c. Fazer coleta de dados. Pergunta 6 Por que é necessário indicar que campo é o label na base de dados? Respostas: c. Para apontar que campo será a Classe de Atributo. Pergunta 7 Quais são os tipos de fontes de dados, que a ferramenta RapidMiner pode carregar? I. Banco de Dados II. Exemplos de base de dados III. Arquivos .TXT IV. Planilhas em Excel Respostas: b. Todas as afirmativas estão corretas. Comentário da resposta: Justificativa (comentário da resposta) Dica: É possível retirar fragmentos do material estudado para comentar a resposta. A maioria das fontes tendem a ser bancos de dados relacionais ou outros tipos de arquivos como .TXT, .XLS etc. A ferramenta RapidMiner consegue trabalhar com todos esses tipos de fontes de dados. Pergunta 8 Quais os tipos de análises podemos realizar com a ferramenta RapidMiner? Respostas: a. Descritiva, Preditiva, Prescritiva e Diagnóstica.
Compartilhar