Prévia do material em texto
Engenharia, Preparação e Visualização de dados (ADAPTADA 2016, FGV) Considere as seguintes características de um projeto de banco de dados. a. O modelo de dados é conhecido e estável; b. A integridade dos dados é essencial para o modelo; c. Velocidade e escalabilidade são preponderantes. d. A segurança dos dados deve ser garantida. Considerando as informações apresentadas, avalie as afirmações a seguir. I - Os itens a e b justificam a utilização de modelagem não relacional, uma vez que estabilidade e integridade são as principais características deste tipo de modelo. II - De acordo com o que podemos conferir em sites, por exemplo, da Amazon, bancos de dados NoSQL são criados para modelos específicos e têm esquemas flexíveis para a criação de aplicativos modernos. Os bancos de dados NoSQL são reconhecidos por sua facilidade de desenvolvimento, funcionalidade e performance em escala. III - Esta categoria de banco de dados é otimizada especificamente para aplicativos que exigem modelos de grande volume de dados, baixa latência e flexibilidade. É correto o que se afirma em Resposta correta II e III, apenas Um arquiteto de dados precisa decidir qual a melhor modelagem de dados para um projeto de Big data na empresa. Ele precisa decidir se vai usar uma modelagem relacional com Oracle ou noSQL com o banco MongoDB. Considerando os requisitos do projeto, analise as asserções a seguir e a relação proposta entre elas. I. O projeto tem como requisito a necessidade de processar grandes volumes de dados por meio de dados não estruturados. PORQUE II. Uma característica da modelagem de dados a ser implementada refere-se aos dados, que são dinâmicos e frequentemente alterados. A respeito dessas asserções, assinale a opção correta. Resposta correta As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Análise Estatística de Decisão parte do pressuposto de que os indivíduos são capazes de expressar suas preferências básicas quando enfrentam situações de decisão simples. Com base nisso, a metodologia desenvolvida pela Análise de Decisão permitirá a resolução de problemas de decisão mais complexos, nos quais seu agente (que passaremos a chamar simplesmente de decisor) mantém suas preferências básicas, mas é incapaz de manipular intuitivamente a complexidade da situação. Considerando o texto apresentado, avalie as afirmações a seguir. I. Em projetos que envolvem inteligência artificial, técnicas de análise estatística, visa- se selecionar dados para transformá-los de acordo com a necessidade, como, por exemplo, mudar o formato de data de algum dado, além de validar o modelo de decisão construído. II. Uma amostra representa uma fração do conjunto de dados da base, que possui todas as classes a serem estudadas. III. Os valores que, em estatística, caracterizam os valores médios são chamados de medidas de tendência central. Entre as principais medidas de tendência central, destacam-se a média aritmética e a regressão linear. É correto o que se afirma em: Resposta correta I e II, apenas Considere que um modelo foi construído para classificar imagens de veículos. Este classificador produziu os seguintes resultados: Verdadeiros Positivos (TP) = 10 imagens; Verdadeiros Negativos (TN) = 20 imagens; falso Negativo(FN) = 100 imagens; Falso Positivo (FP) = 20 imagens. Utilizando essas informações, assinale a alternativa correta sobre qual a precisão deste modelo de classificação? Resposta correta 0.33 Em problemas de classificação, uma matriz de confusão é uma tabela que permite a visualização do desempenho do algoritmo. Considerando a frase acima, avalie as asserções a seguir e a relação proposta entre elas. I - Um algoritmo de classificação visa identificar a classe que um determinado item pertence. PORQUE II - Medidas estatísticas como precisão e acurácia podem ser extraídas a partir da análise da matriz de confusão. Sobre as asserções, assinale a alternativa correta. Resposta correta As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I. Também conhecido como KDD (knowledge-discovery in databases), a descoberta de conhecimento em bases de dados visa encontrar padrões em grandes volumes de dados e, a partir destes padrões, identificar novos conhecimentos. Considerando o texto apresentado, avalie as afirmações a seguir. I. O KDD apresenta o ciclo de vida de um projeto de Inteligência Artificial. II. A modelagem relacional não faz parte do KDD. III. A seleção de dados é a etapa onde o usuário seleciona quais dados deseja visualizar em um dashboard. É correto o que se afirma em Resposta correta I, apenas. Um banco de dados relacional armazena seus dados de acordo com a relação que eles estabelecem. Essa forma de armazenamento permite facilitar a compreensão do modelo de dados armazenado. Neste tipo de banco de dados, a estrutura de tabela é um conjunto não ordenado de linhas (tuplas, na terminologia acadêmica) onde os registros são armazenados. Considerando o texto apresentado, avalie as asserções a seguir e a relação proposta entre elas. I - Uma tabela relacional permite organizar registros em linhas e suas colunas representam cada um de seus atributos PORQUE II - O modelo relacional preza por escalabilidade dos dados. Resposta correta A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. Redes neurais convolucionais (convolutional neural networks, CNN) se inspiram no funcionamento do córtex visual. Esse tipo de rede neural é utilizada em três cenários, sendo eles: extração de características; mapeamento de características; subamostragem. Considerando as informações apresentadas, é correto afirmar que Resposta correta Redes Neurais podem ser utilizadas para processamento de dados textuais. O aprendizado de máquina é um subcampo da ciência da computação que evoluiu do estudo de reconhecimento de padrões e da teoria da aprendizagem computacional em inteligência artificial. Um subcampo da aprendizagem de máquina é o Deep Learning ou Redes Neurais de Aprendizagem profunda que consiste em um conjunto de arquiteturas para redes neurais com várias camadas. Cada camada é responsável por capturar e extrair determinados tipos de informações dos objetos de entrada. Considerando o trecho acima, avalie as asserções a seguir e a relação proposta entre elas. I - O processo de extração de características consiste em utilizar uma arquitetura de aprendizagem profunda para processar o conteúdo de uma imagem. PORQUE II- Uma imagem é processada pela estrutura da rede e, a cada camada do modelo, são realizadas transformações para identificar características específicas dessa imagem. A respeito dessas asserções, assinale a opção correta. Resposta correta As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.