Logo Passei Direto
Buscar

Engenharia, Preparação e Visualização de dados

User badge image
Ionara Soares

em

Ferramentas de estudo

Questões resolvidas

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Prévia do material em texto

Engenharia, Preparação e Visualização de dados 
 
(ADAPTADA 2016, FGV) Considere as seguintes características de um projeto de 
banco de dados. 
 
a. O modelo de dados é conhecido e estável; 
b. A integridade dos dados é essencial para o modelo; 
c. Velocidade e escalabilidade são preponderantes. 
d. A segurança dos dados deve ser garantida. 
Considerando as informações apresentadas, avalie as afirmações a seguir. 
I - Os itens a e b justificam a utilização de modelagem não relacional, uma vez que 
estabilidade e integridade são as principais características deste tipo de modelo. 
II - De acordo com o que podemos conferir em sites, por exemplo, da Amazon, 
bancos de dados NoSQL são criados para modelos específicos e têm esquemas 
flexíveis para a criação de aplicativos modernos. Os bancos de dados NoSQL são 
reconhecidos por sua facilidade de desenvolvimento, funcionalidade e performance em 
escala. 
III - Esta categoria de banco de dados é otimizada especificamente para aplicativos 
que exigem modelos de grande volume de dados, baixa latência e flexibilidade. 
 
É correto o que se afirma em 
 Resposta correta 
II e III, apenas 
 
Um arquiteto de dados precisa decidir qual a melhor modelagem de dados 
para um projeto de Big data na empresa. Ele precisa decidir se vai usar uma 
modelagem relacional com Oracle ou noSQL com o banco MongoDB. 
Considerando os requisitos do projeto, analise as asserções a seguir e a relação 
proposta entre elas. 
I. O projeto tem como requisito a necessidade de processar grandes volumes 
de dados por meio de dados não estruturados. 
PORQUE 
II. Uma característica da modelagem de dados a ser implementada refere-se 
aos dados, que são dinâmicos e frequentemente alterados. 
A respeito dessas asserções, assinale a opção correta. 
 
Resposta correta 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. 
 
Análise Estatística de Decisão parte do pressuposto de que os indivíduos são capazes 
de expressar suas preferências básicas quando enfrentam situações de decisão 
simples. Com base nisso, a metodologia desenvolvida pela Análise de Decisão permitirá 
a resolução de problemas de decisão mais complexos, nos quais seu agente (que 
passaremos a chamar simplesmente de decisor) mantém suas preferências básicas, 
mas é incapaz de manipular intuitivamente a complexidade da situação. 
Considerando o texto apresentado, avalie as afirmações a seguir. 
I. Em projetos que envolvem inteligência artificial, técnicas de análise estatística, visa-
se selecionar dados para transformá-los de acordo com a necessidade, como, por 
exemplo, mudar o formato de data de algum dado, além de validar o modelo de 
decisão construído. 
II. Uma amostra representa uma fração do conjunto de dados da base, que possui 
todas as classes a serem estudadas. 
III. Os valores que, em estatística, caracterizam os valores médios são chamados de 
medidas de tendência central. Entre as principais medidas de tendência central, 
destacam-se a média aritmética e a regressão linear. 
É correto o que se afirma em: 
 Resposta correta 
I e II, apenas 
 
 
Considere que um modelo foi construído para classificar imagens de veículos. Este 
classificador produziu os seguintes resultados: 
 Verdadeiros Positivos (TP) = 10 imagens; 
 Verdadeiros Negativos (TN) = 20 imagens; 
 falso Negativo(FN) = 100 imagens; 
 Falso Positivo (FP) = 20 imagens. 
Utilizando essas informações, assinale a alternativa correta sobre qual a precisão 
deste modelo de classificação? 
 
Resposta correta 
0.33 
 
Em problemas de classificação, uma matriz de confusão é uma tabela que permite a 
visualização do desempenho do algoritmo. 
Considerando a frase acima, avalie as asserções a seguir e a relação proposta entre 
elas. 
I - Um algoritmo de classificação visa identificar a classe que um determinado item 
pertence. 
PORQUE 
II - Medidas estatísticas como precisão e acurácia podem ser extraídas a partir da 
análise da matriz de confusão. 
Sobre as asserções, assinale a alternativa correta. 
 
 Resposta correta 
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I. 
 
Também conhecido como KDD (knowledge-discovery in databases), a descoberta de 
conhecimento em bases de dados visa encontrar padrões em grandes volumes de 
dados e, a partir destes padrões, identificar novos conhecimentos. 
Considerando o texto apresentado, avalie as afirmações a seguir. 
I. O KDD apresenta o ciclo de vida de um projeto de Inteligência Artificial. 
II. A modelagem relacional não faz parte do KDD. 
III. A seleção de dados é a etapa onde o usuário seleciona quais dados deseja 
visualizar em um dashboard. 
É correto o que se afirma em 
 
Resposta correta 
I, apenas. 
Um banco de dados relacional armazena seus dados de acordo com a relação que eles 
estabelecem. Essa forma de armazenamento permite facilitar a compreensão do 
modelo de dados armazenado. Neste tipo de banco de dados, a estrutura de tabela é 
um conjunto não ordenado de linhas (tuplas, na terminologia acadêmica) onde os 
registros são armazenados. 
Considerando o texto apresentado, avalie as asserções a seguir e a relação proposta 
entre elas. 
I - Uma tabela relacional permite organizar registros em linhas e suas colunas 
representam cada um de seus atributos 
PORQUE 
II - O modelo relacional preza por escalabilidade dos dados. 
 Resposta correta 
A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. 
 
Redes neurais convolucionais (convolutional neural networks, CNN) se 
inspiram no funcionamento do córtex visual. Esse tipo de rede neural 
é utilizada em três cenários, sendo eles: 
 extração de características; 
 mapeamento de características; 
 subamostragem. 
Considerando as informações apresentadas, é correto afirmar que 
Resposta correta 
Redes Neurais podem ser utilizadas para processamento de dados textuais. 
 
O aprendizado de máquina é um subcampo da ciência da computação que evoluiu do 
estudo de reconhecimento de padrões e da teoria da aprendizagem computacional em 
inteligência artificial. Um subcampo da aprendizagem de máquina é o Deep Learning ou 
Redes Neurais de Aprendizagem profunda que consiste em um conjunto de arquiteturas 
para redes neurais com várias camadas. Cada camada é responsável por capturar e 
extrair determinados tipos de informações dos objetos de entrada. 
Considerando o trecho acima, avalie as asserções a seguir e a relação proposta entre 
elas. 
I - O processo de extração de características consiste em utilizar uma arquitetura de 
aprendizagem profunda para processar o conteúdo de uma imagem. 
PORQUE 
II- Uma imagem é processada pela estrutura da rede e, a cada camada do modelo, 
são realizadas transformações para identificar características específicas dessa 
imagem. 
A respeito dessas asserções, assinale a opção correta. 
 
Resposta correta 
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.

Mais conteúdos dessa disciplina