Logo Passei Direto
Buscar

Teorias Analiticas Avançadas

User badge image
Viviane Lopes

em

Ferramentas de estudo

Questões resolvidas

O que vem a ser um algoritmo de clusterização K-Means?
É um recurso computacional que oferece um ambiente completo e similar a um ambiente real para o processamento de um Big Data;
São processamentos paralelos que atingem médias de resultados para compor uma pesquisa;
São virtualizações entre sistemas operacionais, discos e outros meios físicos que auxiliam no processamento de um Big Data.
É uma técnica baseada em médias interativa e muito simples e poderosa para particionar um conjunto de dados em grupos separados, sendo este obtendo um valor incógnito determinado;
É um sistema que relaciona dois ou mais computadores para que estes trabalhem em maneira conjunta no intuito de processar uma tarefa;

Implementações RIAK são agrupamentos de nós físicos ou virtuais dispostos em pares. Qual das opções seguintes NÃO pode ser considerada uma característica do RIAK?
Índices secundários
Pesquisas
Processamento sequencial
Tolerância a falhas
Linhas em link walking

Como se identifica dados "sujos" num processo de análise em Big Data:
São dados captados em tempo real;
São dados desestruturados;
São agregações de dados de várias fontes;
São dados coletados de bases heterogêneas;
São dados imprecisos, incompletos ou errôneos que podem incluir erros de caligrafia ou sensor quebrado.

As pilhas de infraestrutura que devem ser levadas em consideração num processo de Big Data são:
Conjunto de Servidores interligados a Gigabits, Racks inteligentes e monitoráveis remotos;
Infraestrutura segregada e compartilhada e armazenamento semântico;
Sistema de Arrefecimento interno e externo, Sistema de Iluminação e refrigeração;
Infraestrutura física redundante, de segurança, Base de Dados Operacionais, Serviços de Organização de Dados e Ferramentas e Armazém de Dados Analíticos.
Datacenter, Link de acesso remoto e Storage distribuído;

Existem centenas de algoritmos para clusterização para Big Data, e muitos são utilizáveis, mas nenhum é realmente ótimo. Um destes algoritmos classifica objetos com base em exemplos de treinamento que estão mais próximos no espaço de características. Identifique o algoritmo descrito:
Shuffle
K-Means
kNN
Kernel K-Means
GMM

Um processo de Big Data requer as mesmas seguranças que outros demais processos de TI ou sistemas convencionais. Exposto isso, quais as ações que devem ser tomadas quanto a questão de segurança dessa infraestrutura?
Estabelecer segurança transversal e universal nas integrações entre os ambientes heterogêneos.
Garantir segurança quanto ao acesso aos dados, liberação total do firewall e Detecção de Incidentes;
Garantir segurança quanto ao acesso aos dados e a aplicativos, Criptografia de dados e Detecção de Ameaças;
Garantir o desempenho, estabilidade e funcionalidade do processo de coleta e gestão dos dados;
Garantir unicidade e velocidade nos processos de TI;

Em que momento as bases de dados documentacionais são úteis:
Quando há a necessidade de produzir muitos relatórios e eles precisam ser montados dinamicamente a partir de elementos que mudam com frequência;
Num processo de OLAP os registros documentacionais são relevantes para se apurar momentos de compra em tempo real;
Quando há a necessidade de explorar dados relacionais em tabelas dinâmicas;
Quando se deseja registrar a nacionalidade dos visitantes e colaboradores dos sites visitados;
Para obter dados pertinentes ao estilo de vida de um indivíduo.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

O que vem a ser um algoritmo de clusterização K-Means?
É um recurso computacional que oferece um ambiente completo e similar a um ambiente real para o processamento de um Big Data;
São processamentos paralelos que atingem médias de resultados para compor uma pesquisa;
São virtualizações entre sistemas operacionais, discos e outros meios físicos que auxiliam no processamento de um Big Data.
É uma técnica baseada em médias interativa e muito simples e poderosa para particionar um conjunto de dados em grupos separados, sendo este obtendo um valor incógnito determinado;
É um sistema que relaciona dois ou mais computadores para que estes trabalhem em maneira conjunta no intuito de processar uma tarefa;

Implementações RIAK são agrupamentos de nós físicos ou virtuais dispostos em pares. Qual das opções seguintes NÃO pode ser considerada uma característica do RIAK?
Índices secundários
Pesquisas
Processamento sequencial
Tolerância a falhas
Linhas em link walking

Como se identifica dados "sujos" num processo de análise em Big Data:
São dados captados em tempo real;
São dados desestruturados;
São agregações de dados de várias fontes;
São dados coletados de bases heterogêneas;
São dados imprecisos, incompletos ou errôneos que podem incluir erros de caligrafia ou sensor quebrado.

As pilhas de infraestrutura que devem ser levadas em consideração num processo de Big Data são:
Conjunto de Servidores interligados a Gigabits, Racks inteligentes e monitoráveis remotos;
Infraestrutura segregada e compartilhada e armazenamento semântico;
Sistema de Arrefecimento interno e externo, Sistema de Iluminação e refrigeração;
Infraestrutura física redundante, de segurança, Base de Dados Operacionais, Serviços de Organização de Dados e Ferramentas e Armazém de Dados Analíticos.
Datacenter, Link de acesso remoto e Storage distribuído;

Existem centenas de algoritmos para clusterização para Big Data, e muitos são utilizáveis, mas nenhum é realmente ótimo. Um destes algoritmos classifica objetos com base em exemplos de treinamento que estão mais próximos no espaço de características. Identifique o algoritmo descrito:
Shuffle
K-Means
kNN
Kernel K-Means
GMM

Um processo de Big Data requer as mesmas seguranças que outros demais processos de TI ou sistemas convencionais. Exposto isso, quais as ações que devem ser tomadas quanto a questão de segurança dessa infraestrutura?
Estabelecer segurança transversal e universal nas integrações entre os ambientes heterogêneos.
Garantir segurança quanto ao acesso aos dados, liberação total do firewall e Detecção de Incidentes;
Garantir segurança quanto ao acesso aos dados e a aplicativos, Criptografia de dados e Detecção de Ameaças;
Garantir o desempenho, estabilidade e funcionalidade do processo de coleta e gestão dos dados;
Garantir unicidade e velocidade nos processos de TI;

Em que momento as bases de dados documentacionais são úteis:
Quando há a necessidade de produzir muitos relatórios e eles precisam ser montados dinamicamente a partir de elementos que mudam com frequência;
Num processo de OLAP os registros documentacionais são relevantes para se apurar momentos de compra em tempo real;
Quando há a necessidade de explorar dados relacionais em tabelas dinâmicas;
Quando se deseja registrar a nacionalidade dos visitantes e colaboradores dos sites visitados;
Para obter dados pertinentes ao estilo de vida de um indivíduo.

Prévia do material em texto

Avaliação: NPG2059_AV_201905016841 » TEORIAS ANALÍTICAS AVANÇADAS
	Tipo de Avaliação: AV
	Aluno: 201905016841 - VIVIANE PEREIRA RODRIGUES LOPES
	Professor:
	DENIS GONCALVES COPLE
	Turma: 9001/AA
	Nota da Prova: 5,4    Nota de Partic.: 1   Av. Parcial 0  Data: 07/09/2019 21:13:08
	
	 1a Questão (Ref.: 201907996137)
	Pontos: 0,0  / 0,6
	Ao adotarmos um balanceamento de cargas numa configuração em cluster, estamos querendo que o comportamento do ambiente se comporte da seguinte maneira:
		
	 
	Queremos que seu funcionamento seja pleno e seu foco é obter muita performance, ou seja, não há degradação de recursos e nem perda de desempenho;
	
	As tarefas são processadas unicamente num nó deixando os demais disponíveis para as aplicações executarem suas rotinas livremente;
	 
	As tarefas são distribuídas o mais uniformemente possível entre os nós. O objetivo é fazer que cada computador receba e atenda a uma requisição e não, ou seja, que a tarefa seja dividida entre os nós.
	
	Queremos que seu funcionamento seja pleno e seu foco é obter muita disponibilidade ou seja, não é aceitável que o sistema pare de funcionar;
	
	As tarefas são processadas separadamente e depois são agrupadas num único nó;
	
	
	 2a Questão (Ref.: 201906015647)
	Pontos: 0,6  / 0,6
	Quais os tipos de clusterização mais utilizados na TI:
		
	
	Por métodos ambíguos de algoritmos.
	
	Alto armazenamento de dados, alta funcionalidade de recursos e balanceamento de memória;
	
	Por particionamento, por agrupamento e por aglutinação;
	 
	Alto desempenho, alta disponibilidade e balanceamento de carga;
	
	Por compartilhamento de recursos, por segregação de processamento e por abstração de dados;
	
	
	 3a Questão (Ref.: 201906015646)
	Pontos: 0,6  / 0,6
	O que vem a ser um algoritmo de clusterização K-Means?
		
	
	É um recurso computacional que oferece um ambiente completo e similar a um ambiente real para o processamento de um Big Data;
	
	São processamentos paralelos que atingem médias de resultados para compor uma pesquisa;
	
	São virtualizações entre sistemas operacionais, discos e outros meios físicos que auxiliam no processamento de um Big Data.
	 
	É uma técnica baseada em médias interativa e muito simples e poderosa para particionar um conjunto de dados em grupos separados, sendo este obtendo um valor incógnito determinado;
	
	É um sistema que relaciona dois ou mais computadores para que estes trabalham em maneira conjunta no intuito de processar uma tarefa;
	
	
	 4a Questão (Ref.: 201906070407)
	Pontos: 0,6  / 0,6
	Implementações RIAK são agrupamentos de nós físicos ou virtuais dispostos em pares. Qual das opções seguintes NÃO pode ser considerada uma característica do RIAK?
		
	
	Tolerância a falhas
	
	Pesquisas
	
	Linhas em link walking
	 
	Processamento sequencial
	
	Índices secundários
	
	
	 5a Questão (Ref.: 201906015630)
	Pontos: 0,6  / 0,6
	Como se identifica dados "sujos" num processo de análise em Big Data:
		
	
	São dados captados em tempo real;
	
	São dados desestruturados;
	
	São agregações de dados de várias fontes;
	
	São dados coletados de bases heterogêneas;
	 
	São dados imprecisos, incompletos ou errôneos que podem incluir erros de caligrafia ou sensor quebrado.
	
	
	 6a Questão (Ref.: 201906015604)
	Pontos: 0,6  / 0,6
	As pilhas de infraestrutura que devem ser levadas em consideração num processo de Big Data são:
		
	
	Datacenter, Link de acesso remoto e Storage distribuído;
	
	Sistema de Arrefecimento interno e externo, Sistema de Iluminação e refrigeração;
	 
	Infraestrutura física redundante, de segurança, Base de Dados Operacionais, Serviços de Organização de Dados e Ferramentas e Armazém de Dados Analíticos.
	
	Infraestrutura segregada e compartilhada e armazenamento semântico;
	
	Conjunto de Servidores interligados a Gigabits, Racks inteligentes e monitoráveis remotos;
	
	
	 7a Questão (Ref.: 201906124790)
	Pontos: 0,6  / 0,6
	Existem centenas de algoritmos para clusterização para Big Data, e muitos são utilizáveis, mas nenhum é realmente ótimo. Um destes algoritmos classifica objetos com base em exemplos de treinamento que estão mais próximos no espaço de características. Identifique o algoritmo descrito:
		
	
	GMM
	
	Shuffle
	 
	kNN
	
	Kernel K-Means
	
	K-Means
	
	
	 8a Questão (Ref.: 201906015603)
	Pontos: 0,6  / 0,6
	Um processo de Big Data requer as mesmas seguranças que outros demais processos de TI ou sistemas convencionais. Exposto isso, quais as ações que devem ser tomadas quanto a questão de segurança dessa infraestrutura?
		
	
	Garantir segurança quanto ao acesso aos dados, liberação total do firewall e Detecção de Incidentes;
	
	Garantir o desempenho, estabilidade e funcionalidade do processo de coleta e gestão dos dados;
	
	Garantir unicidade e velocidade nos processos de TI;
	
	Estabelecer segurança transversal e universal nas integrações entre os ambientes heterogêneos.
	 
	Garantir segurança quanto ao acesso aos dados e a aplicativos, Criptografia de dados e Detecção de Ameaças;
	
	
	 9a Questão (Ref.: 201906015609)
	Pontos: 0,6  / 0,6
	Em que momento as bases de dados documentacionais são úteis:
		
	 
	Quando há a necessidade de produzir muitos relatórios e eles precisam ser montados dinamicamente a partir de elementos que mudam com frequência;
	
	Num processo de OLAP os registros documentacionais são relevantes para se apurar momentos de compra em tempo real;
	
	Quando há a necessidade de explorar dados relacionais em tabelas dinâmicas;
	
	Quando se deseja registrar a nacionalidade dos visitantes e colaboradores dos sites visitados;
	
	Para obter dados pertinentes ao estilo de vida de um indivíduo.
	
	
	 10a Questão (Ref.: 201906015660)
	Pontos: 0,6  / 0,6
	Como você responderia sobre os fundamentos do HBase:
		
	
	É um sistema de arquivos baseados em pastas escalonáveis e complexas.
	
	É um sistema de gerenciamento de discos capaz de mapear pequenos volumes de mídias sociais;
	 
	É um sistema operacional de banco de dados de mapa classificado multidimensional distribuído que é executado sobre um sistema distribuído que armazena grandes volumes e fornece rápidas consultas;
	
	É um sistema operacional baseado em 64 bits com alto desempenho e disponibilidade;
	
	É um SGBD não estrutural complexo que retorna informações precisas ao processo de Big Data;

Mais conteúdos dessa disciplina