teorias analiticas

2

0

2

0

Renée da Cunha Vilas Boas

30/03/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Teorias Analiticas Avançadas

85 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

O Big Data é definido como qualquer tipo de fonte de dados que possui pelo menos três características comuns. Quais são elas?
a) Vantagens, Prioridade e Disponibilidade.
x b) Volume, Velocidade e Variedade.
c) Diversidade, Granularidade e Abrangência.
d) Operacionalidade, Diversidade e Comodidade.
e) Vantagem, Velocidade e Veracidade.
Qual a diferença entre dados estruturados e dados desestruturados?
x a) Dados desestruturados são informações imprevisíveis e de difícil coleta.
b) São informações particionadas num ambiente relacional.
c) São conteúdos estigmatizados dentro de um ambiente OLTP em conjunto com um ambiente OLAP.
d) São ambientes OLAP que apoiam a decisão do negócio sem gerar tendências de mercado.
e) São tendências de distribuídas de dados heterogêneos que visam estabelecer padrões de mercado.
Como podemos definir um Big Data ?
a) É a capacidade de estabelecer modelos de dados de forma que eles sejam percebidos pelos usuários como tabelas ou mais formalmente relações.
b) É um processo de coleta, organização, análise compartilhamento e monitoramento de informações que oferecem suporte a gestão de negócios para tomadas de decisão.
c) É um conceito baseado em interfaces com o usuário que proporciona a capacidade de ter ideias sobre os dados, permitindo analisá-los em diversos ângulos.
x d) É a capacidade de administrar um volume enorme e significativo de dados de diferentes origens, na velocidade certa, dentro do prazo certo para permitir análises e reações em tempo real.
e) É uma linguagem padrão de gerenciamento de dados que interage com os principais bancos de dados baseados em modelos multidimensionais.
Como podemos definir dados desestruturados?
x a) São dados desalinhados dentro de uma base relacional.
b) São dados desindexados.
c) São dados alinhados por palavras chaves.
d) São dados cujas fontes de dados são incompatíveis com a linguagem do banco de dados.
e) São dados que não seguem um formato especifico.
Quais as camadas 0 de infraestrutura que devem ser levadas em consideração para garantir a redundância de um ambiente Big Data ?
a) Armazenagem, Extração e Carga.
b) Transformação, clusterização e servidores de alta disponibilidade.
c) Computação distribuída e virtualização.
d) Redes lógicas e switches inteligentes.
x e) Desempenho, Disponibilidade, Escalabilidade, Flexibilidade e custos.
A virtualização possui três características importantes que suportam a escalabilidade e a eficiência operacional exigidas por ambientes em Big Data . Quais são essas características?
a) Paridade, Prioridade e Eficiência de equipamento.
x b) Particionamento, Isolamento e Encapsulamento.
c) Compartilhamento, Fracionamento e Empilhamento.
d) Espelhamento, Convergência e Distribuição.
e) Armazenamento distribuído, Empilhamento contínuo e Velocidade em processamento.
Um processo de Big Data requer as mesmas seguranças que outros demais processos de TI ou sistemas convencionais. Exposto isso, quais as ações que devem ser tomadas quanto a questão de segurança dessa infraestrutura?
a) Garantir segurança quanto ao acesso aos dados, liberação total do firewall e Detecção de Incidentes.
x b) Garantir segurança quanto ao acesso aos dados e a aplicativos, Criptografia de dados e Detecção de Ameaças.
c) Garantir o desempenho, estabilidade e funcionalidade do processo de coleta e gestão dos dados.
d) Garantir unicidade e velocidade nos processos de TI.
e) Estabelecer segurança transversal e universal nas integrações entre os ambientes heterogêneos.
As pilhas de infraestrutura que devem ser levadas em consideração num processo de Big Data são:
a) Datacenter, Link de acesso remoto e Storage distribuído.
b) Sistema de Arrefecimento interno e externo, Sistema de Iluminação e refrigeração.
c) Conjunto de Servidores interligados a Gigabits , Racks inteligentes e monitoráveis remotos.
d) Infraestrutura segregada e compartilhada e armazenamento semântico.
x e) Infraestrutura física redundante, de segurança, Base de Dados Operacionais, Serviços de Organização de Dados e Ferramentas e Armazém de Dados Analíticos.
Uma base de dados que tem como característica a capacidade de lidar com “objetos” dentro de um esquema, ter condições de tratar chaves externas em outras tabelas e garantir a integridade do ambiente denomina-se:
a) Bases de dados não relacional.
b) Bases de dados Gráficas.
c) Bases de dados Espaciais.
d) Bases de dados híbridas com variações de integridade relacional.
x e) Base de Dados Relacional.
Num banco de dados documentacional existem dois tipos de bancos que avançam consideravelmente, o MongoDB e o CouchDB, ambos são similares e tem características especificas. São elas:
x a) Alto volume de gestão de conteúdo, Redes Sociais, Análise de Tempo Real e Escalabilidade.
b) Fragmentação, Cliente API, Resiliência e Linguagem de Consulta.
c) Geoserver, OpenLayers , Serviços de Sincronização e estruturação vertical.
d) Link e Link Walking .
e) Processamento paralelo, Diversidade de Interface e Consistência Eventual.
Em que momento as bases de dados documentacionais são úteis:
a) Quando se deseja registrar a nacionalidade dos visitantes e colaboradores dos sites visitados.
b) Quando há a necessidade de explorar dados relacionais em tabelas dinâmicas.
x c) Quando há a necessidade de produzir muitos relatórios e eles precisam ser montados dinamicamente a partir de elementos que mudam com frequência.
d) Num processo de OLAP os registros documentacionais são relevantes para se apurar momentos de compra em tempo real.
e) Para obter dados pertinentes ao estilo de vida de um indivíduo.
Base de dados gráficas são bases:
a) São endereçados por pastas e ponteiros.
b) São registrados numa API.
x c) Que não são possíveis seus armazenamentos em RDBMS.
d) São direcionados para vetores e ponteiros.
e) São documentacionais e registrados em RDBMS.
Quando se trata de análise, pode se considerar uma gama de tipos possíveis. Dentre elas estão as análises operacionalizadas. Como podemos defini-la?
a) Divisão e segmentação dos dados, visualização simples e monitoramento básico.
b) As análises são utilizadas para conduzir rendimento diretamente.
x c) As análises tornam-se parte do processo de negócio.
d) São análises mais complexas com modelagem preditivas e outras técnicas de combinação.
e) Análises baseadas em monetização combinadas com análises básicas.
Quais exemplos podemos citar num processo de análise avançada num Big Data :
a) Árvore de Classificação e Redes Neurais.
b) Regressão Logística e Dados de Armazenagem.
c) Processo de dados em Movimento.
x d) Modelagem Preditiva, Análise de Textos e Mineração de Dados.
e) Divisão e Segmentação.
Dentre os algoritmos típicos em mineração de dados, uma técnica estatística muito usada que produz uma fórmula que prevê uma função das variáveis independentes é denominada de:
a) Árvores de Classificação.
x b) Regressão Logística.
c) Redes Neurais.
d) Técnicas de Agrupamento em K.
e) Técnicas de Regressão em Y.
Como se identifica dados ‘sujos’ num processo de análise em Big Data :
a) São dados captados em tempo real.
b) São dados desestruturados.
c) São agregações de dados de várias fontes.
d) São dados coletados de bases heterogêneas.
x e) São dados imprecisos, incompletos ou errôneos que podem incluir erros de caligrafia ou sensor quebrado.
O que vem a ser ETL?
a) Examinar, transformar e Lidar com grandes volumes de dados num Big Data .
b) Extrair, transmitir e Ler informações de um ambiente relacional em tempo real.
x c) Extrair, Transformar e Ler (Carga) dados de vários ambientes e direcioná-los para um ambiente Big Data .
d) Explorar, transmitir e Lidar, com arquivos externos e desestruturados para integrar num Big Data .
e) Examinar, traduzir e Localizar arquivos armazenados em bases de dados heterogêneas.
x a) Definindo problemas, preparando dados, explorando dados, criando modelos, explorando e validando modelos e. Implementando e atualizando dados.
b) Definindo entidade-relacionamento,estabelecendo hierarquia de extração, criando objetos e estruturando filtros de pesquisa.
c) Estabelecendo regras de segmentação, explorando modelos hierárquicos, criando modelos e objetos relacionais e estruturando pesquisas ad-hoc.
d) Criando objetos estruturais na sua forma multidimensional, entendo a problemática e realizando as ligações e relações e estabelecendo regras de extração.
e) Montar pesquisas e filtros de extração de dados.
Como podemos definir uma plataforma de transmissão de dados num processo de Big Data ?
a) É uma plataforma de computação semântica que está focada em velocidade.
x b) É uma plataforma de computação analítica que está focada em velocidade.
A criação de um modelo de mineração representa apenas uma parte de um processo maior que inclui desde perguntas sobre dados e criação de um
modelo até respostas para as perguntas feitas a implantação do modelo em um ambiente de trabalho. Esse processo pode ser definido usando as seis
etapas básicas. Quais são:
c) É uma plataforma de computação analítica que está focada em veracidade.
d) É uma plataforma de computação semântica que está focada em veracidade.
e) É uma plataforma de computação analítica sem nenhum requisito a mais.
Numa integração dos dados, a informação precisa ser entregue ao negócio de uma maneira confiável, controlada, consistente e flexível para toda a empresa independentemente das exigências para os sistemas e aplicativos individuais. Para atingir a esses objetivos aplicamos três princípios básicos:
a) Estabelecer métricas de processamento; apurar variáveis estratégicas e integrar dados relacionais.
x b) Criar entendimento comum as definições de dados; desenvolver um conjunto de serviços para qualifica-os e torna-los consistentes e Integrar de uma maneira racional suas fontes de dados.
c) Montar mapas de pesquisa; criar chaves padrões de ligação e relação de dados.
d) Montar regras de negócios complexas com filtros personalizados para obtenção de resultados qualificados.
e) Estabelecer métricas, entender a demanda do negócio e estabelecer critérios de busca.
O que vem a ser um algoritmo de clusterização K-Means?
a) É um sistema que relaciona dois ou mais computadores para que estes trabalham em maneira conjunta no intuito de processar uma tarefa.
x b) É uma técnica baseada em médias interativa e muito simples e poderosa para particionar um conjunto de dados em grupos separados, sendo este obtendo um valor incógnito determinado.
c) É um recurso computacional que oferece um ambiente completo e similar a um ambiente real para o processamento de um Big Data .
d) São processamentos paralelos que atingem médias de resultados para compor uma pesquisa.
e) São virtualizações entre sistemas operacionais, discos e outros meios físicos que auxiliam no processamento de um Big Data .
Quais os tipos de clusterização mais utilizados na TI:
a) Por particionamento, por agrupamento e por aglutinação.
b) Por compartilhamento de recursos, por segregação de processamento e por abstração de dados.
c) Alto armazenamento de dados, alta funcionalidade de recursos e balanceamento de memória.
x d) Alto desempenho, alta disponibilidade e balanceamento de carga.
e) Por métodos ambíguos de algoritmos.
O que consiste em estender ou substituir uma interface, existente por um outro de modo a imitar um comportamento?
a) Clusterização.
x b) Virtualização.
c) Abstração.
d) Concatenação de recursos.
e) Espelhamento de ambientes.
Ao adotarmos um balanceamento de cargas numa configuração em cluster, estamos querendo que o comportamento do ambiente se comporte da seguinte maneira:
a) Queremos que seu funcionamento seja pleno e seu foco é obter muita disponibilidade ou seja, não é aceitável que o sistema pare de funcionar.
x b) Queremos que seu funcionamento seja pleno e seu foco é obter muita performance, ou seja, não há degradação de recursos e nem perda de desempenho.
c) As tarefas são processadas unicamente num nó deixando os demais disponíveis para as aplicações executarem suas rotinas livremente.
d) As tarefas são processadas separadamente e depois são agrupadas num único nó.
e) As tarefas são distribuídas o mais uniformemente possível entre os nós. O objetivo é fazer que cada computador receba e atenda a uma requisição e não, ou seja, que a tarefa seja dividida entre os nós.
Qual a principal função da administração YARN?
a) Partilha os dados para as funções Map e Reduce e gerencia as falhas para os nós mais disponíveis.
b) Responsável pelo controle de acesso, organização dos diretórios e metadados.
c) Sistema tolerante a falhas, com grande confiabilidade e alta escalabilidade.
x d) Um único nó é responsável por reordenar os nós no caso de falhas dos nós escravos.
e) Facilita o incremento de novos nós dentro da infraestrutura.
Como você responderia sobre os fundamentos do HBase:
a) É um sistema de gerenciamento de discos capaz de mapear pequenos volumes de mídias sociais.
b) É um SGBD não estrutural complexo que retorna informações precisas ao processo de Big Data .
c) É um sistema operacional baseado em 64 bits com alto desempenho e disponibilidade.
x d) É um sistema operacional de banco de dados de mapa classificado multidimensional distribuído que é executado sobre um sistema distribuído que armazena grandes volumes e fornece rápidas consultas.
e) É um sistema de arquivos baseados em pastas escalonáveis e complexas.
Como o HBase armazena os registros?
a) Em tipos e em colunas.
x b) Em bytes e famílias de colunas.
c) Em blobs e diretórios.
d) Em bytes e famílias de colunas.
e) Em blobs e bytes .
Qual a finalidade principal da mineração HIVE?
a) Integrar as bases heterogêneas.
b) Criar ligações entre os demais ambientes.
c) Extrair e transformar os dados.
x d) Analisar os dados.
e) Minerar os filtros e metadados.
O que você entendeu sobre internet das coisas?
a) São qualquer coisa que se plug na tomada para acessar a internet.
b) São qualquer computador que se pode acessar a internet.
c) São qualquer dispositivo que possa receber dados da internet tais como: tables , pen drive entre outros.
d) São automóveis dotados de mecanismos eletrônicos capazes de operar independentemente da interferência humana.
x e) São qualquer coisa (equipamentos eletrônicos, sapatos, carros entre outros) dotados de mecanismos eletrônicos capazes de se conectar à internet a fim de trocar, registrar e divulgar informações.
O conceito em Big Data , que coloca os dados no centro de uma arquitetura na qual é compartilhada, eliminando silos e redundâncias de informações é denominado de:
a) Log de Arquivos, Archive Log , em Inglês.
b) Dados Truncados, Truncate Date , em Inglês.
c) Repositório de dados.
x d) Lago de Dados, Data Lake em Inglês.
e) Mix de Dados, Data Mix em Inglês.
Como os dados armazenados nas mídias sociais podem contribuir com os negócios?
a) Estabelecer mecanismos de compartilhamento de perfis.
x b) Dados informados como gostos, estilos de vida ou mudanças de comportamentos podem ser relevantes para que as empresas possam oferecer seus produtos e traçar tendências.
c) Saber da vida aleia e divulgar para o mundo digital.
d) Converter essas informações em números estatísticos sem nenhum objetivo aparente.
e) Coletar dados para mensurar o tamanho das bases de dados dentro de um longo prazo.
Qual a real diferença entre um processo de Big Data e um BI?
a) BI é um mecanismo de Data Warehouse que une várias informações num único lugar enquanto que Big Data , são grandes volumes de dados centralizados num único lugar.
b) BI é um mecanismo de coleta de dados homogêneo que permite a tomada de decisão enquanto que o Big Data são mecanismo de coleta de dados heterogêneos.
x c) BI é um mecanismo de TI que permite traçar resultados para a tomada de decisão, enquanto que Big Data é um mecanismo que além de permitir a tomada de decisão oferece sugestões, tendências e padrões nos quais podem sofrer mudança dinamicamente.
d) BI é um mecanismo de TI que permite seconectar ao mundo exterior através da interner para coletar dados irrelevantes para a corporação enquanto que o Big Data se conecta a internet para obter dados relevantes.
e) BI é um mecanismo de busca que pesquisa dada na internet enquanto que o Big Data busca esses dados dentro da corporação, sistemas operacionais e banco de dados.
Um processo de Big Data requer as mesmas seguranças que outros demais processos de TI ou sistemas convencionais. Exposto isso, quais as ações que devem ser tomadas quanto a questão de segurança dessa infraestrutura?
Uma base de dados que tem como característica a capacidade de lidar com “objetos” dentro de um esquema, ter condições de tratar chaves externas em outras tabelas e garantir a integridade do ambiente denomina-se:
Dentre os algoritmos típicos em mineração de dados, uma técnica estatística muito usada que produz uma fórmula que prevê uma função das variáveis independentes é denominada de:
e) São dados imprecisos, incompletos ou errôneos que podem incluir erros de caligrafia ou sensor quebrado.
c) Extrair, Transformar e Ler (Carga) dados de vários ambientes e direcioná-los para um ambiente Big Data .
a) Definindo problemas, preparando dados, explorando dados, criando modelos, explorando e validando modelos e. Implementando e atualizando dados.
b) Definindo entidade-relacionamento, estabelecendo hierarquia de extração, criando objetos e estruturando filtros de pesquisa.
c) Estabelecendo regras de segmentação, explorando modelos hierárquicos, criando modelos e objetos relacionais e estruturando pesquisas ad-hoc.
d) Criando objetos estruturais na sua forma multidimensional, entendo a problemática e realizando as ligações e relações e estabelecendo regras de extração.
A criação de um modelo de mineração representa apenas uma parte de um processo maior que inclui desde perguntas sobre dados e criação de um
modelo até respostas para as perguntas feitas a implantação do modelo em um ambiente de trabalho. Esse processo pode ser definido usando as seis
etapas básicas. Quais são:
Numa integração dos dados, a informação precisa ser entregue ao negócio de uma maneira confiável, controlada, consistente e flexível para toda a empresa independentemente das exigências para os sistemas e aplicativos individuais. Para atingir a esses objetivos aplicamos três princípios básicos:
c) BI é um mecanismo de TI que permite traçar resultados para a tomada de decisão, enquanto que Big Data é um mecanismo que além de permitir a tomada de decisão oferece sugestões, tendências e padrões nos quais podem sofrer mudança dinamicamente.
d) BI é um mecanismo de TI que permite se conectar ao mundo exterior através da interner para coletar dados irrelevantes para a corporação enquanto que o Big Data se conecta a internet para obter dados relevantes.
Numa integração dos dados, a informação precisa ser entregue ao negócio de uma maneira confiável, controlada, consistente e flexível para toda a empresa independentemente das exigências para os sistemas e aplicativos individuais. Para atingir a esses objetivos aplicamos três princípios básicos: