Logo Passei Direto
Buscar

Outros

Outros
Leia o texto a seguir:

Big Data é um conjunto de estratégias e ferramentas para processamento rápido de grandes volumes de dados para geração de inteligência para tomada de decisão. Grande parte do sucesso vem da essência de Big Data derivada de seus 5 Vs.

Considerando o texto, avalie as afirmações sobre os 5 Vs abaixo:
I. Volume é um dos Vs que representa a quantidade de dados que precisam ser processados.
II. Valor não é um dos Vs, pois dados sem processamento ainda não agregam valor à empresa.
III. Velocidade é um dos Vs e representa a importância de os dados representarem a realidade.
IV. Variedade é um dos Vs e representa a quantidade de formatos de dados que são processados.

É correto o que se afirma em:
III, apenas.
I, apenas.
IV, apenas.
I e II, apenas.
User badge image
CuriosidadesGerais

há 6 meses

Respostas

User badge image

Ed Verified user icon

há 6 meses

Vamos analisar cada uma das afirmações sobre os 5 Vs do Big Data: I. Volume é um dos Vs que representa a quantidade de dados que precisam ser processados. Verdadeiro, essa afirmação está correta. II. Valor não é um dos Vs, pois dados sem processamento ainda não agregam valor à empresa. Falso, o "Valor" é um dos 5 Vs do Big Data, pois se refere à importância dos dados processados para a tomada de decisão e geração de insights. III. Velocidade é um dos Vs e representa a importância de os dados representarem a realidade. Falso, a "Velocidade" se refere à rapidez com que os dados são gerados e processados, não à representação da realidade. IV. Variedade é um dos Vs e representa a quantidade de formatos de dados que são processados. Verdadeiro, essa afirmação está correta. Com base nas análises: - A afirmação I é verdadeira. - A afirmação II é falsa. - A afirmação III é falsa. - A afirmação IV é verdadeira. Portanto, as afirmações corretas são I e IV. No entanto, a alternativa que contém apenas uma afirmação correta é: I, apenas. Assim, a resposta correta é: I, apenas.

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Leia o texto abaixo:

Árvore de decisão é uma das técnicas mais populares de mineração de dados. Mais comumente usada para resolver a tarefa de classificação de dados, a árvore de decisão consiste em uma coleção de nós internos e nós folhas, organizados em um modelo hierárquico (da mesma forma que se organizam as estruturas de dados do tipo árvore). No contexto da resolução da tarefa de classificação, uma árvore de decisão representa o modelo capaz de guiar a tomada de decisão sobre a determinação da classe à qual um exemplar pertence.

A figura abaixo traz um exemplo de um modelo classificador hipotético, na forma de uma árvore de decisão, para escolha de pratos em um restaurante.


A imagem mostra uma árvore de decisão para escolha de pratos em um restaurante. A árvore começa com um nó raiz rotulado como 'Temperatura', que se divide em dois ramos: 'baixa' e 'alta'. Cada ramo leva a um nó rotulado como 'Refeição', que se divide em 'almoço' e 'jantar'. Os nós folhas indicam o tipo de prato: 'Prato quente' ou 'Prato frio'.


Fonte: SILVA, L. A. Introdução à mineração de dados: com aplicações em R. Rio de Janeiro: Elsevier, 2016.

Considerando as informações apresentadas, assinale a opção correta.
A construção da árvore é realizada por meio de um algoritmo que não precisa analisar os atributos descritivo conjunto de dados previamente rotulado, consistindo apenas no processo de aprendizado do modelo classif
Os nós internos da árvore (tipo de prato) dizem respeito a atributos prescritivos de uma ocasião em que alguém está no restaurante para realizar uma refeição.
Segundo o modelo representado pela árvore, se a ocasião se refere à temperatura alta e à hora do jantar, deve-se optar por um prato frio.
A árvore de decisão está classificando as ocasiões em: apropriadas para consumo de pratos no jantar ou inapropriadas para consumo de pratos no jantar.
Cada nó folha (temperatura) representa uma decisão sugerida pelo modelo classificador para a ocasião, sugestão esta, presente no atributo rótulo do conjunto de dados usado para induzir o modelo.

Leia o texto a seguir: A governança de dados é a gestão do ciclo de vida dos dados dentro de uma empresa ou instituição. Na era em que dados são o novo tesouro e é até regulamentado por leis, este departamento está cada vez mais em alta e presente nas principais empresas do planeta.
Qual alternativa indica a ordem correta dos níveis funcionais dentro da Governança de Dados?
Nível de Suporte – Nível Operacional – Nível Tático – Nível Estratégico – Nível Executivo.
Nível Estratégico – Nível de Suporte – Nível Operacional – Nível Tático – Nível Executivo.
Nível de Suporte – Nível Operacional – Nível Executivo – Nível Tático – Nível Estratégico.
Nível Operacional – Nível de Suporte – Nível Tático – Nível Estratégico – Nível Executivo.
Nível Tático – Nível de Suporte – Nível Operacional –Nível Estratégico – Nível Executivo.

Leia o texto a seguir:

Tradeoffs são trocas em que se abre mão de uma característica de bancos de dados para se fortificar ou possibilitar a existência de outras. Os teoremas CAP e sua evolução, o PACELC representam características de bancos de dados distribuídos que devem ser escolhidas de acordo com as necessidades de cada projeto.

Seu atual projeto precisa de três bancos de dados. Um que seja rápido e sempre disponível para processamento de dados não críticos, outro seguro para processamento de dados críticos que podem ser perdidos ou corrompidos de forma alguma e um terceiro que funcione em sistema distribuído sem interrupções em caso de quebra de comunicação.

Considerando o texto acima, assinale a opção correta:
O primeiro sistema pode ser um AP, pois é disponível (available) e tolerante a partições (partition tolerant). O segundo sistema pode ser CP, pois é consistente e tolerante a partições. Finalmente, o terceiro sistema pode ser AP, pois é disponível (available) e tolerante a partições (partition tolerant).
Todos os sistemas devem ser CP, pois serão consistentes e tolerantes a partições.
O primeiro sistema pode ser um RP, pois é rápido e disponível (available) e tolerante a partições (partition tolerant). O segundo sistema pode ser AP, pois é consistente e tolerante a partições. Finalmente, o terceiro sistema pode ser DP, pois é disponível e tolerante a partições (partition tolerant).
O primeiro sistema pode ser um CP, pois é disponível (available) e tolerante a partições (partition tolerant). O segundo sistema pode ser AP, pois é consistente e tolerante a partições. Finalmente, o terceiro sistema pode ser CP, pois é disponível (available) e tolerante a partições (partition tolerant).
Todos os sistemas devem ser CA, pois assim serão consistentes e sempre disponíveis.

Leia o texto a seguir:

"O algoritmo k-médias toma como entrada o parâmetro k, correspondente ao número de grupos desejados, e particiona o conjunto de n objetos em k grupos, de forma que a similaridade intragrupo seja alta e a similaridade intergrupo seja baixa. A similaridade intragrupo é avaliada considerando o valor médio dos objetos em um grupo, que pode ser visto como o seu centro de gravidade ou centroide."

Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 116.

Considere as seguintes descrições a respeito da tarefa de agrupamento, mais especificamente ao algoritmo k-médias.
I. A detecção de agrupamentos é uma tarefa de aprendizado preditiva também conhecida como clustering. Nesse caso, as técnicas utilizadas são, comumente, relativas ao aprendizado supervisionado, ou seja, o conjunto de dados não possui rótulos e o aprendizado usa apenas atributos preditivos;
II. Os algoritmos para tarefas preditivas produzem modelos a partir de um processo de treinamento que utiliza todo o conjunto de dados disponível. O objetivo é organizar os dados rotulados em grupos de acordo com uma medida de similaridade ou correlação;
III. Um grupo é um conjunto de objetos similares (homogêneos) e os objetos que pertencem a grupos diferentes são não similares (heterogêneos). O principal objetivo do agrupamento é maximizar a homogeneidade interna nos grupos e a heterogeneidade entre os grupos.
IV. Dependendo do atributo selecionado, poderemos ter diferentes grupos. Nesse contexto, a detecção de agrupamentos poderá resultar em diferentes quantidades de grupos e em composições, também diferentes, para cada grupo obtido.

É correto apenas o que se afirma em:
II e IV, apenas.
III e IV, apenas.
II e III, apenas.
III, apenas.
IV, apenas.

Leia o texto abaixo: A mineração de dados é parte integrante de um processo mais amplo, conhecido como descoberta de conhecimento em bases de dados (knowledge discovery in databases, ou KDD) [...] A preparação ou pré-processamento de dados é uma das partes principais do KDD, e correspondem as etapas anteriores à mineração que visam preparar os dados para uma análise eficiente e eficaz. Fonte: DE CASTRO, L. N. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016.
A preparação ou pré-processamento de dados inclui
a análise descritiva, a associação e a detecção de anomalias nos dados.
a limpeza, a integração, a seleção ou redução e a transformação dos dados.
o agrupamento e a associação dos dados.
a análise descritiva, o agrupamento e a predição dos dados.
a transformação, a mineração e a avaliação dos dados.

Mais conteúdos dessa disciplina