Buscar

Descoberta de conhecimento com BIG DATA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Descoberta de conhecimento com BIG DATA: 
 
Atualmente as informações de bases de dados atingem grandes quantidades de 
forma muito fácil. A filtragem desses dados, seguida de estudos para transformá-
los em conhecimento que permita embasar gestores nas suas tomadas de decisão, é 
de extrema importância. O processo KDD tem como objetivo transformar em 
conhecimento esses grandes volumes de dados de maneira sistemática. 
Analisando a figura abaixo, qual a sequência correta das etapas que compõem o 
processo KDD? 
Você acertou! 
B. 
1- Seleção; 2- Pré-processamento; 3- Transformação; 4-Mineração de dados; e 5- 
Interpretação e avaliação. 
2. 
A mineração de dados é uma etapa do KDD que consiste na aplicação de técnicas 
estatísticas e inteligência artificial em bases de dados volumosas com o objetivo de 
reconhecer padrões e relações robustas entre os dados. 
Como deve ser realizada a escolha da técnica mais adequada para a etapa de 
mineração de dados? 
Você acertou! 
B. 
A escolha deve ser com base no tipo de problema a ser solucionado. 
Não existe uma técnica que resolva todos os problemas de data mining. Diferentes 
técnicas servem para diferentes propósitos, cada uma oferecendo vantagens e 
desvantagens. A escolha da técnica está fortemente relacionada com o tipo de 
conhecimento que se deseja extrair ou com o tipo de dado no qual ela será aplicada. 
3. 
Na etapa de interpretação e avaliação do processo KDD, o conhecimento adquirido 
é interpretado e avaliado para verificar se o objetivo final foi alcançado. O que 
ocorre caso o objetivo final não tenha sido alcançado? 
Você acertou! 
C. 
Como o KDD é iterativo, o processo pode retornar a uma das etapas anteriores. 
Caso o resultado não seja satisfatório, o que não é raro, o processo pode retornar a 
qualquer um dos estágios anteriores ou até mesmo ser recomeçado. Ou seja, o processo 
não é simplesmente encerrado e não é necessário alterar os seus objetivos. A 
característica de iteração do processo permite que ele retorne com resultados diferentes. 
4. 
A etapa de transformação dos dados no processo KDD é de extrema importância 
para a etapa de mineração, pois garante o seu armazenamento adequado. 
Qual das situações abaixo representa a etapa de transformação de dados? 
Resposta correta 
C. 
Construção de campos que realizam alguns cálculos que podem facilitar na mineração 
de dados. 
Na etapa de Transformação é feito o armazenamento dos dados de forma a facilitar o 
uso das técnicas de Data Mining. A transformação garante que não ocorrerá nenhuma 
perda nos dados, e sim uma qualificação deles, o que facilita a consolidação do 
conhecimento ao final do processo. 
5. 
No processo KDD, a qualidade dos dados é crucial para obtenção de êxito, pois 
pode determinar a eficiência dos algoritmos de mineração de dados. 
Qual das etapas do processo KDD é responsável por garantir a qualidade dos 
dados a serem processados? 
Você acertou! 
A. 
Etapa de pré-processamento e limpeza. 
Na etapa de pré-processamento e limpeza dos dados deverão ser realizadas tarefas que 
eliminem dados redundantes e inconsistentes, recuperem dados incompletos e avaliem 
possíveis dados discrepantes ao conjunto. 
 
Desafio 
Descoberta de conhecimento em bancos de dados (KDD) é um processo utilizado a 
partir de uma grande coleção de dados. Essa técnica amplamente usada inclui 
preparação e seleção de dados, limpeza de dados, incorporação de conhecimento prévio 
em conjuntos de dados e interpretação de soluções precisas a partir dos resultados 
observados. 
 
Você atua como analista de banco de dados em uma empresa de crédito. Em uma base 
de dados de clientes da empresa, é necessário realizar um processo de mineração de 
dados que permita eleger os clientes mais adequados para realizar novas propostas de 
crédito. 
Nessa base de dados, existem alguns campos de dados que não têm um padrão 
adequado para realização de análises com qualidade. 
Com base nessas informações, responda: 
1) Quais cuidados são necessários na etapa de transformação, a fim de garantir êxito na 
mineração dos dados? 
2) Qual a importância de realizar a adequação desses dados, garantindo uma 
padronização? 
Sua resposta 
1) Nessa etapa é necessário voltar até a etapa anterior primeiramente e verificar e 
vasculhar os dados congruentes ou seja organizar os dados de forma correta se preciso 
for verificar a atuação dos determinados profissionais na recorreção desses dados. Ou 
seja estruturar todos os dados que serão enviados para a próxima etapa para ter 
coerência e facilidade de uso. Para isso é necessário verificar com cuidado para não 
excluir dados que poderão ser importantes futuramente. Na transformação pode-se dizer 
que aqui haverá transformação ou criação de campos nas tabelas ( caso não exista é 
necessário cria-las ). 2) Para que o processo de KDD corra de maneira correta nas suas 
atribuições e fases. E evitar de voltar nessas fases para fazer novas alterações e porque 
não dizer "trabalho dobrado" com chance de se perder algum processo já feito. Com 
essa padronização se torna facilitador caso haja necessidade de novas inserções. 
Enviado em: 21/10/2021 10:27 
Padrão de resposta esperado 
1) Na etapa de transformação dos dados é importante realizar a sua padronização, a fim 
de garantir que na etapa seguinte, de mineração, os algoritmos e técnicas processem os 
dados de modo a garantir o reconhecimento de padrões e uma qualificação na extração 
de conhecimento. 
2) Neste caso é importante analisar as bases de dados em busca de campos que não 
tenham um padrão de preenchimento. Por exemplo, o campo data, que normalmente 
tem entradas nos formatos dd/mm/aaaa ou dd/mm/aa.

Continue navegando