Buscar

Rosolução de Caso N1 - DATA MINING - Bruno Almeida

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

U N IV E RS ID A DE SA L V AD OR – UN IFA CS 
 
C URS O D E P ÓS - GR A DU AÇ Ã O ESP EC IA L IZ A ÇÃ O E M 
B US IN ESS IN T ELL IG E N CE E AN A LY T ICS 
 
 
 
DATA MINING 
RESOLUÇÃO DE CASO N1 
BRUNO SIQUEIRA ALMEIDA 
MATRÍCULA: 2021300721 
D is s ert a çã o ap res en t ad a ao 
P rog ram a d e Pó s - G ra dua ção , 
d a Uni vers id ad e S a l vad o r – 
U N IF A CS – com o a v a l i ação da 
d i s c ip l ina Da ta Min i ng . 
 
 
 
 
Sum ár io 
 
1 . 0 – ET A PA S PA R A R ESO LU Ç ÃO D O P R OBLE MA . . . . . . . . . . . . . . . . . . . . 2 
1 . 1 – En t end im en t o do N eg ó c io e Id en t i f i ca ção d o Prob l em a . . . . . . . 2 
1 . 2 – Co le t a e Exp lo raçã o de Dad os . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 
1 . 3 – E s t ru tu ra çã o e L im p eza d os D ad os . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 
1 . 4 – Mo de la g em d os D ad os . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 
1 . 5 – Aná l i s e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 
2 . 0 – TÉ C NI C AS DE D A TA MI NI N G E OS PR IN C IP AIS 
A LG OR ITI MO S UT ILIZ A DOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 
2 . 1 – C l ass i f i ca ção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 
2 . 2 – E s t im a t i va . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 
2 . 3 – Prev i sã o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 
2 . 4 – Aná l i s e d e A f in id ad es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 
2 . 5 – Aná l i s e d e Ag rup am en t os . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 
 
 
 
2 
 
1 . 0 – ET A PA S PA R A R ESO LU Ç ÃO D O P R OBLE MA 
 
D i an t e d a p ro b l em át i ca ap r e sen t ada , An a C láud i a , d a In s t i t u i ção de 
E n s in o XP T O, p o der á mo n t a r a s e t ap as d o s eu p r o ces so d e mi n e ração d e 
d ado s u t i l i z and o o p ro ced im en to pad r ão CR ISP - DM ( Cr os s - I nd us t r y 
S ta nd ar d P ro ces s o f D a t a Min in g , ou P r o ces so In du s t r i a l Pad r ão d e 
M in e r ação d e D ados ) d a s eg u i n t e f o rma : 
1 . 1 – En t end im en t o do N eg ó c io e Id en t i f i ca ção d o Prob l em a 
E ss e p ro ced im en to i n i c i a l t em com o foco o en t end i m en t o d o n eg ó c io 
e v i s a ob t e r co nhec im en t o so br e os o b j e t i vo s d o mes mo e s eu s 
r eq u i s i t o s . D ess a man e i r a p od e - se en t en d e r me lh o r o p ro b lem a , e en t ão 
co nv e r t e r e s s e con h ec im en t o em um a de f in i ção p a ra u m p l ano 
p r e l imi n a r co m o ob j e t i vo d e s o lu c io na r o c as o . 
1 . 2 – Co le t a e Exp lo raçã o de Dad os 
E m segu id a , a eq u i p e d ed i ca t emp o a co l e t a r e ex p l o ra r os d ad os 
p r op r i amen t e d i to s . I s so po de s e r f e i t o p o r me io d e a lg o r i t mos 
e s p ec i f i c am en t e p ro g r am ad os p ar a es s a f i n a l id ad e . É n a e t ap a d e 
ex p l o r ação d os dado s q u e as f e r r amen ta s e s t a t í s t i c a s b ás i ca s com eçam 
a se r u t i l i z ad as . E s t a t amb ém é a e t ap a em qu e o s es p ec i a l i s t as co l e t am , 
d e s c rev em e ex p l o ram o s d ad os . 
1 . 3 – E s t ru tu ra çã o e L im p eza d os D ad os 
D ep end en do de on de v en h am o s d ad os , é l an çad o m ão d e d i fe r en t es 
m ét od os p a r a e s t ru tu r á - l os e t r an s fo rmá - lo s em i n f o rm ação in t e l ig ív e l 
e qu e p os sa s e r u t i l i z ada d e fo rm a p r á t i c a . É n ess a fa s e qu e o s r u íd os , 
d ado s e s t r an ho s ou in con s i s t en t e s s ão t r a t ado s . 
1 . 4 – Mo de la g em d os D ad os 
E s t a e t apa po ss u i r e l a ção d i r e t a com o o b j e t iv o d e cad a p r o ce sso d e 
M in e r ação , p o i s é ne s s a e t ap a qu e s ão d e f i n i d as a s t é cn i ca s p e l a s q u a i s 
o p ro b l em a d e t ec t ad o an t e r io rm en t e po d e r á s e r s o l u c io nad o . G r an d e 
p a r t e d a s t é cn i cas d e da t a mi n i ng s ão com b as e em co n ce i t os d e 
ap r end i zag em d a m áqu i n a , r e co nh ec i men t o d e p ad r ões , e s t a t í s t i c a , 
c l as s i f i c ação e c l us t e r i z ação . 
1 . 5 – An á l i s e 
N a im pl em en t ação d o p ro ces so d e m in e r ação d e d ad os , n a f a s e d e 
an á l i s e , é q u an do to d as a s e t ap as an t e r i o r e s s ão r ev i s t as . Es s a é a f as e 
m ai s d e l i cad a d o p ro ce ss o , v i s t o q u e é n ece ss á r io a pa r t i c ip ação d e u m 
g r up o d e p e ss o as es p ec i a l i z ad as em da ta m in i ng e no n eg ó c i o qu e é 
a l vo d a an á l i s e , pa r a av a l i a r s e a mi n er ação d e d ad os a l can çou o s 
r e s u l t ado s s a t i s f a t ó r i os . 
 
 
 
3 
 
2 . 0 – T ÉC N IC AS D E D ATA MI NI N G E OS P RI N CI P AIS 
A LG OR ITI MO S UT ILIZ A DOS 
 
E x i s t em d i v e rs as t écn i ca s d e mi n e ração d e d ad os e cad a um a s e rv e 
m el ho r à um p r op ós i to qu e ou t r a s , a d ep en d er d a p r ob l em át i ca . D ess a 
f o rm a n ão h á apen as um a m ane i ra d e en con t r a r pad rõ es d en t ro u m g r an d e 
v o l um e d e d ad os . S ão 5 o s n i cho s d e t é cn i cas g e r a i s p a r a mi n er ação d e 
d ado s : 
2 . 1 – C l ass i f i ca ção 
A c l as s i f i c ação v o l t ad a es p ec i f i c am en t e à a t r i b u i ção d e c l as s es 
q u e s ão p r é -d e f i n i d as p e l o an a l i s t a a os n ov os fa to s o u ob j e t os 
s ub m et i do s à c l a s s i f i c ação . A t é cn i ca p o de s e r u t i l i z ad a p a r a en t end e r 
d ado s ex i s t en t es e p r eve r como no vo s d ado s i r ão s e co mp o r t a r . Os 
a l go r i tmo s m a i s u t i l i z ado s p a r a e s t e f im s ão o s de á rv or es d e d ec i são , 
r eg r es s ão e r ed e s neu r a i s . 
2 . 2 – E s t im a t i va 
A s t écn i cas d e es t im a r u m r es u l t ado são us ad as p a r a d e t e r mi n a r , 
d a m el ho r fo r ma po ss ív e l , um va lo r ba s eand o - s e em ou t ro s v a lo r es d e 
s i t u açõ es sem elh an t e s . A l go r i tmo s d e r eg r es s ão e as r ed es n eu r a i s s ão 
b a s t an t e u t i l i z ad os n e s t es c as os . 
2 . 3 – Prev i sã o 
É a av a l i a ção d o v a l o r f u t u ro d e um a va r i áv e l a p a r t i r do s dado s 
h i s t ó r i co s d o seu co mp or t am en to p a ss ado . O s a l go r i tmo s u t i l i z ad os 
aq u i s ão , d en t r e o u t r os , a s r ed es n eura i s , a r eg r es são , e a s á r vo r e s d e 
d ec i s ão s ão os m ai s u su a i s . 
2 . 4 – Aná l i s e d e A f in id ad es 
R eco nh ece p adr õ esd e o co r r ên c ia s im ul t ân ea em d e t e rm in ad os 
ev en t os no s dado s an a l i s ado s . Es s a t écn i ca p od e d e t e rmin a r q ue fa to s 
o co r rem s imu l t an eam e n t e com pr ob ab i l i d ad e r azo áv e l ( co - o co r r ên c i a ) 
o u q u e i t en s d e uma m as s a d e d ad os es t ão p r es en t es j un to s com um a 
ce r t a ch an ce ( co r re l ação ) . Qu an to ao s a l go r i tmo s , a u t i l i zação d e 
r eg r as d e as s o c i ação é o p ro ced im en to m ai s u t i l i z ado n e s s e s c as os . 
2 . 5 – Aná l i s e d e Ag rup am en t os 
T em com o o b j e t iv o f o rm ar g r up os d e o b j e t os ou e l em en to s m ai s 
h om og ên eo s en t r e s i . P od e - se es t ab e l e c e r p r ev i am en t e um nú m er o de 
g r up os a s e r f o rm ad o ou p od e - se c r i a r um a lg o r i tm o d e ag r up am ent o 
p a r a qu e f aça l i v r e a s so c i ação d e u n i dad es , d e f o rm a q u e a q u an t id ad e 
d e g r up os r es u l t an t e s e j a co nh ec i d a som en t e ao f in a l do p r o ce sso . F i ca 
c l a ro aq u i a d i f e r en ça en t r e An á l i s e d e ag r up am ent o e C l a s s i f i c ação , 
p o i s n a C l as s i f i c ação as c l as s es s ão p r é - de f i n i d as p e l o p e sq u i sado r , 
en qu an t o aq u i n ão ex i s t e es s e r eq u i s i t o . A t é cn ica d e ag r u p am en to é 
ex ecu t ad a p o r a l go r i tmo s e s t a t í s t i cos es p ec í f i co s p a r a es se f im , p o r ém 
a s r ed es n eu ra i s t am b ém s ão t am b ém u t i l i zad as n e s t e s en t id o .

Continue navegando

Outros materiais