Baixe o app para aproveitar ainda mais
Prévia do material em texto
Árvores de Decisão Algoritmos de classificação que têm amplo uso na prática Facilidade de interpretação dos resultados obtidos Permitem identificar as variáveis previsoras relevantes no processo de classificação Podem ser utilizadas com outras técnicas para a pré-seleção de variáveis Conjunto de dados é particionado inicialmente em subconjuntos mais “puros”, ou seja, mais homogêneos em termos da variável alvo, que o conjunto original Cada subconjunto é particionado posteriormente em novos mais puros Prossegue-se particionando até que os subconjuntos resultantes satisfaçam um critério de parada previamente definido Conjunto superior tem dois tipos de indivíduos em proporções iguais (“impuro”) Particionando em dois subconjuntos, cada um deles tem a preponderância de um dos tipos de indivíduos e, portanto, são mais puros que o conjunto original Nó raiz: contempla todas as observações Nó: segmento específico de elementos com característica homogêneas entre si Nó terminal (folha): grupo de elementos homogêneos quanto à característica em estudo que não podem mais ser subdivididos Nó pai: nó dividido em novos nós Nós filhos: nós resultantes Esta árvore tem 3 níveis (profundidade igual a 3) por apresentar 3 camadas de nós A folha mais à esquerda (nó 2) pode ser representada pela notação (92%; 8%) 92% das observações que caem nesse nó pertencem ao grupo A e 8% ao B Nó apresenta também a porcentagem de clientes (50%) da base nele contida A segunda caixinha (nó 12) indica que 100% dos indivíduos que caem nesse nó pertencem ao grupo A Nas duas últimas caixinhas (nós 13 e 7) , todos os indivíduos pertencem ao grupo B
Compartilhar