Prévia do material em texto
Utilização e Análise de Técnicas Alternativas para a Elaboração de Segmentos RFV Autoria: Maria Carolina Barbosa Dantas, Fernando de Rosa Resumo Este trabalho tem como foco o marketing de relacionamento na sua primeira etapa: a segmentação de clientes. Seu principal objetivo é discutir o modelo de segmentação baseado em recência, freqüência e valor, utilizando-se três técnicas de segmentação distintas: CHAID, Cluster e análise categórica de RFV e comparando-se os resultados em termos de capacidade de formação de grupos diferenciados. Inicialmente, há um breve histórico do marketing de relacionamento e uma explicação sobre cada técnica utilizada para análise dos resultados. Dados secundários de uma instituição financeira de grande porte foram usados para a segmentação de 7.787 clientes da região metropolitana de São Paulo. Aplicadas as três técnicas de segmentação, foi possível comparar os resultados a partir da formação de 27 segmentos. Foi detectado que, geralmente, uma das variáveis do RFV tem maior capacidade de discriminação. Usando-se técnicas em que não haja categorização – cluster e CHAID – as variáveis com maior amplitude acabam direcionando a formação dos grupos, o que é atenuado ao se utilizar a técnica de análise categórica. Introdução O ambiente empresarial contemporâneo caracteriza-se pelo acirramento da concorrência global, pelo direcionamento de ações que foquem o cliente e pela crescente diversidade de produtos e serviços (MC KENNA, 1992; VAVRA, 1994; RAPP e COLLINS, 1996). Esse cenário mercadológico traduz-se numa necessidade de coletar, armazenar e processar informações sobre o cliente, utilizando-se, para tal, de recursos de tecnologia de informação, cujos investimentos devem ser constantes, agravados pela elevada taxa de obsolescência. Assim, soluções de CRM (Customer Relationship Management) tornaram-se comuns em organizações de médio e grande portes, no intuito melhor conhecer o cliente. O CRM pode ser entendido como o conjunto de processos capazes de viabilizar a filosofia do marketing de relacionamento. Nesse sentido, o conceito de marketing de relacionamento não consiste em CRM. Kalakota (2002, p.168) reduz o conceito de CRM em software que “ajuda as organizações a melhor gerenciar o relacionamento com os clientes acompanhando as interações de clientes de todos os tipos”. Marketing de Relacionamento é uma abordagem mercadológica mais ampla, focada na descoberta das expectativas e necessidades individuais dos clientes e no direcionamento de produtos e serviços de maneira que possam atendê-los de forma personalizada. Essa abordagem é antagônica ao Marketing de Transações, ou seja, o marketing massificado. Segundo Bretzke (2002), CRM consiste numa das estratégias mais eficientes para fidelizar o cliente, pois a empresa tem a possibilidade de aumentar a rentabilidade dos clientes atuais a partir de informações de relacionamento que são compiladas no momento de contato entre este e aquela. Diversos autores que estudam o fenômeno de inserção do CRM nas empresas comparam o custo em reter um cliente e conquistar um novo. Para Bretzke (2000), atrair e obter um novo cliente é seis vezes mais caro que manter um. De acordo com Scott (2001) e o Eisenfeld (2002), o custo de conquistar um cliente sobe para 10 vezes quando comparado ao trabalho de reter um já satisfeito. 2 Para a implantação de CRM, o primeiro passo a ser considerado é a segmentação de clientes. Mas, para que isso ocorra é importante que a empresa possua um banco de dados capaz de fornecer, se não todos, pelo menos os dados mais importantes dos clientes. A segmentação de clientes é o ponto essencial deste trabalho. Dados demográficos, geográficos, geodemográficos, psicográficos, socioculturais, comportamentos de consumo e benefícios esperados podem ser importantes para a formulação do perfil do cliente e seu posterior agrupamento em segmentos de acordo com as similaridades percebidas. Além disso, transações históricas de compras ou até mesmo a procura por um SAC (Serviço de Atendimento ao Consumidor) também podem ser arquivados como insumos para a segmentação. Kotler (2000) observa que alguns pesquisadores tentam formar segmentos observando as características dos consumidores: geográfica, demográficas, psicográficas e comportamental. Nos últimos anos, há uma tendência de identificar os segmentos observando os dados comportamentais a partir das respostas dos consumidores aos benefícios procurados, ocasiões de uso ou marcas. Engel (1995) sugere para uma segmentação muitas variáveis. Mas, os dados mais usados são das seguintes categorias: geográficas, demográficas, psicográficas e comportamentais. Esta última inclui benefícios procurados, extensões de uso e lealdade e situação de uso. Dentre os diversos critérios de se praticar a segmentação, tem se destacado o comportamental de consumo. Uma maneira extremamente simples de se praticar essa segmentação está baseada no clássico uso dos conceitos de recência, freqüência e valor (RFV), algo facilmente aplicável a empresas de pequeno e médio portes. Os modelos de segmentação baseados em recência, freqüência valor são muito utilizados em estratégias de marketing de relacionamento por fornecer informações para construção e manutenção de relacionamentos duradouros e lucrativos. A recência indica há quanto tempo ocorreu a última transação do cliente. A freqüência é a assiduidade de um cliente em efetuar suas transações (HUGHES, 1998). A categorização por RFV, segundo Hughes (1998), é um método de dividir em categorias os registros presentes em um banco de dados a fim de conhecer quem são os compradores mais recentes, os que compram com mais freqüência e quem são os que mais gastam com os produtos ou serviços da empresa. O autor alerta que tal método só pode ser utilizado na carteira de clientes da empresa e é o método mais confiável de previsão de retorno conhecido pelos profissionais de marketing. “Porque o RFV é uma medida de comportamento, e comportamento é justamente o que se pretende prever” (HUGHES, 1998, p. 90). Esta pesquisa tem o propósito de apresentar três técnicas alternativas – CHAID, Cluster e Categorização de RFV – para implementar segmentações baseadas em atributos de recência, freqüência e valor. Há vantagens no uso de cada uma das técnicas? Os resultados encontrados são convergentes? Em quais condições específicas recomenda-se o uso de cada uma das técnicas? Conhecer os clientes a partir da segmentação Tratar clientes individualmente não é novidade em empresas de marketing direto tradicional, ou seja, aquelas especialistas em vendas por mala-direta. Tais empresas testam a todo o momento todas as suas estratégias e ofertas para, assim, conhecer, dentro de um intervalo de confiança estatística, exatamente quanto de um produto ou serviço venderão usando cada uma das ofertas testadas em um contexto de mercado mais amplo (VAVRA, 1993). 3 Em tempos de grande transformação no mundo empresarial, conhecer o cliente significa ter o “grande trunfo”. Mas, não basta apenas conhecer suas necessidades e expectativas, é preciso prever a sua opção de compra futura a fim de voltar-se aos clientes mais rentáveis. Vavra (1993) descreve as empresas de marketing direto tradicional como decididas ao registrar resultados. Assim, elas não apenas sabem com precisão o número de vendas que realizaram, mas também quais os clientes de seu banco de dados compraram ou não, complementando com um histórico completo das respostas anteriores de cada cliente. “Para campanhas futuras, os clientes podem ser segmentados por interesse, rentabilidade ou nível de atividade de compra. Essa atenção para o detalhe é análoga à perspectiva das empresas de venda industrial ou business to business, para as quais um banco de dados de clientes e um conhecimento preciso de suas necessidades individuais têm sido sempre o meio normativo para conduzir negócios” (VAVRA,1993, p.49). A tríade segmentação, seleção do mercado-alvo e posicionamento representa a base para as ações de marketing de uma empresa. A segmentação de clientes professa a separação do conjunto total dos consumidores em grupos menores, nos quais os mesmos possuem necessidades e desejos homogêneos (TAM e BORGES, 2001). Um dos objetivos mais importantes dessa segmentação é estimar qual o valor que o cliente pode agregar. Inicialmente a segmentação considerava dados demográficos e geográficos como os mais importantes. Hoje, percebe-se um avanço na busca de informações adicionais sobre o cliente (aspectos psicográficos, comportamentais de consumo, benefícios esperados, entre outros), que confere ao instrumento de segmentação uma maior precisão no efetivo conhecimento do cliente. O primeiro passo para a segmentação de clientes é a criação do banco de dados, geralmente oriundos de múltiplas fontes. O processo de criação do banco de dados combina conjuntos de dados em registros de marketing utilizáveis. Toda a transação, ou contato com o cliente ou prospect é uma oportunidade para reunir dados, investir no relacionamento com o cliente e construir um valor mútuo. Assim, o banco de dados deverá reunir informações ideais para viabilizar a realização da segmentação. A empresa precisa diferenciar os clientes primeiro pelo valor que eles representam e então por suas necessidades ou psicografias, em vez de confiarem em padrões históricos ou demográficos (BROWN, 2001). A tecnologia de banco de dados é capaz de auxiliar na conquista e manutenção de clientes. O banco de dados coleta informações, endereça benefícios específicos para clientes selecionados e fornece meios para medir precisamente os resultados (AAKER et al., 2001). As tendências de banco de dados, de acordo com Laudon (2002) incluem o crescimento de bancos de dados distribuídos, cujo armazenamento pode ser em mais de um local físico, e o surgimento de bancos de dados orientados a objetos, que armazena os dados e os procedimentos como objetos que podem ser facilmente recuperados e compartilhados, e orientados com hipermídia, cuja característica principal é a capacidade que o usuário tem em escolher seu próprio caminho. Existem diversas alternativas de organização de dados e de representação dos relacionamentos entre os dados em um banco de dados. O banco de dados para fins de segmentação de clientes pode ser construído de diversas maneiras. O mais arrojado é o Data Warehouse (DW), conhecido como um banco de dados corporativo, orientado a assuntos, histórico, capaz de desenvolver a memória institucional. Ele contém informações sobre os clientes de uma organização, sobre seus produtos e sobre o mercado, além de diversos outros assuntos de interesse corporativo. Caracteriza-se por ser fruto de um processo organizado de extração de dados de fontes internas e externas, de transformação desses dados em informações úteis, de armazenamento em diversos níveis de agregação e de acesso e recuperação fáceis. No contexto de CRM, “o Data Warehouse pode coletar informações 4 demográficas de fora dos sistemas da empresa e permitir a análise comparando-as com seus próprios dados de cobrança para discernir sobre as preferências de compra da sua base de clientes” (BROWN, 2001. p.206). Além do Data Warehouse, alguns pesquisadores apontam outras técnicas para criar um banco de dados com objetivo de interagir com clientes, como o Database Marketing, o Data Mart e o OLAP (On-line Analytical Processing) (SERRA, 2002; LAUDON, 2002; KOTLER, 2000). O objetivo de muitas empresas quando ingressam em um projeto de Data Warehouse é focar em necessidades especiais de pequenos grupos dentro da organização. Esses pequenos armazenamentos de dados são denominados Data Marts. Serra (2002) define Data Marts como pequenos Data Warehouses que fornecem suporte à decisão de um pequeno grupo de pessoas. Os Data Marts podem servir como veículo de teste para empresas que desejam explorar os benefícios do Data Warehouse. Entre as principais vantagens, Serra (2002) aponta a diminuição drástica do custo de implementação, a manutenção de sistemas de apoio à decisão e a possibilidade de aquisição de um número muito maior de corporações, além da rapidez em ser desenvolvido e a concentração de esforço/time já que possuem o escopo mais limitado e são mais identificados com grupos de necessidades de usuários. O Database Marketing consiste numa abordagem interativa para o marketing, cujo uso está mais focado em canais e meios de comunicação de marketing. Tal banco de dados registra e mantém uma memória eletrônica de dados de clientes, clientes potenciais e todos os contatos comerciais e de comunicação. Serra (2002) aponta como o principal objetivo do Database Marketing a melhoria de atendimento nos contatos futuros e um planejamento mais realista de todo o marketing. Segundo Serra (2002) há dois usos principais para o Database Marketing: marketing para clientes, onde se mantém um relacionamento estreito com clientes, com a possibilidade de oferecer serviços especiais, o que pode resultar em fidelidade, aumento de vendas e redução de “attrition”; e marketing para não-clientes (prospects), cujo objetivo é identificar os clientes potenciais a partir da compreensão das motivações do consumidor o que resultará na expansão da base de consumidores com custos decrescentes. Numa arquitetura de aplicação de análise multidimensional de dados como o OLAP (On-line Analytical Processing) os dados são representados em diferentes dimensões. De acordo com Singh (2001), ferramentas OLAP fornecem meios tecnológicos para análise completa do negócio possibilitando aos usuários analisar e navegar os dados para detectar tendências, exceções e obter detalhes para entender a evolução da empresa. Inmon, Welch e Glassey (1999) conceituam OLAP como uma extensão do Data Warehouse. Alguns aspectos merecem maior importância, como a possibilidade de personalização no nível departamental e “o preço da criação para o processamento OLAP ser pago apenas uma vez” (INMON et al., 1999, p. 187). Técnicas para segmentação As técnicas utilizadas por profissionais de marketing para segmentar os clientes de uma organização, hoje, são diversas. Segundo Ross apud Gordon (2001), as principais técnicas são: redes neurais, árvores de decisão, análise multivariada e indução de regras. Laudon (2002) acrescenta entre as técnicas, a lógica fuzzy, os algoritmos genéticos e os agentes inteligentes. Malhotra (2001) aponta a análise de conglomerados, ou Cluster, como técnica importante de segmentação. Vavra (1993) completa com a abordagem de segmentação baseada nas categorias de RFM (Recência, Freqüência e valor Monetário). Outros autores como Duffy (2002), falam de RFV, substituindo M de monetário por V de Valor. 5 Em geral as técnicas são aplicadas segundo um modelo conceitual de segmentação que embasa a criação dos grupos de elementos similares. São diversos os modelos existentes, mas Miglautsch (2002) considera aqueles baseados na abordagem de RFV como os mais utilizados nas segmentações do marketing direto por décadas. Por outro lado, alerta para as limitações do método, como o foco excessivo nos melhores clientes e a inadequação no uso da variável recência em empresas novas com crescimento rápido. Neste trabalho, o modelo de RFV será tratado por três técnicas: Cluster, CHAID ou árvores de decisão categórica e categorização por RFV. Análise de Cluster O princípio da técnica é a divisão baseada em uma medida de similaridade ou distância para a criação de grupos homogêneos ou clusters. Os casos são individualizados no começo do processo, passando a se juntar apenas no decorrer da aplicação, de acordo com a similaridade apresentada em relação a certas variáveis (FREITAS e HEINECK, 2001). A análise de cluster é uma das técnicas multivariadas mais utilizadas pelos autores da área de marketing e segmentação (FREITAS e HEINECK,2001), cujo objetivo principal é a redução do número de casos sob análise. Ao contrário de outras técnicas, o cluster não necessita calcular uma matriz de proximidade como um passo intermediário. A técnica de cluster permite formar grupos homogêneos, desconsiderando os casos perdidos ou missing. Cada grupo possui números de clientes diferentes, mas com características semelhantes. Isso porque ao analisar os dados contidos num banco, é possível verificar que muitos deles são complementares, sendo necessária mais de uma característica para formar os segmentos. A redução da população em grupos é a base principal da técnica de cluster. O primeiro passo numa segmentação por Cluster é definir a estrutura dos dados alocando as ocorrências semelhantes num mesmo grupo. Para saber como medir a semelhança entre as variáveis podem ser utilizados métodos diversos, como correlação entre objetos, distâncias euclidianas e, ainda, e proximidades entre ocorrências parecidas (HAIR et al., 1998). Também é preciso saber quantos grupos serão formados. Enquanto o número de grupos diminui, reduz também a sua homogeneidade. É do pesquisador a decisão sobre o número de grupos a serem formados. Malhotra (2001) classifica os processos de aglomeração para formação dos clusters em dois: hierárquico e não-hierárquico. A aglomeração hierárquica se caracteriza pelo estabelecimento de uma hierarquia, ou estrutura em forma de árvore. Já os métodos não- hierárquicos, chamados também de K-means clustering consistem em centros, onde todos os objetos a menos de um valor pré-determinado a contar do centro são agrupados juntamente. CHAID (Árvore de decisão) CHAID objetiva agrupar um conjunto de dados baseado na simplificação do número de variáveis discriminantes que melhor explicam os segmentos gerados. O método de árvores de regressãoi, ou Detecção de Interação Automática do Qui-Quadrado – CHAIDii - consiste em análises de freqüência de categorias procedidas com o objetivo de explicar a heterogeneidade de uma variável dependente qualitativa. O modelo das árvores cria distinção e segmentos estatisticamente significantes. Cada segmento tem um único perfil. A porcentagem da amostra populacional neste segmento é depois comparada com os resultados de toda a população. Isto permite ao analista de marketing rever quais segmentos consomem acima ou abaixo de um dado padrão. 6 As árvores de decisão dividem os dados em grupos com base no valor das variáveis que são classificadas de acordo com os resultados potenciais das decisões. Para Gordon (2001), as ferramentas que usam árvores de decisão categóricas têm dificuldades em manipular conjuntos contínuos de dados, como idade do cliente e vendas. Na técnica de CHAID, os resultados são visualizados na forma de um diagrama em árvore, como divisões progressivas em pequenos ramos. A princípio, toda população é considerada, sendo progressivamente dividida, por meio da utilização de variáveis que melhor explicam a sua variação. (FREITAS e HEINECK, 2001). Os diagramas da técnica de CHAID devem ser pensados como um “tronco de árvore”, com divisões progressivas em ramificações menores. Assim funciona a técnica: o tronco inicial consiste em todas as variáveis importantes para a segmentação. Uma série delas é estudada e avaliada para iniciar o processo de distribuição a fim de conduzir a uma discriminação estatisticamente significante de variáveis dependentes. A segunda ramificação é formada por variáveis mais significantes da primeira amostra que foi dividida. Para cada novo grupo que é formado é verificada a possibilidade de formar novos subgrupos tomando por base variáveis dependentes. Ao término do processo, o resultado é um desenho de ramificações, cada qual especificando mais o grupo a ser segmentado. A cada etapa são feitos testes estatísticos com o objetivo de verificar se cada variável realmente pode oferecer um subgrupo homogêneo. Freitas e Heineck (2001) citam entre as principais vantagens na utilização do método, a possibilidade de utilização de variáveis dependentes e independentes em diferentes formatos e de várias bases para a segmentação buscando-se a homogeneização dos segmentos criados, a possibilidade dos valores faltantes serem tratados pelos softwares disponíveis, sendo agregado ao grupo que mais se assemelhar a ele ou isolado em uma categoria distinta e, também, a não necessidade de estabelecer provisoriamente uma ou mais variáveis como base para segmentação. Análise Categórica de Recência, Freqüência e Valor (RFV) A técnica de categorização por RFV permite dividir em categorias os registros presentes em um banco de dados, de forma a conhecer quem são os compradores mais recentes, os que compram com mais freqüência e quem são os que mais gastam com produtos e serviços. Essa técnica só pode ser utilizada para clientes da carteira da empresa ou organização e trata-se do método mais eficiente e menos oneroso de se direcionar mala direta para maximizar lucros (HUGHES, 1998). A Recência é a mais poderosa das três unidades. Hughes (1998) aconselha a usar a data da última compra para investir no cliente. Segundo ele, “nesse rápido instante de entusiasmo pelo novo produto e pela sua empresa, é bem possível que o consumidor venha a comprar mais alguma coisa”. Os compradores mais recentes são os consumidores de maior potencial de retorno. É importante ressaltar que em empresas de serviço a idéia de recência acima descrita pode não ser válida, pois o consumo é contínuo. É possível, por exemplo, medir a recência numa empresa de serviço pela relação entre o tempo e a freqüência com que o cliente utiliza o serviço. Pela mesma linha de raciocínio é possível verificar que se o cliente tem muito tempo de empresa e pouco utiliza, sua recência pode ser baixa, já o contrário indica uma recência com valor mais alto. Em geral, pode-se afirmar, que quanto mais recentemente o cliente visitou a empresa, maior a chance de retornar. O segundo fator de maior impacto no comportamento de consumo do cliente é a freqüência, ou seja, o número de vezes que uma pessoa adquire produtos ou serviços de uma organização. A freqüência deve ser combinada com a recência, a fim de compreender de modo adequado, o comportamento do consumidor. Segundo Duffy (2002), a freqüência pode 7 ser mensurada de duas maneiras: a média de transações em um determinado período ou o tempo médio entre transações. Por fim, valor representa o montante gasto por um cliente em um determinado período de tempo. A terceira unidade é criada pelo cálculo do valor obtido de cada cliente, desde a ocasião em que passaram a fazer parte do banco de dados da empresa. Aqueles clientes que gastam mais têm um retorno melhor (HUGHES, 1998). Contudo, o valor não tem o mesmo “poder de fogo” da recência ou da freqüência. Para cada uma das variáveis é calculado um valor. Quando o banco de dados é dividido em quartis, o cliente mais recente recebe o valor 4. O mais freqüente, também recebe valor 4. E, o que mais gasta também é 4. Assim, o cliente ideal é o 4-4-4. Já o cliente 1-1-1 está numa situação que não compra com freqüência, gasta pouco e não vem comprando recentemente. Miglautsch (2002), aconselha a criação de variáveis adicionais ao grupo a fim de obter informações internas de compra. Este último geralmente é o maior grupo e representa um baixo potencial para a organização. Método Pesquisa, população e amostra Quanto aos fins, trata-se de pesquisa descritiva (GIL, 1996), cujo objetivo primordial é a descrição das características de uma determinada população ou fenômeno ou, então o estabelecimento de relações entre variáveis. Quanto aos procedimentos técnicos utilizados, o trabalho reúne pesquisa bibliográfica, desenvolvida a partir de material já elaborado, constituída, principalmente, de livros e artigos científicos, assim como modelagem e tratamento analítico de dados (GIL, 1996). A população original da presente pesquisaconsiste em aproximadamente 902 mil clientes de um grande banco de varejo situados na região metropolitana de São Paulo. A amostra utilizada é proveniente de uma pesquisa de satisfação de clientes realizada pelo banco de varejo no ano de 2000. Esta pesquisa consistiu em entrevistar e agregar dados de transações de 7.787 clientes identificados por um código padrão da empresa. Para efeito deste trabalho, foram considerados apenas os dados transacionais dos clientes. Os dados relativos à satisfação não tiveram utilidade neste trabalho. A partir desses dados secundários e para atingir os objetivos propostos anteriormente, foi necessário realizar um tratamento mais elaborado dos dados. Primeiramente, foram apurados e suprimidos mais 87 casos de outliers. Para alcançar este número, foi preciso a padronização das variáveis (z). Todos os casos com z � 5 e z � -5 foram desconsiderados. Restaram, portanto, 7.700 casos. Mas, para “tratar” todo o banco, foi necessário, também, suprimir os casos considerados missing values, ou seja, aqueles que apresentavam campos em branco nas três variáveis de interesse. Ao todo, 409 casos encontravam-se nessa situação. Ao final, a amostra tratada apresentou 7.291 casos de clientes. São esses os clientes que serão segmentados em grupos, de acordo com cada uma das três técnicas: CHAID, Cluster e RFV. Operacionalização das variáveis Inicialmente, as variáveis apresentadas eram nove (Quadro 1). Porém, houve a necessidade em criar novas variáveis, a partir das anteriores, que melhor atendessem ao requisito de recência, freqüência e valor, devido ao modo como foi composto o trabalho. 8 Quadro 1 – Variáveis Variável Escala Descrição CODAG Nominal Código de Agência CODCLI Nominal Código do Cliente RENTB Métrica de razão Margem de contribuição gerada pelo cliente mensalmente RENDA Métrica de razão Renda média que o cliente possui mensalmente SENIOR Métrica de razão Tempo, em anos, que o cliente é correntista do banco QSDEBAUT Métrica de razão Quantidade de saques de débito automático QTMOV Métrica de razão Quantidade de movimentação de débitos e créditos efetuados VLMOV Métrica de razão Somatório dos valores de débitos e créditos QTCHEQ Métrica de razão Quantidade de cheques emitidos Para isso, foram analisadas aquelas que pudessem ser úteis para a geração de novas variáveis com o enfoque RFV de segmentação. Para construir grupos baseados em RFV, é preciso levantar dados que apresentem a recenticidade do cliente. A Recência traduz em números quando foi o último contato do cliente com a empresa. Quanto mais recente maior será o valor a ele atribuído. Em termos estratégicos de marketing, o cliente recente é um bom candidato a voltar e fazer novas compras. Dentre as variáveis acima descritas, nenhuma apresenta características para ilustrar a recentidade dos casos. Por este motivo, foi necessária a composição de duas variáveis para gerar uma terceira capaz de oferecer subsídios para o entendimento do conceito. Optou-se, dado o caráter contínuo do consumo de serviços em um banco, por utilizar-se o inverso da senioridade <sênior>, conforme fórmula 1.1. Assim: (1.1) A segunda unidade da abordagem RFV, freqüência, é o número de vezes que um cliente adquire algo da empresa (Hughes, 1998). A maneira mais simples para calcular este valor é somando quantas vezes o cliente teve contato com o banco. Optou-se pela variável de quantidade de movimentações <qtmov> dividida pelo tempo de relacionamento <sênior>, para estimar-se a quantidade de interações com o banco em um dado período de tempo, de acordo com a fórmula 1.2. (1.2) O valor a ser utilizado na técnica de segmentação é o mesmo levantado pelo banco de dados: o volume de movimentação do cliente <vlmov>, ou seja, o valor total de suas transações (fórmula 1.3). Segundo Hughes (1998), aqueles que gastam mais têm um retorno melhor. Dada as diferenças de margens de contribuição geradas por diversos tipos de produtos, preferiu-se o montante de transações à margem de contribuição, que também costuma ser usada como estimador de valor ou montante. (1.3) Como pode ser observado, para todas as técnicas foram utilizadas as proxies de recência, freqüência e valor a fim de possibilitar a comparação mais precisa entre as mesmas. É importante lembrar que, com a criação das proxies acima descritas e da tabulação dos dados, as três técnicas estão utilizando o mesmo conjunto de variáveis para viabilizar a comparabilidade dos resultados a serem obtidos. O tratamento dos dados foi realizado por meio do software SPSS (Statiscal Package for Social Sciences), versão 11.5. Optou-se por analisar os dados pelo mesmo modelo de RECÊNCIA = ____1___ SENIOR FREQUÊNCIA = QTMOV / SENIOR VALOR = VLMOV 9 segmentação baseada em recência, freqüência e valor por oferecer a possibilidade de comparar as três técnicas utilizando os mesmos parâmetros. Análise Descritiva A análise descritiva tem o objetivo de apresentar as estatísticas a respeito de cada variável representativa de recência, freqüência e valor. Neste caso disponibiliza-se a média, desvio padrão, valor máximo e mínimo e coeficiente de variação. De acordo com a tabela 1, é possível perceber que a variável “Valor” assume uma amplitude muito grande, sendo o valor máximo superior a 1.700.000,00 e o mínimo zero, assim como um desvio-padrão avantajado. Analisando o coeficiente de variação, pode-se, também, observar que a variável “recência” é a mais homogênea e o “valor”, a mais dispersa. Tabela 1 – Análise Descritiva N Mínimo Máximo Média Desvio Padrão Coeficiente de variação Recência 7291 0,04 3,00 0,34 0,33 0,971 Freqüência 7291 0 1.366,40 100,15 148,53 1,483 Valor 7291 0 1.731.206,69 77.662,00 137.324,21 1,768 Aplicação de Análise Categórica de RFV Na técnica de RFV, as três variáveis (recência, freqüência, valor) foram categorizadas e distribuídas em tercis, ou três partes iguais. Hughes (1998) aconselha dividir o banco de dados em quintis, ou cinco partes iguais por apresentar um número suficiente de combinações para o estudo das estratégias de marketing. Com quintis, (5x5x5), haveria 125 combinações, com quartis (4x4x4), o número de combinações diminui para 64. “Quanto menos combinações, maior a probabilidade de se misturarem comportamentos diferentes de consumidores, perdendo assim, a precisão acurada que você pode obter com um número maior”.(HUGHES, 1998). Nesta pesquisa, além da amostra ser considerada pequena (7.787), a distribuição do banco em quintis ou quartis tornaria muito complexa a comparação entre as técnicas. Por este motivo, optou-se por dividir o banco em tercis (3x3x3), possibilitando o surgimento de 27 grupos. Os clientes 3-3-3 são considerados os clientes mais fiéis e rentáveis. Aplicação de Análise de Cluster Os 7.291 casos foram distribuídos, inicialmente, em 54 centros. Considerou-se este número por tratar do dobro do número de grupos formados pela técnica de RFV. A partir daí, foi possível tratar os grupos a fim de torna-los mais homogêneos. A técnica de Cluster foi realizada pelo método não-hierárquico K-means com fixação de centróides passo-a-passo (stepwise). O objetivo foi compor igualmente 27 grupos. No primeiro passo, após a formação dos 54 centros, foram eliminados todos os grupos que possuíam de 1 a 2 casos. Assim, restaram 42 centros. É válido ressaltar que os casos eliminados foram inseridos em novo centro de acordo com a similaridade existente entre este e aquele. As ocorrências que possuíam 3 a 6 casos foram suprimidas e introduzidas em outros centros com características semelhantes. Reduziu-se o número para 31 centros. O mesmo processo foi efetuado a fim de obter maior homogeneidade dentro dos grupos. Para isso, centros que apresentavam até 14 casos foram eliminados, gerando os 27 grupos desejados. Ao final, os 7.291 clientes foram distribuídos em 27 clusters.Os clusters ficaram distribuídos de acordo com a Tabela 2. 10 Tabela 2 – Quantidade de casos nos 27 clusters formados Aplicação de CHAID A terceira e última técnica a ser analisada foi CHAID. Como foi descrita por Freitas e Heineck (2001), a imagem é de uma árvore. Cada ramificação é uma nova categoria formada. A técnica de CHAID permite ao usuário contar a freqüência de casos em cada classe. No presente estudo, a variável dependente (y) foi os 27 grupos formados pela técnica de Cluster. A partir daí, os grupos foram subdivididos categoricamente usando basicamente variáveis determinantes. Praticamente, as variáveis recência e freqüência não entram na estrutura do modelo. A categorização de variáveis, característica forte da técnica de CHAID, permitiu formar outros 27 grupos com características diferentes dos inicialmente formados pela técnica de Cluster. Análise dos Resultados Análise de Correlação A correlação entre as três variáveis está expressa na tabela 3, evidenciando valores significativos para p<0,01, embora a maior interação se dê entre recência e freqüência. Tabela 3 – Análise de Correlação Cluster nº Qtd casos Cluster nº Qtd casos 1 1133 16 27 2 496 17 32 3 29 18 388 4 114 19 1614 5 16 20 22 6 184 21 24 7 233 22 314 8 31 23 56 9 57 24 23 10 82 25 1386 11 40 26 23 12 27 27 142 13 757 14 17 Valid 7291 15 24 Missing 0 Recência Freqüência Valor Recência Pearson Correlation 1,000 0,621 -0,031 Sig. (2-tailed) - 0,000 0,008 Freqüência Pearson Correlation 0,621 1,000 0,253 Sig. (2-tailed) 0,000 - 0,000 Valor Pearson Correlation -0,031 0,253 1,000 Sig. (2-tailed) 0,008 0,000 - ** Correlation is significant at the 0.01 level (2-tailed). 11 Discussão sobre a criação dos grupos Cluster A técnica de Cluster, a primeira a ser realizada, formou 27 grupos distintos entre si. No entanto, na Análise de Variância (ANOVA) e Teste de Scheffe que serão descritas a seguir, vê-se que alguns clusters podem ser reagrupados pela semelhança ainda existente entre os mesmos. Vale ressaltar um certo desequilíbrio entre os grupos extremos, como, por exemplo, o cluster 20 que possui poucos clientes e as maiores quantias na variável “valor” e o 19, que é o maior em termos de quantidade de casos (1614 casos), embora apresentem baixos valores de freqüência e valor. O grupo mais recente é o de número 20 e aquele com maior freqüência, o de número 3. A fim de confirmar e validar externamente o modelo criado foi realizada uma Análise de Variância (ANOVA) da variável rentabilidade que não entrou no modelo. O valor de F foi de 61,92, p<0,001. Analisando-se os resultados providos pelas variáveis que entraram no modelo – recência, freqüência e valor, adotou-se testes ANOVA e Scheffe. Este último visa a identificar os segmentos menos distintos, a fim de formar um menor número de grupos. Para o profissional de marketing é mais viável trabalhar com grupos mais homogêneos, que geralmente implica maior quantidade de grupos, dificultando o estabelecimento e a manutenção de estratégias distintas, dada a complexidade gerencial que proporcionará. No presente estudo, a variável recência não se mostrou significativamente distinta entre os 27 grupos criados (F=0,946 e p<0,543). No entanto há diferenças nas variáveis Freqüência e Valor entre os grupos. Pelo teste de Scheffe, recência reagrupa os clusters em um único grupo, ou seja, não há diferenças, enquanto a variável freqüência forma 3 grupos distintos. Por fim, o teste de Scheffe não acrescentou mudanças quanto à variável valor. Os 27 clusters não foram reagrupados. Isso porque a variável em questão tem alto poder discriminatório, como foi visto na análise de variância. Cada um dos 27 clusters possui características próprias capazes de justificar a sua formação. O profissional de marketing deve ser capaz de perceber as peculiaridades de cada grupo formado e a partir daí formular estratégias de marketing direcionado, como propõe autores como Bretzke (2000) e Vavra (1993). O cluster com características de menor freqüência e valor deve ser cuidadosamente analisado. No presente estudo este cluster é o de número 19. Como é o que possui mais casos (1614), não pode simplesmente ser descartado, mas trabalhado. Clientes fiéis e de elevado valor como é o caso dos 22 clientes do cluster 20 devem ter um tratamento diferenciado. E, na era do marketing de relacionamento, deve-se aplicar um tratamento personalizado e capaz de atender às suas necessidades específicas. Categorização por RFV A distribuição dos casos em tercis (3x3x3) possibilitou a formação de 27 grupos. É possível perceber, de acordo com a Tabela 4, que o número de grupos 1-1-1 (menor recência, freqüência e valor) foi superior aos 3-3-3 (maior recência, freqüência e valor). Um grupo que se destaca por possuir menor número de casos entre todos os analisados é o 1-3-2 (menor recência, maior freqüência e médio montante). 12 Tabela 4 – Distribuição de freqüência de grupos RFV Como a técnica RFV exige categorizar as variáveis, houve um estreitamento na dispersão dos grupos. A Análise de Variância (ANOVA) demonstrou que a variável valor (F=166,50, p<0,001) já não possui grande poder de diferenciação como na técnica de cluster. E, contraditoriamente, a variável freqüência (F=543,64, p<0,001) apresentou maior capacidade de diferenciação. O teste de Scheffe não pode ser aplicado em razão do grupo 132 apresentar um único caso. Ao categorizar as variáveis, a técnica de RFV torna os grupos maiores e, conseqüentemente, mais heterogêneos dentro e entre si. Para a presente aplicação, os grupos extremos sofreram um grande incremento de casos prejudicando a compreensão de suas características. Uma possível explicação para a variável “valor” na Categorização de RFV não ter apresentado a mesma capacidade discriminante que em cluster reside no fato desta última tratar os valores de forma métrica, potencializando o efeito dos valores extremos observados. CHAID A técnica CHAID formou igualmente 27 grupos tomando como ponto de partida os 27 clusters. A cada nível a técnica separava os clusters em outros com características semelhantes. Surgiram 27 novos grupos cuja variável com maior poder de discriminação foi o valor. Por meio da Análise de Variância (ANOVA), percebe-se que, como na técnica de Cluster, a recência não exerce influência na formação de segmentos. E, o montante é capaz de diferenciar os grupos entre si. O teste de Scheffe reagrupou os 27 grupos em 2, levando em consideração a variável recência. Já quando a variável testada foi freqüência, o número de grupos formados foi 8. E, o “valor” originou 24 grupos. Coincidentemente à técnica de Cluster, o CHAID apresentou como variável de diferenciação mais forte, “valor”. A recência, por sua vez, apresentou maior dispersão que na técnica de Cluster, formando mais dois novos grupos. Para formulação de estratégias de marketing, a técnica CHAID permite visualizar os clientes de forma genérica e, de acordo com o negócio, agrupa-los diante de características semelhantes. A técnica de CHAID, considerando a distribuição das três variáveis, induz a criação de alguns poucos grupos com muitos casos, por exemplo, os grupos 24,25 e 26 que representam 50% da amostra, aproximadamente, dada a forte dispersão existente na variável que tem o maior poder discriminante, isto é, “valor”. RFV Qtd Casos RFV Qtd Casos 111 770 223 270 112 435 231 30 113 203 232 351 121 49 233 583 122 356 311 257 123 575 312 19 132 1 313 8 133 47 321 262 211 569 322 102 212 104 323 44 213 65 331 194 221 299 332 589 222 474 333 635 13 Conclusão A filosofia de marketing de relacionamento aponta a retenção de clientes como fator essencial para manutenção da posição competitiva de algumas empresas em setores concorrenciais e orientados à fidelização. O marketing de relacionamento tem o papel de conhecer os clientes e trata-los individualmente. Conhecer significaobter o maior número de informações a respeito do cliente. A partir daí, é preciso agrupa-los de acordo com as características semelhantes entre eles, a partir de modelos e técnicas de segmentação de clientes. Modelos RFV são relativamente simples de serem implementados e permitem conhecer o cliente em termos de comportamento de consumo, naquelas variáveis que são mais consideradas como determinantes de repetição de compra. A presente pesquisa buscou comparar a aplicação de três técnicas de segmentação – CHAID, Cluster e Análise Categórica em um modelo de segmentação baseado em RFV, no intuito de evidenciar diferentes formas de se implementar um modelo RFV. Também buscou- se apresentar a capacidade distinta de discriminação de variáveis utilizadas no modelo, dado o seu nível de dispersão. Como direcionamentos para futuros trabalhos podem ser sugeridos: a) a aplicação de modelos RFV longitudinais, onde o efeito da rentabilidade se dá ao longo do tempo, e não simultaneamente, com a recência e a freqüência; b) a aplicação em mercados de produtos, ao invés de serviços, uma vez que há maior clareza no conceito de recência nesse tipo de negócio; c) a avaliação a posteriori dos efeitos trazidos pelo uso de estratégias baseadas em variáveis de recência, freqüência e valor. Como limitações do trabalho, deve-se salientar que os resultados obtidos referem-se ao caso específico utilizado, não podendo ser generalizado para outras instituições financeiras e setores. Também é necessário realçar a limitação metodológica de utilizar como variável categórica, na técnica CHAID, o grupo criado pelo cluster, e o uso de tercis, ao invés de quartis, na técnica de análise categórica de RFV. Referências Bibliográficas AAKER, David A.; KUMAR, V.;DAY, George S. Pesquisa de Marketing. São Paulo: Atlas, 2001. BRETZKE, Miriam. Marketing de Relacionamento e Competição em Tempo Real (Com CRM). São Paulo: Atlas, 2000. BRETZKE, Miriam. O Customer Relationship Management (CRM) na era da competição em tempo real. Disponível em http://www.itcom.com.br. Acesso em 14.11.2002. BROWN, Stanley A. CRM – Costumer Relationship Management: uma ferramenta estratégica para o mundo e-business. São Paulo: Makron Books, 2001. DUFFY, Dennis L. Do something! Guia prático para fidelização de clientes. São Paulo: Fábrica Comunicação Dirigida, 2002. EISENFELD, Beth. The Economics Justification of IT: Exploiting Technology for Business Advantage – CRM 101: The basics. The Gartner´s Group Summit. In 6º Annual CRM User Fórum. Setembro/2002. ENGEL, James F.; BLACKWELL, Roger D.; MINIARD, Paul W. Consumer Behavior. Orlando: The Dryden Press, 1995. FREITAS, Ana Augusta Ferreira; HEINECK, Luiz Fernando Mahlmann. Metodologia de segmentação de mercado pela associação direta entre produtos e clientes. In: ENCONTRO ANUAL DA ASSOCIAÇÃO NACIONAL DOS PROGRAMAS DE PÓS-GRADUAÇÃO 14 EM ADMINISTRAÇÃO. 25o, 2001, Campinas. Anais... Rio de Janeiro: ANPAD, Set/2001. CD-ROM. GIL, Antonio Carlos. Como elaborar projetos de pesquisa. São Paulo: Atlas, 2002. GORDON, Ian. Marketing de Relacionamento: estratégias, técnicas e tecnologias para conquistar clientes e mantê-los para sempre. São Paulo: Futura, 2001. HAIR, Joseph F. et al. Multivariate data analysis. 5a. ed. New Jersey: Prentice-Hall, 1998. HUGHES, Arthur M. Database Marketing estratégico. São Paulo: Makron Books, 1998. INMON, W. H., WELCH, J. D., GLASSEY, Katherine L. Gerenciando Data Warehouse. São Paulo: Makron Books, 1999. KALAKOTA, Ravi; ROBINSON, Márcia. E-business: estratégias para alcançar o sucesso no mundo digital (2 ed.). Porto Alegre: Bookman, 2002. KOTLER, Philip. Administração de marketing: a edição do novo milênio. São Paulo: Prentice Hall, 2000. LAUDON, K.; LAUDON, J. P. Gerenciamento de Sistemas de Informação. Rio de Janeiro, LTC, 2002. MALHOTRA, Naresh K. Pesquisa de marketing: uma orientação aplicada. 3a.ed. Porto Alegre: Bookman, 2001. McKENNA, Regis. Marketing de Relacionamento. São Paulo: Campus, 1992. MIGLAUTSCH, John. Application of RFM principles: what to do with 1-1-1 costumers? Journal of Database Marketing. v.9, n.4, p.319-324, 2002. PEPPERS, Don. One to One – B2B. São Paulo: Campus, 2001. RAPP, Stan; COLLINS, Thomas L. The New Maximarketing. Nova York: McGraw-Hill, 1996. SCOTT, Nelson. Gartner’s CRM Vision: a road for a customer – centric transformation. The Gartner´s Group Summit. In 6º Annual CRM User Fórum. Out/2002. SERRA, Laércio. A essência do Business Intelligence. São Paulo: Berkeley Brasil, 2002. SINGH, Harry. Data Warehouse: conceitos, tecnologias, implementação e gerenciamento. São Paulo: Makron Books, 2001. TAM, Nguyen; BORGES, Adilson. A segmentação de mercado a partir do método fuzzy logic: uma alternativa metodológica para o problema de superposição dos segmentos na classificação. In: ENCONTRO ANUAL DA ASSOCIAÇÃO NACIONAL DOS PROGRAMAS DE PÓS-GRADUAÇÃO EM ADMINISTRAÇÃO. 25o, 2001, Campinas. Anais... Rio de Janeiro: ANPAD, Set/2001. CD-ROM. VAVRA, Terry G. Marketing de relacionamento (After Marketing): Como manter a fidelidade de clientes através do marketing de relacionamento. São Paulo: Atlas, 1993. i Conhecido assim por formar o desenho semelhante a uma árvore ii Chi-Square Automatic Interaction Detection