Baixe o app para aproveitar ainda mais
Prévia do material em texto
Marketing Avançado Capítulo 03: Concepção de Pesquisa Pesquisa de Marketing e Pesquisa de Mercado são sinônimos. Elas envolvem a identificação sistemática e objetiva, coleta, análise, e uso de informação com objetivo de apoiar decisões relacionadas à identificação e solução de problemas e oportunidades em marketing. Após definido um problema de pesquisa de marketing e sua abordagem, o pesquisador deve iniciar um planejamento detalhado de pesquisa. Existem dois tipos principais de concepções de pesquisa: exploratória e conclusiva. Esta última pode ainda ser classificada como descritiva ou causal. A concepção de pesquisa é uma estrutura para a realização do projeto de pesquisa de marketing, na qual são especificados detalhes dos procedimentos necessários para a obtenção das informações indispensáveis para estruturar e/ou resolver problemas. Exploratória Qualitativa (amostra pequena; serve como insights para a Conclusiva) Tipo de concepção de pesquisa que tem como principal objetivo ajudar a compreender a situação-problema enfrentada pelo pesquisador – oferecer discernimento e compreensão. Informações obtidas com tomadores de decisão (TD), especialistas, em bases secundárias podem ser insuficientes para definir o problema da pesquisa. Para obter uma maior compreensão muitas vezes pesquisas qualitativas são ideais. Caracterizada por ser não estruturada, as informações necessárias são definidas de forma ampla; de natureza exploratória e baseada em pequenas amostras, embora não sejam conduzidas de maneira formal, elas oferecem conhecimentos valiosos sobre o problema. Ex: Focus Group Conclusiva Quantitativa (amostra grande) Pesquisa concebida para auxiliar o tomador de decisão a determinar, avaliar e selecionar o melhor curso de ação em determinada situação – testar hipóteses específicas e examinar relações. Metodologia de pesquisa que quantificam dados, tipicamente usando alguma forma de análise estatística. Caracterizada por ser estruturada, e generalista ao identificar resultados de uma amostra para uma população de interesse, elas oferecem uma recomendação de ação ao final da pesquisa. A pesquisa conclusiva pode ser descritiva ou causal. A primeira por sua vez pode ter uma concepção transversal (envolve a coleta de informações de uma dada amostra de elementos da população somente uma vez) ou longitudinal (envolve uma amostra fixa de elementos da população que é medida repetidamente; a amostra permanece a mesma ao longo do tempo, oferecendo uma ilustração vívida da situação e das mudanças que estão ocorrendo ao longo do tempo). Os dados utilizados para ambas as pesquisas podem ser de bases primárias ou secundárias. Ambos possuem vantagens e desvantagens. Isabela Della Torre Vantagens Desvantagens Tipos Primária Atualizados Diretamente relacionados com a pesquisa Mais caro Exige mais tempo para a coleta dos dados Observação Levantamento Experimental Secundária Mais barato Método que exige menos tempo Pode estar desatualizado Os dados podem ser irrelevantes Interno Externo Comparação entre os tipos de concepção de pesquisa: Conclusiva Exploratória Descritiva Causal Objetivo Descobrir ideias e informações. Descrever algo, como por exemplo, características ou funções do mercado. Determinar relações de causa e efeito. Características Flexível; muitas vezes é o ponto de partida de toda a concepção. Formulação prévia de hipóteses; concepção pré- planejada e estruturada. Manipulação de uma ou mais variáveis independentes; medida do efeito sobre as variáveis dependentes e controle de outras variáveis mediadoras. Métodos Entrevistas com especialistas; levantamentos-piloto; estudos de caso; dados secundários: análise qualitativa; pesquisa qualitativa. Dados secundários: análise quantitativa; levantamentos; observações. Experimentos (ex: análise discriminante resort dada em aula) Várias fontes potenciais de erro afetam a concepção de pesquisa, mas é possível controla- las para obter uma concepção que seja adequada. Por exemplo, o erro total é a variação entre o valor médio real da variável de interesse na população e o valor médio observado no projeto de pesquisa de marketing. Esse erro pode ser: Erro de amostragem aleatória – ocorre porque a amostra selecionada é uma representação imperfeita da população de interesse. Definido como a variação entre o valor médio real para a amostra e o valor médio real para a população. Erro não amostral – atribuído a outras fontes que não incluem a amostragem e podem ser aleatórios ou não aleatórios. Erro de não resposta: ocorre quando algumas das pessoas incluídas na amostra não respondem a pesquisa. Pode ser definido como a variação entre o valor médio real da variável na amostra original e o valor médio real na amostra “final resultante” – a falta de resposta faz com que a amostra resultante seja diferente, em tamanho e composição, da amostra pré-selecionada. Erro de resposta: surge de entrevistados que respondem, mas dão respostas imprecisas ou cujas respostas são registradas ou analisadas erroneamente. Pode ser definido como a variação entre o valor médio real da variável na amostra “resultante” e o valor médio observado obtido no projeto de pesquisa de marketing. Uma vez especificada uma concepção de pesquisa que controle o erro total, é preciso tomar decisões de orçamento e programação. Isto é, ferramenta gerencial que ajudar a garantir a conclusão do projeto dentro dos recursos disponíveis, por exemplo, financeiros, humanos, de tempo, etc. Especificando-se os custos de cada tarefa e os parâmetros de tempo dentro dos quais cada tarefa deverá ser concluída, o projeto poderá ser gerenciado de forma eficaz. Uma técnica gerencial útil para tanto é o método do caminho crítico. Este envolve dividir o projeto em suas atividades componentes e determinar sua sequencia e o tempo total que toda atividade irá exigir. Isso será diagramado em um fluxograma de rede, no qual pode ser identificado o caminho crítico, a série de atividades cujo atraso irá deter o projeto. Após formulada a concepção da pesquisa e concluído o orçamento e programação do projeto, deve-se preparar uma proposta de pesquisa de marketing por escrito. Se trate de um layout oficial da atividade planejada de pesquisa para a gerência descrevendo o problema da pesquisa, a abordagem, a concepção, os métodos de coleta, a análise e o relato de dados. Assim, o pesquisador garante que a gerência concorda a respeito da natureza do projeto e possui uma ferramenta de ajuda para vendê-lo à gerência. Capítulo 08: Mensuração e Escalonamento: Fundamentos e Escalas Comparativas Uma vez determinado o tipo de concepção de pesquisa e especificada a informação a ser obtida, o pesquisador deve decidir quanto aos processos de mensuração e escalonamento. Há quatro escalas principais de mensuração: Nominal: números indicam e classificam objetos, servem como rótulos e etiquetas para identifica-los - atribuídos a jogadores de futebol ou números de marcas, por exemplo. Ordinal: números indicam as posições relativas dos objetos, mas não a magnitude das diferenças entre eles - ordem de classificação dos times vencedores ou classificações de preferência, por exemplo. Intervalar: escala em que se utilizam números para pontuar/classificar objetos, de modo que distancias numericamente iguais na escala representem distancias iguais nas características que estão sendo medidas; diferenças entre objetos podem ser comparadas; ponto zero é arbitrário – atitudes e opiniões ou classificação do desempenho em uma escala de 1 a 10, por exemplo. Razão: escala mais alta, que permite ao pesquisador identificar ou classificar os objetos, ordená-los e comprara intervalos ou diferenças; ponto zero fixo, podem ser calculadasas razões dos valores de escala – comprimento, peso, idade, renda, tempo em segundos, por exemplo. Capítulo 19: Análise Fatorial Quais os benefícios procurados por um consumidor de um determinado produto? Muitos atributos. A análise visa identificar uma inter-relação entre benefícios/variáveis atribuindo-as a diferentes “fatores”. Na análise fatorial examina-se todo o conjunto de relações interdependentes entre variáveis. O objetivo é reduzir as variáveis em um número menor de fatores (criação de fatores que expressem constructos subjacentes aos dados). A análise fatorial é uma técnica de interdependência, no sentido de que é examinado todo conjunto de relações interdependentes; Utiliza-se essa análise em circunstâncias como: Identificar fatores que expliquem as correlações entre conjuntos de variáveis. A seguir, essas informações poder ser analisadas fatorialmente para identificar os fatores psicográficos subjacentes. Identificar um conjunto novo, menor, de variáveis não correlacionadas na análise multivariada subsequente (análise de regressão ou discriminante). Ex: fatores psicográficos identificados podem ser usados como variáveis independentes para explicar as diferenças entre clientes fiéis e eventuais. Identificar em um conjunto maior, um conjunto menor de variáveis que se destacam para uso em uma análise multivariada subsequente. No âmbito do marketing, pode ser usada na segmentação de mercado para identificar as variáveis subjacentes segundo as quais se agrupam consumidores; na pesquisa de um produto para determinar os atributos de uma marca que influenciam a escolha do consumidor; em estudos de propaganda para identificar os hábitos de consumo de mídia do mercado-alvo; em estudos sobre preços para identificar as características dos consumidores que são sensíveis a preços. Exemplo feito em sala - Pasta de Dente Deseja-se saber quais são os benefícios procurados por um consumidor de pasta de dentes ao escolher um produto. Amostra aleatória de 30 consumidores Variáveis: V1: É importante comprar uma pasta de dente que previna cáries. V2: Eu gosto de pastas de dente que deixe meus dentes brilhantes . V3: Uma pasta deve fortalecer a gengiva. V4: Eu prefiro uma pasta que refresque o hálito. V5: Prevenção de desgaste do dente não é um benefício importante oferecido por uma pasta de dente. V6: O aspecto mais relevante ao se escolher uma pasta de dentes é garantir dentes atraentes. Passo-a-passo 1º - Import data Data Data Editor Data Editor (Edit) 2º - mdesc – verificar se não tem nenhum missing value 3º - summarize – verificar como as variáveis se comportam e observar escala utilizada 4º - statistics sumaries, tables and tests summary and descriptive statistics correlations and covariances - montar matriz de correlação para ver se existe multicolinearidade. Para que a análise fatorial seja apropriada as variáveis devem ser correlacionadas. Portanto espera-se que as variáveis altamente correlacionadas (≈1 ou ≈-1) umas com as outras se correlacionem também com os mesmos fatores. De acordo com a medida de adequação da amostra de Kaiser-Meyer-Olkin (KMO) um valor superior a 0,5 é desejável. Caso contrário, a análise fatorial pode ser inapropriada. 5º - statistics multivariate analysis factor and principal component factor analysis (OBS: na segunda aba “model2” selecionar o método principal component factor) – construir tabela de Eigenvalue = autovalor e Uniqueness =especificidade. A análise do principal component factor é recomendada quando a preocupação maior for determinar o número mínimo de fatores que respondem pela máxima variância nos dados. Comunalidade = 1 – Especificidade O Eingenvalue representa a variância total explicada pelo fator. Comunalidade é a porção da variância que uma variável compartilha com todas as outras variáveis consideradas. É também a proporção de variância explicada pelos fatores comuns. Em outras palavras, expressa o quanto da variabilidade de Xi é explicada pelo modelo. Portanto, quanto menor a Uniqueness (expressa o quanto da variabilidade de Xi não é explicada pelo modelo) melhor para o modelo já que as variáveis são mais correlacionadas. O critério de Kaiser é utilizado para avaliar a adequação da análise fatorial. Fatores com Eigenvalue maior do que 1 são selecionados como apropriados já que vão explicar grande parte das variáveis. Por exemplo, nesse caso 82,49% do modelo é explicado pelos fatores 1 e 2, em outras palavras os dois primeiros fatores combinados respondem por 82,49% da variância total. Seguindo o critério da parcimônia deve-se escolher o menor número de fatores. 6º - statistics multivariate analysis fator and principal componente postestimation screeplot – consigo determinar o número de fatores relevantes pelo gráfico de acordo com o cumulative value. 7º - statistics multivariate analysis fator and principial componente postestimation rotate loadings – As cargas fatoriais (correlações simples entre as variáveis e os fatores) são rotacionadas. Normalmente antes de fazer a rotação, os fatores são correlacionados com muitas variáveis. Deste modo, raramente os fatores podem ser interpretados. Para facilitar essa interpretação, a rotação faz com que as variáveis fossem significativamente relacionadas com poucos fatores, se possível um. A rotação não afeta as comunalidades e a porcentagem explicada da variância total. Porém a porcentagem da variância explicada pelo fator mudará após ser redistribuída graças a rotatividade dos fatores. Logo diferentes métodos de rotação podem resultar na identificação de diferentes fatores. 8º - statistics multivariate analysis fator and principial componente postestimation loadingplot - conseguir visualizar graficamente os fatores e as variáveis neles “alocadas”. O método mais utilizado é o procedimento varimax. Trata-se de um método ortogonal de rotação, ou seja, onde os eixos são mantidos em ângulo reto, que minimiza o número de variáveis com altas cargas em um fator, melhorando assim a interpretabilidade do mesmo. Neste caso, os fatores passam a ser não correlacionados. O método da máxima verossimilhança supõe que os dados seguem uma distribuição normal multivariada. Já o método do componente principal, baseia-se na análise de componentes principais e não há pressuposição da normalidade das variáveis envolvidas. Na rotação oblíqua os eixos não se mantêm em ângulo reto e os fatores são correlacionados. Logo após deve-se dar nomes aos fatores. A interpretação é facilitada pela identificação das variáveis que apresentam grandes cargas em um mesmo fator. Além das cargas fatoriais, devem ser levadas em conta as correlações entre as variáveis originais, medindo as contribuições individuais de cada variável. Os nomes dados para os fatores sempre devem ser em relação ao consumidor; ex: benefícios à saúde (V1,V3) e benefícios sociais ao consumidor (V2,V4,V6). Exemplo usando o método do vizinho mais próximo, máxima verossimilhança: statistics multivariate analysis factor and principal component factor analysis (OBS: na segunda aba “model2” selecionar o método maximum likelihood factor). statistics multivariate analysis fator and principal component postestimation screeplot statistics multivariate analysis fator and principial componente postestimation rotate loadings (usando 2 fatores) statistics multivariate analysis fator and principial componente postestimation loadingplot Resumo de como fazer a análise fatorial:Fazer exercício Soft Drinks para treinar! Capítulo 20: Análise de Agrupamentos (Cluster Analysis) A análise de Cluster estuda todo um conjunto de relações interdependentes. Busca identificar grupos de consumidores homogêneos dada, por exemplo, a renda e o grau de lealdade. A análise visa fazer uma inter-relação entre todo o conjunto de variáveis sejam estas independentes e/ou dependentes. Em outras palavras a análise visa classificar objetos e aglomerá-los em grupos relativamente homogêneos chamados cluster ou conglomerados chegando a segmentos homogêneos. Ela tem sido utilizada em pesquisa de marketing para vários propósitos, como: Segmentação de mercado onde os consumidores podem ser agrupados com base nos benefícios que esperam da compra de um produto, por exemplo. Compreensão do comportamento do comprador para identificar dentro de cada cluster formado o comportamento daqueles “objetos” ali aglomerados. Identificação de oportunidades para um novo produto; as marcas do mesmo cluster concorrem mais acirradamente entre elas do que com marcas de outros clusters; uma empresa pode analisar suas ofertas atuais comparando-as com as de seus concorrentes, a fim de identificar oportunidades potenciais. Seleção de mercados de teste; cluster de cidades, por exemplo, podem ser úteis para testar estratégias locais de marketing Redução de dados; a formação de clusters pode servir como instrumento de redução de dados para criar clusters ou subgrupos de dados mais fáceis de manejar do que observações individuais. A maioria dos métodos de aglomeração é baseada em algoritmos; Formação de segmentos: 1.Definir uma medida de similaridade ou dissimilaridade entre pares de elementos (indivíduos, famílias, empresas, unidades tomadoras de decisão, etc) depende do tipo de dados disponíveis; as medidas de similaridades não feitas via distâncias euclidianas = distâncias entre os centroides (=valores médios das variáveis para todos os casos em um cluster particular). 2. Escolher um método para prescrever um consumidor para cada cluster (= segmento). Técnicas hierárquicas aglomerativas: Métodos de encadeamento: agrupam os objetos de acordo com a distância entre eles. Método do vizinho mais próximo (single linkage): a distância entre os grupos é igual à menor das distâncias. Método do vizinho mais longe (complete linkage): a distância entre os grupos é igual à maior das distâncias. Método das médias das distâncias (average linkage): a distância entre os grupos é igual à média das distâncias. Método de variância: clusters são gerados de modo a minimizar a variância dentro do cluster. Método de Ward: formam-se clusters baseados na mudança da soma dos quadrados dos erros (ou desvios com relação à media do grupo). Tem como objetivo gerar clusters que minimizem a variância intra-cluster. Métodos centróides: clusters são gerados a fim de maximizar as distâncias entre os centroides dos clusters. Técnicas não hierárquicas: Métodos de partição: particionar as unidades amostrais formando conglomerados com alta coesão interna e isolados. K-means: tentará formar grupos visando obter uma soma de quadrados residual da partição pequena. A construção do dendograma é fundamental já que é um dispositivo gráfico para apresentar os resultados de aglomeração. As linhas verticais representam clusters unidos. Exemplo feito em sala – Compras Deseja-se saber qual a atitude dos consumidores em relação à compras. Amostra aleatória de 20 consumidores Variáveis: V1: fazer compras é divertido V2: as compras afetam meu orçamento V3: combino compras com refeições fora de casa V4: procuro a melhor oferta quando compro V5: não me preocupo com compras V6: podemos economizar bastante comparando preços Passo-a-passo: 1º statistics multivariate analysis cluster analysis cluster data ward’s linkage - Para analisar se as variáveis poderiam ser segmentadas, foi utilizado o método de Ward. 2º statistics multivariate analysis cluster analysis postclustering dendograms - pelo dendograma, concluiu-se que a segmentação deveria ser feita em três partes dado que é possível notar agrupamentos homogêneos distintos. A partir daí utilizaremos o número de grupos definido para fazer as análises (grupos definidos a priori). 3º Agora, preciso criar os clusters com o nome isabela. Para analisar se os clusters se diferem é calculado o cluster centroides o qual da a média das variáveis para cada cluster construído. 4º statistics multivariate analysis cluster analysis cluster data kmeans - outra forma de agrupar os segmentos é pelo método de kmeans. Interpretar e traçar o perfil dos clusters envolve a análise dos centroides (valores médios dos objetos contidos no cluster). Nenhuma solução de aglomeração deve ser aceita sem uma avaliação de sua confiabilidade e validade. Para isso fazer a análise utilizando diferentes medidas de distância e métodos de aglomeração são adequados; ao compara-los que eles levam a resultados parecidos. Estes, não são exatamente iguais, pois os métodos utilizam algoritmos distintos. É bom analisar o conjunto de dados empregando diferentes métodos para analisar a estabilidade das soluções de aglomeração, isto é, é uma forma de ver se a clusterização feita é robusta ou não. 5º statistics – multivariate analysis – MANOVA, multivariate regression, and related MANOVA - utilizo para comparar as médias das variáveis nos clusters. Assim quando p- valor<5% o meu modelo é bom para ser utilizado, ou seja, as médias não são muito próximas. A única diferença entre MANOVA e ANOVA é que a primeira é análise múltipla de variância, ou seja, age como se fosse uma matriz (analisa relações entre todas as médias das variáveis). Resumo de como fazer a análise de cluster: Fazer exercícios Dell Case para treinar! Capítulo 18: Análise Discriminante e Análise Logit Análise Discriminante A análise discriminante é uma técnica para analisar dados na pesquisa de marketing em que a variável dependente ou de critério é categórica e as variáveis previsoras ou independentes têm natureza intervalar. O seu objetivo é estabelecer uma combinação linear entre variáveis independentes, que melhor discrimina as categorias da variável dependente - variável resposta - (grupos); além de verificar se existem diferenças significativas entre os grupos, desde modo é possível descrever os segmentos identificados. Em outras palavras, a análise visa identificar qual é a variável importante para separar os grupos Quanto menos multicolinearidade melhor, pois assim é mais fácil de separar os grupos. A variável dependente pode envolver duas categorias ou três ou mais categorias. Quando a variável dependente é binária, o modelo logit também pode ser usado ao invés da análise discriminante de três grupos. Exemplo da aula: Visitas a Resort Variável resposta: se a família visitou um resort nos últimos dois anos ou não (2 categorias: sim,1 ou não,2) e qual o gasto com férias (3 categorias: 1-low, 2-medium, 3-high). Variáveis independentes e potenciais variáveis discriminantes: Renda anual familiar, atitude em relação à viagens (Likert 1-9), importância dada a viagens em família (Likert 1-9), tamanho da família e idade do chefe de família. Passo-a-passo: 1º mdesc e summarize 2º tabstat 3º multivariate analysis discriminant analysis canonical linear discriminant analysis (seleciono as variables, e no group variable coloco visit) Preciso padronizar os coeficientes, pois multiplico pela variável padronizada (média=0, dp=1). O padronizado me permite comparar para ver qual variável é a mais influente, mais importante (maior coeficiente). Probabilidade>f tem que ser menor do que 5%, assim essa função discriminante discrimina. Não rejeito a Ho, parto da premissa que a função é discriminante. A correlação canônica ao quadrado (0,8)^2 = 0,64 se desse 1 seria perfeito; é como se fosse o R2 de estatística. A função discriminante está discriminando os dois grupos com acerto de 64%. Matriz de confusão os casos corretos é soma da diagonal = 12+15=27 a função colocou no grupo 1, 12 respondentes; 12 indivíduos realmente condizem com as características daquele grupo, e 0 deles não condizem com as variáveis daquele grupo. Já 18 foram colocados no grupo 2, 15 deles realmente condizem com as características daquele grupo, e 3 deles não condizem com as variáveis daquele grupo Total de casos 30. Acertos 90% (27/30). 4º statistics multivariate analysis postestimation reports and statistics Anova Tanto o coeficiente padronizado como a correlação (com a variável dependente) da matriz mostram a importância daquela variável em explicar a função discriminante. Se f > 5% portanto a Ho é rejeitada, essa variável não é significante para a discriminação da função discriminante. A partir disso eu posso fazer igual fazia em Econometria, tiro as variáveis com maior p-valor e rodo o modelo novamente. 5º statistics multivariate analysis postestimation reports and statistics canonical coefficients (loadings) display unstandardlized. Consigo achar o coeficiente despadronizado, assim posso multiplicar as respostas de um determinado consumidor para cada variável pelos coeficientes e somo a constante. Terei um resultado próximo de 1 (se for uma pessoa que vai) ou 2 (se for uma pessoa se não vai). Utilizo esse método para prever futuros consumidores. Agora utilizarei 3 categorias, ao invés de usar visita vou usar gasto em férias (1-low,2 -médium, 3-high). Preciso de n-1 funções, portanto nesse caso duas. 6º multivariate analysis discriminant analysis canonical linear discriminant analysis (seleciono as variáveis e coloco amount) A probabilidade de f deu maior que 5%, portanto a função 2 não é estatisticamente relevante, não é discriminante. Tenho alguns coeficientes negativos, portanto quando maior o tamanho da minha família menor a minha propensão a gastar com férias, por exemplo. A correlação canônica ao quadrado (0,89)^2=0,7921 A função discriminante 1 está discriminando os três grupos com acerto de 79%. A correlação canônica ao quadrado (0,44)^2=0,1936 A função discriminante 2 está discriminando os três grupos com acerto de 19%. Matriz de confusão os casos corretos é soma da diagonal = 9+9+8=26 Total de casos 30. Acertos 86% (26/30). 7º statistics multivariate analysis postestimation reports and statistics Anova Income e travel são altamente significantes. 8º statistics multivariate analysis postestimation reports and statistics canonical coefficients (loadings) display unstandardlized. COMPARAÇÃO ENTRE AS TRÊS ANÁLISES ESTUDADAS: Modelos de Demanda de Escolha Direta *Modelo Logit Binomial (variável dependente não é contínua, é binária) Quando a variável dependente é binária como 0 ou 1 e há muitas variáveis independentes que são métricas (ou dummies), além da análise discriminante é possível o modelo logit. O modelo logit binário ou regressão logística geralmente trata do quanto é provável que uma observação pertença a cada grupo, estimando a probabilidade de uma observação pertencer a um determinado grupo. Análise Fatorial Análise de Cluster Análise Discriminante Analisa todas as variáveis e as reduz em fatores Pega o grupo de respondente e os agrupa em grupos homogêneos. Analisa a variável dependente e tenta identificar a variável que separa os grupos Tem como objetivo estimar o impacto na demanda de uma marca pela alteração de variáveis estratégicas (ex. preços) da empresa, de seus concorrentes ou do ambiente (impacto na decisão do consumo: Elasticidades – impacto de uma variação no preço na demanda). Ou seja, identificar quais são as variáveis de escolha. Quais fatores levam ao aumento ou diminuição de vendas? Ofertas de preços e atividades de trade marketing dão retorno? Com o Plano de Marketing X, qual a probabilidade de um consumidor comprar da nossa empresa? E se mandarmos uma mala direta? E se o preço for P? etc Para conseguir responder a essas perguntas, o administrador deve entender como programas de marketing afetam a probabilidade individual dos consumidores de comprar a marca, o impacto das decisões e ser capaz de estimar o retorno financeiro desses programas ROI das ações de marketing. Problema: nem sempre os consumidores revelam em pesquisas o que realmente eles fazem: 1. Consumidores tendem a ser mais “racionais” quando respondem a questionários do que na hora da compra ou do consumo. 2. Ao responder perguntas os consumidores não são forçados a escolher entre atributos (não há trade-offs). Uso de modelos de escolha discreta para targeting: Dados de preferência revelada como históricos de compras dos consumidores, ou…dados provenientes de mailings / surveys para consumidores potenciais. Usar modelos de escolha discreta, como logit, para estimar o impacto de variáveis independentes na decisão do consumidor. Baseado nas estimativas do modelo, computar um escore que indique a probabilidade de resposta (ex. probabilidade de compra de uma marca). Classificar os consumidores em grupos de acordo com os seus escores. Fazer uma análise de lucratividade para determinar para quais grupos se deve concentrar a ação de marketing (ex. envio de brochuras). Preferências Declaradas vs. Preferências Reveladas •Needs-based segmentation: baseada em dados de survey; o consumidor declara o que prefere e o que vai fazer. •Choice-based segmentation: baseada em dados de compra (ex. dados de scanner ou dados de experimentos); observamos o que o consumidor comprou ou fez ex: Pão de Açucar usa o CRM como base de dados para traçar perfis dos clientes. Quando eu estou em uma baixa probabilidade preciso de muito esforço para promover meu produto; quando estou próximo a 50% um esforço menor leva a maiores resultados Exercício: Escolha por duas marcas de ketchup Hunt’s ou Heinz? Se os supermercados oferecerem Heinz ou Hunt’s ao mesmo preço, qual será a marca líder no mercado? O que se pode concluir sobre o efeito de atividades de Trade Marketing em lojas na decisão de compra de Heinz e Hunt’s? Variáveis analisadas para cada marca: •Preços •Display: produto em ponta de gôndola ou algum tipo de merchandising na loja •Feature: presença de propaganda na loja •Feature e display: as duas ações em conjunto 1º passo: por ser um logit binomial as variáveis são dummies onde 1 quando o dislplay estava presente e 0 quando o display estava ausente (idem para feature e feature e display); já a variável preço deve-se fazer a relação de preços das marcas fazendo ln dos preços, de modo a não alterar os resultados além de trazer uma maior sensibilidade. Deste modo posso transportar para o stata. 2º passo: mdesc 3º passo: summarize Nesse caso a média é o mkt share (89%Heinz e 11% Hunt’s) 4ºpasso: statistics binary outcome logistic regression O Pseudo R2 = 0,30 é ok na medida em que equivale a um R2 simulado, ou seja, mede a adequação do modelo, e a prob>chi2 é boa. Lembrando que ln_price_dif_ = ln Heinz – ln Hunt’s, essa variável é significativa e o coeficiente desta é negativo, portanto essa variável contribui negativamente para a escolha. Já featdisplheinz não é signiticativa para explicar a escolha pela Heinz. Analisando os demais coeficientes sabe-se que display também é importante, porém preço é mais.Lembrando que a probabilidade de escolha da Hunt’s é 1 – probabilidade de escolha da Heinz 5ºpasso: statistics postestimation binary outcome goodness (na aba Main: seleciona a primeira opção e utiliza estimation sample) Soma da diagonal, dividido pelo total de observações resulta no total de acertos. Embora o R2 não foi muito bom, teve uma porcentagem de acerto grande. Portando o modelo é adequado. 6ºpasso: montar o gráfico com a curva da probabilidade de comprar – predict prob (criar coluna de probabilidades de comprar Heinz); fazer um gráfico para ajudar a interpretar a probabilidade – graphics twoway graph create Y: prob X: ln_price_dif_ O gráfico da direita é mais fácil de interpretar. Quando ln x – ln y =0, os preços são iguais; com display sempre a chance de comprar é um pouco maior. Quando ln x – ln y = 1, a elasticidade preço é grande. Caso eu queira a probabilidade numérica entro no Data Editor e terei a probabilidade de compra da Heinz para cada indivíduo. Exercício: Lealdade à marca 1ºpasso: mdesc 2ºpasso: summarize 3ºpasso: statistics categorical outcomes multinomial logistic regression (variável dependente: loyalty) O R2 nesse caso não é muito bom, mas é considerado ok (o ideal seria 1). Já o p-valor das variáveis product e shopping são> 5% e, portanto, não são significantes para explicar a lealdade à marca deveria tirar essas variáveis e rodar de novo. 4ºpasso: statistics postestimation binary outcome goodness (na aba Main: seleciona a primeira opção e utiliza estimation sample) Interpretação dos coeficientes: Se a marca aumentar em uma unidade, o Ln da probabilidade (“log odds”) aumentará em e^1,27 unidades, quando o efeito das outras variáveis independentes é mantido constante. O sinal desse coeficiente determinará se a probabilidade aumenta (se o sinal for positivo) ou diminui (se o sinal for negativo), nessa quantidade. lembrar exercício da lista 2 O modelo teve 80% de acerto, o que é considerado bom, dado o R2 apresentado. *Modelo Logit Multinomial Neste caso, a variável dependente tem mais de duas alternativas (escolha segue discreta) e existem diversas variáveis independentes métricas ou dummies. Este modelo vai estimar a probabilidade de uma observação pertencer a um determinado grupo. Exercício da Lista 2: Painel de Biscoitos a) Qual o market share de cada marca, preço médio pago pelos consumidores por cada marca e o percentual de vezes que o consumidor vê um display ou uma propaganda da marca na hora da compra? A partir das saídas do stata é possível montar outras tabelas para melhor visualizar o Market share, preço médio pago e percentual de vezes que o consumidor vê um display ou uma propaganda das marcas na hora da compra: Stats Private Sunshine Keebler Nabisco Sum 1035 239 226 1792 N 3292 3292 3292 3292 Market Share 31,43% 7,26% 6,86% 54,43% Stats Private Sunshine Keebler Nabisco Preço médio $0,68 $0,96 $1,10 $1,10 Stats Private Sunshine Keebler Nabisco Sum 117 71 86 160 N 3292 3292 3292 3292 % de display/propaganda 3,55% 2,15% 2,61% 4,86% Portando a primeira tabela mostra a quantidade de vezes que uma marca foi consumida e o número total de compras observadas, onde a Nabisco possui o maior Market share com 54,43%. A segunda tabela gera novamente o total de observações e quantos atos de compra existiram dada à presença de propaganda ou display. Novamente a Nabisco e a Private estão na frente onde 4,86% e 3,55% das compras foram efetuadas após o consumidor ver um display e/ou propaganda, respectivamente. Por fim, a última tabela dá o preço médio dos produtos das marcas em destaque. b) Analise a discriminação da escolha da marca em relação aos preços das marcas do mercado. As variáveis utilizadas para servirem como base da segmentação foram: obs – mostra a observação gravada, household – identifica o consumidor, lastpurchase – indica a última compra, os nomes das marcas private, sunshin, keebler, nabisco – indicam a marca comprada, price e featuredisplay – corresponde ao conjunto promocional total. Para ver se existiam missing values, foi utilizado o comando mdesc que gerou a tabela a seguir: A partir da tabela, pode-se concluir que para todas as variáveis selecionadas não existe missing value. Para verificar como essas variáveis se comportam, foi utilizado o comando summarize e construído histogramas para as variáveis preços das marcas. Com a tabela, pode-se ver que a maioria das variáveis são binárias, ou seja, 0 quando não ocorreu a compra ou a presença daquela variável e 1 quando aquela variável estava presente. Também é possível olhar a média das variáveis. Para household esta é inútil já que não traduz nada além da identificação do consumidor. A média do price é realmente uma média de preço, nota-se, portanto, que o em média mais barato é a marca private e o keebler mais caro a $1,12. Ao analisar os histogramas dos preços das marcas, é possível confirmar o que foi citado anteriormente ao visualizar a frequência dos diferentes preços praticados. A marca Nabisco pratica o preço dentro de um menor intervalo de variação, já a marca Private tem uma maior concentração em torno de R$0,68. Para fazer uma análise discriminante da escolha das marcas em relação ao preço, posso utilizar a ferramenta tabstat, porém antes disso preciso criar uma coluna chamada marcas para identificar a escolha de cada consumidor. Isso foi feito pelo comando: generate marcass = 0 if private == 1 (2257 missing values generated) replace marcass = 1 if sunshine == 1 (239 real changes made) replace marcass = 2 if keebler == 1 (226 real changes made) replace marcass = 3 if nabisco == 1 (1792 real changes made) A partir daí, posso fazer uma análise canônica com uma divisão proporcional das probabilidades. O standardized canonical discriminat function, nos mostra um coeficiente padronizado o qual permite comparação para ver qual variável é a mais influente, mais importante (maior coeficiente). Além disso, as probabilidades das funções quando menores do que 5%, nos dizem que a função discriminante discrimina. Já a matriz de confusão, mostra os casos corretos na soma da diagonal (199+21+1627=1847) a primeira função, respondente a marca Private teve 1035 respondentes; 199 indivíduos realmente condizem com as características daquele grupo, e o restante não condiz com as variáveis daquele grupo. Já 239 foram colocados no grupo seguinte (Sunshine), 21 deles realmente condizem com as características daquele grupo; a marca Keebler teve 0% de acertos e segue assim o raciocínio. O total de casos é de 3292, onde obteve-se um nível de acerto mediano de 56,1% (1847/3292). Daí pode-se afirmar que o preço sozinho não é suficiente para explicar a escolha da marca. Para identificar a relevância das variáveis, e validar a análise foi feita uma ANOVA: Como f < 5% portanto a Ho não é rejeitada, ou seja, essa variável é significante para a discriminação da função discriminante, porém elas não explicam tudo. c) Estime o impacto das variáveis (preço, display, feature e feature and display) na demanda por marcas. Para estimar o impacto das variáveis na demanda por marcas foi utilizado a análise de regressão multinominal logistica abaixo: Ao analisar a saída do Stata, como o p-valor < 5% pode-se dizer que as variáveis em questão influenciam a escolha da marca. Vale ressaltar que as constantes representam o valor das marcas Sunshine, Keebler e Nabisco respectivamente em relação à base Private. Dito isso, o brand equity da Nabisco é melhorque o das outras companhias já que possui o maior coeficiente. Os coeficientes negativos significam que o valor é menor do que sua base, no caso a marca Private. Porém, deve-se também analisar o p-valor das variáveis. A partir de então, a marca Keebler não deu significante, portanto não é possível tirar conclusões concretas. A presença de display aumenta a venda, uma vez que o coeficiente é positivo, entretanto ele também não deu significativo já que seu p-valor é maior do que 5%. Por fim, o preço se mostrou ser significativo e é a variável mais importante. d) Interprete o sinal e a significância do efeito marginal de cada variável na probabilidade de escolha das marcas de biscoito. Explique porque o sinal do coeficiente estimado de cada variável já indica qual o sinal do efeito marginal dessa mesma variável. Sabe-se que ao elevar “e” ao coeficiente encontrado na análise de regressão multinominal logistica acima encontra-se o odds ratio, ou seja, a probabilidade de escolha das marcas de biscoito. O efeito marginal mostra o efeito na escolha da marca dado o aumento de 1 unidade nessa variável, tudo mais constante. Portanto ao interpretar o sinal dos coeficientes das variáveis nota-se que os números negativos resultam em um menor impacto no efeito marginal dessa mesma variável na probabilidade de escolha das marcas. Fato este explicado já que “e” elevado a um coeficiente negativo, resulta em um número 1/e^coeficiente (ex: e^-3 = 1/e^3). Portanto, as variáveis com um maior efeito marginal na escolha das marcas são Const3(Nabisco), feat e featdispl. Entretanto, como já dito anteriormente, a variável display não se mostrou significante não podendo, portanto, tirar conclusões concretas sobre ela. e) Estime o brand equity relativo a cada marca. As duas questões discutidas anteriormente são essenciais para a discussão do brandy equity das marcas de biscoito. Uma vez que os “Brand Equity” são os interceptos da CLogit, ficou claro que o valor da marca Nabisco possui um maior impacto no efeito marginal dessa mesma variável na probabilidade de escolha das marcas. Além disso, o brand equity da Nabisco é melhor que o das outras companhias já que possui o maior coeficiente positivo depois de feita a análise de regressão multinominal logística (os coeficientes negativos significam que o valor é menor do que sua base, no caso a marca Private). Portanto a probabilidade de alguém escolher essa marca de biscoito é maior perante as demais. Em seguida, utilizando os mesmo critérios, aparecem as marcas: Private, Keebler e Sunshine. Variável Coeficientes Exponencial Const 1 -0,6602 0,5167 Const 2 -0,1674 0,8459 Const 3 1,7966 6,0291 Price -3,126 0,0439 Disp 0,0025 1,0025 Feat 0,4475 1,5644 Featdisp 0,6124 1,8449 Capítulo Mapas Perceptuais e de Preferências Como consumidores percebem o posicionamento de nossa marca? Os mapas perceptuais têm por objetivo mapear a percepção dos consumidores sobre atributos de produtos existentes e novos conceitos; a percepção da similaridade entre marcas; preferência por produtos; e medidas de respostas comportamentais de consumidores com relação ao produto. Primeiramente deve-se relembrar o conceito de posicionamento: é o ato de desenvolver a oferta e a imagem da empresa, de maneira que ocupem uma posição competitiva distinta e significativa nas mentes dos consumidores do público alvo. Para isso deve-se selecionar os atributos e benefícios com base no segmento alvo. O posicionamento de um produto tem sucesso quando os benefícios do produto estão na mente do consumidor de modo correto, estes são considerados relevantes, exclusivos (difíceis de copiar – análise VRIO), e são comunicados com clareza trazendo rentabilidade para a empresa. Portanto, uma empresa só tem sucesso se ela tem uma vantagem competitiva sustentável. Análise competitiva: Características relevantes – referência: natureza da concorrência (quando você estabelece uma estrutura de referencia você também estabelece seus concorrentes), mercado-alvo; spill- over dou o tiro no publico alvo, mas sempre acaba alcançando pessoas fora do público alvo. O OMO quer vender pra classe C, mas ele tem um preço mais elevado devido ao posicionamento que conseguiu alcançar. “Omo lava mais branco; se sujar faz bem”. Ponto de paridade – comuns: são necessários, base da concorrência; ex: Pepsi e coca são bem parecidos Ponto de diferenciação: são desejáveis e possíveis de entregar; ex: Pepsi, foca mais em um público jovem. Um bom posicionamento deve conter: Para (público alvo) nossa (marca) é (conceito) que (ponto de diferença). Para analisar o mapa perceptual deve-se ver a projeção do ponto no eixo (fatores que + explicam) e não a distância. Os tamanhos dos vetores indicam as forças daqueles atributos/variáveis, ou seja, em qual direção ele está crescendo. Ex: Tam, Azul, Gol, Avianca precisa de um gráfico com 4 eixos (pontualidade, serviço, conforto e conveniência). Atributos que são, ao mesmo tempo, relevantes e próximos aos eixos principais, ajudam a determinar o significado desses eixos. Para posicionar uma companhia em um atributo, desenhe uma linha perpendicular entre a sua localização e o atributo (projeção ortogonal). Se eu comparar entre quadrantes, consigo ver quem são os concorrentes diretos (olho quem está plotado ao redor daquela marca). Existem dois modelos de preferências: o modelo de preferência ponto ideal onde existe um máximo para preferência daquela variável (ex: doçura); e o modelo de vetor de preferência (acima ilustrado), o qual mostra níveis e variáveis de preferência (ex: rapidez de um serviço). Se for um joint-space usando pontos ideais como a figura abaixo o círculo maior representa uma maior concentração de clientes (cluster) e cada ponto um respondente. Portanto nesse mapa de posicionamento as marcas se diferem. O tamanho da bolinha indica a importância do cluster, portanto nessa região tem a maior concentração de clientes. Nesse caso, Budwieser está mais bem posicionada para atender esse grupo de pessoas. No gráfico da direita devo projetar as bolinhas dos atributos no vetor de preferência. Quanto mais pra baixo melhor, portanto a Samsung é preferida nesse caso. Preferência não tem muito a ver com o racional, é simplesmente a escolha do consumidor. Já nesse último joint space usando vetor de preferência de 25 respondentes, cada vetor é um respondente; o tamanho da flecha mostra a convicção dos valores, portanto quando o vetor é muito grande significa que ele é “dentro” de daquele quadrante. Como cada vetor é uma pessoa, a Budweiser é a melhor já que possui mais e maiores (com convicções mais claras) vetores próximos a ela. Exercício Lista 2: Office Star Materiais de Escritório – Posicionamento de Marca Descrição: Possuem respectivamente os dados originais sobre percepção e preferência e o mapa perceptual e de preferência da loja da Office Star e de seus concorrentes. a) Qual o significado do percentual que está indicado nos eixos do mapa? Após realizar uma análise qualitativa ou fatorial, chega-se a conclusão dos fatores que explicam de melhor forma as variações que constam no modelo. Os fatores que constam nos eixos do mapa foram selecionados por possuírem os maiores autovalores, sendo as porcentagens presentes, o percentual que cada fator explica da variância total do modelo. Portanto, nota-se que a Dimensão I explica 66,9% da variância do modelo. Os outros 30,8% da variância do modelo é explicada pela Dimensão II. b) Qual é o percentual de variação total dos dados explicados por esse mapa bidimensional? Em sua opinião esse mapa representa bem as percepções dos consumidores nesse mercado? Explique. O percentual de variação total dos dadosexplicados pelo mapa bidimensional é a soma dos fatores expressos nos eixos do mapa: 66,9 + 30,8. Ou seja, 97,7%. Consideramos 97,7% um valor bastante significativo para afirmar que o mapa perceptual represente bem as percepções dos consumidores nesse mercado. Concluímos isso, uma vez que um terceiro fator acrescentaria apenas 2,3% na variância total, o que consideramos pouco. c) O que se pode concluir sobre o posicionamento da Office Star a partir da análise do mapa perceptual? A partir da análise do mapa perceptual, observando a proximidade da marca aos vetores, conclui-se que os consumidores percebem o direcionamento da Office Star para qualidade no serviço. Junto a qualidade de serviço, nota-se a percepção positiva dos clientes quanto a grande variedade e boa qualidade dos produtos. No entanto, observa-se a percepção dos clientes perante a Office Star como uma marca que entrega produtos caros e com baixa conveniência. Portanto, agrupando e analisando as percepções dos clientes (uma marca que entrega bom serviço com qualidade e variedade dos produtos, vendidos com preços altos e em poucos pontos) conclui-se que a Office Star tem um posicionamento TOP no setor de materiais de escritório. Analisando o posicionamento da Office Star perante seus concorrentes, nota-se que a empresa está bem posicionada em seu segmento alvo, líder de preferência. Observa-se que não há proximidade de concorrentes que busquem as vantagens competitivas almejadas pela Office Star e que existe uma grande tendência de preferencias das percepções dos clientes “ao redor” da empresa. Capítulo 21: Análise de Preferência Conjunta Como podemos alterar atributos do produto com base na percepção dos consumidores? Uma empresa aérea deve oferecer mais entretenimento ou espaço para as pernas? (trade-offs) O objetivo da análise de preferência conjunta é criar funções de utilidade que avaliam a importância relativa que clientes percebem nos atributos do produto (baseado em utilidade). Em outras palavras a técnica procura determinar a importância relativa que os consumidores dão a atributos relevantes, para avaliar um determinado produto e a utilidade (preferência) que os consumidores associam aos níveis desses atributos Trade-offs entre atributos. Assim, os resultados auxiliam a decisão dos atributos que devem ser projetados para o novo produto com o objetivo de maximizar o desempenho esperado no mercado (levando também em conta os concorrentes). A análise conjunta vem sendo utilizada em marketing como: Avaliar a importância relativa dos atributos no processo de escolha do consumidor. Estimar a participação de mercado de produtos que diferem nos níveis dos atributos (simulação). Determinação do produto de maior preferência. Segmentação do mercado baseada na preferência pelos atributos (bases de segmentação). Exercício: Tênis Um fabricante de tênis deseja projetar um produto que tenha uma boa aceitação no mercado. Para tanto, ele quer saber quais são as características de um tênis que um consumidor leva em conta no momento da compra. De acordo com a tabela acima, o tênis possui três atributos: sola cobertura e preço e dentro de cada atributo tenho três níveis. Atributos = características que descrevem o produto Níveis = números de diferentes valores do atributo Perfil = uma combinação de atributos, cada atributo em nível específico, apresentado ao respondente para uma avaliação (ou preferência declarada) Conjunto de escolhas/Bundles = perfis pre-especificados apresentados ao respondente para fazer uma pseudo-escolha (escolha declarada). São colhidos dados de consumidores sobre preferências gerais com relação às cestas (bundles) de atributos (produtos). Essas preferências são decompostas em valores de utilidades (part- worths) que o consumidor atribui a cada nível de cada atributo. Métodos de coleta de dados: Escala métrica: –Atribua uma nota de zero a cem a cada perfil refletindo a probabilidade de comprar o produto. Escala não-métrica: –Ordene os produtos (perfis) segundo a sua preferência (avaliação por postos) –Classifique cada um dos produtos (perfis) em •compraria certamente •provavelmente compraria •talvez comprasse •provavelmente não compraria •não compraria certamente Para coletar as utilidades do consumidor seria possível fazer 27 combinações diferentes conforme a abordagem pareada (pairwise approach), como mostra a tabela abaixo: Entretanto na vida real coletar esse número de dados com diversos consumidores seria inviável. Para facilitar, existe uma outra abordagem, conhecida como abordagem de perfil pleno, onde somente faz-se o número ideal de “bundles” a soma dos níveis, nesse caso 9. Avaliação pela escala gráfica Escala Likert Devo atribui um código numérico para cada nível de tênis para então calcular utilidades distintas para cada nível (a variável dependente é a preferência ou a intenção de compra). O modelo de análise conjunta expressa a relação fundamental entre atributos e a utilidade em análise conjunta. O procedimento utilizado para estimar o modelo é a regressão com variáveis dammy. Sendo n a quantidade de níveis existentes, preciso de n-1 dummies, no caso 2. Utilizando de mínimos quadrados ordinários com variáveis dummy obtém-se o seguinte modelo estimado: Os níveis dos atributos cobertura e preço foram codificados de maneira similar. Os parâmetros foram estimados como segue: Os coeficientes negativos mostram que aquele nível de atributo não é muito importante para o consumidor, e/ou são menos importante do que a base. A somatória é zero exatamente porque a soma dos alfas igual é zero é de origem arbitrária. Percebe- se que este entrevistado acusa maior preferência para uma sola de borracha na avaliação do tênis. Borracha – Plástico = b1 Poli – Plastico =b2 Sola Cobertura Preço É possível calcular os intervalos dos part-worths, no caso Como demostrado acima, a importância relativa é calcula pela divisão entre a amplitude dos alfas para cada atributo e o Part-Worth total. Interpretando os resultados gerais na tabela abaixo, nota-se que a primeira preferência é pela sola de borracha, a segunda é para uma sola de plástico, e a sola de poliuretano é a de menor preferência. A parte superior de couro é a que tem maior preferência, seguida por lona e nylon. O preço preferível com maior utilidade é o mais baixo. Como já dito anteriormente, em termos de importância relativa dos atributos, preço é o mais importante seguido por sola e cobertura. Portanto essa pessoa pode ser rotulada como sensível ao preço. É mais conveniente fazer os gráficos das funções de valores parciais abaixo para melhor interpretar os resultados. Por fim, para avaliar a confiabilidade e a validade dos resultados de uma análise conjunta, deve-se olhar o 𝑅2 da regressão, o qual indica o grau de aderência do modelo aos -0,556 0,778 1,334 28,6% é a utilidade relativa do atributo sola. Nota-se que em termos de importância relativa dos atributos, vê-se que o preço é número um, sola o segundo e por fim cobertura. dados; olhar a correlação entre a utilidade estimada pelo modelo e as preferências declaradas; se a análise foi feita no agregado, pode-se dividir amostra em duas para reestimação e os resultados comparados para avaliar a estabilidade das soluções da análise conjuntas. No exercício obtivemos um R2 de 0,934, o que indica um bom ajuste. Exercício: Designing a frozen pizza Core Product ou Núcleo do Produto: o aspecto mais fundamental do produto – a necessidade ou desejo que satisfaz o consumidor ao comprar o produto. espera-se que o produto seja o que é esperado é ex:caneta, espera-se que a caneta escreva. O que eu objetivo no produto, o aspecto mais fundamental do produto. “Na fábrica, nós produzimos cosméticos; na loja, nós vendemos esperança” (Charles Revson da Revlon) Produto Tangível ou Básico: consiste em características, estilo, nível de qualidade, marca e embalagem; é o produto mais convencional ex: caneta é composta por plástico, tinta, etc. Produto Ampliado: inclui características e serviços adicionais ao produto; ex. SAC, guias de instalação, garantias e serviços pós venda. Processo de desenvolvimento de novos produtos: Mapeamento Reverso: determinar valores de características físicas/objetivas de um produto para atingir uma posição predeterminada no espaço/mercado. Solução: o pesquisador pode determinar uma função que relacione características/atributos a preferências ou percepções por um novo produto. Função utilidade (função de preferência) o pesquisador pode definir o nível dos atributos de um produto para que o consumidor atinja um determinado nível de utilidade. Modelos para desenho de produto: Para commodities com apenas um atributo diferenciador (ex. preço), como saber qual é a marca que o consumidor escolherá? 𝑝𝑎>𝑝𝑏 ↔ 𝑢𝑎<𝑢𝑏 Essa análise funciona bem quando tenho uma função de utilidade, ou seja, existe um nível de atributos em que o consumidor atinge um nível de preferência determinado. Existem dois métodos para definir os perfis (cestas/bundles de atributos). I. Desenho fatorial completo (full-factorial design) número de perfis = 𝑀𝐾 II. Desenho fatorial fracionado (fractional-factorial design): combinações ortogonais de níveis dos atributos Reduz o número de perfis, mas ainda permite a estimação das contribuições independentes de cada atributo à função utilidade. Utilizando o desenho fatorial completo, um total de 216 (multiplicação de todas as possibilidades de atributos: 3x4x3x2x3) tipos de pizza podem ser desenvolvidas. O consumidor deve dar notas de 0 a 100 para cada atributo – tem que somar 100. E dentro de cada atributo devo dar 0 para aqueles que valem menos e o limite dado anteriormente para a mais valiosa. Ex: massa = 20 pan 0; thin 20; thick 10 Exercício: Case Forte Hotel Um grupo quer oferecer charme e confiança de hotéis europeus nos EUA; eles identificaram 5 atributos (com vários níveis) que os clientes mais valorizam na escolha do hotel. Eles querem saber que tipo de hotel deveria ser instalado na região. Price, Location and Brand Name 3 principais razões de escolha Decidiu explorar as preferências do consumidor a partir de 5 atributos chaves: room type (small suite, large room, office room); business amenities (www access, speaker phone, room fax); leisure facilities (exercise room, pool, exercise room+pool); conveniences and extras (shoe shine, tape library, fruit and cheese, newspaper); and restaurants and dining (yes, no). Dentro de cada atributo existem diversos níveis. O ideal seria ter o mesmo número de níveis, porém quando a diferença é pequena não é tão grave. Seria possível fazer 216 combinações; mais existe um “macete”: faz-se o número ideal de “bundles” a partir da soma dos níveis = 16. Foi feita uma análise conjunta para identificar uma “maneira científica” para: qual é o novo produto; Existem dois métodos: *Posso dar notas que somem 100 para os atributos e para os níveis dou o maior valor para o mais preferível e 0 para o menos (zero relativo, pois preciso colocar isso em uma escala) e um valor intermediário para os demais. Ex: room type 40 small suíte 40, large room 20, office 0. A partir daí eu monto as notas do bundles. *Posso dar notas aleatórias para os bundles de acordo com minha percepção, e ai o computador vai dar as notas pra cada atributo e pra cada nível. Processo inverso do método anterior. Exercício Lista 2: Calças jeans – Características Relevantes Dados: uma marca de roupas quer entender quais características são mais importantes para seus clientes na hora de decidir qual calça jeans comprar. Dentre as características pesquisadas estão elasticidade (baixa e alta), cor (escura e clara) e corte (cintura baixa e cintura alta). Análise de preferência conjunta: consideramos elasticidade (baixa e alta), cor (escura e clara) e corte (cintura baixa e cintura alta) como atributos e seus níveis estão dentro dos parênteses. Uma vez coletados os dados para os consumidores calculou-se a utilidade. Utilidades Estimadas (Part-worths) Elasticidade Corte Cor Baixa 0,75 Cintura Baixa 1,75 Escura -1,00 Alta -0,75 Cintura Alta -1,75 Clara 1,00 a) Usando os valores das utilidades de cada nível apresentados na tabela acima, calcule a importância relativa de cada atributo na escolha do consumidor. A cima, realizamos a soma das diferenças entre o maior e o menor valor encontrado entre as utilidades, para podermos calcular qual a importância relativa de cada atributo na escolha do consumidor. O resultado é consequência do quociente da diferença entre o maior e o menor valor das utilidades de cada nível de atributo pela soma dos intervalos do part-worths (igual a 7, resultado da equação acima). De acordo com tais resultados, pode-se concluir a importância relativa de cada a tributo na escolha do consumidor sendo o “corte” o atributo mais importante, seguido por “cor” e “elasticidade”. b) Com esses atributos e níveis de avaliação quantos perfis poderiam ser formados? Sendo 3 os atributos e 2 os níveis em cada atributo, pode-se formar 8 perfis diferentes de calça jeans: Bundle Elasticidade Corte Cor 1 Baixa Cintura Baixa Clara 2 Baixa Cintura Baixa Escura 3 Baixa Cintura Alta Clara 4 Baixa Cintura Alta Escura c) Explique como obter a utilidade media através da regressão linear. Deve-se utilizar variáveis Dummy. Estas variáveis atuariam para cada nível de cada atributo. Conforme o nível do atributo, varia-se a Dummy entre 0 ou 1 para que possa ser feita a comparação. Importante lembrar que deve-se deixar algum nível de cada atributo como base (zero). d) Sugira uma possível razão que justifique a empresa não ter incluído o atributo preço no experimento. Acreditamos que a razão pela qual a empresa não incluí o atributo “preço” no experimento é devido a um possível viés que tal atributo pode causar na interpretação dos outros atributos: “elasticidade”, “corte”, “cor”. Como estamos tratando de um bem comum, intuitivamente, quanto menor o preço, melhor para o consumidor. Assim, o preço não passa a ser um fator diferencial, e sim, uma paridade de posicionamento da marca. Caso incluíssemos o preço, ele poderia ter influência direta no viés da preferência dos atributos. Capítulo 22: Modelos de Equações Estruturais (MEE) A modelagem de equações estruturais é um procedimento para estimar uma série de relações de dependência entre um conjunto de construtos representados por diversas variáveis e incorporados em um modelo integrado. É uma mistura entre a fatorial e a regressão linear múltipla, na medida em que eu utilizo variáveis que explicam um construto e estes construtos podem ser colocados em uma regressão linear. O MEE pode ajudar a avaliar as propriedades da mensuração e testar as relações teóricas propostas utilizando uma única técnica. Ele também examina a estrutura de inter-relações, que são expressas em uma série de equações estruturais. Essas equações modelam todas as relações entre construtos, dependentes e independentes. No MEE, os construtos são fatores não observáveis ou latentes em relações de dependência que são representados por diversas variáveis, mas não pode ser medidos diretamente por um questionário, por exemplo. Além disso, ocorre a incorporação de um erro de mensuração de maneira explícita. O erro descreve o grau até onde as variáveis observadas não descrevem os construtos latentes deinteresse no MEE. O modelo pode considerar a confiabilidade menos que perfeita das variáveis observáveis, proporcionando análises de atenuação e viés de estimativa devido ao erro de mensuração. O processo também consiste na explicação da covariância entre as variáveis observadas e na estimação de efeitos diretos e indiretos na variável dependente. 5 Alta Cintura Baixa Clara 6 Alta Cintura Baixa Escura 7 Alta Cintura Alta Clara 8 Alta Cintura Alta Escura Vale ressaltar que o MEE é usado principalmente como técnica confirmatória, para determinar se certo modelo (de mensuração) é válido, e não como técnica exploratória. Uma teoria serve como fundamento conceitual para o desenvolvimento de um modelo, portanto é necessário que inicialmente o MEE seja baseado em uma teoria antes dele ser estimado. O MEE consiste em dois modelos: o modelo de mensuração e o modelo estrutural. O primeiro retrata como as variáveis observadas/medidas representam construtos e permite a avaliação da validade do construto construído. O modelo de mensuração utiliza a técnica de análise fatorial confirmatória, em que o pesquisador define quais as variáveis que definem cada construto/fator, para confirmar se os construtos e as cargas das variáveis observadas sobre eles estão dentro do esperado na teoria. Assim, a AFC é empregada para verificar a estrutura fatorial de um conjunto de variáveis observadas. O modelo estrutural, por sua vez, mostra como os construtos são inter-relacionados uns com os outros, com ou sem relações de dependência. Modelos podem ser representados visualmente por um diagrama de caminho (path diagram). Relações de dependência são representadas por flechas retas com uma extremidade, do construto independente para o dependente. Já, relações correlacionais (covariância) são representadas por flechas curvas com duas pontas, ligando os dois construtos. Construto exógeno: é o equivalente latente e formado por vários itens de variáveis independentes na análise multivariada. É determinado por fatores externos ao modelo e não pode ser explicado por nenhum outro construto ou variável no modelo Variáveis múltiplas X medidas representam o construto exógeno ξ . Construto endógeno: é o equivalente latente* e formado por vários itens de variáveis dependentes na análise multivariada. É determinado por fatores internos ao modelo e pode ser explicado por outros construtos ou variáveis no modelo Variáveis múltiplas Y medidas representam o construto endógeno η. Relação correlacional/relação de covariância: especifica uma correlação simples entre construtos exógenos Relação de dependência: pode ocorrer em modelos de mensuração (dependência entre construtos e variáveis mensuradas) e em modelos estruturais (dependência entre construtos). Caso quisesse formar minhas equações seriam: (gama = lâmba) onde x é independente e y é dependente Índices de validade e confiabilidade dos construtos Índices de ajuste do modelo vou ver se deu certo a confiabilidade do modelo Goodness of fit – quanto maior melhor Qui- Quadrado – quanto menor melhor p-valor > 5% me mostra o quanto o modelo tem uma variância diferente da variância da amostra, portanto mede o quanto o modelo é ruim. Exemplo 01: Uso do site de uma universidade Conclusões: a intenção de uso aumenta quando os alunos percebem a utilidade (estimativa = 0.46, p<0.001)) e facilidade (estimativa = 0.28, p < 0.001) de utilização; juntos, os dois construtos combinados explicam 40% da variância na Intenção de uso da internet. Exemplo 02: Lealdade dos consumidores em uma loja Esse construto é formado por várias variáveis O coeficiente representa a covariância dos dois construtos e pode ser interpretado como o coeficiente de uma equação linear: Yuso = 0,46*útil + erro Yuso = 0,28*fac + erro OBS: não seria uma soma das duas, pois eles têm uma correlação mútua de 0,4. O consumidor é fiel a minha loja de acordo com a quantidade de compras feitas na minha loja e este construto é influenciado por outros 3 construtos (preço, atendimento, ambiente). Percebe-se nesse caso que o ambiente é o mais importante. Se eu quisesse saber o impacto da percepção de atendimento na lealdade teria que ver todos os caminhos possíveis até chegar na lealdade. Conclusões: o ambiente da loja tem o maior impacto, seguido do atendimento e, em menor grau preço; a participação nas compras tem um impacto substancial na lealdade, com coeficiente estimado da equação de 0,5. Exercício: Dell Desenvolver um SEM para explicar a satisfação e lealdade da Dell (medidas por Q4, Q5 e Q6) em termos de grau de desempenho nos 4 primeiros itens da Q8. Lembrando: foi feita uma pesquisa com 300 consumidores, as perguntas deveriam ser respondidas em uma escala Likert, porém, nem todas seguiam o mesmo raciocínio (algumas eram invertidas). 1. Especifique o MM (modelo de mensuração) e o ME (modelo estrutural). Desenhar o diagrama de caminho 2. Estimar o MM e especificar a validade e confiabilidade 3. Estimar o ME e especificar a validade 4. Que recomendações você daria a Administração da Dell? 1ºpasso: mdesc 2ºpasso: summarize 3ºpasso: statistics SEM (structural equation modeling) model building and estimation clicar no botão dou nome ao primeiro construto no espaço latent, no caso Performance, no campo measurable seleciono as questões/variáveis que influenciam esse construto; abro novamente e nomeio o segundo construto como Lealdade clicar no botão faz a flecha de correlação A primeira etapa da análise de MEE é definir os construtos individuais especificados com base na teoria, lembrando que o interesse é testar tanto a teoria de mensuração (como os construtos são representados) quanto a teoria estrutural (como os construtos são inter- relacionados) 4º passo: estimation estimate (aba group: standard; aba model: maximum likelihood; aba reporting: standardized porque as escalas Likerts estão diferentes) 2,4 é a média da escala de 1 a 4 para esta pergunta A covariância entre os dois construtos é negativa já que as escalas são invertidas; ou seja, quanto melhor minha performance mais leal o consumidor será. O valor é bom já que é próximo de 1. Com as saídas do stata, diagrama de caminho e com o modelo de mensuração estimado é possível tirar conclusões sobre. A adequação do modelo é então determinada, após estimar o MM, comparando-se o quanto a matriz de covariância estimada se enquandra na matriz de covariância observada. Será utilizado dois índices para avaliar a adequação (goodness off it – GFI - números mais altos serão desejáveis) e a inadequação do modelo (qui- quadrado - números baixos serão desejados já que mensuram o erro ou desvio). O teste qui-quadrado proporciona um teste estatístico da diferença da matriz observada de covariância da amostra e a matriz de covariância estimada, portanto quanto menor o p-valor, maior será a chance de que as duas matrizes de covariância não sejam iguais p-valor MAIOR do que 5% é desejado para que o modelo não seja inadequado; no caso uma probabilidade de 40,15% comprova que o modelo não é inadequado. 5ºpasso: estimation goodness of fit equation level P-valor < 5% a variável é representativa para a formação daquele construto Já o índice goodness-of-it valores mais altos são considerados aceitáveis para um modelo adequado; no caso 0,96 mostra a adequabilidade do modelo já que está muito próximo de 1. 6ºpasso: Agora quero ver se existe uma relação de dependência entre os construtos criando um modelo de relação estrutural; ainda com a aba model building and estimation apagar as flechas de correlação e clicar em estimation clear; clicar no botão; após construir a flecha de dependência entre os construtos clicar em estimation estimate (aba group: standard; aba model: maximum likelihood; aba reporting: standardized porque as escalas Likerts estão diferentes) Olhando o diagrama de caminho, percebe-se que a performance é explicada pela lealdade em 66%. Comparando o modelo de mensuração nota-se que o lado esquerdo não muda, porém os erros do lado direito mudaram. Novamente o índice de inadequação do modelo mostrou que o modelo não é inadequado. Se também olharmos para o valor chi(13) =13,62 é bom (o ideal seria 0). Se o p-valor fosse menor que 5% então a variância da amostra e a variância estimada seriam diferentes. 7ºpasso: estimation goodness of fit equation level Agora o índice GFI encontrado foi de 0,80, portanto piorou a adequação do modelo com o modelo estrutural. Porém, existe sim uma relação de dependência entre os construtos. A conclusão do exercício é que a avaliação de performance determina o grau de satisfação e lealdade. Portanto a Dell deveria melhorar a performance de seus computadores para aumentar a satisfação e lealdade dos consumidores. OBS: Caso o p-valor da estatística qui-quadrado desse menor que 5% deve-se voltar na estimação do modelo e ver qual das variáveis atrapalhou a construção do construto. Posso tirar ela ou fazer um recoach (nesse caso geraria uma coluna extra com as respostas na escala inversa)
Compartilhar