Resumo Marketing Avançado

•

INSPER

Rebeca Nicolas Pinheiro

16.09.2013

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 44 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 44 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 44 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Marketing Avançado

70 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Marketing Avançado
Capítulo 03: Concepção de Pesquisa
Pesquisa de Marketing e Pesquisa de Mercado são sinônimos. Elas envolvem a
identificação sistemática e objetiva, coleta, análise, e uso de informação com objetivo de
apoiar decisões relacionadas à identificação e solução de problemas e oportunidades em
marketing.
Após definido um problema de pesquisa de marketing e sua abordagem, o pesquisador
deve iniciar um planejamento detalhado de pesquisa. Existem dois tipos principais de
concepções de pesquisa: exploratória e conclusiva. Esta última pode ainda ser classificada
como descritiva ou causal. A concepção de pesquisa é uma estrutura para a realização do
projeto de pesquisa de marketing, na qual são especificados detalhes dos procedimentos
necessários para a obtenção das informações indispensáveis para estruturar e/ou resolver
problemas.
Exploratória  Qualitativa (amostra pequena; serve como insights para a Conclusiva)
Tipo de concepção de pesquisa que tem como principal objetivo ajudar a compreender a
situação-problema enfrentada pelo pesquisador – oferecer discernimento e compreensão.
Informações obtidas com tomadores de decisão (TD), especialistas, em bases secundárias
podem ser insuficientes para definir o problema da pesquisa. Para obter uma maior
compreensão muitas vezes pesquisas qualitativas são ideais. Caracterizada por ser não
estruturada, as informações necessárias são definidas de forma ampla; de natureza
exploratória e baseada em pequenas amostras, embora não sejam conduzidas de maneira
formal, elas oferecem conhecimentos valiosos sobre o problema. Ex: Focus Group
Conclusiva  Quantitativa (amostra grande)
Pesquisa concebida para auxiliar o tomador de decisão a determinar, avaliar e selecionar o
melhor curso de ação em determinada situação – testar hipóteses específicas e examinar
relações. Metodologia de pesquisa que quantificam dados, tipicamente usando alguma forma
de análise estatística. Caracterizada por ser estruturada, e generalista ao identificar resultados
de uma amostra para uma população de interesse, elas oferecem uma recomendação de ação
ao final da pesquisa. A pesquisa conclusiva pode ser descritiva ou causal. A primeira por sua
vez pode ter uma concepção transversal (envolve a coleta de informações de uma dada
amostra de elementos da população somente uma vez) ou longitudinal (envolve uma amostra
fixa de elementos da população que é medida repetidamente; a amostra permanece a mesma
ao longo do tempo, oferecendo uma ilustração vívida da situação e das mudanças que estão
ocorrendo ao longo do tempo).
Os dados utilizados para ambas as pesquisas podem ser de bases primárias ou
secundárias. Ambos possuem vantagens e desvantagens.
Isabela Della Torre

Vantagens Desvantagens Tipos
Primária  Atualizados
 Diretamente relacionados com a
pesquisa
 Mais caro
 Exige mais tempo para a coleta dos
dados
 Observação
 Levantamento
 Experimental
Secundária  Mais barato
 Método que exige menos tempo
 Pode estar desatualizado
 Os dados podem ser irrelevantes
 Interno
 Externo
Comparação entre os tipos de concepção de pesquisa:
Conclusiva
Exploratória Descritiva Causal
Objetivo Descobrir ideias e informações. Descrever algo, como por
exemplo, características
ou funções do mercado.
Determinar relações de causa e
efeito.
Características Flexível; muitas vezes é o ponto
de partida de toda a concepção.
Formulação prévia de
hipóteses; concepção pré-
planejada e estruturada.
Manipulação de uma ou mais
variáveis independentes; medida
do efeito sobre as variáveis
dependentes e controle de
outras variáveis mediadoras.
Métodos Entrevistas com especialistas;
levantamentos-piloto; estudos
de caso; dados secundários:
análise qualitativa; pesquisa
qualitativa.
Dados secundários:
análise quantitativa;
levantamentos;
observações.
Experimentos (ex: análise
discriminante resort dada em
aula)
Várias fontes potenciais de erro afetam a concepção de pesquisa, mas é possível controla-
las para obter uma concepção que seja adequada. Por exemplo, o erro total é a variação entre
o valor médio real da variável de interesse na população e o valor médio observado no projeto
de pesquisa de marketing. Esse erro pode ser:
 Erro de amostragem aleatória – ocorre porque a amostra selecionada é uma
representação imperfeita da população de interesse. Definido como a variação entre o
valor médio real para a amostra e o valor médio real para a população.
 Erro não amostral – atribuído a outras fontes que não incluem a amostragem e podem ser
aleatórios ou não aleatórios.
 Erro de não resposta: ocorre quando algumas das pessoas incluídas na amostra não
respondem a pesquisa. Pode ser definido como a variação entre o valor médio real da
variável na amostra original e o valor médio real na amostra “final resultante” – a falta
de resposta faz com que a amostra resultante seja diferente, em tamanho e
composição, da amostra pré-selecionada.
 Erro de resposta: surge de entrevistados que respondem, mas dão respostas imprecisas
ou cujas respostas são registradas ou analisadas erroneamente. Pode ser definido como

a variação entre o valor médio real da variável na amostra “resultante” e o valor médio
observado obtido no projeto de pesquisa de marketing.
Uma vez especificada uma concepção de pesquisa que controle o erro total, é preciso
tomar decisões de orçamento e programação. Isto é, ferramenta gerencial que ajudar a
garantir a conclusão do projeto dentro dos recursos disponíveis, por exemplo, financeiros,
humanos, de tempo, etc. Especificando-se os custos de cada tarefa e os parâmetros de tempo
dentro dos quais cada tarefa deverá ser concluída, o projeto poderá ser gerenciado de forma
eficaz. Uma técnica gerencial útil para tanto é o método do caminho crítico. Este envolve
dividir o projeto em suas atividades componentes e determinar sua sequencia e o tempo total
que toda atividade irá exigir. Isso será diagramado em um fluxograma de rede, no qual pode
ser identificado o caminho crítico, a série de atividades cujo atraso irá deter o projeto.
Após formulada a concepção da pesquisa e concluído o orçamento e programação do
projeto, deve-se preparar uma proposta de pesquisa de marketing por escrito. Se trate de um
layout oficial da atividade planejada de pesquisa para a gerência descrevendo o problema da
pesquisa, a abordagem, a concepção, os métodos de coleta, a análise e o relato de dados.
Assim, o pesquisador garante que a gerência concorda a respeito da natureza do projeto e
possui uma ferramenta de ajuda para vendê-lo à gerência.
Capítulo 08: Mensuração e Escalonamento: Fundamentos e Escalas Comparativas
Uma vez determinado o tipo de concepção de pesquisa e especificada a informação a
ser obtida, o pesquisador deve decidir quanto aos processos de mensuração e escalonamento.
Há quatro escalas principais de mensuração:
 Nominal: números indicam e classificam objetos, servem como rótulos e etiquetas
para identifica-los - atribuídos a jogadores de futebol ou números de marcas, por
exemplo.
 Ordinal: números indicam as posições relativas dos objetos, mas não a magnitude das
diferenças entre eles - ordem de classificação dos times vencedores ou classificações
de preferência, por exemplo.
 Intervalar: escala em que se utilizam números para pontuar/classificar objetos, de
modo que distancias numericamente iguais na escala representem distancias iguais
nas características que estão sendo medidas; diferenças entre objetos podem ser
comparadas; ponto zero é arbitrário – atitudes e opiniões ou classificação do
desempenho em uma escala de 1 a 10, por exemplo.
 Razão: escala mais alta, que permite ao pesquisador identificar ou classificar os
objetos, ordená-los e comprara intervalos ou diferenças; ponto zero fixo, podem ser
calculadasas razões dos valores de escala – comprimento, peso, idade, renda, tempo
em segundos, por exemplo.
Capítulo 19: Análise Fatorial
Quais os benefícios procurados por um consumidor de um determinado produto? Muitos
atributos. A análise visa identificar uma inter-relação entre benefícios/variáveis atribuindo-as a
diferentes “fatores”. Na análise fatorial examina-se todo o conjunto de relações

interdependentes entre variáveis. O objetivo é reduzir as variáveis em um número menor de
fatores (criação de fatores que expressem constructos subjacentes aos dados). A análise
fatorial é uma técnica de interdependência, no sentido de que é examinado todo conjunto de
relações interdependentes; Utiliza-se essa análise em circunstâncias como:
 Identificar fatores que expliquem as correlações entre conjuntos de variáveis. A seguir,
essas informações poder ser analisadas fatorialmente para identificar os fatores
psicográficos subjacentes.
 Identificar um conjunto novo, menor, de variáveis não correlacionadas na análise
multivariada subsequente (análise de regressão ou discriminante). Ex: fatores
psicográficos identificados podem ser usados como variáveis independentes para
explicar as diferenças entre clientes fiéis e eventuais.
 Identificar em um conjunto maior, um conjunto menor de variáveis que se destacam
para uso em uma análise multivariada subsequente.
 No âmbito do marketing, pode ser usada na segmentação de mercado para identificar
as variáveis subjacentes segundo as quais se agrupam consumidores; na pesquisa de
um produto para determinar os atributos de uma marca que influenciam a escolha do
consumidor; em estudos de propaganda para identificar os hábitos de consumo de
mídia do mercado-alvo; em estudos sobre preços para identificar as características dos
consumidores que são sensíveis a preços.
Exemplo feito em sala - Pasta de Dente
 Deseja-se saber quais são os benefícios procurados por um consumidor de pasta de
dentes ao escolher um produto.
 Amostra aleatória de 30 consumidores
 Variáveis:
 V1: É importante comprar uma pasta de dente que previna cáries.
 V2: Eu gosto de pastas de dente que deixe meus dentes brilhantes .
 V3: Uma pasta deve fortalecer a gengiva.
 V4: Eu prefiro uma pasta que refresque o hálito.
 V5: Prevenção de desgaste do dente não é um benefício importante oferecido
por uma pasta de dente.
 V6: O aspecto mais relevante ao se escolher uma pasta de dentes é garantir
dentes atraentes.
 Passo-a-passo
1º - Import data
Data  Data Editor  Data Editor (Edit)

2º - mdesc – verificar se não tem nenhum missing value

3º - summarize – verificar como as variáveis se comportam e observar escala utilizada

4º - statistics  sumaries, tables and tests  summary and descriptive statistics 
correlations and covariances - montar matriz de correlação para ver se existe
multicolinearidade.

Para que a análise fatorial seja apropriada as variáveis devem ser correlacionadas. Portanto
espera-se que as variáveis altamente correlacionadas (≈1 ou ≈-1) umas com as outras se
correlacionem também com os mesmos fatores. De acordo com a medida de adequação da
amostra de Kaiser-Meyer-Olkin (KMO) um valor superior a 0,5 é desejável. Caso contrário, a
análise fatorial pode ser inapropriada.

5º - statistics  multivariate analysis  factor and principal component  factor analysis
(OBS: na segunda aba “model2” selecionar o método principal component factor) – construir
tabela de Eigenvalue = autovalor e Uniqueness =especificidade.

A análise do principal component factor é recomendada quando a preocupação maior for
determinar o número mínimo de fatores que respondem pela máxima variância nos dados.
Comunalidade = 1 – Especificidade
O Eingenvalue representa a variância total explicada pelo fator. Comunalidade é a porção da
variância que uma variável compartilha com todas as outras variáveis consideradas. É também
a proporção de variância explicada pelos fatores comuns. Em outras palavras, expressa o
quanto da variabilidade de Xi é explicada pelo modelo. Portanto, quanto menor a Uniqueness
(expressa o quanto da variabilidade de Xi não é explicada pelo modelo) melhor para o modelo
já que as variáveis são mais correlacionadas.
O critério de Kaiser é utilizado para avaliar a adequação da análise fatorial. Fatores com
Eigenvalue maior do que 1 são selecionados como apropriados já que vão explicar grande
parte das variáveis. Por exemplo, nesse caso 82,49% do modelo é explicado pelos fatores 1 e 2,
em outras palavras os dois primeiros fatores combinados respondem por 82,49% da variância
total. Seguindo o critério da parcimônia deve-se escolher o menor número de fatores.
6º - statistics  multivariate analysis  fator and principal componente  postestimation 
screeplot – consigo determinar o número de fatores relevantes pelo gráfico de acordo com o
cumulative value.

7º - statistics  multivariate analysis  fator and principial componente  postestimation 
rotate loadings – As cargas fatoriais (correlações simples entre as variáveis e os fatores) são
rotacionadas.

Normalmente antes de fazer a rotação, os fatores são correlacionados com muitas variáveis.
Deste modo, raramente os fatores podem ser interpretados. Para facilitar essa interpretação, a
rotação faz com que as variáveis fossem significativamente relacionadas com poucos fatores,
se possível um. A rotação não afeta as comunalidades e a porcentagem explicada da variância
total. Porém a porcentagem da variância explicada pelo fator mudará após ser redistribuída
graças a rotatividade dos fatores. Logo diferentes métodos de rotação podem resultar na
identificação de diferentes fatores.
8º - statistics  multivariate analysis  fator and principial componente  postestimation 
loadingplot - conseguir visualizar graficamente os fatores e as variáveis neles “alocadas”.

O método mais utilizado é o procedimento varimax. Trata-se de um método ortogonal de
rotação, ou seja, onde os eixos são mantidos em ângulo reto, que minimiza o número de
variáveis com altas cargas em um fator, melhorando assim a interpretabilidade do mesmo.
Neste caso, os fatores passam a ser não correlacionados. O método da máxima
verossimilhança supõe que os dados seguem uma distribuição normal multivariada. Já o
método do componente principal, baseia-se na análise de componentes principais e não há
pressuposição da normalidade das variáveis envolvidas. Na rotação oblíqua os eixos não se
mantêm em ângulo reto e os fatores são correlacionados.
Logo após deve-se dar nomes aos fatores. A interpretação é facilitada pela identificação das
variáveis que apresentam grandes cargas em um mesmo fator. Além das cargas fatoriais,
devem ser levadas em conta as correlações entre as variáveis originais, medindo as
contribuições individuais de cada variável. Os nomes dados para os fatores sempre devem ser
em relação ao consumidor; ex: benefícios à saúde (V1,V3) e benefícios sociais ao consumidor
(V2,V4,V6).

Exemplo usando o método do vizinho mais próximo, máxima verossimilhança:
 statistics  multivariate analysis  factor and principal component  factor analysis
(OBS: na segunda aba “model2” selecionar o método maximum likelihood factor).

 statistics  multivariate analysis  fator and principal component  postestimation 
screeplot

 statistics  multivariate analysis  fator and principial componente  postestimation 
rotate loadings (usando 2 fatores)

 statistics  multivariate analysis  fator and principial componente  postestimation
 loadingplot

 Resumo de como fazer a análise fatorial:Fazer exercício Soft Drinks para treinar!
Capítulo 20: Análise de Agrupamentos (Cluster Analysis)
A análise de Cluster estuda todo um conjunto de relações interdependentes. Busca
identificar grupos de consumidores homogêneos dada, por exemplo, a renda e o grau de
lealdade. A análise visa fazer uma inter-relação entre todo o conjunto de variáveis sejam estas
independentes e/ou dependentes. Em outras palavras a análise visa classificar objetos e
aglomerá-los em grupos relativamente homogêneos chamados cluster ou conglomerados
chegando a segmentos homogêneos.
Ela tem sido utilizada em pesquisa de marketing para vários propósitos, como:
 Segmentação de mercado onde os consumidores podem ser agrupados com base nos
benefícios que esperam da compra de um produto, por exemplo.
 Compreensão do comportamento do comprador para identificar dentro de cada
cluster formado o comportamento daqueles “objetos” ali aglomerados.
 Identificação de oportunidades para um novo produto; as marcas do mesmo cluster
concorrem mais acirradamente entre elas do que com marcas de outros clusters; uma
empresa pode analisar suas ofertas atuais comparando-as com as de seus
concorrentes, a fim de identificar oportunidades potenciais.

 Seleção de mercados de teste; cluster de cidades, por exemplo, podem ser úteis para
testar estratégias locais de marketing
 Redução de dados; a formação de clusters pode servir como instrumento de redução
de dados para criar clusters ou subgrupos de dados mais fáceis de manejar do que
observações individuais.
A maioria dos métodos de aglomeração é baseada em algoritmos;
Formação de segmentos: 1.Definir uma medida de similaridade ou dissimilaridade
entre pares de elementos (indivíduos, famílias, empresas, unidades tomadoras de decisão, etc)
 depende do tipo de dados disponíveis; as medidas de similaridades não feitas via distâncias
euclidianas = distâncias entre os centroides (=valores médios das variáveis para todos os casos
em um cluster particular). 2. Escolher um método para prescrever um consumidor para cada
cluster (= segmento).
Técnicas hierárquicas aglomerativas:
Métodos de encadeamento: agrupam os objetos de acordo com a distância entre eles.
 Método do vizinho mais próximo (single linkage): a distância entre os grupos é
igual à menor das distâncias.
 Método do vizinho mais longe (complete linkage): a distância entre os grupos é
igual à maior das distâncias.
 Método das médias das distâncias (average linkage): a distância entre os grupos
é igual à média das distâncias.
Método de variância: clusters são gerados de modo a minimizar a variância dentro do
cluster.
 Método de Ward: formam-se clusters baseados na mudança da soma dos
quadrados dos erros (ou desvios com relação à media do grupo). Tem como
objetivo gerar clusters que minimizem a variância intra-cluster.
Métodos centróides: clusters são gerados a fim de maximizar as distâncias entre os
centroides dos clusters.

Técnicas não hierárquicas:
Métodos de partição: particionar as unidades amostrais formando conglomerados
com alta coesão interna e isolados.
 K-means: tentará formar grupos visando obter uma soma de quadrados residual
da partição pequena.
A construção do dendograma é fundamental já que é um dispositivo gráfico para
apresentar os resultados de aglomeração. As linhas verticais representam clusters unidos.
Exemplo feito em sala – Compras
 Deseja-se saber qual a atitude dos consumidores em relação à compras.
 Amostra aleatória de 20 consumidores
 Variáveis:
 V1: fazer compras é divertido

 V2: as compras afetam meu orçamento
 V3: combino compras com refeições fora de casa
 V4: procuro a melhor oferta quando compro
 V5: não me preocupo com compras
 V6: podemos economizar bastante comparando preços
 Passo-a-passo:
1º statistics  multivariate analysis  cluster analysis  cluster data  ward’s linkage - Para
analisar se as variáveis poderiam ser segmentadas, foi utilizado o método de Ward.
2º statistics  multivariate analysis  cluster analysis  postclustering  dendograms - pelo
dendograma, concluiu-se que a segmentação deveria ser feita em três partes dado que é
possível notar agrupamentos homogêneos distintos. A partir daí utilizaremos o número de
grupos definido para fazer as análises (grupos definidos a priori).

3º Agora, preciso criar os clusters com o nome isabela. Para analisar se os clusters se diferem é
calculado o cluster centroides o qual da a média das variáveis para cada cluster construído.

4º statistics  multivariate analysis  cluster analysis  cluster data  kmeans - outra forma
de agrupar os segmentos é pelo método de kmeans.

Interpretar e traçar o perfil dos clusters envolve a análise dos centroides (valores médios dos
objetos contidos no cluster).

Nenhuma solução de aglomeração deve ser aceita sem uma avaliação de sua confiabilidade e
validade. Para isso fazer a análise utilizando diferentes medidas de distância e métodos de
aglomeração são adequados; ao compara-los que eles levam a resultados parecidos. Estes, não
são exatamente iguais, pois os métodos utilizam algoritmos distintos. É bom analisar o
conjunto de dados empregando diferentes métodos para analisar a estabilidade das soluções
de aglomeração, isto é, é uma forma de ver se a clusterização feita é robusta ou não.
5º statistics – multivariate analysis – MANOVA, multivariate regression, and related 
MANOVA - utilizo para comparar as médias das variáveis nos clusters. Assim quando p-
valor<5% o meu modelo é bom para ser utilizado, ou seja, as médias não são muito próximas.

A única diferença entre
MANOVA e ANOVA é que a primeira é análise múltipla de variância, ou seja, age como se fosse
uma matriz (analisa relações entre todas as médias das variáveis).
 Resumo de como fazer a análise de cluster:

Fazer exercícios Dell Case para treinar!
Capítulo 18: Análise Discriminante e Análise Logit
Análise Discriminante
A análise discriminante é uma técnica para analisar dados na pesquisa de marketing
em que a variável dependente ou de critério é categórica e as variáveis previsoras ou
independentes têm natureza intervalar. O seu objetivo é estabelecer uma combinação linear
entre variáveis independentes, que melhor discrimina as categorias da variável dependente -

variável resposta - (grupos); além de verificar se existem diferenças significativas entre os
grupos, desde modo é possível descrever os segmentos identificados. Em outras palavras, a
análise visa identificar qual é a variável importante para separar os grupos  Quanto menos
multicolinearidade melhor, pois assim é mais fácil de separar os grupos.
A variável dependente pode envolver duas categorias ou três ou mais categorias.
Quando a variável dependente é binária, o modelo logit também pode ser usado ao invés da
análise discriminante de três grupos.
Exemplo da aula: Visitas a Resort
Variável resposta: se a família visitou um resort nos últimos dois anos ou não (2 categorias:
sim,1 ou não,2) e qual o gasto com férias (3 categorias: 1-low, 2-medium, 3-high).
Variáveis independentes e potenciais variáveis discriminantes: Renda anual familiar, atitude
em relação à viagens (Likert 1-9), importância dada a viagens em família (Likert 1-9), tamanho
da família e idade do chefe de família.
Passo-a-passo:
1º mdesc e summarize

2º tabstat

3º multivariate analysis  discriminant analysis  canonical linear discriminant analysis
(seleciono as variables, e no group variable coloco visit)

Preciso padronizar os coeficientes, pois multiplico pela variável padronizada (média=0, dp=1).
O padronizado me permite comparar para ver qual variável é a mais influente, mais
importante (maior coeficiente).
Probabilidade>f tem que ser menor do que 5%, assim essa função discriminante discrimina.
Não rejeito a Ho, parto da premissa que a função é discriminante.
A correlação canônica ao quadrado (0,8)^2 = 0,64  se desse 1 seria perfeito; é como se fosse
o R2 de estatística. A função discriminante está discriminando os dois grupos com acerto de
64%.
Matriz de confusão  os casos corretos é soma da diagonal = 12+15=27  a função colocou
no grupo 1, 12 respondentes; 12 indivíduos realmente condizem com as características
daquele grupo, e 0 deles não condizem com as variáveis daquele grupo. Já 18 foram colocados
no grupo 2, 15 deles realmente condizem com as características daquele grupo, e 3 deles não
condizem com as variáveis daquele grupo Total de casos 30. Acertos 90% (27/30).
4º statistics  multivariate analysis  postestimation reports and statistics  Anova

Tanto o coeficiente padronizado como
a correlação (com a variável
dependente) da matriz mostram a
importância daquela variável em
explicar a função discriminante.

Se f > 5% portanto a Ho é rejeitada, essa variável não é significante para a discriminação da
função discriminante. A partir disso eu posso fazer igual fazia em Econometria, tiro as variáveis
com maior p-valor e rodo o modelo novamente.
5º statistics  multivariate analysis  postestimation reports and statistics  canonical
coefficients (loadings) display unstandardlized.

Consigo achar o coeficiente despadronizado, assim posso multiplicar as respostas de um
determinado consumidor para cada variável pelos coeficientes e somo a constante. Terei um
resultado próximo de 1 (se for uma pessoa que vai) ou 2 (se for uma pessoa se não vai). Utilizo
esse método para prever futuros consumidores.
Agora utilizarei 3 categorias, ao invés de usar visita vou usar gasto em férias (1-low,2 -médium,
3-high). Preciso de n-1 funções, portanto nesse caso duas.
6º multivariate analysis  discriminant analysis  canonical linear discriminant analysis
(seleciono as variáveis e coloco amount)

A probabilidade de f deu maior que 5%, portanto a função 2 não é estatisticamente relevante,
não é discriminante.
Tenho alguns coeficientes negativos, portanto quando maior o tamanho da minha família
menor a minha propensão a gastar com férias, por exemplo.

A correlação canônica ao quadrado (0,89)^2=0,7921  A função discriminante 1 está
discriminando os três grupos com acerto de 79%.
A correlação canônica ao quadrado (0,44)^2=0,1936  A função discriminante 2 está
discriminando os três grupos com acerto de 19%.
Matriz de confusão  os casos corretos é soma da diagonal = 9+9+8=26  Total de casos 30.
Acertos 86% (26/30).
7º statistics  multivariate analysis  postestimation reports and statistics  Anova

Income e travel são altamente significantes.
8º statistics  multivariate analysis  postestimation reports and statistics  canonical
coefficients (loadings) display unstandardlized.

COMPARAÇÃO ENTRE AS TRÊS ANÁLISES ESTUDADAS:

Modelos de Demanda de Escolha Direta
*Modelo Logit Binomial (variável dependente não é contínua, é binária)
Quando a variável dependente é binária como 0 ou 1 e há muitas variáveis
independentes que são métricas (ou dummies), além da análise discriminante é possível o
modelo logit. O modelo logit binário ou regressão logística geralmente trata do quanto é
provável que uma observação pertença a cada grupo, estimando a probabilidade de uma
observação pertencer a um determinado grupo.
Análise Fatorial Análise de Cluster Análise Discriminante
Analisa todas as variáveis
e as reduz em fatores
Pega o grupo de respondente e os
agrupa em grupos homogêneos.
Analisa a variável dependente e tenta
identificar a variável que separa os grupos

Tem como objetivo estimar o impacto na demanda de uma marca pela alteração de
variáveis estratégicas (ex. preços) da empresa, de seus concorrentes ou do ambiente (impacto
na decisão do consumo: Elasticidades – impacto de uma variação no preço na demanda). Ou
seja, identificar quais são as variáveis de escolha.
Quais fatores levam ao aumento ou diminuição de vendas? Ofertas de preços e
atividades de trade marketing dão retorno? Com o Plano de Marketing X, qual a probabilidade
de um consumidor comprar da nossa empresa? E se mandarmos uma mala direta? E se o
preço for P? etc
Para conseguir responder a essas perguntas, o administrador deve entender como
programas de marketing afetam a probabilidade individual dos consumidores de comprar a
marca, o impacto das decisões e ser capaz de estimar o retorno financeiro desses programas
 ROI das ações de marketing.
Problema: nem sempre os consumidores revelam em pesquisas o que realmente eles fazem:
1. Consumidores tendem a ser mais “racionais” quando respondem a questionários do que na
hora da compra ou do consumo.
2. Ao responder perguntas os consumidores não são forçados a escolher entre atributos (não
há trade-offs).
Uso de modelos de escolha discreta para targeting:
 Dados de preferência revelada como históricos de compras dos consumidores,
ou…dados provenientes de mailings / surveys para consumidores potenciais.
 Usar modelos de escolha discreta, como logit, para estimar o impacto de variáveis
independentes na decisão do consumidor.
 Baseado nas estimativas do modelo, computar um escore que indique a probabilidade
de resposta (ex. probabilidade de compra de uma marca).
 Classificar os consumidores em grupos de acordo com os seus escores.
 Fazer uma análise de lucratividade para determinar para quais grupos se deve
concentrar a ação de marketing (ex. envio de brochuras).
Preferências Declaradas vs. Preferências Reveladas
•Needs-based segmentation: baseada em dados de survey; o consumidor declara o que
prefere e o que vai fazer.
•Choice-based segmentation: baseada em dados de compra (ex. dados de scanner ou dados
de experimentos); observamos o que o consumidor comprou ou fez  ex: Pão de Açucar usa o
CRM como base de dados para traçar perfis dos clientes.

Quando eu estou em uma baixa probabilidade preciso de muito esforço para promover
meu produto; quando estou próximo a 50% um esforço menor leva a maiores resultados

Exercício: Escolha por duas marcas de ketchup Hunt’s ou Heinz?
Se os supermercados oferecerem Heinz ou Hunt’s ao mesmo preço, qual será a marca líder no
mercado? O que se pode concluir sobre o efeito de atividades de Trade Marketing em lojas na
decisão de compra de Heinz e Hunt’s?
Variáveis analisadas para cada marca:
•Preços
•Display: produto em ponta de gôndola ou algum tipo de merchandising na loja
•Feature: presença de propaganda na loja
•Feature e display: as duas ações em conjunto

1º passo: por ser um logit binomial as variáveis são dummies onde 1 quando o dislplay estava
presente e 0 quando o display estava ausente (idem para feature e feature e display); já a
variável preço deve-se fazer a relação de preços das marcas fazendo ln dos preços, de modo a
não alterar os resultados além de trazer uma maior sensibilidade.

Deste modo posso transportar para o stata.
2º passo: mdesc

3º passo: summarize

Nesse caso a média é o mkt share (89%Heinz e 11% Hunt’s)
4ºpasso: statistics  binary outcome  logistic regression

O Pseudo R2 = 0,30 é ok na medida em que equivale a um R2 simulado, ou seja, mede a
adequação do modelo, e a prob>chi2 é boa.
Lembrando que ln_price_dif_ = ln Heinz – ln Hunt’s, essa variável é significativa e o coeficiente
desta é negativo, portanto essa variável contribui negativamente para a escolha. Já
featdisplheinz não é signiticativa para explicar a escolha pela Heinz. Analisando os demais
coeficientes sabe-se que display também é importante, porém preço é mais.Lembrando que a probabilidade de escolha da Hunt’s é 1 – probabilidade de escolha da Heinz
5ºpasso: statistics  postestimation  binary outcome  goodness (na aba Main: seleciona a
primeira opção e utiliza estimation sample)

Soma da diagonal, dividido pelo total de observações resulta no total de acertos.

Embora o R2 não foi muito bom, teve uma porcentagem de acerto grande. Portando o modelo
é adequado.

6ºpasso: montar o gráfico com a curva da probabilidade de comprar – predict prob (criar
coluna de probabilidades de comprar Heinz); fazer um gráfico para ajudar a interpretar a
probabilidade – graphics  twoway graph  create  Y: prob X: ln_price_dif_

O gráfico da direita é mais fácil de interpretar. Quando ln x – ln y =0, os preços são iguais; com
display sempre a chance de comprar é um pouco maior. Quando ln x – ln y = 1, a elasticidade
preço é grande.

Caso eu queira a probabilidade numérica entro no Data Editor e terei a probabilidade de
compra da Heinz para cada indivíduo.

Exercício: Lealdade à marca
1ºpasso: mdesc

2ºpasso: summarize

3ºpasso: statistics  categorical outcomes multinomial logistic regression (variável
dependente: loyalty)

O R2 nesse caso não é muito bom, mas é considerado ok (o ideal seria 1). Já o p-valor das
variáveis product e shopping são> 5% e, portanto, não são significantes para explicar a
lealdade à marca  deveria tirar essas variáveis e rodar de novo.

4ºpasso: statistics  postestimation  binary outcome  goodness (na aba Main: seleciona a
primeira opção e utiliza estimation sample)

Interpretação dos coeficientes:

Se a marca aumentar em uma unidade, o Ln da probabilidade (“log odds”) aumentará
em e^1,27 unidades, quando o efeito das outras variáveis independentes é mantido constante.
O sinal desse coeficiente determinará se a probabilidade aumenta (se o sinal for positivo) ou
diminui (se o sinal for negativo), nessa quantidade.  lembrar exercício da lista 2
O modelo teve 80% de acerto, o que é considerado bom, dado o R2 apresentado.

*Modelo Logit Multinomial
Neste caso, a variável dependente tem mais de duas alternativas (escolha segue
discreta) e existem diversas variáveis independentes métricas ou dummies. Este modelo vai
estimar a probabilidade de uma observação pertencer a um determinado grupo.
Exercício da Lista 2: Painel de Biscoitos
a) Qual o market share de cada marca, preço médio pago pelos consumidores por cada marca e o
percentual de vezes que o consumidor vê um display ou uma propaganda da marca na hora da
compra?

A partir das saídas do stata é possível montar outras tabelas para melhor visualizar o
Market share, preço médio pago e percentual de vezes que o consumidor vê um display ou
uma propaganda das marcas na hora da compra:
Stats Private Sunshine Keebler Nabisco
Sum 1035 239 226 1792
N 3292 3292 3292 3292
Market Share 31,43% 7,26% 6,86% 54,43%

Stats Private Sunshine Keebler Nabisco
Preço médio $0,68 $0,96 $1,10 $1,10

Stats Private Sunshine Keebler Nabisco
Sum 117 71 86 160
N 3292 3292 3292 3292
% de display/propaganda 3,55% 2,15% 2,61% 4,86%

Portando a primeira tabela mostra a quantidade de vezes que uma marca foi
consumida e o número total de compras observadas, onde a Nabisco possui o maior Market
share com 54,43%. A segunda tabela gera novamente o total de observações e quantos atos
de compra existiram dada à presença de propaganda ou display. Novamente a Nabisco e a
Private estão na frente onde 4,86% e 3,55% das compras foram efetuadas após o consumidor
ver um display e/ou propaganda, respectivamente. Por fim, a última tabela dá o preço médio
dos produtos das marcas em destaque.
b) Analise a discriminação da escolha da marca em relação aos preços das marcas do mercado.
As variáveis utilizadas para servirem como base da segmentação foram: obs – mostra a
observação gravada, household – identifica o consumidor, lastpurchase – indica a última
compra, os nomes das marcas private, sunshin, keebler, nabisco – indicam a marca comprada,
price e featuredisplay – corresponde ao conjunto promocional total. Para ver se existiam
missing values, foi utilizado o comando mdesc que gerou a tabela a seguir:

A partir da tabela, pode-se concluir que para todas as variáveis selecionadas não existe
missing value. Para verificar como essas variáveis se comportam, foi utilizado o comando
summarize e construído histogramas para as variáveis preços das marcas.

Com a tabela, pode-se ver que a maioria das variáveis são binárias, ou seja, 0 quando
não ocorreu a compra ou a presença daquela variável e 1 quando aquela variável estava
presente. Também é possível olhar a média das variáveis. Para household esta é inútil já que
não traduz nada além da identificação do consumidor. A média do price é realmente uma
média de preço, nota-se, portanto, que o em média mais barato é a marca private e o keebler
mais caro a $1,12. Ao analisar os histogramas dos preços das marcas, é possível confirmar o
que foi citado anteriormente ao visualizar a frequência dos diferentes preços praticados. A

marca Nabisco pratica o preço dentro de um menor intervalo de variação, já a marca Private
tem uma maior concentração em torno de R$0,68.
Para fazer uma análise discriminante da escolha das marcas em relação ao preço,
posso utilizar a ferramenta tabstat, porém antes disso preciso criar uma coluna chamada
marcas para identificar a escolha de cada consumidor. Isso foi feito pelo comando:
generate marcass = 0 if private == 1
(2257 missing values generated)
replace marcass = 1 if sunshine == 1
(239 real changes made)
replace marcass = 2 if keebler == 1
(226 real changes made)
replace marcass = 3 if nabisco == 1
(1792 real changes made)
A partir daí, posso fazer uma análise canônica com uma divisão proporcional das
probabilidades.

O standardized canonical discriminat function, nos mostra um coeficiente padronizado
o qual permite comparação para ver qual variável é a mais influente, mais importante (maior
coeficiente). Além disso, as probabilidades das funções quando menores do que 5%, nos dizem
que a função discriminante discrimina. Já a matriz de confusão, mostra os casos corretos na
soma da diagonal (199+21+1627=1847) a primeira função, respondente a marca Private teve
1035 respondentes; 199 indivíduos realmente condizem com as características daquele grupo,
e o restante não condiz com as variáveis daquele grupo. Já 239 foram colocados no grupo
seguinte (Sunshine), 21 deles realmente condizem com as características daquele grupo; a
marca Keebler teve 0% de acertos e segue assim o raciocínio. O total de casos é de 3292, onde
obteve-se um nível de acerto mediano de 56,1% (1847/3292). Daí pode-se afirmar que o preço
sozinho não é suficiente para explicar a escolha da marca.
Para identificar a relevância das variáveis, e validar a análise foi feita uma ANOVA:

Como f < 5% portanto a Ho não é rejeitada, ou seja, essa variável é significante para a
discriminação da função discriminante, porém elas não explicam tudo.
c) Estime o impacto das variáveis (preço, display, feature e feature and display) na demanda
por marcas.
Para estimar o impacto das variáveis na demanda por marcas foi utilizado a análise de
regressão multinominal logistica abaixo:

Ao analisar a saída do Stata, como o p-valor < 5% pode-se dizer que as variáveis em
questão influenciam a escolha da marca. Vale ressaltar que as constantes representam o valor
das marcas Sunshine, Keebler e Nabisco respectivamente em relação à base Private. Dito isso,
o brand equity da Nabisco é melhorque o das outras companhias já que possui o maior
coeficiente. Os coeficientes negativos significam que o valor é menor do que sua base, no caso
a marca Private. Porém, deve-se também analisar o p-valor das variáveis. A partir de então, a
marca Keebler não deu significante, portanto não é possível tirar conclusões concretas. A
presença de display aumenta a venda, uma vez que o coeficiente é positivo, entretanto ele
também não deu significativo já que seu p-valor é maior do que 5%. Por fim, o preço se
mostrou ser significativo e é a variável mais importante.
d) Interprete o sinal e a significância do efeito marginal de cada variável na probabilidade de
escolha das marcas de biscoito. Explique porque o sinal do coeficiente estimado de cada
variável já indica qual o sinal do efeito marginal dessa mesma variável.
Sabe-se que ao elevar “e” ao coeficiente encontrado na análise de regressão multinominal
logistica acima encontra-se o odds ratio, ou seja, a probabilidade de escolha das marcas de
biscoito. O efeito marginal mostra o efeito na escolha da marca dado o aumento de 1 unidade
nessa variável, tudo mais constante. Portanto ao interpretar o sinal dos coeficientes das
variáveis nota-se que os números negativos resultam em um menor impacto no efeito
marginal dessa mesma variável na probabilidade de escolha das marcas. Fato este explicado já
que “e” elevado a um coeficiente negativo, resulta em um número 1/e^coeficiente (ex: e^-3 =
1/e^3).

Portanto, as variáveis com um maior efeito marginal na escolha das marcas são
Const3(Nabisco), feat e featdispl. Entretanto, como já dito anteriormente, a variável display
não se mostrou significante não podendo, portanto, tirar conclusões concretas sobre ela.
e) Estime o brand equity relativo a cada marca.
As duas questões discutidas anteriormente são essenciais para a discussão do brandy
equity das marcas de biscoito. Uma vez que os “Brand Equity” são os interceptos da CLogit,
ficou claro que o valor da marca Nabisco possui um maior impacto no efeito marginal dessa
mesma variável na probabilidade de escolha das marcas. Além disso, o brand equity da
Nabisco é melhor que o das outras companhias já que possui o maior coeficiente positivo
depois de feita a análise de regressão multinominal logística (os coeficientes negativos
significam que o valor é menor do que sua base, no caso a marca Private). Portanto a
probabilidade de alguém escolher essa marca de biscoito é maior perante as demais. Em
seguida, utilizando os mesmo critérios, aparecem as marcas: Private, Keebler e Sunshine.
Variável Coeficientes Exponencial
Const 1 -0,6602 0,5167
Const 2 -0,1674 0,8459
Const 3 1,7966 6,0291
Price -3,126 0,0439
Disp 0,0025 1,0025
Feat 0,4475 1,5644
Featdisp 0,6124 1,8449

Capítulo Mapas Perceptuais e de Preferências
Como consumidores percebem o posicionamento de nossa marca? Os mapas
perceptuais têm por objetivo mapear a percepção dos consumidores sobre atributos de
produtos existentes e novos conceitos; a percepção da similaridade entre marcas; preferência
por produtos; e medidas de respostas comportamentais de consumidores com relação ao
produto.

Primeiramente deve-se relembrar o conceito de posicionamento: é o ato de
desenvolver a oferta e a imagem da empresa, de maneira que ocupem uma posição
competitiva distinta e significativa nas mentes dos consumidores do público alvo. Para isso
deve-se selecionar os atributos e benefícios com base no segmento alvo. O posicionamento de
um produto tem sucesso quando os benefícios do produto estão na mente do consumidor de
modo correto, estes são considerados relevantes, exclusivos (difíceis de copiar – análise VRIO),
e são comunicados com clareza trazendo rentabilidade para a empresa. Portanto, uma
empresa só tem sucesso se ela tem uma vantagem competitiva sustentável.

Análise competitiva:
Características relevantes – referência: natureza da concorrência (quando você estabelece
uma estrutura de referencia você também estabelece seus concorrentes), mercado-alvo; spill-
over  dou o tiro no publico alvo, mas sempre acaba alcançando pessoas fora do público alvo.
O OMO quer vender pra classe C, mas ele tem um preço mais elevado devido ao
posicionamento que conseguiu alcançar. “Omo lava mais branco; se sujar faz bem”.
Ponto de paridade – comuns: são necessários, base da concorrência; ex: Pepsi e coca são bem
parecidos
Ponto de diferenciação: são desejáveis e possíveis de entregar; ex: Pepsi, foca mais em um
público jovem.
Um bom posicionamento deve conter: Para (público alvo) nossa (marca) é (conceito) que
(ponto de diferença).
Para analisar o mapa perceptual deve-se ver a projeção do ponto no eixo (fatores que +
explicam) e não a distância. Os tamanhos dos vetores indicam as forças daqueles
atributos/variáveis, ou seja, em qual direção ele está crescendo. Ex: Tam, Azul, Gol, Avianca
precisa de um gráfico com 4 eixos (pontualidade, serviço, conforto e conveniência). Atributos
que são, ao mesmo tempo, relevantes e próximos aos eixos principais, ajudam a determinar o
significado desses eixos. Para posicionar uma companhia em um atributo, desenhe uma linha
perpendicular entre a sua localização e o atributo (projeção ortogonal). Se eu comparar entre
quadrantes, consigo ver quem são os concorrentes diretos (olho quem está plotado ao redor
daquela marca).

Existem dois modelos de preferências: o modelo de preferência ponto ideal onde existe um
máximo para preferência daquela variável (ex: doçura); e o modelo de vetor de preferência
(acima ilustrado), o qual mostra níveis e variáveis de preferência (ex: rapidez de um serviço).
Se for um joint-space usando pontos ideais como a figura abaixo o círculo maior representa
uma maior concentração de clientes (cluster) e cada ponto um respondente.

Portanto nesse mapa de posicionamento as marcas se diferem. O tamanho da bolinha indica a
importância do cluster, portanto nessa região tem a maior concentração de clientes. Nesse
caso, Budwieser está mais bem posicionada para atender esse grupo de pessoas. No gráfico da
direita devo projetar as bolinhas dos atributos no vetor de preferência. Quanto mais pra baixo
melhor, portanto a Samsung é preferida nesse caso. Preferência não tem muito a ver com o
racional, é simplesmente a escolha do consumidor.

Já nesse último joint space usando vetor de preferência de 25 respondentes, cada vetor é um
respondente; o tamanho da flecha mostra a convicção dos valores, portanto quando o vetor é
muito grande significa que ele é “dentro” de daquele quadrante. Como cada vetor é uma
pessoa, a Budweiser é a melhor já que possui mais e maiores (com convicções mais claras)
vetores próximos a ela.

Exercício Lista 2: Office Star Materiais de Escritório – Posicionamento de Marca

Descrição: Possuem respectivamente os dados originais sobre percepção e preferência e o
mapa perceptual e de preferência da loja da Office Star e de seus concorrentes.
a) Qual o significado do percentual que está indicado nos eixos do mapa?
Após realizar uma análise qualitativa ou fatorial, chega-se a conclusão dos fatores que
explicam de melhor forma as variações que constam no modelo. Os fatores que constam nos
eixos do mapa foram selecionados por possuírem os maiores autovalores, sendo as
porcentagens presentes, o percentual que cada fator explica da variância total do modelo.
Portanto, nota-se que a Dimensão I explica 66,9% da variância do modelo. Os outros 30,8% da
variância do modelo é explicada pela Dimensão II.
b) Qual é o percentual de variação total dos dados explicados por esse mapa
bidimensional? Em sua opinião esse mapa representa bem as percepções dos
consumidores nesse mercado? Explique.
O percentual de variação total dos dadosexplicados pelo mapa bidimensional é a soma
dos fatores expressos nos eixos do mapa: 66,9 + 30,8. Ou seja, 97,7%.
Consideramos 97,7% um valor bastante significativo para afirmar que o mapa perceptual
represente bem as percepções dos consumidores nesse mercado. Concluímos isso, uma vez
que um terceiro fator acrescentaria apenas 2,3% na variância total, o que consideramos
pouco.
c) O que se pode concluir sobre o posicionamento da Office Star a partir da análise do
mapa perceptual?
A partir da análise do mapa perceptual, observando a proximidade da marca aos
vetores, conclui-se que os consumidores percebem o direcionamento da Office Star para
qualidade no serviço. Junto a qualidade de serviço, nota-se a percepção positiva dos clientes
quanto a grande variedade e boa qualidade dos produtos. No entanto, observa-se a percepção

dos clientes perante a Office Star como uma marca que entrega produtos caros e com baixa
conveniência.
Portanto, agrupando e analisando as percepções dos clientes (uma marca que entrega
bom serviço com qualidade e variedade dos produtos, vendidos com preços altos e em poucos
pontos) conclui-se que a Office Star tem um posicionamento TOP no setor de materiais de
escritório.
Analisando o posicionamento da Office Star perante seus concorrentes, nota-se que a
empresa está bem posicionada em seu segmento alvo, líder de preferência. Observa-se que
não há proximidade de concorrentes que busquem as vantagens competitivas almejadas pela
Office Star e que existe uma grande tendência de preferencias das percepções dos clientes “ao
redor” da empresa.

Capítulo 21: Análise de Preferência Conjunta

Como podemos alterar atributos do produto com base na percepção dos
consumidores? Uma empresa aérea deve oferecer mais entretenimento ou espaço para as
pernas? (trade-offs)
O objetivo da análise de preferência conjunta é criar funções de utilidade que
avaliam a importância relativa que clientes percebem nos atributos do produto (baseado em
utilidade). Em outras palavras a técnica procura determinar a importância relativa que os
consumidores dão a atributos relevantes, para avaliar um determinado produto e a utilidade
(preferência) que os consumidores associam aos níveis desses atributos  Trade-offs entre
atributos. Assim, os resultados auxiliam a decisão dos atributos que devem ser projetados para
o novo produto com o objetivo de maximizar o desempenho esperado no mercado (levando
também em conta os concorrentes).
A análise conjunta vem sendo utilizada em marketing como:
 Avaliar a importância relativa dos atributos no processo de escolha do consumidor.
 Estimar a participação de mercado de produtos que diferem nos níveis dos atributos
(simulação).
 Determinação do produto de maior preferência.
 Segmentação do mercado baseada na preferência pelos atributos (bases de
segmentação).

Exercício: Tênis
Um fabricante de tênis deseja projetar um produto que tenha uma boa
aceitação no mercado. Para tanto, ele quer saber quais são as
características de um tênis que um consumidor leva em conta no
momento da compra.

De acordo com a tabela acima, o tênis possui três atributos: sola cobertura e preço e dentro de
cada atributo tenho três níveis.
 Atributos = características que descrevem o produto
 Níveis = números de diferentes valores do atributo
 Perfil = uma combinação de atributos, cada atributo em nível específico, apresentado
ao respondente para uma avaliação (ou preferência declarada)
 Conjunto de escolhas/Bundles = perfis pre-especificados apresentados ao respondente
para fazer uma pseudo-escolha (escolha declarada).

São colhidos dados de consumidores sobre preferências gerais com relação às cestas (bundles)
de atributos (produtos). Essas preferências são decompostas em valores de utilidades (part-
worths) que o consumidor atribui a cada nível de cada atributo.
Métodos de coleta de dados:
Escala métrica:
–Atribua uma nota de zero a cem a cada perfil refletindo a probabilidade de comprar o
produto.
Escala não-métrica:
–Ordene os produtos (perfis) segundo a sua preferência (avaliação por postos)
–Classifique cada um dos produtos (perfis) em
•compraria certamente
•provavelmente compraria
•talvez comprasse
•provavelmente não compraria
•não compraria certamente

Para coletar as utilidades do consumidor seria possível fazer 27 combinações diferentes
conforme a abordagem pareada (pairwise approach), como mostra a tabela abaixo:

Entretanto na vida real coletar esse número de dados com diversos consumidores seria
inviável. Para facilitar, existe uma outra abordagem, conhecida como abordagem de perfil
pleno, onde somente faz-se o número ideal de “bundles” a soma dos níveis, nesse caso 9.
Avaliação pela escala
gráfica  Escala Likert

Devo atribui um código numérico para cada nível de tênis para então calcular
utilidades distintas para cada nível (a variável dependente é a preferência ou a intenção de
compra).
O modelo de análise conjunta expressa a relação fundamental entre atributos e a
utilidade em análise conjunta. O procedimento utilizado para estimar o modelo é a regressão
com variáveis dammy. Sendo n a quantidade de níveis existentes, preciso de n-1 dummies, no
caso 2.
Utilizando de mínimos quadrados ordinários com variáveis dummy obtém-se o
seguinte modelo estimado:

Os níveis dos atributos cobertura e preço foram codificados de maneira similar. Os
parâmetros foram estimados como segue:

Os coeficientes negativos mostram que aquele nível de atributo não é muito
importante para o consumidor, e/ou são menos importante do que a base.

A somatória é zero
exatamente porque a soma
dos alfas igual é zero é de
origem arbitrária. Percebe-
se que este entrevistado
acusa maior preferência
para uma sola de borracha
na avaliação do tênis.
Borracha – Plástico = b1
Poli – Plastico =b2
Sola
Cobertura
Preço

É possível calcular os intervalos dos part-worths, no caso

Como demostrado acima, a importância relativa é calcula pela divisão entre a
amplitude dos alfas para cada atributo e o Part-Worth total.
Interpretando os resultados gerais na tabela abaixo, nota-se que a primeira
preferência é pela sola de borracha, a segunda é para uma sola de plástico, e a sola de
poliuretano é a de menor preferência. A parte superior de couro é a que tem maior
preferência, seguida por lona e nylon. O preço preferível com maior utilidade é o mais baixo.
Como já dito anteriormente, em termos de importância relativa dos atributos, preço é o mais
importante seguido por sola e cobertura. Portanto essa pessoa pode ser rotulada como
sensível ao preço.

É mais conveniente fazer os gráficos das funções de valores parciais abaixo para
melhor interpretar os resultados.

Por fim, para avaliar a confiabilidade e a validade dos resultados de uma análise
conjunta, deve-se olhar o 𝑅2 da regressão, o qual indica o grau de aderência do modelo aos
-0,556 0,778
1,334
28,6% é a utilidade
relativa do atributo
sola. Nota-se que em
termos de
importância relativa
dos atributos, vê-se
que o preço é
número um, sola o
segundo e por fim
cobertura.

dados; olhar a correlação entre a utilidade estimada pelo modelo e as preferências declaradas;
se a análise foi feita no agregado, pode-se dividir amostra em duas para reestimação e os
resultados comparados para avaliar a estabilidade das soluções da análise conjuntas.
No exercício obtivemos um R2 de 0,934, o que indica um bom ajuste.
Exercício: Designing a frozen pizza

Core Product ou Núcleo do Produto: o aspecto mais fundamental do produto – a necessidade
ou desejo que satisfaz o consumidor ao comprar o produto. espera-se que o produto seja o
que é esperado é ex:caneta, espera-se que a caneta escreva. O que eu objetivo no produto, o
aspecto mais fundamental do produto.
“Na fábrica, nós produzimos cosméticos; na loja, nós vendemos esperança” (Charles Revson da
Revlon)
Produto Tangível ou Básico: consiste em características, estilo, nível de qualidade, marca e
embalagem; é o produto mais convencional ex: caneta é composta por plástico, tinta, etc.
Produto Ampliado: inclui características e serviços adicionais ao produto; ex. SAC, guias de
instalação, garantias e serviços pós venda.

Processo de desenvolvimento de novos produtos:
Mapeamento Reverso: determinar valores de características físicas/objetivas de um produto
para atingir uma posição predeterminada no espaço/mercado.
Solução: o pesquisador pode determinar uma função que relacione características/atributos a
preferências ou percepções por um novo produto.
Função utilidade (função de preferência)  o pesquisador pode definir o nível dos atributos de
um produto para que o consumidor atinja um determinado nível de utilidade.
Modelos para desenho de produto: Para commodities com apenas um atributo diferenciador
(ex. preço), como saber qual é a marca que o consumidor escolherá? 𝑝𝑎>𝑝𝑏 ↔ 𝑢𝑎<𝑢𝑏
Essa análise funciona bem quando tenho uma função de utilidade, ou seja, existe um nível de
atributos em que o consumidor atinge um nível de preferência determinado.

Existem dois métodos para definir os perfis (cestas/bundles de atributos).
I. Desenho fatorial completo (full-factorial design) número de perfis = 𝑀𝐾
II. Desenho fatorial fracionado (fractional-factorial design): combinações ortogonais de
níveis dos atributos Reduz o número de perfis, mas ainda permite a estimação das
contribuições independentes de cada atributo à função utilidade.
Utilizando o desenho fatorial completo, um total de 216 (multiplicação de todas as
possibilidades de atributos: 3x4x3x2x3) tipos de pizza podem ser desenvolvidas.
O consumidor deve dar notas de 0 a 100 para cada atributo – tem que somar 100. E
dentro de cada atributo devo dar 0 para aqueles que valem menos e o limite dado
anteriormente para a mais valiosa.
Ex: massa = 20  pan 0; thin 20; thick 10
Exercício: Case Forte Hotel
Um grupo quer oferecer charme e confiança de hotéis europeus nos EUA; eles identificaram 5
atributos (com vários níveis) que os clientes mais valorizam na escolha do hotel. Eles querem
saber que tipo de hotel deveria ser instalado na região.
Price, Location and Brand Name  3 principais razões de escolha
Decidiu explorar as preferências do consumidor a partir de 5 atributos chaves: room type
(small suite, large room, office room); business amenities (www access, speaker phone, room
fax); leisure facilities (exercise room, pool, exercise room+pool); conveniences and extras (shoe
shine, tape library, fruit and cheese, newspaper); and restaurants and dining (yes, no). Dentro
de cada atributo existem diversos níveis. O ideal seria ter o mesmo número de níveis, porém
quando a diferença é pequena não é tão grave. Seria possível fazer 216 combinações; mais
existe um “macete”: faz-se o número ideal de “bundles” a partir da soma dos níveis = 16.
Foi feita uma análise conjunta para identificar uma “maneira científica” para: qual é o novo
produto;
Existem dois métodos:
*Posso dar notas que somem 100 para os atributos e para os níveis dou o maior valor para o
mais preferível e 0 para o menos (zero relativo, pois preciso colocar isso em uma escala) e um
valor intermediário para os demais. Ex: room type 40  small suíte 40, large room 20, office
0. A partir daí eu monto as notas do bundles.
*Posso dar notas aleatórias para os bundles de acordo com minha percepção, e ai o
computador vai dar as notas pra cada atributo e pra cada nível. Processo inverso do método
anterior.

Exercício Lista 2: Calças jeans – Características Relevantes
Dados: uma marca de roupas quer entender quais características são mais importantes para
seus clientes na hora de decidir qual calça jeans comprar. Dentre as características
pesquisadas estão elasticidade (baixa e alta), cor (escura e clara) e corte (cintura baixa e
cintura alta).
Análise de preferência conjunta: consideramos elasticidade (baixa e alta), cor (escura e clara)
e corte (cintura baixa e cintura alta) como atributos e seus níveis estão dentro dos parênteses.
Uma vez coletados os dados para os consumidores calculou-se a utilidade.
Utilidades Estimadas (Part-worths)
Elasticidade Corte Cor
Baixa 0,75 Cintura Baixa 1,75 Escura -1,00
Alta -0,75 Cintura Alta -1,75 Clara 1,00

a) Usando os valores das utilidades de cada nível apresentados na tabela acima, calcule a
importância relativa de cada atributo na escolha do consumidor.


A cima, realizamos a soma das diferenças entre o maior e o menor valor encontrado
entre as utilidades, para podermos calcular qual a importância relativa de cada atributo na
escolha do consumidor. O resultado é consequência do quociente da diferença entre o
maior e o menor valor das utilidades de cada nível de atributo pela soma dos intervalos do
part-worths (igual a 7, resultado da equação acima).



De acordo com tais resultados, pode-se concluir a importância relativa de cada a tributo na
escolha do consumidor sendo o “corte” o atributo mais importante, seguido por “cor” e
“elasticidade”.
b) Com esses atributos e níveis de avaliação quantos perfis poderiam ser formados?
Sendo 3 os atributos e 2 os níveis em cada atributo, pode-se formar 8 perfis diferentes de
calça jeans:
Bundle Elasticidade Corte Cor
1 Baixa Cintura Baixa Clara
2 Baixa Cintura Baixa Escura
3 Baixa Cintura Alta Clara
4 Baixa Cintura Alta Escura

c) Explique como obter a utilidade media através da regressão linear.
Deve-se utilizar variáveis Dummy. Estas variáveis atuariam para cada nível de cada
atributo. Conforme o nível do atributo, varia-se a Dummy entre 0 ou 1 para que possa ser feita
a comparação. Importante lembrar que deve-se deixar algum nível de cada atributo como base
(zero).
d) Sugira uma possível razão que justifique a empresa não ter incluído o atributo preço
no experimento.
Acreditamos que a razão pela qual a empresa não incluí o atributo “preço” no
experimento é devido a um possível viés que tal atributo pode causar na interpretação dos
outros atributos: “elasticidade”, “corte”, “cor”.
Como estamos tratando de um bem comum, intuitivamente, quanto menor o preço,
melhor para o consumidor. Assim, o preço não passa a ser um fator diferencial, e sim, uma
paridade de posicionamento da marca. Caso incluíssemos o preço, ele poderia ter influência
direta no viés da preferência dos atributos.
Capítulo 22: Modelos de Equações Estruturais (MEE)
A modelagem de equações estruturais é um procedimento para estimar uma série de
relações de dependência entre um conjunto de construtos representados por diversas
variáveis e incorporados em um modelo integrado. É uma mistura entre a fatorial e a
regressão linear múltipla, na medida em que eu utilizo variáveis que explicam um construto e
estes construtos podem ser colocados em uma regressão linear. O MEE pode ajudar a avaliar
as propriedades da mensuração e testar as relações teóricas propostas utilizando uma única
técnica. Ele também examina a estrutura de inter-relações, que são expressas em uma série de
equações estruturais. Essas equações modelam todas as relações entre construtos,
dependentes e independentes.
No MEE, os construtos são fatores não observáveis ou latentes em relações de
dependência que são representados por diversas variáveis, mas não pode ser medidos
diretamente por um questionário, por exemplo. Além disso, ocorre a incorporação de um erro
de mensuração de maneira explícita. O erro descreve o grau até onde as variáveis observadas
não descrevem os construtos latentes deinteresse no MEE. O modelo pode considerar a
confiabilidade menos que perfeita das variáveis observáveis, proporcionando análises de
atenuação e viés de estimativa devido ao erro de mensuração. O processo também consiste na
explicação da covariância entre as variáveis observadas e na estimação de efeitos diretos e
indiretos na variável dependente.
5 Alta Cintura Baixa Clara
6 Alta Cintura Baixa Escura
7 Alta Cintura Alta Clara
8 Alta Cintura Alta Escura

Vale ressaltar que o MEE é usado principalmente como técnica confirmatória, para
determinar se certo modelo (de mensuração) é válido, e não como técnica exploratória.
Uma teoria serve como fundamento conceitual para o desenvolvimento de um
modelo, portanto é necessário que inicialmente o MEE seja baseado em uma teoria antes dele
ser estimado. O MEE consiste em dois modelos: o modelo de mensuração e o modelo
estrutural. O primeiro retrata como as variáveis observadas/medidas representam construtos
e permite a avaliação da validade do construto construído. O modelo de mensuração utiliza a
técnica de análise fatorial confirmatória, em que o pesquisador define quais as variáveis que
definem cada construto/fator, para confirmar se os construtos e as cargas das variáveis
observadas sobre eles estão dentro do esperado na teoria. Assim, a AFC é empregada para
verificar a estrutura fatorial de um conjunto de variáveis observadas. O modelo estrutural, por
sua vez, mostra como os construtos são inter-relacionados uns com os outros, com ou sem
relações de dependência.
Modelos podem ser representados visualmente por um diagrama de caminho (path
diagram). Relações de dependência são representadas por flechas retas com uma
extremidade, do construto independente para o dependente. Já, relações correlacionais
(covariância) são representadas por flechas curvas com duas pontas, ligando os dois
construtos.
Construto exógeno: é o equivalente latente e formado por vários itens de variáveis
independentes na análise multivariada. É determinado por fatores externos ao modelo e não
pode ser explicado por nenhum outro construto ou variável no modelo  Variáveis múltiplas X
medidas representam o construto exógeno ξ .
Construto endógeno: é o equivalente latente* e formado por vários itens de variáveis
dependentes na análise multivariada. É determinado por fatores internos ao modelo e pode
ser explicado por outros construtos ou variáveis no modelo  Variáveis múltiplas Y medidas
representam o construto endógeno η.
Relação correlacional/relação de covariância: especifica uma correlação simples entre
construtos exógenos

Relação de dependência: pode ocorrer em modelos de mensuração (dependência
entre construtos e variáveis mensuradas) e em modelos estruturais (dependência entre
construtos).

Caso quisesse formar minhas equações seriam:
(gama = lâmba) onde x é independente e y é dependente
Índices de validade e confiabilidade dos construtos
Índices de ajuste do modelo  vou ver se deu certo a confiabilidade do modelo

Goodness of fit – quanto maior melhor
Qui- Quadrado – quanto menor melhor  p-valor > 5% me mostra o quanto o modelo
tem uma variância diferente da variância da amostra, portanto mede o quanto o modelo é
ruim.
Exemplo 01: Uso do site de uma universidade

Conclusões: a intenção de uso aumenta quando os alunos percebem a utilidade
(estimativa = 0.46, p<0.001)) e facilidade (estimativa = 0.28, p < 0.001) de utilização; juntos, os
dois construtos combinados explicam 40% da variância na Intenção de uso da internet.
Exemplo 02: Lealdade dos consumidores em uma loja

Esse construto é formado por várias variáveis
O coeficiente representa a covariância
dos dois construtos e pode ser
interpretado como o coeficiente de uma
equação linear:
Yuso = 0,46*útil + erro
Yuso = 0,28*fac + erro
OBS: não seria uma soma das duas, pois
eles têm uma correlação mútua de 0,4.

O consumidor é fiel a minha loja de acordo com a quantidade de compras feitas na
minha loja e este construto é influenciado por outros 3 construtos (preço, atendimento,
ambiente). Percebe-se nesse caso que o ambiente é o mais importante. Se eu quisesse saber o
impacto da percepção de atendimento na lealdade teria que ver todos os caminhos possíveis
até chegar na lealdade.
Conclusões: o ambiente da loja tem o maior impacto, seguido do atendimento e, em
menor grau preço; a participação nas compras tem um impacto substancial na lealdade, com
coeficiente estimado da equação de 0,5.
Exercício: Dell
Desenvolver um SEM para explicar a satisfação e lealdade da Dell (medidas por Q4, Q5
e Q6) em termos de grau de desempenho nos 4 primeiros itens da Q8. Lembrando: foi feita
uma pesquisa com 300 consumidores, as perguntas deveriam ser respondidas em uma escala
Likert, porém, nem todas seguiam o mesmo raciocínio (algumas eram invertidas).
1. Especifique o MM (modelo de mensuração) e o ME (modelo estrutural). Desenhar o
diagrama de caminho
2. Estimar o MM e especificar a validade e confiabilidade
3. Estimar o ME e especificar a validade
4. Que recomendações você daria a Administração da Dell?
1ºpasso: mdesc
2ºpasso: summarize
3ºpasso: statistics  SEM (structural equation modeling)  model building and estimation 
clicar no botão dou nome ao primeiro construto no espaço latent, no caso
Performance, no campo measurable seleciono as questões/variáveis que influenciam
esse construto; abro novamente e nomeio o segundo construto como Lealdade
 clicar no botão faz a flecha de correlação
A primeira etapa da análise de MEE é definir os construtos individuais especificados com base
na teoria, lembrando que o interesse é testar tanto a teoria de mensuração (como os
construtos são representados) quanto a teoria estrutural (como os construtos são inter-
relacionados)
4º passo: estimation  estimate (aba group: standard; aba model: maximum likelihood; aba
reporting: standardized porque as escalas Likerts estão diferentes)

2,4 é a média da escala de 1 a
4 para esta pergunta
A covariância entre os dois
construtos é negativa já que as
escalas são invertidas; ou seja,
quanto melhor minha
performance mais leal o
consumidor será. O valor é bom
já que é próximo de 1.

Com as saídas do stata, diagrama de caminho e com o modelo de mensuração
estimado é possível tirar conclusões sobre. A adequação do modelo é então determinada,
após estimar o MM, comparando-se o quanto a matriz de covariância estimada se enquandra
na matriz de covariância observada. Será utilizado dois índices para avaliar a adequação
(goodness off it – GFI - números mais altos serão desejáveis) e a inadequação do modelo (qui-
quadrado - números baixos serão desejados já que mensuram o erro ou desvio).
O teste qui-quadrado proporciona um teste estatístico da diferença da matriz observada de
covariância da amostra e a matriz de covariância estimada, portanto quanto menor o p-valor,
maior será a chance de que as duas matrizes de covariância não sejam iguais  p-valor MAIOR
do que 5% é desejado para que o modelo não seja inadequado; no caso uma probabilidade de
40,15% comprova que o modelo não é inadequado.
5ºpasso: estimation  goodness of fit  equation level

P-valor < 5%  a variável é
representativa para a
formação daquele construto

Já o índice goodness-of-it valores mais altos são considerados aceitáveis para um
modelo adequado; no caso 0,96 mostra a adequabilidade do modelo já que está muito
próximo de 1.
6ºpasso: Agora quero ver se existe uma relação de dependência entre os construtos criando
um modelo de relação estrutural; ainda com a aba model building and estimation apagar as
flechas de correlação e clicar em estimation clear; clicar no botão; após construir a
flecha de dependência entre os construtos clicar em estimation  estimate (aba group:
standard; aba model: maximum likelihood; aba reporting: standardized porque as escalas
Likerts estão diferentes)

Olhando o diagrama de caminho, percebe-se que a performance é explicada pela
lealdade em 66%. Comparando o modelo de mensuração nota-se que o lado esquerdo não
muda, porém os erros do lado direito mudaram. Novamente o índice de inadequação do
modelo mostrou que o modelo não é inadequado. Se também olharmos para o valor chi(13)
=13,62 é bom (o ideal seria 0). Se o p-valor fosse menor que 5% então a variância da amostra e
a variância estimada seriam diferentes.
7ºpasso: estimation  goodness of fit  equation level

Agora o índice GFI encontrado foi de 0,80, portanto piorou a adequação do modelo
com o modelo estrutural. Porém, existe sim uma relação de dependência entre os construtos.
A conclusão do exercício é que a avaliação de performance determina o grau de
satisfação e lealdade. Portanto a Dell deveria melhorar a performance de seus computadores
para aumentar a satisfação e lealdade dos consumidores.
OBS: Caso o p-valor da estatística qui-quadrado desse menor que 5% deve-se voltar na
estimação do modelo e ver qual das variáveis atrapalhou a construção do construto. Posso
tirar ela ou fazer um recoach (nesse caso geraria uma coluna extra com as respostas na escala
inversa)