Buscar

I [PME]

Prévia do material em texto

Preparação, 
Análise e 
Interpretação de 
Dados
Professor: Rafael Marcuzzo
UDESC – Universidade do Estado de Santa Catarina
CCT – Centro de Ciências Tecnológicas
DEPS – Departamento de Engenharia de Produção e Sistemas
Objetivo geral da disciplina: Proporcionar aos acadêmicos conhecimentos para
realização da pesquisade mercado.
PME - Pesquisa de Mercado
1
Cronograma de Atividades
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
2
Data​ Conteúdo Previsto​
18/ago Plano de ensino. Cronograma de atividades. Acordo de trabalho.​
25/ago Introdução a Pesquisa de Mercado. Estruturas de mercado.​
01/set​ Métodos de pesquisa.​ Atividade 01​
08/set​ Coleta de dados secundários.​ Atividade 02​
15/set​ Escalas e Mensuração.​ Atividade 03​
22/set​ Elaboração do instrumento de pesquisa.​ Atividade 04​
29/set​ Definição da amostra.​ Atividade 05​
06/out​ Atividade 05 e Trabalho Final Trabalhar​
13/out​ Aplicação da pesquisa.​
20/out​ Semana de Eventos Integrados (SEI)​ Participar/Trabalhar
27/out Análise e interpretação de dados
03/nov Apresentação dos resultados/ Tomada de decisão​
10/nov Modelo de relatório / Prévias dos trabalhos finais​ Trabalhar​
17/nov Revisão para prova​
24/nov Prova​
01/dez​ Apresentações de Trabalho Final​
08/dez​ Apresentações de Trabalho Final​
15/dez​
O que vimos na última aula?
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
3
• O grau de aceitação social de entrevistador(a) pelo(a) entrevistado(a)
pode influir na qualidade dos dados obtidos, especialmente em
entrevistas pessoais;
• Saúde, sociabilidade, comunicabilidade, educação, experiência são 
qualificações que devem ser comuns a entrevistadores(as);
• Pequena modificação no fraseado, na sequência ou na maneira de
formular a pergunta pode deixar tendenciosa a resposta;
• Técnicas motivacionais para induzir entrevistado(a) a ampliar,
esclarecer ou explicar suas respostas;
• Educação e ética no encerramento da entrevista e na avaliação de
entrevistadores(as) é fundamental para garantir boa impressão.
Nesta aula:
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
4
• Introdução a análise e interpretação de dados
• Preparação dos dados
• Análise preliminar de dados com técnica de Distribuição de 
Frequência
• Medidas de posição
• Medidas de dispersão
• Medidas de forma
• Análise de um instrumento de pesquisa de mestrado
• Trabalhar
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
5
Desafios da Análise e Interpretação de Dados
• Ter dificuldades na hora de interpretar os 
dados;
• Focar só no passado e não no futuro;
• Não conseguir comunicar os resultados para o 
cliente;
• Dedicar mais tempo à coleta dos dados do 
que à análise;
• Qual o futuro da análise e interpretação de 
dados?
HO, Joses et al. Moving beyond P values: data analysis with estimation graphics. Nature
methods, v. 16, n. 7, p. 565-566, 2019.
Introdução
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
6
• Bigdata, machine learning, deep web… o que mais virá?
• Muitos projetos de pesquisa de marketing não vão além da análise dos
dados básicos (tabelas e gráficos);
• A análise de dados preliminar proporciona informações valiosas e
orienta não apenas o resto da análise, como também a interpretação
dos resultados;
• Análise preliminar de dados com técnica de Distribuição de Frequências.
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
7
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
8
• Após definir o problema de pesquisa e desenvolver uma abordagem conveniente,
formular uma concepção de pesquisa e realizar o trabalho de campo, o
pesquisador pode passar ao preparo e à análise dos dados.
• Antes que os dados brutos contidos no questionário sejam submetidos à análise
estatística, devem ser alinhados em um formato apropriado para análise.
• A qualidade dos resultados estatísticos depende dos cuidados adotados na fase
de preparação dos dados.
• O processo de preparo dos dados é orientado pelo plano preliminar de análise de
dados formulado durante a fase de concepção (abordagem do problema).
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
9
• Refere-se à implementação de uma série de processos, na qual as
informações são revisadas para se chegar a uma conclusão.
• Objetiva ajudar as pessoas a entender os dados numéricos que foram
coletados, organizados e disponibilizados.
• “Lixo que entra, lixo que sai”.
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
10
Verificação do questionário
• Partes do questionário estão incompletas?
• O padrão das respostas indica que o entrevistado não entendeu
ou não seguiu as instruções? (ex. ordem)
• As respostas acusam pequena variância? (ex. sempre a opção 4
em várias questões de 7 pontos)
• O questionário é recebido após a data estipulada para o
encerramento?
• O questionário é respondido por alguém qualificado para participar
da pesquisa?
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
11
Editoração
• Consiste em identificar respostas ilegíveis, incompletas,
inconsistentes ou ambíguas (no caso de questões não-
estruturadas).
• Respostas insatisfatórias podem ser superadas retornando-se ao
campo de trabalho (principalmente amostragens pequenas).
• Complementa-se valores faltantes no caso de (i) serem em
número muito pequeno e (ii) não se tratarem de variáveis-chave.
• Elimina-se respostas insatisfatórias, em alguns casos.
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
12
Editoração
• Elimina-se respostas insatisfatórias, em alguns casos. Exemplo:
Em uma pesquisa transcultural com gerentes de marketing de países
africanos de língua inglesa, foram enviados questionários a 565
empresas, tendo sido devolvidos 192 formulários preenchidos;
desses, quatro foram descartados porque os respondentes sugeriram
que não estavam encarregados de decisões gerenciais de marketing.
→ A decisão de descartar os quatro questionários baseou-se no fato
de se tratar de uma amostra suficientemente grande com uma
proporção pequena de respondentes insatisfatórios.
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
13
Codificação
• Consiste em atribuir um código (geralmente um número) a cada
resposta possível de cada questão.
• O código inclui uma indicação na coluna (campo) e o registro que
vai ocupar:
• Registro: todas características demográficas (ex.: aba do Excel);
• Campo: Célula
Número da 
coluna
Nome da variável
Número da 
questão
Instruções de codificação
7
Frequência de 
compra
III
Nenhuma=1; Muito frequente=6; 
Valores faltantes=9
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
14
Codificação
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
15
Codificação
• Podem ser adicionados ainda, para cada entrevistado, código de projeto,
código do entrevistador, códigos de data e hora e código de validação.
• Códigos de valores faltantes devem ser diferentes dos códigos atribuídos a
respostas legítimas.
• Em geral basta uma única coluna para codificar uma questão estruturada
com resposta única (dicotômicas e de uma escolha apenas entre mais de
duas opções).
Ex.: Você tem passaporte válido?
1. Sim. 2. Não
→ As vezes precisa-semais colunas, em questões que admitem um grande
número de respostas (múltipla escolha);
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
16
Codificação
• Questões não-estruturadas,: respostas literais dos entrevistados são
registradas.
• Pode-se relacionar categorias de respostas (mutuamente excludentes e
coletivamente exaustivas), a fim de codificá-las.
• Itens críticos devem ter atribuídos códigos de categoria diferenciados.
• É preciso codificar os dados de maneira que conservem o maior
numero possível de detalhes (não traduzir para frequentes ou
ocasionais).
• Livro de códigos.
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
17
Transcrição
• Fazer a digitação dos dados.
• Hoje em dia os softwares já fazem a compilação e criam uma
tabela com os dados coletados, de acordo com seu
posicionamento no registro.
• Interconexão entre instrumentos: dados coletados abastecem em
tempo real um banco de dados de sistema de gestão dos dados
(ex. dashboard do Power BI) que habilita o monitoramento e
planejamento quase em tempo real das intervenções necessárias.
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
18
Depuração
• Verificação detalhada e ampla da consistência e tratamento de
respostas faltantes.
Ex.: Entrevistados foram consultados quanto ao seu grau de concordância, em
uma escala de 1 a 5, com certas afirmações sobre seumodo de vida.
Supondo que 9 designe valores faltantes, os valores 0, 6, 7 e 8 estão fora do
padrão. Softwares como Excel, SPSS, SAS e Minitab podem ser programados
para identificar e imprimir o código relacionado e proporcionar ações de correção
/ exclusão.
Ex.2: Um entrevistado pode afirmar que debita em seu cartão de crédito a fatura
do telefone - mas ele não tem um cartão de crédito.
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
19
Depuração
• Como lidar com respostas faltantes (ou ambíguas, inconsistentes):
hoje em dia via formulários eletrônicos pode ser fácil, com o
recurso da obrigatoriedade de resposta. Entretanto, não é ético
requerer a obrigatoriedade.
• Proporção de respostas faltantes deve ser menor que 10%. O que
pode-se fazer nesses casos (com muita cautela):
• Substituir por um valor neutro (médio);
• Substituir por um valor já marcado antes;
• Supressão caso a caso;
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
20
Ajuste estatístico dos dados
Ponderação, reespecificação e transformação de escala.
• Ponderação: Atribuição de peso que reflete a importância relativa
do respondente em relação aos outros.
• Ex.: Em estudo para determinar as modificações a serem feitas em um
produto existente, o pesquisador pode querer atribuir um peso maior às
opiniões de usuários frequentes do produto (3- bastante; 2- médio; 1-pouco).
• Ex.: A preferência por restaurantes de refeições rápidas é influenciada por
características demográficas, como nível de instrução. Assim, a ponderação
pode tornar-se necessária.
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
21
Ajuste estatístico dos dados
Ponderação, reespecificação e transformação de escala.
• Reespecificação: Transformação de dados para criar novas
variáveis ou modificar variáveis existentes, de modo que se tornem
mais consistentes com o objetivo do estudo.
• Ex.: Suponha que a variável original seja o consumo de um produto, com 10
categorias de resposta. Pode-se condensar essas 10 em 4 (frequente,
médio, eventual e não-usuário).
• Ex.: Pode-se tomar a razão entre variáveis: se foram calculados o total de
compras em uma loja (X1) e o montante dessas que foram debitadas (X2),
pode-seobter nova variável da razão dessas duas (X2/X1).
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
22
Ajuste estatístico dos dados
Ponderação, reespecificação e transformação de escala.
• Transformação de escala: Manipulação dos valores de uma
escala a fim de assegurar a comparabilidade com outras escalas
ou adaptar os dados para análise.
• Ex.: Xt = Xi – media + C
• Padronização: correção de dados para reduzi-los à mesma escala
mediante subtração da média de amostragem e divisão pelo
desvio-padrão:
• Zi = (Xi – média) / s
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
23
Estratégia de análise de dados
Depende da definição e abordagem do problema e da concepção da
pesquisa (passos iniciais do processo de PME).
• Considerar características conhecidas dos dados: escalas de medida
exercem forte influência sobre a escolha de técnicas estatísticas
• Considerar as propriedades das técnicas estatísticas: algumas são
adequadas para examinar diferenças em variáveis, outras para avaliar
a magnitude da relação entre variáveis e outras, ainda, para fazer
previsões.
• Várias técnicas podem ser apropriadas para analisar dados de um
mesmo projeto.
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
24
Preparação dos Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
25
Análise e Interpretação de Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
26
Análise e Interpretação de Dados
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
27
• Uma vez preparados os dados, procede-se uma análise preliminar.
• A Distribuição de Frequências é uma das opções (além da tabulação
cruzada e teste de hipóteses), na qual é possível indicar números
faltantes ou extremos, visualizar tendência central da distribuição e da
forma da distribuição.
• Distribuição matemática cujo objetivo é obter uma contagem do número
de respostas associadas a diferentes valores de uma variável e
expressar essas contagens em termos de porcentagens.
Distribuição de Frequências
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
28
• Contagem do número de respostas associadas a diferentes valores de uma
variável (porcentagens).
Respostas
ilegítimas (0, 8).
Extremos Faltantes
Distribuição de Frequências
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
29
• Histograma de Frequência: Distribuição empírica da variável
Reflexão: A distribuição observada é consistente com uma distribuição esperada ou
assumida, como a normal?
→ Estatísticas
associadas:
- Posição
- Dispersão
- Forma
Distribuição de Frequências
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
30
Medidas de Posição
• Média: somar elementos e dividir pela soma no número de elementos - sensível
a valores extremos (escala intervalar ou de razão);
• Moda: valor que ocorre com maior frequência (pico). Recomendada para variável
categórica (escala nominal).
• Mediana: valor acima do qual está a metade dos valores e abaixo está a outra
metade dos valores;
• Valores em ordem crescente ou decrescente (dados ordinais);
Ex.: Seja a sequência numérica {4, 4, 6, 7, 10, 11, 12, 14, 15}
com frequência {1, 1, 2, 1, 1, 2, 4, 2, 1}.
→ Qual Média, Moda e Mediana?
Distribuição de Frequências
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
31
Medidas de Dispersão (1/4)
• Intervalo: Diferença entre o maior e o menor valor de uma distribuição.
• Intervalo interquartil: Intervalo de uma distribuição que abrange os 50%
intermediários dasobservações.
• Diferença entre a mediana da 2ª parte e a mediana da 1ª parte do conjunto
de dados.
Ex.: Seja a sequência numérica {4, 4, 6, 7, 10, 11, 12, 14, 15}
→ Qual Intervalo e Intervalo interquartil?
Distribuição de Frequências
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
32
Medidas de Dispersão (2/4)
• Variância: Quando os dados estão agrupados em torno da média a variância é
pequena. Se dados estão dispersos em relação a média, a variância é grande.
• Desvio padrão: Grau de dispersão de um conjunto de dados (expresso nas
mesmas unidades dos dados):
Distribuição de Frequências
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
33
Medidas de Dispersão (3/4)
• Exemplo: Seja a sequência numérica {4, 4, 6, 7, 10, 11, 12, 14, 15}
com frequência {1, 1, 2, 1, 1, 2, 4, 2, 1} e média {10}
→ Qual a Variância e o Desvio-padrão?
S2= [ (4-10)2 + (4-10)2 + {2x(6-10)2} + (7-10)2 + (10-10)2 {2x(11-10)2} +
{4x(12-10)2} + {2x(14-10)2}+ (15-10)2 ] / (15 - 1)
S2= {36 + 36 + 32 + 9 + 0 + 2 + 16 + 32 + 25} / 14
S2= 188/14 = 13,428 → Variância
S= 3,664 → Desvio-padrão
Distribuição de Frequências
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
34
Medidas de Dispersão (4/4)
• Coeficiente de Variação: Medida padronizada de dispersão de uma distribuição.
• Medida adimensional e para escalas de razão (com zero absoluto, sem
negativos).
→ Do ponto de vista gerencial, as medidas de dispersão são importantes porque, se
uma característica demonstra grande variabilidade, então talvez o mercado possa
ser segmentado com base nessa característica.
No exemplo anterior, para calcular CV.
CV = 3,66 / 10 = 0,366 = 36,6%
Distribuição de Frequências
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
35
Medidas de Forma
• Assimetria: Característica de uma distribuição que mede sua simetria em
relação à média.
• Se os desvios (a contar da média) são maiores em uma direção do que na outra, há
tendência de cauda.
• Curtose: Medida do achatamento relativo da curva definida pela distribuição de
frequência.
• Distribuição normal é zero. Se curtose positiva, pico é mais acentuado que normal.
Se curtose negativa, a distribuição é mais achatada que a normal.
Distribuição de Frequências
CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas
36
Mapa conceitual da Análise de Frequências
UDESC – Universidade do Estado de Santa Catarina
CCT – Centro de Ciências Tecnológicas
DEPS – Departamento de Engenharia de Produção e Sistemas
RESUMO
• A análise de dados preliminar proporciona informações valiosas e
orienta não apenas o resto da análise, como também a interpretação
dos resultados.
• É básico obter distribuição de frequências, porcentagens e
porcentagens cumulativas, habilitando indicar intervalos, faltantes ou
extremos.
• Média, moda e mediana são medidas de tendência central.
• A variabilidade é descrita pelo intervalo, variância ou desvio-padrão,
coeficiente de variação e intervalo interquartil.
• Assimetria e curtose dão uma ideia da forma da distribuição.

Continue navegando