Baixe o app para aproveitar ainda mais
Prévia do material em texto
Preparação, Análise e Interpretação de Dados Professor: Rafael Marcuzzo UDESC – Universidade do Estado de Santa Catarina CCT – Centro de Ciências Tecnológicas DEPS – Departamento de Engenharia de Produção e Sistemas Objetivo geral da disciplina: Proporcionar aos acadêmicos conhecimentos para realização da pesquisade mercado. PME - Pesquisa de Mercado 1 Cronograma de Atividades CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 2 Data Conteúdo Previsto 18/ago Plano de ensino. Cronograma de atividades. Acordo de trabalho. 25/ago Introdução a Pesquisa de Mercado. Estruturas de mercado. 01/set Métodos de pesquisa. Atividade 01 08/set Coleta de dados secundários. Atividade 02 15/set Escalas e Mensuração. Atividade 03 22/set Elaboração do instrumento de pesquisa. Atividade 04 29/set Definição da amostra. Atividade 05 06/out Atividade 05 e Trabalho Final Trabalhar 13/out Aplicação da pesquisa. 20/out Semana de Eventos Integrados (SEI) Participar/Trabalhar 27/out Análise e interpretação de dados 03/nov Apresentação dos resultados/ Tomada de decisão 10/nov Modelo de relatório / Prévias dos trabalhos finais Trabalhar 17/nov Revisão para prova 24/nov Prova 01/dez Apresentações de Trabalho Final 08/dez Apresentações de Trabalho Final 15/dez O que vimos na última aula? CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 3 • O grau de aceitação social de entrevistador(a) pelo(a) entrevistado(a) pode influir na qualidade dos dados obtidos, especialmente em entrevistas pessoais; • Saúde, sociabilidade, comunicabilidade, educação, experiência são qualificações que devem ser comuns a entrevistadores(as); • Pequena modificação no fraseado, na sequência ou na maneira de formular a pergunta pode deixar tendenciosa a resposta; • Técnicas motivacionais para induzir entrevistado(a) a ampliar, esclarecer ou explicar suas respostas; • Educação e ética no encerramento da entrevista e na avaliação de entrevistadores(as) é fundamental para garantir boa impressão. Nesta aula: CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 4 • Introdução a análise e interpretação de dados • Preparação dos dados • Análise preliminar de dados com técnica de Distribuição de Frequência • Medidas de posição • Medidas de dispersão • Medidas de forma • Análise de um instrumento de pesquisa de mestrado • Trabalhar CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 5 Desafios da Análise e Interpretação de Dados • Ter dificuldades na hora de interpretar os dados; • Focar só no passado e não no futuro; • Não conseguir comunicar os resultados para o cliente; • Dedicar mais tempo à coleta dos dados do que à análise; • Qual o futuro da análise e interpretação de dados? HO, Joses et al. Moving beyond P values: data analysis with estimation graphics. Nature methods, v. 16, n. 7, p. 565-566, 2019. Introdução CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 6 • Bigdata, machine learning, deep web… o que mais virá? • Muitos projetos de pesquisa de marketing não vão além da análise dos dados básicos (tabelas e gráficos); • A análise de dados preliminar proporciona informações valiosas e orienta não apenas o resto da análise, como também a interpretação dos resultados; • Análise preliminar de dados com técnica de Distribuição de Frequências. Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 7 Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 8 • Após definir o problema de pesquisa e desenvolver uma abordagem conveniente, formular uma concepção de pesquisa e realizar o trabalho de campo, o pesquisador pode passar ao preparo e à análise dos dados. • Antes que os dados brutos contidos no questionário sejam submetidos à análise estatística, devem ser alinhados em um formato apropriado para análise. • A qualidade dos resultados estatísticos depende dos cuidados adotados na fase de preparação dos dados. • O processo de preparo dos dados é orientado pelo plano preliminar de análise de dados formulado durante a fase de concepção (abordagem do problema). Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 9 • Refere-se à implementação de uma série de processos, na qual as informações são revisadas para se chegar a uma conclusão. • Objetiva ajudar as pessoas a entender os dados numéricos que foram coletados, organizados e disponibilizados. • “Lixo que entra, lixo que sai”. Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 10 Verificação do questionário • Partes do questionário estão incompletas? • O padrão das respostas indica que o entrevistado não entendeu ou não seguiu as instruções? (ex. ordem) • As respostas acusam pequena variância? (ex. sempre a opção 4 em várias questões de 7 pontos) • O questionário é recebido após a data estipulada para o encerramento? • O questionário é respondido por alguém qualificado para participar da pesquisa? Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 11 Editoração • Consiste em identificar respostas ilegíveis, incompletas, inconsistentes ou ambíguas (no caso de questões não- estruturadas). • Respostas insatisfatórias podem ser superadas retornando-se ao campo de trabalho (principalmente amostragens pequenas). • Complementa-se valores faltantes no caso de (i) serem em número muito pequeno e (ii) não se tratarem de variáveis-chave. • Elimina-se respostas insatisfatórias, em alguns casos. Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 12 Editoração • Elimina-se respostas insatisfatórias, em alguns casos. Exemplo: Em uma pesquisa transcultural com gerentes de marketing de países africanos de língua inglesa, foram enviados questionários a 565 empresas, tendo sido devolvidos 192 formulários preenchidos; desses, quatro foram descartados porque os respondentes sugeriram que não estavam encarregados de decisões gerenciais de marketing. → A decisão de descartar os quatro questionários baseou-se no fato de se tratar de uma amostra suficientemente grande com uma proporção pequena de respondentes insatisfatórios. Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 13 Codificação • Consiste em atribuir um código (geralmente um número) a cada resposta possível de cada questão. • O código inclui uma indicação na coluna (campo) e o registro que vai ocupar: • Registro: todas características demográficas (ex.: aba do Excel); • Campo: Célula Número da coluna Nome da variável Número da questão Instruções de codificação 7 Frequência de compra III Nenhuma=1; Muito frequente=6; Valores faltantes=9 Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 14 Codificação Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 15 Codificação • Podem ser adicionados ainda, para cada entrevistado, código de projeto, código do entrevistador, códigos de data e hora e código de validação. • Códigos de valores faltantes devem ser diferentes dos códigos atribuídos a respostas legítimas. • Em geral basta uma única coluna para codificar uma questão estruturada com resposta única (dicotômicas e de uma escolha apenas entre mais de duas opções). Ex.: Você tem passaporte válido? 1. Sim. 2. Não → As vezes precisa-semais colunas, em questões que admitem um grande número de respostas (múltipla escolha); Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 16 Codificação • Questões não-estruturadas,: respostas literais dos entrevistados são registradas. • Pode-se relacionar categorias de respostas (mutuamente excludentes e coletivamente exaustivas), a fim de codificá-las. • Itens críticos devem ter atribuídos códigos de categoria diferenciados. • É preciso codificar os dados de maneira que conservem o maior numero possível de detalhes (não traduzir para frequentes ou ocasionais). • Livro de códigos. Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 17 Transcrição • Fazer a digitação dos dados. • Hoje em dia os softwares já fazem a compilação e criam uma tabela com os dados coletados, de acordo com seu posicionamento no registro. • Interconexão entre instrumentos: dados coletados abastecem em tempo real um banco de dados de sistema de gestão dos dados (ex. dashboard do Power BI) que habilita o monitoramento e planejamento quase em tempo real das intervenções necessárias. Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 18 Depuração • Verificação detalhada e ampla da consistência e tratamento de respostas faltantes. Ex.: Entrevistados foram consultados quanto ao seu grau de concordância, em uma escala de 1 a 5, com certas afirmações sobre seumodo de vida. Supondo que 9 designe valores faltantes, os valores 0, 6, 7 e 8 estão fora do padrão. Softwares como Excel, SPSS, SAS e Minitab podem ser programados para identificar e imprimir o código relacionado e proporcionar ações de correção / exclusão. Ex.2: Um entrevistado pode afirmar que debita em seu cartão de crédito a fatura do telefone - mas ele não tem um cartão de crédito. Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 19 Depuração • Como lidar com respostas faltantes (ou ambíguas, inconsistentes): hoje em dia via formulários eletrônicos pode ser fácil, com o recurso da obrigatoriedade de resposta. Entretanto, não é ético requerer a obrigatoriedade. • Proporção de respostas faltantes deve ser menor que 10%. O que pode-se fazer nesses casos (com muita cautela): • Substituir por um valor neutro (médio); • Substituir por um valor já marcado antes; • Supressão caso a caso; Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 20 Ajuste estatístico dos dados Ponderação, reespecificação e transformação de escala. • Ponderação: Atribuição de peso que reflete a importância relativa do respondente em relação aos outros. • Ex.: Em estudo para determinar as modificações a serem feitas em um produto existente, o pesquisador pode querer atribuir um peso maior às opiniões de usuários frequentes do produto (3- bastante; 2- médio; 1-pouco). • Ex.: A preferência por restaurantes de refeições rápidas é influenciada por características demográficas, como nível de instrução. Assim, a ponderação pode tornar-se necessária. Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 21 Ajuste estatístico dos dados Ponderação, reespecificação e transformação de escala. • Reespecificação: Transformação de dados para criar novas variáveis ou modificar variáveis existentes, de modo que se tornem mais consistentes com o objetivo do estudo. • Ex.: Suponha que a variável original seja o consumo de um produto, com 10 categorias de resposta. Pode-se condensar essas 10 em 4 (frequente, médio, eventual e não-usuário). • Ex.: Pode-se tomar a razão entre variáveis: se foram calculados o total de compras em uma loja (X1) e o montante dessas que foram debitadas (X2), pode-seobter nova variável da razão dessas duas (X2/X1). Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 22 Ajuste estatístico dos dados Ponderação, reespecificação e transformação de escala. • Transformação de escala: Manipulação dos valores de uma escala a fim de assegurar a comparabilidade com outras escalas ou adaptar os dados para análise. • Ex.: Xt = Xi – media + C • Padronização: correção de dados para reduzi-los à mesma escala mediante subtração da média de amostragem e divisão pelo desvio-padrão: • Zi = (Xi – média) / s Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 23 Estratégia de análise de dados Depende da definição e abordagem do problema e da concepção da pesquisa (passos iniciais do processo de PME). • Considerar características conhecidas dos dados: escalas de medida exercem forte influência sobre a escolha de técnicas estatísticas • Considerar as propriedades das técnicas estatísticas: algumas são adequadas para examinar diferenças em variáveis, outras para avaliar a magnitude da relação entre variáveis e outras, ainda, para fazer previsões. • Várias técnicas podem ser apropriadas para analisar dados de um mesmo projeto. Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 24 Preparação dos Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 25 Análise e Interpretação de Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 26 Análise e Interpretação de Dados CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 27 • Uma vez preparados os dados, procede-se uma análise preliminar. • A Distribuição de Frequências é uma das opções (além da tabulação cruzada e teste de hipóteses), na qual é possível indicar números faltantes ou extremos, visualizar tendência central da distribuição e da forma da distribuição. • Distribuição matemática cujo objetivo é obter uma contagem do número de respostas associadas a diferentes valores de uma variável e expressar essas contagens em termos de porcentagens. Distribuição de Frequências CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 28 • Contagem do número de respostas associadas a diferentes valores de uma variável (porcentagens). Respostas ilegítimas (0, 8). Extremos Faltantes Distribuição de Frequências CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 29 • Histograma de Frequência: Distribuição empírica da variável Reflexão: A distribuição observada é consistente com uma distribuição esperada ou assumida, como a normal? → Estatísticas associadas: - Posição - Dispersão - Forma Distribuição de Frequências CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 30 Medidas de Posição • Média: somar elementos e dividir pela soma no número de elementos - sensível a valores extremos (escala intervalar ou de razão); • Moda: valor que ocorre com maior frequência (pico). Recomendada para variável categórica (escala nominal). • Mediana: valor acima do qual está a metade dos valores e abaixo está a outra metade dos valores; • Valores em ordem crescente ou decrescente (dados ordinais); Ex.: Seja a sequência numérica {4, 4, 6, 7, 10, 11, 12, 14, 15} com frequência {1, 1, 2, 1, 1, 2, 4, 2, 1}. → Qual Média, Moda e Mediana? Distribuição de Frequências CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 31 Medidas de Dispersão (1/4) • Intervalo: Diferença entre o maior e o menor valor de uma distribuição. • Intervalo interquartil: Intervalo de uma distribuição que abrange os 50% intermediários dasobservações. • Diferença entre a mediana da 2ª parte e a mediana da 1ª parte do conjunto de dados. Ex.: Seja a sequência numérica {4, 4, 6, 7, 10, 11, 12, 14, 15} → Qual Intervalo e Intervalo interquartil? Distribuição de Frequências CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 32 Medidas de Dispersão (2/4) • Variância: Quando os dados estão agrupados em torno da média a variância é pequena. Se dados estão dispersos em relação a média, a variância é grande. • Desvio padrão: Grau de dispersão de um conjunto de dados (expresso nas mesmas unidades dos dados): Distribuição de Frequências CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 33 Medidas de Dispersão (3/4) • Exemplo: Seja a sequência numérica {4, 4, 6, 7, 10, 11, 12, 14, 15} com frequência {1, 1, 2, 1, 1, 2, 4, 2, 1} e média {10} → Qual a Variância e o Desvio-padrão? S2= [ (4-10)2 + (4-10)2 + {2x(6-10)2} + (7-10)2 + (10-10)2 {2x(11-10)2} + {4x(12-10)2} + {2x(14-10)2}+ (15-10)2 ] / (15 - 1) S2= {36 + 36 + 32 + 9 + 0 + 2 + 16 + 32 + 25} / 14 S2= 188/14 = 13,428 → Variância S= 3,664 → Desvio-padrão Distribuição de Frequências CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 34 Medidas de Dispersão (4/4) • Coeficiente de Variação: Medida padronizada de dispersão de uma distribuição. • Medida adimensional e para escalas de razão (com zero absoluto, sem negativos). → Do ponto de vista gerencial, as medidas de dispersão são importantes porque, se uma característica demonstra grande variabilidade, então talvez o mercado possa ser segmentado com base nessa característica. No exemplo anterior, para calcular CV. CV = 3,66 / 10 = 0,366 = 36,6% Distribuição de Frequências CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 35 Medidas de Forma • Assimetria: Característica de uma distribuição que mede sua simetria em relação à média. • Se os desvios (a contar da média) são maiores em uma direção do que na outra, há tendência de cauda. • Curtose: Medida do achatamento relativo da curva definida pela distribuição de frequência. • Distribuição normal é zero. Se curtose positiva, pico é mais acentuado que normal. Se curtose negativa, a distribuição é mais achatada que a normal. Distribuição de Frequências CCT – Centro de Ciências Tecnológicas / DEPS – Departamento de Engenharia de Produção e Sistemas 36 Mapa conceitual da Análise de Frequências UDESC – Universidade do Estado de Santa Catarina CCT – Centro de Ciências Tecnológicas DEPS – Departamento de Engenharia de Produção e Sistemas RESUMO • A análise de dados preliminar proporciona informações valiosas e orienta não apenas o resto da análise, como também a interpretação dos resultados. • É básico obter distribuição de frequências, porcentagens e porcentagens cumulativas, habilitando indicar intervalos, faltantes ou extremos. • Média, moda e mediana são medidas de tendência central. • A variabilidade é descrita pelo intervalo, variância ou desvio-padrão, coeficiente de variação e intervalo interquartil. • Assimetria e curtose dão uma ideia da forma da distribuição.
Compartilhar