Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Centro Paula Sousa CURSO GESTÃO EMPRESARIAL DISCIPLINA Análise e Interpretação de Dados DOCENTE Prof. Me. Marcos Pereira “Pesquisar é buscar meios de transformar curiosidade em informação”. A estatística auxilia o pesquisador a ir, por inferência, mais longe do que seus olhos alcançam”. Sérgio F. Costa. Importante: Este conjunto de textos visa apenas orientar o estudo dos alunos sobre o conteúdo desenvolvido em sala de aula. Não substitui, portanto, as discussões em sala de aula sobre os temas abordados ou exercícios nela desenvolvidos. Nas avaliações realizadas, as anotações de aula e as correções dos exercícios são igualmente importantes. São Paulo Outubro / 2014 2 AVALIAÇÃO DA DISCIPLINA 50% - Média aritmética das atividades realizadas EM SALA DE AULA. 50% - Trabalho entregue impresso dia 15/12 – última aula. O trabalho deverá abordar algum problema (livre escolha do aluno) a ser pesquisado em uma empresa ou atividade econômica e deverá conter ao menos 6 dos 9 conteúdos abaixo: 1) Dados secundários – fontes internas 2) Dados secundários – fontes externas 3) Pesquisa qualitativa – Focus Group 4) Ficha de Avaliação do Cliente/Usuário devidamente analisada 5) Determinação do tamanho da amostra 6) Elaboração de questionário com escalas de avaliação 7) Apresentação de resultados com gráficos 8) Cálculo e interpretação do resultado da correlação linear simples 9) Cálculo da regressão linear simples ESTATÍSTICA Na Antiguidade, quando os agricultores precisaram de um método para contar sua produção e seus animais, utilizaram pequenas pedras, que em latim eram chamadas de calculus. No sec. IV, na Índia, adotou-se a numeração de base 10, ao invés do 6. A introdução do zero deu-se no sec. IX e permitiu operações mais complexas e precisas. Um século depois, também na Índia, aparecem os algarismo indu-arábicos. A palavra estatística tem raiz latina, em status, de onde se origina estado. Apenas no final do século XVIII a palavra estatística surge na Enciclopédia Britânica pelas mãos do historiador e jurista alemão Gottfried Achenwall. A teoria das probabilidades surge a partir do século XVII por encomenda real. Soberanos queriam utilizar “macetes” que lhes garantissem ganhar em jogos de azar. Até cientistas de renome como Pascal e Newton estiveram envolvidos nesses estudos. 3 Hoje a definimos como o conjunto de técnicas e métodos que envolvem planejamento, coleta qualificada de dados, processamento, análise e inferências sobre um experimento. Confere ordem, estrutura e significado aos dados, tornando-os confiáveis para a tomada de decisões. Identifica variações e tendências, transformando-os em informações. Estatística descritiva - Descreve a realidade a partir dos dados obtidos, como se fosse um retrato da situação. Permite construir gráficos/tabelas, ordenar as variáveis, calcular médias e porcentagens para fornecer uma primeira ideia de como um fenômeno se comporta no tempo e no espaço. É uma análise estática, não cogita explicar o futuro. Serve para organizar, analisar e interpretar os dados disponíveis. Estatística inferencial - É dinâmica e permite ao pesquisador fazer previsões sobre o comportamento de um fenômeno e tomar decisões mais acertadas, como se fosse uma “bola de cristal”. Ao tirar conclusões de uma amostra e repassá-las à população- mãe o pesquisador pode realizar erros de inferência. A Teoria das probabilidades permite avaliar e o tamanho do erro que se comete ao fazer generalizações (inferências). 1. DADOS E INFORMAÇÕES Dado – aquilo que se toma por base para realizar uma análise quantitativa ou qualitativa. Informação - resultado do processamento, manipulação e organização de dados, de forma a modificar o conhecimento da pessoa ou organização que a recebe. Exemplo 1 – Saber que 25,2% dos estrangeiros que visitaram o Brasil em 2013 desaprovaram a sinalização turística é apenas um dado solto. Mas verificar que esse índice é históricamente o que mais desagrada esses visitantes, e que o seu valor era de 15,1% em 2001, é mais que um dado, passa a ser uma informação importante para o planejamento dessa atividade. Percebe-se que o país tem falhado em resolver o que mais atrapalha o seu público-alvo, já que o desagrado é contínuo e tem aumentado. Isso modifica o conhecimento do planejador e pode influenciar suas decisões. 4 Exemplo 2 - O assistente da gerência comercial de uma grande empresa entrega seu relatório de vendas onde detalha a data de cada venda, o nome do cliente, itens adquiridos, o valor bruto da compra, desconto, valor líquido da venda e o prazo de pagamento. Esses dados só se tornarão informações se o gerente comercial, por sua conta, separar o valor líquido das vendas e perceber que 35% das vendas representam 70% da receita do mês, e que 75% dos pedidos foram feitos na primeira quinzena do mês. Identificar os principais compradores e os clientes menos rentáveis, além do momento propício para oferecer os produtos, pode ser de grande valia para essa gerência e alterar algumas políticas até então adotadas pela empresa. Levantar dados é um trabalho inicial, por vezes difícil ou trabalhoso, e de grande importância. Porém, não são um fim em si mesmos. Precisam ser adequadamente analisados/trabalhados para gerarem informações, ou seja, agregar conhecimento. 2. TIPOS DE ESTUDO ESTUDO EXPLORATÓRIO - descobre explicações novas para um problema, relações de causa e efeito. A formalidade dá lugar à flexibilidade e à criatividade na coleta e análise dos dados. Utiliza primeiramente fontes secundárias para se atualizar a cerca das hipóteses e prováveis explicações a serem investigadas. Depois o investigador parte para a pesquisa junto a indivíduos informados, com forte associação ao problema. Requer do pesquisador um bom conhecimento do problema. ESTUDO DESCRITIVO - Utilizado para descrever as características de uma determinada situação, como pesquisas de opinião pública, grau de satisfação de clientes e turistas, ou identificação do perfil da demanda. Trata-se de um projeto mais formal, que planeja em detalhes toda a coleta e interpretação dos dados. Os estudos descritivos se dividem em: Descritivo Quantitativo Método Estatístico – Caracteriza-se por estudar uma quantidade limitada de fatores em grande número de casos/entrevistas. Utiliza forte base de cálculo para dar credibilidade às informações obtidas. Pode sugerir, mas não comprovar relações de causa e efeito. 5 Descritivo Qualitativo a) Pesquisa Documental – investigação de fontes como jornais, revistas, diários/correspondências pessoais, relatórios, fotografias, propagandas, filmes, obras literárias ou técnicas para obter novas interpretações ou contribuições para um problema. É bastante útil quando é impossível a entrevista com indivíduos essenciais ao problema (distância, negação ou morte) ou para interpretar mudanças comportamentais ao longo do tempo. b) Pesquisa Etnográfica - descrição dos eventos que fazem parte da vida social de um grupo, seja uma tribo indígena, funcionários de uma empresa ou uma comunidade receptora. c) Método do Estudo de Caso - Analisa grande quantidade de variáveis da unidade pesquisada (caso). Busca interpretar as inter-relações associadas ao problema, sendo indicado quando não é possível estudar isoladamente uma variável. Dificuldade de generalizar os resultados para outros casos. Facilidades - Método bastanteflexível, abrange todos os aspectos importantes num único caso e analisa fenômenos em ambiente real, sem abstrair partes da realidade. Dificuldades - Subjetividade e amostra única - dificuldade de generalizar conclusões, risco de ver só o que se quer ver (viés antecipado), método mais demorado e necessidade de maior experiência do pesquisador. Pesquisador deve ser: observador, flexível, bom ouvinte, capaz de não envolver seus julgamentos, correlacionar informações e identificar contradições. Coleta de dados deve ser: observação e entrevista – com relatórios mais informais e narrativos (descritiva do que ocorre no campo e reflexiva com comentários pessoais). Qualidade dos resultados de um estudo de caso em 4 princípios: Massa crítica – múltiplas fontes de evidência. Validade interna – comparações e construções de explicações. Validade externa – possibilidade de reaplicar o estudo em outros casos. Confiabilidade – protocolo de estudos, procedimentos seguidos, registro de dados e tabulação de dados observáveis. 6 ESTUDO EXPERIMENTAL Indicado para estabelecer relações de causa e efeito quando é possível separar/isolar uma variável das demais. Utiliza experiências artificialmente constituídas com a finalidade de visualizar a influência dessa variável. Pode ser usado para testar campanhas publicitárias antes de sua veiculação, promoções, design de embalagens etc. 3. PESQUISAS QUALITATIVAS Por se tratar de uma investigação mais profunda na mente humana, é normalmente realizada por meio de entrevistas pessoais. O questionário é um instrumento mais impessoal, frio e distante, não estimula o entrevistado a se abrir e dar respostas confiáveis nesse tipo de investigação. A seguir são apresentadas as formas mais comuns e eficientes de realizar uma pesquisa qualitativa. a) FOCUS GROUP É utilizada para verificar critérios de escolha de um produto, referenciais de valor (o que valorizam mais para decidir entre um ou outro concorrente), conhecer a hierarquia dos atributos considerados nas decisões do público, entender percepções ou verificar tendências sobre um determinado mercado. É uma entrevista com pequenos grupos de pessoas (geralmente entre 8 a 12 pessoas) que pertençam ao segmento visado. Os atributos fundamentais são aqueles mencionados por um maior número de pessoas ou expressados com maior força pelos entrevistados, possuindo maior peso na análise dos resultados. Cada sessão pode durar cerca de 90 minutos, tempo suficiente para ouvir a todos, mas sem cansá-los. O número de sessões dependerá dos objetivos firmados e da qualidade das respostas obtidas, mas normalmente não passa de 5 a 6 sessões. Entrevistadores experientes apenas introduzem os tópicos pelos quais se interessam e os próprios participantes se encarregam de conversar descontraidamente sobre o tema proposto. Ouvir é mais importante do que falar, as pessoas adoram transmitir seus pontos de vista, emoções e experiências quando são estimuladas. A entrevista deve ser preparada apenas para as questões básicas. No mais, o entrevistador deve deixar a conversa correr livremente. 7 b) FICHA DE AVALIAÇÃO DO CLIENTE Um excelente método para conseguir avaliar continuamente o grau de satisfação com os produtos ou serviços de uma empresa é a aplicação sistemática da ficha de avaliação do cliente. Na verdade, esse instrumento é mais do que um a pesquisa, trata-se de uma ferramenta gerencial que otimiza os esforços para alcançar a qualidade percebida pelos consumidores. Os procedimentos necessários para sua correta montagem são: A) Aplicação aos clientes de uma tabela simples e concisa com os atributos fundamentais. B) Solicitar a classificação dos atributos de acordo com sua importância. C) Avaliação da qualidade percebida de cada atributo. D) Dividir as avaliações em 3 níveis e analisar os resultados com total imparcialidade. Exemplo de FICHA DE AVALIAÇÃO – Hotel de praia ATRIBUTO PRIORIDADE (1 a maior e 12 a menor) AVALIAÇÃO (5 a maior e 1 a menor) Beleza cênica/entorno 5 3 Serviço de praia 12 5 Área de lazer 4 4 Frequentadores 7 3 Atendimento recepção 9 5 Conforto 1 4 Bar e restaurante 8 4 Tamanho do apto. 11 3 Decoração 10 5 Café da manhã 6 2 Preço 2 3 Acesso 3 3 Todos os itens discriminados na tabela são importantes e merecem atenção. Porém, a realidade empresarial mostra que a escassez de recursos força a tomada de decisões sobre a ordem dessas melhorias, ou seja, estabelecer prioridades. A interpretação da Ficha de Avaliação dos Clientes ajuda empresas a hierarquizar os investimentos a serem feitos. No exemplo dado, comparamos a importância de cada atributo com a avaliação recebida. É possível ver que dentre os itens de maior prioridade, conforto e área de lazer foram bem avaliados, mas devem ser melhorados. Já 8 os itens preço e acesso receberam avaliações apenas regulares. No atual momento competitivo, regular deve ser entendido como ruim (não podemos nos contentar em apenas NÃO ser o pior). No segundo nível de prioridades, café da manhã e frequentadores não foram bem avaliados. Mas chama a atenção que os itens de menor prioridade para o público receberam as melhores avaliações dos entrevistados, o que reflete um descompasso entre a visão da administração do hotel e a da sua demanda. Em um primeiro momento de investimento, o hotel deveria direcioná-lo para melhorar o conforto e área de lazer, a fim de contrapor o preço e a localização, que não é possível melhorar no curto prazo. Apesar de outros itens terem tido uma avaliação pior, esses dois itens causam maior impacto junto ao público. Após serem feitos os investimentos nos quesitos mais importantes e que não receberam uma boa avaliação, devemos avaliar onde o restante dos recursos deve ser aplicado. No segundo momento de investimento devem ser incluídos o café da manhã e algo referente ao público frequentador, em razão das baixas avaliações e médias classificações. Por último, melhorias no bar e no restaurante deveriam ser feitas num terceiro momento de investimento, já que a avaliação foi boa e a prioridade é baixa. 4. FONTES DE INFORMAÇÕES Dados secundários - Informações já publicadas que auxiliam na tomada de decisões. Podem vir de duas fontes: Externas - disponíveis em associações de classe, órgãos oficiais e publicações em geral. Neles podemos encontrar dados importantes sobre tendências sobre o tema pesquisado. Internas - encontrados na própria organização. Departamentos produzem relatórios e estudos que podem igualmente ser utilizados na elaboração de estratégias setores correlatos. Antes da pesquisa de campo devemos esgotar a busca por dados secundários para evitar esforços desnecessários e oferecer indicações novas sobre o que deve ser levantado em campo. É indicado consultar o IBGE, FGV, Bacen, Fundação Seade e entidades de classe. A análise de dados secundários deve seguir os seguintes princípios: 9 Encontrar – busca de dados em fontes confiáveis (pesquisadores ou instituições renomadas, órgãos públicos/oficiais, associações de classe, sindicatos ou indivíduos de notório saber sobre o tema) Filtrar – Deve-se focar ao máximo no objetivo da pesquisa e aproveitar o que de fato é relevante. O excesso de dados dificulta o trabalho do pesquisador e a compreensão do leitor. Interpretar – Apenas colocar os dados filtrados na pesquisa torna o conteúdo do relatório fraco. Todos os dados citados/mostrados merecem uma análise mais aprofundada, explicando como interferem no resultado final. Dado X Informação ! Comunicar – Dados levantados e interpretados devem sertambém divulgados, sendo necessário fazê-los circular. Dados escondidos não formam um banco de dados, mas um bando de dados. Dados primários - Informações ainda não pesquisadas devem ser levantadas diretamente junto ao público visado. Por requerer tempo, equipamentos e recursos humanos (sendo muitas vezes cara), a pesquisa de dados primários deve ser muito bem planejada para ser objetiva e evitar desperdícios de recursos. 5. PLANEJAMENTO DA PESQUISA Algumas pesquisas não dão certo por falta de planejamento inicial. Quer pela pressa em obter dados, ou pela falta de experiência, o impulso imediato de logo elaborar um questionário e entrevistar o público é o meio mais rápido de fracassar. Uma pesquisa é um projeto, e como tal deve ser planejado em etapas: A) Objetivos e tipo de estudo - razão pela qual está sendo realizada, ou o problema-chave a ser investigado. Sem ele, muito será investigado sem necessidade e questionamentos relevantes ficarão de fora, por isso é a etapa mais importante do planejamento. Um objetivo bem definido torna a pesquisa mais simples aos entrevistados e útil ao entrevistador. B) Orçamento - quanto custará ao município a sua realização. A ausência da etapa anterior ajuda a elevar os custos da pesquisa. C) Cronograma - quando será realizada cada etapa de seu projeto. Não pode ser meramente figurativo, a indisciplina em segui-lo torna a pesquisa mais onerosa e demorada. D) Gestão - mostra quem ficará responsável por cada etapa. Distribui tarefas e garante sua perfeita execução. 10 E) População e Amostra - definição da população a ser pesquisada e amostra trabalhada: População = conjunto de todos os indivíduos que compõem o universo de interesse do pesquisador. Amostra = subconjunto adequadamente extraído de uma população, oferecendo um retrato próximo da realidade. A amostragem se faz necessário quando o processo de pesquisa for: destrutivo, caro ou muito demorado. Se toda a população for pesquisada, torna-se um censo. F) Instrumento de coleta de dados - definição da forma como os dados serão coletados; pessoalmente, correio, internet, telefone... 8. PESQUISA QUANTITATIVA Utilizada para definir perfil do mercado, estimar a demanda de um produto ou para verificar o grau de satisfação com a oferta de produtos. Usa como instrumento básico de coleta de dados o questionário. É dedutivo e conclusivo, mas não oferece explicações sobre a ocorrência dos eventos pesquisados. Métodos para dimensionamento da amostra O cálculo da amostra necessária a uma determinada pesquisa dependerá de 3 fatores básicos: o tamanho da população (universo da pesquisa), erro máximo de estimativa que o pesquisador permite e grau de confiança (probabilidade de que o valor encontrado esteja dentro da margem de erro). Quanto maior o grau de confiança e menor o erro permitido, maior será o tamanho da amostra necessário ao pesquisador. Apresentaremos a seguir 3 métodos de determinação da amostra. O primeiro deles é dos autores Arkin e Colton, que construíram uma tabela relacionando o tamanho do universo com a margem de erro desejada, a partir de um coeficiente de confiança fixo em 95%: 11 Outro método é utilizado para universos grandes, onde se sabe que a amostra será proporcionalmente pequena (menor do que 10% do universo), e o pesquisador pode variar margem de erro e grau de confiança. Esse cálculo pode ser realizado pela seguinte fórmula: n = tamanho da amostra (Zα/2) = valor crítico associado ao grau de confiança desejado E = erro máximo permitido O grau de confiança mostra o percentual de certeza com que se quer trabalhar, sendo os mais comuns 90%, 95% e 99%. Através da tabela t de Student (tabela de distribuição probabilística) pode-se verificar o valor crítico associado a esses 3 níveis: Grau de confiança Valor crítico 90% 1,645 95% 1,96 99% 2,575 12 Exemplo: Qual o tamanho da amostra que um pesquisador precisa para saber a opinião dos turistas que visitaram à lazer um destino Y sobre a receptividade local? Sabe-se que esse universo é composto por 200 mil indivíduos/ano, o pesquisador quer um grau de confiança de 95% e aceita uma margem de erro máxima de 3%. Pelo tamanho do universo já se sabe que a amostra não será proporcionalmente grande, ou seja, cabe utilizar a fórmula dada: Ou seja, dentro dessas condições o pesquisador precisaria realizar 1.067 entrevistas, que representa 0,5% da população. Caso seja mais exigente e queira trabalhar com apenas 1% de erro, a amostra subiria para 9.604 entrevistas!!!! (4,8% da população). Se quisesse trabalhar com grau de confiança de 90% e 5% de margem de erro, o número de entrevistas cairia para 271 (0,13%). Dependendo das condições o pesquisador pode fazer simulações para determinar qual grau de confiança e margem de erro aceitará. O pesquisador não trabalha só com grandes números, ele pode se deparar com populações finitas, onde a amostra será grande (%). Se uma empresa trabalha com grandes projetos e possui 20 clientes, entrevistar 8 deles representa 40% da população. Nesse caso utiliza-se uma correção na fórmula anterior: Exemplo: Qual o tamanho da amostra que um pesquisador precisa para saber a opinião dos expositores de um evento de médio porte sobre as tendências do setor? O evento teve 80 expositores, o pesquisador quer um grau de confiança de 95% e aceita uma margem de erro máxima de 5%. 13 Ou seja, dentro dessas condições o pesquisador precisaria investigar 80% dos expositores, o que é um tanto difícil. Caso aceitasse um grau de confiança de 90% e uma margem de erro de 10% ele teria que entrevistar apenas 37 expositores, ou 46% dos expositores, tornando a tarefa bem mais facilitada sem comprometer tanto a confiabilidade dos resultados. TÉCNICAS PARA ELABORAÇÃO DE QUESTIONÁRIOS 1) Consequência direta dos objetivos estabelecidos - quanto mais específico e claro, mais simples e curto será ele. 2) Entrevistados não estão dispostos a responder todas as nossas dúvidas, é necessário eleger prioridades. O questionário deve ser curto, porém completo quanto às prioridades do pesquisador. 3) No caso de envio de formulários, a amostra deve ser maior do que é necessário. Muitas pessoas não respondem as pesquisas. 4) Utilize preponderantemente questões fechadas, iniciando o questionário com os dados pessoais. Uma ou duas questões abertas podem ser feitas no final do questionário. 5) Ofereça alternativas de resposta por faixas quando for necessário pesquisar idade e renda dos entrevistados. 6) As questões devem ser simples e de linguagem mais acessível possível. O entrevistado não pode perder tempo tentando entender o sentido do que lhe foi perguntado. 7) Evite perguntas genéricas, pesquisas de mercado precisam obter dados objetivos e conclusivos. Saber que alguém qualificou algo como bom, não nos leva a lugar algum. 8) Evite perguntas compostas ou que possam constranger o entrevistado, induzindo-o a uma determinada resposta. 9) Faça um teste piloto para identificar deficiências e faça os ajustes que julgar necessário no questionário final. 10) Faça cruzamento de respostas. Saber, por exemplo, que 20% dos entrevistados não aprovaram um serviço é muito menos significativo do que saber quem disse isso, qual sua renda, quantas vezes visita comprou, a quanto tempo compra, etc. 14 9. PRINCIPAIS ESCALAS DE AVALIAÇÃO Escala de avaliação verbal ATRIBUTO ÓTIMO MUITO BOM BOM REGULAR RUIM Preço X Café da manhã XBusiness center X Restaurante X Decoração X Espaço para eventos X Escala de ordenação – medir a ordem de atitudes ou preferências Montadora Classificação Atributo Classificação A 2º. Preço 1º. B 4º. Financiamento 6º. C 1º. Manutenção 4º. D 6º. Consumo 5º. E 3º. Conforto 3º. F 5º. Design 2º. Escala comparativa Concorrentes de A Melhor do que A Igual a A Pior do que A Não sei avaliar Empresa B X Empresa C X Empresa D X Empresa E X Escala Stapel Atributo Avaliação Pzo de pagamento -5 -4 -3 -2 -1 1 2 3 4 5 Assistência técnica -5 -4 -3 -2 -1 1 2 3 4 5 Atendimento -5 -4 -3 -2 -1 1 2 3 4 5 15 Escala de soma constante – verificar a ordem e o intervalo de preferência do consumidor. Ex: Distribua 100 pontos entre as marcas abaixo de acordo com sua preferência. Concorrentes Pontos Samsung 40 LG 30 Nokia 15 Motorola 10 Sony Ericsson 05 Escala de diferencial semântico (Osgood) Assinale sua opinião sobre os seguintes atributos do Bar X Limpo ..... ..... ..... ..... ..... ..X.. ..... Sujo Bonito ..... ..... ..X.. ..... ..... ..... ..... Feio Barato ..... ..... ..... ..... ..X.. ..... ..... Caro Escala Likert Afirmações Concordo totalmente Concordo pouco Indeciso Discordo pouco Discordo totalmente Ambiente é aconchegante X Atendimento é cortês X Pouco tempo de espera X Cardápio é variado X Pode também usar as expressões: aprovo totalmente, aprovo parcialmente, indeciso, desaprovo um pouco, desaprovo totalmente 16 10. TIPOS DE GRÁFICOS COLUNA – é o nome popular do histograma, que representa a distribuição de uma variável. São úteis para mostrar as alterações de dados em um período de tempo ou para ilustrar comparações ou contagem entre itens e escalas de medição. “PIZZA” - mostra o tamanho proporcional dos itens em uma série de dados (exibidos como um percentual de toda a pizza). Mais indicado para mostrar a distribuição de poucos itens, ou quando nenhum deles for igual ou próximo de zero. 17 LINHA – É o gráfico poligonal. Mostra a distribuição de dados contínuos ao longo do tempo e, em intervalos iguais, como anos, trimestres ou meses. Útil para demonstrar variações ou flutuações cronológicas com frequência acumulada. 18 Barras – mostra comparações entre itens individuais, normalmente quando os rótulos ou valores forem longos. Dispersão (XY) – mede a uniformidade dos valores. Uteis para verificar a estabilidade da frequência da variável. 19 De área - enfatiza as alterações das variáveis ao longo do tempo mais a participação de cada uma delas para o valor total. Radar (ou Polar) - comparam os valores agregados de várias séries de dados. Útil para demonstrar variações cíclicas. 20 11. MEDIDAS DE TENDÊNCIA CENTRAL Busca o valor central de uma determinada série de dados. a) MÉDIA ARITMÉTICA - indica a centralidade de um conjunto, que pode configurar uma tendência, possibilitando que sejam desenvolvidas ações para satisfazer a maior parte do público estudado. Quando a série envolve muitos dados (por exemplo: R$115,80, R$98,90, R$132,20, R$ 119,40, R$120,00, R$108, 50, R$97,20, R$92,10, R$112, 00, R$86,30, R$149,80 e R$94,60; é necessário utilizar a fórmula: X _ Onde: X = símbolo da média ∑ Xi = somatório de todos os valores da variável n = tamanho da amostra Temos então: _ X = = 110,56 Com uma série grande de dados, como a que apresentamos a seguir: (60, 19, 20, 22, 23, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 49, 50, 55, 56, 57, 58, 60, 18, 19, 20, 20, 21, 22, 23, 23, 24, 25, 25, 25, 26, 26, 26, 30, 30, 30, 30, 31, 32, 33, 33, 34, 34, 34, 35, 41, 43, 44, 45, 46, 47, 48, 49, 50, 53, 55, 56, 57, 58, 27, 27, 27, 28, 28, 28, 28, 29, 29, 29, 36, 36, 36, 37, 37, 38, 38, 39, 38, 40, 38, 40, 38, 40, 40 e 40), a primeira coisa a fazer é organizar os dados por ordem crescente: 18, 19, 19, 20, 20, 20, 21, 22, 22, 23, 23, 23, 24, 25, 25, 25, 25, 26, 26, 26, 26, 27, 27, 27, 27, 28, 28, 28, 28, 28, 29, 29, 29, 29, 30, 30, 30, 30, 30, 31, 31, 32, 32, 33, 33, 33, 34, 34, 34, 34, 35, 36, 36, 36, 36, 37, 37, 37, 38, 38, 38, 38, 38, 38, 39,39, 40, 40, 40, 40, 40, 40, 41, 41, 43, 43, 44, 44, 45, 45, 46, 46, 47, 47, 48, 49, 49, 50, 50, 53, 55, 55, 56, 56, 57, 57, 58, 58, 60 e 60. o A média é uma medida única, fácil de ser entendida, calculada e utilizada. Entretanto, pode ser afetada por valores extremos do conjunto de dados. È a medida ideal quando precisamos saber o quanto algo (processo, sistema...) se aproxima ou se distancia do alvo (meta, controle de qualidade etc). 21 b) MEDIANA - Trata-se do valor situado no meio da distribuição, depois que os dados forem ordenados. o Se o conjunto de dados for ímpar, a mediana corresponde ao valor situado no meio da distribuição. Se o conjunto de dados for par, a mediana corresponde à média aritmética dos dois valores centrais. No caso acima, onde a distribuição das idades forma um conjunto de dados igual a 100: Md = (34 + 35) / 2 = 34,5 anos o A mediana é uma medida única, fácil de ser entendida e calculada, além de não ser afetada pelos valores extremos. Entretanto, como não considera todos os valores da variável, costuma ser menos confiável que a média (exceto nos casos onde os valores extremos são muito díspares). c) MODA - Corresponde ao valor mais frequente de uma distribuição. Quando não há repetição de valores não é possível identificar a moda (Mo). o No caso estudado, há uma série de dados bimodal, 38 e 40 anos, que se repetem 6 vezes na distribuição dos dados. o A moda é uma medida fácil de ser entendida e encontrada e não é afetada por valores extremos do conjunto de dados. Não considera todos os valores da variável e pode estar distante do centro dos valores, costuma ser menos confiável que a média. o É a medida ideal quando é necessário saber o valor típico da variável, como por exemplo, quantos itens de um produto são mais comumente adquiridos pelos clientes de um supermercado. 12. MEDIDAS DE DISPERSÃO Nem sempre as medias centrais caracterizam bem uma variável. Por vezes um conjunto de dados possui alta dispersão, ou seja, se afastam muito entre si, o que pode inviabilizar conclusões tiradas a partir da observação apenas de suas médias. Faz-se, portanto, necessário calcular a variabilidade da amostra para identificar se um determinado conjunto de dados é estável. 22 a) VARIÂNCIA o Imaginemos dois conjuntos de dados representando o número de faltas de funcionários em dois departamentos da mesma empresa em um determinado mês: RH (2, 5, 3, 1, 4) e MKT (0, 10, 4, 1, 0) _ o Ambos possuem n = 5 e X = 3, mas o bom senso nos diz que eles não iguais, pois a distância entre os valores é muito grande. o No RH o máximo de faltas é 5, enquanto que no MKT é 10. Todos os funcionários de RH faltaram, e dois funcionários no MKT nunca faltaram. o Não há Mo em RH, e em MKT a Mo é 0. o A Md de X é 3 e em MKT é 1. A Md representa bem Y? o Para verificar o grau de variabilidade dos dados, foi desenvolvido o cálculo da variância, demonstrado na tabela abaixo:Xi _ Xi - X = xi Xi² Yi _ Yi - Y = yi Yi² 2 2-3 = -1 1 0 0-3 = -3 9 5 5-3 = 2 4 10 10-3 = 7 49 3 3-3 = 0 0 4 4-3 = 1 1 1 1-3= -2 4 1 1-3 = -2 4 4 4-3 = 1 1 0 0-3 = -3 9 ∑Xi = 15 ∑xi = 0 ∑xi² = 10 ∑Yi = 15 ∑yi = 0 ∑yi² = 72 Variância = s² (X) = ∑xi² / n s² (y) = ∑yi² / n 2 2 o No cálculo da variância n = tamanho da população, que no exemplo visto é igual a 5. Ou seja, o total de funcionários de cada departamento é 5. Caso o cálculo seja feito com uma amostra, utiliza-se n-1. Se houvesse 30 funcionários no departamento e utilizássemos uma amostra de 8 funcionários, a variância trabalharia com n-1, ou seja, 7. 23 DESVIO PADRÃO o É fácil perceber que não é nem um pouco prático trabalhar com medidas como faltas/vendas/reclamações/peças rejeitadas/R$ ao quadrado. o Por esse motivo utiliza-se o desvio padrão, que mantém a unidade de medida, porém de forma mais objetiva/prática. Sua fórmula é: No caso acima, temos que: S (X) = = 1,41 falta S(Y) = = 3,8 faltas COEFICIENTE DE VARIAÇÃO o Para medir quanto o desvio padrão varia em relação ao conjunto de dados é necessário calcular o coeficiente de variação (CV). Sua fórmula é: No caso das faltas temos: o Esse coeficiente nos mostra que os dados de Y variam muito mais em relação à média, sendo, portanto, um conjunto bastante instável e pouco sensível às medidas de tendência central. 13. CORRELAÇÃO LINEAR SIMPLES Duas variáveis podem estar associadas. Algumas vezes isso ocorre de maneira evidente, como a ingestão de bebida alcoólica (X- variável independente) e a normalidade da fala/equilíbrio (Y- variável dependente). Quanto maior o evento de X, menor será o de Y. Em outras situações, entretanto, é necessário calcular o coeficiente de correlação para verificar se uma variável é a causa de outra. Verificar essa dependência é o primeiro passo para realizar boas previsões, e para tal, torna-se necessário: 1) Cuidadosa coleta de dados X e Y (conjunto estável de dados) 2) Construção do diagrama de dispersão e análise visual da distribuição dos pontos no gráfico. 3) Cálculo do coeficiente de correlação linear simples de Pearson. 24 Para demonstração, exemplificamos com a situação de um município Z que começou a receber investimentos para construção de casas populares (X) e também viu crescer a venda de calçados nas suas lojas (Y). É preciso saber então se há alguma correlação entre essas variáveis. A primeira tarefa foi cumprida, a coleta de dados confiáveis e estáveis, como mostrado a seguir. O gráfico com os dados acima forma a seguinte configuração: Como é possível verificar visualmente, a distribuição dos pontos é bastante linear, sendo possível calcular o coeficiente de correlação linear simples de Pearson, através da seguinte fórmula: Ano Casas Venda de calçados 2005 12.000 12.000 2006 14.000 121.000 2007 13.000 11.000 2008 15.000 13.000 2009 18.000 14.000 2010 20.000 17.000 Calçados Casa s 25 Para facilitar a resolução dessa fórmula é preciso construir a tabela: Xi Yi XiYi Xi² Yi² 12 12 144 144 144 14 12 168 196 144 13 11 143 169 121 15 13 195 225 169 18 14 252 324 196 20 17 340 400 289 ∑ = 92 ∑ = 79 ∑ = 1.242 ∑ = 1.458 ∑ = 1.063 Temos então: rxy = 0,93 Interpretação do resultado O coeficiente de correlação linear simples varia de -1 a 1. Zero significa ausência de correlação, os pares de valores se distribuem em nuvem sem nenhuma tendência. Valor positivo significa crescimento das duas variáveis no mesmo sentido. Quanto maior o coeficiente, maior será a relação de dependência entre os pares de valores, como a relação entre investimento em formação acadêmica e rendimento salarial. 1 significa dependência positiva totalmente proporcional. Valor negativo significa que na medida em que uma variável cresce, a outra decresce. Quanto maior a negatividade, maior será a relação inversa de dependência entre os pares de valores, como a correlação entre a iluminação pública e número de ocorrências policiais em uma determinada área. -1 significa dependência negativa totalmente proporcional. 26 14. REGRESSÃO LINEAR SIMPLES Havendo correlação entre duas variáveis, é possível estimar um valor Y desconhecido a partir de um valor X conhecido, ou ainda, a quantidade de pares de sapatos vendidos se a quantidade de casas populares construídas subir para 25.000 unidades. Esse cálculo (Regressão Linear) permite que o pesquisador possa fazer projeções sobre o seu tema. Ele se baseia na equação da reta: Y = a + bX, que atravessa a distribuição dos dados correlacionados. Para determinar a, utiliza-se a seguinte fórmula: Aplicando a fórmula de a no exemplo dado, temos: Para determinar b, utiliza-se a seguinte fórmula: 0 2.000 4.000 6.000 8.000 10.000 12.000 14.000 16.000 18.000 10.000 12.000 14.000 16.000 18.000 20.000 22.000 Calçados 27 Aplicando a fórmula de a no exemplo dado, temos: Tendo já determinado a e b, é possível determinar o volume de vendas de calçados a partir do aumento na construção de casas populares. Se a secretaria de habitação prevê investimentos equivalentes a 25.000 casas populares, os lojistas de calçados podem esperar vendas no patamar de: Y = 3,23 + (0,65 x 25) Y = 19,48 = 19.480 calçados É possível também determinar quantas casas populares devem ser construídas para elevar a venda de calçados a 20.000 pares. 20 = 3,23 + 0,65X X = 20 – 3,23 / 0,65 X = 25.800 casas populares 28 Referências bibliográficas: LAPPONI, Joan Carlos. Estatística usando Excel. São Paulo: EDUSP, 1997 MATTAR, Fauze N. Pesquisa de marketing. São Paulo: Atlas, 2002. SHIRAISHI, Guilherme. Pesquisa de marketing. São Paulo: Pearson, 2012. TIBONI, Conceição Gentil. Estatística básica para o curso de turismo. São Paulo: Atlas, 2003. Referências eletrônicas: Banco Central - http://www.bcb.gov.br/ Fundação Getúlio Vargas - http://portalibre.fgv.br/ Fundação SEADE - http://www.seade.gov.br/ IBGE - http://www.ibge.gov.br/home/
Compartilhar