Prévia do material em texto
ESTATÍSTICA APLICADA À PESQUISA QUANTITATIVA JULIANA REKSUA Especialista em Análise de Dados SE APRESENTE ● Estatística e a sua relevância na pesquisa ● Inferência Estatística ● Estatística Descritiva ● Significância estatística no teste A/B AGENDA Estatística e a sua relevância na pesquisa Contexto hipotético Lançamento de um novo produto no App - Clube iFood (permite compras de cupons de descontos por preços mais baixos) Problema O time de MKT recebeu o desafio de criar uma campanha com o objetivo de alavancar a adesão deste novo produto. Pergunta a ser respondida: quem deve ser nosso público alvo na campanha? Objetivo Conhecer a persona que compraria o novo produto. Hipótese Público jovem, já cliente do App, ativo e com alta sensibilidade de preço. Metodologia Teste amostral. Inferência estatística A partir de um conjunto de dados amostral, infere-se a uma população Atenção para a seleção da amostra para representação da população ● Amostra aleatória simples: cada membro tem a mesma chance de ser incluído na amostra. ● Amostra aleatória estratificada: a população é dividida em grupos. A amostra geral consiste em alguns membros de cada grupo. ANÁLISE AMOSTRAL Amostragem Representa uma parte de determinada população, ao qual podemos fazer inferências como um todo. APLICAÇÃO DO MÉTODO AMOSTRAL Como definimos a amostra para a análise? Definir tipo de amostra Aleatória simples Definir volumetria de indivíduos para compor a amostra* 385 participantes Atenção! O tamanho amostral interfere na confiabilidade da pesquisa. * [α (nível de significância estatística) = 95% e margem de erro de 5%] - calculadora online https://pt.surveymonkey.com/mp/sample-size-calculator/ Ou seja, é uma forma de medir a probabilidade de que a amostra represente com precisão as atitudes da população em questão. O padrão usual é de 95% SIGNIFICÂNCIA ESTATÍSTICA nos ajuda a determinar o nível de risco que podemos aceitar, equilibrando a necessidade de precisão e os recursos disponíveis. Estatística descritiva “O que aconteceu? Quando aconteceu? Onde aconteceu? Quanto foi?” Medidas de tendência central Aprender algo em comum entre os dados observados Ex: ● Média (simples e ponderada) ● Mediana ● Moda ● Percentil/Quartil Medidas de Dispersão Quantificar o quanto os dados de um conjunto diferem entre si Ex: ● Amplitude ● Desvio-padrão MÉDIA simples ou ponderada Análise descritiva dos dados Idade Divulgação em mídias com maior usabilidade do público Variável Média dos que aderiram Média dos que não aderiram Hipótese de adesão Insight Tempo de casa Freq. mensal Ticket Médio 28 anos 231 dias 24 compras R$ 42,20 42 anos 198 dias 8 compras R$ 68,50 Público mais jovem Usuários há mais tempo Já com alta freq de pdds Gastam menos/pdd Já conhecem a ferramenta São clientes recorrentes (fidelização) Clientes mais sensíveis à preços MEDIANA Indicada para conjunto de dados que não seguem uma distribuição normal Considerando esse conjunto de dados hipotéticos de frequência mensal de pedidos: 1 1 1 2 3 3 4 6 9 + 11 16 22 28 30 38 41 42 83 Nesse cenário, a mediana é de 10 pedidos mensais (média inflada de ~19) Outlier 2 MÉDIA ● Indicada para um conjunto de dados que se distribui de forma normal, ou seja, sem conter dados discrepantes. Usabilidade: conjunto de dados homogêneos MEDIANA ● Geralmente utilizada para retornar à tendência central para distribuições de dados distorcidos/discrepantes. Usabilidade: conjuntos de dados com outliers MODA Revela valores que se repetem em um conjunto de dados Exemplo Considerando esse conjunto de dados hipotéticos da idade dos usuários do App: 18 18 19 20 21 22 27 27 28 28 28 28 29 31 32 32 34 36 37 40 41 44 “Majoritariamente, os usuários do meu App tem 28 anos” DESVIO PADRÃO Indica a dispersão dos dados dentro da base analisada em relação à média Idade A idade dos usuários que aderiram à compra é bastante uniforme Variável Média dos que aderiram Desvio-padrão em relação a média Hipótese Freq. mensal Ticket Médio 28 anos 24 compras R$ 42,20 5,5 anos 35 compras R$ 62,30 Pode ser indicativo de comportamento fraudador de algum cliente Não homogeneidade de preferência de preço entre os clientes AMPLITUDE E QUARTIS Amplitude Diferença entre a mínima e a máxima de uma série de dados ordenados (variação entre limites do conjunto). Quartis Segmentam o conjunto de dados em quatro partes iguais (25%). O boxplot (diagrama de caixa) permite a visualização dessas duas métricas Outliers Mediana “25% levaram até ~2min” levaram até ~4 minutos de navegação antes da conversão. 75% dos usuários que aderiram à compra do novo produto Significância Estatística no Teste A/B Como calculamos? Usabilidade de testes A/B O teste A/B é quando criamos duas versões de design diferentes de um mesmo produto e desejamos medir qual delas apresenta os melhores resultados Qual estilo de botão faz com que as pessoas comprem mais na loja online? Qual o tamanho do botão faz com que as pessoas cliquem mais em “saber mais” sobre aquele produto ofertado na página? Qual tipo de formulário consegue mais inscritos em sua newsletter? O teste A/B te ajuda a entender! ? ? ? Aplicação de Teste A/B Ao comparar duas propostas de design do novo produto percebidas por duas amostra de pessoas, com o objetivo de maximizar a chance de conversão de determinado produto, as diferenças observadas entre esses dois grupos são estatisticamente significativas? [α (nível de significância estatística) = 95%] - calculadora https://pt.surveymonkey.com/mp/ab-testing-significance-calculator/ Teste de hipótese Possibilita testar um valor populacional com base em uma amostra dessa população 1. Selecionamos uma amostra; 2. Fazemos algum tipo de inferência sobre ela “Não há diferenças observadas entre os dois grupos” 3. Via teste estatístico, averiguamos se a população tem aquele comportamento para determinado parâmetro. Estado atual das coisas (ponto de partida) Mudança/inovação Teste de hipótese Teste T de Student Interpretação: quando p < 0,05, há diferenças estatisticamente significativas na comparação entre as amostras, ou seja, rejeitamos a hipótese nula. O b je ti vo C o n d iç ã o Compara duas métricas [média, variância, proporção, conversão etc] ● Distribuição normal dos dados em ambos os grupos Para duas amostras: ● Independentes (baixa correlação) ● Dependentes (mesmos sujeitos em diferentes momentos do tempo, alta correlação) ● Para uma só amostra (compara a média de uma amostra com a média de uma pop. conhecida) Pergunta de negócio Hipótese formulada Descrição do teste Variável 1 Variável 2 Resultado do teste Hipótese validada Interpretação para o negócio Hipótese refutada Possível acionável ACOMPANHANDO TESTES Documente as hipóteses e os resultados do teste, sempre relacionando-o a pergunta de negócio correspondente. Problema a ser resolvido Insight Resumo TA KE A W AY ATENTE-SE PARA SUA SELEÇÃO AMOSTRAL. É ESSA QUE VAI TE PERMITIR INFERIR COMPORTAMENTOS POPULACIONAIS. RESUMO #1 AS MÉTRICAS DE ANÁLISE ESTATÍSTICA DEVEM SER INTERPRETADAS EM CONJUNTO. RESUMO #2 TA KE A W AY NÃO USE A TORTURA DE DADOS PARA FAZÊ-LOS TE CONTAR O QUE VOCÊ QUER “OUVIR”. RESUMO #3 TA KE A W AY