Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Análise Exploratória de dados Relatório da pesquisa de opinião sobre o resort MARI-AZ-IAGO O resort de luxo MARI-AZ-IAGO funciona há cerca de 18 anos na cidade de Butiá, capital do estado de Goiaba, no país latino-americano Pindorama. A direção encomendou uma pesquisa de opinião sobre o resort a Arthur Petersen Inc. Foram selecionados por sorteio aleatório 5000 ex-hóspedes com as seguintes características: não residentes em Butiá, com 18 anos ou mais de idade durante a estadia, que se hospedaram nos últimos três anos. A empresa forneceu a base de dados com as informações a seguir de cada um dos hóspedes pesquisados: - Reserva do hóspede (como foi feita): por telefone (com a recepção do hotel), pelo site do resort, por um aplicativo de reserva, por agência de viagens, ou corporativa (realizada por uma empresa que não seja agência de viagens); - Origem do hóspede: do estado de Goiaba, do estado vizinho de Carambola, de outro estado de Pindorama, de outro país da América Latina, de Europa-Ásia-África- Oceania, dos Estados Unidos; - Estadia (período que permaneceu hospedado): Até 3 dias, Entre 3 e 6 dias, Uma semana, De 8 a 14 dias, Mais de duas semanas; - Opinião geral sobre o resort: Muito insatisfeito, Insatisfeito, Indiferente, Satisfeito, Muito satisfeito; - Renda familiar do hóspede: em número de salários mínimos vigentes no Brasil (referência para Pindorama); - Idade do visitante: em anos completos. Os resultados da análise dos dados da pesquisa são apresentados no presente documento. 2 Primeira Parte – Pré-análise de dados 1) Quantos dados perdidos há em cada variável? O percentual de dados perdidos em relação ao total é aceitável? Justifique. Dados perdidos (missing data) são valores de uma variável que não estão disponíveis no conjunto de dados, ou seja, estão "em branco". No banco de dados em análise, a porcentagem de dados perdidos por variável é inferior a 5%, conforme apresentado na Tabela 1. Assim, considera-se que não é necessário rever o processo de coleta e/ou registro de dados, uma vez que aceita-se até cerca de 5% de dados perdidos em uma base de dados; mais do que isso o processo de pesquisa, e/ou de registro dos dados, pode ter sido prejudicado de tal forma que os resultados podem não ser confiáveis. Tabela 1 – Dados perdidos por variável Variável Dados perdidos1 Porcentagem (*) Reserva 25 0.50% Origem 19 0.38% Estadia 31 0.62% Opinião 25 0.50% Renda 28 0.56% Idade 18 0.36% (*) Total de dados por variável: 5000 2) Quantos e quais são os erros de registro nas variáveis? O que você acha que precisa ser feito para diminuir tais erros nas próximas pesquisas? Justifique. Os erros de registro são valores que foram armazenados incorretamente na base de dados. A Tabela 2 apresenta os erros encontrados em cada variável, bem como suas respectivas porcentagens em um conjunto de 5000 dados por variável. 1 Na análise exploratória do conjunto de dados deste relatório, adotou-se o processo de eliminação parcial dos dados perdidos (pairwise deletion), onde elimina-se os casos apenas nas operações que envolvem as variáveis que apresentam dados perdidos. 3 Nas variáveis qualitativas (Reserva, Origem, Estadia, Opinião) os erros de registro foram resultado da falta de uniformidade no armazenamento das informações. Por exemplo, na variável Reserva, que poderia assumir as categorias Agência de viagens, Aplicativo de reserva, Corporativa, Pelo site do resort ou Por telefone, algum digitador descuidado registrou "Corpo", "Corpor", "Corpora" ao invés de Corporativa, o que acabou criando novos valores para a variável Reserva. Tabela 2 – Erros de registro nas variáveis qualitativas Variável Categoria Erro de registro Total Reserva Agência de viagens "Agênc", "Agênci", "Agência" 37 Aplicativo de reserva "Aplic", "Aplica", "Aplicat", "Aplicati" 29 Corporativa "Corpo", "Corpor", "Corpora" 26 Pelo site do resort "Pelo s", "Pelo si", "Pelo sit", "Pelo" 17 Por telefone "Por t", "Por te", "Por tel", "Por tele" 23 Porcentagem (*) 2.64% Origem América Latina "Améric", "América" 5 Carambola "Caram", "Caramb", "Carambo", "Carambol" 5 Estados Unidos "Estad", "Estado", "Estados" 48 Europa, Ásia, África, Oceania "Europ", "Europa,","Europa, Á" 7 Goiaba "Goib" 12 Pindorama "Pindo", "Pindor", "Pindora", "Pindoram" 17 Porcentagem (*) 1.88% Estadia Até 3 dias "Até 3", "Até 3 d", "Até 3 di" 54 Entre 3 e 6 dias "Entre" 7 Uma semana "Uma s", "Uma se", "Uma sem", "Uma sema" 9 De 8 a 14 dias "De 8", "De 8 a", "De 8 a 1" 29 Mais de duas semanas "Mais", "Mais d", "Mais de" 14 Porcentagem (*) 2.26% Opinião Muito insatisfeito "Muito i", "Muito in" 34 Insatisfeito "Insatis", "Insatisf" 42 Indiferente "Indifer", "Indifere" 16 Satisfeito "Satisfe", "Satisfei" 20 Muito satisfeito "Muito s", "Muito sa" 16 Porcentagem (*) 2.56% (*) Total de dados por variável: 5000 Ao se trabalhar com o Excel, uma forma de diminuir este tipo de erro é criar um drop down list, que consiste em uma espécie de menu/lista suspensa, permitindo, nas células configuradas, ter as opções dos nomes ou valores relacionados. Assim, um drop down list, como o apresentado na Figura 1 para a variável Reserva, tem por 4 objetivo evitar erros em preenchimento de banco de dados ou facilitar a inserção de dados em uma planilha, possibilitando, assim, a uniformização no armazenamento das informações. Figura 1 – Modelo de um drop down list para a variável qualitativa Reserva. Realizou-se, ainda, uma uniformização para que não ocorressem nomes de categorias com espaços após a última palavra, uma vez que Tabelas Dinâmicas são sensíveis à presença desses espaços, o que pode acarretar em tabelas com variáveis redundantes. Nas variáveis quantitativas (Renda e Idade) não foram encontrados erros de registro, que no caso seriam, por exemplo, valores negativos para as variáveis. Segunda Parte – Análise Individual das variáveis 3) Analise a variável Reserva. Qual é o tipo predominante? Justifique Pela análise da Tabela 3, a qual apresenta as frequências e porcentagens relativas à variável Reserva, conclui-se que a maioria das reservas, 24,80%, é realizada por uma Corporativa. Tabela 3 – Tipos de Reserva dos hóspedes do resort Tipo de Reserva Frequência Porcentagem Agência de viagens 1076 21.63% Aplicativo de reserva 1082 21.75% Corporativa 1234 24.80% Pelo site do resort 688 13.83% Por telefone 895 17.99% Total Geral 4975 100.00% 5 4) Analise a variável Origem. A direção investiu bastante em propaganda na América Latina e nos Estados Unidos, considerados mercados preferenciais. O investimento foi compensador? Justifique. A Tabela 4 apresenta as frequências e porcentagens relativas à Origem dos hóspedes do resort MARI-AZ-IAGO. Tabela 4 – Origem dos hóspedes do resort Origem Frequência Porcentagem América Latina 288 5.78% Carambola 224 4.50% Estados Unidos 1699 34.11% Europa, Ásia, África, Oceania 267 5.36% Goiaba 1502 30.15% Pindorama 1001 20.10% Total Geral 4981 100.00% Recodificou-se as categorias da variável Origem para permitir uma simplificação dos dados, uma vez que Pindorama, e seus e respectivos estados Carambola e Goiaba, também pertencem à América Latina. Assim, categorizou-se a variável Origem em “Locais da América Latina” (que incluem o país Pindorama e seus estados Goiaba e Carambola, bem como outros países da América Latina), “Estados Unidos” e “Europa, Ásia, África, Oceania”.A Figura 2 apresenta a distribuição da origem dos hóspedes nessa nova categorização. 6 Figura 2 – Gráfico em setores para variável Origem. Conclui-se, assim, que o investimento da empresa em propaganda na América Latina e nos Estados Unidos foi compensador, uma vez que a maioria dos hóspedes vem desses locais, com uma porcentagem de 60,53% e 34,11%, respectivamente. Ou seja, 94,64% dos hóspedes são de origem de países do continente americano, compensando assim o investimento em propaganda nessa região, considerada, portanto, um mercado preferencial. 5) Analise a variável Estadia. Estudos anteriores mostraram que pelo menos um terço dos hóspedes permanecia uma semana ou mais no resort. Os dados atuais confirmam os estudos anteriores? Justifique. A Tabela 5 apresenta as frequências e porcentagens relativas ao período de Estadia dos hóspedes do resort MARI-AZ-IAGO. Tabela 5 – Período da Estadia no resort Estadia Frequência Porcentagem Até 3 dias 2717 54.68% Entre 3 e 6 dias 285 5.74% Uma semana 572 11.51% De 8 a 14 dias 1138 22.90% Mais de duas semanas 257 5.17% Total Geral 4969 100.00% 60.53% 34.11% 5.36% Origem dos hóspedes Locais da América Latina Estados Unidos Europa,Ásia,África,Oceania 7 Com o objetivo de fazer uma análise do ponto de vista a se considerar estadias de até 6 dias e estadias de uma semana ou mais, recodificou-se essa variável, como apresentado na Figura 3. Figura 3 – Gráfico em setores para variável Estadia. Conclui-se que a maioria dos hóspedes, 60,41%, permanece até 6 dias no resort e 39,58% permanecem uma semana ou mais, o que confirma o estudo anterior, o qual mostrava que pelo menos um terço dos hóspedes permanecia sete ou mais dias no local. 6) Analise a variável Opinião. Os hóspedes do MARI-AZ-IAGO estão satisfeitos com o resort? Justifique. A Tabela 6 apresenta a análise da variável Opinião. Tabela 6 – Opinião dos hóspedes do resort Opinião Frequência Porcentagem Muito insatisfeito 1110 22.31% Insatisfeito 1667 33.51% Indiferente 885 17.79% Satisfeito 772 15.52% Muito satisfeito 541 10.87% Total Geral 4975 100.00% 60.41% 39.59% Período de estadia no resort Até 6 dias Uma semana ou mais 8 A Figura 4 apresenta o resultado para uma recodificação da variável Opinião em hóspedes que apresentam Insatisfação (Muito insatisfeito ou Insatisfeito), Indiferença ou Satisfação (Satisfeito ou Muito Satisfeito). Figura 4 – Gráfico em setores para variável Opinião. Conclui-se, portanto, que a maioria dos hóspedes não está satisfeita com o resort, uma vez que 55,82%, ou seja, a maioria absoluta, apresenta insatisfação em relação ao mesmo. 7) Faça uma descrição da variável Renda. Em estudos anteriores pelo menos três quartos dos hóspedes tinham renda familiar inferior a 6 salários mínimos. Os dados atuais confirmam isso? Justifique. A Tabela 7 apresenta as medidas de síntese para a variável Renda e faz-se, em seguida, uma descrição da referida variável. 55.82% 17.79% 26.39% Opinião dos hóspedes Insatisfação Indiferença Satisfação 9 Tabela 7 – Medidas de síntese para a variável Renda Medidas Renda Média (salários) 4.74 Mediana (salários) 4.06 Qi (salários) 3.10 Qs (salários) 5.54 D.padrão (salários) 2.94 CV% 61.92% Qs-Md (salários) 1.48 Md-Qi (salários) 0.96 Qs-Qi (salários) 2.44 Qs+1.5.(Qs-Qi) (salários) 9.2 Núm. Discrep. Superiores 221 Qi-1.5.(Qs-Qi) (salários) -0.56 Núm. Discrep. Inferiores 0 Mínimo (salários) 2.02 Máximo (salários) 74.2 Assimetria 8.07 Curtose 137.05 Tendência central O valor típico da renda varia entre 4,06 (mediana) e 4,74 salários mínimos (média). Dispersão A variação da renda é de 2.02 (valor mínimo) a 74,2 salários (valor máximo), com um desvio padrão de 2,94 salários, que representa 61,92% (CV%) da média. Assimetria A assimetria vale 8,07, média e mediana apresentam diferenças e a diferença entre quartil superior e mediana (1,48 salários) é diferente da existente entre mediana e quartil inferior (0,96 salários). Tudo isso aponta para uma distribuição assimétrica à direita ou positiva. Curtose A distribuição deve ser leptocúrtica, uma vez que a curtose (137,05) é maior do que zero. 10 Existência de discrepantes Valores menores que -0,56 salários seriam discrepantes inferiores, o que é impossível, uma vez que o valor mínimo é 2,02 salários. Assim, não há discrepantes inferiores. Valores maiores que 9,20 salários seriam discrepantes superiores. Assim, existem 221 rendas consideradas valores discrepantes superiores, sendo o valor máximo (74,2 salários) um deles. Sendo a Renda uma variável quantitativa contínua, elaborou-se a Tabela 8, agrupada em classes de renda2. Tabela 8 – Renda dos hóspedes do resort Classes de renda (salários mínimos) Frequência Porcentagem Porcentagem acumulada 2.02|-6.04 3952 79.49% 79.49% 6.04|-10.06 872 17.54% 97.02% 10.06|-14.08 102 2.05% 99.07% 14.08|- 18.10 25 0.50% 99.58% 18.10|- 22.12 5 0.10% 99.68% 22.12|-26.14 2 0.04% 99.72% 26.14|-30.16 7 0.14% 99.86% 30.16|-34.18 2 0.04% 99.90% 34.18|-38.20 1 0.02% 99.92% 38.20|-42.22 0 0.00% 99.92% 42.22|-46.24 1 0.02% 99.94% 46.24|-50.26 0 0.00% 99.94% 50.26|-54.28 0 0.00% 99.94% 54.28|-58.30 1 0.02% 99.96% 58.30|-62.32 0 0.00% 99.96% 62.32|-66.34 1 0.02% 99.98% 66.34|-70.36 0 0.00% 99.98% 70.36|-74.38 1 0.02% 100.00% Total 4972 100.00% --- 2 O número de classes k é definido tal que, k=5.log(n), onde n é o número de dados (5000 dados). Obtendo-se, portanto, 18 classes. A amplitude de uma classe é dada por: [(Valor máx. da variável) - (Valor mín. da variável)]/k, devendo o valor ser arredondado para cima. Assim, para a variável Renda, tem-se que: Amplitude = (74,20 – 2,02)/18 = 4,02 (valor arredondado para cima). 11 A Figura 5 apresenta um histograma para a variável Renda, no qual percebe-se que as três primeiras classes (até 14,08 salários mínimos) concentram a maioria dos hóspedes (correspondem a 99,07%). Figura 5 - Histograma para variável quantitativa contínua Renda (em salários mínimos) dos hóspedes do resort. Conclui-se, ainda, pela Tabela 8, que 79,49% dos hóspedes têm renda inferior a 6,04 salários mínimos3, o que condiz com os estudos anteriores, os quais afirmavam que pelo menos 75% dos hóspedes tinham renda inferior a 6 salários mínimos. 8) Faça uma descrição da variável Idade. A direção do MARI-AZ-IAGO pretende atrair hóspedes mais “sossegados”, em que a maioria absoluta deles teria 35 anos ou mais. Os dados confirmam a impressão? Justifique. A Tabela 9 apresenta as medidas de síntese para a variável Idade e faz-se, em seguida, uma descrição da referida variável. 3 Mais precisamente, 3942 hóspedes têm renda inferior a exatamente 6 salários mínimos, o que corresponde a 79,28%. 0 400 800 1200 1600 2000 2400 2800 3200 3600 4000 F re q u ê n c ia Renda (salários mínimos) 12 Tabela 9 – Medidas de síntese para a variável Idade Medidas Idade Média (anos) 42.14 Mediana (anos) 42 Moda (anos) 40 Qi (anos) 36 Qs (anos) 48 D.padrão (anos) 9,12 CV% 21.64% Qs-Md (anos) 6 Md-Qi (anos) 6 Qs-Qi (anos) 12 Qs+1.5.(Qs-Qi) (anos) 66 Núm. Discrep. Superiores 34 Qi-1.5.(Qs-Qi) (anos) 18 Núm. Discrep. Inferiores 0 Mínimo (anos) 18Máximo (anos) 75 Assimetria 0.08 Curtose -0.024 Tendência central O valor típico da idade dos hóspedes varia entre 42 (mediana) e 42,14 anos (média). A idade mais frequente do conjunto de dados é 40 anos (moda). Dispersão A variação da idade é de 18 (valor mínimo) a 75 anos (valor máximo), com um desvio padrão de 9,12 anos, que representa 21,64 (CV%) da média (o que parece uma baixa dispersão). Assimetria A assimetria vale 0,08 (valor muito próximo de zero; se igual a zero significa simetria), média e mediana apresentam diferenças mínimas (0,14 anos de diferença) e a diferença entre quartil superior e mediana (6 anos) é igual a existente entre mediana e quartil inferior (6 anos). Tudo isso aponta para uma distribuição bem próxima da simétrica. 13 Curtose Como a curtose é bem próxima de zero (-0,024), a distribuição tende a ter um achatamento como o da curva normal. Existência de discrepantes Valores menores que 18 anos seriam discrepantes inferiores, o que é impossível, uma vez que o valor mínimo é 18 anos. Assim, não há discrepantes inferiores. Valores maiores que 66 anos seriam discrepantes superiores. Assim, existem 34 idades consideradas valores discrepantes superiores, sendo o valor máximo (75 anos) um deles. A Figura 6 apresenta um histograma para a variável Idade, no qual percebe-se que existe uma concentração de idades em torno de determinados valores centrais (no caso, em torno de 42 anos), e à medida que os valores se afastam do centro, as frequências vão diminuindo, de forma equilibrada, tanto para valores acima quanto abaixo de 42 anos. Isso confirma e se associa ao citado anteriormente, relacionando o caso a uma distribuição aproximadamente simétrica. O formato do histograma lembra a “curva de sino” da distribuição normal. Portanto, pode-se concluir que a variável idade dos hóspedes tem distribuição normal. 14 Figura 6 - Histograma para variável quantitativa discreta Idade (em anos) dos hóspedes do resort. A direção do MARI-AZ-IAGO pretende atrair hóspedes mais “sossegados”, em que a maioria absoluta deles teria 35 anos ou mais. Contudo, pela análise da mediana, conforme Tabela 9, sabe-se que, na verdade, a maioria absoluta dos hóspedes tem 42 anos ou mais. Terceira Parte - Análise em conjunto de duas variáveis 9) A direção do resort suspeita que estadias curtas são marcadas por empresas ou por aplicativos de celular, enquanto as maiores seriam pelas agências de viagens ou diretamente com o resort. A suspeita é confirmada pelos dados? A Tabela 10 apresenta a tabulação cruzada entre as variáveis Estadia e Reserva. Considera-se, para propósito desta análise, que estadias curtas são aquelas com duração de até 6 dias e estadias maiores compreendem um período de uma semana ou mais. 0 50 100 150 200 250 18 21 24 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75 F re q u ê n c ia Idade (anos) 15 Tabela 10 – Tabulação cruzada de tempo de Estadia e tipo de Reserva dos hóspedes do resort Estadia Reserva Agência de viagens Aplicativo de reserva Corporativa Pelo site do resort Por telefone Total Geral Até 6 dias Frequência 1047 134 854 609 341 2985 % por linha 35.08% 4.49% 28.61% 20.40% 11.42% 100.00% Uma semana ou mais Frequência 20 939 376 75 549 1959 % por linha 1.02% 47.93% 19.19% 3.83% 28.02% 100.00% Total Frequência 1067 1073 1230 684 890 4944 % por linha 21.58% 21.70% 24.88% 13.83% 18.00% 100.00% Na Figura 7 é possível observar o gráfico de colunas 100% empilhadas com os percentuais por linha, onde percebe-se que há, de fato, uma relação entre o tempo de Estadia e o tipo de Reserva. Figura 7 – Gráfico composto de colunas 100% empilhadas (relação Estadia e Reserva) Pela análise da Figura 7, conclui-se que a suspeita da direção do resort não se confirma, uma vez que estadias curtas (até 6 dias) são marcadas principalmente por agência de viagens (35,08%) ou por corporativas (28,61%), enquanto estadias maiores (uma semana ou mais) são agendadas, em sua maioria, por aplicativo de celular (47,93%) ou por telefone (28,02%). 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Até 6 dias Uma semana ou mais Distribuição dos hóspedes por tempo de estadia e tipo de reserva Por telefone Pelo site do resort Corporativa Aplicativo de reserva Agência de viagens 16 10) Em pesquisa anterior, e o bom senso também indica, hóspedes que vieram de mais longe permanecem por mais tempo no resort. Os dados atuais indicam que este padrão se mantém? Na Figura 8 é possível observar o gráfico de colunas 100% empilhadas que relaciona as variáveis Origem e Estadia dos hóspedes do resort. De fato há uma relação entre essas variáveis, uma vez que os percentuais da variável Estadia se modificam dependendo da Origem do hóspede. Figura 8 – Gráfico composto de colunas 100% empilhadas (relação Origem e Estadia) É possível afirmar que 76,98% dos hóspedes que vieram da Europa, Ásia, África, Oceania e 75,09% dos que vieram de outros países da América Latina permanecem mais tempo no resort (uma semana ou mais), enquanto a maioria dos hóspedes que vieram de Pindorama (60,14%) ou dos Estados Unidos (72,77%) permanecem apenas até 6 dias no local. 24.91% 60.14% 72.77% 23.02% 75.09% 39.86% 27.23% 76.98% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Relação entre origem dos hóspedes e tempo de estadia no resort Uma semana ou mais Até 6 dias 17 Assim, confirmando os padrões da pesquisa feita anteriormente, pode se afirmar que os hóspedes que vieram de mais longe (Europa, Ásia, África, Oceania e de outros países da América Latina) permanecem mais tempo no resort do que os hóspedes que vieram de mais próximo (ou seja, do próprio país Pindorama e dos Estados Unidos4). 11) Na pesquisa do item 10 os hóspedes que vieram de mais longe foram muito críticos sobre o resort. Várias mudanças foram efetuadas para sanar os problemas encontrados. Os dados atuais mostram que as modificações tiveram efeito? É apresentado na Figura 9 o gráfico de colunas 100% empilhadas que relaciona as variáveis Origem e Opinião dos hóspedes do resort. De fato há uma relação entre essas variáveis, uma vez que os percentuais da variável Opinião se modificam dependendo da Origem do hóspede. 4 Como não se tinha a localização geográfica do país Pindorama, afirma-se que os Estados Unidos são vizinhos bem próximos desse país (afirma-se ainda que Pindorama está localizado na América Central Insular, entre Cuba e a República Dominicana, sendo banhado pelo Mar do Caribe). 18 Figura 9 – Gráfico composto de colunas 100% empilhadas (relação Origem e Opinião) É possível afirmar que a maioria dos hóspedes que vieram de Pindorama (55,73%) ou dos Estados Unidos (68,44%) afirmou estar insatisfeita em relação ao resort, enquanto 59,55% dos hóspedes que vieram da Europa, Ásia, África, Oceania ou 59,93% dos que vieram de outros países da América Latina dizem-se satisfeitos com o resort. Sabe-se que algumas medidas foram tomadas para sanar alguns problemas, uma vez que a pesquisa anterior afirmava que os hóspedes que vieram de mais longe foram mais críticos sobre o resort. Nesta pesquisa, pode-se afirmar que isto não ocorreu, uma vez que os hóspedes que vieram de mais longe (Europa, Ásia, África, Oceania e de outros países da América Latina) estão mais satisfeitos, ouseja, foram menos críticos. Agora, os que vieram de mais próximo (ou seja, do próprio país Pindorama e dos Estados Unidos) estão mais insatisfeitos, ou seja, foram mais críticos. 19.16% 55.73% 68.44% 16.10% 20.91% 16.84% 17.82% 24.34% 59.93% 27.42% 13.74% 59.55% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Relação entre origem e opinião dos hóspedes do resort Satisfeito Indiferente Insatisfeito 19 Assim, conclui-se que as modificações efetuadas no resort tiveram efeito, porém apenas para um lado da questão, ou seja, para os hóspedes que vieram de mais longe, pois em contrapartida os hóspedes que vieram de mais perto estão mais insatisfeitos. 12) O MARI-AZ-IAGO tem uma série de atrações que somente podem ser adequadamente apreciadas com uma certa disponibilidade de tempo. Na pesquisa do item 10, hóspedes que permaneceram mais tempo no resort declararam-se mais satisfeitos. Os dados atuais confirmam o resultado da pesquisa anterior? A Tabela 11 apresenta a tabulação cruzada entre as variáveis Estadia e Opinião e a Figura 10 o gráfico de colunas 100% empilhadas com os percentuais por linha. Tabela 11 – Tabulação cruzada entre tempo de Estadia e Opinião dos hóspedes do resort Estadia Opinião Insatisfeito Indiferente Satisfeito Total Geral Até 6 dias Frequência 2437 400 150 2987 % por linha 81.59% 13.39% 5.02% 100.00% Uma semana ou mais Frequência 324 481 1152 1957 % por linha 16.56% 24.58% 58.87% 100.00% Total Frequência 2761 881 1302 4944 % por linha 55.85% 17.82% 26.33% 100.00% Figura 10 – Gráfico composto de colunas 100% empilhadas (relação Estadia e Opinião). 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Até 6 dias Uma semana ou mais Relação entre satisfação e tempo de estadia no resort Satisfeito Indiferente Insatisfeito 20 Analisa-se que hóspedes que tiveram uma estadia curta, ou seja, permaneceram até 6 dias no resort, estão, em maioria absoluta (81,59%), insatisfeitos. Em contrapartida, e confirmando o resultado da pesquisa anterior, hóspedes que permaneceram mais tempo no resort, no caso uma semana ou mais, declararam-se, em maioria absoluta (58,87%), satisfeitos. 13) A direção do MARI-AZ-IAGO supõe que hóspedes de maior nível socioeconômico são mais críticos sobre o resort. Os dados permitem confirmar esta suposição? Para verificar a existência da relação entre as variáveis Opinião e Renda apresenta- se um breakdown em função da variável Opinião, conforme Tabela 12. Neste caso, optou-se por não recodificar a variável Opinião, para se ter uma melhor distribuição dos dados, de modo que o coeficiente de variação (CV) não seja demasiadamente alto em uma dada categoria, uma vez que a variável Renda, sendo quantitativa contínua, apresenta vários valores possíveis (variando de 2,02 a 74,20 salários mínimos, conforme Tabela 12). 21 Tabela 12 – Breakdown da variável Renda (em salários mínimos) em função da Opinião Opinião Insatisfação Muito insatisfeito Frequência de Renda 1110 Média de Renda 7.33 Desvio padrão de Renda 4.35 CV% 59.38% Mínimo de Renda 2.72 Máximo de Renda 74.2 Insatisfeito Frequência de Renda 1667 Média de Renda 4.78 Desvio padrão de Renda 1.73 CV% 36.14% Mínimo de Renda 2.24 Máximo de Renda 29.3 Indiferença Frequência de Renda 885 Média de Renda 3.80 Desvio padrão de Renda 1.36 CV% 35.90% Mínimo de Renda 2.16 Máximo de Renda 18.32 Satisfação Satisfeito Frequência de Renda 772 Média de Renda 3.37 Desvio padrão de Renda 1.81 Cv% 53.62% Mínimo de Renda 2.06 Máximo de Renda 27.1 Muito satisfeito Frequência de Renda 541 Média de Renda 2.79 Desvio padrão de Renda 1.36 CV% 48.82% Mínimo de Renda 2.02 Máximo de Renda 27.4 Totais Frequência de Renda 4975 Média de Renda 4.74 Desvio padrão de Renda 2.94 CV% 62.00% Mínimo de Renda 2.02 Máximo de Renda 74.2 22 A média geral de renda é de 4,74 salários mínimos. Se não houvesse relação entre as variáveis Opinião e Renda, as médias de cada categoria de opinião seriam próximas dessa média geral. Porém não é o que ocorre, uma vez que a média de renda de cada tipo de opinião é diferente da média geral de renda. Assim, do ponto de vista exploratório, há evidências de uma relação entre as variáveis em estudo. Os hóspedes que declararam insatisfação ao resort apresentam a maior média de renda. De fato, os que se declararam “Muito insatisfeitos” apresentam renda média de 7,33 salários mínimos (embora apresentem valores para renda bem dispersos CV = 59,38%) e os que se declararam “Insatisfeitos” apresentam renda média de 4,78 salários mínimos (contudo a dispersão em torno da média é menor, pois CV = 36,14%). A menor renda média (2,79 salários mínimos) é a dos hóspedes que se declararam “Muito Satisfeitos”, seguida da renda média dos que se declararam “Satisfeitos” (3,37 salários mínimos). Diante do exposto, conclui-se que os hóspedes de maior nível econômico são mais críticos sobre o resort, uma vez que declaram insatisfação em relação ao mesmo. 14) Devido às atrações existentes no MARI-AZ-IAGO a direção presume que os hóspedes mais velhos são mais satisfeitos do que mais jovens. Os dados permitem confirmar esta suposição? Para verificar a existência da relação entre as variáveis Opinião e Idade apresenta- se um breakdown em função da variável Opinião, conforme Tabela 13. Neste caso adotou-se a recodificação para a variável Opinião como utilizada na questão 6. 23 Tabela 13 – Breakdown da variável Idade (em anos) em função da Opinião Opinião Insatisfeito Contagem de Idade 2777 Média de Idade 45.91 DesvPad de Idade 8.08 CV% 17.59% Máximo de Idade 75 Mínimo de Idade 20 Indiferente Contagem de Idade 885 Média de Idade 40.18 DesvPad de Idade 7.45 CV% 18.55% Máximo de Idade 68 Mínimo de Idade 20 Satisfeito Contagem de Idade 1313 Média de Idade 35.52 DesvPad de Idade 7.95 CV% 22.38% Máximo de Idade 68 Mínimo de Idade 18 Totais Contagem de Idade 4975 Média de Idade 42.15 DesvPad de Idade 9.12 CV% 21.64% Máximo de Idade 75 Mínimo de Idade 18 Como as médias de idades por categoria de Opinião apresentam certo distanciamento da média geral (42,15 anos), pode-se afirmar, do ponto de vista exploratório, que há evidências da relação entre Opinião e Idade. Os que se declararam insatisfeitos apresentam uma idade média de 45,91 anos (com uma menor variabilidade em torno da média, CV = 17,59%), enquanto os que se declararam satisfeitos apresentam uma idade média de 35,52 anos (contudo apresenta uma maior dispersão em torno da média, CV = 22,38%). Assim, conclui- se que os hóspedes mais velhos (com idade maior) são mais insatisfeitos do que os 24 mais jovens (com idade menor), o que contradiz as expectativas da direção do resort. Quarta Parte - Análise em conjunto de mais de duas variáveis 15) As conclusões da questão 12 valem para hóspedes de todas as origens? Na questão 12 concluiu-se que hóspedes que tiveram uma estadia curta, ou seja, permaneceram até 6 dias no resort, estão, em maioria absoluta (81,59%), insatisfeitos. Em contrapartida, hóspedes que permaneceram mais tempo no resort, no caso uma semana ou mais, declararam-se, em maioria absoluta (58,87%), satisfeitos. A Figura 11 apresentaum conjunto de gráficos compostos por colunas 100 % empilhados resultados do cruzamento entre os dados das variáveis Origem, Estadia e Opinião. Percebe-se que o maior índice de insatisfação (83,77%), está entre os hóspedes que permaneceram até 6 dias no resort e vieram dos Estados Unidos, e o maior índice de satisfação (74,65%) está entre os que se hospedaram por uma semana ou mais e vieram de outros países da América Latina. 25 Relação Origem, Estadia e Opinião dos hóspedes do resort 5 Figura 11 - Gráfico composto de colunas 100% empilhadas (relação Origem, Estadia e Opinião). 5 Neste caso Pindorama inclui os estados de Goiaba e Carambola, bem como os outros estados do país. 53.52% 7.98% 32.39% 17.37% 14.08% 74.65% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Até 6 dias Uma semana ou mais Outros países da América Latina Satisfeito Indiferente Insatisfeito 83.77% 27.35% 12.48% 32.17% 3.75% 40.48% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Até 6 dias Uma semana ou mais Estados Unidos Satisfeito Indiferente Insatisfeito 45.90% 7.35% 40.98% 19.12% 13.11% 73.53% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Até 6 dias Uma semana ou mais Europa, Ásia, África, Oceania Satisfeito Indiferente Insatisfeito 82.46% 15.36% 12.29% 23.84% 5.25% 60.80% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Até 6 dias Uma semana ou mais Pindorama Satisfeito Indiferente Insatisfeito 26 Conclui-se que, independente do país de origem, hóspedes que permaneceram até 6 dias no resort estão, em maioria (nem sempre absoluta), insatisfeitos, enquanto hóspedes que permaneceram uma semana ou mais estão mais satisfeitos (nem sempre em maioria absoluta). Ou seja, as conclusões da questão 12 são válidas para hóspedes de todas as origens. 16) As conclusões da questão 13 valem para hóspedes de todas as origens? Na questão 13 concluiu-se que os hóspedes de maior nível econômico são mais insatisfeitos com o resort. Assim, para analisar se esta conclusão é válida para hóspedes de todas as origens, apresenta-se na Tabela 14 um breakdown da variável Renda (em salários mínimos) em função da Origem e da Opinião dos hóspedes do resort. Inicialmente, percebe-se, que de fato, em todas as origens dos hóspedes, há uma relação entre Renda e Opinião, uma vez que a média de renda de cada tipo de opinião é diferente da média geral de renda. Assim, do ponto de vista exploratório, há evidências de uma relação entre as variáveis em estudo. Pela análise da Tabela 14, conclui-se que, independente da origem, os hóspedes que responderam “Muito insatisfeito” apresentaram as maiores rendas médias e os hóspedes que responderam “Insatisfeito” apresentaram as segundas maiores rendas médias. A menor renda média é apresentada, independente da origem dos hóspedes, no conjunto que respondeu “Muito satisfeito”. Assim, afirma-se que as conclusões da questão 13 são válidas para hóspedes de todas as origens. 27 28 Quinta Parte – Recomendações para o cliente 17) Caso houvesse dados com os perfis abaixo, como seria a opinião dos hóspedes de acordo com os dados. Justifique. Para estas recomendações será utilizada a função “Filtro de Relatório” da Tabela Dinâmica do Excel. As opiniões das Tabelas 15, 16 e 17 não foram recodificadas, sendo, portanto, as categorias possíveis: “Muito Insatisfeito”, “Insatisfeito”, “Indiferente”, “Satisfeito” ou “Muito Satisfeito”. a) Origem: América Latina; Estadia: Uma semana; Renda: maior do que 5 salários mínimos. A Tabela 15 apresenta a opinião do perfil de hóspedes descrito: Origem: América Latina; Estadia: Uma semana; Renda: maior do que 5 salários mínimos. Tabela 15 – Análise do perfil de hóspedes Origem América Latina Estadia Uma semana Renda Maior que 5 salários mínimos Opinião Categorias Indiferente Satisfeito Total Geral Frequência 1 1 2 % por linha 50.00% 50.00% 100.00% Dos 2 hóspedes que vieram da América Latina, se hospedaram por uma semana e possuem renda maior que 5 salários mínimos, um se diz indiferente e o outro satisfeito. b) Reserva: corporativa; Estadia: Até 3 dias; Renda: maior do que 5 salários mínimos. A Tabela 15 apresenta a opinião do perfil de hóspedes descrito: Reserva: corporativa; Estadia: Até 3 dias; Renda: maior do que 5 salários mínimos. 29 Tabela 16 - Análise do perfil de hóspedes Reserva Corporativa Estadia Até 3 dias Renda Maior que 5 salários mínimos Opinião Categorias Muito insatisfeito Insatisfeito Indiferente Satisfeito Total Geral Frequência 111 157 25 3 296 % por linha 37.50% 53.04% 8.45% 1.01% 100.00% Pela análise da Tabela 16, 296 hóspedes realizaram a reserva por meio de uma corporativa, se hospedaram por até 3 dias e têm renda superior a 5 salários mínimos. Destes, 90,54%, ou seja, a maioria absoluta, apresenta insatisfação (soma de “Muito Insatisfeito” com “Insatisfeito”) com o resort e apenas 1,01% se diz satisfeito, embora nenhum deles afirmou estar “Muito Satisfeito”. c) Origem: Estados Unidos; Renda: maior do que 6 salários mínimos; Estadia: De 8 a 14 dias. A Tabela 17 apresenta a opinião do perfil de hóspedes descrito: Origem: Estados Unidos; Renda: maior do que 6 salários mínimos; Estadia: De 8 a 14 dias. Tabela 17 – Análise do perfil de hóspedes Origem Estados Unidos Renda Maior que 6 salários mínimos Estadia De 8 a 14 dias Opinião Categorias Insatisfeito Indiferente Total Geral Frequência 3 2 5 % por linha 60.00% 40.00% 100.00% Tem-se que 5 hóspedes vieram dos Estados Unidos, têm renda maior que 6 salários mínimos e permaneceram no resort de 8 a 14 dias. Destes, 3, ou seja, 60%, afirmaram estar insatisfeitos com o resort, e os outros 2, que representam 40%, demonstraram indiferença. 30 18) Que outras variáveis vocês creem necessárias para caracterizar adequadamente as opiniões dos hóspedes do resort (sugira pelo menos duas)? Justifique. Outras variáveis possíveis para caracterizar adequadamente as opiniões dos hóspedes do resort seriam: o mês da estadia e a forma como tomou conhecimento do resort. Mês da estadia (variável “Mês”): Pode ser possível relacionar a “Opinião” com o “Mês” (suspeita-se, por exemplo, que hóspedes em época do verão estão mais satisfeitos), ou, também, “Origem” com o “Mês” (pode haver indícios que, por exemplo, hóspedes da Europa, Ásia, África, Oceania deem preferência para meses de verão em Pindorama). Forma como tomou conhecimento do resort (variável “Conhecimento”): indicação de conhecidos que já se hospedaram no resort, anúncio em redes sociais, outdoors, jornais ou revistas, indicação da agência de viagens ou corporativa. Pode ser possível relacionar “Conhecimento” com “Idade” (há suspeitas, por exemplo, que hóspedes mais velhos tomem conhecimento do resort por meio de anúncios em jornais e revistas, enquanto os mais jovens, por meio de anúncios em redes sociais), ou, também, “Conhecimento” com “Origem” (por exemplo, hóspedes que vieram de mais longe tomem conhecimento por meio de anúncios em redes sociais, enquanto os hóspedes de Pindorama, por meiode outdoors espalhados pela estrada do país). 19) Há alguma outra análise que você gostaria de fazer com as variáveis existentes (sugira pelo menos duas) para caracterizar melhor as opiniões dos hóspedes do resort? Justifique. Suspeita-se que hóspedes de maior nível econômico permanecem mais tempo no resort. Assim, propõem-se fazer uma análise entre uma possível relação das variáveis Renda e Estadia. A direção do resort deseja tomar conhecimento sobre a utilização do aplicativo de celular para a realização de reservas. Assim, suspeita-se que este aplicativo seja utilizado por hóspedes que vieram de mais longe. Por esse motivo, deseja-se analisar a relação entre as variáveis Origem e Reserva. 31 20) Realize as análises sugeridas e apresente as conclusões, justificando-as. Relação entre as variáveis Estadia e Renda Para verificar a existência da relação entre as variáveis Estadia e Renda apresenta- se um breakdown em função da variável Estadia, conforme Tabela 18. A média geral de renda é de 4,74 salários mínimos. Se não houvesse relação entre as variáveis Estadia e Renda, as médias de cada categoria de Estadia seriam próximas dessa média geral. Porém não é o que ocorre, uma vez que a média de renda de cada tempo de Estadia é diferente da média geral de renda. Assim, do ponto de vista exploratório, há evidências de uma relação entre as variáveis em estudo. Os hóspedes que permaneceram até 6 dias no resort, considerada um estadia curta, apresentam a maior média de renda. De fato, os que permaneceram até 3 dias apresentam renda média de 5,83 salários mínimo (a maior média entre as categorias do tempo de Estadia) e os que permaneceram entre 3 e 6 dias apresentam renda média de 4,03 salários mínimos. A menor renda média (2,49 salários mínimos) é a dos hóspedes que permaneceram mais de duas semanas no resort, seguida da renda média dos que permaneceram de 8 a 14 dias (3,32 salários mínimos). Assim, contrariando as suspeitas, conclui-se que à medida que se aumenta o tempo de estadia, há uma diminuição da renda média dos hóspedes. 6 6 Pode ser que o resort tenha feito algum pacote promocional para hospedagens superiores à uma semana, por exemplo. 32 Tabela 18 – Breakdown da variável Renda (em salários mínimos) em função da Estadia Estadia Até 6 dias Até 3 dias Frequência 2717 Média de Renda 5.83 DesvPad de Renda 3.32 Mínimo de Renda 2.30 Máximo de Renda 74.2 Entre 3 e 6 dias Frequência 285 Média de Renda 4.03 DesvPad de Renda 1.44 Mínimo de Renda 2.15 Máximo de Renda 16.8 Uma semana ou mais Uma semana Frequência 572 Média de Renda 3.78 DesvPad de Renda 1.49 Mínimo de Renda 2.20 Máximo de Renda 19.68 De 8 a 14 dias Frequência 1138 Média de Renda 3.32 DesvPad de Renda 1.78 Mínimo de Renda 2.06 Máximo de Renda 27.4 Mais de duas semanas Frequência 257 Média de Renda 2.49 DesvPad de Renda 0.52 Mínimo de Renda 2.02 Máximo de Renda 8.24 Total Frequência 4969 Total Média de Renda 4.74 Total DesvPad de Renda 2.94 Total Mínimo de Renda 2.02 Total Máximo de Renda 74.2 Relação entre as variáveis Origem e Reserva Na Figura 12 é possível observar o gráfico de colunas 100% empilhadas que relaciona as variáveis Origem e tipo de Reserva realizada pelos hóspedes do resort. 33 De fato há uma relação entre essas variáveis, uma vez que os percentuais da variável Reserva se modificam dependendo da Origem do hóspede, de maneira a se observar dois grupos: os hóspedes que vieram de mais longe (América Latina e Europa, Ásia, África e Oceania) e os que vieram de mais perto (Pindorama e Estados Unidos). Figura 12 – Gráfico composto de colunas 100% empilhadas (relação Origem e tipo de Reserva) É possível afirmar que a maioria dos hóspedes que veio da América Latina (40,21%) ou da Europa, Ásia, África, Oceania (44,19%) realiza a reserva por meio do aplicativo de celular, enquanto a maioria dos hóspedes que veio de Pindorama (24,13%) ou dos Estados Unidos (27,61%) realiza a serva por meio de Corporativas. Assim, como suspeitado, os hóspedes que vieram de mais longe (Europa, Ásia, África, Oceania e de outros países da América Latina) utilizam, em sua maioria, o aplicativo de celular para efetuarem a reserva no resort. 4.55% 3.75% 22.58% 25.89% 40.21% 44.19% 22.80% 13.27% 19.23% 19.48% 24.13% 27.61% 5.59% 5.99% 13.48% 17.00% 30.42% 26.59% 17.02% 16.23% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Relação entre origem e tipo de reserva dos hóspedes do resort Por telefone Pelo site do resort Corporativa Aplicativo de reserva Agência de viagens
Compartilhar