Prévia do material em texto
Centro Federal de Educação Tecnológica Celso Suckow da Fonseca Curso Superior de Tecnologia em Gestão de Turismo Métodos Estatísticos Revisão para a AP1 Prezados alunos e prezadas alunas, vamos discutir aqui as soluções das questões que foram cobradas em uma AP1 de semestres anteriores. Nosso objetivo é ilustrar a articulação entre os conceitos do livro texto e construção das soluções. Por isso, escreveremos um pouco de conteúdo teórico também. Esperamos que estas notas sirvam como uma revisão dos capítulos abordados nestas questões. Vale notar que, de forma alguma, esta revisão tem a obrigação de esgotar as possibilidades de questões para futuras provas. Questão 1. Dada a amostra abaixo, monte uma Tabela de Frequência com 7 classes: Solução: Aqui podemos ter diferentes respostas, uma vez que o tamanho de cada classe não foi definido. O importante é percebermos que, se tratando de uma variável quantitativa, devemos computar a frequência acumulada também. Esse é um ponto importante! Para acumularmos os valores de frequência, precisamos ordenar os dados (ou classes), e isso só é possível nas variáveis quantitativas ou nas variáveis qualitativas ordinais. Abaixo, segue um exemplo com a escolha de classes de um mesmo tamanho: Tabela de Frequências Valores Frequência absoluta Frequência relativa Freq. acumulada abs Freq. acumulada rel 41|-- 46 4 13% 4 13% 46 |-- 51 4 13% 8 27% 51 |-- 56 4 13% 12 40% 56 |-- 61 3 10% 15 50% 61 |-- 66 5 17% 20 67% 66 |-- 71 7 23% 27 90% 71 |-- 77 3 10% 30 100% TOTAL 30 100% Questão 2. O número de dependentes dos clientes para um evento de uma empresa de Turismo foi coletado e armazenado na tabela abaixo. Calcule o que se pede. 4 0 1 0 1 2 0 0 0 2 1 0 3 1 0 0 1 3 0 0 a) A sua mediana; b) A sua moda; c) A sua média; d) A sua variância. Solução: a) A mediana é uma medida de tendência central que representa “o ponto médio dos dados”. Para “dividir ao meio” temos que, antes de tudo, ordenar esses dados 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 2 2 3 3 4 Depois disso, • se a quantidade de dados for um número ímpar, basta tomarmos o dado do meio. Sendo n o número de dados, digamos, 𝑥1, 𝑥2, … , 𝑥𝑛, já ordenados, a posição da mediana pode ser obtida como sendo 𝑛+1 2 . Por exemplo, se tivéssemos 5 dados, 𝑥1, 𝑥2, 𝑥3, 𝑥4, 𝑥5, por essa última fórmula, a posição da mediana seria 6+1 2 = 3 e a mediana seria o dado 𝑥3. Aqui vale mais um comentário importante: não confundam a posição da mediana com a próprio valor da mediana: a posição é 3 e a mediana, propriamente dada, é 𝑥3. • Agora, se a quantidade for um número par, não teremos exatamente um “ponto do meio”. Por exemplo, se tivéssemos 6 dados, 𝑥1, 𝑥2, 𝑥3, 𝑥4, 𝑥5, 𝑥6, nenhum desses dados consegue deixar 50% dos valores observados à sua esquerda e, os outros 50% restantes, à sua direita (concorda?). Neste caso, a mediana não será um dado que foi observado. O que fazemos é tomar uma média entre os dois valores centrais que foram observados. Nas seis observações, esses dois dados seriam o 𝑥3 e o 𝑥4 e, com isso, a mediana seria dada por 𝑥3+𝑥4 2 . Em geral, se n é um número par, a mediana é dada por: 𝑥(𝑛)/2+𝑥(𝑛/2 +1) 2 Vale observar que as planilhas eletrônicas possuem função para o cálculo de medianas implementada exatamente desta forma. Voltando à nossa questão: como temos 20 dados observados (um número par), o cálculo é feito tomando-se a média aritmética entre os 10º e 11° dados. Sendo assim, a sua mediana é 𝑥10+𝑥11 2 = 0+1 2 =0.5. b) A sua moda é o valor observado mais frequentemente. No nosso caso é o valor 0 (zero), que ocorreu 10 vezes. Repare que não haveria a necessidade de ordenar os dados para obtermos a moda. b) A média é obtida somando-se todos os valores observados e dividindo esta soma pelo número de observações: �̅� = ∑ 𝑥𝑖 20 1 20 = 0.95. Repare que aqui, também não haveria a necessidade de ordenar os dados para obtermos a média. c) A sua variância é uma medida de dispersão dos dados em relação à média, que já calculamos acima. Sua fórmula é dada por 𝜎2 = ∑ (𝑥𝑖−�̅�)2𝑛 𝑖 𝑛 =1.4475. Questão 4. Existem duas opções de caminho para se dirigir de um certo hotel até um certo ponto turístico. Tentando definir qual o melhor caminho, o gestor anota o tempo de viagem em diferentes dias, obtendo os seguintes tempos (em minutos): Caminho 1 12 11 10 10 8 12 15 7 20 12 Caminho 2 12 15 13 13 14 13 12 14 13 15 Faça uma análise comparativa desses dados para ajudar o gestor a escolher um caminho a ser adotado pelos guias turísticos. Sua análise deve estar, necessariamente, baseada nos indicadores média e desvio padrão. Solução: Fazendo as contas, vemos que Caminho 1 : média 11,7 min e desvio padrão 3,49 min Caminho 2 : média 13,4 min e desvio padrão 1,02 min Então, no caminho 1, os tempos estão em média 3,49 min abaixo ou acima de 11,7 minutos. Já no caminho 2, temos em média tempos 1,02min abaixo ou acima de 13,4 minutos. Em uma análise de pior caso, o caminho 1 poderia levar 15,19 minutos e o caminho 2, 14,42 minutos. Com isso, o caminho 2 se mostra menos arriscado e mais estável em relação ao tempo médio. Questão 4. Uma empresa comercializa eventos em duas modalidades de pacotes: um com capacidade máxima para 300 pessoas e um para 1000 pessoas. Para efeito de análise de futuros redimensionamentos dos pacotes, o gestor solicitou os relatórios dos últimos pacotes vendidos para conferir as lotações dos eventos. • Capacidade de 300 pessoas: 𝑥 ̅ = 275; 𝜎 = 25 • Capacidade de 1000 pessoas: �̅� = 975; 𝜎 = 25 Analise qual dos dois pacotes sugerem uma reflexão sobre o redimensionamento da capacidade máxima, baseando-se na variabilidade dos dados. Solução: Vamos interpretar esses indicadores: Embora ambos os pacotes tenham o mesmo desvio padrão, o desvio padrão é uma medida de dispersão em torno da média. Como a média observada no primeiro pacote turístico é de 275, bem menor do que a média do segundo, vemos que a variabilidade no primeiro pacote é muito maior. Portanto, o gestor deve refletir sobre o redimensionamento do primeiro pacote.