Prévia do material em texto
1 Componente Curricular: Estatística Básica Referencial de Respostas do capítulo 1 Capítulo 1 Estatística Descritiva: a importância da estatística no dia a dia Atividade 1.1 Apresentamos uma argumentação básica para a questão proposta e ressaltamos que você certamente irá apresentar outras respostas. O importante é identificar o conteúdo e a coerência da argumentação apresentada. Resposta: Conforme solicitado escolhemos uma relação de pessoas, por exemplo, do setor de atendimento de uma empresa, onde fomos buscar informações sobre plano de saúde. Os primeiros atendentes das quatro fileiras são: o Pedro, a Clara, o João e a Maria Rita. Mas, como associar o nome dos atendentes ao sexo, de forma que isto se transforme em medida? Para isso, basta associarmos o nome ao sexo como forma de medida qualitativa, ou seja, basta associar ao sexo masculino o número 1 e ao feminino o número 2. Observe que os números 1 e 2 representam categorias, não quantidades. Também expressamos essas ideias através dos Quadros 1.1 e 1.2: Quadro 1.1 - Nome e sexo dos atendentes. Quadro 1.2 - Medida associativa Nome Sexo Nome Sexo Pedro Clara Maria Rita João Masculino Feminino Feminino Masculino Pedro Clara Maria Rita João 1 2 2 1 Atividade 1.2 2 Resposta: Apresentamos uma argumentação básica para cada item proposto e ressaltamos que você aluno(a) poderá apresentar outras respostas. O importante é identificar o conteúdo e a coerência da argumentação apresentada. a) Falso. Estatística é mais do que organizar dados. Ela também se dedica, entre outras coisas, de desenvolver o uso dos métodos para a coleta e análise de dados e como suplantar para toda a população os dados analisados (ou amostrados). b) Verdadeiro. Uma população pode ser constituída de todo solo pertencente a uma área bem definida, por exemplo, área reflorestada no Brasil no ano de 2009. c) Verdadeiro. A Estatística Descritiva pode ser considerada a parte mais conhecida da Estatística, e usualmente é a primeira técnica a ser utilizada nos auxiliando na exploração e análise do conjunto de dados. d) Falso. A afirmação deste item é um exemplo de população. Uma amostra é um grupo de 2.500 eleitores, por exemplo, selecionados em todo o Estado de Minas Gerias. e) Falso. A amostra precisa ser coletada com cautela evitando vícios e distorções nos resultados. Como se sabe uma amostra para ser boa, necessariamente, tem que ser representativa da população em estudo, ou seja, deve conter em proporção tudo o que a população possui qualitativamente e quantitativamente. Atividade 1.3 Resposta: Conforme a amostra estatística do horário de preferência, escolhido pelos funcionários temos: 7h 7h15 8h 8h45 7h 9h 7h 7h15 8h 8h 7h 8h 8h15 7h45 7h30 8h30 8h 8h15 7h45 9h 8h15 9h 8h30 7h 8h 7h15 7h 9h 7h30 7h45 a) Construindo uma tabela de frequência para sintetizar estes dados: Tabela 1.1 - Distribuição de frequência dos horários de preferência, escolhido pelos funcionários. Horário 7h 7h15 7h30 7h45 8h 8h15 8h30 8h45 9h Total n 3 if 6 3 2 3 6 3 2 1 4 30 rf 0,20 0,10 0,07 0,10 0,20 0,10 0,07 0,03 0,13 1,0 pf 20% 10% 7% 10% 20% 10% 7% 3% 13% 100% Fonte: dados simulados. b) Cálculos da distribuição de frequência percentual pf : Antes de calcularmos a pf precisamos saber a frequência relativa rf . Assim, a rf do primeiro horário escolhido por 6 dos funcionários, é expressa por: 6 0,20 30 i r f f n . E assim, sucessivamente, para os demais valores da sequência. O cálculo da frequência percentual pf nos indica a porcentagem de cada classe e, para obtê-la basta multiplicar rf por 100. Sendo assim temos, *100 0,20*100 20%p rf f . E assim, sucessivamente, para os demais valores da sequência. Atividade 1.4 Resposta: Esta resolução é de acordo com o estudo gráfico escolhido por você. O importante é identificar o conteúdo e a coerência da argumentação apresentada. Atividade 1.5 Resposta: Conforme a tabela fornecida, com a distribuição de frequência do consumo médio de eletricidade /kw hora reconstruindo-a temos: Tabela 1.2 - Distribuição de frequência. Classes Consumo /kw hora Número de usuários if F 1 5 --- 25 4 4 2 25 --- 45 6 10 3 45 --- 65 14 24 4 65 --- 85 26 50 5 85 --- 105 14 64 4 6 105 --- 125 8 72 7 125 --- 145 6 78 8 145 --- 165 2 80 - Total 80 - Fonte: dados simulados. Antes de calcularmos o 1Q , o 75C e o 9D vamos observar as informações que a Tabela 1.3 nos fornece. Além da frequência de usuários distribuídos nas 8 classes de valores do consumo médio de eletricidade /kw hora temos também uma outra coluna com a freqüência acumulada F . Atenção! Lembre–se sempre das dicas quanto a recordar os conceitos estudados! Então, recordar o conceito de F , a frequência acumulada - corresponde à soma das frequências absolutas if de sua classe, mais as anteriores caso existir. E o F acumulado representado na última classe, deverá ser igual ao valor de n . Assim, atuali anteriorF f F . Agora, vamos aos cálculos: Para calcular o primeiro quartil, primeiro temos que encontrar a sua posição 1QE . 1 * 1*80 20 4 4iQ Q i n E E Como podemos ver o 1Q encontra-se na 20ª posição logo, com o auxílio dos valores dispostos na coluna de frequência acumulada, verificamos que esta posição localiza- se na 3ª classe. Com base nessas informações calculamos o valor de 1Q . inf 1 20 10 * 45 *20 45 14,29 59,29 / 14 i Qi Qi Q anterior i i E F Q l h Q km h f Concluímos que 25% dos usuários consomem até 59,29 /km h . De forma análoga, 75% consomem acima de 59,29 /km h . Da mesma forma, para o cálculo do septuagésimo quinto centil 75C , primeiro temos que encontrar a sua posição 75CE . 5 75 * 75*80 6.000 60 100 100 100iC C i n E E Como podemos ver o 75C encontra-se na 60ª posição logo, com o auxílio dos valores dispostos na coluna de frequência acumulada, verificamos que esta posição localiza- se na 4ª classe. Com base nessas informações calculamos o valor de 75C . 75 inf 75 60 24 * 65 *20 65 27,70 92,70 / 26 i Ci Ci C anterior i E F C l h C km h f Concluímos que 75% dos usuários consomem até 92,70 /km h . De forma análoga, 25% consomem acima de 92,70 /km h . No cálculo do nono decil 9D , primeiro também temos que encontrar a sua posição 9DE . 9 * 9*80 720 72 10 10 10iD D i n E E Verificamos que o 9D encontra-se na 72ª posição logo, com o auxílio dos valores dispostos na coluna de frequência acumulada, verificamos que esta posição localiza- se na 6ª classe. Com base nessas informações calculamos o valor de 9D . inf 9 72 64 * 105 *20 105 20 125 / 8 i Di Di D anterior i i E F D l h D km h f Concluímos que 90% dos usuários consomem até 125 /kw h . De forma análoga, 10% consomem acima de 125 /kw h . 6 Referencial de Respostas do capítulo 2 Capítulo 2 Conhecendo o cálculo da probabilidade Atividade 2.1 Resposta a) / 0t t , em que t representa o tempo de vida útil. E podemos notar que 0t inclui a possibilidade da lâmpada não acender logo no início do teste. b) Para facilitar visualizarmos o espaço amostral resultante no lançamento de dois dados, sugerimos a construção de uma Tabela 2.1. Também é importante considerarmos 1D : dado 1 e 2D : dado 2. Tabela 2.1 - Valores obtidos, nas faces superiores, no lançamento de dois dados honestos. 1D 1 2 3 4 5 6 2D 1 1;1 1;2 1;3 1;4 1;5 1;6 2 2;1 2;2 2;3 2;4 2;5 2;6 3 3;1 3;2 3;3 3;4 3;5 3;6 4 4;1 4;2 4;3 4;4 4;5 4;6 5 5;1 5;2 5,3 5;4 5;5 5;6 6 6;1 6;2 6;3 6;4 6;5 6;6 Portanto, o espaço amostral: 1;1 ; 1;2 ; 1;3 ; ; 6;6 c) / 0X X , em que X representa o número de peças defeituosas. E podemos concluir que 0X inclui a possibilidade de não se produzir nenhuma peça defeituosa em uma hora. Ou 1X , logo 0,1,2,... . d) Portanto, o espaço amostral é o conjunto de todos os números reais positivos, e com isto assume valor contínuo. 7 Atividade 2.2 Resposta: A situação apresentada na Atividade 2.2 sugere a aplicação da definição de eventos independentes, entre as três etapas de inspeção, em que podemos escrever: P I II III P I P II P III 30.82 55,14%P I II III Portanto, com base nas informações obtidas, a probabilidade de um produto passar pelas três etapas de inspeção sem ser detectado é de 55,14%. Atividade 2.3 Resposta: Primeiro denominamos cada um dos eventos, depois com muita atenção definimos a probabilidade condicionada ao evento de interesse. II: representa o evento “lançado pela indústria II” G: representa o evento “gases poluentes lançados na atmosfera” Pergunta: Qual probabilidade dos gases considerados poluentes terem sidos lançados pela indústria II? Logo, queremos a probabilidade condicional de: / ?P II G / / P II G P II P G II P II G P G P G Atenção! Não se esqueça que os gases poluentes podem provir de qualquer uma das três indústrias (e só de uma). Portanto, confira a seguir como realizar os cálculos de P G , que representa a probabilidade dos gases considerados poluentes lançados na atmosfera. Como calcular P G ? / / /P G P I P G I P II P G II P III P G III 0,40 0,02 0,35 0,01 0,25 0,03 0,019P G P P P P P P Assim, / / P II P G II P II G P G 8 0,35 0,01 / 0,40 0,02 0,35 0,01 0,25 0,03 P II G 0,0035 / 0,184 18,4% 0,019 P II G Portanto, conclui-se que a probabilidade dos gases, considerados poluentes, terem sido lançados pela indústria II é de aproximadamente 18,4%. 9 Referencial de Respostas do capítulo 3 Capítulo 3 Distribuições de Probabilidade Atividade 3.1 Resposta: 1D : dado 1 e 2D : dado 2 Z : soma dos pontos das faces superiores 1E : lançar dois dados 2E : observar a soma das faces superiores Tabela 3.1 - Valores obtidos, nas faces superiores, no lançamento de dois dados honestos. 1D 1 2 3 4 5 6 2D 1 1;1 1;2 1;3 1;4 1;5 1;6 2 2;1 2;2 2;3 2;4 2;5 2;6 3 3;1 3;2 3;3 3;4 3;5 3;6 4 4;1 4;2 4;3 4;4 4;5 4;6 5 5;1 5;2 5,3 5;4 5;5 5;6 6 6;1 6;2 6;3 6;4 6;5 6;6 Fonte: dados simulados. Espaço amostral: 1;1 ; 1;2 ; 1;3 ; ; 6;6 No lançamento de dois dados honestos, podemos obter a soma dos pontos das faces superiores com valores variando de 2 até 12, conforme demonstrado na Tabela 3.1. Isto é, no resultado 1;1 a soma dos dois valores é 2, da mesma forma 1;2 a soma é 3, e assim por diante até o resultado 6;6 em que a soma dos dois resultados é 12. 10 As probabilidades vão de 1/36 a 6/36, e a função de probabilidade será expressa como, na Tabela 3.2: Tabela 3.2 - Função de probabilidade obtida, no lançamento de dois dados honestos. Z 2 3 4 5 6 7 8 9 10 11 12 ( )P Z 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 Fonte: dados simulados. Atividade 3.2 Resposta: X : número de filhos (variável aleatória) Vamos refletir! Não importa qual a família escolhida, mas apenas qual é a resposta dada quanto ao número de filhos. Desta forma, estamos sorteando um valor de X dentre 0, 1, 2, 3, 4 ou 5. A função de probabilidade dessa variável X segue das informações disponíveis que: 0 0,20P X 1 0,30P X e 2 0,35P X Como podemos notar para concluir a caracterização probabilística da variável X precisamos obter as probabilidades 3P X , 4P X 5P X . Segundo informações fornecidas, elas são iguais e, podemos dizer que apresenta valor p . Utilizando a definição de função discreta de probabilidade ou, simplesmente, função de probabilidade, temos que: 0 1 2 5 1P X P X P X P X 0,20 0,30 0,35 1p p p 0,85 3 1 3 1 0,85p p 0,15 0,05 3 p p Logo, a função de probabilidade para X é expressa pela Tabela 3.3 Tabela 3.3 - Função de probabilidade para X . X 0 1 2 3 4 5 Total ip 0,20 0,30 0,35 0,05 0,05 0,05 1,0 11 Fonte: dados simulados. Atividade 3.3 Resposta: Seja perfeita 0,95P e defeituosa 0,05P , logo 2 eventos com probabilidades constantes. Portanto, sendo 1k o número de peças defeituosas temos: k n k n P X x p q k 1 1920 1 0,05 0,95 0,3774 1 P X Na Tabela de distribuição binomial, vamos fazer a leitura da intersecção destes valores, isto é, temos que para 20n , 0,05p e para o valor de 1k , a intersecção da linha de 1k com a coluna em 0,05p . Concluímos o resultado 0,3774. Portanto, em um lote de peças onde 5% são defeituosos, sorteadas 20 dessas peças, a probabilidade de haver, exatamente, uma defeituosa é em torno de 37,74%. Atividade 3.4 Resposta: Como fornecido T Po , 3 . Deseja-se saber qual a probabilidade para que durante um mês se avariem sete ou mais colhedoras. , 0,1,2, ! k e P T k k k T : número de colhedoras que se avariam em cada mês. : média k : número de ocorrências 3 7 3 7 ! ! k k k e e P T k P T k k Tabela de Poisson Para obter o resultado consultando a Tabela de Poisson (ao final deste capítulo), basta procurar a média desejada, 3 ( , equivale a na Tabela de Poisson que 12 apresentamos), e, em seguida, ler o valor correspondente de k . A probabilidade é obtida pela intersecção da coluna de com a linha de k . Atenção! Observe que, neste caso, como 7T vamos somar todas as intersecções da coluna de com a linha de k a partir de 7k até o final da coluna de 3 . E, na Tabela de Poisson para 3 o último valor tabelado para k corresponde a 13 (valor 0,000 ). 7 0,0216 0,0081 0,0027 0,0008 0,0002 0,0001P T 7 0,0335P T Concluímos que durante um mês a probabilidade que se avariem sete ou mais colhedoras de cana-de-açúcar é de 3,35%. Atividade 3.5 Resposta: Seja X o tempo de extermínio da praga e, assim temos 2,X N , isto é, 15,4X N . Como desejamos saber qual a proporção, dessa variedade de soja, que demora mais de 17 dias para o extermínio da praga, calculamos: 17 15 17 1 4 X P X P P Z 0,5 0 1 0,5 0,3413 0,1587P Z Portanto, a proporção dessa variedade de soja em demorar mais de 17 dias para o extermínio da praga é de 15,87%. Atenção! Para encontrar o valor 0,3413, resultante da probabilidade 0 1P Z na Tabela de distribuição normal, basta realizar a leitura da coluna 0z correspondente ao valor 1 e, subtrair de 0,5 o valor encontrado. 13 Referencial de Respostas Capítulo 4 Capítulo 4 AmostragemAtividade 4.1 Resposta: Agora o sistema de referência sugerido na Atividade 4.1 é constituído por números de dois dígitos, isto é, 01,02,03,04, ,16,17,18,19, ,57,58,59,60 . Vamos retirar uma . . .AC S de tamanho seis 6n , utilizando a Tabela 4.1. Tabela 4.1 - Parte de uma Tabela de Números Aleatórios. 28 67 96 25 68 36 24 72 03 85 49 24 85 86 94 78 32 59 51 82 86 43 73 84 40 10 60 09 05 88 78 44 63 13 58 25 94 55 89 Fonte: Adaptada de Morettin, 2009. Para realizarmos este sorteio precisamos pré-estabelecer as regras de leitura da Tabela 4.1 e a retirada dos números. Os números correspondentes a cada professor são formados de dois dígitos, desta forma vamos realizar a leitura das sequências de dois dígitos na TNA . Adotando o mesmo início da leitura na Tabela 4.1 e as mesmas regras do exemplo apresentado, temos: Início da leitura na Tabela 4.1: Supor o início da leitura na 3ª linha, da esquerda para a direita, a partir do 9º dígito; formado por dois dígitos. Número de dígitos que vamos ler de cada vez nesta Tabela 4.1: Vamos ler dois dígitos de cada vez para corresponder aos números do sistema de referência adotado, isto é, a numeração dos professores: 01,02,03,04, ,59,60 . Sequência de leitura dos números na Tabela 4.1: Supor esta leitura da esquerda para a direita até o final da linha, reiniciando no começo da próxima linha e, assim sucessivamente até conseguirmos sortear todos os números da amostra desejada. Como proceder com os números repetidos na Tabela 4.1? Vamos ignorá-los caso já foram considerados na primeira leitura. 14 Como proceder com os números só formados por dígitos zero? Vamos associá-los ao último número do sistema de referência que, neste contexto, é representado pelo número 60. Atenção! Reescrevendo a Tabela 4.1 com os dígitos da sequência obtida, marcados em negrito, após as regras pré-estabelecidas. Tabela 4.1 - Parte de uma Tabela de Números Aleatórios. 28 67 96 25 68 36 24 72 03 85 49 24 85 86 94 78 32 59 51 82 86 43 73 84 40 10 60 09 05 88 78 44 63 13 58 25 94 55 89 Podemos observar que o primeiro número sorteado, 78, de acordo com os critérios adotados até agora, “não serve”, pois ultrapassa o valor do sistema de referência, assim como outros números desta 3ª linha, ou seja, 63, 94 e 89. Portanto, não conseguimos retirar as 6 unidades amostrais necessárias. Desta forma, podemos adotar um procedimento que além de permitir a retirada das 6 unidades previstas, também vamos reduzir o processo até o momento estudado. Atenção! Quando um número sorteado (que, neste contexto, é de dois dígitos) ultrapassar o maior valor do sistema de referência (que, na Atividade 4.1, corresponde a 60) basta dividirmos o número sorteado pelo maior valor do sistema e, considerarmos o resto desta divisão como o número da unidade populacional sorteada para compor a amostra prevista. Sendo assim, de acordo com este outro procedimento, vamos realizar a divisão dos números 78 e 63. Pois ambos ultrapassaram o maior valor do sistema de referência e, com apenas estas duas divisões conseguiremos concluir o tamanho amostral previsto. 78 60 18 1 63 60 3 1 Logo, a . . .AC S é expressa pela sequência: 18 44 3 13 58 25 Início: “3ª linha, a partir do 9º dígito” 15 Portanto, o sorteio utilizando a Tabela 4.1 apontou que uma amostra casual simples . . .AC S de professores de uma população, de professores de Estatística, que trabalham nos três períodos na UNIUBE; considerando 6n é composta pelo 3º, 13º, 18º, 25º, 44º e 58º professor do sistema de referência dado pela numeração dos professores em 01, 02, 03, 04, , 59, 60. Atividade 4.2 Resposta: Para a questão proposta ressaltamos que você aluno (a) certamente irá apresentar a resposta de acordo com o que pesquisou. O importante é identificar o conteúdo e a coerência da argumentação apresentada com o proposto na atividade.