Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 INSTITUTO SUPERIOR DE CONTABILIDADE E AUDITORIA DE MOÇAMBIQUE Disciplina: Estatistica II Data: 21.06.2023 Curso: LCA, LCFin, LCPA e LCF Duração: 2 horas Ano/Semestre: 2º Ano/ 1 º Semestre Docente: O Grupo de disciplina Exame Normal-Variante II GUIÃO DE CORRECÇÃO A inferência estatística tem por objectivo fazer generalizações sobre uma população com base em valores amostrais. A inferência pode ser feita estimando os parâmetros por ponto e por intervalo. 1. Das afirmações que seguem, assinale com V as afirmações verdadeiras e F as Falsas: (3.0 val) a) Os testes não-Paramétricos podem frequentemente ser aplicados a dados não-numéricos. Verdade b) O erro tipo II consiste em rejeitar a hipótese nula quando ela é falsa. Falso c) Na estimação de parâmetros, quanto maior for o nível de confiança, menor será a precisão. Verdade d) Um estimador 𝜃 é não viciado, quando á medida em que o tamanho amostral aumenta, o seu valor esperado converge para o parâmetro de interesse. Falso e) Se o coeficiente de correlação entre duas variáveis quantitativas for muito fraco, conclui-se que não existe uma relação linear entre as variáveis. Falso f) Nos modelos de regressão linear simple, o coeficiente de determinação é usado para medir a qualidade de ajuste do modelo. Verdade 2. O chefe do departamento de qualidade de uma empresa de fornecimento de material de escritório, pretende estimar a taxa de reclamações dos seus clientes em relação a durabilidade dos produtos fornecidos. Sabendo que, ele deseja obter uma estimativa com um erro mínimo possível: a) Qual é a probabilidade de em 100 clientes selecciondos aleatoriamente, obter um erro máximo de estimação de 0.565%? (1.5 val) Resolução Pelos dados temos: 𝑛 = 100; 𝜀 ≤ 0.00565; 𝑃𝑒𝑑𝑒 − 𝑠𝑒 𝑃(𝜀 ≤ 0.03) 𝑜𝑢 (1 − 𝛼) ∗ 100%? (𝟎. 𝟐 𝒗𝒂𝒍) Sabe se que: 𝑝~𝑁 (𝜋; 𝜋 ∗ (1 − 𝜋) 𝑛 ) (𝟎. 𝟏 𝒗𝒂𝒍) Padronizando teremos: 𝑍~𝑁(0; 1) Partindo da fórmula do erro de estimação do I.C para as proporções com populações infinitas, teremos: 𝜀 = 𝑍𝛼 2 ∗ √ 𝑝 ∗ (1 − 𝑝) 𝑛 (𝟎. 𝟐 𝒗𝒂𝒍) Lembre que, uma vez que as proporções são desconhecidas, deve-se recorrer ao pior cenário, logo: 𝑝 = 𝑞 = 50% 2 Então: 0.00565 = 𝑍𝛼 2 ∗ √ 0.5 ∗ 0.5 100 𝟎. 𝟓 𝒗𝒂𝒍 𝑍𝛼 2 = 2.26 (𝟎. 𝟏 𝒗𝒂𝒍) Recorrendo a tabela Z normal temos: 0.5 − 𝛼 2 = 0.48809 𝟎. 𝟏 𝒗𝒂𝒍 𝛼 = 0.02382 1 − 𝛼 = 1 − 0.02382 = 0.97618 (𝟎. 𝟐 𝒗𝒂𝒍) Resposta: A probabilidade de em 100 clientes seleccionados aleatoriamente, obter um erro máximo de estimação de 0.565% é de 97.6%. (0.1 val) b) Um estudo piloto revelou uma proporção de reclamações de 25%. Qual deve ser o tamanho de amostra a um nível de confiança de 97%, para que a precisão não exceda a 0.026? (1.5 val) Resolução Pelos dados temos: 𝑝 = 0.25; 𝜀 ≤ 0.026; 1 − 𝛼 = 0.97; 𝑛 =? (𝟎. 𝟏 𝐯𝐚𝐥) Sabe se que: 𝑝~𝑁 (𝜋; 𝜋 ∗ (1 − 𝜋) 𝑛 ) (𝟎. 𝟏 𝐯𝐚𝐥) Padronizando teremos: 𝑍~𝑁(0; 1) 𝑍𝛼 2 = 𝑍0.015 = 2.17 (𝟎. 𝟏 𝐯𝐚𝐥) Recorrendo a fórmula do tamanho de amostra para as proporções com populações infinitas, temos: 𝑛 = 𝑍2𝛼 2 ∗ 𝑝 ∗ (1 − 𝑝) 𝜀2 (𝟎. 𝟏 𝐯𝐚𝐥) 𝑛 = 2.172 ∗ 0.25 ∗ 0.75 0.0262 (𝟎. 𝟖 𝐯𝐚𝐥) = 1306 (𝟎. 𝟏 𝐯𝐚𝐥) Resposta: O tamanho de amostra a um nível de confiança de 97%, para que a precisão não exceda a 0.026% deve ser no mínimo de 1306 clientes. (𝟎. 𝟐𝐯𝐚𝐥) 3 c) Seleccionada a amostra com o tamanho obtido na alínea b), obteve-se uma proporção de 36% de reclamações em relação a durabilidade dos produtos. Construa um intervalo de confiança para a verdadeira proporção com nível de confiança de 90%. (1.5 val) Resolução Pelos dados temos: 𝑝 = 0.36; 1 − 𝛼 = 0.90; 𝑛 = 1306? (𝟎. 𝟏 𝒗𝒂𝒍) Sabe se que: 𝑝~𝑁 (𝜋; 𝜋 ∗ (1 − 𝜋) 𝑛 ) (𝟎. 𝟏 𝒗𝒂𝒍) Padronizando teremos: 𝑍~𝑁(0; 1) 𝑍𝛼 2 = 𝑍0.05 = 1.645 (𝟎. 𝟏 𝒗𝒂𝒍) Recorrendo a fórmula do intervalo de confiança para proporção quando a população é infinita, teremos: 𝑝 ± 𝑍𝛼 2 ∗ √ 𝑝 ∗ (1 − 𝑝) 𝑛 ∈ 𝜋 (𝟎. 𝟐 𝒗𝒂𝒍) 0.36 ± 1.645 ∗ √ 0.36 ∗ 0.64 1306 ∈ 𝜋 (𝟎. 𝟕 𝒗𝒂𝒍) 0.338 ≤ 𝜋 ≤ 0.382 (𝟎. 𝟐 𝒗𝒂𝒍) Interpretação: A um nível de confiança de 90%, pode-se afirmar que a taxa de reclamações dos clientes em relação a durabilidade dos produtos fornecidos pela empresa está entre 33.8% e 38.2%. (𝟎. 𝟏 𝒗𝒂𝒍) 3. Os consumidores da cidade de Maputo, afirmam que o gás doméstico comercializado nos postos de venda é adulterado. Para verificar a veracidade desta afirmação, o Instituto Nacional de Normalização e Qualidade- IP (INNOQ) realizou uma inspeção a 33 botijas de gás da Galp, com 11kg de peso em alguns dos seus pontos de venda, tendo obtido os seguintes dados: 9.9 9.8 9.6 10.4 11.0 10.5 9.8 10.7 10.8 9.2 9.9 10.5 10.0 11.0 11.1 9.7 9.4 10.3 10.8 10.4 9.7 10.1 9.9 9.8 10.7 10.9 10.6 9.8 9.4 11.0 11.1 9.8 10.8 Sabendo que os pesos seguem uma distribuíção normal: a) A um nível de significância de 1%, há evidências para afirmar que as botijas são adulteradas? (2.0 val) Resolução Pelos dados temos: 𝜇0 = 11; 𝑛 = 33; �̅� = 10.3; 𝑆 = 0.5646; 𝛼 = 0.01 (𝟎. 𝟐 𝒗𝒂𝒍) 1º Passo: Formulação de hipóteses: { H0: μ = 11 (𝟎. 𝟏 𝒗𝒂𝒍) H1: μ < 11 (𝟎. 𝟐 𝒗𝒂𝒍) 2º Passo: Identificação da distribuição amostral 4 Como a variança populacional é desconhecida e n é grande, então: 𝑃𝑎𝑟𝑎 𝛼 = 0.01, 𝑍~𝑁(0; 1) (𝟎. 𝟏 𝒗𝒂𝒍) 3º Passo: Determinação da estatística do teste 𝑧𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = �̅� − 𝜇0 𝑆 √𝑛 (𝟎. 𝟐 𝒗𝒂𝒍) = 10.3 − 11 0.5646 √33 (𝟎. 𝟔 𝒗𝒂𝒍) = −7.1222 (𝟎. 𝟏 𝒗𝒂𝒍) 4º Passo: Com o auxílio da tabela de distribuíção normal padrão, determinar a RC (região crítica) e RA (região de aceitação) para 𝐻0 Sab-se que o nível de significância é de 1% e o teste é uni-caudal esquerdo, pela tabela Z-normal padrão temos: −𝑍𝛼; = −𝑍0.05 = −1.645 (𝟎. 𝟏 𝒗𝒂𝒍) (𝟎. 𝟏 𝒗𝒂𝒍) 5º Passo: Decisão Como 𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = −7.1222 ∈ 𝑅𝑒𝑔𝑖ã𝑜 𝑑𝑒 𝑟𝑒𝑗𝑒𝑖çã𝑜, rejeita-se a hipótese nula- (𝟎. 𝟏𝒗𝒂𝒍) 6ª passo: Conclusões A um nível de significância de 5%, pode se concluir que há evidências suficientes para afirmar que as botijas são adulteradas. (𝟎. 𝟐 𝒗𝒂𝒍) b) Determine o intervalo de confiança a 95% para a variabilidade dos pesos das botijas. (1.5 val) Resolução Do problema temos Pelos dados temos: 𝑛 = 33; 𝑆2 = 0.3188; 1 − 𝛼 = 0.95 (𝟎. 𝟏 𝒗𝒂𝒍) 𝜒2~𝜒2 𝑛−1 (𝟎. 𝟏 𝒗𝒂𝒍) A fórmula geral do intervalo de confiança para o desvio padrão será: (𝑛 − 1) ∗ 𝑆2 𝜒2 𝑠𝑢𝑝 ≤ 𝜎2 ≤ (𝑛 − 1) ∗ 𝑆2 𝜒2 𝑖𝑛𝑓 (𝟎. 𝟐 𝒗𝒂𝒍) 5 Neste caso é necessário inicialmente determinar os valores da distribuição, 𝜒2 de modo, que 𝜒2 𝑖𝑛𝑓 tenha uma área (probabilidade) à esquerda igual a 97.5% e 𝜒2 𝑠𝑢𝑝 tenha uma área (probabilidade) à direita igual a 2.5%. Recorrendo a tabela Chi-Quadrado teremos: 𝜒2 𝑠𝑢𝑝 = 𝜒2 0.025;32 = 46.979 (𝟎. 𝟏 𝒗𝒂𝒍) e 𝜒2 𝑖𝑛𝑓 = 𝜒2 0.975;32 = 16.791 (𝟎. 𝟏 𝒗𝒂𝒍) Substituindo os dados pela fórmula temos: 32 ∗ 0.3188 46.979 ≤ 𝜎2 ≤ 32 ∗ 0.3188 16.791 (𝟎. 𝟔 𝒗𝒂𝒍) 0.2172 ≤ 𝜎 ≤ 0.6076 (𝟎. 𝟐 𝒗𝒂𝒍) Interpretação: A um nível de confiança de 95% pode se afirmar que o intervalo [0.2172; 0.6076] contêm a verdadeia variabilidade dos pesos das botijas. (𝟎. 𝟏 𝒗𝒂𝒍) 4. Com objectivo de comparar os preços de venda de um determinado produto, entre duas empresas A e B, foi realizada uma pesquisa tendo se obtido os seguintes resultados: Quantidades vendidas Preço Médio (u.m) Desvio Padrão Empresa A 29 85.46 2.617 Empresa B 21 89.48 4.652 Supondo que os preços praticados seguem uma distribuição normal, a um nível de significânciade 5%, pode – se afirmar que as duas empresas praticam o mesmo preço? (4.5 val) Resolução Pelos dados temos: 𝑆𝑒𝑗𝑎 𝑛1 = 𝐸𝑚𝑝𝑟𝑒𝑠𝑎 𝐴 𝑒 𝑛2 = 𝐸𝑚𝑝𝑟𝑒𝑠𝑎 𝐵 𝑛1 = 29; �̅�1 = 85.46; 𝑆1 = 2.617; 𝑛2 = 21; �̅�2 = 89.48; 𝑆2 = 4.652 (𝟎. 𝟏 𝐯𝐚𝐥) Nota que nada sab-see sobre a homogeidade das população, então primeiros temos que testar a hipótese para a igualdade das varianças. 1º Passo: Formulação de hipóteses: { 𝐻0: 𝜎 2 1 = 𝜎 2 2 (𝐴𝑠 𝑝𝑜𝑝𝑢𝑙𝑎çõ𝑒𝑠 𝑠ã𝑜 ℎ𝑜𝑚𝑜𝑔ê𝑛𝑒𝑎𝑠) (𝟎. 𝟏 𝐯𝐚𝐥) 𝐻1: 𝜎 2 1 ≠ 𝜎 2 2 (𝐴𝑠 𝑝𝑜𝑝𝑢𝑙𝑎çõ𝑒𝑠 𝑠ã𝑜 ℎ𝑒𝑡𝑒𝑟𝑟𝑜𝑔ê𝑛𝑒𝑎𝑠) (𝟎. 𝟏 𝐯𝐚𝐥) 2º Passo: Identificação da distribuição amostral 𝑃𝑎𝑟𝑎 = 0.05; 𝐹~𝐹𝑛1−1;𝑛1−1 (𝟎. 𝟏 𝐯𝐚𝐥) 3º Passo: Determinação da estatística do teste 𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 𝑆21 𝑆22 (𝟎. 𝟏 𝐯𝐚𝐥) = ( 2.617 4.652 ) 2 (𝟎. 𝟑 𝐯𝐚𝐥) = 0.3164 (𝟎. 𝟏 𝐯𝐚𝐥) 4º Passo: Determinação dos valores críticos e região de aceitação ou rejeição da Hipótese nula Sabe-se que o nível de significância é de 5% e o teste é bi-caudal, pela tabela de distribuição F temos: 6 𝐹𝛼 2 ; 𝑛1−1;𝑛2−1 = 𝐹0.025; 28;20 = 3.35 (𝟎. 𝟏 𝐯𝐚𝐥) 𝐹 1− 𝛼 2 ; 𝑛1−1;𝑛2−1 = 1 𝐹𝛼 2 ; 𝑛2−1;𝑛1−1; = 1 𝐹0.025; 20;28 = 1 2.23 = 0.4484 (𝟎. 𝟏 𝐯𝐚𝐥) (𝟎. 𝟏 𝐯𝐚𝐥) 5º Passo: Decisão Como 𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 0.3164 ∈ 𝑅𝑒𝑔𝑖ã𝑜 𝑑𝑒 𝑅𝑒𝑗𝑒𝑖çã𝑜, logo, rejeita-se a hipótese nula. (𝟎. 𝟏 𝐯𝐚𝐥) 6ª Passo: Conclusões A um nível de significância de 5%, pode se afirmar que as varianças são desconhecidas e diferentes, isto é, as populações são heterrogêneas. (𝟎. 𝟏 𝐯𝐚𝐥) Em seguida o teste de igualdade das médias: 1º Passo: Formulação de hipóteses: { 𝐻0: 𝜇1 = 𝜇2 (𝟎. 𝟏 𝐯𝐚𝐥) 𝐻1: 𝜇1 ≠ 𝜇2 (𝟎. 𝟐 𝐯𝐚𝐥) 2º Passo: Identificação da distribuição amostral 𝑁𝑜𝑡𝑎 𝑞𝑢𝑒 (𝑛1 ∩ 𝑛2 ) < 30, 𝐿𝑜𝑔𝑜 𝑝𝑎𝑟𝑎 𝛼 = 0.05, 𝑡~𝑡𝐺𝑙 (𝟎. 𝟏 𝐯𝐚𝐥) 3º Passo: Determinação da estatística do teste Coo as populações são homogêneas, então: 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = (�̅�1 − �̅�2) − (𝜇1 − 𝜇2) √ 𝑆21 𝑛1 + 𝑆22 𝑛2 (𝟎. 𝟐 𝐯𝐚𝐥) e 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 85.46 − 89.48 √6.848689 28 + 21.641104 20 (𝟏. 𝟎 𝐯𝐚𝐥) = −0.8593 (𝟎. 𝟏 𝐯𝐚𝐥) 4º Passo: Determinação dos valores críticos e região de aceitação ou rejeição da Hipótese nula Sabe-se que o nível de significância é de 5% e o teste é bilateral com varianças desconhecidas diferentes, então: 𝐺𝑙 = ( 𝑆21 𝑛1 + 𝑆22 𝑛2 ) 2 ( 𝑆21 𝑛1 ) 2 𝑛1 − 1 + ( 𝑆22 𝑛2 ) 2 𝑛2 − 1 (𝟎. 𝟏 𝐯𝐚𝐥) = ( 6.848689 29 + 21.641104 21 ) 2 ( 6.848689 29 ) 2 28 + ( 21.641104 21 ) 2 20 (𝟎. 𝟕 𝐯𝐚𝐥) = 23 (𝟎. 𝟏 𝐯𝐚𝐥) 𝑡𝛼; 𝐺𝑙 = 𝑡0.025;23 = ±2.069 (𝟎. 𝟏 𝐯𝐚𝐥) (𝟎. 𝟏 𝐯𝐚𝐥) 7 5º Passo: Decisão Como 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = −0.8593 ∈ 𝑅𝐴, Logo aceita-se a hipótese nula. (𝟎. 𝟏 𝐯𝐚𝐥) 6ª Passo: Conclusões A um nível de significância de 5%, não há evidências suficientes de que as duas empresas praticam o mesmo preço. (𝟎. 𝟐 𝐯𝐚𝐥) 5. Realizou-se uma pesquisa de mercado com o objectivo de estudar a relação entre o tempo necessário para um consumidor tomar uma decisão (sobre o que comprar) e o número de embalagens alternativas do mesmo produto apresentadas a esse consumidor. Eliminaram-se as marcas das embalagens, a fim de reduzir o efeito da preferência por uma ou outra marca. Os consumidores fizeram suas escolhas somente com base na descrição do produto, anotada nas embalagens pelos fabricantes. A análise de regressão do tempo necessário em minutos, para que cada um tomasse sua decisão foi anotado para 15 participantes. As tabelas abaixo, mostram os resultados da análise de regressão feita. Coefficients Standard Error t Stat P-value Intercept 4.3 1.216447 3.534884 0.003661 Número de alternativas 1.5 0.39125 3.833861 0.00207 a) Calcule e interprete o desvio padrão do modelo; (1.0 val) Resolução 𝑆 = √ 𝑠𝑦𝑦 − �̂�1 ∗ 𝑠𝑥𝑦 𝑛 − 2 = √ 𝑆𝑄𝑡𝑜𝑡𝑎𝑙 − 𝑆𝑄𝑅𝑒𝑔 𝑛 − 2 = √ 𝑆𝑄𝑅𝑒𝑠 𝑛 − 2 = √ 𝑀𝑄𝑅𝑒𝑠 𝑛 − 2 (𝟎. 𝟐 𝒗𝒂𝒍) Regression Statistics Multiple R 0.728464397 ANOVA df SS MS F Significance F Regression 1 22.5 22.5 14.7 0.0021 Residual 13 19.9 1.530769 Total 14 42.4 R Square 0.530660377 Adjusted R Square 0.494557329 Standard Error 1.237242592 Observations 15 8 𝑆 = √1.530769 (𝟎. 𝟓 𝒗𝒂𝒍) = 1.2372 (𝟎. 𝟏 𝐯𝐚𝐥) O desvio padrão do modelo é igual a 1.2372, isto é, em média o tempo previsto necessário para um consumidor tomar uma decisão,o desvia-se do número de alternativas em aproximadamente 1.2372 segundos. (0.2 val) b) Determine poder explicativo do modelo e interprete-o; (1.5 val) Resolução 𝑅2 = ( 𝑠𝑥𝑦 √𝑠𝑥𝑥 ∗ 𝑠𝑦𝑦 ) 2 = 0.531 (𝟏. 𝟎 𝐯𝐚𝐥) 53.1% da variação média do tempo necessário para um consumidor tomar uma decisão é explicado pelo número de alternativas, e os restantes 46.9% por outros factores. (0.5 val) c) Obtenha o intervalo de confiança de 95%, para a previsão de um valor médio do tempo necessário para um consumidor tomar uma decisão (sobre o que comprar), para um número de alterntivas igual a 15. (2.0 val) Resolução Pela fórmula temos: �̂�0 ± 𝑡𝛼 2 ;𝑛−2 ∗ 𝑆 ∗ √ 1 𝑛 + (𝑋0 − �̅�) 2 𝑆𝑥𝑥 𝜖 𝑌𝜇 (𝟎. 𝟐 𝐯𝐚𝐥) Nota que: 𝑆𝑥𝑥 = 𝑆𝑄𝑅𝑒𝑔 𝛽1̂ 2 = 22.5 1.52 = 10 (𝟎. 𝟓 𝐯𝐚𝐥) (4.3 + 1.5 ∗ 15) ± 2.160 ∗ 1.2372 ∗ √ 1 15 + (15 − 𝑥)2 10 𝜖 𝑌𝜇𝑥=15 (𝟎. 𝟕 𝐯𝐚𝐥) 26.8 − 2.672352 ∗ √ 1 15 + (15 − 𝑥)2 10 ≤ 𝑌𝜇𝑥=15 ≤ 26.8 + 2.672352 ∗ √ 1 15 + (15 − 𝑥)2 10 (𝟎. 𝟑 𝐯𝐚𝐥) Resposta: A um nível de confiança de 95%, pode-se concluir que a previsão para o valor médio do tempo necessário para um consumidor tomar uma decisão (sobre o que comprar), para um número de alterntivas igual a 15, é de 26.8 + 26.8 ± 2.672352 ∗ √ 1 15 + (15−𝑥)2 10 . (𝟎. 𝟑 𝐯𝐚𝐥)
Compartilhar