Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA APLICADA ÀS ANÁLISES CONTÁBEIS AULA 5 Profª Aline Purcote Quinsler CONVERSA INICIAL Segundo Castanheira (2010), na maioria dos problemas estatísticos, a amostra não é suficientemente grande para determinar a distribuição da população de maneira muito precisa. Assim, surge a distribuição de probabilidade, modelo matemático para a distribuição real das frequências que relaciona certo valor da variável em estudo com a sua probabilidade de ocorrência. Martins (2010) comenta que as análises das distribuições de probabilidades possibilitam a construção de modelos que nos auxiliam no entendimento de fenômenos do mundo real. Muitas vezes, não estamos interessados propriamente no resultado de um experimento aleatório, mas em características numéricas chamadas de Variáveis Aleatórias, classificadas em variável discreta ou contínua. Variável aleatória discreta é aquela que assume valores inteiros e finitos. Já a variável aleatória contínua pode assumir inúmeros valores em um intervalo de números reais e é medida em uma escala contínua. Os modelos discretos de probabilidade são as distribuições de probabilidade Binomial e de Poisson e, para as variáveis aleatórias contínuas, temos a distribuição normal de probabilidade. Com base na Distribuição Normal, podemos estruturar e definir os intervalos de confiança e os testes de hipóteses. Mas o que significa um intervalo de confiança e para que serve? Vimos que a Estatística é dividida em duas partes, Estatística Descritiva e Inferência Estatística. A Inferência Estatística obtém informações sobre a população com base nos elementos da amostra, e sempre que trabalhamos com amostragem temos um erro envolvido, surgindo, assim, o intervalo de confiança. Na Inferência, também temos os testes de hipóteses, nos quais admitimos um valor hipotético para um parâmetro da população e, com base na amostra, realizamos um teste para aceitar ou rejeitar este valor. Tanto o teste de hipótese como os intervalos de confiança são ferramentas que dão credibilidade aos resultados estatísticos. CONTEXTUALIZANDO Provavelmente você já ouviu o resultado de uma pesquisa eleitoral e, neste caso, ouviu falar de intervalo de confiança, nível de confiança e margem 3 de erro dessa pesquisa. Mas o que isso significa? Como funciona uma pesquisa eleitoral? Vamos entender como isso ocorre assistindo ao seguinte vídeo: Como funciona uma pesquisa eleitoral: <https://www.youtube.com/watch?v=igi7E1OY7gs> Para calcular e interpretar os conceitos apresentados, estudaremos Distribuições de Probabilidade, Intervalo de Confiança e Testes de Hipóteses. TEMA 1 – DISTRIBUIÇÃO BINOMIAL A Distribuição Binomial é um modelo que fornece a probabilidade do número de sucessos quando um experimento é repetido, assim, é a probabilidade de um evento ocorrer X vezes em N tentativas. Por exemplo, a probabilidade de ocorrerem três vezes o número 6 em cinco lançamentos de um dado, ou seja, três vezes (X=3) em 5 tentativas (N=5). Para Distribuição Binominal, considera-se um número fixo de tentativas, a probabilidade de sucesso (p) é a mesma em todas as tentativas e as tentativas são todas independentes. Segundo Castanheira (2010), se p é a probabilidade de um evento acontecer em uma tentativa única, denominada probabilidade de sucesso, e qé a probabilidade de o evento não ocorrerem qualquer tentativa, denominada probabilidade de insucesso, então a probabilidade de o evento ocorrer exatamente X vezes em N tentativas é dada por: P(X) = XNX qp XNX N . )!(! ! Em que: N = tentativas X = vezes p = probabilidade de sucesso q = 1 –p= probabilidade de insucesso Observação: N! ou X! é igual ao fatorial. O fatorial de um número N é dado pela fórmula: N! = N · (N – 1) · (N – 2) · (N – 3) ·... · 1 Ou seja, multiplicamos o número N por seus antecessores até chegar ao número 1. 4 Exemplo 1: 5! = 5· 4· 3· 2· 1 = 120 9! = 9· 8· 7· 6· 5· 4· 3· 2· 1 = 362.880 Ao calcular uma distribuição binomial, os problemas podem fornecer ou não o valor da probabilidade (p). Caso não seja informado, utilizar a fórmula do cálculo da probabilidade: Exemplo 2: Determinar a probabilidade de ocorrer 3 vezes o número 2 em 5 jogadas de um dado. O primeiro passo para calcular a distribuição binomial é encontrar os seguintes valores: N = tentativas = 5 X = vezes = 3 p = probabilidade de sucesso. Verificamos que o exercício não fornece a probabilidade. Dessa forma, precisamos encontrar este valor. Para encontrar a probabilidade, precisamos conhecer o espaço amostral e o evento. Como o experimento é o lançamento de um dado, o espaço amostral é: S = {1,2,3,4,5,6} O evento é a saída do número 2, ou seja: A = {2} Com estas informações, calculamos a probabilidade: Com o valor de p, calculamos o valor da probabilidade do insucesso (q): Q=1 – p =1 – 0,1667=0,8333 Conhecido todos os valores, aplicamos a fórmula da distribuição binomial: N = 5 X = 3 p=0,1667 q=0,8333 1667,0 6 1 )( AP XNqxp XNX N xP )!(! ! )( 358333,031667,0 )!35(!3 !5 )( xP 5 Exemplo 3:Sabe-se que 5% dos parafusos fabricados por certa indústria são defeituosos. Em um lote de 10 parafusos, calculea probabilidade de exatamente 2 serem defeituosos. Analisando o enunciado, temos os seguintes valores: N = 10 X = 2 p = 5% = 5/100 = 0,05 q = 1 –p = 1 – 0,05 = 0,95 Conhecidos todos os valores, aplicamos a fórmula da distribuição binomial: 2102 95,0.05,0 )!210(!2 !10 )( XP 6634,0.0025,0 )!8(2 800.628.3 )( XP 0017,0 40320.2 3628800 )( XP 0017,0 80640 3628800 )( XP 0017,0.45)( XP 0765,0)( XP %65,7)( XP Exemplo 4: Um varejista de computadores vende PCs on-line, tanto desktops quanto laptops. Sabendo que 80% dos PCs que o varejista vende sejam desktop e 20% laptop, encontre a probabilidade de que três dos próximos quatro PCs comprados sejam laptops. Analisando o enunciado, temos os seguintes valores: N = 4 X = 3 P= 20% = 20/100 = 0,20 q = 1 – p = 1 – 0,20 = 0,80 6944,0.0046,0 )!2(6 120 )( xP 0032,0 12 120 )( xP %2,3100.032,00032,0.10)( xP 6 Com base nos dados, aplicamos a fórmula da distribuição normal: 343 80,020,0 )!34(!3 !4 )( XP 80,0.008,0 !1.6 24 )( XP 0064,0 6 24 )( XP %56,20256,00064,0.4)( XP TEMA 2 – DISTRIBUIÇÃO POISSON A Distribuição de Poisson é utilizada para encontrar a probabilidade de um número designado de sucessos por unidade de tempo. Segundo Martins (2010), essa distribuição representa um modelo probabilístico adequado para o estudo de grande número de fenômenos observáveis. Por exemplo, chamadas telefônicas por minuto, acidentes por unidade de tempo ou clientes chegando ao caixa por hora. A probabilidade de um número designado de sucessos por unidade de intervalo, P(X), pode ser encontrada por: Em que: X: número designado de sucessos; λ(lambda): é o número médio de sucessos em um intervalo específico, ou seja, a média. e: base do logaritmo natural, ou 2,71828. Observação: o valor de e pode ser calculado utilizando a calculadora científica, HP, pela substituição do valor por 2,71828, ou utilizando uma tabela que fornece os valor de e . Calculadora científica:procureo símbolo ex. Exemplo: e-5 = SHIFT ex e digitar –5 = 0,00674 Calculadora HP: procure o símbolo ex no botão 1/x. Exemplo: e-5 = digitar 5 CHS g 1/x = 0,00674 O comando CHStorna o número negativo. 7 Substituição do valor de e: Exemplo: para calcular e-5, vamos substituir e por 2,71828. e-5 = 2,71828-5 Como o expoente é negativo, devemos inverter a fração para torná-lo positivo: 2,71828-5 = 00674,0 412660,148 1 71828,2 1 5 Tabela 1 – Identificação do valor direto na tabela utilizandoo valor da média (λ) Exemplo: e-5 = 0,00674 λ e-λ λ e-λ 0,0 1,00000 2,5 0,08208 0,1 0,90484 2,6 0,07427 0,2 0,81873 2,7 0,06721 0,3 0,74082 2,8 0,06081 0,4 0,67032 2,9 0,05502 0,5 0,60653 3,0 0,04979 0,6 0,54881 3,2 0,04076 0,7 0,49659 3,4 0,03337 0,8 0,44933 3,6 0,02732 0,9 0,40657 3,8 0,02237 1,0 0,36788 4,0 0,01832 1,1 0,33287 4,2 0,01500 1,2 0,30119 4,4 0,01228 1,3 0,27253 4,6 0,01005 1,4 0,24660 4,8 0,00823 1,5 0,22313 5,0 0,00674 Fonte: Castanheira, 2010. Caso o valor da média não seja fornecido, antes de aplicar a distribuição de Poisson, precisamos calculá-la utilizando: λ = N · p, em que N é o número de tentativas e p a probabilidade de sucesso. Essa fórmula é utilizada quando o número N de tentativas é muito grande e a probabilidade p de sucesso é muito pequena. Exemplo 1: Um departamento recebe em média cinco solicitações por hora. Qual é a probabilidade de receber duas solicitações em uma hora selecionada aleatoriamente? Vamos encontrar os valores de X e λ: X = 2 λ = 5 Agora, aplicamos a fórmula para encontrar a probabilidade: ! )( X ex xP 8 Há uma probabilidade de 8,422% de ocorrerem duas solicitações em uma hora selecionada. Exemplo 2: Uma pesquisa indica que, em média, seis clientes param em um caixa por hora. Qual é a probabilidade de três clientes pararem por hora? O enunciado fornece os seguintes dados: X = 3 λ = 6 Temos 8,928% de chance de três clientes pararem por hora nesse caixa. TEMA 3 – DISTRIBUIÇÃO NORMAL A Distribuição Normal é uma das distribuições mais empregadas e constitui a base teórica de toda inferência estatística. Utiliza dois parâmetros, a média e o desvio padrão, e seu principal interesse é obter a probabilidade de uma variável assumir um valor em determinado intervalo. A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média, que recebe o nome de Curva Normal ou Curva de Gauss, conforme Figura 1. 2 00674,0.25 !2 525 )( e xP %422,808422,0 2 16845,0 )( xP 9 Figura 1 – Curva normal A área total limitada pela curva é igual a 1, que corresponde a 100%, já que essa área corresponde à probabilidade da variável aleatória X assumir qualquer valor real. Como a curva é simétrica em torno da média, a probabilidade de ocorrer valor maior que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5 ou 50%, conforme a Figura 2: Figura 2 – Curva simétrica em torno da média Segundo Castanheira (2010), qualquer conjunto de valores X, normalmente distribuídos, pode ser convertido em valores normais padronizados Z pela fórmula: s X Z Em que corresponde à média e S ao desvio padrão. Esta é a fórmula reduzida da distribuição normal com média igual a zero e desvio padrão igual a um. Ao calcular Z, encontramos a probabilidade entre a média e o valor de X, conforme a Figura 3: 50% 50% 10 Figura 3 – Cálculo de Z Para encontrarmos o valor da distribuição normal, utilizamos o valor de Z que é tabelado, conforme tabela 1. A tabela indica as proporções de área para vários intervalos de valores para a distribuição de probabilidade normal padronizada, com a fronteira inferior do intervalo começando sempre na média. Tabela 2 – Áreas de uma distribuição normal padrão Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 (continua) X Z 11 (continuação da Tabela 2) 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 Obs.: as áreas para os valores de z negativos são obtidos por simetria. Fonte: Adaptada de Costa Neto. Para calcular a Distribuição Normal, precisamos dos valores da média, desvio padrão e X, calcular o parâmetro Z, encontrar o valor de Z na tabela e, após interpretar o intervalo solicitado, encontramos a probabilidade. A avaliação da curva normal ajuda na interpretação, auxiliando no cálculo final para obter a probabilidade desejada, conforme veremos nos exemplos seguintes. Exemplo 1: Uma máquina produz parafusos cujo diâmetro tem distribuição normal com média de 2 cm e desvio padrão de 0,04 cm. Qual é a probabilidade de um parafuso ter o diâmetro com valor entre 2 e 2,05 cm? No nosso problema, queremos calcular a probabilidade de o diâmetro apresentar valor entre 2 e 2,05, considerando uma distribuição normal. Para encontrara probabilidade, calculamos o valor de Z, desta forma, precisamos dos valores de X, e S. Para encontrar o valor de X, analisamos a faixa de valores solicitada no enunciado, queremos calcular diâmetro entre 2 e 2,05. Verificamos que 2 é a nossa média, assim, 2,05 será o valor de X. Por meio do enunciado, temos o valor da média e desvio padrão, conforme abaixo: X = 2,05 = 2 S = 0,04 Conhecidos os valores, vamos encontrar Z aplicando a fórmula: s X Z 25,1 04,0 205,2 Z Agora, verificamos na tabela o valor de Z = 1,25. Na primeira coluna, procuramos o valor até a primeira casa decimal = 1,2. Em seguida, encontramos, na primeira linha, o valor 0,05, que corresponde ao último 12 algarismo do número 1,25. Na intersecção da linha e coluna correspondentes, encontramos o valor 0,3944, este valor é a probabilidade que procuramos: Tabela 3 – Áreas de uma distribuição normal padrão Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,10260,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 Fonte: Adaptado de Costa Neto. P(X) = 0,3944 x 100 = 39,44%. Logo, a probabilidade de certo parafuso apresentar um diâmetro entre 2e 2,05 cm é de 39,44%. Exemplo 2: Em determinada empresa, a remuneração média por semana dos trabalhadores do setor de produção foi de R$ 441,84. Suponha que os dados disponíveis indiquem que os salários estejam normalmente distribuídos 13 com um desvio padrão de R$90,00. Escolhendo aleatoriamente um trabalhador, qual é a probabilidade de eleter ganhado menos de R$ 250,00 por semana? O enunciado fornece os seguintes valores: 84,441 X = 250 90S Com base nos dados, calculamos o valor de Z utilizando a fórmula e buscamos este valor na tabela de distribuição normal: s X Z 13,2 90 84,441250 z Verificamos que o valor de Z é negativo e não temos valores negativos na tabela, mas os valores negativos são obtidos por simetria. Logo, o valor procurado é 0,4834, considerando 2,1 na vertical e 0,03 na horizontal. Tabela 4 – Áreas de uma distribuição normal padrão Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 14 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 Fonte: Adaptado de Costa Neto. O exercício solicita a probabilidade para ganho menor que R$ 250,00, conforme área azul do gráfico: Figura 4 – Probabilidade de ganho Como o parâmetro Z calcula a probabilidade entre a média até o Xe queremos encontrar ganho menor que R$ 250,00, precisamos diminuir 0,50 do valor da tabela, pois cada metade da curva representa 50% de probabilidade. Assim: 0,50 – 0,4834 = 0,01660 x 100= 1,66% Logo, a probabilidade de um trabalhador ter ganhado menos de R$ 250,00 por semana é de 1,66%. Exemplo 3: Uma empresa realizou um estudo indicando que o salário semanal dos seus operários é distribuído normalmente em torno de uma média de R$ 80,00 com desvio padrão de R$ 5,00. O diretor da empresa está interessado em saber qual é a probabilidade de um operário ter um salário semanal acima de R$ 85,00. 15 Para encontrar a probabilidade, calculamos o valor de Z com os seguintes dados: 80 X = 85 5S 1 5 8085 Z Procurando Z na tabela, temos uma probabilidade de 0,3413, mas como queremos identificar a porcentagem acima de R$ 85, conforme gráfico abaixo, precisamos diminuir a probabilidade encontrada de 50% ou 0,5. Figura 5 – Diminuição da probabilidade 0,5–0,3413 = 0,1587 x 100 = 15,87% Logo, a probabilidade de um operário ter um salário semanal acima de R$ 85,00 é de 15,87%. Exemplo 4: As idades de um grupo apresentaram média igual a 20 anos e desvio padrão de 2 anos. Determine o percentual desse grupo que tem idade entre 17 e 22 anos. Neste exercício, estamos interessados em encontrar o percentual de idade entre 17 e 22 anos sabendo que 20 e S = 2. Neste caso, qual é o valor de X? Vamos analisar o gráfico da distribuição: Figura 6 – Gráfico da distribuição 16 Como o intervalo procurado apresenta um número menor e outro maior que a média, precisamos calcular dois valores para Z utilizando dois valores de X, sendo X = 17 e X = 22: X = 17: Verificando na tabela, temos 0,4332. X = 22 Verificando na tabela, temos 0,3413. Para encontrar o valor da probabilidade, devemos somar os valores encontrados: 0,4332 +0,3413 = 0,7745 = 77,45% Assim, o percentual desse grupo que tem idade entre 17 e 22 anos é de 77,45%. TEMA 4 – INTERVALO DE CONFIANÇA A Inferência Estatística é um processo para obterinformações sobre uma população com base em resultados obtidos na amostra. Segundo Castanheira (2010), para realizar uma inferência, precisamos trabalhar com temas que envolvem amostragem, estimação e intervalo de confiança. A amostragem consiste em selecionar parte de uma população para observar, de modo que seja possível estimar alguma coisa sobre toda a população. Essa estimativa pode ocorrer por ponto ou por intervalo. A estimativa por ponto é um valor único obtido por meio de cálculos efetuados com a amostra, que serve como uma aproximação do parâmetro. Vamos considerar uma amostra de 1.000 clientes realizando uma pesquisa referente à satisfação em relação ao atendimento da empresa. Suponha que 700 clientes respondam que estão satisfeitos, desta forma, pela estimativa por ponto, temos que 70% dos clientes estão satisfeitos com o atendimento dessa empresa, ou seja: %701007,0 1000 700 x 5,1 2 2017 z 1 2 2022 z 17 Segundo Castanheira (2010), a estimativa por intervalo, também denominada intervalo de confiança, para um parâmetro é uma faixa de valores possíveis e aceitos como verdadeiro, na qual se estima encontrar o parâmetro. Permite diminuir o tamanho do erro que estamos cometendo, e quanto menor for o comprimento do intervalo, maior a precisão dos cálculos. O intervalo de confiança é um intervalo de valores com probabilidade de conter o valor desconhecido e associado a um nível de confiança, um número que exprime o grau de confiança deste intervalo: O valor de c é chamado de erro amostral e obtido pela fórmula: Em que: Z = distribuição normal padronizada = desvio padrão da população n = tamanho da amostra Após calcular o valor de c, determinamos o intervalo de confiança: Em que: = média da amostra média da população Exemplo 1: Determine o intervalo de confiança para um grupo que tem peso médio de 68 kg com desvio padrão de 3 kg. Supor nível de confiança igual a 90% e uma amostra de 64 pessoas. O primeiro passo para encontrar o intervalo de confiança é calcular o valor de c, mas precisamos ter o valor de Z. Para encontrar Z,levamos em conta o nível de confiança que, neste exemplo, é igual a 90%. Dividimos o nível de confiança por 2 e, depois, por 100, assim procuramos o valor obtido na tabela de distribuição normal para termos o valor de Z. 45,0 100 %45 2 %90 n Zc cXcX X 18 Na tabela, buscamos o valor no centro e, ao encontrar, verificamos o seu correspondente na vertical e horizontal conforme abaixo: Tabela 5 – Áreas de uma distribuição normal padrão Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 Fonte: Adaptado de Costa Neto, S.d. Observação: Dividimos o nível de confiança por dois e isso sempre vai ocorrer, pois a tabela indicada acima mostra a metade da área sob a curva normal. Logo, para 0,45, temos um Z = 1,65. Agora, precisamos encontrar os demais valores para calcular c: = 3 kg 19 n= 64 = 68 kg Com o valor de c, determinamos o intervalo de confiança: Como vimos, quando trabalhamos com amostra, não representamos perfeitamente a população, logo sempre teremos o erro amostral. Não podemos evitar este erro, mas sim reduzi-lo, escolhendo uma amostra de tamanho adequado, pois quanto maior o tamanho da amostra, menor será o erro, e quanto menor a amostra, maior o erro. Com afórmula para calcular o erro amostral (c), podemos obter o tamanho da amostra isolando o n, obtendo: Exemplo 2: Uma pesquisa deseja estimar a renda média para o primeiro ano de trabalho de um contador. Que tamanho de amostra se deve ter para que, com uma probabilidade de 95% de confiança, sua estimativa não esteja a menos de R$ 500,00 da verdadeira média populacional? Suponha que o desvio padrão seja de R$ 6.250. O enunciado fornece os seguintes dados: = 6.250 c = 500 O primeiro passo é encontrar o valor de Z dividindo o nível de confiança por 2 e avaliando o valor encontrado na tabela: 475,0 100 %5,47 2 %95 Z = 1,96 Com os dados, aplicamos a fórmula para encontrar o tamanho da amostra: n Zc X 6188,0375,0.65,1 8 3 65,1 64 3 65,1 c cXcX 6188,0686188,068 6188,683812,67 n Zc 2 . c z n 2 . c z n 20 Desta forma, precisamos obter uma amostra de, ao menos, 600,25 entrevistados para termos 95% de confiança. TEMA 5 – TESTES DE HIPÓTESES De acordo com Pereira (2014), os testes de hipóteses têm a função de comparar as medidas obtidas de uma amostra com os dados da população. Essa comparação é importante para aferir se o valor amostral é correto ou não. Segundo Castanheira (2010), o teste de hipótese é uma técnica para se fazer inferência estatística. Por meio de um teste realizado com os dados de uma amostra, é possível inferir sobre a população a que essa amostra pertende. Esta técnica permite aceitar ou rejeitar a hipótese estatística, de modo que a hipótese estatística é uma suposição quanto ao valor de um parâmetro populacional. Temos dois tipos de hipóteses, a hipótese nula (H0), que é a hipótese a ser testada, e a hipótese alternativa (H1), que é qualquer hipótese diferente da hipótese nula ou qualquer hipótese que afirmeque a hipótese nula é falsa.O teste de hipótese coloca a hipótese nula em contraposição à hipótese alternativa. De acordo com Martins (2010), a hipótese nula expressa uma igualdade, enquanto a hipótese alternativa é dado por uma desigualdade. Exemplo1: Hipótese Nula (H0) H0= 50 Hipótese Alternativa (H1) H1 > 50 Podemos considerar outras hipóteses alternativas, como, H1 <50 e H1 ≠ 50. Quando realizamos um teste de hipótese, há dois tipos de erros. Podemos rejeitar a hipótese nula sendo ela verdadeira e, assim, temos o erro 2 500 6250.96,1 n 25,60025,24 2 500 12250 n 21 tipo I, ou aceitar a hipótese nula sendo ela falsa, cometendo o erro tipo II. No quadro abaixo, avaliamos os possíveis erros e acertos de uma decisão com base em um teste de hipótese. Quadro 1 – Erros e acertos em teste de hipótese Aceita-se a hipótese nula (H0) Rejeita-se a hipótese nula (H0) H0 é verdadeira Decisão foi correta Erro do tipo 1 H0 é falsa Erro do tipo 2 Decisão foi correta Fonte: Castanheira, 2010. A probabilidade de cometermos o erro do tipo I é designada por α (alfa) e chamamos de nível de significância do teste. Já a probabilidade de cometer o erro do tipo II é designada β (beta). Além das hipóteses e dos tipos de erros, temos as regiões de aceitação,nas quais a hipótese nula é aceita, e a região de rejeição, em que se rejeita a hipótese nula. De acordo com Castanheira (2010), para qualquer teste de hipóteses, devemos observar as seguintes etapas: 1. Enunciar a hipótese nula (H0) e a hipótese alternativa (H1); 2. Por meio de H1, definir o tipo de teste que será usado para testar H0; 3. Fixar o limite de erro (α); 4. Determinar a região de rejeição (RR) e a região de aceitação (RA), esta análise pode ocorrer em três situações: Figura 8 – Teste de hipótese (I) 22 Figura 9 – Teste de hipótese (II) Figura 10 – Teste de hipótese (III) 5. Calcular o estimador e verificar se ele se encontra na região de rejeição ou aceitação. Para realizar um teste para médias, podemos utilizar como estimador da média populacional a média amostral e calcular o teste Z de uma amostra dado por: Ou seja: sendo n o tamanho da amostra. 6. Decidir, se o estimador estiver na região de aceitação, aceitar H0; se o estimador estiver na região de rejeição, rejeitar H0. Exemplo 2:Uma população tem desvio padrão igual a 5 mm. Se uma amostra de 50 elementos, obtida dessa população, tem média igual a 46 mm, 23 podemos afirmar que a média dessa população é superior a 43 mm, ao nível de significância de 1%? Precisamos encontrar as hipótese nula (H0) e alternativa (H1), ou seja: H0= 43 mm H1 > 43 mm Precisamos fixar o limite de erro (α) que, no nosso exemplo, é de 1% = 0,01, ou seja: 0,50 – 0,01 = 0,49 Buscamos o valor encontrado na tabela de distribuição normal para encontrar o parâmetro z, conforme abaixo: Tabela 6 – Áreas de uma distribuição normal padrão Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 24 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 Fonte: Adaptado de Costa Neto. Logo, z = 2,33. Agora, definimos as regiões de aceitação (R.A) e rejeição (R.R): Figura 11 – Regiões de aceitação e rejeição Calcular o estimador e verificar se ele se encontra na região de rejeição ou aceitação: 46X µ = 43 σ = 5 n = 50 50 5 4346 z 07,7 5 3 z 24,4 707,0 3 z Para finalizar, comparamos o resultado encontrado com o valor de Z, assim, temos que 4,24 > 2,33. Dessa forma, rejeitamos H0, ou seja, a média é superior a 43 mm no nível e significância considerado. TROCANDO IDEIAS Você já participou de alguma pesquisa eleitoral? Após a participação, teve acesso aos resultados? Analisando os resultados, conseguimos identificar o 25 tamanho da amostra utilizada, o nível de confiança de tal pesquisa e o intervalo de confiança dos resultados apresentados. Vimos também as diferentes distribuições de probabilidade e suas aplicações, você se recorda de alguma aplicação utilizando as distribuições? NA PRÁTICA As Distribuições de Probabilidades podem ser utilizadas em várias situações. A Distribuição Binomial pode ser utilizada na escolha entre um produto bom ou defeituoso. A Distribuição de Poisson pode ser utilizada em chamadas telefônicas por unidade de tempo ou clientes chegando a uma fila para atendimento por minuto. Já a Distribuição Normal é uma das distribuições mais utilizadas e importantes, constituindo a base teórica de toda inferência estatística e pode ser utilizada em diferentes áreas. Vamos verificar alguns exemplos da utilização da Distribuição Normal na área financeira: Finanças e investimentos: <http://walterforte.blogspot.com.br/2010/04/dist ribuicao-normal-tambem-conhecida.html>; Análise de risco: <http://www.palisade-br.com/risk/risk_analysis.asp>. Também estudamos os conceitos de intervalo de confiança e teste de hipótese, que podemos utilizar em diferentes áreas e resolução de problemas. Vamos verificar uma aplicação que utiliza os intervalos de confiança: Case Seis Sigma: intervalos de confiança para avaliar variações <https://www.fm2s.com.br/case-seis-sigma-intervalos-confianca>. FINALIZANDO Nesta aula apresentamos as principais Distribuições de Probabilidades: Binomial, Poisson e Normal, os principais conceitos envolvendo Intervalo de Confiança e Teste de Hipóteses. 26 REFERÊNCIAS CASTANHEIRA, N. P. Estatística aplicada a todos os níveis. Curitiba: InterSaberes, 2012. LARSON, R.; FARBER, B. Estatística aplicada. 2.ed. São Paulo: Pearson, 2004. MARTINS, G. de A. Estatística geral e aplicada. 3. ed. São Paulo: Atlas, 2010. MORETTIN, L. G. Estatística básica: probabilidade e inferência. São Paulo: Pearson, 2010. PEREIRA, A. T. Métodos quantitativos aplicadosà contabilidade. Curitiba: InterSaberes, 2014.
Compartilhar