Baixe o app para aproveitar ainda mais
Prévia do material em texto
CCDD – Centro de Criação e Desenvolvimento Dialógico 1 Estatística Aplicada às Análises Contábeis Aula 5 Profa. Claudia Lorena Juliato Araújo CCDD – Centro de Criação e Desenvolvimento Dialógico 2 Conversa Inicial Estabelecer níveis de confiança para delimitar resultados seguros, além de supor possíveis resultados com base em dados já estabelecidos. Nesta rota de aprendizagem, vamos trabalhar com intervalos de confiança e testes de hipóteses, além da delimitação de amostras, de suma importância para a confiabilidade dos resultados de pesquisas. Contextualizando Saber se os resultados de uma pesquisa são confiáveis ou se estão dentro dos parâmetros de aceitabilidade é de suma importância para que um conjunto de resultados tenha credibilidade. A suposição de valores e a delimitação de uma amostragem correta também fazem parte de resultados aceitáveis e seguros na interpretação correta dos dados e dos resultados alcançados com as pesquisas. Os intervalos de confiança, os testes de hipóteses e o dimensionamento das amostras são ferramentas para dar credibilidade aos resultados de dados estatísticos. CCDD – Centro de Criação e Desenvolvimento Dialógico 3 Mas o que é intervalo de confiança? E o que é teste de hipóteses? Os intervalos de confiança e os testes de hipóteses constituem um ingrediente essencial para a tomada de decisões estatísticas. Basicamente, esses conceitos trabalham com dados que fornecerão confiabilidade para os valores encontrados nas pesquisas e nos resultados estatísticos. Os intervalos de confiança, assim como os testes de hipóteses, estão intimamente associados à curva normal, sendo ela a base e a estruturação desses conceitos. Podemos ter intervalos de confiança e testes de hipóteses para variáveis discretas e contínuas, aos quais chamaremos de intervalos de confiança e testes de hipóteses para médias e para proporção, respectivamente. Pesquise Pesquise sobre intervalos de confiança, testes de hipóteses e dimensionamento de amostra. Agora, responda: Qual a importância dos intervalos de confiança para a credibilidade de uma pesquisa? E dos testes de hipóteses? CCDD – Centro de Criação e Desenvolvimento Dialógico 4 Tema 1 – Intervalo de Confiança para Médias Um intervalo é um limite entre dois valores. Um intervalo de confiança é um limite entre dois valores onde se encontra a quantidade de valores confiáveis para uma determinada amostra estudada. Seu uso se dá pela importância de analisar a confiabilidade dos valores que estão sendo analisados. Quanto menor o intervalo de confiança, maior a confiabilidade dos resultados. Podemos calcular um intervalo de confiança para dois casos diferentes: quando o desvio padrão populacional é conhecido e quando o desvio padrão amostral é desconhecido. Quando o desvio padrão é conhecido, calculamos o valor do intervalo de confiança usando a tabela z da curva normal. Quando o desvio padrão é desconhecido, calculamos o valor do intervalo de confiança usando a tabela t de Student. DESVIO PADRÃO CONHECIDO IC = �̅� ± 𝒛 . 𝝈 √𝒏 Tabela z da curva normal DESVIO PADRÃO DESCONHECIDO IC = �̅� ± 𝒕 . 𝝈 √𝒏 Tabela t de Student Tabela z da curva normal: CCDD – Centro de Criação e Desenvolvimento Dialógico 5 Tabela t de Student: CCDD – Centro de Criação e Desenvolvimento Dialógico 6 Obs.: G.L (graus de liberdade) = n – 1 Vejamos alguns exemplos de intervalos de confiança para médias com desvio padrão conhecido e para desvio padrão desconhecido. CCDD – Centro de Criação e Desenvolvimento Dialógico 7 1) O tamanho médio de certa peça é de 19,9 cm com desvio padrão de 5,73 cm. O gerente do setor dessa indústria tomou uma amostra de 36 peças para verificar a padronização dela. Construa um intervalo de confiança de 95%. Solução: Trata-se de um intervalo de confiança com desvio padrão conhecido, logo utilizaremos a tabela z da curva normal. Como o intervalo é de 95%, teremos 47,5% de área para cada lado da curva e o valor a ser buscado na tabela z é de 0,4750 no meio da tabela. Esse valor nos fornece um escore reduzido de 1,96. Então, o intervalo será: IC = 19,9 ± 5,73 √36 IC = (18,02 ; 21,77) 2) De um determinado paciente são tomadas 24 amostras de sua pressão arterial ao longo de certo dia, hora a hora. Os resultados estão apresentados na tabela a seguir. Determine um intervalo de confiança de 99%. 112 107 109 105 98 96 100 114 115 112 110 108 98 97 98 100 102 105 103 104 98 97 99 100 Solução: Trata-se de um intervalo de confiança com desvio padrão desconhecido. Nesse caso, utilizaremos a tabela t de Student. Calculando a média e o desvio padrão, teremos 103,625 para média e 5,96 para o desvio padrão. Com 99% de confiança e G.L = n – 1 = 24 – 1 = 23, teremos um t = 2,5. Então, o intervalo será de: CCDD – Centro de Criação e Desenvolvimento Dialógico 8 IC = 19,9 ± 5,73 √36 IC = (18,02 ; 21,77) O intervalo de confiança de 99% é uma variação de 18,02 cm a 21,77 cm para essas peças. Tema 2 – Intervalo de Confiança para Proporção e Taxa No intervalo de confiança para proporção, o que muda é o tipo da variável. Intervalo de confiança para proporção No caso de intervalo de confiança para proporção, o tipo da variável é o que muda. Ao contrário do intervalo de confiança para proporção, no qual a variável é contínua, ou seja, vem de um processo de medição, aqui a variável é discreta, ou seja, vem de um processo de contagem. Mais ainda, é uma variável que se estabelece dentro de uma probabilidade. Nesse caso, estamos trabalhando com uma variável do tipo probabilidade e esta é a média da proporção. p̅ = x n O desvio padrão nesse caso é dado por: Sp̅ = √ p̅.q̅ n Em que q̅ = 1 - p̅ CCDD – Centro de Criação e Desenvolvimento Dialógico 9 E o intervalo de confiança para proporção fica: IC = p̅ ± z . √ p̅. q̅ n Vejamos um exemplo. 1) Em uma amostra aleatória de 600 itens, observou-se que 58 deles tinham algum tipo de não conformidade. Determine um intervalo com 95% de confiança. Solução: Estamos trabalhando com 47,5% de área para cada lado, e, nesse caso, o valor de z na tabela da curva normal é de z = 1,96. Precisamos calcular o desvio padrão, mas, para isso, precisamos da média. Vejamos todos os elementos de que precisamos, então: p̅ = 58 600 = 0,0967 q̅ = 1 – 0,0967 = 0,9033 Sp̅ = √ 0,0967.0,9033 600 = 0,012066 IC = 0,0967 ± 1,96 . √ 0,0967.0,9033 600 IC = ( 0,07305; 0,1203 ) CCDD – Centro de Criação e Desenvolvimento Dialógico 10 Logo, o intervalo de confiança para peças com não conformidades será de 7,3% a 12,03%. Intervalo de Confiança para Taxa No caso de intervalo de confiança para taxa, a variável é do tipo da distribuição de Poisson, ou seja, uma variável que ocorre como uma taxa de variação. Estamos falando da ocorrência de um evento por unidade de medida ou por unidade de tempo, e representamos essa variável por λ. A ocorrência de um evento por unidade de tempo ou de medida é a média. Seu desvio padrão é dado por: √ λ n O intervalo de confiança para taxa é dadopor: IC = λ ± z . √ λ n Vejamos um exemplo. 1) No processo de fabricação de portas de um certo automóveis, 81 peças foram escolhidas aleatoriamente para verificação de quantas não conformidades apareciam em cada peça. Construa um intervalo de 95% de confiança para a quantidade de defeitos por peça. Os defeitos por porta são dados a seguir: 1 2 0 2 2 0 0 1 1 CCDD – Centro de Criação e Desenvolvimento Dialógico 11 2 2 1 1 0 2 1 0 1 3 1 1 0 0 0 1 0 2 0 0 1 1 0 1 1 0 2 0 2 1 2 2 1 2 2 3 1 1 2 1 1 1 2 1 1 1 2 2 2 2 3 2 1 1 2 0 2 1 1 3 3 2 0 2 3 2 2 2 2 2 2 0 A média λ será 106 81 = 1,31 A confiança de 95% é dada pelo escore reduzido de 1,96 da tabela z. Então o intervalo de confiança será de: IC = 1,31 ± 1,96 . √ 1,31 81 IC = (1,06; 1,56) Logo, o intervalo com 95% de confiança para as não conformidades por peça produzida é de 1,06 a 1,56 não conformidades por peça. Tema 3 – Dimensionamento de Amostra CCDD – Centro de Criação e Desenvolvimento Dialógico 12 Para que os resultados de uma pesquisa tenham um alto grau de confiabilidade, é importante sabermos dimensionar a amostra com a qual se vai estudar. Os bons e confiáveis resultados de uma pesquisa dependem de vários fatores, dentre eles de um bom dimensionamento da amostra. Quanto mais confiável a amostragem, melhores serão os resultados obtidos com as estatísticas em questão. A amostra é um subconjunto da população. Para que uma amostra tenha significado e possa representar uma população, seus elementos devem ter a mesma chance de ocorrência que os da população. O método que escolhe os elementos de uma população que pertencerão a uma amostra é denominado de Método da Amostragem Probabilística, que consiste em selecionar indivíduos da população de forma que todos eles tenham a mesma chance de ocorrência. Como uma amostra não representa em todos os seus efeitos uma população em toda a sua integridade, devemos considerar uma margem de erro de representatividade. Esse erro é chamado de Erro Amostral. Podemos determinar o tamanho de uma amostra em quatro situações diferentes: CCDD – Centro de Criação e Desenvolvimento Dialógico 13 Para essas quatro situações, temos as seguintes fórmulas para seus respectivos cálculos. Determinação da amostra para média com população infinita ou desconhecida. n = ( z .σ e ) 2 Determinação de amostra com base na média com população conhecida com população desconhecida Determinação de amostra com base na proporção com população conhecida com população desconhecida CCDD – Centro de Criação e Desenvolvimento Dialógico 14 Determinação da amostra para média com população finita ou conhecida. 𝐧 = 𝐍 . 𝐳𝟐 . 𝛔𝟐 (𝐍 − 𝟏). 𝐞𝟐 + 𝛔𝟐. 𝐞𝟐 Determinação da amostra para proporção com população infinita ou desconhecida. 𝐧 = 𝒛𝟐. �̅�. �̅� 𝒆𝟐 Determinação da amostra para proporção com população finita ou conhecida. 𝐧 = 𝐍 . �̅� . �̅� . 𝐳𝟐 �̅� . �̅� . 𝐳𝟐 + (𝐍 − 𝟏). 𝐞𝟐 Em que: n = amostra N = população z = escore reduzido da tabela normal σ = desvio padrão populacional e = erro amostral �̅� = média amostral da proporção �̅� = 1 − �̅� Vejamos alguns exemplos práticos. 1) Uma pesquisa pretende ser realizada para determinar os gastos com lazer das famílias dos funcionários de uma empresa. O responsável pela pesquisa deseja ter 95% de confiança de que a média da amostra está no máximo com um erro de ± R$ 75,00 da média real dos gastos com lazer dessas famílias. Um estudo prévio indica que o desvio padrão pode ser igual a R$ 520,00. Nessas condições, qual o tamanho da amostra necessária? Solução: 95% equivale a um escore reduzido de z = 1,96 e = 75 CCDD – Centro de Criação e Desenvolvimento Dialógico 15 σ = 520 Nessas condições e sabendo que a população é desconhecida, teremos: 𝐧 = ( 1,96 . 520 75 ) 2 = 𝟏𝟖𝟒, 𝟔𝟕 Para uma pesquisa confiável, será necessário entrevistar 184 pessoas. 2) Em uma população de 2000 pessoas, sabe-se que a média proporcional é de 75%, com erro amostral de 5%. Determine uma amostra segura com 90% de confiança. Solução: 90% equivale a um escore reduzido de z = 1,645 e = 5% = 0,05 N = 2000 �̅� = 0,75 �̅� = 1 − 0,75 = 0,25 Nessas condições, teremos: 𝐧 = 𝟐𝟎𝟎𝟎 . 𝟎, 𝟕𝟓 . 𝟎, 𝟐𝟓 . 𝟏, 𝟔𝟒𝟓𝟐 𝟎, 𝟕𝟓 . 𝟎, 𝟐𝟓 . 𝟏, 𝟔𝟒𝟓𝟐 + (𝟐𝟎𝟎𝟎 − 𝟏). 𝟎, 𝟎𝟓𝟐 = 𝟏𝟖𝟒, 𝟑𝟑 Logo, uma amostragem segura para essa pesquisa será de 184 indivíduos. Tema 4 – Testes de Hipóteses para Médias CCDD – Centro de Criação e Desenvolvimento Dialógico 16 É verdadeiro ou falso? Os testes de hipóteses fazem parte da Estatística Inferencial e servem para avaliar se determinada afirmação sobre os parâmetros da população também servem para seus valores amostrais. Em geral, os testes de hipóteses servem para verificar se, a partir de valores considerados padrão, novos dados amostrais se adequam ou não aos tomados como certos e verdadeiros. Para isso, devemos estabelecer as chamadas hipóteses nula e alternativa. A hipótese nula (H0) é a hipótese da igualdade entre o valor a ser testado e o valor padrão. Chama-se hipótese nula, pois o princípio é que não haja diferença entre a média padrão e a da amostra estudada. A hipótese alternativa (H1) é a hipótese que irá ser contraposta, é a possibilidade da não veracidade da hipótese nula. Pode ser valor maior, menor ou diferente do valor padrão. H0 : μ=μ μ >μ H1 : μ<μ μ≠μ CCDD – Centro de Criação e Desenvolvimento Dialógico 17 Além das hipóteses nula e alternativa, um teste de hipótese é composto das regiões críticas chamadas de aceitação e de rejeição. São essas regiões que decidirão se um teste de hipótese terá sua hipótese nula aceita ou não. As regiões de aceitação e de rejeição são delimitadas pelo z crítico, valor este na tabela z da curva normal de acordo com a confiança estabelecida. Também há de ser considerado o teste em si, que é o valor que será estabelecido entre o que é padrão e o que se está sendo testado. Esse cálculo é chamado de z teste e dado por fórmula específica. Zteste = média amostral − média populacional desvio padrão √n Feito isso, devemos verificar dentro das regiões de aceitação e de rejeição onde o valor do z teste se encaixa. Se ele se encaixar na área de aceitação, concluímos que H0 é verdadeiro. Se cair na região de rejeição, concluímos que H0 é falso. Quando H0 é verdadeira e a rejeitamos, cometemos um erro do Tipo I, se H0 é falsa e aceitamos, cometemos um erro Tipo II. A saber: H0 Verdadeiro H0 Falso Aceitar H0 Conclusão Erro Tipo II CCDD – Centro de Criação e Desenvolvimento Dialógico 18 correta Rejeitar H0 Erro Tipo I Conclusão correta Após todas essas verificações, podemos afirmar se os valores amostrais se adequam aos valores padrão ou não, podendo encerrar a interpretação do teste de hipótese. Em resumo, é possível colocarmos os passos para a formulação de um teste de hipótese. 1º) Formular H0 e H1. 2º) Determinar o valor crítico (valor de z na tabela). 3º) Delimitar as regiões de aceitação e de rejeição. 4º) Calcular z teste. 5º) Aceitar ou rejeitar H0. Vejamos algunsexemplos práticos. 1) Um comprador de peças acha que estas já não possuem a mesma qualidade, pois o tamanho médio delas sempre foi de 100 mm com desvio padrão de 5 mm. Uma amostra de 100 peças, escolhidas ao acaso, acusou tamanho médio de 98 mm. Ao nível de significância de 5%, pode-se afirmar que o tamanho médio das peças diminui? Solução: Seguindo os passos para formulação de um teste de hipótese: 1º) H0 : média = 100 mm H1 : média < 100 mm 2º) Como a significância é de 5%, a confiança é de 95%. Para isso, temos um escore reduzido z de 1,96. CCDD – Centro de Criação e Desenvolvimento Dialógico 19 3º) 4º) Calcular z teste: Zteste = 98 − 100 5 √100 = −4 5º) – 4 está dentro da área de rejeição, logo H0 é falso. Tema 5 – Teste de Hipótese para Proporção Uma proporção é uma parte de um contexto maior. Os testes de hipóteses para proporção, em sua essência, têm a mesma base que os testes de hipóteses para médias. Nesse caso, a diferença é no tipo de variável. As hipóteses continuam as mesmas: Região de Rejeição Região de Aceitação -1,96 CCDD – Centro de Criação e Desenvolvimento Dialógico 20 H0 : p̅=p p̅ >p H1 : p̅<p p̅≠p A região crítica também será delimitada da mesma forma, com o valor de significância subtraído de 100% e procurando-se o valor no centro da tabela z. A delimitação das regiões de aceitação e de rejeição também fica a mesma. Em sua essência, a fórmula do z teste permanece muito parecida, vejamos: Zteste = p̅ − p √ p . q n Vejamos alguns exemplos práticos. 1) Pesquisa revela que 85% dos usuários de certa marca são fiéis a esta. Amostra de 200 pessoas selecionadas ao acaso acusou uma fidelidade no produto de 162 pessoas. A um nível de 5%, podemos dizer que a afirmação da pesquisa inicial é verdadeira? Solução: 1º) H0 : p = 0,85 H1 : p < 0,85 p̅ = 162/200 = 0,81 2º) Com significância de 5%, tem-se uma confiança de 95% que na tabela z equivale a um valor de z de 1,96. CCDD – Centro de Criação e Desenvolvimento Dialógico 21 3º) 4º) Calcular z teste: Zteste = 0,81 − 0,85 √0,85 . 0,15 200 = −1,58 5º) -1,58 está dentro da área de aceitação, logo H0 é verdadeiro e a pesquisa inicial procede. Trocando Ideias Que tal agora você se aventurar pelo dimensionamento de amostra e buscar outras formas de dimensionar uma amostragem a partir de uma população conhecida? São várias as formas de determinar o tamanho de uma amostra. Procure essas formas diferentes. Síntese Nesta rota de aprendizagem, você conheceu um pouco sobre aplicações da curva normal, com os conceitos de intervalo de confiança, testes de hipóteses e dimensionamento de amostra. Vimos que muitos estudos estatísticos se baseiam e têm como base a curva normal. Para se ter a certeza de que os dados serão de confiabilidade, é importante conhecer uma boa amostragem. A verificação de que esses dados se fundamentam ou não Região de Aceitação -1,96 Região de Rejeição CCDD – Centro de Criação e Desenvolvimento Dialógico 22 também é de suma importância. Essas constatações são feitas por meio dos testes de hipóteses. CCDD – Centro de Criação e Desenvolvimento Dialógico 23 Referências COSTA, G. G de O. Curso de estatística básica: teoria e prática. São Paulo: Atlas, 2011. SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993. BUSSAB, W.; MORETTIN, P. Estatística básica. São Paulo: Saraiva, 2002. DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 2006. LEVIN, J. Estatística aplicada a ciências humanas. São Paulo: Harbra, 1985.
Compartilhar