Baixe o app para aproveitar ainda mais
Prévia do material em texto
13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niWg… 1/39 introdução Introdução Os testes de hipótese são ferramentas para avaliar uma suposição com relação a um parâmetro populacional com base em dados amostrais. Esses testes podem ser aplicados na média, no desvio-padrão ou na proporção de casos dentro de uma população. Para a aplicação correta dos testes, devemos avaliar as informações conhecidas e que tipo de informação queremos avaliar. Nesta unidade, estudaremos os intervalos de con�ança para a proporção, quando as opções de escolha dentro de uma população são apenas duas e quando existem mais grupos de valores. INFERÊNCIA ESTATÍSTICAINFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESES PARATESTES DE HIPÓTESES PARA PROPORÇÃO E VARIÂNCIA:PROPORÇÃO E VARIÂNCIA: CORRELAÇÃO LINEARCORRELAÇÃO LINEAR Autor: Dr. Bruno Henrique Ol iveira Mul ina Revisor: Antonio Gomes de Mattos Neto INICIAR 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niWg… 2/39 Também veremos a aplicação desses testes para a variância populacional. Além disso, veremos como avaliar as relações entre duas variáveis, de modo a identi�car se existe essa relação, tanto sob o ponto de vista da relação da variação, quanto na possibilidade de estimar o valor de uma variável com base no valor de outra. 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niWg… 3/39 Entre as diversas ferramentas existentes na estatística, os testes de hipótese nos permitem tomar decisões com relação a uma suposição de um parâmetro da população com base em dados obtidos em uma amostra. Ela possibilita constatar se os dados contidos na amostra possuem relação ou não com uma hipótese estática formulada. Para aplicar o teste de hipótese, devemos selecionar o parâmetro da população de interesse, tais como a média 𝜇, o desvio-padrão 𝜎 ou a proporção ρ, pois é um aspecto fundamental da inferência e da análise estatística. Para testar hipóteses, primeiramente, fazemos suposições no que diz respeito às características desconhecidas da população. De�nidos a suposição e o parâmetro a ser avaliado, extraímos uma amostra aleatória da população e, com base nas características amostrais correspondentes, aplicamos uma estatística compatível, em seguida, com base nos resultados obtidos, aceitamos ou rejeitamos as hipóteses de acordo com o grau de con�ança escolhido. Para isso, devemos determinar uma con�ança nos testes IC, que determinam a probabilidade de acerto, e uma signi�cância α, que está relacionada à probabilidade de erro. O índice de con�ança e a signi�cância são complementares, ou seja, IC=1- α. Os testes de hipóteses são avaliados por meio de duas hipóteses: uma nula , relacionada à suposição que desejamos con�rmar; e uma alternativa , que nega a condição da hipótese nula. Por exemplo, se queremos testar a igualdade na hipótese nula, a hipótese alternativa avaliará a chance da diferença dos valores. São duas as de concluir com relação à hipótese: por meio da região crítica e por meio da função poder (ou p-valor). A decisão por meio da região crítica é realizada destacando os intervalos nos quais as hipóteses nula e alternativa ocorrem e, por meio da comparação com o valor obtido pelas estatísticas, podemos dizer qual a hipótese a ser aceita. Já por meio do p-valor, calculamos o poder da amostra e, se for menor que a signi�cância, devemos rejeitar a hipótese nula. Existem também dois tipos de erros quando se testam hipóteses: o tipo I , quando rejeitamos a hipótese nula quando de fato é verdadeira; e o tipo II , quando aceitamos uma hipótese nula como sendo falsa. Isso acontece porque os valores aplicados nos testes possuem uma margem de con�ança, que podem motivar uma análise incorreta dos dados. Podemos controlar a probabilidade de acontecer um erro tipo I por meio da signi�cância α aplicada aos testes. Entretanto, reduzindo α, temos maior probabilidade de acontecer o erro de tipo II, 𝛽, a não ser que o tamanho da amostra aumente. Apresentação Sobre osApresentação Sobre os Testes de HipóteseTestes de Hipótese 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niWg… 4/39 A seguir, veremos o desenvolvimento dos testes para análise da proporção populacional para distribuições com condições binomiais e para comparação entre as proporções dos elementos em duas amostras. 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niWg… 5/39 Em muitos casos, não é de interesse saber sobre o valor dos elementos que participam de uma amostra, mas a proporção de elementos que se enquadram em uma determinada condição. Quando se deseja avaliar acerca de uma suposição com relação à proporção populacional, deve-se aplicar um teste de hipótese para a proporção. Por exemplo, em uma pesquisa realizada em determinado município brasileiro, deseja-se veri�car a proporção de motoqueiros que utilizam capacete cotidianamente. Na pesquisa realizada com 400 motoqueiros, 174 a�rmaram que fazem uso cotidianamente do capacete. Podemos dizer então que menos da metade dos motoqueiros não usa capacete? Para responder a isso, devemos aplicar uma estatística que permita inferir com relação à população. Como a questão levantada se refere a responder à pergunta acerca da proporção de motoqueiros, aplicamos um teste de hipótese para a proporção. Para isso, devemos, antes, considerar que a distribuição dos elementos dentro da amostra segue uma distribuição normal. Segundo, a amostra segue uma distribuição binomial, ou seja, existem duas possibilidades de valor para os elementos da população, uma considerada verdadeira e outra falsa. Nesse caso, os valores são usar capacete e não usar capacete. Terceiro, vamos de�nir que a probabilidade se refere à proporção do evento que estamos avaliando, e , à proporção do evento complementar, de modo que . Feito isso, devemos avaliar a suposição levantada. No caso do nosso exemplo, a pergunta foi sobre menos da metade dos motoqueiros usar capacete. Então, a hipótese nula será: Teste de hipóteses daTeste de hipóteses da Proporção Amostral paraProporção Amostral para uma População Normaluma População Normal p̂ q̂ + = 1p̂ q̂ { : p < 0, 5H0 : p ≥ 0, 5H1 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niWg… 6/39 Agora que de�nimos todos os parâmetros necessários, aplicamos as estatísticas relacionadas a esse teste. Caso o número de acertos e de erros seja maior que 5, podemos aplicar a distribuição normal para responder à hipótese. Os valores da distribuição normal podem ser observados na Tabela 4.1. ref lita Re�ita Deve-se prestar atenção nas suposições. No exemplo, é questionado sobre os valores serem “menores que”. Por isso, a condição de igualdade foi para a hipótese alternativa. Caso a pergunta fosse “no máximo”, signi�caria que se metade dos motoqueiros usasse capacete, estaria incluída na suposição a ser avaliada, ou seja, na hipótese nula. Fonte: Barbosa (2014). 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niWg… 7/39 α=a+b a 0,000 0,001 0,002 0,003 0,004 0,005 0,006 0,007 0,008 0,009 b 0,000 - 3,090 2,878 2,748 2,652 2,576 2,512 2,457 2,409 2,366 0,010 2,326 2,290 2,257 2,226 2,197 2,170 2,144 2,120 2,097 2,075 0,020 2,054 2,034 2,014 1,995 1,977 1,960 1,943 1,927 1,911 1,896 0,030 1,881 1,866 1,852 1,838 1,825 1,812 1,799 1,787 1,774 1,762 0,040 1,751 1,739 1,728 1,717 1,706 1,695 1,685 1,675 1,665 1,655 0,050 1,645 1,6351,626 1,616 1,607 1,598 1,589 1,580 1,572 1,563 0,060 1,555 1,546 1,538 1,530 1,522 1,514 1,506 1,499 1,491 1,483 0,070 1,476 1,468 1,461 1,454 1,447 1,440 1,433 1,426 1,419 1,412 0,080 1,405 1,398 1,392 1,385 1,379 1,372 1,366 1,359 1,353 1,347 0,090 1,341 1,335 1,329 1,323 1,317 1,311 1,305 1,299 1,293 1,287 0,100 1,282 1,276 1,270 1,265 1,259 1,254 1,248 1,243 1,237 1,232 0,110 1,227 1,221 1,216 1,211 1,206 1,200 1,195 1,190 1,185 1,180 0,120 1,175 1,170 1,165 1,160 1,155 1,150 1,146 1,141 1,136 1,131 0,130 1,126 1,122 1,117 1,112 1,108 1,103 1,098 1,094 1,089 1,085 0,140 1,080 1,076 1,071 1,067 1,063 1,058 1,054 1,049 1,045 1,041 0,150 1,036 1,032 1,028 1,024 1,019 1,015 1,011 1,007 1,003 0,999 0,160 0,994 0,990 0,986 0,982 0,978 0,974 0,970 0,966 0,962 0,958 0,170 0,954 0,950 0,946 0,942 0,938 0,935 0,931 0,927 0,923 0,919 0,180 0,915 0,912 0,908 0,904 0,900 0,896 0,893 0,889 0,885 0,882 0,190 0,878 0,874 0,871 0,867 0,863 0,860 0,856 0,852 0,849 0,845 0,200 0,842 0,838 0,834 0,831 0,827 0,824 0,820 0,817 0,813 0,810 0,210 0,806 0,803 0,800 0,796 0,793 0,789 0,786 0,782 0,779 0,776 0,220 0,772 0,769 0,765 0,762 0,759 0,755 0,752 0,749 0,745 0,742 0,230 0,739 0,736 0,732 0,729 0,726 0,722 0,719 0,716 0,713 0,710 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niWg… 8/39 Tabela 4.1 - Valores de Z para P<0,3 Fonte: Elaborada pelo autor. Para ler a Tabela 4.1, temos, na primeira linha e na primeira coluna, os valores da probabilidade de Z, enquanto, no centro dela, temos os valores de Z. Por exemplo, se quisermos saber o valor de Z para uma signi�cância de α=0,133, basta que localizemos a linha que possui o valor 0,13, e a coluna 0,003. Vendo o cruzamento desses dados, temos Z(0,133) = 1,112. Se desejarmos o valor de P(z=1,458), basta que esse valor (ou o mais próximo) seja localizado no meio da Tabela 4.1, e o valor de P(z) é obtido nas primeiras linhas e na primeira coluna. Ou seja, P(z=1,458) = 0,073. Para nosso exemplo, temos o número de acertos (referente a não usar capacete) igual a 174 e de erros (motoristas que usam capacete) igual a 226. Haja vista o número de acertos e de erros ser maior que 5, podemos aplicar a distribuição normal para nossas estatísticas. Vamos avaliar todos os parâmetros necessários para a aplicação do teste de hipótese. Temos o p como a proporção amostral de motoqueiros que não usam capacete, ou seja, , é a proporção da população que queremos avaliar, ou seja, . Teste de Hipótese da Proporção Aplicando a Região Crítica De acordo com a hipótese levantada, podemos distinguir as regiões críticas com base na signi�cância desejada. Vamos considerar que a signi�cância a ser aplicada será de 5%. Por meio do teorema do Limite Central, podemos destacar as regiões de comparação conforme mostrado na Figura 4.1. Figura 4.1 - Condições a serem avaliadas no teste de hipótese da proporção Fonte: Elaborada pelo autor. Conforme a hipótese nula desejada, a região crítica referente à signi�cância será disposta como mostra a Figura 4.2. 0,240 0,706 0,703 0,700 0,697 0,693 0,690 0,687 0,684 0,681 0,678 0,250 0,674 0,671 0,668 0,665 0,662 0,659 0,656 0,653 0,6505 0,646 = 174/400 = 0, 435p̂ p0 = 0, 5p0 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niWg… 9/39 Figura 4.2 - Construção das regiões críticas para a hipótese levantada Fonte: Elaborada pelo autor. A normalização dos valores da amostra, necessária para a disposição nos intervalos de valores, devemos aplicar a estatística: Para nosso exemplo, aplicando os valores obtidos anteriormente, temos: Agora, devemos obter o valor-limite da região crítica. Consultando a Tabela 4.1, vemos que Z(0,05)=1,64. Observando a Figura 4.2, vemos que esse valor deve ser negativo. Se o valor normalizado for menor que -1,64, ele está presente na hipótese nula, e menos da metade dos motoqueiros usa capacete. Se o valor normalizado for maior, não temos indícios para dizer que menos da metade usa. Figura 4.3 - Disposição do valor normalizado com relação às hipóteses Fonte: Elaborada pelo autor. Veja que a Figura 4.3 apresenta o resultado obtido, mostrando que o valor normalizado está na região relativa à hipótese nula. Teste de Hipótese da Proporção Aplicando p- Valor = (1)Zobs p − p0 × po q0 n − −−−− √ = = = − 2, 6Zobs p − p0 × po q0 n − −−−− √ 0, 435 − 0, 5 05 ×0,5 400 − −−−− √ 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 10/39 Outro método de responder com relação à suposição levantada é aplicando o p-valor da amostra. Para isso, devemos, inicialmente, alterar a disposição das amostras para que a condição de igualdade esteja obrigatoriamente na hipótese nula, ou seja, as hipóteses do nosso exemplo serão: Agora, consultaremos a probabilidade Z que forneça o valor normalizado da amostra. Como já foi calculado anteriormente, a mudança nas hipóteses não altera o tamanho da signi�cância (ela continua unicaudal), podemos, então, usar o valor normalizado anteriormente, ou seja, devemos buscar (P(z=-2,6)). Como a distribuição normal é simétrica, (P(z=-2,6)) = (P(z=2,6)). Consultando o Tabela 4.1, temos que p-valor=(P(z=2,6))≈0,045. Como a signi�cância adotada (α=0,05) é maior que o p-valor, podemos dizer que a hipótese alternativa é válida, ou seja, a proporção é menor que 0,5 praticar Vamos Praticar Um cientista quer saber se a fração dos experimentos que falham é de 1 em 10. Para avaliar sua dúvida, ele realiza 200 experimentos, sendo que 24 deles deram errado. Considerando que a signi�cância aplicada é de 5%, assinale a alternativa que contém o valor normalizado, o p-valor do teste e a conclusão que o cientista poderá tirar. a) Zobs=0,943; p-valor = 0,173 e a taxa de erro é igual a 0,1. b) Zobs=1,96; p-valor = 0,05 e a taxa de erro é diferente de 0,1. c) Zobs =-0,943; p-valor = 0,05 e a taxa de erro é diferente de 0,1. d) Zobs=-1,96; p-valor = 0,173 e a taxa de erro é igual a 0,1. e) Zobs=-0,943; p-valor = -0,173 e a taxa de erro é diferente de 0,1. { : p ≥ 0, 5H0 : p < 0, 5H1 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niWg… 11/39 Vimos antes como comparar o valor da proporção de uma amostra com um valor exato por meio de um teste de hipótese. Agora, se quisermos comparar o valor de duas amostras, aplicamos uma estatística diferente. Se as duas populações são normalmente distribuídas e independentes, respeitando os critérios do número de acertos e de erros dentro de cada uma das amostras, então, a distribuição amostral da diferença entre as proporções e médias amostrais é normal ou aproximadamente normal. Considera-se que os eventos sejam de�nidos por meio de duas possibilidades, que podemos de�nir como e , as proporções do evento a ser avaliado, e como e , as proporções dos eventos que não são de interesse, lembrando que e e são os tamanhos das duas amostras. É importante que, ao levantar uma suposição, seja de�nido de forma clara quem é a amostra 1 e a amostra 2, sob o risco de avaliar a hipótese, principalmente no caso dos testes aplicando a região crítica serem equivocados. Teste de Hipótese para Comparação da Proporção Binomial Uma distribuição binomial é aquela em que os elementos podem assumir duas condições: verdadeiro, quando condiz com a condição avaliada, ou falsa, para as demais condições. Caso queira comparar amostras em que as proporções não podem ser tratadas apenas por duas condições, aplicamos outro tipo de teste, como veremos a seguir. Teste de Hipótese para Comparação da Proporção Binomial Aplicando a Região Crítica Para aplicar o teste de hipótese por meio da região crítica, devemos de�nir as hipóteses. Sempredevemos ter cuidado nessa etapa, para que possa traduzir as suposições em hipóteses corretas. A normalização necessária para a aplicação dos testes de hipótese é realizada por meio da expressão: Teste de ComparaçãoTeste de Comparação para a Proporçãopara a Proporção PopulacionalPopulacional p1 p2 q1 q2 + = 1p1 q1 n1 n2 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 12/39 A de�nição da região crítica é feita do mesmo modo que a realizada com a aplicação de uma amostra. Deve-se observar se a hipótese é bicaudal (igualdade), em que a signi�cância é dividida por dois, ou unicaudal, em que a signi�cância está concentrada em uma única cauda. Feito isso, devemos obter os valores-limite da região crítica e localizar o valor normalizado dentro de um dos intervalos, além de responder com relação à suposição. Por exemplo, em uma pesquisa de intenção de votos com 1000 eleitores, o candidato A obteve 23% das intenções. Uma semana depois, em outra pesquisa, com 500 eleitores, o mesmo candidato apresentou 20% das intenções. Adotando que a signi�cância nas análises seja de 5%, é possível dizer que houve redução nos eleitores desse candidato? Então, para resolver esse problema, a primeira etapa é a de�nição da hipótese e os parâmetros conhecidos. De�niremos que a primeira pesquisa fornece os dados p1=0,23; q1=1-0,23=0,77 e n1=1000, e a segunda amostra fornece p2=0,2, q2=1-0,2=0,8 e n2=500. Como a suposição é de redução na proporção da primeira pesquisa para a segunda, as hipóteses levantadas serão: Por ser um teste de maior, então é unicaudal. Aplicando a estatística para a normalização dos dados amostrais: Com base na Tabela 4.1, o limite da região crítica é Z(0,05)=1,64. Por meio da Figura 4.4, vemos que o valor-limite deve ser negativo, ou seja, a região da hipótese nula é de�nida para z<-1,64, enquanto, para a hipótese alternativa, temos o intervalo z > -1,64. A partir das hipóteses, podemos de�nir as regiões críticas e dispor o valor normalizado Zobs, como mostrado na Figura 4.4. O valor normalizado está localizado na região da hipótese nula, ou seja, p2 é menor que p1. Teste de Hipótese para Comparação da Proporção Binomial Aplicando o p-Valor Para calcular o teste por meio do p-valor, temos que inverter as hipóteses, isto é, a hipótese a ser testada será: = (2)Zobs − p1 p2 +×p1 q2 n1 ×p2 q2 n2 − −−−−−−−−− √ { : <H0 p1 p2 : ≥H1 p1 p2 = = = 1, 345Zobs − p1 p2 + × p1 q2 n1 × p2 q2 n2 − −−−−−−−−−− √ 0, 23 − 0, 2 + 0,23 × 0,77 1000 0,2 × 0,8 500 − −−−−−−−−−−−−−− √ Figura 4.4 - Regiões críticas para as hipóteses do exemplo Fonte: Elaborada pelo autor. 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 13/39 Calculando o p-valor da amostra por meio do valor normalizado, com base na Tabela 4.1, tem-se que P(z=1,345)=0,089. Como o p-valor > α, então, não podemos rejeitar a hipótese nula, ou seja, a proporção da primeira pesquisa é maior ou igual à segunda pesquisa. Teste Qui-Quadrado para as Proporções Amostrais O teste qui-quadrado é um teste de hipótese de proporções quando é de interesse comparar duas amostras nas quais as proporções dos elementos não podem ser tratadas de forma binomial. Por exemplo, quando se tem uma pesquisa de intenção de voto e se deseja saber se a distribuição dos votos entre os candidatos se manteve, deve-se aplicar um teste qui-quadrado. Esse teste é amplamente usado como um teste não paramétrico para avaliar a aderência de duas distribuições amostrais. A partir do estudo das proporções apresentadas em cada distribuição, o teste permite identi�car se a proporção dos eventos que compõem a amostra varia diante de outra amostra. O teste qui-quadrado é, essencialmente, o estudo dos desvios apresentados por duas distribuições. Ele tem por vantagem avaliar se existe a diferença entre várias proporções sem a perda de con�ança nos testes, como ocorre se �zermos isso aos pares. Porém, tem por desvantagem não informar, caso exista diferença, quem são os elementos diferentes. Para a aplicação do teste, as proporções devem ser convertidas em frequência absoluta, ou seja, a quantidade de elementos real em cada agrupamento. Então, nesse teste, não usaremos as proporções diretamente, mas o número de indivíduos que cada proporção representa. As hipóteses a serem testadas são: A hipótese nula avalia se as frequências observadas na primeira amostra são iguais às frequências da segunda amostra. Para desenvolver o teste qui-quadrado, a primeira observação a ser realizada é na quantidade de elementos presentes em cada proporção. Caso existam no mínimo 5 elementos em cada agrupamento, o teste é realizado avaliando a diferença das frequências das amostras e aplicando a estatística: No caso de agrupamentos com menos de 5 elementos, a diferença entre as duas frequências deve ser realizada por meio da correção de Yates: A hipótese nula é válida se Qobs for menor que o valor tabelado, obtido pela distribuição qui- quadrado para (signi�cância; número de agrupamentos - 1). Os valores para a distribuição qui- quadrado podem ser vistos no Tabela 4.2. { : <H0 p2 p1 : ≥H1 p2 p1 { { (3): =H0 F1 F2 : ≠H1 F1 F2 : = ; = ; = ; …H0 p11 p12 p21 p22 p31 p32 : ao menos uma propor o diferenteH1 a~ F1 F2 £ /esperado, ondeesperado = (totalcolunaj ∗ totallinhai)/totaldevaloresdat(observado − esperado)2 (5) (| − | − 0, 5)F1 F2 2 F2 X2 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 14/39 Signi�cância 0,01 0,025 0,05 0,1 0,9 0,95 0,975 0,99 Graus de liberdade 1 6,63 5,02 3,84 2,71 0,02 0,00 0,00 0,00 2 9,21 7,38 5,99 4,61 0,21 0,10 0,05 0,02 3 11,34 9,35 7,81 6,25 0,58 0,35 0,22 0,11 4 13,28 11,14 9,49 7,78 1,06 0,71 0,48 0,30 5 15,09 12,83 11,07 9,24 1,61 1,15 0,83 0,55 6 16,81 14,45 12,59 10,64 2,20 1,64 1,24 0,87 7 18,48 16,01 14,07 12,02 2,83 2,17 1,69 1,24 8 20,09 17,53 15,51 13,36 3,49 2,73 2,18 1,65 9 21,67 19,02 16,92 14,68 4,17 3,33 2,70 2,09 10 23,21 20,48 18,31 15,99 4,87 3,94 3,25 2,56 11 24,72 21,92 19,68 17,28 5,58 4,57 3,82 3,05 12 26,22 23,34 21,03 18,55 6,30 5,23 4,40 3,57 13 27,69 24,74 22,36 19,81 7,04 5,89 5,01 4,11 14 29,14 26,12 23,68 21,06 7,79 6,57 5,63 4,66 15 30,58 27,49 25,00 22,31 8,55 7,26 6,26 5,23 16 32,00 28,85 26,30 23,54 9,31 7,96 6,91 5,81 17 33,41 30,19 27,59 24,77 10,09 8,67 7,56 6,41 18 34,81 31,53 28,87 25,99 10,86 9,39 8,23 7,01 19 36,19 32,85 30,14 27,20 11,65 10,12 8,91 7,63 20 37,57 34,17 31,41 28,41 12,44 10,85 9,59 8,26 21 38,93 35,48 32,67 29,62 13,24 11,59 10,28 8,90 22 40,29 36,78 33,92 30,81 14,04 12,34 10,98 9,54 23 41,64 38,08 35,17 32,01 14,85 13,09 11,69 10,20 24 42,98 39,36 36,42 33,20 15,66 13,85 12,40 10,86 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 15/39 Tabela 4.2 - Valores de para n<30 Fonte: Elaborada pelo autor. Por exemplo, vamos considerar que, durante uma eleição, é de interesse veri�car se houve variação nas intenções de votos. Para isso, foram usados os resultados obtidos no início da campanha e de pesquisas realizadas às vésperas da eleição. A Tabela 4.3 mostra as porcentagens na intenção de votos, considerando que foram entrevistados 2500 eleitores em cada pesquisa. Aplique uma signi�cância nos testes de 5%. Candidato Intenção pesquisa 1 (%) Intenção pesquisa 2 (%) 1 28 30 2 21 12 3 18 20 4 15 16 5 10 12 6 8 10 Tabela 4.3 - Proporções de intenção de votos para o exemplo Fonte: Elaborada pelo autor. Então, vamos converter os dados de proporção (porcentagem) em frequências absolutas, multiplicando a proporção pelo número total de entrevistados, como mostra a Tabela 4.4, tendo os termos das diferençasdas frequências já calculados. 25 44,31 40,65 37,65 34,38 16,47 14,61 13,12 11,52 26 45,64 41,92 38,89 35,56 17,29 15,38 13,84 12,20 27 46,96 43,19 40,11 36,74 18,11 16,15 14,57 12,88 28 48,28 44,46 41,34 37,92 18,94 16,93 15,31 13,56 29 49,59 45,72 42,56 39,09 19,77 17,71 16,05 14,26 30 50,89 46,98 43,77 40,26 20,60 18,49 16,79 14,95 X2 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 16/39 Candidato Quantidade de eleitores por candidato pesquisa 1 (Fo) Quantidade de eleitores por candidato pesquisa 2 (Fe) d /fe 1 700 725 0,862 2 525 500 1,25 3 450 500 5 4 375 400 1,562 5 250 200 12,5 6 200 175 3,571 Soma 24,746 Tabela 4.4 - Número de eleitores para cada candidato do exemplo Fonte: Elaborada pelo autor. Por meio da Tabela 4.4, temos que . Consultando a Tabela 4.2, o valor de . Como o valor calculado é maior que o tabelado, podemos dizer que existe diferença entre as proporções dos candidatos no começo e no �nal da campanha eleitoral. Pode-se aplicar o p-valor do mesmo modo que nos outros testes. Nesse caso, quanto menor o p- valor, mais indícios para rejeitar a hipótese nula, ou seja, se p-valor > α, as probabilidades são iguais, caso contrário, a distribuição é diferente. Consultando a Tabela 4.2, temos que é menor que 0,01, que é menor que a signi�cância, e con�rma a diferença nas proporções. Esse tipo de teste pode ser empregado em outras aplicações. Por exemplo, se queremos con�rmar que a amostra possui um comportamento semelhante ao de uma distribuição de probabilidade, podemos considerar que a amostra 2 possui as proporções de cada valor referente à distribuição que se deseja avaliar, e comparamos as proporções. praticar Vamos Praticar Em um jogo não viciado, a chance de uma face do dado sair qualquer face é de 1 em 6. Para saber se um dado não está viciado, foi lançado 60 vezes, com o número de vezes que cada face saiu mostrado na tabela a seguir. 2 = 24, 746Qobs (0, 05; 5) = 11, 02X2 P( = 24, 75; 5)x2 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 17/39 Face 1 2 3 4 5 6 Número de vezes 13 11 8 10 8 10 Fonte: Elaborada pelo autor. Considerando a signi�cância de 5%, assinale a alternativa que destaca o valor Qobs e a conclusão sobre o dado. a) , e o dado não é viciado. b) , e o dado não é viciado. c) , e o dado é viciado. d) , e o dado é viciado. e) , e o dado é viciado. = 1, 8Qobs = 0, 18Qobs = 12, 81Qobs = −0, 18Qobs = 18, 91Qobs 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 18/39 Quando desejamos avaliar alguma suposição com relação à variação dos elementos dentro de uma amostra ou mais amostras, devemos aplicar testes de hipótese relacionados à variância dos valores. A variância, como deve já estar claro, é a medida em que os indivíduos da amostra variam em torno da média amostral, mas não está diretamente relacionada à média, mas sim a como os elementos se dispõem em torno dela. Por exemplo, ao avaliar se uma máquina está produzindo parafusos com as dimensões corretas, é observado, além das medidas de tamanho, se a produção mantém um padrão de produção. É muito ruim, por exemplo, quando o cliente chega em casa e diversos parafusos não encaixam em suas respectivas roscas, sendo uma hora menor, outra maior. A média dos tamanhos pode estar correta, mesmo assim, os parafusos não são de boa qualidade. Veremos a seguir como responder às hipóteses levantadas para a variância ou o desvio-padrão de uma amostra, ou entre duas amostras. Teste de Hipóteses EntreTeste de Hipóteses Entre Variâncias Amostrais deVariâncias Amostrais de Populações NormaisPopulações Normais saiba mais Saiba mais O controle da variação nas dimensões dos produtos fabricados é um dos fatores mais complexos na indústria. Se, aproveitando o exemplo dos parafusos, a média dos parafusos for pequena, um ajuste como mandar a máquina produzir peças maiores já resolve o problema. Porém, a variação nos tamanhos é algo intrínseco à máquina e requer mudanças signi�cativas para que possa ser minimizada. Para entender a importância da análise da variância na indústria, Eleotério, Storck e Lopes (1996) avaliam a relação entre a variância e os lucros da empresa. ACESSAR http://www.scielo.br/pdf/cflo/v6n1/1980-5098-cflo-6-01-89.pdf 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 19/39 Teste de Hipóteses para Variância de uma Amostra Normal A variância de uma amostra é um parâmetro sempre positivo. Então, a distribuição de probabilidade relacionada a esse parâmetro também deverá ser. Quando o teste envolve a avaliação da variação amostral com relação a um valor exato ou obtido de uma população, será aplicada a distribuição qui-quadrado. Essa distribuição é aplicada em diferentes testes, inclusive gerando uma família de testes não paramétricos (que não necessitam de premissas iniciais como a normalidade dos valores) que avaliam características da amostra por meio da frequência apresentada pelos valores da amostra. Inclusive, vimos dois desses testes para avaliar a independência entre fatores e igualdade de proporções em amostras que não possuem apenas duas opções de escolha. A distribuição qui-quadrado já foi apresentada anteriormente, aplicada em testes de mesmo nome. É uma distribuição assimétrica, com valores positivos, que depende do grau de liberdade da amostra. Ao avaliar uma suposição com relação à variância, ou ao desvio-padrão, devemos, inicialmente, avaliar a suposição a ser testada. Com base no teorema do limite central, podemos de�nir a distribuição em três regiões: uma de igualdade, onde se apresentam as maiores probabilidades, outra região referente a valores menores e outra a valores maiores que a variância (ou o desvio-padrão) populacional, como mostra a Figura 4.5. Figura 4.5 - Regiões críticas para as hipóteses aplicando a distribuição qui-quadrado Fonte: Elaborada pelo autor. Por ser assimétrica, deve-se atentar para qual cauda será avaliada, pois os valores qui-quadrado para cada uma delas variam. Caso queira a cauda da direita, deve-se aplicar uma probabilidade α (ou α/2, dependendo do tipo de teste) e, no caso da cauda da esquerda, deve-se buscar os valores de probabilidade 1-α (ou 1-α/2). Os valores de referentes a cada probabilidade são apresentados na Tabela 4.5. x2 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 20/39 Tabela 4.5 - Regiões críticas para as hipóteses envolvendo a distribuição qui-quadrado Fonte: Elaborada pelo autor. Os graus de liberdade aplicados nesse teste são v = n-1, onde n é o tamanho da amostra. O teste de hipótese para a variância pode ser desenvolvido tanto por meio da região crítica, utilizando a comparação entre os valores qui-quadrado tabelado e o observado por meio da normalização, quanto por meio do p-valor. Teste de Hipóteses para Variância de uma Amostra Normal Aplicando Região Crítica Para o desenvolvimento dos testes de hipótese, devemos sempre normalizar os valores do parâmetro a ser avaliado. No caso dos testes envolvendo a variância (ou o desvio-padrão) de uma amostra, aplicaremos a normalização: O teste de hipótese aplicando a região crítica deve ser feito posicionando o valor observado em um dos intervalos criados pela suposição desejada. Por exemplo, um vendedor de parafusos informa que seu produto possui um desvio-padrão nas medidas de 2 unidades. Para con�rmar essa informação, você compra um lote, e, por meio da amostragem de 20 unidades, você obtém um desvio-padrão de 2,5 unidades. Adotando uma signi�cância de 5%, o que podemos dizer com relaçãoà a�rmação do vendedor? Primeiro, a suposição. A a�rmação do vendedor é que os parafusos possuem um desvio-padrão de σ=2, ou . Esse valor é exato, pois não foi fornecido com base em outra amostra. Por meio de uma amostra de n=20, obtivemos o desvio-padrão amostral s = 2,5, ou a variância s2=6,25. Com isso, nossa hipótese a ser testada será: Aplicando a normalização dos valores, temos: Com base na tabela, teremos duas regiões críticas (os testes de igualdade são bicaudais). Então, os valores-limite da região crítica são: e . Ao dispor o valor normalizado com as regiões obtidas, vemos na Figura 4.6 que ele está localizado na região demarcada para a hipótese nula. Então, não podemos rejeitar a a�rmação do vendedor = (6)Qobs (n − 1) s2 σ2 = 4σ2 { : = 4H0 s 2 : ≠ 4H1 s2 = = = 29, 678Qobs (n − 1) s2 σ2 (20 − 1) 6, 25 4 (0, 05/2; 20 − 1) = (0, 025; 19) = 32, 85X2 X2 (1 − 0, 05/2; 20 − 1) = (0, 975; 19) = 8, 91X2 X2 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 21/39 de que o desvio-padrão das medidas é de 2 unidades. Figura 4.6 - Regiões críticas para as hipóteses do exemplo anterior Fonte: Elaborada pelo autor. Agora, se o mesmo vendedor dissesse que o desvio é no máximo de 2 unidades, as regiões críticas seriam um pouco diferentes, pois as regiões seriam marcadas como mostra a �gura. Então, o teste seria unicaudal. De�nido pela hipótese: Conforme a Tabela 4.2, o valor-limite da região crítica será: . Comparando o valor normalizado com as regiões de cada hipótese, podemos dizer que o desvio-padrão é no máximo de 2 unidades. Teste de Hipóteses para Variância de uma Amostra Normal Aplicando p-Valor A aplicação do p-valor para os testes de variância de uma amostra segue o mesmo procedimento de outros testes. Primeiro, devemos posicionar a hipótese de igualdade na hipótese nula. Segundo, calcular a probabilidade do valor normalizado. Então, para o nosso exemplo anterior original (avaliando a igualdade das variâncias), teremos . Na tabela, esse valor está entre os valores para α=0,05 e α=0,1. Como essa faixa de valores é maior que a signi�cância (p-valor>α), não podemos rejeitar a hipótese de que os parafusos realmente possuam o desvio-padrão igual a 2 unidades. Teste de Hipóteses para Variância de duas Amostras Normal Para avaliar as hipóteses aplicando duas variâncias (ou desvios-padrões) amostrais, aplicamos a distribuição F de Fisher para avaliar as suposições. É uma distribuição assimétrica e possui apenas valores positivos, apresentando dois graus de liberdade. Como essa distribuição amostral se baseia na razão entre duas variâncias, ela apresenta um grau de liberdade referente ao numerador, e outro referente ao denominador. As Tabelas 4.6 a 4.9 mostram os valores da distribuição quando a signi�cância vale 5%, 2,5%, 97,5% e 95%. { : ≤ 4H0 s 2 : > 4H1 s2 (0, 05; 20 − 1) = (0, 05; 19) = 30, 14X2 X2 p − valor = P( = 29, 87)x2 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 22/39 Tabela 4.6 - Valores de f para α=0,05 Fonte: Elaborada pelo autor. grau de liberdade do numerador 2 3 4 5 6 7 8 9 10 12 15 18 20 22 4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 247,3 248,0 248,6 1 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,44 19,45 19,45 3 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,67 8,66 8,65 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,82 5,80 5,79 8 5,786 5,409 5,192 5,050 4,950 4,876 4,818 4,772 4,735 4,678 4,619 4,579 4,558 4,541 7 5,143 4,757 4,534 4,387 4,284 4,207 4,147 4,099 4,060 4,000 3,938 3,896 3,874 3,856 1 4,737 4,347 4,120 3,972 3,866 3,787 3,726 3,677 3,637 3,575 3,511 3,467 3,445 3,426 8 4,459 4,066 3,838 3,687 3,581 3,500 3,438 3,388 3,347 3,284 3,218 3,173 3,150 3,131 7 4,256 3,863 3,633 3,482 3,374 3,293 3,230 3,179 3,137 3,073 3,006 2,960 2,936 2,917 5 4,103 3,708 3,478 3,326 3,217 3,135 3,072 3,020 2,978 2,913 2,845 2,798 2,774 2,754 7 3,885 3,490 3,259 3,106 2,996 2,913 2,849 2,796 2,753 2,687 2,617 2,568 2,544 2,523 3 3,682 3,287 3,056 2,901 2,790 2,707 2,641 2,588 2,544 2,475 2,403 2,353 2,328 2,306 4 3,555 3,160 2,928 2,773 2,661 2,577 2,510 2,456 2,412 2,342 2,269 2,217 2,191 2,168 1 3,493 3,098 2,866 2,711 2,599 2,514 2,447 2,393 2,348 2,278 2,203 2,151 2,124 2,102 1 3,443 3,049 2,817 2,661 2,549 2,464 2,397 2,342 2,297 2,226 2,151 2,098 2,071 2,048 2 3,385 2,991 2,759 2,603 2,490 2,405 2,337 2,282 2,236 2,165 2,089 2,035 2,007 1,984 1 3,316 2,922 2,690 2,534 2,421 2,334 2,266 2,211 2,165 2,092 2,015 1,960 1,932 1,908 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 23/39 Tabela 4.7 - Valores de f para α=0,025 Fonte: Elaborada pelo autor. grau de liberdade do numerador 2 3 4 5 6 7 8 9 10 12 15 18 20 22 8 799,5 864,2 899,6 921,8 937,1 948,2 956,7 963,3 968,6 976,7 984,9 990,3 993,1 995, 1 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,44 39,45 39,4 4 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,20 14,17 14,1 2 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,59 8,56 8,53 07 8,434 7,764 7,388 7,146 6,978 6,853 6,757 6,681 6,619 6,525 6,428 6,362 6,329 6,30 3 7,260 6,599 6,227 5,988 5,820 5,695 5,600 5,523 5,461 5,366 5,269 5,202 5,168 5,14 3 6,542 5,890 5,523 5,285 5,119 4,995 4,899 4,823 4,761 4,666 4,568 4,501 4,467 4,43 1 6,059 5,416 5,053 4,817 4,652 4,529 4,433 4,357 4,295 4,200 4,101 4,034 3,999 3,97 9 5,715 5,078 4,718 4,484 4,320 4,197 4,102 4,026 3,964 3,868 3,769 3,701 3,667 3,63 7 5,456 4,826 4,468 4,236 4,072 3,950 3,855 3,779 3,717 3,621 3,522 3,453 3,419 3,39 4 5,096 4,474 4,121 3,891 3,728 3,607 3,512 3,436 3,374 3,277 3,177 3,108 3,073 3,04 0 4,765 4,153 3,804 3,576 3,415 3,293 3,199 3,123 3,060 2,963 2,862 2,792 2,756 2,72 8 4,560 3,954 3,608 3,382 3,221 3,100 3,005 2,929 2,866 2,769 2,667 2,596 2,559 2,52 1 4,461 3,859 3,515 3,289 3,128 3,007 2,913 2,837 2,774 2,676 2,573 2,501 2,464 2,43 6 4,383 3,783 3,440 3,215 3,055 2,934 2,839 2,763 2,700 2,602 2,498 2,426 2,389 2,35 6 4,291 3,694 3,353 3,129 2,969 2,848 2,753 2,677 2,613 2,515 2,411 2,338 2,300 2,26 8 4,182 3,589 3,250 3,026 2,867 2,746 2,651 2,575 2,511 2,412 2,307 2,233 2,195 2,16 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 24/39 Tabela 4.8 - Valores de f para α=0,95 Fonte: Elaborada pelo autor. grau de liberdade do numerador 2 3 4 5 6 7 8 9 10 12 15 18 20 22 0,1 0,1 0,1 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,05 0,10 0,14 0,17 0,19 0,21 0,22 0,23 0,24 0,26 0,27 0,28 0,29 0,29 0,05 0,11 0,15 0,18 0,21 0,23 0,25 0,26 0,27 0,29 0,30 0,32 0,32 0,33 0,05 0,11 0,16 0,19 0,22 0,24 0,26 0,28 0,29 0,31 0,33 0,34 0,35 0,36 4 0,052 0,111 0,160 0,198 0,228 0,252 0,271 0,287 0,301 0,322 0,345 0,361 0,369 0,376 4 0,052 0,112 0,162 0,202 0,233 0,259 0,279 0,296 0,311 0,334 0,358 0,376 0,385 0,392 4 0,052 0,113 0,164 0,205 0,238 0,264 0,286 0,304 0,319 0,343 0,369 0,388 0,398 0,406 4 0,052 0,113 0,166 0,208 0,241 0,268 0,291 0,310 0,326 0,351 0,379 0,398 0,409 0,417 4 0,052 0,113 0,167 0,210 0,244 0,272 0,295 0,315 0,331 0,358 0,386 0,407 0,418 0,427 4 0,052 0,114 0,168 0,211 0,246 0,275 0,299 0,319 0,336 0,363 0,393 0,415 0,426 0,435 4 0,052 0,114 0,169 0,214 0,250 0,280 0,305 0,325 0,343 0,372 0,404 0,427 0,439 0,449 4 0,051 0,115 0,171 0,217 0,254 0,285 0,311 0,333 0,351 0,382 0,416 0,441 0,454 0,465 4 0,051 0,115 0,172 0,218 0,257 0,288 0,315 0,338 0,357 0,389 0,425 0,451 0,465 0,477 4 0,051 0,115 0,172 0,219 0,258 0,290 0,317 0,341 0,360 0,393 0,430 0,456 0,471 0,483 4 0,051 0,116 0,173 0,220 0,259 0,292 0,319 0,343 0,363 0,396 0,434 0,461 0,476 0,488 40,051 0,116 0,173 0,221 0,261 0,294 0,322 0,346 0,366 0,400 0,439 0,467 0,482 0,495 4 0,051 0,116 0,174 0,222 0,263 0,296 0,325 0,349 0,370 0,405 0,445 0,475 0,490 0,504 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 25/39 Tabela 4.9 - Valores de f para α=0,975 Fonte: Elaborada pelo autor. A análise de hipóteses, valores e regiões críticos e os valores de signi�cância são semelhantes aos aplicados para os testes de hipótese para análise da variância de uma amostra, mostrados na Tabela 4.5. A diferença estará na estatística aplicada para a normalização dos valores, que será: Com graus de liberdade para o numerador, e para o denominador. Por exemplo, temos amostras de dois lotes de sacos de arroz, cada amostra contendo 10 indivíduos, e, durante a medição, foi identi�cado que um dos lotes possuía desvio-padrão de 5 grau de liberdade do numerador 2 3 4 5 6 7 8 9 10 12 15 18 20 22 0,0 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,2 0,2 0,2 0,2 0,2 0,03 0,06 0,09 0,12 0,14 0,15 0,17 0,17 0,18 0,20 0,21 0,22 0,22 0,23 0,03 0,06 0,10 0,13 0,15 0,17 0,18 0,20 0,21 0,22 0,24 0,25 0,26 0,26 0,03 0,07 0,10 0,14 0,16 0,18 0,20 0,21 0,22 0,24 0,26 0,28 0,28 0,29 1 0,025 0,067 0,107 0,140 0,167 0,189 0,208 0,223 0,236 0,257 0,280 0,296 0,304 0,311 1 0,025 0,068 0,109 0,143 0,172 0,195 0,215 0,231 0,246 0,268 0,293 0,310 0,320 0,327 1 0,025 0,068 0,110 0,146 0,176 0,200 0,221 0,238 0,253 0,277 0,304 0,323 0,333 0,341 1 0,025 0,069 0,111 0,148 0,179 0,204 0,226 0,244 0,259 0,285 0,313 0,333 0,343 0,352 1 0,025 0,069 0,112 0,150 0,181 0,207 0,230 0,248 0,265 0,291 0,320 0,341 0,353 0,362 1 0,025 0,069 0,113 0,151 0,183 0,210 0,233 0,252 0,269 0,296 0,327 0,349 0,361 0,370 1 0,025 0,070 0,114 0,153 0,186 0,214 0,238 0,259 0,276 0,305 0,337 0,361 0,374 0,384 1 0,025 0,070 0,116 0,156 0,190 0,219 0,244 0,265 0,284 0,315 0,349 0,375 0,389 0,400 1 0,025 0,070 0,116 0,157 0,192 0,222 0,248 0,270 0,290 0,322 0,358 0,385 0,400 0,412 1 0,025 0,071 0,117 0,158 0,193 0,224 0,250 0,273 0,293 0,325 0,363 0,391 0,406 0,419 1 0,025 0,071 0,117 0,159 0,195 0,225 0,252 0,275 0,295 0,329 0,367 0,395 0,411 0,424 1 0,025 0,071 0,118 0,160 0,196 0,227 0,254 0,278 0,298 0,332 0,372 0,401 0,417 0,431 1 0,025 0,071 0,118 0,161 0,197 0,229 0,257 0,281 0,302 0,337 0,378 0,409 0,426 0,440 = (10)Fobs s21 s22 = − 1v1 n1 = − 1v2 n2 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 26/39 unidades, e o segundo possuía o desvio-padrão de 3 unidades. Se desejamos saber se os desvios- padrões são iguais, adotando uma signi�cância de 5%, levantaremos as hipóteses: Como é um teste de igualdade, os valores-limite são obtidos por meio dos valores obtidos nas Tabelas 4.6 a 4.9, e . Para nosso exemplo, temos os limites e . Aplicando a normalização da variável, temos: Agora, será disposto o valor normalizado no intervalo de valores de f, como mostra a Figura 4.7, localizando-o na região referente à hipótese nula ou à alternativa. Como mostra a Figura 4.7, temos que o valor normalizado está localizado na região da hipótese nula, o que indica que o desvio-padrão das amostras é igual. praticar Vamos Praticar Uma empresa promete que a vida útil de seus colchões é de 10 anos, com um desvio-padrão de 3 anos. Para garantir que a empresa é honesta, um órgão de proteção aos clientes selecionou 5 colchões e determinou que a vida útil realmente é de 10 anos, porém com um desvio de 4 anos. Avaliando apenas o desvio-padrão obtido e adotando uma signi�cância de 5%, assinale a alternativa que determina o valor normalizado a ser aplicado no teste e o(s) valor(es)-limite a serem aplicados para identi�car que o desvio- padrão obtido na amostra é maior que o informado pela empresa. a) Qobs = 7,11 e valor-limite: 9,49. b) Qobs = 7,11 e valor-limite: 0,49. c) Qobs = 3,11 e valores-limite: 0, 82 e 9,49. { : =H0 s 2 1 s 2 2 : ≠H1 s2 1 s2 1 F( , ,α/2)v1 v2 F( , , 1 − α/2)v1 v2 F( , ,α/2) = F(9, 9, 0, 025) = 4, 026v1 v2 F( , , 1 − α/2) = F(9, 9, 0, 975) = 0, 248v1 v2 = = = 2, 777Fobs s21 s22 52 32 Figura 4.7 - Regiões críticas para as hipóteses Fonte: Elaborada pelo autor. 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 27/39 d) Qobs = 7,11 e valores-limite: 0,49 e 9,49. e) Qobs = 3,11 e valor-limite: 3,49. 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 28/39 Ao selecionarmos variáveis de duas amostras, essas podem ter algum tipo de relação de causalidade que represente uma dependência entre elas. Por exemplo, podemos dizer que a quantidade de votos que um candidato recebe em uma eleição é função do gasto com campanha. Quanto maior o gasto, mais votos ele recebe. Além disso, reduzir os gastos com propaganda reduz o número de votos que ele recebe. Vemos, então, que existe uma relação entre a variação dos dois elementos. A correlação entre duas variáveis é uma medida associativa entre a variação dos valores em variáveis de duas amostras. Por meio dela, podemos medir se existe uma relação entre as variáveis e, se existe, quanto que a variação no valor de uma delas re�ete na variação da outra. Por exemplo, considere duas amostras, A e B. Os possíveis diagramas de dispersão são mostrados na Figura 4.8. Correlação Linear EntreCorrelação Linear Entre VariáveisVariáveis ref lita Re�ita Deve-se ter em mente que o coe�ciente de correlação não mede a escala de variação de uma variável em função da outra. Um coe�ciente de correlação apenas apresenta o quanto da variação de uma das variáveis pode ser explicada pela variação da outra. Por exemplo, um coe�ciente de 0,7 apenas informa que 70% da variação pode ser explicada pela outra variável. Para saber de que modo ocorre a variação, deve- se obter um modelo de regressão linear. Fonte: Figueiredo Filho e Silva Júnior (2009). 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 29/39 Perceba que na Figura 4.8a, o aumento da variável A re�ete no aumento da variável B. Esse tipo de relação entre as variáveis fornece uma correlação positiva. Agora, é possível perceber, no diagrama de dispersão mostrado na Figura 4.8b, que o aumento no valor da variável A resulta na redução no valor da variável B. Esse tipo de comportamento de�ne uma correlação negativa. No caso da Figura 4.8c, o diagrama mostra que a variação de A não impacta na variação dos valores de B. Nesse caso, o coe�ciente de correlação é nulo. Para quanti�car a relação entre as duas variáveis, uma das medidas de correlação entre variáveis quantitativas amplamente utilizadas é o coe�ciente de correlação de Pearson, também conhecido como coe�ciente de correlação (produto – momento). Ele é um índice adimensional que possui valores determinados entre –1 e 1, onde r =1 representa a correlação perfeita positiva entre as duas variáveis, r=-1, correlação perfeita negativa entre as duas variáveis, e r=0 representa a correlação nula. Para obter o coe�ciente de Pearson, é aplicada a expressão: Onde: É comum classi�car os valores da correlação conforme a “força” na explicação das variações. O valor da correlação r pode, como já vimos, variar. Para os valores intermediários, podemos de�nir as correlações como nula, fraca, média ou forte, com as faixas de valores numéricos que representam cada “força” mostrada na Figura 4.9. Figura 4.8 - Diagramas de dispersão possíveis para um par de amostras Fonte: Elaborada pelo autor. r = (11) Sxy × Sxx Syy − −−−−−−−−√ = Σ = n Σ ( ) − (12)Sxx (x − )x −− 2 x2 (Σx)2 = Σ = n Σ ( ) − (13)Syy (y − )y −− 2 y2 (Σy)2 = Σ − (y − ) = n Σ (x ×y) − (Σx) × (Σy) (14)Sxy (x − )x −− y −− 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 30/39 Figura 4.9 - Força das correlações entre duas amostras Fonte: Elaborada pelo autor. Por exemplo, desejamos calcular se existe uma correlação entre a idade, em anos, e a altura, em metros, de uma criança. Então, a cada ano, foi medida a altura, fornecendo os dados da Tabela 4.10. Tabela 4.10 - Medidas de altura em função da idade de uma criança Fonte: Elaborada pelo autor. O coe�ciente de Pearson será obtido por meio do cálculo das somatórias, mostradas na Tabela 4.11, com média da idade valendo 2,5 e da altura em 0,842. Tabela 4.11 - Tabela para o cálculo do coe�ciente de Pearson Fonte: Elaborada pelo autor. Então, o coe�ciente de Pearson é dado por: Idade 0 1 2 3 4 5 Altura 0,4 0,7 0,8 0,9 1,1 1,15 Idade Altura x y 0 0,4 6,25 0,1951 1,1042 1 0,7 2,25 0,0201 0,2125 2 0,8 0,25 0,0017 0,0208 3 0,9 0,25 0,0034 0,0292 4 1,1 2,25 0,0667 0,3875 5 1,15 6,25 0,0951 0,7708 Somas 17,5 0,3821 2,525 =Sxx (x − )x − 2 =Syy (y − )y − 2 = (x − )(y − )Sxy x − y − r = = = 0, 976 Sxy x Sxx Syy − −−−−−−√ 2, 525 17, 5 x 0, 3821 − −−−−−−−−−−√ 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 31/39 Para avaliarmos se o coe�ciente de Pearson possui um valor signi�cativamente válido, podemos propor as seguintes hipóteses: Para responder a essas hipóteses, aplicamos a estatística: Que aplica a distribuição t de Student, com graus de liberdade n-2, onde n é o número de pares de variáveis, e signi�cância α/2. Para o exemplo anterior, temos: As conclusões podem ser obtidas por meio da região crítica ou por meio do p-valor. Como sempre é um teste de igualdade, podemos de�nir a regra de avaliação das hipóteses no caso de o módulo do tobs ser maior que t(α/2; n-2), assim, o coe�ciente é não nulo, ou seja, existe a correlação linear. Diante dos valores consultados na Tabela 4.12, e com base no valor calculado para nosso exemplo, podemos dizer que a hipótese alternativa é verdadeira, ou seja, existe uma relação entre as variáveis analisadas. { (15) : r = 0 (n o existe correla o)H0 a~ a~ : r ≠ 0 (existe uma correla o)H1 a~ t = (16) r n − 2− −−−−√ 1 − r2 − −−−−−√ = = 7, 766tobs 0, 976 5 − 2 − −−− √ 1 − 0, 9762 − −−−−−−−− √ 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 32/39 n Con�ança α/2 1 2 3 4 5 6 7 8 9 10 90% 0,050 6,31 2,92 2,35 2,13 2,02 1,94 1,89 1,86 1,83 1,81 95% 0,025 12,71 4,30 3,18 2,78 2,57 2,45 2,36 2,31 2,26 2,23 98% 0,010 31,82 6,96 4,54 3,75 3,36 3,14 3,00 2,90 2,82 2,76 99% 0,005 63,66 9,92 5,84 4,60 4,03 3,71 3,50 3,36 3,25 3,17 n Con�ança α/2 11 12 13 14 15 16 17 18 19 20 90% 0,050 1,80 1,78 1,77 1,76 1,75 1,75 1,74 1,73 1,73 1,72 95% 0,025 2,20 2,18 2,16 2,14 2,13 2,12 2,11 2,10 2,09 2,09 98% 0,010 2,72 2,68 2,65 2,62 2,60 2,58 2,57 2,55 2,54 2,53 99% 0,005 3,11 3,05 3,01 2,98 2,95 2,92 2,90 2,88 2,86 2,85 n Con�ança α/2 21 22 23 24 25 26 27 28 29 30 90% 0,050 1,72 1,72 1,71 1,71 1,71 1,71 1,70 1,70 1,70 1,70 95% 0,025 2,08 2,07 2,07 2,06 2,06 2,06 2,05 2,05 2,05 2,04 98% 0,010 2,52 2,51 2,50 2,49 2,49 2,48 2,47 2,47 2,46 2,46 99% 0,005 2,83 2,82 2,81 2,80 2,79 2,78 2,77 2,76 2,76 2,75 Tabela 4.12 - Distribuição t de Student Fonte: Elaborada pelo autor. Caso seja de interesse quanti�car a relação entre as duas variáveis, isto é, saber o quanto a variação de uma unidade em uma variável gera de variação na segunda, podemos calcular o coe�ciente angular do modelo linear que relaciona as duas variáveis, obtido pela seguinte expressão: Retornando ao nosso exemplo, para saber a taxa de crescimento da criança, aplicamos a expressão anterior: a = (17) Sxy Sxx a = = = 0, 144 Sxy Sxx 2, 525 17, 5 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 33/39 Isso quer dizer que, a cada ano, a criança cresce 0,144 metro, ou 14,4 cm. praticar Vamos Praticar A �m de determinar se existe a relação entre o valor do salário recebido e os valores devidos pelos clientes de seu banco, o gerente selecionou 8 clientes. Os resultados obtidos são mostrados na tabela a seguir. Fonte: Elaborada pelo autor. Considerando a signi�cância de 5%, assinale a alternativa que mostra o valor do coe�ciente de correlação de Pearson e o coe�ciente angular entre as duas variáveis. a) r = 0,965 e a =0,172. b) r = 0,863 e a = -0,172. c) r = -0,965 e a = -0,357. d) r = 0,752 e a =0,452. e) r = 1,965 e a =0,832. Salário (em milhares) 1 2 3 5 8 10 20 30 Saldo devedor (em milhares) 0,2 0,5 0,6 1 1,2 3 4 5 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 34/39 indicações Material Complementar L I VRO Controle estatístico do processo: cartas de controle para variáveis, cartas de controle para atributos, função de perda quadrática, análise de sistemas de medição José Luis Duarte Ribeiro e Carla Schwengber ten Caten Editora: FEENG/UFRGS – Fundação Empresa Escola de Engenharia da UFRGS Comentário: Este livro mostra como as principais ferramentas estatísticas de estimação e testes de hipóteses são aplicadas em conjuntos para fornecer dados que permitam o Controle Estatístico de Processos, ou CEP. 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 35/39 WEB Como escolher o teste estatístico ideal durante seu projeto Lean 6 Sigma Ano: 2018 Comentário: O vídeo mostra a relação entre as ferramentas estatísticas, em especial sobre con�ança e testes de hipóteses, e qual a sua importância para as ferramentas de gestão avançada, como no caso do 6 Sigma. São apresentadas como são avaliados os pré- requisitos para a escolha dos testes disponíveis na Estatística. Para conhecer mais, acesse o link a seguir. ASSISTIR 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 36/39 conclusão Conclusão Os testes de hipóteses são uma importante ferramenta da inferência estatística. Por meio deles, podemos avaliar suposições relacionadas a parâmetros da população. Nesta unidade, vimos os testes de hipóteses acerca da proporção das amostras, sejam em condições binomiais (certo ou errado) ou quando existe mais de um grupo na amostra. Vimos que, no caso de amostras binomiais, é aplicada a distribuição normal para os testes, já no caso de mais grupos, aplica-se a análise da variação dos valores por meio do teste qui-quadrado. Quando os testes envolvem o estudo da variância, duas distribuições são usadas: a qui-quadrado no caso de uma amostra, ou F de Fisher no caso de duas. Vimos que, por conta da assimetria dessas distribuições, o valor da signi�cância buscada é diferente conforme a hipótese a ser testada. Finalmente, vimos o conceito de correlação entre duas amostras, de modo a identi�car se a variação nos valores de uma amostra é fruto da variação das outras, criando uma relação linear, ou se essa variação não é linear. Além de avaliar a correlação, aprendemos como estimar o tamanho da relação entre essas variáveis, permitindo prever qual a variação nos valores de uma amostra em função da outra amostra. referências Referências Bibliográ�cas BARBOSA, E. M. Testes de hipóteses e aplicações . 2014. 30f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Estadual da Paraíba, Campina Grande, 2014. BONAFINI, F. C. (Org). Probabilidade e estatística . São Paulo: Pearson Education do Brasil, 2015. (Coleção Bibliogra�a UniversitáriaPearson). Disponível na Biblioteca Virtual Universitária. FIGUEIREDO FILHO, D. B.; SILVA JÚNIOR, J. A. Desvendando os Mistérios do Coe�ciente de Correlação de Pearson (r). Revista Política Hoje , Recife, v. 18, n. 1, p. 115-146, 2009. LARSON, R.; FARBER, B. Estatística aplicada . 6. ed. São Paulo: Pearson, 2016. Disponível na Biblioteca Virtual Universitária. MORETTIN, L. G. Estatística básica: probabilidade e inferência. São Paulo: Pearson, 2010. Disponível na Biblioteca Virtual Universitária. RIBEIRO, J. L. D.; CATEN, C. S. Controle estatístico do processo : cartas de controle para variáveis, cartas de controle para atributos, função de perda quadrática, análise de sistemas de medição. 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 37/39 Porto Alegre: FEENG/UFRGS, 2012. WALPOLE, R. E. et al. Probabilidade e estatística : para engenharia e ciências. 8. ed. São Paulo: Pearson, 2009. Disponível na Biblioteca Virtual Universitária. 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 38/39 13/09/2022 20:41 Ead.br https://student.ulife.com.br/ContentPlayer/Index?lc=wSq%2f9o53Nr1Xrpj6JcoUOA%3d%3d&l=SN3CxjkX10H6w1kmogRLlQ%3d%3d&cd=niW… 39/39
Compartilhar