Prévia do material em texto
INFERÊNCIA ESTATÍSTICA - ATIV 4 __________________________________________________________________________________________ Existem vários fenômenos reais que podem ser explicados por meio de modelos do tipo y=ax+b, em que a é o coeficiente angular obtido pela análise da correlação linear. Por exemplo, a relação entre a tensão V e a corrente I em uma resistência elétrica R é obtida pela relação V = RI. Para determinar o valor de R, foram realizados os experimentos mostrados no seguinte quadro: Corrente I 1 2 5 7 10 Tensão V 10 18 30 50 80 Fonte: Elaborado pelo autor. Caso seja necessário, aplique os dados da tabela a seguir com valores normalizados: Fonte: Elaborada pelo autor. Com base nas informações apresentadas e adotando uma significância de 5%, a respeito das hipóteses nulas aceitas, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) A resistência elétrica R vale 8,95 unidades. II. ( ) O coeficiente de correlação linear vale 0,98. III. ( ) O teste de hipótese, em relação ao coeficiente de correlação, indica que ele é nulo. IV. ( ) O p-valor do teste aplicado para avaliar se o coeficiente é nulo vale, aproximadamente, 0,001. Assinale a alternativa que apresenta a sequência correta. Resposta correta. A alternativa está correta. A afirmativa I é falsa. Para verificar a não veracidade da afirmativa, calcularemos os termos Sxx, Syy e Sxy. A tabela a seguir ajudará nos cálculos. A média obtida para a tensão vale 37,6 e, para a corrente, a média vale 5. Corrente Tensão x y 1 10 16 761,76 110,4 2 18 9 384,16 58,8 5 30 0 57,76 0 7 50 4 153,76 24,8 10 80 25 1797,76 212 Soma 54 3155,2 406 Calculando o coeficiente angular entre a corrente e a tensão, temos: . A afirmativa II é verdadeira, pois, calculando o coeficiente de correlação, temos: . A afirmativa III é falsa, pois, avaliando a hipótese de que a correlação é nula, verifica-se: #EQUAÇÃO 17# O valor é normalizado: . RES.: F, V, F, V. __________________________________________________________________________________________ Durante o levantamento sobre o nascimento de crianças no último ano, percebeu-se que, em um grupo com 100 nascidos, 56 eram meninas e 44 eram meninos. Ao consultar os dados da década passada, identificou-se que, em um grupo do mesmo tamanho, eram 48 meninas e 52 meninos. Enquanto algumas pessoas afirmavam que isso representava o fato de que havia mais mulheres nascendo, um pesquisador expôs que não houve mudança. Para as análises, baseia-se na tabela a seguir, se necessário. Considerando uma significância de 5%, o p-valor para o teste a ser aplicado para confirmar a frase do pesquisador será: Resposta correta. A alternativa está correta, pois, como o pesquisador expôs que as proporções de meninas nascendo eram iguais, podemos levantar a hipótese: #EQUAÇÃO 7# Além disso, o valor normalizado para esse tipo de hipótese é obtido como: =1,136. O p-valor para o teste será: P(z=1,136) = 0,129. RES.: p-valor = 0,129. __________________________________________________________________________________________ Para saber se as empresas não estão lesionando os clientes, os órgãos de proteção realizam visitas em supermercados, selecionam uma amostra e analisam a média e o desvio padrão das quantidades, comparando-os com valores padrões. Para sacos de arroz de 5kg, o desvio padrão deve ser menor que 500g. Assim, em um supermercado, foram amostradas 25 unidades, apresentando uma média de 4,8Kg e desvio padrão de 600g. Caso seja necessário, utilize a tabela a seguir: A partir do exposto, analise as asserções a seguir e a relação proposta entre elas. I. O cliente está sendo lesionado ao comprar a marca de arroz que foi avaliada, pois o desvio padrão no peso se mostrou maior do que 500g. Pois: II. Se for aplicado um teste para avaliar o desvio padrão, o p-valor foi superior a 5%. A seguir, assinale a alternativa correta. Resposta correta: A alternativa está correta, pois a asserção I é uma proposição verdadeira, vez que, aplicando a hipótese e a normalização da variável, temos: #EQUAÇÃO 13# Por ser um teste maior, trata-se de um teste unicaudal e, por isso, a significância será de 5%. Então, consultando o valor X 2(a;n-1)= X 2(0,05;24) = 36,4, como Qobs<36,4, a hipótese nula é validada. A asserção II é uma proposição verdadeira e justifica a I, pois, por meio da análise do valor normalizado e consultando a tabela com os valores de X2, para v = n-1 = 24, temos: P(X 2=34,56) > 0,05 (fica entre 0,05 e 0,10). RES.: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. __________________________________________________________________________________________ A correlação linear é uma medida que permite explicar a variação no valor de uma amostra em função da variação de outra amostra. Por causa disso, a correlação é de grande valia em diversas áreas da estatística, pois permite avaliar se existe uma relação entre as variáveis, além de qual é a escala dessa relação. Considerando o exposto, em relação ao coeficiente de correlação linear e ao coeficiente angular, analise as afirmativas a seguir. I. A correlação linear descreve como a variação de uma unidade de uma variável impacta na variação de outra. II. Se a correlação linear é positiva, o crescimento de uma variável faz com que o valor da outra também aumente. III. Uma correlação linear nula implica a ausência de uma relação linear entre as variáveis. Assim, a variação pode ser explicada por outras relações. IV. O maior valor da correlação linear é, em módulo, unitário. Isso significa que, se aumentarmos uma unidade em uma variável, a outra variável também aumentará em uma unidade. Está correto o que se afirma em: Sua resposta está incorreta. A alternativa está incorreta. A afirmativa I está incorreta, já que a correlação não quantifica a variação nos valores das amostras, mas, sim, o quanto a variação de uma pode explicar a variação da outra. Quem quantifica a variação é o coeficiente angular. A afirmativa II está correta, pois a correlação positiva postula que, se houver um aumento no valor de uma variável, a outra também aumentará seu valor. A afirmativa III está incorreta, pois a correlação nula informa apenas que não existe uma relação linear entre as duas variáveis. A afirmativa IV está incorreta, porque o coeficiente de correlação linear unitário informa que toda a variação de uma das variáveis pode ser explicada pela variação da outra, porém não quanto vale essa variação. RES. CORRETA: II, apenas. __________________________________________________________________________________________ Duas marcas de bebida, B1 e B2, que disputam o mercado de refrigerantes, produzem três tipos de refrigerante, sendo um de cola (C), um de guaraná (G) e um de laranja (L). A quantidade de unidades vendidas durante um fim de semana em um supermercado que fornece as duas marcas é mostrada no seguinte quadro: Marcas B1 B2 Tipos C 180 150 G 200 220 L 120 130 Caso seja necessário, utilize as tabelas a seguir: Considerando uma significância de 5%, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) Pode-se afirmar que a proporção de vendas dos refrigerantes é igual para as duas marcas. II. ( ) Na marca B2, o refrigerante de cola é responsável por, pelo menos, 40% das vendas. III. ( ) O refrigerante de guaraná é responsável por, no máximo, 50% do mercado de refrigerantes. IV. ( ) Na marca B1, o refrigerante de laranja é responsável por menos de 30% das vendas. Assinale a alternativa que apresenta a sequênciacorreta. Resposta correta. A alternativa está correta, pois a afirmativa I é falsa, visto que é levantada a hipótese: #EQUAÇÃO 8# Para responder à hipótese, podemos calcular o valor normalizado: . A amostra possui v=3-1=2 graus de liberdade e o valor limite para a hipótese nula ser verdadeira vale: Q(0,05; 2)=5,99. Então, é possível afirmar que a proporção é diferente. A afirmativa II é falsa, pois, avaliando as proporções, podemos afirmar que o refrigerante de cola possui p=180/500=0,36. Assim, avalia-se a hipótese de: #EQUAÇÃO 9# Com a normalização do valor, tem-se: . Consultando o valor de Z(0,05)=1,64 e de acordo com a hipótese (“pelo menos”), o valor limite das regiões de análise é -1,64. Como o Z obs < -1,64, então podemos considerar que é falsa a suposição de que o refrigerante seja responsável por, pelo menos, 40% das vendas. A afirmativa III é verdadeira, pois, avaliando as proporções, podemos afirmar que o refrigerante de cola possui p=420/1000=0,42. Assim, avalia-se a hipótese de: #EQUAÇÃO 10# Com a normalização do valor, tem-se: . Consultando o valor de Z(0,05)=1,64 e de acordo com a hipótese (“pelo menos”), o valor limite das regiões de análise é 1,64. Como o Z obs < -1,64, então podemos considerar que é verdadeira a suposição de que o refrigerante seja responsável por, no máximo, 50% das vendas. A afirmativa IV é verdadeira, pois, avaliando as proporções, podemos afirmar que o refrigerante de cola possui p=120/500=0,24. Assim, avalia-se a hipótese de: EQUAÇÃO 11 Com a normalização do valor, tem-se: . Consultando o valor de Z(0,05)=1,64, e de acordo com a hipótese (“menos de”) o valor limite das regiões de análise é -1,64. Como o Z obs < -1,64, então podemos dizer que é verdadeira a suposição de que o refrigerante de laranja representa menos de 30% das vendas da marca B1. RES.: F, F, V, V. __________________________________________________________________________________________ Ao investigar a qualidade de um serviço, por exemplo, a comida servida em um restaurante, é comum que, além da qualidade, sejam buscados os lugares em que a qualidade se mantém quase constante. Imagine dois restaurantes: A e B. Em 5 idas em cada um deles, você deu notas de 0 a 10, que resultaram em um desvio padrão de 2 para o restaurante A, e 3 para o restaurante B. Caso seja necessário, baseia-se nas tabelas a seguir: Fonte: Elaborada pelo autor. Fonte: Elaborada pelo autor. Fonte: Elaborada pelo autor. Fonte: Elaborada pelo autor. A partir do exposto e considerando uma significância de 5%, analise as asserções a seguir e a relação proposta entre elas. I. A variação na qualidade apresentada pelos dois restaurantes é igual. Pois: II. O valor normalizado está localizado na região referente à hipótese nula, delimitada pelos valores críticos obtidos na distribuição qui-quadrado. A seguir, assinale a alternativa correta. Resposta correta. A alternativa está correta, pois a asserção I é uma proposição verdadeira. Para avaliar a veracidade da asserção, a hipótese levantada é de: #EQUAÇÃO 3# Para avaliar essa condição, o valor normalizado será: Consultando os valores limites para as hipóteses, têm-se: F(0,025;4;4) = 9,60 e F(0,975;4;4) = 0,1. Como o valor normalizado está dentro do intervalo entre os valores limites, então a variância e, consequentemente, o desvio padrão são iguais. A asserção II é uma proposição falsa, pois será aplicado o teste F de Fisher para a comparação de variância de duas amostras. RES.: A asserção I é uma proposição verdadeira, e a asserção II é uma proposição falsa. __________________________________________________________________________________________ Em uma turma de alunos, o professor avaliou as notas conforme conceitos, aplicando notas de A até F. Após um ano lecionando, esse professor resolve alterar a metodologia de ensino. O objetivo dele, ao alterar a metodologia, é que mais alunos tenham conceitos maiores ou iguais a B. A partir do exposto, analise as asserções a seguir e a relação proposta entre elas. I. O professor deve avaliar os resultados por meio de um teste de hipótese para a proporção aplicando uma distribuição qui-quadrado. Pois: II. Como há mais de um grupo de notas a ser avaliado, o professor deve, inicialmente, avaliar se as proporções de todas as notas se mantiveram. Caso tenha mudado, é preciso avaliar qual das proporções foi alterada. A seguir, assinale a alternativa correta. Resposta correta. A alternativa está correta, pois a asserção I é uma proposição falsa, uma vez que o professor deseja que as notas acima de B melhorem, então temos duas condições: notas iguais ou acima de B e notas abaixo de B. Nesse caso, o teste aplica uma distribuição normal. A asserção II também é uma proposição falsa, pois o professor, para saber se melhorou ou não a nova metodologia, deve comparar a proporção de casos que ele está interessado antes e depois da implantação da metodologia. RES.: As asserções I e II são proposições falsas. __________________________________________________________________________________________ Em uma pesquisa, buscando relacionar o número de bactérias, em milhões, nas comidas e a temperatura, em ºC, na qual a comida foi armazenada, foram realizadas 5 medições, sendo obtidos os resultados evidenciados no seguinte quadro: Temperatura 20 50 80 100 120 Número de bactérias 150 200 220 190 200 Fonte: Elaborado pelo autor. Caso seja necessário, aplique a tabela a seguir: Fonte: Elaborada pelo autor. Com base no exposto e adotando uma significância de 5%, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) A correlação linear encontrada vale r = 0,62. II. ( ) A correlação linear entre a temperatura e o número de bactérias é negativa. III. ( ) Estatisticamente, não existe relação linear entre a temperatura e a quantidade de bactérias. IV. ( ) Para cada aumento de 1ºC na temperatura, o número de bactérias aumenta em 1,8 milhões. Assinale a alternativa que apresenta a sequência correta. Resposta correta. A alternativa está correta, pois a afirmativa I é verdadeira, uma vez que, calculando o coeficiente de correlação linear por meio da tabela a seguir, tem-se: 291617642268 Temperatur a Número de bactérias 20 150 50 200 576 64 -192 80 220 36 784 168 100 190 676 4 -52 120 200 2116 64 368 Soma 6320 2680 2560 =0,622. A afirmativa II é falsa, pois, como calculado anteriormente, o coeficiente é positivo. A afirmativa III é falsa, pois, aplicando o teste para avaliar se o valor do coeficiente é nulo, tem-se: . Os valores limites são obtidos por meio da distribuição t de Student t(0,025;3)=3,18. Então, podemos concluir que o coeficiente linear não é nulo. A afirmativa IV é falsa, pois o coeficiente angular da relação entre a temperatura é: . Isso significa que a variação em 1ºC representa o crescimento de 0,405 milhões de bactérias. RES.: V, F, F, F. __________________________________________________________________________________________ Uma empresa promete que, ao adquirir uma versão nova de um software, as chances de parada em uma indústria por causa de erros de execução do programa diminuirão. Atualmente, a cada 100 dias, ocorre que a empresa fica parada em 10 deles, em função do software. Com o novo software, a empresa promete que serão apenas 5 dias parados. Caso seja necessário, consulte a tabela a seguir: A partir do exposto, analise as asserções a seguir e a relação proposta entre elas. I. Não vale a pena investir no novo software, pois o número de dias parados permanecerá o mesmo. Pois:II. Aplicando um teste estatístico para definir a real quantidade de dias parados, o p-valor encontrado é de 0,08. A seguir, assinale a alternativa correta. Resposta correta: A alternativa está correta, pois a asserção I é uma proposição verdadeira, já que a hipótese levantada para a asserção é: #EQUAÇÃO 14# Os valores de probabilidade foram encontrados, para o sistema atual p=10/100=0,1, e para o proposto p=5/100=0,05. Aplicando a normalização, tem-se: . Como é um teste de igualdade, a significância é dividida por dois, então o valor limite para a igualdade será Z(0,025)=1,96. Como o valor normalizado está no intervalo entre -1,96 e 1,96, então as proporções são iguais. A asserção II é uma proposição falsa, pois, ao consultar a tabela da distribuição normal, tem-se: P(Z=1,667)=0,047. RES.: A asserção I é uma proposição verdadeira, e a asserção II é uma proposição falsa. __________________________________________________________________________________________ Para cada tipo de inferência a ser feita em relação à população, há uma distribuição de probabilidade e uma estatística relacionada. Em alguns casos, para um mesmo parâmetro, existe mais de uma estatística a ser aplicada. Então, é de suma importância saber identificar qual é a distribuição a ser aplicada para cada caso. A respeito das distribuições de probabilidade aplicadas em teste de hipótese, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) Quando se avalia a variância em uma amostra, deve-se aplicar uma distribuição qui-quadrado. II. ( ) A distribuição F de Fisher é indicada para avaliação da proporção entre duas amostras que possuem apenas duas condições de resposta. III. ( ) Por ser uma medida de variação, o coeficiente de correlação linear é avaliado por meio da distribuição qui-quadrado. IV. ( ) A distribuição de probabilidade a ser aplicada nos testes envolvendo a variância depende da quantidade de amostras envolvidas. Assinale a alternativa que apresenta a sequência correta. Resposta correta. A alternativa está correta, pois a afirmativa I é verdadeira, uma vez que a avaliação da hipótese para a variância de uma amostra é realizada pelo valor normalizado Qobs, envolvendo a variância da amostra e uma variância padrão. A afirmativa II é falsa, pois a proporção de uma ou duas amostras com apenas duas condições (binomial) é realizada por meio da distribuição normal. A afirmativa III é falsa, visto que a distribuição qui-quadrado é usada para comparar a proporção de duas amostras com mais de um grupo de possibilidades. A afirmativa IV é verdadeira, pois, se o teste avaliar a variância de uma amostra, a distribuição a ser aplicada é a qui-quadrado, enquanto, para duas amostras, será a f de Fisher. RES.: V, F, F, V. __________________________________________________________________________________________ INFERÊNCIA ESTATÍSTICA - ATIV 4