Buscar

Exercícos Resolvidos Hipótese e Regressão Linear

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Testes de Hipótese
 Os dados abaixo representam a resistência de dez pedaços de um cabo de aço, ensaiados por tração até a ruptura. Com base nos resultados obtidos, pretende-se saber se esse cabo obedece à especificação, a qual exige que sua carga média de ruptura seja 1.500 Kg no mínimo. Qual sua conclusão, ao nível de 2% de significância?
Resolução: 
Propriedade a ser utilizada: Teste de Hipótese para médias. Como e a variância populacional é desconhecida, utilizaremos o teste t student bilateral. As hipóteses a serem formuladas são:
G.L (Graus de Liberdade) = n–1 = 10–1 = 9
Como se trata de um teste bilateral, devemos dividir 
 
O próximo passo será calcular a média da amostra através do processo tradicional para médias: 
=
Em seguida, devemos calcular o desvio padrão amostral, que é calculado através da fórmula: 
Pela tabela do t-student, descobrimos tcrítico= -2,821 e 2,821
Para a Hipótese nula ser aceita, tcalculado deve estar no intervalo entre –tcrítico e +tcrítico
Como , aceita-se a 2% de significância. 
A cronometragem de certa operação industrial forneceu os seguintes valores para diversas determinações, dados em segundos:
Podemos concluir que o tempo médio necessário para realizar essa operação não deve exceder a 2 min, ao nível de 5% de significação?
Propriedade a ser utilizada: Teste de Hipótese para médias. Como e a variância populacional é desconhecida também neste exercício, utilizaremos o teste t student bilateral. As hipóteses a serem formuladas são:
=
Convertendo a média para minutos, =1,95 minutos 
G.L=n-1=18-1=17
-tcrítico= -2,110 , +tcrítico=2,110
Aceita-se a 5% de significância. 
A distribuição de freqüências que segue representa uma amostra retirada de uma população aproximadamente normal. Ao nível de 5% de significância, há evidencia de que o desvio-padrão dessa população seja diferente de 15?
Propriedade a ser utilizada: Teste de Hipótese para variâncias e desvio padrão bilaterais. Para este teste, utiliza-se a distribuição qui-quadrado:
Hipótese a ser formulada: 
Se (
Como se tratam de dados tabelados, o cálculo da média e da variância amostral (S²) é feito de forma diferente ao apresentado nos demais exercícios. A média será igual a:
=
Neste caso, n é a soma das frequências: 
n=3+6+11+15+18+10+5+4=72
Para o cálculo da média, será necessário calcular os valores de para depois multiplicarmos por cada uma das frequências, somarmos o produto entre eles e por fim, dividirmos por n. 
=
Agora devemos calcular o desvio padrão amostral (S). A fórmula para o cálculo do desvio padrão amostral para dados agrupados é a seguinte:
n=72, =(96)²=9216
Agora já temos todos os dados para calcularmos o valor de :
Agora devemos encontrar os valores de e na tabela do qui quadrado. 
Para com 71 Graus de Liberdade (n-1=72-1=71) e 
Não temos o valor 71 (Grau de Liberdade) na tabela. Quando isso acontecer, devemos utilizar o grau de liberdade mais próximo (no caso específico deste exercício, 60).
Portanto, 
Para com 71 Graus de Liberdade (n-1=72-1=71) e 
Não temos o valor 71 (Grau de Liberdade) na tabela. Quando isso acontecer, devemos utilizar o grau de liberdade mais próximo (no caso específico deste exercício, 60).
Portanto, 
Como , Aceita-se a Hipótese de que o desvio padrão não é diferente de 15 a 5% de significância. 
Uma máquina foi regulada para fabricar placas de 5 mm de espessura, em média, com coeficiente de variação de, no máximo, 3%. A distribuição das espessuras é normal. Iniciada a produção, foi colhida uma amostra de tamanho 10, que forneceu as seguintes medidas de espessuras, em milímetros:
	5,1
	4,8
	5,0
	4,7
	4,8
	5,0
	4,5
	4,9
	4,8
	5,2
Ao nível do 1%, pode-se concluir que a hipóteses de que a regulagem da máquina é satisfatória?.
Propriedade a ser utilizada: Teste de Hipótese para médias. Como e a variância populacional é desconhecida, utilizaremos o teste t student bilateral. As hipóteses a serem formuladas são:
=
Desvio padrão amostral (S):
Pela tabela do t-Student com 9 Graus de Liberdade e 0,005 de probabilidade, encontramos e 
Como Aceita-se a Hipótese a 1% de significância. 
Em indivíduos normais, o consumo renal médio de oxigênio tem distribuição normal com média 12 cm3/min e desvio-padrão 1,3 cm3/min. Um pesquisador coleta uma amostra do consumo renal de oxigênio de 10 indivíduos, obtém uma média amostral de 12,5 cm3/min e um desvio amostral de 1,8 cm3/min, o pesquisador poderia afirmar que o consumo renal médio de oxigênio é significativamente maior que 12 cm3/min. Use um nível de 5% de significância.
Esta é uma situação diferente e requer muito cuidado porque o enunciado pede um teste unilateral à direita (Num teste unilateral, a hipótese alternativa (H1) diz que o parâmetro é maior (unilateral à direita) ou menor (unilateral à esquerda) do que o valor estipulado na hipótese nula).
O que significa que não devemos dividir alfa por 2. Como a variância populacional é conhecida (, devemos utilizar a distribuição Z.
 
Ou seja, ele quer comparar com apenas um dos lados da região. Para encontrar o valor crítico de Z (1,64), devemos proceder da seguinte forma: 
Hipótese a ser formulada:
Como , Aceita-se a hipótese nula a 5% de significância
Um produtor deseja obter peso especifico médio de 0,8 Kg/dm3 para certo material necessário à sua linha de produção. Admitindo o produtor a possibilidade de uma partida estar acima da especificação, quer saber se poderá, ao nível de 5% de significância, devolver a partida ao fornecedor. Para tanto, colheu uma amostra de doze porções do material, a qual forneceu média de 0,81 Kg/dm3 e desvio padrão de 0,02 Kg/dm3. O fornecedor indica como sendo de 0,01 Kg/dm3 o desvio padrão do peso específico do produto. Poderia concluir que se deve devolver a partida ao fornecedor?.
É a mesma situação do exercício anterior. Variância conhecida e teste de hipótese unilateral à direita.
Num estudo sobre o metabolismo de citrato no fígado foram tomadas foram tomadas amostras da veia hepática de dez indivíduos normais e amostras de sangue arterial de outros dez indivíduos normais, obtendo-se as seguintes determinações de citrato em cada amostra (em mg/ml):
Realize um teste de hipótese a fim de verificar se existe uma diferencia significativa no sentido de um maior conteúdo médio de citrato no sangue arterial em relação ao sangue da veia hepática. Use =0,01.
Propriedade a ser utilizada: Teste de Hipótese para igualdade das médias. Como a variância populacional é desconhecida, utilizaremos o teste t student, a priori. Mas segundo a propriedade da igualdade das médias para o teste t student, as variâncias devem ser desconhecidas e iguais. Portanto, para comprovar que as variâncias não diferem entre si, deveremos utilizar outra propriedade: O teste de significância para igualdade de Variâncias. Primeiramente, calculamos as médias através do método tradicional para a população A (Sangue da veia hepática) e B (Sangue da veia arterial) e a variância amostral de ambas as populações foi calculada pelo seguinte método:
A distribuição F deve ser usada neste tipo de situação.
Hipóteses:
Para calcular Devemos considerar o grau de liberdade ( e a probabilidade . 
G.L==10-1=9
0,05 de probabilidade
Para calcular Devemos considerar o grau de liberdade ( e a probabilidade . 
G.L= 
0,05 de probabilidade
Se Aceita-se a hipótese de que a variâncias sejam iguais.
Como encontrar na tabela: 
Como encontrar na tabela (Tomem cuidado, pois os Graus de Liberdade são iguais. Nem sempre encontrarão esta situação) :
 
Como Aceita-se a hipótese nula a 1% de significância. 
Agora devemos passar para a segunda etapa da resolução. Uma vez que as variâncias são desconhecidas e iguais, devemos utilizar a propriedade t-student para igualdade das médias. A hipótese a ser formulada é a seguinte: 
 
 com 0,01 de probabilidade.Como encontrar o valor na tabela: 
Como 
Rejeita-se a hipótese nula a 1% de significância. 
Em uma experiência industrial, foi executado um trabalho por 10 operários, de acordo com o método I, e por 20 operários, de acordo com o método II. Os resultados que são o tempo necessário para a execução do trabalho (em min)se apresentam a continuação:
	
	Média
	Variância
	Método I
	53
	6
	Método II
	57
	15
Teste se os dois métodos devem ser considerados como tendo a mesma variabilidade do tempo.
Propriedade a ser utilizada no exercício: Teste de hipótese para igualdade das variâncias (Teste F) 
Diga se os dados permitem afirmar que o método I fornece um tempo médio menor que o método II. (Use =0,05).
Propriedade a ser utilizada no exercício: Teste de hipótese para igualdade das médias. Como a variância é conhecida, usem a distribuição Z. Trata-se de um teste unilateral à esquerda, portanto, não dividam alfa por 2. 
A qualidade de rebites é tanto melhor quanto maiores sua resistência média e sua homogeneidade. Seis rebites de duas marcas foram ensaiados ao cisalhamento, tendo-se obtido as seguintes cargas de ruptura:
Esses resultados ratificam a afirmação, do produtor da Marca B, de que seus rebites são melhores quanto a pelo menos um aspecto?. Use =0,05.
Teste para igualdade das médias. Como a variância é desconhecida, utilizem a distribuição t student. Mas não se esqueçam de antes usar o teste F para comprovar que as variâncias são iguais. É um teste de hipótese unilateral à direita. 
Com o intuito de controlar a homogeneidade da produção de certas partes no tempo, amostras semanais são retiradas da produção concorrente. Uma primeira amostra de dez elementos forneceu uma média de 284,55 e desvio padrão de 0,320, ao passo que uma segunda amostra forneceu nas mesmas unidades os seguintes valores:
	284,6
	283,9
	234,8
	285,2
	284,3
	283,7
	284,0
	Ao nível de 5% de significância, podemos concluir que a homogeneidade da produção tenha variado no decorrer das duas semanas pesquisadas?.
Propriedade a ser utilizada no exercício: Teste de hipótese para igualdade das variâncias (Teste F) 
A fim de comparar duas marcas de cimento, A e B, fizemos experiência com quatro corpos de prova da marca A e 5 corpos de prova da marca B, obtendo-se as seguintes resistências à ruptura:
Verifique se as resistências médias das duas marcas diferem entre si. Use =0,05.
Propriedade a ser utilizada no exercício: Teste de hipótese para médias populacionais. Como a variância é desconhecida e n<30, usa-se a distribuição t student. 
Análise de Regressão Linear Simples e Correlação Linear
Elabore um gráfico com os seguintes dados:
	(1,1)
	(4,1)
	(5,3)
	(3,2)
	(3,4)
	(4,2)
	(1,4)
	(3,3)
Qual é a linha de regressão estimada, obtenha o coeficiente de correlação e de determinação.
Resolução: A linha de regressão ou equação de regressão tem o seguinte formato.
Os parâmetros são calculados pelas fórmulas: 
													
 (Equação de Regressão)
Coeficiente de determinação (r²) 
Coeficiente de correlação: 
Mas o coeficiente de correlação tem (por regra) o mesmo sinal de na equação de regressão, então é negativo. 
Outro método de cálculo do coeficiente de correlação:
Para cinco volumes de uma solução, foram medidos os tempos de aquecimento em um mesmo bico de gás e as respectivas temperaturas de ebulição:
Faça um gráfico identifique a linha de regressão estimada, estabeleça o teste da existência dos parâmetros.
A variável dependente corresponde à temperatura, pois o tempo de aquecimento é determinante para o nível de temperatura no bico do gás. Sendo assim Y= temperatura e X= tempo de aquecimento.
	
	
	
	
	
	20
	75
	1500
	400
	5625
	22
	80
	1760
	484
	6400
	19
	75
	1425
	361
	5625
	23
	82
	1886
	529
	6724
	17
	78
	1326
	289
	6084
	
	390
	7897
	2063
	 30458
 (Equação de Regressão)
O primeiro teste de hipótese envolve a existência ou não do coeficiente angular. Para isso, teremos que usar a Anova, cuja tabela está expressa abaixo.
	F.V.
	G.L.
	S.Q.
	Q.M.
	Fcalculado
	Regressão
	1
	SQReg
	QMReg=SQReg
	F=QMReg/QMErro
	Erro
	5-2=3
	SQErro
	QMErro=SQErro/(n-2)
	
	Total
	5-1=4
	SQTotal
	
	
 Os Graus de Liberdade (G.L) para este caso específico dependerão da quantidade de variáveis independentes na equação de regressão. 
O teste de hipótese que comprovará ou não a existência do parâmetro é o seguinte:
: 1 = 0 (Não existe relação linear entre Y e X)
: 1 0 (Existe relação linear entre Y e X)
Calculando os valores da tabela Anova:
	F.V.
	G.L.
	S.Q.
	Q.M.
	Fcalculado
	Regressão
	1
	-730273
	QMReg=-730273
	F=-730273/77=-9484
	Erro
	n-2
	231
	QMErro=231/(5-2)=77
	
	Total
	n-1
	-730042
	
	
Como há apenas uma variável independente (x) na equação, o Grau de Liberdade do numerador é =1. E o Grau de Liberdade do numerador é=n-2=5-2=3 para 0,01 (Obs: Há um equívoco no enunciado, pois não informa o nível alfa). Neste caso, não se divide alfa por 2. 
Como 
Ajuste uma reta de mínimos quadrados aos dados abaixo, adotando:
	
	
	
	
	
	9
	2
	18
	81
	4
	9
	4
	36
	81
	16
	7
	5
	35
	49
	25
	4
	6
	24
	16
	36
	5
	7
	35
	25
	49
	3
	10
	30
	9
	100
	1
	12
	12
	
	144
	
	46
	190
	
	 374
a) X como variável independente;
O procedimento é o mesmo dos anteriores.
 - (-)1,07*5,43=12,38
Y como variável independente.
 - (-)0,83*6,57=10,9 
Verifique se as duas equações obtidas correspondem à mesma função implícita.
A velocidade máxima de automóveis Formula 1 com motores de mesma potencia é função, entre outras variáveis, do peso do veículo, no intervalo entre 700 e 800 Kgs. Assim, verificou-se qual a velocidade máxima atingida em uma reta de 1.200 m. Os resultados foram:
Identifique a variável Independente (X) e a variável dependente (Y).
A variável dependente corresponde à velocidade máxima, visto que os índices da mesma dependem do Peso. Desta forma, a variável independente é o peso. 
Faz um gráfico desta relação.
Obs: Calculei a equação de regressão pelo mesmo método apresentado nos exercícios anteriores. 
Qual é o modelo para esta relação, o modelo é bom porque?.
É um modelo matemático, de regressão linear, que deve ser estimado pelo método dos mínimos quadrados. É bom porque permite identificar a relação entre as variáveis X e Y se o modelo for significativo. Em termos econômicos é de suma relevância, pois estima de maneira exata a variação na quantidade demandada de um produto, por exemplo, quando o seu preço aumenta ou diminui. 
Qual a velocidade esperada para um veículo de 730 Kgs.?
e) Qual a velocidade esperada para um veículo de 730 Kgs.?
As vendas de duas firmas A e B estão relacionadas a seguir, em milhares de unidades.
Identifique a variável Independente (X) e a variável dependente (Y).
Tanto para a firma A como para a firma B, a variável independente (X) será o ano codificado, enquanto que a variável dependente (Y) será a venda. 
Faz um gráfico desta relação.
Gráfico de A:
Gráfico de B:
Qual é o modelo para esta relação, o modelo é bom porque?.
Sim, pois além de explicar a relação entre as variáveis dependentes e independentes (caso seja significativo), permite estabelecer uma projeção para as vendas no ano seguinte.
 d) Quais serão as vendas das duas firmas no ano de 1976?.
Em relação a A:
	Ano
	Ano Codificado (X)
	Vendas (Y)
	1970
	0
	1
	1971
	1
	1,5
	1972
	2
	3
	1973
	3
	3,5
	1974
	4
	4,5
	1975
	5
	5
Uma vez que identificamos as variáveis X e Y no problema, estima-se normalmente, como nos outros exercícios, a regressão. A equação de regressão da firma A corresponde a: 
As vendas da firma A em 1976 serão de:
Em relação a B:
	Ano
	Ano Codificado (X)
	Vendas (Y)
	1970
	0
	4,5
	1971
	1
	5
	1972
	2
	5,5
	1973
	35,5
	1974
	4
	6
	1975
	5
	6
Equação de Regressão da Firma B:
As vendas da firma B em 1976 serão de:
_____________________________________________________________________
Regressão Linear
Exercício 01 - É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação, uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma delas a idade (X) e a massa muscular (Y).
	Massa muscular (Y)
	Idade (X)
	82.0
	71.0
	91.0
	64.0
	100.0
	43.0
	68.0
	67.0
	87.0
	56.0
	73.0
	73.0
	78.0
	68.0
	80.0
	56.0
	65.0
	76.0
	84.0
	65.0
	116.0
	45.0
	76.0
	58.0
	97.0
	45.0
	100.0
	53.0
	105.0
	49.0
	77.0
	78.0
	73.0
	73.0
	78.0
	68.0
Construa o diagrama de dispersão e interprete-o. 
No gráfico de dispersão entre a variável massa muscular e idade, pode-se observar que há um forte indício de relação linear decrescente entre as variáveis em estudo. Nota-se que a massa muscular das pessoas diminui à medida que a idade aumenta. 
Calcule o coeficiente de correlação linear entre X e Y. 
Denotamos as variáveis: Y = Massa Muscular e X = Idade n=18
 
 
Segundo o resultado da correlação obtida, pode-se notar que há uma forte correlação linear entre a variável massa muscular e idade. Nota-se que à medida que a idade da pessoa aumenta a massa muscular diminui, o que é coerente com o gráfico de dispersão apresentada anteriormente.
Ajuste uma reta de regressão para a relação entre as variáveis Y: massa muscular (dependente) e X: idade (independente). 
A reta de regressão estimada da variável Massa muscular (Y) em função da Idade (X) é
Considerando a reta estimada dada no item (c), estime a massa muscular média de mulheres com 50 anos.
Exercício 02 - Os dados a seguir correspondem à variável renda familiar e gasto com alimentação (em unidades monetárias) para uma amostra de 25 famílias.
	Renda Familiar (X)
	Gasto com Alimentação (Y)
	3
	1,5
	5
	2,0
	10
	6,0
	10
	7,0
	20
	10,0
	20
	12,0
	20
	15,0
	30
	8,0
	40
	10,0
	50
	20,0
	60
	20,0
	70
	25,0
	70
	30,0
	80
	25,0
	100
	40,0
	100
	35,0
	100
	40,0
	120
	30,0
	120
	40,0
	140
	40,0
	150
	50,0
	180
	40,0
	180
	50,0
	200
	60,0
	200
	50,0
Construa o diagrama de dispersão da variável gasto com alimentação (Y) em função da renda familiar (X). 
Calcular o coeficiente de correlação entre essas variáveis.
Denotamos as variáveis: Y = Gasto com Alimentação e X = Renda familiar
 
Obtenha a equação de regressão do gasto com alimentação em função da renda familiar. 
A reta de regressão estimada da variável Gasto de alimentação (Y) em função da Renda familiar (X) é
Qual o significado prático do valor da inclinação da reta de regressão do item (c)?
O valor =0,256 significa que estima-se que para cada aumento de uma unidade monetária da renda familiar ocorre um acréscimo em média de 0,256 unidades no gasto com alimentação. 
Exercício 03 - Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada substância no sangue está bem calibrado. Para isto, ele tomou 15 amostras de concentrações conhecidas (X) e determinou a respectiva concentração através do instrumento (Y), obtendo:
	X
	2,0
	2,0
	2,0
	4,0
	4,0
	4,0
	6,0
	6,0
	6,0
	8,0
	8,0
	8,0
	10,0
	10,0
	10,0
	Y
	2,1
	1,8
	1,9
	4,5
	4,2
	4,0
	6,2
	6,0
	6,5
	8,2
	7,8
	7,7
	9,6
	10,0
	10,1
(a) Construa o diagrama de dispersão para esses dados. 
(b) Trace no gráfico a reta com 45º de inclinação passando pela origem. Como essa reta pode ser útil na avaliação do instrumento? 
Esta reta é útil, pois, quanto mais próximos os pontos estiverem nela, maior à precisão do instrumento, já que o ideal é Y=X.
(c) Calcule o coeficiente de correlação entre as variáveis X e Y. 
 
(d) Obtenha a reta de regressão da variável Y em função de X. 
A reta de regressão estimada da variável Y e X é
(e) Com base nos itens anteriores tire conclusões sobre a eficiência do instrumento.
Com base nos itens anteriores, nota-se que, o instrumento para medir a concentração de determinada substância no sangue encontra-se bem calibrado. Observa-se que existe uma alta correlação entre as medidas feitas pelo instrumento e a concentração da determinada substância, o que pode ser confirmado nos gráficos apresentados anteriormente. Além disso, a reta de regressão obtida é bem próxima da reta Y=X, indicando grande proximidade entre as medidas. O método formal para verificar se o instrumento esta bem calibrado é testar as hipóteses:(α=0,05)
Estatística do teste:
R.C. (α=0,05)
Valores observados
Como , então aceita-se Ho. Ou seja, o instrumento esta bem calibrado.

Continue navegando