Prévia do material em texto
Métodos Quantitativos Métodos Quantitativos Resumo Unidade de Ensino: 4 Competência da Unidade de Ensino: Compreender a relação entre duas variáveis. Resumo: Nessa unidade você estudará a relação entre duas variáveis, de modo a ter a possibilidade de prever resultados futuros ou inferir valores não amostrados de uma população. Palavras-chave: correlação entre variáveis quantitativas; teste de significância; regressão linear; estudando resíduos Título da teleaula: Estatística inferencial (parte I) Teleaula nº: 4 Muitas das pesquisas e investigações que realizamos têm o objetivo de verificar a existência de relação entre duas variáveis. A relação entre duas variáveis é forte ou fraca? A relação é direta ou inversa? Como medimos a relação entre duas Variáveis? Contextualização da teleaula Fonte: https://goo.gl/qlUNFE. Acessado em 10/03/2017. Imagine que você é um funcionário da empresa M e que foi incumbido de realizar uma pesquisa para determinar o perfil dos 30 mil funcionários. Foi perguntado aos funcionários da empresa M qual era a avaliação deles em relação às condições de trabalho e à remuneração. Contextualização da teleaula Será que essas variáveis estão relacionadas? Quanto maior a remuneração, maior a satisfação do funcionário? Será que essas variáveis estão relacionadas? Quanto maior a remuneração, maior a satisfação do funcionário? Conhecimentos conceituais: Função afim. Conhecimentos Procedimentais: Operações aritméticas básicas; Construção de gráficos. Conhecimentos prévios Uma função afim é uma função cuja lei de formação é , em que , não nulo, é denominado coeficiente angular e é denominado coeficiente linear. A representação gráfica de uma função afim sempre é uma reta Conhecimentos prévios Função afim Planilha eletrônica Excel: 1. Inserir os pares ordenados (x, y). 2.Inserir gráfico de dispersão. Conhecimentos prévios Gráfico de dispersão Correlação entre variáveis quantitativas Imagine que você é funcionário da empresa M e que necessita avaliar a relação existente entre a satisfação em relação às condições de trabalho e a satisfação em relação à remuneração. Será que, quanto maior é a satisfação em relação à remuneração, mais satisfeitos ficam os funcionários em relação às condições de trabalho? Situação-problema 1 Fonte: https://goo.gl/qlUNFE. Acessado em 10/03/2017. Para tanto, considere a seguinte amostra de funcionários da empresa M Situação-problema 1 Situação-problema 1 A tabela a seguir representa a produção mensal de aço de uma siderúrgica nos últimos 4 meses, expressa em milhares de toneladas. Correlação entre variáveis quantitativas Se denominarmos X a variável mês e Y a variável produção, também podemos escrever as informações anteriores da forma (X, Y). Correlação entre variáveis quantitativas Representação dos pontos no plano cartesiano Correlação entre variáveis quantitativas Uma vez aceita a hipótese de relação de dependência entre duas variáveis, surgem duas perguntas básicas: 1ª) Essa relação é forte ou fraca? 2ª) De que forma podemos mensurar essa relação? Correlação: diz-se que duas variáveis estão correlacionadas quando existe uma relação de dependência entre elas. Correlação entre variáveis quantitativas Correlação linear: Duas variáveis estão correlacionadas linearmente quando a relação entre elas pode ser representada graficamente por meio de uma reta. Correlação entre variáveis quantitativas Se r > 0, a correlação entre X e Y é positiva, e quanto mais próximo r estiver de + 1, mais fortemente as variáveis estão correlacionadas. Se r < 0, a correlação entre X e Y é negativa, e quanto mais próximo r estiver de - 1, mais fortemente as variáveis estão correlacionadas. Se r = 0, não há correlação entre X e Y Classificação da relação entre as variáveis a partir de r Correlação entre variáveis quantitativas Utilizando a fórmula: Calcule o coeficiente de correlação para as variáveis X e Y e classifique as variáveis quanto à correlação. Correlação entre variáveis quantitativas Correlação entre variáveis quantitativas Resolução: Correlação entre variáveis quantitativas Resolução: 1ª parte: 2ª parte: 3ª parte: Correlação entre variáveis quantitativas Resolução: Correlação entre variáveis quantitativas Utilizando uma calculadora científica Resolvendo a situação-problema 1 Calculadora científica 1º + + 2º + + 3º Inserir os pares ordenados. Ex.:(2, 3 ) + + + 4º + Resolvendo a situação-problema 1 Shift Shift Mode 3 Mode 3 1 2 , 3 M+ 2 1 r Medindo o grau de associação de H e G. Resolvendo a Situação-Problema 1 Utilizando uma planilha eletrônica Planilha eletrônica Excel: 1. Inserir os pares ordenados (x, y). 2.Inserir gráfico de dispersão. 3. Adicionar linha de tendência. 4. Exibir valor de R-quadrado no gráfico Resolvendo a situação-problema 1 Portanto, as variáveis H e G estão correlacionadas positivamente e, além disso, essa correlação é forte. Resolvendo a situação-problema 1 Classifique as variáveis X e Y como correlacionadas positivamente, correlacionadas negativamente ou não correlacionadas. Teste de significância Verificamos anteriormente que o coeficiente de correlação para a amostra apresentada é , e afirmamos que nesse caso a correlação é forte. A fim de sustentarmos essa afirmação, precisamos testá-la. Para isso, que procedimentos devemos adotar? Situação-problema 2 Fonte: https://goo.gl/qlUNFE. Acessado em 10/03/2017. Conhecendo-se o valor de r, podemos testar a significância. Passo 1 (elaborar as hipóteses) (não há correlação negativa significante) (correlação negativa significante) (não há correlação positiva significante) (correlação positiva significante) Teste de significância Passo 2 (determinar a estatística de teste) Com graus de liberdade Passo 3 (fixar o nível de significância) até 5% Teste de significância Passo 4 (calcular a estatística a partir da amostra) Passo 5 (tomar uma decisão) Teste de significância Para testar a significância de r, executamos os seguintes passos: Passo 1 (elaborar as hipóteses) (não há correlação positiva significante) (correlação positiva significante) Passo 2 (determinar a estatística de teste) Resolvendo a Situação-problema 2 Com graus de liberdade. Passo 3 (fixar o nível de significância) Suponha Passo 4 (calcular a estatística a partir da amostra) Rejeitaremos a hipótese caso o valor obtido a partir da amostra seja muito maior que ou, ainda, quando pertencer à região crítica , em que t é obtido na tabela T. Resolvendo a Situação-problema 2 Observando a tabela na linha e na coluna correspondente à probabilidade 5%, temos Logo, Obtivemos a partir de uma amostra de tamanho n = 20, logo, calculamos: Resolvendo a Situação-problema 2 Resolvendo a Situação-problema 2 Passo 5 (tomar uma decisão) Como decidimos rejeitar isto é, há indícios suficientes que nos permitem considerar a correlação entre G e H positivamente significante. Resolvendo a Situação-problema 2 Regressão Linear Imagine que você seja um funcionário da empresa M e que foi incumbido de descrever o perfil dos funcionários. A partir da tabela a seguir, é possível estabelecer uma relação matemática entre a satisfação em relação à remuneração e a satisfação em relação às condições de trabalho? Situação-problema 3 Um funcionário que avalie sua satisfação em relação à remuneração com a pontuação 9 avaliará com qual pontuação a satisfação em relação às condições de trabalho? Situação-problema 3 De 0 (insatisfeito) a 10 (muito satisfeito), qual é a sua satisfação em relação as condições de trabalho? De 0 (insatisfeito) a 10 (muito satisfeito), qual é a sua satisfação em relação a sua remuneração? A linha reta representada na figura abaixo, queé a reta de melhor ajuste, é denominada reta de regressão. O papel desempenhado por essa reta é o de representar geometricamente a associação entre as variáveis X e Y. Regressão Linear Uma linha reta é descrita matematicamente por uma equação do tipo , em que e são números desconhecidos a serem determinados. Os coeficientes e podem ser calculados pelas seguintes fórmulas: e Regressão Linear Existem fórmulas alternativas e equivalentes para calcular os coeficientes de regressão. São elas: Regressão Linear O coeficiente de correlação linear entre as variáveis G: satisfação em relação às condições de trabalho e H: satisfação em relação à remuneração é . Com um nível de significância de 95%, foi atestada a significância dessa correlação. Logo, faz sentido determinarmos a equação da reta de regressão: Resolvendo a Situação-Problema 3 Utilizando uma calculadora científica Utilizando uma planilha eletrônica Resolvendo a situação-problema 3 Calculadora científica 1º + + 2º + + 3º Inserir os pares ordenados. Ex.:(2, 3) + + + + 4º + Resolvendo a situação-problema 3 Shift Shift Mode 3 Mode 3 1 2 , 3 M+ 2 1 A 2 B Resolvendo a situação-problema 3 Planilha eletrônica Excel: 1. Inserir os pares ordenados (x, y). 2.Inserir gráfico de dispersão. 3. Adicionar linha de tendência. 4. Exibir equação no gráfico. Resolvendo a situação-problema 3 Em quais situações um Agrônomo poderia aplicar o conceito de regressão linear? Estudando resíduos É possível estabelecer um intervalo de confiança para a estimativa , obtida a partir de ? Quanto da variação de G é explicado pela variação de H e quanto é devido ao acaso e às características próprias de cada funcionário? Situação-problema 4 Fonte: https://goo.gl/qlUNFE. Acessado em 10/03/2017. O coeficiente de determinação (ou de explicação) é uma medida que tem por finalidade mensurar em termos percentuais, o quanto da variação de uma variável Y é devido à variação de X, supondo que essas variáveis sejam correlacionadas. Estudando resíduos Existe uma relação estreita entre o coeficiente de correlação r e o coeficiente de determinação. Essa relação é expressa por: Estudando resíduos Duas variáveis X e Y estão negativamente correlacionadas de modo que . Quanto da variação de Y pode ser explicado por sua correlação e variação de X? Exemplo Estudando resíduos Resolução: Coeficiente de determinação: Logo, 81% da variação de Y se deve à variação de X e que 19% se deve ao acaso Estudando resíduos Em estatística, sempre que é realizada uma estimativa pontual, como é o caso da previsão para feita por meio da reta de regressão em que , é natural pensarmos em construir um intervalo de confiança para a estimativa. Alguns autores também o denominam intervalo de previsão. IC= Estudando resíduos Dada a regressão linear suponha que ao nível de confiança de 95%, a margem de erro de previsão para seja . Determine o intervalo de confiança para o valor correspondente a . Exemplo Estudando resíduos Resolução: : Estudando resíduos O coeficiente de correlação dessas variáveis foi estimado em . Desse modo, apenas 50% da variação de G se deve à variação de H, e os outros 50% devem-se ao acaso. Resolvendo a Situação-Problema 4 Supondo: Nível de confiança de Intervalo de predição para Margem de erro Resolvendo a Situação-Problema 4 O intervalo de previsão para com 95% de confiança é: Resolvendo a Situação-Problema 4 Duas variáveis X e Y estão correlacionadas linearmente de modo que os valores de Y são previstos a partir de X por regressão linear. Sabendo que r =−0,75, determine o percentual da variação de Y não explicado pela variação de X. Recapitulando Correlações entre variáveis quantitativas; Teste de significância; Estudando resíduos; Regressão Linear. Recapitulando... Vamos refletir! Fonte: https://www.istockphoto.com/br/vetor/pequeno- menino-cabelo-loiro-imaginando-desenho-animado- personagem-vector-gm672162820-123211729. Acesso em 15 fev. 2019. Diálogo com os alunos Fonte: http://4.bp.blogspot.com/-PA- JjciYSiw/VWZJIH0oJpI/AAAAAAAABOI/BbSi6d7uj-E/s1600/Principios-Basico-de-la- PNL.jpg Acessado em 28/08/2018