Baixe o app para aproveitar ainda mais
Prévia do material em texto
57 Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 MateMática aplicada Unidade III Ajustes de CurvAs 5 Ajuste de CurvAs É um método que consiste em encontrar uma curva que se ajuste a uma série de pontos. Existem vários métodos para realizar esse ajuste, como o método dos mínimos quadrados, o método da máxima verossimilhança e o método do máximo coeficiente de correlação linear. A escolha do método deve levar em consideração o modelo matemático de ajuste de curvas, tais como: ajuste linear simples, ajuste linear múltiplo, ajuste exponencial, ajuste geométrico, ajuste hiperbólico, entre outros. Consideremos n pontos do ℝ², não todos situados na mesma vertical, e cujas coordenadas são: (x1, y1), (x2, y2), (x3, y3) ... (xn, yn) conforme a figura a seguir. O problema consiste em encontrar uma reta que se ajuste a esses pontos. Volume de produção de venda y 0 x (xn,yn) dn d4 d2 d1 d3 dn (x4,y4) (x3,y3) (x2,y2) (x1,y1) Figura 59 Essa nuvem de pontos é conhecida como gráfico de dispersão. Há inúmeras maneiras de se encontrar a reta que mais se aproxima, inclusive usando uma régua, por exemplo. Contudo, uma maneira simples e de qualidade é o método dos mínimos quadrados. A ideia básica desse método consiste em considerar o modelo mais simples de relacionar duas variáveis x e y, que é a equação de uma reta dada pela sentença y = Ax + B, e que tornará mínima a soma dos quadrados dos desvios ((d1)² + (d2)² + (d3)² + (d4)² + ... + (dn)²), onde di = yi – (Axi + B). Tal reta é chamada de reta de mínimos quadrados, cuja equação iremos determinar. 58 Unidade III Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 Os dados a serem ajustados são os (xi, yi), de forma tal que a distância vertical di seja a menor possível. A partir dessas distâncias, define-se que D é igual a somatória do quadrado dessas diferenças, isto é, D(A, B) = ∑ (di)² = ∑(yi – (Axi + B))². Portanto, temos que: D(A, B) = ∑(yi – Axi – B)². Os pontos críticos de D são obtidos resolvendo-se o sistema: D(A) = 2∑(yi – Axi – B)(-xi) = 0 D(B) = 2∑(yi – Axi – B)(-1) = 0 Ou seja: ∑(xiyi – (Axi)² - Bxi) = 0 ⇔ ∑xiyi - A∑(xi)² - B∑ ∑(yi – Axi – B) = 0 ∑yi - A∑xi – nB = 0 A solução do sistema é: A xy x y n x x n e B yi n A xi n = ∑ − ∑ ∑ ∑ − ∑ = ∑ − ∑ ( )( ) ( )2 2 O método dos mínimos quadrados, basicamente, consiste em obter-se a curva, dentro de uma família de curvas pré-estabelecidas, que minimiza esse desvio. Lembrete Quando usamos funções do primeiro grau para representar essas curvas, temos as retas, e no caso das funções quadráticas teremos as parábolas. Exemplo: 1) Um comerciante deseja obter uma equação de demanda para o seu produto. Ele admite que a quantidade média demandada (y) se relaciona com o seu preço unitário (x) por meio de uma função do 1º grau y = ax + b. Para estimar essa reta, fixou os preços em vários níveis e observou a quantidade demandada, obtendo os dados a seguir: 59 Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 MateMática aplicada Tabela 3 preço unitário (x) 1 2 3 4 quantidade demandada (y) 10 8 5 3 Qual a equação da reta de mínimos quadrados? Solução: Inicialmente, vamos escrever a seguinte tabela de dados: Tabela 4 x y x•y x² 1 10 (1)(10) = 10 1² = 1 2 8 (2)(8) = 16 2² = 4 3 5 (3)(5) =15 3² = 9 4 3 (4)(3) = 12 4² = 16 ∑x = 10 ∑y = 26 ∑xy = 53 ∑x² = 30 Temos que n = 4 (quantidade de dados fornecidos). a xy x y n x x n b y n a = ∑ − ∑ ∑ ∑ − ∑ − − = − = ∑ − ( )( ) ( ) ( )( ) ( ) , 2 2 2 53 10 26 4 30 10 4 2 4 ∑ = − − = x n 26 4 2 4 10 4 12 5( , ) , Logo, a equação da reta procurada é y = 12,5 – 2,4x 5.1 tipos de ajustes de curvas O tipo de ajuste mais simples é o ajuste linear ou regressão linear, que relaciona duas variáveis x e y, e o modelo matemático usado é a equação de uma reta: y = A + Bx, onde A e B são os parâmetros do modelo. No caso em que precisamos relacionar uma variável dependente y com p variáveis independentes, o tipo de ajuste é chamado de ajuste linear múltiplo, representado por: y = β0 + β1.x1 + β2.x2 + ... + βp.xp onde β0 , β1 , ..., βp são os parâmetros do modelo. 60 Unidade III Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 Quando o modelo usado para o ajuste da curva não é uma reta, e sim uma parábola, o tipo de ajuste que usamos é a regressão quadrática dada por: y = Ax² + Bx + C onde A, B e C são os parâmetros do modelo. Qualquer que seja o tipo de ajuste, precisamos de métodos para calcular esses parâmetros e encontrar a solução. Dependendo do caso, da quantidade de variáveis e parâmetros, o cálculo não é tão simples e precisamos de recursos computacionais para resolver o problema. Observação Existem diversos softwares com as fórmulas programadas, com os quais só precisamos fornecer os dados para obter os resultados. Entre eles, o mais popular é o Excel, da Microsoft. 5.2 regressão linear Em análise estatística, a metodologia que estuda a relação entre diversas variáveis quantitativas ou qualitativas, de modo que uma variável pode ser predita a partir de outra variável (ou outras variáveis), é conhecida como análise de regressão. Em outras palavras, não estamos querendo apenas analisar a associação existente entre duas variáveis quantitativas (ou qualitativas), mas queremos justificar a nossa hipótese a respeito da provável relação de causa e efeito entre essas variáveis, ou seja, queremos saber se a variável X depende da variável Y. A análise de regressão é usada com a finalidade de previsão. Nesse caso, queremos prever o valor da variável X em função da variável Y. Outra finalidade é o de estimar o quanto a variável Y influencia ou modifica a variável X. O caso mais simples de regressão é quando temos duas variáveis e a relação entre elas pode ser representada por uma linha reta, que chamamos de regressão linear simples ou ajuste linear simples. b1 = y 0 x + 1x yi = b0 + b1xi b0 ∆x=1 ∆v ∆y ∆x Figura 60 61 Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 MateMática aplicada b0 é o coeficiente linear, também chamado intercepto, é o valor que y assume quando x for zero. Quando a região experimental inclui x = 0, então b0 é o valor da média da distribuição de y em x = 0. b1 é o coeficiente angular, expressa a taxa de mudança em y, isto é, é a mudança em y quando ocorre a mudança de uma unidade em x. Ele indica a mudança na média da distribuição de probabilidade de y por unidade de acréscimo em x. O ajuste linear múltiplo aplica-se nos casos em que y é uma função linear de duas ou mais variáveis lineares. Nesse caso, procura-se calcular os valores de b0, b1, b2 ,b3, ... , bn tais que a relação entre eles seja aproximada por uma expressão do tipo: y = b0 + b1x1 + b2x2 + b3x3 + ... + bnxn. No caso do ajuste linear múltiplo, resolver o sistema de equações normais é resolver o sistema: p x x x xn x x x x x x x x xn x Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ 1 2 3 1 1 1 1 2 1 3 1 2 � ( )( ) ( )( ) ( )( ) ( )( ) (xx x x x x x x xn x x x x x 2 1 2 2 2 3 2 3 3 1 3 2 )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( Σ Σ Σ Σ Σ Σ Σ xx x x xn xn xn x xn x xn x xn 3 3 3 1 2 3 )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( ) Σ Σ Σ Σ Σ Σ � � � � � �(( ) ( xn b b b b bn y y = 0 1 2 3 � Σ Σ ))( ) ( )( ) ( )( ) ( )( ) x y x y x y xn 1 2 3 Σ Σ Σ � Exemplo: 1) Determinar a equação do tipo y = b0 + b1x1 + b2x2 que melhor se ajusta à tabela a seguir: Tabela 5 x1 -1 0 1 2 4 5 5 6 x2 -2 -1 0 1 1 2 3 4 y2 13 11 9 4 11 9 1 -1 Solução: 8 22 8 22 108 57 8 57 36 0 1 2 57 92 5 = − b b b Portanto, temos que: b b b 0 1 2 4 2 3 4 6 5 = − , , , e a função de ajuste é y = 4,2 + 3,4x1 – 6,5x2. 62 Unidade III Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 Lembrete O caso do ajuste polinomial consiste em determinar um polinômio (que pode ser de qualquer grau). Quando se trata de um polinômio do 2º grau, dizemos que o ajuste é uma regressão quadrática. y = b0 + b1x1 + b2x2 + b3x3 + ... + bnxn Para resolver o ajuste polinomial, usamos o método do ajuste linear múltiplo, com a seguinte adaptação: x1 = x1, x2 = x2, x3 = x3, ... , xn = xn Portanto o sistema fica assim: p x x x x x x x x x x x x x x x x x n n n Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ 1 2 3 1 2 3 4 1 2 3 4 5 2 3 4 5 � + + xx x x x x x x n n n n n n 6 3 1 2 3 2 Σ Σ Σ Σ Σ Σ + + + + � � � � � � bb b b b bn y y x y x y x 0 1 2 3 1 2 3 � � = Σ Σ Σ Σ ( )( ) ( )( ) ( )( ) ΣΣ( )( )y xn Exemplo: 1) Ajustar os pontos da tabela a uma expressão do tipo y = b0 + b1x + b2 x². Tabela 6 x -2.0 -1.5 0 1 2.2 3.1 y -30.5 -20.2 -3.3 8.9 16.8 21.4 Solução: 6 2 8 217 2 8 21 7 30 064 21 7 30 064 137 841 0 1 2 , , . . . . . . b b b = − 6 9 203 5 128 416 . . . A solução é: b b b 0 1 2 2 018 11 332 1 222 = − − . . . 63 Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 MateMática aplicada 5.3 Qualidade do ajuste na regressão A qualidade de um ajuste linear pode ser verificada em função do coeficiente de determinação R², dado por: R yi a bxi yi n yi Onde R2 2 2 2 21 1 0 1= − − − − ≤ ≤ Σ Σ Σ ( ) ( ) ( ) : R² = proporção da variabilidade de y que é explicada pelo modelo (reta de regressão). Se R² = 0,90 significa que 90% da variação em y pode ser explicada pela equação obtida. Quanto mais próximo o coeficiente de determinação estiver de 1, melhor será o ajuste. Lembrete A regressão padrão é o instrumento mais poderoso quando a variável independente, X, é numérica. Já a análise da variância é adequada quando a variável independente é um conjunto de categorias não ordenadas. 6 MedidAs de dispersãO Medidas de dispersão são medidas usadas para nos dizer o quanto os valores analisados estão distantes (dispersos) do valor real. A mais comum é a média. Na realidade, a média é uma medida de tendência central, e o seu valor é calculado por meio da soma dos valores dados, dividida pelo número de dados. Em determinadas análises, ela não é suficiente, pois podemos ter dois grupos distintos com uma dispersão diferente e mesmo assim o valor da média ser igual. Por exemplo, os dados observados do grupo A = 3,3,3 e os dados do grupo B = 1,3,5. A média nos dois grupos é a mesma e igual a 3, mas a variação dos dados observados no grupo A é diferente da variação observada no grupo B. Nesse caso, além de usar a medida de tendência, é aconselhável usar medidas de dispersão para uma análise mais completa. As mais usadas são a variância e o desvio padrão. A variância é a soma dos quadrados dividida pelo número de observações do grupo menos 1. E o desvio padrão é a raiz quadrada da variância. Variância = ∑ (xi – Média)2 / (n – 1) Quanto menor for o valor da variância, mais próximo da média estarão os dados observados, em contrapartida, quanto mais variação existir entre os dados observados, maior será o desvio padrão. 64 Unidade III Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 Propriedades do desvio padrão: a) somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o desvio padrão não se altera; b) multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado (ou dividido) por essa constante. saiba mais Software com linguagem matemática e simulação: <http://www. mathworks.com/academia/student_version/>. Acesso em: 11 abr. 2012. 6.1 Coeficiente de variação O coeficiente de variação é usado para analisar e caracterizar a dispersão dos dados observados com relação ao seu valor médio, isto é, o coeficiente de variação é a razão entre o desvio padrão e a média dos dados observados. Coeficiente de variação = (desvio padrão / média) x 100 Exemplo: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos: Tabela 7 Discriminação Média Desvio padrão Estaturas 175 cm 5,0 cm Pesos 68 Kg 2,0 Kg Qual das medidas (estatura ou peso) possui maior homogeneidade? Solução: Teremos que calcular o coeficiente de variação da estatura e o do peso. O resultado menor será o de maior homogeneidade (menor dispersão ou variabilidade). • Coeficiente de Variação da estatura = (5 / 175 ) x 100 = 2,85 % • Coeficiente de Variação do peso = (2 / 68 ) x 100 = 2,94 %. Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos. 65 Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 MateMática aplicada 6.2 Correlação entre variáveis Para analisar como os valores entre duas variáveis estão relacionados, podemos observar um diagrama de dispersão ou analisar os resultados por meio de uma equação. A partir da análise do diagrama de dispersão, podemos verificar se a correlação entre as duas variáveis é: • linear positiva, isto é, os pontos do diagrama têm como imagem uma reta ascendente; • linear negativa, isto é, os pontos têm como imagem uma reta descendente; • não linear, isto é, os pontos têm como imagem uma curva; • não há relação, isto é, os pontos não dão ideia de uma imagem definida. 6.3 Coeficiente de correlação linear Proposto por Karl Pearson, o coeficiente de correlação (ou “r de Pearson’) é usado para obter a medida da correlação linear. Ele indica o grau de intensidade da correlação entre duas variáveis e o sentido dessa correlação, isto é, se a correlação é positiva ou negativa. r n xy x y n x x n y y = − − − Σ Σ Σ Σ Σ Σ Σ2 2 2 2( ) ( ) Onde: n = número de observações. Os valores limites de r são -1 e +1. Observação • r = -1 (correlação linear negativa); • r = 0 (Os pontos não estão correlacionados); • r = +1 (correlação linear positiva). Exemplos de coeficiente de correlação: * * * * * * * * * * * * * * * * * * * * * * Correlação linear perfeitae negativa r = -1 Correlação linear perfeita e positiva r = 1 Variáveis não correlacionadas r = 0 Figura 61 66 Unidade III Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 saiba mais A disciplina Estatística é muito extensa e fascinante, com diversas aplicações. No filme O homem que mudou o jogo – título original Moneyball, o gerente geral de um time de basebol quer montar um time competitivo e esbarra nas dificuldades financeiras. Para contratar jogadores, ele usa a estatística para analisar cada um deles. resumo Ao final desta unidade, você deverá ser capaz de realizar algumas análises sobre dados coletados, tais como, calcular a média, a variância e o desvio padrão, criar diagramas de dispersão e fazer ajustes de curvas. Para uma boa gestão, você fará uso dessas técnicas para tomar decisões precisas e calculadas. A partir dos conceitos de regressão linear, é possível tirar conclusões sobre a análise das informações, por exemplo, sobre a variação dos custos de um projeto de TI. exercícios Questão 1. Em um estudo da relação entre a resistência (y) de um determinado tipo de plástico e o tempo [x (em horas)] decorrido a partir da conclusão do processo de modelagem até o momento de medição da resistência do plástico, obteve-se a tabela a seguir: Tabela 8 i 1 2 3 4 5 6 7 8 9 10 11 12 xi 32 48 72 64 48 16 40 48 48 24 80 56 yi 230 262 323 298 255 199 248 279 267 214 359 305 A reta de regressão linear obtida pelo método de mínimos quadrados que melhor representa a relação entre x e y é: A y x B y x C y x D ) , , ) , , ) , , = + = + = − 153 917 2 417 2 417 153 917 153 917 2 417 )) , , ) , y x E y x = − = 2 417 153 917 2 417 ℝesposta correta: alternativa A. 67 Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 MateMática aplicada Análise das alternativas: Para resolvermos a questão, consideremos o modelo de regressão linear simples: y xi i i= + +β β ε0 1 , com { , , ..., }εi i n=1 , com E i[ ] ,ε = 0 Var ii[ ] ,ε σ= ∀ 2 . Denotemos por β β0 1 ^ ^ ( )a estimativa dos mínimos quadrados do coeficiente β β0 1( ) . Dado que: x y x y x y i i i i i i i i = = = = ∑ ∑ ∑ = = = = = 1 12 1 12 2 1 12 2 576 3239 48 269 917 31488 , 11 12 1 12 897639 164752∑ ∑= = = x yi i i vem que: β^ ,1 1 12 2 1 12 2 12 12 164752 12 48 269 917 3148 = − − = − × × = = ∑ ∑ x y xy x x i i i i i 88 12 48 2 417 269 917 2 417 48 153 917 2 0 1 − × = = − = − × = , , , , ^ ^β βy x Logo, y E y x x x y x ^ ^ ^ ^ ^ [ / ] , , , ,= = + = + ⇒ = +β β0 1 153 917 2 417 153 917 2 417 Sendo assim, A) Alternativa correta. Justificativa: de acordo com os cálculos. B) Alternativa incorreta. Justificativa: de acordo com os cálculos. C) Alternativa incorreta. Justificativa: de acordo com os cálculos. D) Alternativa incorreta. Justificativa: de acordo com os cálculos. E) Alternativa incorreta. Justificativa: de acordo com os cálculos. 68 Unidade III Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 Questão 2. Existe uma correlação entre duas variáveis quando uma delas está de alguma forma relacionada com a outra. Considerando-se correlações lineares entre duas variáveis x e y, os gráficos I, II, III, IV, V, VI, VII e VIII referem-se respectivamente a: y x (I) y x (II) y x (III) x y (IV) x y (V) y x (VI) x y (VII) x y (VIII) A) Fraca correlação positiva entre x e y, forte correlação positiva entre x e y, correlação positiva perfeita entre x e y, fraca correlação positiva entre x e y, forte correlação negativa entre x e y, correlação negativa perfeita entre x e y, não-correlação entre x e y e correlação não-linear entre x e y. B) Fraca correlação negativa entre x e y, forte correlação negativa entre x e y, correlação negativa perfeita entre x e y, fraca correlação positiva entre x e y, forte correlação positiva entre x e y, correlação positiva perfeita entre x e y, não-correlação entre x e y e correlação não-linear entre x e y. C) Fraca correlação positiva entre x e y, forte correlação positiva entre x e y, correlação positiva perfeita entre x e y, fraca correlação negativa entre x e y, forte correlação negativa entre x e y, correlação negativa perfeita entre x e y, correlação não-linear entre x e y e não-correlação entre x e y. 69 Re vi sã o: V irg in ia - D ia gr am aç ão : F ab io - 1 4/ 05 /1 2 MateMática aplicada D) Fraca correlação negativa entre x e y, forte correlação negativa entre x e y, correlação negativa perfeita entre x e y, fraca correlação positiva entre x e y, forte correlação positiva entre x e y, correlação positiva perfeita entre x e y, correlação não-linear entre x e y e não-correlação entre x e y. E) Fraca correlação positiva entre x e y, forte correlação positiva entre x e y, correlação positiva perfeita entre x e y, fraca correlação negativa entre x e y, forte correlação negativa entre x e y, correlação negativa perfeita entre x e y, não-correlação entre x e y e correlação não-linear entre x e y. Resolução deste exercício na plataforma.
Compartilhar