Baixe o app para aproveitar ainda mais
Prévia do material em texto
Modelos matemáticos –método da regressão linear Docente: Ivana M. G. de Andrade INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO SUL DE MINAS GERAIS Bacharelado em Engenharia de Alimentos Disciplina: Controle e Otimização de Processos correlação entre variáveis A análise de correlação mede o grau de associação entre duas variáveis aleatórias quantitativas, descrevendo o comportamento conjunto de ambas. Exemplo: Numa situação de comparação entre dois métodos de análise, é desejável um coeficiente de correlação positivo e o mais próximo possível de 1 2 Método A Método B 2,07 2,05 2,42 2,43 2,81 2,85 3,03 2,98 2 3 correlação entre variáveis Coeficiente de correlação (r) A medida do grau de correlação entre duas variáveis pode ser obtida por meio do coeficiente de correlação de Person, representado por r e calculado pela seguinte expressão: 3 4 correlação entre variáveis Sx e Sy são chamados de variância: são a raiz quadrada das médias dos quadrados dos desvios: O valor de S2xy, que é conhecido como covariância entre as variáveis X e Y também fornece uma medida para o relacionamento entre X e Y: 4 Modelagem de experimentos Como visto anteriormente: Modelos matemáticos são equações ou sistemas de equações utilizados para PREVER resultados Exemplo: suponha que desejamos encontrar o relacionamento funcional entre uma variável Y e uma variável X - A FUNÇÃO LINEAR será do tipo y = f(x) São modelos lineares usando os parâmetros βo, β1 e β2: 5 5 Modelagem de experimentos Modelos estatísticos são aqueles que utilizam a estatística para determinar uma função que represente a tendência de comportamento de dados aleatórios - Exemplo: obtenção da reta por regressão linear simples diferentemente dos modelos matemáticos, não temos uma reta perfeita que alinhe todos os pontos necessidade de buscar a “RETA MAIS PRÓXIMA” Neste caso, os modelos lineares usando os parâmetros βo, β1 e β2 precisam de um “fator de correção”: 6 6 Modelagem de experimentos A reta da regressão linear simples Suponha que a equação abaixo descreve o relacionamento funcional linear entre as variáveis X e Y de um dado experimento: A resolução da equação envolve determinar βo e β1 7 7 Modelagem de experimentos Estimativa dos parâmetros βo e β1 Para a equação: Considere o método dos mínimos quadrados em que B0 e B1 serão dados por: 8 8 Modelagem de experimentos Exemplo 1: densidade ótica (x) e massa seca (y) para a levedura: 9 D.O. 0,2620 0,2878 0,3367 0,3902 0,4899 0,6196 0,8279 M.S. 0,1042 0,1191 0,1390 0,1668 0,2085 0,2779 0,4169 9 Modelagem de experimentos Podemos calcular os valores de B0 e B1: Considere o método dos mínimos quadrados em que B0 e B1 serão dados por: 10 10 Modelagem de experimentos Portanto, a reta que relaciona y e x, será Assim, no intervalo estudado, a cada acréscimo de uma unidade em x (densidade ótica) ocorre um acréscimo de B1=0,5399 unidades em y (massa seca em g/L). A Reta corta o eixo Y em B0 = -0,0433 11 11 Modelagem de experimentos 12 12 Modelagem de experimentos Exemplo 2: Atividade enzimática segundo a temperatura. A temperatura foi fixada para intervalos de 10°C. Neste caso, há uma variável independente fixa (fator), com seus níveis previamente fixados Busca-se determinar aqueles que otimizam as variáveis dependentes ou respostas r=0,36 indica fraca correlação linear positiva entre a temperatura e a atividade enzimática 13 Temp. 30 40 50 60 70 Atividade 158 292 393 456 215 13 Modelagem de experimentos Adotaremos códigos para descrever a temperatura, uma vez que ela foi previamente fixada variável codificada (C) Vamos subtrair a temperatura média (50°C) de todos os valores de T e dividir pelo espaçamento de T (δ =10): 14 Temp.:C -2 -1 0 1 2 Temp.: X 30 40 50 60 70 Atividade(Y) 158 292 393 456 215 Os valores codificados ci tem o apelo de coeficiente de contraste ortogonal essenciais estimação de parâmetros para a construção de superfícies de respostas! 14 Modelagem de experimentos Se determinarmos a equação da reta utilizando o mesmo procedimento de cálculo do exercício 1, obteremos a seguinte equação da reta: 15 Logo, a reta não representa o comportamento dos dados, devido ao baixo valor de r(0,36) 15 Modelagem de experimentos Vamos simplificar nossos cálculos, através do cálculo considerando a variável codificada. A equação será então: Em que: 16 16 Modelagem de experimentos Resolvendo: 17 Temp.:C -2 -1 0 1 2 Temp.: X 30 40 50 60 70 Atividade(Y) 158 292 393 456 215 17 Modelagem de experimentos 18 Teremos então uma reta ajustada aos valores da atividade enzimática! 18 Modelagem de experimentos Podemos transitar livremente entre um modelo e outro: Se: Logo: 19 19 Modelagem de experimentos Coeficiente de determinação ou coeficiente de explicação da reta (R2): - Quantifica a qualidade do ajustamento do modelo matemático aos dados experimentais. - De forma simplificada: - Exemplo 1: r = 0,9959 R2 = 99,18 % explica 99,18% da variação total inerente à quantidade de massa seca - Exemplo 2: r=0,36 R2= 12,96 % explica apenas 12,79% da variação inerente à atividade enzimática 20 20 Gráficos de superfície de resposta 21 21 experimentos fatoriais Docente: Ivana M. G. de Andrade INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO SUL DE MINAS GERAIS Bacharelado em Engenharia de Alimentos Disciplina: Controle e Otimização de Processos Noções introdutórias Experimentos delineados em esquemas fatoriais: São aqueles que envolvem combinações entre os níveis de duas ou mais variáveis independentes (fatores) variáveis que tiveram seus níveis fixados Exemplo: delineamento inteiramente casualizado de dois fatotes, cada qual com dois níveis - Fator A: “Temperatura “ com níveis “1” e “2” - Fator B: “pH” com níveis “1” e “2” Combinações: 23 A1B1 A1B2 A2B1 A2B2 23 Noções introdutórias Se A tem 3 níveis e B tem 2 níveis : Se ambos tem três níveis: 24 A1B1 A1B2 A2B1 A2B2 A3B1 A3B2 A1B1 A1B2 A1B3 A2B1 A2B2 A2B3 A3B1 A3B2 A3B3 24 Noções introdutórias De forma mais geral: Para K sendo o número de fatores (variáveis independentes) e N sendo o número de níveis esquema fatorial completo, será: Que representa o número de ensaios, tratamentos ou combinações possíveis: 25 Fatores Níveis k=2 k=3 k=K 2 22=4 23=8 2k 3 32=9 33=27 3k N N2 N3 Nk NK 25 Noções introdutórias Logo, pode-se notar que quanto maior o número de variáveis independentes e de níveis a serem estudados 26 Haverá um crescimento exponencial do número de testes!!! Inviabilidade de estudar esquemas fatorais completos para valores grande de N e K. 26 Noções introdutórias “Pré-seleção” através de delineamentos com base em frações de fatoriais 27 Obtém os FATORES e/ou NÍVEIS que realmente conduzem a RESPOSTAS EXPERIMENTAIS ÓTIMAS! 27 delineamento eM ESQUEMA FATORAL 2K A fim de se otimizar o número de testes em um estudo, serão analisados k fatores, todos com dois níveis: Delineamentos deste tipos são muito utilizados em laboratórios e/ou locais onde as FONTES EXTERNAS DE VARIAÇÃO, são geralmente, muito bem controladas. 28 2K 28 fatorial 22 com interação não significativa Suponha um teste laboratorial para estudar a atividade enzimática em função: - do pH (fator A) com dois níveis: baixo (-) e alto (+) - da temperatura com dois níveis: baixa (-) e alta (+) O teste será feito em três repetições 29 Fatores Tratamentos Atividade enzimática Totais Médias A (pH) B (T) 1 2 3 - - 1 218 212 170 600 200 + - a 67 73 76 216 42 - + b 402 399 411 1212 404 + + ab 222 258 270 750 250 29 fatorial 22 com interação não significativa A descrição esquemática das médias dos resultados experimentais, seria: 30 B + - A - + b=404 ab=250 (1)=200 a=72 30 fatorial 22 com interação não significativaEfeitos principais do pH, temperatura e interação sobre as respostas: - Efeito do fator A entendido como a variação causada na resposta, quando percorremos todos os níveis de A, independentemente dos demais fatores - Efeito do pH: diferença entre a atividade enzimática média no nível alto e no nível baixo (ver tabela) 31 A passagem do nível (-) para o nível (+) do pH causou uma diminuição de 141,0 U/mL, na média da atividade enzimática! 31 fatorial 22 com interação não significativa A relação definida no numerador da estimativa do efeito na equação é denominada de CONTRASTE: No caso do pH: Contraste: (a+ab) – (1+b) = a + ab – 1- b 32 Numeradores! 32 fatorial 22 com interação não significativa Contraste gerador da estimativa do pH: 33 Tratamentos a ab (1) b Soma Coeficientes +1 +1 -1 -1 0 Quadrados 1 1 1 1 4 33 fatorial 22 com interação não significativa Efeito da temperatura: diferença entre a atividade enzimática média no nível alto e no nível baixo (ver tabela) Contraste da temperatura: b + ab – 1- a 34 A passagem do nível (-) para o nível (+) da T causou um acréscimo de 191,0 U/mL, na média da atividade enzimática! 34 fatorial 22 com interação não significativa Contraste gerador da estimativa da Temperatura: 35 Tratamentos b ab (1) a Soma Coeficientes +1 +1 -1 -1 0 Quadrados 1 1 1 1 4 35 fatorial 22 com interação não significativa - Se construímos uma tabela com as médias da atividade enzimática, segundo o pH e a temperatura, teremos: 36 Temperatura Níveis de pH Médias marginais segundo a Temperatura - + - 200 72 yT- = 136 + 404 250 yT+ = 327 Médias marginais segundo o pH ypH- = 302 ypH+ = 161 y=231,5 (média das médias) 36 fatorial 22 com interação não significativa Efeito da interação: No modelo simples do exemplo adotado, têm-se uma INTERAÇÃO DE PRIMEIRA ORDEM uma interação entre os níveis de dois fatores O efeito da interação de primeira ordem é entendido como a variação causada na resposta, quando se faz variar os níveis de um dos fatores “dentro” de cada nível do outro. 37 37 fatorial 22 com iteração não significativa A estimativa do efeito da interação pode ser obtida como a diferença entre as médias determinadas pelas diagonais: Contraste da interação: ab + 1 – a - b 38 B + - A - + b=404 ab=250 (1)=200 a=72 38 fatorial 22 com interação não significativa Contrastes com totais: Na construção dos contrastes, poderíamos ter utilizado os TOTAIS ao invés das médias apenas acrescentar o número de repetições (r=3): 39 Contrastes Totais Valor do contraste Soma dos quadrados dos coeficientes Aa+ab-(1)-b 216+750-600-1212 -846 4 Bb+ab-(1)-a 1212+750-600-216 1146 4 ABab+(1)-a-b 750+600-216-1212 -78 4 39 fatorial 22 com iteração não significativa Ajuste do modelo matemático Um modelo matemático linear utilizado no relacionamento funcional entre variáveis pode ser dado por: x são variáveis “codificados” (no caso, x1 e x2) X valores realmente utilizados no experimento No presente exemplo: x1 e x2 assumem ambos os valores: -1 (correlação linear negativa perfeita) e 1 (correlação linear positiva perfeita). 40 40 fatorial 22 com iteração não significativa Ajuste do modelo matemático Podemos estimar o valor da variável resposta Y para algum valor da variável independente X, pertencente ao intervalo já utilizado no experimento. 41 Um fato importante a ser ressaltado é que podemos obter os valores estimados para as respostas (no caso, atividade enzimática), através do MODELO AJUSTADO Válido para valores da variável independente (pH e Temp) dentro do intervalo estudado. 41 fatorial 22 com iteração não significativa Os parâmetros βo, β1, β2 e β12 são parâmetros do modelo de regressão que serão estimados: βo para fins práticos, será a média geral das respostas βo = y = 231,5 Os demais parâmetros, serão iguais às metades das estimativas dos efeitos correspondentes: 42 42 fatorial 22 com iteração não significativa Sendo assim, o modelo que descreve o comportamento da atividade enzimática em função da variação do pH (x1) e da Temperatura (x2), será dado por: Em que x1 e x2 são variáveis codificadas. 43 43 Análise de variância aplicada ao ajuste do modelo Deseja-se agora aplicar uma análise de variância ao modelo obtido por regressão linear para se testar as seguintes hipóteses: - Ausência de regressão linear hipótese de que a reta obtida é paralela ao eixo X (ausência de inclinação) Há regressão linear hipótese de que a reta obtida é NÃO É paralela ao eixo X (presença de inclinação) O parâmetro β1 é o que corta o eixo X, portanto: Ho: β1 = 0 versus Ha: β1 ≠ 0 44 44 Análise de variância aplicada ao ajuste do modelo Uma tabela de análise de variância (ANOVA) típica será: 45 Fontes de variação Graus de liberdade:GL Soma dos quadrados:SQ Quadrados médios: QM F calculado: Fcalc Regressão linear: RL 1 QMRL/QMRes Resíduo: Res. n-2 Total n-1 - 45 Análise de variância aplicada ao ajuste do modelo No entanto, a soma dos quadrados relacionados ao fatores (pH e T), podem ser calculadas através dos respectivos contrastes construídos com os totais: 46 Em que: 4 soma dos quadrados dos coeficientes do contraste r número de repetições 46 Análise de variância aplicada ao ajuste do modelo Logo: 47 Contrastes Totais Valor do contraste Soma dos quadrados dos coeficientes Aa+ab-(1)-b 216+750-600-1212 -846 4 Bb+ab-(1)-a 1212+750-600-216 1146 4 ABab+(1)-a-b 750+600-216-1212 -78 4 47 Análise de variância aplicada ao ajuste do modelo Por sua vez, a SQ Total corrigida e a SQ Resíduo são calculadas como mostrado na tabela: SQ Total corrigida: SQ Resíduo: 48 48 Análise de variância aplicada ao ajuste do modelo A tabela da ANOVA para o exemplo será: 49 Fontes de variação GL SQ QM Fcalc Hipóteses pH 1 59643,00 59643,00 QMRL/QMRes =59643/342 =174,39 Ho: β1=0 Temp 1 109443,00 109443,00 =109443/342 =320,01 Ho :β2=0 pH x Temp 1 507,00 507,00 =507/342 =1,48 Ho :β12=0 Resíduo n-4=12-4 =8 2736,00 2736/8 =342 Total n-1=12-1 =11 172329,00 - 49 50 Se Fcal> ou = Ftab (1;8,α=5%) rejeita-se Ho e conclui-se sobre a EXISTÊNCIA DE REGRESSÃO LINEAR Temos que Fcal> ou = Ftab (1;8,α=5%) apenas para o pH e a Temperatura rejeita-se Ho (há regressão linear) hipótese de que a reta obtida é NÃO É paralela ao eixo X (presença de inclinação) 50 Análise de variância aplicada ao ajuste do modelo Para a interação pH x Temp Fcalc < Ftab - a interação não foi significativa Não se rejeita a hipótese Ho :β12=0 Estatisticamente, na equação obtida, o parâmetro β12x1x2 (-6,5x1x2) tem pouca influência sobre a resposta y. 51 51 Análise de variância aplicada ao ajuste do modelo A interação não significativa gera duas retas paralelas A interação significativa gera duas retas concorrentes 52 52 Análise de variância aplicada ao ajuste do modelo Para uma análise mais detalhada, podemos estudar o valor do COEFICIENTE DE DETERMINAÇÃO OU DE EXPLICAÇÃO (R2), que pode ser dado por: Logo: Se desprezamos o efeito da interação: 53 53 Análise de variância aplicada ao ajuste do modelo Neste caso, manter ou retirar do modelo o parâmetro β12 NÃO IMPLICA EM GRANDES DIFERENÇAS SOBRE AS CONCLUSÕES. Portanto, o modelo completo é aceitável gera um gráfico do modelo ajustado conhecido como SUPERFÍCIE DE RESPOSTA 54 54 55 55 Exercício para nota Considere um conjunto de 12 ensaios que relacionam atividade enzimática e temperatura. Obter: A reta; A curva ajustada com os valores codificados (ci); Os valores de y’ para ci= -1; ci= 0 e ci= 1; Os valores do erro (e= y-y’); A análise de variância para testar a hipótese Ho: β1=0. 56 56 57 Ensaio Temperatura Atividade enzimática (U/mL) Erro de ajustamento ci xi yij y’ij e=yij – y’ij 1 -1 30 167,00 2 -1 30 168,003 -1 30 171,00 4 -1 30 185,00 5 0 50 225,00 6 0 50 268,00 7 0 50 255,00 8 0 50 270,00 9 1 70 288,00 10 1 70 305,00 11 1 70 322,00 12 1 70 328,00 57 [ ] [ ] 1 1 / ) ( / ) ( 2 2 2 2 2 £ £ - = S - S S - S S S - S = r S S S n y y n x x n y x xy r Y X XY 1 ) )( ( ) ( 2 2 - S S - S = n n yi xi xi s XY 1 ) ( ) ( 1 ) ( 2 2 2 2 - S - S = - - S = n n xi xi n i x xi s 2 s s + = 3 2 2 2 1 1 0 2 2 1 1 0 : x x y também x x y b b b b b b + + = + + = x x erro e onde e x y i i i - = = + + = : 1 1 0 b b i e x y + + = 1 1 0 b b 1 1 0 x B B y + = x B y B S S n x x n y x y x B X XY i i i i i i 1 0 2 2 2 1 ) ( ) )( ( - = = S - S S S - S = 9959 , 0 7930 , 0 ; 3667 , 0 ; 7264 , 1 4324 , 1 ; 2141 , 3 ; 7 2 2 = = S = S = S = S = S = r y x y x y x n i i i i i i 0433 , 0 ) 4592 , 0 )( 5399 , 0 ( 2046 , 0 : 5399 , 0 7 ) 2141 , 3 ( 7264 , 1 7 ) 4324 , 1 )( 2141 , 3 ( 7930 , 0 ) ( ) )( ( 1 0 2 2 2 1 - = - = - = = - - = S - S S S - S = x B y B e n x x n y x y x B i i i i i i i i x y 5399 , 0 0433 , 0 + - = 1 5399 , 0 0433 , 0 x y i + - = } 2 , 1 , 0 , 1 , 2 { 10 50 - - = - = - = C x x x c i i i d i i x y 78 , 2 80 , 163 + = i c b b y 1 0 + = y b c y c b i i i = S S = 0 2 1 i c y 80 , 27 80 , 302 + = 80 , 302 80 , 27 10 278 0 2 1 = = = = S S = y b c y c b i i i i i i i c x x c 10 50 10 50 + = ® - = i i i i i i x y x y x y 78 , 2 80 , 163 ) 50 * 80 , 27 ( 80 , 27 00 , 3028 10 10 50 80 , 27 80 , 302 + = - + = ÷ ø ö ç è æ - + = 100 * ) ( 2 2 r R = 0,005 0,010 0,015 0,020 0,025 0,030 0,035 0 2 4 6 8 10 12 14 16 18 20 0,002 0,004 0,006 0,008 0,010 0,012 0,014 0,016 0,018 0,020 Lucro x 2 x 1 141 302 161 2 404 200 2 250 72 ˆ 2 1 2 ˆ - = - = + - + = + - + = - = ® - + A b ab a y y A pH pH pH 2 1 2 ˆ b ab a y y A pH pH pH + - + = - = ® - + 191 136 327 2 72 200 2 250 404 ˆ 2 1 2 ˆ = - = + - + = + - + = - = ® - + B a ab b y y B a Temperatur T T 13 2 404 72 2 200 250 2 2 1 - = + - + = + - + = ® pHxT b a ab AB pHxT 191 136 327 3 2 216 600 3 2 750 1212 2 ) 1 ( 2 ˆ 141 302 161 3 2 1212 600 3 2 750 216 2 ) 1 ( 2 ˆ = - = + - + = + - + = - = - = - = + - + = + - + = - = - + - + x x r a r ab b y y B x x r b r ab a y y A T T pH pH i j j j j ijr e x x x x y + + + + = 2 1 12 2 2 1 1 0 b b b b 5 , 6 2 13 2 ˆ 1 5 , 95 2 191 2 ˆ 5 , 70 2 141 2 ˆ 2 2 1 - = - = = = = = - = - = = B A B A b b b j j j j ijr x x x x y 2 1 2 1 5 , 6 5 , 95 5 , 70 50 , 231 - + - = 2 ) ˆ ( y y i - S 2 ) ˆ ( i i y y - S 2 2 y n y i - S 1 ) ˆ ( 2 y y i - S 2 ) ˆ ( 2 - - S n y y i i [ ] [ ] [ ] r AB pHxTemp SQ AB SQ r B Temp SQ B SQ r A pH SQ A SQ 4 ) ( ) ( 4 ˆ ) ( ) ˆ ( 4 ˆ ) ( ) ˆ ( 2 2 2 = = = = = = [ ] [ ] [ ] [ ] [ ] [ ] 00 , 507 3 4 78 4 ) ( ) ( 00 , 109443 3 4 1146 4 ˆ ) ( ) ˆ ( 00 , 59643 3 4 846 4 ˆ ) ( ) ˆ ( 2 2 2 2 2 2 = - = = = = = = = = - = = = x r AB pHxTemp SQ AB SQ x r B Temp SQ B SQ x r A pH SQ A SQ 00 , 172329 ) 50 , 231 )( 12 ( ] 270 ... 67 218 [ 2 2 2 2 2 2 = - + + + = - S = y n y SQT i c 00 , 2736 507 109443 59643 172329 ) ( ) ( ) ( Re : ) ( Re 2 = - - - = - - - = - S = AB SQ B SQ A SQ SQT s SQ ou y y s SQ c i % 41 , 98 172329 507 109443 59643 100 100 (%) 2 = + + = = x SQT SQRL x R c c c SQT s SQ SQT SQRL R Re 1 2 - = = % 11 , 98 172329 109443 59643 100 100 (%) 2 = + = = x SQT SQRL x R c
Compartilhar