Baixe o app para aproveitar ainda mais
Prévia do material em texto
Tema 2: ANOVA com um fator Neste caso, é analisado se um determinado fator influencia ou não numa variável dependente. Para entender melhor essa teoria, consideremos um processo em que é necessário avaliar a influência de um determinado fator A, tal que A tenha k níveis, cada qual está fixo num determinado valor (Portal Action, 2014). Suponha-se que em cada nível de experimento k, tenha-se n variáveis sendo analisadas. Assim, escrevemos uma matriz de dados conforme sugere a tabela 1. Tabela 1 - Apresentação de dados para ANOVA de um fator. Para tornar menos abstrata a teoria apresentada, vamos apresentar um exemplo (PORTAL ACTION, 2014). Considere o processo de produção de uma fibra sintética, no qual o experimentador quer conhecer a influência da porcentagem de algodão na resistência da fibra. Para isto, foi realizado um experimento totalmente aleatorizado, no qual diversos níveis de porcentagem de algodão foram avaliados em relação à resistência da fibra. No experimento, tomamos cinco níveis para a porcentagem de algodão e cinco replicações. Veja, na Tabela 2, essas informações: Tabela 2 - Apresentação de dados experimentais. O objetivo central da ANOVA com um fator é determinar se os diferentes níveis de um determinado fator A afetam as observações diferentemente. Para tanto, deve-se realizar um teste de hipótese, que compara as médias de todos os níveis dos experimentos, ou seja, 0 1 2 3 kH : y y y ... y 1 iH : ao menos um valor y , com i 1, 2,...,k, é diferente. Onde iy são as médias das populações para cada nível de tratamento i. Para realizarmos esse teste de hipóteses, fazemos uso da estatística F. Essa é uma razão, com um numerador que irá refletir a variação entre as médias das amostras e um denominador que refletirá a variação dentro das amostras. Dessa forma, os componentes-chave em nosso método de ANOVA são: variância total, variância entre os grupos e dentro dos grupos. Variância total A variância quadrática total dos dados é dada por (PORTAL ACTION, 2014): ink 2 i j i 1 j 12 t y y S n 1 Onde a soma de quadrados total no numerador é definida como medida de variabilidade total dos dados. ink 2 t i j i 1 j 1 Q y y Tal que i = 1, 2, ..., k são os níveis de tratamentos, j = 1, 2, ..., ni são elementos amostrais de cada i-ésimo tratamento e y é a média geral. Dessa forma, uma fórmula resumida para se calcular a variância total pode ser escrita como: 2 t t Q S , n 1 Onde n é o número total de amostras. Conforme Martins (2010), a soma dos quadrados totais t(Q ) pode ser quebrada em componentes de soma dos quadrados entre os grupos eQ e soma de quadrados dentro dos grupos dQ . Ou seja, t e dQ Q Q . Variância entre os grupos É a variação das médias das populações em torno da média global, onde a média global é dada pela média das in observações que compõem os k diferentes níveis de grupos. Considerando os desvios iy y de cada nível k de tratamento. Fazendo uma soma quadrática média desses desvios, teremos uma amostra de variância entre os grupos, conforme a seguir: k 2 i i 2 ei 1 e n y y Q S , k 1 k 1 onde k 2 e i i i 1 Q n y y é definido como a soma dos quadrados entre os grupos. Se as médias amostrais 1 2 ky , y , ..., y tendem a estar próximas umas das outras e também próximas de y , o resultado será um valor de eQ relativamente pequeno. Por outro lado, se ao menos uma das médias 1 2 ky , y , ..., y tende a se localizar bem afastada das demais e também afastada de y , o resultado será um valor de eQ relativamente grande. Variância dentro dos grupos Aqui se estuda a característica ponderada do quanto a variância, de cada grupo, está espalhada, independentemente da localização da média de cada grupo analisado. Para tanto, é feita uma soma ponderada de quadrados das k variâncias dentro dos grupos: 2 2 2 2 1 1 2 2 k k d 1 2 k (n 1)S (n 1)S ... (n 1)S S (n 1) (n 1) ... (n 1) ou 2 2 22 1 1 2 2 k k d (n 1)S (n 1)S ... (n 1)S S (n k) Onde 1 2 kn n n ... n , ou seja, é o número total de amostras. O numerador 2 2 2 1 1 2 2 k k(n 1)S (n 1)S ... (n 1)S denomina-se variação dentro dos grupos e representa a soma dos quadrados dentro do grupo dQ , ou seja: 2 2 2 d 1 1 2 2 k kQ (n 1)S (n 1)S ... (n 1)S Lembrando que t e dQ Q Q . Logo, a variância dentro dos grupos pode ser reescrita como: 2 t e d Q Q S . (n k) Variância dentro versus variância entre Segundo Martins (2010) as variâncias 2 2 2 t e dS , S e S possuem distribuição qui-quadrática com (n-1), (k-1) e (n-k) graus de liberdade respectivamente. Dessa forma, se reduzirmos as duas variâncias 2 eS e 2 dS a um único valor podemos aplicar o teste F, como: 2 e 2 d S F , S Onde o número de graus de liberdade do numerador será (k-1) e do denominador será (n-k). Para o teste de hipótese utilizando a distribuição F, é sugerido que os dados sejam agrupados numa tabela, conforme abaixo. Tabela 3 - Análise de variância. Para fazer o teste, comparamos o valor calculado calF com o valor tabelado tabF , tal que o número de graus de liberdade do numerado será (k-1) e do denominador (n-k), considerando um nível de significância . Caso cal tabF F , a hipótese nula é aceita. Dessa forma, pode-se concluir com um nível de confiança (1 ) que o fator não influencia a variável em estudo. Por outro lado, se cal tabF F , a hipótese nula é rejeitada e conclui-se com um nível de confiança (1 ) que o fator tem influência sobre a variável em estudo. Para ter mais informações sobre a ANOVA com um fator, clique no link a seguir! http://www.portalaction.com.br/content/1-anova-um-fator
Compartilhar