Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal de Minas Gerais Instituto de Ciências Agrárias Campus Regional Montes Claros ESTATÍSTICA APLICADA APOSTILA PRÁTICA GUSTAVO DE OLIVEIRA ALVES AGRONOMIA Montes Claros 2018 2 UNIVERSIDADE FEDERAL DE MINAS GERAIS – UFMG INSTITUTO DE CIÊNCIAS AGRÁRIAS – ICA APOSTILA PRÁTICA: USO DE PROGRAMAS ESTATÍSTICOS: R, R Studio e EXCEL Trabalho realizado pelo discente: Gustavo de Oliveira Alves1, como exigência da disciplina Estatística Experimental ministrada pelo professor Alcinei Mistico Azevedo. Julho/2018 Montes Claros- MG 1 Matricula: 00000000 1 Contato: gustavo.go83@gmail.com 3 Sumário Baixando o R ................................................................................................................................. 4 Instalando pacotes adicionais ........................................................................................................ 4 R Studio ......................................................................................................................................... 5 Comandos básicos e símbolos básicos .......................................................................................... 6 DIC no R Studio ............................................................................................................................ 7 DBC no R Studio ........................................................................................................................ 18 DQL no R Studio ........................................................................................................................ 30 Esquema Fatorial ......................................................................................................................... 42 DIC 4x2x3 ................................................................................................................................... 42 DBC 4x2x3.................................................................................................................................. 50 Parcela Subdividida ..................................................................................................................... 60 DIC 4x2x3 ................................................................................................................................... 60 DBC 4x2x3.................................................................................................................................. 68 Regressão .................................................................................................................................... 79 Regressão linear simples no Excel .............................................................................................. 79 Regressão quadrática no Excel .................................................................................................... 80 Regressão cúbica no Excel .......................................................................................................... 81 Regressão linear no R .................................................................................................................. 84 Regressão quadrático no R .......................................................................................................... 84 Regressão cúbico no R ................................................................................................................ 85 Regressão em DBC ..................................................................................................................... 93 Qui-Quadrado ............................................................................................................................ 107 Com frequências ........................................................................................................................ 107 Quando as frequências são iguais .............................................................................................. 107 Teste de Independência ............................................................................................................. 108 Anova pelo Excel - DIC ............................................................................................................ 110 Referencias ................................................................................................................................ 114 4 Baixando o R O R é programa destinado as análises estatísticas, qual realiza modelagem linear e não linear, diversos testes estatísticos, classificação, agrupamento e produção de gráficos, além de ter certas vantagens, por ser altamente flexível e de código aberto. R é um ambiente de software livre para computação estatística e gráficos. Ele compila e é executado em uma ampla variedade de plataformas UNIX, Windows e MacOS. Para baixar R , por favor escolha o seu espelho CRAN preferido (R CORE TEAM, 2018). Instalando pacotes adicionais Há uma grande diversidade de pacotes responsáveis por realizarem as análises estatísticas. Sendo que, em sua data base, estão presentes somente os pacotes essenciais para o seu funcionamento. O pacote Exp.Des.pt, que está presente na data base nas versões mais atuais, é um dos pacotes mais usados no setor agrário, por ser um pacote que realizar as principais analises estatísticas do setor agropecuário. Pacote destinado a análise de delineamentos experimentais simples (DIC, DBC e DQL), experimentos em esquema de fatorial duplo (em DIC e DBC), experimentos em esquema de parcelas subdivididas no tempo (em DIC e DBC), experimentos em esquema de fatorial duplo com um tratamento adicional (em DIC e DBC), experimentos em esquema de fatorial triplo (em DIC e DBC) e experimentos em esquema de fatorial triplo com um tratamento adicional (em DIC e DBC); realizando a análise de variância e comparação de medias pelo ajuste de modelos de regressão até o terceiro grau (tratamentos quantitativos) ou por testes de comparação múltipla: teste de Tukey, teste de StudentNewman- Keuls (SNK), teste de Scott-Knott, teste de Duncan, teste t (LSD), teste t de Bonferroni (LSD protegido) e teste Bootstrap (tratamentos qualitativos); analise de resíduos (FERREIRA et al., 2014). 1º Passo: Abrir o R 2º Passo: Click em “PACOTES”, em seguida vá em INSTALA PACOTE (S) 5 R Studio O R Studio (baixe aqui) é um software livre de ambiente desenvolvimento integrado ao R, conseguindo facilitar o uso diário e analises estatísticas. Com sua interface bem organizada e desenvolvida, promove grandes vantagens a frente ao R tradicional, dentro delas: auto complete, interface intuitiva, facilidade em criação de pacotes entre outras. 6 Comandos básicos e símbolos básicos · remove(list = ls()): Apaga a memória; · setwd("C:/ "): Diretório no desk; · read.table("DADOS.txt", header = TRUE): Tabela qual estar os dados; HEADER: cabeçario não é dados; · library: Ativa os pacotes; · ?xxxxx: Abrir central de ajuda; · ExpDes.pt: pacote para análise de variância; · Summary: é uma função genérica usada para produzir resumos de resultados dos resultados de várias funções de ajuste de modelo; · Anova: Calculo de análise de variação (ou desvio) para um ou mais objetos de modelo ajustados; · ^: Potencia; · /: Divisão; · +: Soma; · -: Subtração; · *: Multiplicação; 7 DIC no R Studio O delineamento inteiramente casualizado (DIC) é o mais simples de todos os delineamentos experimentais,qual usa-se somente os princípios da casualização e repetição (Kronka, 2013). Passo 1: Crie uma pasta e tabule no EXCEL e copia para um arquivo “.txt”, salve na pasta. Abra o R Studio e, em seguida, prepare o programa para desenvolvimento dos cálculos. Não deve haver espaços no cabeçario da tabela e usar pontos nos dados tabulados. 8 Passo 2: Limpa o Console “Ctrl+L” Passo 3: Limpa a memória do R Studio: Ø remove(list = ls()) Com o R Studio aberto, limpe o Console clicando Ctrl+L. Para acionar os comandos, usar o conjunto “Ctrl+Enter” Segue os seguintes passos a seguir para executa analise de variância, seguida do teste de comparação múltipla. 9 Passo 4: Diretório até os arquivos usados. Ø setwd(“C:/Users...Dados”) seguido de Ctrl+Enter Obs: Deve-se usa as barras “/” Ø É possível importa os dados - Excel, em Text, do SAS - diretamente sem o uso de comandos, através das abas: File à Import Dataset à From... Passo 5: Injetar os dados no programa Ø X=read.table(“DadosDic.txt”, header = TRUE) seguido de Ctrl+Enter Ø header = TRUE: Primeira linha é o cabeçario. 10 Passo 6: Ativa o pacote a ser usado, nesse caso o ExpDes.pt. Ø library(ExpDes.pt) seguido de Ctrl+Enter 11 Passo 7: abrir as informações sobre o pacote Ø ?ExpDes.pt seguido de Ctrl+Enter Passo 8: Em Pacotes Experimental Designs, vá ao rodapé e click em Index, e click em DIC. Passo 9: em Usage, copie a linha de comando. Obs: Faça uma leitura dos Arguments, para maiores informações e testes possíveis. Ø dic(trat, resp, quali = TRUE, mcomp = "tukey", sigT = 0.05, sigF = 0.05) 12 Passo 10: Na linha de comando, indique para cada argumento a localização dos dados na tabela que foi injetada (Conjuntos de dados “x”). Nós argumentos, deve-se usa o =x$, esse “x” varia de acordo com a letra usada para o conjunto de dados. Ø Exemplo: · trat=x$TRAT · resp=x$Numero_de_fungos à à Em mcomp, indicar o teste a ser realizado 13 Passo 11: Ao preencher corretamente cada requisita da linha de comando, defina a significância dos testes, o F e o Tukey,--- sigT = 0.05, sigF = 0.05 ---, normalmente usa- se 0,05 ou 0,01. Em seguida, executa o comando: Ctrl+Enter. Quadro ANOVA ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 5 46.975 9.3950 23.406 2.7068e-07 Residuo 18 7.225 0.4014 Total 23 54.200 ---------------------------------------------------------------------- -- CV = 7.45 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.04628611 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! Outros testes: · LSD ('lsd'); · LSDB ('lsdb'); · Duncan ('duncan'); · SNK ('snk'); · Scott-Knott ('sk'); · Comparacoes multiplas bootstrap ("ccboot"); · Calinski & Corsten baseado na distribuicao F ("ccf"). 14 ---------------------------------------------------------------------- -- Como os resíduos não são normais, deve realizar uma transformação para normalizar o erro. > remove(list = ls()) > setwd("C:/Users/iNFORTEC/Desktop/DIC PROVA") > x=read.table("DICdados.txt", header = TRUE) > library(ExpDes.pt) > ?ExpDes.pt > View(x) > dic(trat=x$Trat, resp=x$VarR, quali = TRUE, mcomp = "tukey", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 5 46.975 9.3950 23.406 2.7068e-07 Residuo 18 7.225 0.4014 Total 23 54.200 ---------------------------------------------------------------------- -- CV = 7.45 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.04628611 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! ---------------------------------------------------------------------- -- Teste de Tukey ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a F 10.35 a E 9.6 ab C 9.325 bc D 7.925 cd B 7.6 d A 6.2 ---------------------------------------------------------------------- -- > dic(trat=x$Trat, resp=x$VarR, quali = TRUE, mcomp = "lsd", sigT = 0. 05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 5 46.975 9.3950 23.406 2.7068e-07 Residuo 18 7.225 0.4014 Onde o p valor é menor que o nível de significância, rejeita-se Ho, logo há alguma diferença entre os tratamentos pelo teste F. 15 Total 23 54.200 ---------------------------------------------------------------------- -- CV = 7.45 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.04628611 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! ---------------------------------------------------------------------- -- Teste t (LSD) ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a F 10.35 ab E 9.6 b C 9.325 c D 7.925 c B 7.6 d A 6.2 ---------------------------------------------------------------------- -- > dic(trat=x$Trat, resp=x$VarR, quali = TRUE, mcomp = "duncan", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 5 46.975 9.3950 23.406 2.7068e-07 Residuo 18 7.225 0.4014 Total 23 54.200 ---------------------------------------------------------------------- -- CV = 7.45 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.04628611 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! ---------------------------------------------------------------------- -- Teste de Duncan ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a F 10.35 ab E 9.6 b C 9.325 c D 7.925 c B 7.6 d A 6.2 16 ---------------------------------------------------------------------- -- > dic(trat=x$Trat, resp=x$VarR, quali = TRUE, mcomp = "sk", sigT = 0.0 5, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 5 46.975 9.3950 23.406 2.7068e-07 Residuo 18 7.225 0.4014Total 23 54.200 ---------------------------------------------------------------------- -- CV = 7.45 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.04628611 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! ---------------------------------------------------------------------- -- Teste de Scott-Knott ---------------------------------------------------------------------- -- Grupos Tratamentos Medias 1 a F 10.350 2 a E 9.600 3 a C 9.325 4 b D 7.925 5 b B 7.600 6 c A 6.200 ---------------------------------------------------------------------- -- > dic(trat=x$Trat, resp=x$VarR, quali = TRUE, mcomp = "ccboot", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 5 46.975 9.3950 23.406 2.7068e-07 Residuo 18 7.225 0.4014 Total 23 54.200 ---------------------------------------------------------------------- -- CV = 7.45 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.04628611 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! ---------------------------------------------------------------------- -- 17 Teste de Comparacoes multiplas Bootstrap ---------------------------------------------------------------------- -- Grupos Tratamentos Medias 1 a F 10.350 2 a E 9.600 3 a C 9.325 4 b D 7.925 5 b B 7.600 6 c A 6.200 ---------------------------------------------------------------------- -- Obs.: O metodo de comparacoes multiplas bootstrap pode ter resultados diferentes a cada rodada por depender de simulacoes ---------------------------------------------------------------------- 18 DBC no R Studio O delineamento em blocos casualizados (DBC), leva em consideração os princípios da repetição, da casualização, o princípio do controle local por meio do estabelecimento dos blocos (Kronka, 2013). Passo 1: Crie uma pasta e tabule no EXCEL e copia para um arquivo “.txt”, salve na pasta. Abra o R Studio, em seguida prepare o programa para desenvolvimento dos cálculos. Não deve haver espaços no cabeçario da tabela e usar pontos nos dados tabulados. Com o R Studio aberto, limpe o Console clicando Ctrl+L. Para aciona os comandos, usar o conjunto “Ctrl+Enter” Segue os seguintes passos a seguir para executa analise de variança, seguida do teste de comparação múltipla. 19 Passo 2: Limpa o Console Ø “Ctrl+L” Passo 3: Limpa a memória do R Studio: Ø remove(list = ls()) Passo 4: Diretório até os arquivos usados. Ø setwd(“C:/Users...Dados”) seguido de Ctrl+Enter Obs: Deve-se usa as barras “/” 20 Ø É possível importa os dados - Excel, em Text, do SAS - diretamente sem o uso de comandos, através das abas: File à Import Dataset à From... Passo 5: Injetar os dados no programa Ø X=read.table(“DadosDBC.txt”, header = TRUE) seguido de Ctrl+Enter Ø header = TRUE: Primeira linha é o cabeçario. 21 Passo 6: Ativa o pacote a ser usado, nesse caso o ExpDes.pt. Ø library(ExpDes.pt) seguido de Ctrl+Enter 22 Passo 7: abrir as informações sobre o pacote Ø ?ExpDes.pt seguido de Ctrl+Enter Passo 8: Em Pacotes Experimental Designs, vá ao rodapé e click em Index, e click em DBC. Passo 9: em Usage, copie a linha de comando. Obs: Faça uma leitura dos Arguments, para maiores informações e testes possíveis. Ø dbc(trat, bloco, resp, quali = TRUE, mcomp = "tukey", sigT = 0.05, sigF = 0.05) 23 Passo 10: Na linha de comando, indique para cada argumento a localização dos dados na tabela que foi injetada (Conjuntos de dados “x”). Nós argumentos, deve-se usa o =x$, esse “x” varia de acordo com a letra usada para o conjunto de dados. · Exemplo: · trat=x$TRAT · resp=x$Numero_de_fungos · bloco=x$bloco. à à 24 à Em mcomp, indicar o teste a ser realizado Passo 11: Ao preencher corretamente cada requisita da linha de comando, defina a significância dos testes, o F e o Tukey,--- sigT = 0.05, sigF = 0.05 ---, normalmente usa-se 0,05 ou 0,01. Em seguida, executa o comando: Ctrl+Enter. Quadro ANOVA ---------------------------------------------------------------------- Quadro da analise de variancia ---------------------------------------------------------------------- GL SQ QM Fc Pr>Fc Tratamento 4 806.70 201.675 5.7828 0.00786 Bloco 3 69.75 23.250 0.6667 0.58847 Residuo 12 418.50 34.875 Total 19 1294.95 ---------------------------------------------------------------------- CV = 4.15 % Teste de normalidade dos residuos (Shapiro-Wilk) Outros testes: · LSD ('lsd'); · LSDB ('lsdb'); · Duncan ('duncan'); · SNK ('snk'); · Scott-Knott ('sk'); · Comparacoes multiplas bootstrap ("ccboot"); · Calinski & Corsten baseado na distribuicao F ("ccf"). 25 p-valor: 0.004991976 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! Como os resíduos não são normais, deve realizar uma transformação para normalizar o erro. Teste de média Teste de Tukey Grupos Tratamentos Medias a E 154.75 ab A 142.25 b D 139.25 b C 138.5 b B 137.5 Analise completa, com teste de comparação múltipla e outros testes. > remove(list = ls()) > setwd("C:/Users/iNFORTEC/Desktop/DBC") > x=read.table("DadosDBC.txt", header = TRUE) > View(x) > View(x) > library(ExpDes.pt) > ?ExpDes.pt > dbc(trat=x$Trat, bloco=x$Blocos, resp=x$VarR, quali = TRUE, mcomp = "tukey", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 4 806.70 201.675 5.7828 0.00786 Bloco 3 69.75 23.250 0.6667 0.58847 Residuo 12 418.50 34.875 Total 19 1294.95 ---------------------------------------------------------------------- -- CV = 4.15 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.004991976 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! ---------------------------------------------------------------------- -- Teste de Tukey ---------------------------------------------------------------------- -- Onde o p valor é menor que o nível de significância, rejeita-se Ho, logo há alguma diferença pelo teste F: entre os tratamentos e/ou entre os blocos. 26 Grupos Tratamentos Medias a E 154.75 ab A 142.25 b D 139.25 b C 138.5 b B 137.5 ------------------------------------------------------------------------ > dbc(trat=x$Trat, bloco=x$Blocos, resp=x$VarR, quali = TRUE, mcomp = "lsd", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 4 806.70 201.675 5.7828 0.00786 Bloco 3 69.75 23.250 0.6667 0.58847 Residuo 12 418.50 34.875 Total 19 1294.95 ---------------------------------------------------------------------- -- CV = 4.15 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.004991976 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! ---------------------------------------------------------------------- -- Teste t (LSD) ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a E 154.75 b A 142.25 b D 139.25 b C 138.5 b B 137.5 ---------------------------------------------------------------------- -- > dbc(trat=x$Trat, bloco=x$Blocos, resp=x$VarR, quali = TRUE, mcomp = "duncan", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 4 806.70 201.675 5.7828 0.00786 Bloco 3 69.75 23.250 0.6667 0.58847 Residuo 12 418.50 34.875 Total 19 1294.95 ---------------------------------------------------------------------- -- CV = 4.15 % 27 ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.004991976 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! ---------------------------------------------------------------------- -- Teste de Duncan ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a E 154.75 b A 142.25 b D 139.25 b C 138.5 b B 137.5 ---------------------------------------------------------------------- -- > dbc(trat=x$Trat, bloco=x$Blocos, resp=x$VarR, quali = TRUE, mcomp = "sk", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 4 806.70 201.675 5.7828 0.00786 Bloco 3 69.75 23.250 0.6667 0.58847 Residuo 12 418.50 34.875 Total 19 1294.95 ---------------------------------------------------------------------- -- CV = 4.15 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.004991976 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! ---------------------------------------------------------------------- -- Teste de Scott-Knott ---------------------------------------------------------------------- -- Grupos Tratamentos Medias 1 a E 154.75 2 b A 142.25 3 b D 139.25 4 b C 138.50 5 b B 137.50 ---------------------------------------------------------------------- -- > dbc(trat=x$Trat, bloco=x$Blocos, resp=x$VarR, quali = TRUE, mcomp = "ccboot", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia 28 ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 4 806.70 201.675 5.7828 0.00786 Bloco 3 69.75 23.250 0.6667 0.58847 Residuo 12 418.50 34.875 Total 19 1294.95 ---------------------------------------------------------------------- -- CV = 4.15 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.004991976 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! ---------------------------------------------------------------------- -- Teste de Comparacoes multiplas Bootstrap ---------------------------------------------------------------------- -- Grupos Tratamentos Medias 1 a E 154.75 2 b A 142.25 3 b D 139.25 4 b C 138.50 5 b B 137.50 ---------------------------------------------------------------------- -- Obs.: O metodo de comparacoes multiplas bootstrap pode ter resultados diferentes a cada rodada por depender de simulacoes ---------------------------------------------------------------------- -- > dbc(trat=x$Trat, bloco=x$Blocos, resp=x$VarR, quali = TRUE, mcomp = "ccf", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 4 806.70 201.675 5.7828 0.00786 Bloco 3 69.75 23.250 0.6667 0.58847 Residuo 12 418.50 34.875 Total 19 1294.95 ---------------------------------------------------------------------- -- CV = 4.15 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.004991976 ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais! ---------------------------------------------------------------------- -- 29 Teste de Calinski & Corsten baseado na distribuicao F ---------------------------------------------------------------------- -- Grupos Tratamentos Medias 5 a E 154.75 1 b A 142.25 4 b D 139.25 3 b C 138.50 2 b B 137.50 30 DQL no R Studio O Delineamento em Quadrado Latino (DQL) é utilizado nas pesquisas em que duas fontes principais de variação estão presentes e precisam ser controladas (comum na experimentação animal). É constituída de linhas e colunas, cada qual estruturado como um bloco. (JANGARELL, 2013) Passo 1: Crie uma pasta e tabule no EXCEL e copia para um arquivo “.txt”, salve na pasta. Abra o R Studio, em seguida prepare o programa para desenvolvimento dos cálculos. Passo 2: Limpa o Console Não deve haver espaços no cabeçario da tabela e usar pontos nos dados tabulados. Com o R Studio aberto, limpe o Console clicando Ctrl+L. Para aciona os comandos, usar o conjunto “Ctrl+Enter” Segue os seguintes passos a seguir para executa analise de variança, seguida do teste de comparação múltipla. 31 Ø “Ctrl+L” Passo 3: Limpa a memória do R Studio: Ø remove(list = ls()) Passo 4: Diretório até os arquivos usados. Ø setwd(“C:/Users...Dados”) seguido de Ctrl+Enter Obs: Deve-se usa as barras “/” 32 Ø É possível importa os dados - Excel, em Text, do SAS - diretamente sem o uso de comandos, através das abas: File à Import Dataset à From... Passo 5: Injetar os dados no programa Ø X=read.table(“DadosDBC.txt”, header = TRUE) seguido de Ctrl+Enter Ø header= TRUE: Primeira linha é o cabeçario. 33 Passo 6: Ativa o pacote a ser usado, nesse caso o ExpDes.pt. Ø library(ExpDes.pt) seguido de Ctrl+Enter Passo 7: abrir as informações sobre o pacote Ø ?ExpDes.pt seguido de Ctrl+Enter 34 Passo 8: Em Pacotes Experimental Designs, vá ao rodapé e click em Index, e click em DQL. Passo 9: em Usage, copie a linha de comando. Obs: Faça uma leitura dos Arguments, para maiores informações e testes possíveis. Ø dql(trat, linha, coluna, resp, quali = TRUE, mcomp = "tukey", sigT = 0.05, sigF = 0.05) 35 Passo 10: Na linha de comando, indique para cada argumento a localização dos dados na tabela que foi injetada (Conjuntos de dados “x”). Nós argumentos, deve-se usa o =x$, esse “x” varia de acordo com a letra usada para o conjunto de dados. Ø Exemplo: · trat=x$TRAT · resp=x$Numero_de_fungos · linhas=x$lin · colunas=x$col à à 36 à à Em mcomp, indicar o teste a ser realizado Passo 11: Ao preencher corretamente cada requisita da linha de comando, defina a significância dos testes, o F e o Tukey,--- sigT = 0.05, sigF = 0.05 ---, normalmente usa- se 0,05 ou 0,01. Em seguida, executa o comando: Ctrl+Enter. Outros testes: · LSD ('lsd'); · LSDB ('lsdb'); · Duncan ('duncan'); · SNK ('snk'); · Scott-Knott ('sk'); · Comparacoes multiplas bootstrap ("ccboot"); · Calinski & Corsten baseado na distribuicao F ("ccf"). 37 Quadro ANOVA ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 3 1.855 0.61833 5.1172 0.043098 Linha 3 0.935 0.31167 2.5793 0.149156 Coluna 3 1.935 0.64500 5.3379 0.039485 Residuo 6 0.725 0.12083 Total 15 5.450 ---------------------------------------------------------------------- -- CV = 6.65 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.05025199 De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residu os podem ser considerados normais. Teste de média Analise completa, com teste de comparação múltipla e outros testes. > remove(list = ls()) > setwd("C:/Users/iNFORTEC/Desktop/DadosDQL") > x=read.table("DadosDQL.txt", header = TRUE) > View(x) > library(ExpDes.pt) > ?ExpDes.pt > dql(trat=x$Trat, linha=x$Linha, coluna=x$Coluna, resp=x$VarR, quali = TRUE, mcomp = "tukey", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 3 1.855 0.61833 5.1172 0.043098 Linha 3 0.935 0.31167 2.5793 0.149156 Coluna 3 1.935 0.64500 5.3379 0.039485 Onde o p valor é menor que o nível de significância, rejeita-se Ho, logo há alguma diferença pelo teste F: entre as linhas e/ou entre as colunas. 38 Residuo 6 0.725 0.12083 Total 15 5.450 ---------------------------------------------------------------------- -- CV = 6.65 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.05025199 De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residu os podem ser considerados normais. ---------------------------------------------------------------------- -- Teste de Tukey ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a A 5.575 a B 5.55 a D 4.95 a C 4.825 ---------------------------------------------------------------------- -- > dql(trat=x$Trat, linha=x$Linha, coluna=x$Coluna, resp=x$VarR, quali = TRUE, mcomp = "lsd", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 3 1.855 0.61833 5.1172 0.043098 Linha 3 0.935 0.31167 2.5793 0.149156 Coluna 3 1.935 0.64500 5.3379 0.039485 Residuo 6 0.725 0.12083 Total 15 5.450 ---------------------------------------------------------------------- -- CV = 6.65 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.05025199 De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residu os podem ser considerados normais. ---------------------------------------------------------------------- -- Teste t (LSD) ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a A 5.575 ab B 5.55 bc D 4.95 c C 4.825 ---------------------------------------------------------------------- -- 39 > dql(trat=x$Trat, linha=x$Linha, coluna=x$Coluna, resp=x$VarR, quali = TRUE, mcomp = "duncan", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 3 1.855 0.61833 5.1172 0.043098 Linha 3 0.935 0.31167 2.5793 0.149156 Coluna 3 1.935 0.64500 5.3379 0.039485 Residuo 6 0.725 0.12083 Total 15 5.450 ---------------------------------------------------------------------- -- CV = 6.65 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.05025199 De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residu os podem ser considerados normais. ---------------------------------------------------------------------- -- Teste de Duncan ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a A 5.575 ab B 5.55 bc D 4.95 c C 4.825 ---------------------------------------------------------------------- -- > dql(trat=x$Trat, linha=x$Linha, coluna=x$Coluna, resp=x$VarR, quali = TRUE, mcomp = "sk", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 3 1.855 0.61833 5.1172 0.043098 Linha 3 0.935 0.31167 2.5793 0.149156 Coluna 3 1.935 0.64500 5.3379 0.039485 Residuo 6 0.725 0.12083 Total 15 5.450 ---------------------------------------------------------------------- -- CV = 6.65 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.05025199 De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residu os podem ser considerados normais. ---------------------------------------------------------------------- -- 40 Testede Scott-Knott ---------------------------------------------------------------------- -- Grupos Tratamentos Medias 1 a A 5.575 2 a B 5.550 3 b D 4.950 4 b C 4.825 ---------------------------------------------------------------------- -- > dql(trat=x$Trat, linha=x$Linha, coluna=x$Coluna, resp=x$VarR, quali = TRUE, mcomp = "ccboot", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 3 1.855 0.61833 5.1172 0.043098 Linha 3 0.935 0.31167 2.5793 0.149156 Coluna 3 1.935 0.64500 5.3379 0.039485 Residuo 6 0.725 0.12083 Total 15 5.450 ---------------------------------------------------------------------- -- CV = 6.65 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.05025199 De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residu os podem ser considerados normais. ---------------------------------------------------------------------- -- Teste de Comparacoes multiplas Bootstrap ---------------------------------------------------------------------- -- Grupos Tratamentos Medias 1 a A 5.575 2 a B 5.550 3 b D 4.950 4 b C 4.825 ---------------------------------------------------------------------- -- Obs.: O metodo de comparacoes multiplas bootstrap pode ter resultados diferentes a cada rodada por depender de simulacoes ---------------------------------------------------------------------- -- > dql(trat=x$Trat, linha=x$Linha, coluna=x$Coluna, resp=x$VarR, quali = TRUE, mcomp = "ccf", sigT = 0.05, sigF = 0.05) ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc Tratamento 3 1.855 0.61833 5.1172 0.043098 41 Linha 3 0.935 0.31167 2.5793 0.149156 Coluna 3 1.935 0.64500 5.3379 0.039485 Residuo 6 0.725 0.12083 Total 15 5.450 ---------------------------------------------------------------------- -- CV = 6.65 % ---------------------------------------------------------------------- -- Teste de normalidade dos residuos (Shapiro-Wilk) p-valor: 0.05025199 De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residu os podem ser considerados normais. ---------------------------------------------------------------------- -- Teste de Calinski & Corsten baseado na distribuicao F ---------------------------------------------------------------------- -- Grupos Tratamentos Medias 1 a A 5.575 2 a B 5.550 4 b D 4.950 3 b C 4.825 ---------------------------------------------------------------------- -- 42 Esquema Fatorial Os experimentos fatoriais não constituem um delineamento experimental, mas um esquema de desdobramentos dos graus de liberdade e soma de quadrados de tratamentos em um determinado delineamento, seja DIC, DBC ou DQL (SOARES, 2017) DIC 4x2x3 Passo 1: Crie uma pasta e tabule no EXCEL e copia para um arquivo “.txt”, salve na pasta. Não deve haver espaços no cabeçario da tabela e usar pontos nos dados tabulados. 43 Abra o R Studio, em seguida prepare o programa para desenvolvimento dos cálculos. Passo 2: Limpa o Console Ø “Ctrl+L” Passo 3: Limpa a memória do R Studio: Ø remove(list = ls()) Com o R Studio aberto, limpe o Console clicando Ctrl+L. Para aciona os comandos, usar o conjunto “Ctrl+Enter” Segue os seguintes passos a seguir para executa analise de variança, seguida do teste de comparação múltipla. 44 Passo 4: Diretório até os arquivos usados. Ø setwd(“C:/Users...Dados”) seguido de Ctrl+Enter Obs: Deve-se usa as barras “/” Ø É possível importa os dados - Excel, em Text, do SAS - diretamente sem o uso de comandos, através das abas: File à Import Dataset à From... Passo 5: Injetar os dados no programa Ø X=read.table(“DadosDBC.txt”, header = TRUE) seguido de Ctrl+Enter Ø header = TRUE: Primeira linha é o cabeçario. 45 Passo 6: Ativa o pacote a ser usado, nesse caso o ExpDes.pt. Ø library(ExpDes.pt) seguido de Ctrl+Enter 46 Passo 7: abrir as informações sobre o pacote Ø ?ExpDes.pt seguido de Ctrl+Enter Passo 8: Em Pacotes Experimental Designs, vá ao rodapé e click em Index, e click em fat2.dic. Passo 9: em Usage, copie a linha de comando. Obs: Faça uma leitura dos Arguments, para maiores informações e testes possíveis. Ø fat2.dic(fator1, fator2, resp, quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("F1", "F2"), sigT = 0.05, sigF = 0.05) 47 Passo 10: Na linha de comando, indique para cada argumento a localização dos dados na tabela que foi injetada (Conjuntos de dados “x”). Nós argumentos, deve-se usa o =x$, esse “x” varia de acordo com a letra usada para o conjunto de dados. Exemplo: · fator1=x$Aspergi_BRS · resp=x$Numero_de_fungos à à 48 à Em mcomp, indicar o teste a ser realizado Passo 11: ao preencher corretamente cada requisita da linha de comando, defina a significância dos testes, o F e o Tukey,--- sigT = 0.05, sigF = 0.05 ---, normalmente usa- se 0,05 ou 0,01. Em seguida, executa o comando: Ctrl+Enter. remove(list = ls()) > setwd("C:/UFMG/Materias/Estatistica Experimental/TESTE/FATORIAL DIC/ LISTA 3/QUESTÃO 7") > x=read.table("dadosfatoria.txt", header = TRUE) > library(ExpDes.pt) > ?ExpDes.pt > fat2.dic(fator1=x$FATORA, fator2=x$FATORB, resp=x$RESUL, quali = c(T RUE, TRUE), mcomp = "tukey", fac.names = c("F1", "F2"), sigT = 0.05, s igF = 0.05) ---------------------------------------------------------------------- -- Outros testes: · LSD ('lsd'); · LSDB ('lsdb'); · Duncan ('duncan'); · SNK ('snk'); · Scott-Knott ('sk'); · Comparacoes multiplas bootstrap ("ccboot"); · Calinski & Corsten baseado na distribuicao F ("ccf"). 49 Legenda: FATOR 1: F1 FATOR 2: F2 ---------------------------------------------------------------------- -- Quadro da analise de variancia ---------------------------------------------------------------------- -- GL SQ QM Fc Pr>Fc F1 3 20.3333 6.7778 27.1111 0.000002 F2 1 2.6667 2.6667 10.6667 0.004855 F1*F2 3 1.0000 0.3333 1.3333 0.298523 Residuo 16 4.0000 0.2500 Total 23 28.0000 ---------------------------------------------------------------------- -- CV = 3.85 % Teste de normalidade dos residuos (Shapiro-Wilk) valor-p: 0.05883198 De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residu os podem ser considerados normais. ---------------------------------------------------------------------- -- Interacao nao significativa: analisando os efeitos simples ---------------------------------------------------------------------- -- F1 Teste de Tukey ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a 3 14 a 4 13.83333b 1 12.16667 b 2 12 ---------------------------------------------------------------------- -- F2 Teste de Tukey ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a 2 13.33333 b 1 12.66667 Onde o p valor é menor que o nível de significância, rejeita-se Ho, logo há alguma diferença entre os tratamentos pelo teste F. Como não houve interação entre os fatores, não é necessário realizar desdobramento 50 DBC 4x2x3 Passo 1: Crie uma pasta e tabule no EXCEL e copia para um arquivo “.txt”, salve na pasta. Em caso de dados em decimais, usa o “.”, pois o R reconhece virgula como outro caractere de comando. O ponto é o separador decimal. Abra o R Studio, em seguida prepare o programa para desenvolvimento dos cálculos. Passo 2: Limpa o Console Não deve haver espaços no cabeçario da tabela e usar pontos nos dados tabulados. Com o R Studio aberto, limpe o Console clicando Ctrl+L. Para aciona os comandos, usar o conjunto “Ctrl+Enter” Segue os seguintes passos a seguir para executa analise de variança, seguida do teste de comparação múltipla. 51 Ø “Ctrl+L” Passo 3: Limpa a memória do R Studio: Ø remove(list = ls()) Passo 4: Diretório até os arquivos usados. Ø setwd(“C:/Users...Dados”) seguido de Ctrl+Enter Obs: Deve-se usa as barras “/” 52 Ø É possível importa os dados - Excel, em Text, do SAS - diretamente sem o uso de comandos, através das abas: File à Import Dataset à From... Passo 5: Injetar os dados no programa Ø X=read.table(“DadosDBC.txt”, header = TRUE) seguido de Ctrl+Enter Ø header = TRUE: Primeira linha é o cabeçario. 53 Passo 6: Ativa o pacote a ser usado, nesse caso o ExpDes.pt. Ø library(ExpDes.pt) seguido de Ctrl+Enter 54 Passo 7: abrir as informações sobre o pacote Ø ?ExpDes.pt seguido de Ctrl+Enter Passo 8: Em Pacotes Experimental Designs, vá ao rodapé e click em Index, e click em fat2.dbc. Passo 9: em Usage, copie a linha de comando. Obs: Faça uma leitura dos Arguments, para maiores informações e testes possíveis. Ø fat2.dbc(fator1, fator2, bloco, resp, quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("F1", "F2"), sigT = 0.05, sigF = 0.05) 55 Passo 10: Na linha de comando, indique para cada argumento a localização dos dados na tabela que foi injetada (Conjuntos de dados “x”). Nós argumentos, deve-se usa o =x$, esse “x” varia de acordo com a letra usada para o conjunto de dados. Exemplo: · fator1=x$Aspergi_BRS · resp=x$Numero_de_fungos à à 56 à à Em mcomp, indicar o teste a ser realizado Passo 11: ao preencher corretamente cada requisita da linha de comando, defina a significância dos testes, o F e o Tukey,--- sigT = 0.05, sigF = 0.05 ---, normalmente usa- se 0,05 ou 0,01. Em seguida, executa o comando: Ctrl+Enter. > remove(list = ls()) Outros testes: · LSD ('lsd'); · LSDB ('lsdb'); · Duncan ('duncan'); · SNK ('snk'); · Scott-Knott ('sk'); · Comparacoes multiplas bootstrap ("ccboot"); · Calinski & Corsten baseado na distribuicao F ("ccf"). 57 > setwd("C:/UFMG/Materias/Estatistica Experimental/TESTE/FATORIAL DIC/LISTA 3/QUESTÃO 8") > x=read.table("DADOS.txt", header = TRUE) > library(ExpDes.pt) > ?ExpDes.pt > fat2.dbc(fator1=x$FATORA, fator2=x$FATORB, bloco=x$BLOCO, resp=x$RESP, quali = c(TRUE, TR UE), mcomp = "tukey", fac.names = c("F1", "F2"), sigT = 0.05, sigF = 0.05) ------------------------------------------------------------------------ Legenda: FATOR 1: F1 FATOR 2: F2 Quadro da analise de variancia ------------------------------------------------------------------------ GL SQ QM Fc Pr>Fc Bloco 2 2.349 1.174 2.944 0.073657 F1 3 57.647 19.216 48.161 0.000000 F2 2 71.754 35.877 89.919 0.000000 F1*F2 6 42.068 7.011 17.573 0.000000 Residuo 22 8.778 0.399 Total 35 182.596 ------------------------------------------------------------------------ CV = 14.1 % ------------------------------------------------------------------------ Teste de normalidade dos residuos (Shapiro-Wilk) valor-p: 0.811311 De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residuos podem ser consider ados normais. ------------------------------------------------------------------------ Interacao significativa: desdobrando a interacao ------------------------------------------------------------------------ Desdobrando F1 dentro de cada nivel de F2 ------------------------------------------------------------------------ ------------------------------------------------------------------------ Quadro da analise de variancia ------------------------------------------------------------------------ GL SQ QM Fc Pr.Fc Bloco 2 2.34889 1.17444 2.9435 0.0737 F2 2 71.75389 35.87694 89.9194 0 F1:F2 1 3 15.69333 5.23111 13.1109 0 F1:F2 2 3 31.74000 10.58000 26.517 0 F1:F2 3 3 52.28250 17.42750 43.6791 0 Residuo 22 8.77778 0.39899 Total 35 182.59639 5.21704 ------------------------------------------------------------------------ Onde o p valor é menor que o nível de significância, rejeita-se Ho, logo há alguma diferença pelo teste F: entre os tratamentos e/ou entre blocos. Como houve interação entre os fatores, fez-se necessário realizar desdobramento 58 F1 dentro do nivel 1 de F2 ------------------------------------------------------------------------ Teste de Tukey ------------------------------------------------------------------------ Grupos Tratamentos Medias a 3 4.833333 b 4 3.3 b 2 2.233333 b 1 1.9 ------------------------------------------------------------------------ F1 dentro do nivel 2 de F2 ------------------------------------------------------------------------ Teste de Tukey ------------------------------------------------------------------------ Grupos Tratamentos Medias a 4 6.5 b 2 3.8 b 3 3.6 c 1 1.966667 ------------------------------------------------------------------------ F1 dentro do nivel 3 de F2 ------------------------------------------------------------------------ Teste de Tukey ------------------------------------------------------------------------ Grupos Tratamentos Medias a 2 8.366667 a 3 8.066667 b 4 6.066667 c 1 3.133333 ------------------------------------------------------------------------ Desdobrando F2 dentro de cada nivel de F1 ------------------------------------------------------------------------ ------------------------------------------------------------------------ Quadro da analise de variancia ------------------------------------------------------------------------ GL SQ QM Fc Pr.Fc Bloco 2 2.34889 1.17444 2.9435 0.0737 F1 3 57.64750 19.21583 48.1612 0 F2:F1 1 2 2.88667 1.44333 3.6175 0.0438 F2:F1 2 2 60.92667 30.46333 76.3511 0 F2:F1 3 2 31.92667 15.96333 40.0094 0 F2:F1 4 2 18.08222 9.04111 22.66 0 Residuo 22 8.77778 0.39899 Total 35 182.59639 5.21704 ------------------------------------------------------------------------F2 dentro do nivel 1 de F1 ------------------------------------------------------------------------ Teste de Tukey ------------------------------------------------------------------------ Grupos Tratamentos Medias 59 a 3 3.133333 a 2 1.966667 a 1 1.9 ------------------------------------------------------------------------ F2 dentro do nivel 2 de F1 ------------------------------------------------------------------------ Teste de Tukey ------------------------------------------------------------------------ Grupos Tratamentos Medias a 3 8.366667 b 2 3.8 c 1 2.233333 ------------------------------------------------------------------------ F2 dentro do nivel 3 de F1 ------------------------------------------------------------------------ Teste de Tukey ------------------------------------------------------------------------ Grupos Tratamentos Medias a 3 8.066667 b 1 4.833333 b 2 3.6 ------------------------------------------------------------------------ F2 dentro do nivel 4 de F1 ------------------------------------------------------------------------ Teste de Tukey ------------------------------------------------------------------------ Grupos Tratamentos Medias a 2 6.5 a 3 6.066667 b 1 3.3 ------------------------------------------------------------------------ 60 Parcela Subdividida Parcela subdivida podem ser instalados em qualquer delineamento experimental (DIC, DBC, DQL), assim como os fatoriais, envolvem as combinações dos níveis dos fatores do tratamento (USP, 2017). DIC 4x2x3 Passo 1: Crie uma pasta e tabule no EXCEL e copia para um arquivo “.txt”, salve na pasta. Abra o R Studio, em seguida prepare o programa para desenvolvimento dos cálculos. Não deve haver espaços no cabeçario da tabela e usar pontos nos dados tabulados. Com o R Studio aberto, limpe o Console clicando Ctrl+L. Para aciona os comandos, usar o conjunto “Ctrl+Enter” Segue os seguintes passos a seguir para executa analise de variança, seguida do teste de comparação múltipla. 61 Passo 2: Limpa o Console Ø “Ctrl+L” Passo 3: Limpa a memória do R Studio: Ø remove(list = ls()) Passo 4: Diretório até os arquivos usados. Ø setwd(“C:/Users...Dados”) seguido de Ctrl+Enter Obs: Deve-se usa as barras “/” 62 Ø É possível importa os dados - Excel, em Text, do SAS - diretamente sem o uso de comandos, através das abas: File à Import Dataset à From... Passo 5: Injetar os dados no programa Ø X=read.table(“DadosDBC.txt”, header = TRUE) seguido de Ctrl+Enter Ø header = TRUE: Primeira linha é o cabeçario. 63 Passo 6: Ativa o pacote a ser usado, nesse caso o ExpDes.pt. Ø library(ExpDes.pt) seguido de Ctrl+Enter 64 Passo 7: abrir as informações sobre o pacote Ø ?ExpDes.pt seguido de Ctrl+Enter Passo 8: Em Pacotes Experimental Designs, vá ao rodapé e click em Index, e click em psub2.dic. Passo 9: em Usage, copie a linha de comando. Obs: Faça uma leitura dos Arguments, para maiores informações e testes possíveis. Ø psub2.dic(fator1, fator2, repet, resp, quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("F1", "F2"), sigT = 0.05, sigF = 0.05) 65 Passo 10: Na linha de comando, indique para cada argumento a localização dos dados na tabela que foi injetada (Conjuntos de dados “x”). Nós argumentos, deve-se usa o =x$, esse “x” varia de acordo com a letra usada para o conjunto de dados. Ø Exemplo: · fator1=x$Aspergi_BRS · resp=x$Numero_de_fungos à à à 66 Em mcomp, indicar o teste a ser realizado Passo 11: ao preencher corretamente cada requisita da linha de comando, defina a significância dos testes, o F e o Tukey,--- sigT = 0.05, sigF = 0.05 ---, normalmente usa- se 0,05 ou 0,01. Em seguida, executa o comando: Ctrl+Enter. > remove(list = ls()) > setwd("C:/UFMG/Materias/Estatistica Experimental/TESTE/FATORIAL DIC/LISTA 3/QUESTÃO 10") > x=read.table("DADOS.txt", header = TRUE) > library(ExpDes.pt) > ?ExpDes.pt > psub2.dic(fator1=x$FATORA, fator2=x$FATORB, repet=x$REPEAT, resp=x$RES, quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("F1", "F2"), sigT = 0.05, sigF = 0.05) ------------------------------------------------------------------------ Legenda: FATOR 1 (parcela): F1 FATOR 2 (subparcela): F2 ------------------------------------------------------------------------ ------------------------------------------------------------------------ $`Quadro da analise de variancia` GL SQ QM Fc Pr(>Fc) F1 3 20.3333 6.7778 32.533 7.9e-05 *** Erro a 8 1.6667 0.2083 Outros testes: · LSD ('lsd'); · LSDB ('lsdb'); · Duncan ('duncan'); · SNK ('snk'); · Scott-Knott ('sk'); · Comparacoes multiplas bootstrap ("ccboot"); · Calinski & Corsten baseado na distribuicao F ("ccf"). 67 F2 1 2.6667 2.6667 9.143 0.01647 * F1*F2 3 1.0000 0.3333 1.143 0.38890 Erro b 8 2.3333 0.2917 Total 23 28.0000 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 ------------------------------------------------------------------------ CV 1 = 1.75552 % CV 2 = 2.077162 % ------------------------------------------------------------------------ #Teste de normalidade dos residuos (Shapiro-Wilk) valor-p: 0.08987376 De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residuos podem ser conside rados normais. Interacao nao significativa: analisando os efeitos simples ------------------------------------------------------------------------ F1 Teste de Tukey ------------------------------------------------------------------------ Grupos Tratamentos Medias a 3 27 a 4 26.83333 b 1 25.16667 b 2 25 ------------------------------------------------------------------------ F2 Teste de Tukey ------------------------------------------------------------------------ Grupos Tratamentos Medias a 2 26.33333 b 1 25.66667 ------------------------------------------------------------------------ Onde o p valor é menor que o nível de significância, rejeita-se Ho, logo há alguma diferença entre os tratamentos pelo teste F. Como não houve interação entre os fatores, não é necessário realizar desdobramento. 68 DBC 4x2x3 Passo 1: Crie uma pasta e tabule no EXCEL e copia para um arquivo “.txt”, salve na pasta. Em caso de dados em decimais, usa o “.”, pois o R reconhece virgula como outro caractere de comando. O ponto é o separador decimal. Abra o R Studio, em seguida prepare o programa para desenvolvimento dos cálculos. Passo 2: Limpa o Console Não deve haver espaços no cabeçario da tabela e usar pontos nos dados tabulados. Com o R Studio aberto, limpe o Console clicando Ctrl+L. Para aciona os comandos, usar o conjunto “Ctrl+Enter” Segue os seguintes passos a seguir para executa analise de variança, seguida do teste de comparação múltipla. 69 Ø “Ctrl+L” Passo 3: Limpa a memória do R Studio: Ø remove(list = ls()) Passo 4: Diretório até os arquivos usados. Ø setwd(“C:/Users...Dados”) seguido de Ctrl+Enter Obs: Deve-se usa as barras “/” 70 Ø É possível importa os dados - Excel, em Text, do SAS - diretamentesem o uso de comandos, através das abas: File à Import Dataset à From... Passo 5: Injetar os dados no programa Ø X=read.table(“DadosDBC.txt”, header = TRUE) seguido de Ctrl+Enter Ø header = TRUE: Primeira linha é o cabeçario. 71 Passo 6: Ativa o pacote a ser usado, nesse caso o ExpDes.pt. Ø library(ExpDes.pt) seguido de Ctrl+Enter 72 Passo 7: abrir as informações sobre o pacote Ø ?ExpDes.pt seguido de Ctrl+Enter Passo 8: Em Pacotes Experimental Designs, vá ao rodapé e click em Index, e click em psub2.dbc. Passo 9: em Usage, copie a linha de comando. Obs: Faça uma leitura dos Arguments, para maiores informações e testes possíveis. Ø psub2.dbc(fator1, fator2, bloco, resp, quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("F1", "F2"), sigT = 0.05, sigF = 0.05) 73 Passo 10: Na linha de comando, indique para cada argumento a localização dos dados na tabela que foi injetada (Conjuntos de dados “x”). Nós argumentos, deve-se usa o =x$, esse “x” varia de acordo com a letra usada para o conjunto de dados. Ø Exemplo: · fator1=x$Aspergi_BRS · resp=x$Numero_de_fungos à à à 74 à Em mcomp, indicar o teste a ser realizado Passo 11: ao preencher corretamente cada requisita da linha de comando, defina a significância dos testes, o F e o Tukey,--- sigT = 0.05, sigF = 0.05 ---, normalmente usa- se 0,05 ou 0,01. Em seguida, executa o comando: Ctrl+Enter. > remove(list = ls()) > setwd("C:/UFMG/Materias/Estatistica Experimental/TESTE/FATORIAL DIC/ LISTA 3/questao 11") > x=read.table("DADOS.txt", header = TRUE) > library(ExpDes.pt) > ?ExpDes.pt > psub2.dbc(fator1=x$FATORA, fator2=x$FATORB, bloco=x$BLOCO, resp=x$RE PEAT, quali = c(TRUE, TRUE), mcomp = "tukey",fac.names = c("F1", "F2") , sigT = 0.05, sigF = 0.05) Outros testes: · LSD ('lsd'); · LSDB ('lsdb'); · Duncan ('duncan'); · SNK ('snk'); · Scott-Knott ('sk'); · Comparacoes multiplas bootstrap ("ccboot"); · Calinski & Corsten baseado na distribuicao F ("ccf"). 75 ---------------------------------------------------------------------- -- Legenda: FATOR 1 (parcela): F1 FATOR 2 (subparcela): F2 ---------------------------------------------------------------------- -- ---------------------------------------------------------------------- -- $`Quadro da analise de variancia\n------------------------------------ ------------------------------------\n` GL SQ QM Fc Pr(>Fc) F1 3 13078.8 4359.6 65.048 5.7e-05 *** Bloco 2 155.0 77.5 1.157 0.3759 Erro a 6 402.1 67.0 F2 3 9104.1 3034.7 100.022 < 2e-16 *** F1*F2 9 3415.8 379.5 12.509 < 2e-16 *** Erro b 24 728.2 30.3 Total 47 26883.9 --- *1Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 ---------------------------------------------------------------------- -- CV 1 = 18.17567 % CV 2 = 12.22912 % Interacao significativa: desdobrando a interacao ---------------------------------------------------------------------- -- Desdobrando F1 dentro de cada nivel de F2 ---------------------------------------------------------------------- -- GL SQ QM Fc valor.p F1 : F2 1 3.00000 2037.5833 679.19444 17.190263 5e-06 F1 : F2 2 3.00000 4443.6667 1481.22222 37.48941 0 F1 : F2 3 3.00000 4792.9167 1597.63889 40.435891 0 F1 : F2 4 3.00000 5220.3333 1740.11111 44.041831 0 Erro combinado 22.83456 902.2031 39.51042 ---------------------------------------------------------------------- -- F1 dentro de F2 1 ---------------------------------------------------------------------- -- Teste de Tukey Onde o p valor é menor que o nível de significância, rejeita-se Ho, logo há alguma diferença pelo teste F: entre os tratamentos e/ou entre os blocos. Como há interação entre os fatores, faz-se necessário o desdobramento. 76 ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a 3 48.66667 b 4 33.33333 bc 1 19.66667 c 2 15.33333 ---------------------------------------------------------------------- -- F1 dentro de F2 2 ---------------------------------------------------------------------- -- Teste de Tukey ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a 4 65.66667 b 3 36.33333 c 1 20.33333 c 2 17 ---------------------------------------------------------------------- -- F1 dentro de F2 3 ---------------------------------------------------------------------- -- Teste de Tukey ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a 3 80.66667 b 4 61.33333 c 2 35 c 1 32 ---------------------------------------------------------------------- -- F1 dentro de F2 4 ---------------------------------------------------------------------- -- Teste de Tukey ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a 4 95 b 3 70.66667 c 2 45 c 1 44.66667 ---------------------------------------------------------------------- -- Desdobrando F2 dentro de cada nivel de F1 ---------------------------------------------------------------------- -- GL SQ QM Fc valor.p F2 : F1 1 3 1249.6667 416.55556 13.729457 2e-05 F2 : F1 2 3 1858.2500 619.41667 20.415656 1e-06 F2 : F1 3 3 3678.2500 1226.08333 40.411078 0 F2 : F1 4 3 5733.6667 1911.22222 62.992904 0 77 Erro b 24 728.1667 30.34028 ---------------------------------------------------------------------- -- F2 dentro de F1 1 ---------------------------------------------------------------------- -- Teste de Tukey ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a 4 44.66667 b 3 32 b 2 20.33333 b 1 19.66667 ---------------------------------------------------------------------- -- ---------------------------------------------------------------------- -- F2 dentro de F1 2 ---------------------------------------------------------------------- -- Teste de Tukey ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a 4 45 a 3 35 b 2 17 b 1 15.33333 ---------------------------------------------------------------------- -- ---------------------------------------------------------------------- -- F2 dentro de F1 3 ---------------------------------------------------------------------- -- Teste de Tukey ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a 3 80.66667 a 4 70.66667 b 1 48.66667 b 2 36.33333 ---------------------------------------------------------------------- -- ---------------------------------------------------------------------- -- F2 dentro de F1 4 ---------------------------------------------------------------------- -- Teste de Tukey 78 ---------------------------------------------------------------------- -- Grupos Tratamentos Medias a 4 95b 2 65.66667 b 3 61.33333 c 1 33.33333 ---------------------------------------------------------------------- -- ---------------------------------------------------------------------- -- 79 Regressão Análise de Regressão possibilita encontrar uma relação razoável entre as variáveis de entrada e saída, por meio de relações empíricas. A utilização desta abordagem necessita-se de coleta de dados e do uso de métodos estatísticos de Análise de Regressão Linear (Portal Action, 2018) No Excel, digite os valores e faça os gráficos de dispersão. Regressão linear simples no Excel Para obter a equação da reta, faça: · Click em algum ponto da reta, e vá até “Adicionar linha de tendência” · Em seguida marque: Exibir equação no gráfico 80 Regressão quadrática no Excel Para obter a equação da reta, faça: · Click em algum ponto da reta, e vá até “Adicionar linha de tendência” 81 · Em seguida marque: Exibir equação no gráfico · Regressão cúbica no Excel Para obter a equação da reta, faça: 82 · Click em algum ponto da reta, e vá até “Adicionar linha de tendência” · Em seguida marque: Exibir equação no gráfico 83 Para realizar análise estática e obter a significância dos coeficientes, abra o R Studio e realize os seguintes comandos: Passo 1: limpe a memória do console Ø remove(list = ls()) Passo 2: definir os vetores Ø x=c(10,20,25,30,35,40) Ø y=c(10,15,30,35,40,35) Passo 3: Injeta o modelo matemático e teclar ctrl+enter, em seguida digitar anova(xxxx) seguido de ctrl+enter 84 Regressão linear no R Ø modelo1=lm(y~x) Ø anova(modelo1) Passo 4: Obtendo os coeficientes de regressão linear Ø summary(modelo1) Regressão quadrático no R Ø modelo2=lm(y~x) 85 Ø anova(modelo2) Passo 4: Obtendo os coeficientes de regressão linear Ø summary(modelo1) Regressão cúbico no R Ø modelo3=lm(y~x+I(x^2)+I(x^3)) Ø anova(modelo3) 86 Passo 4: Obtendo os coeficientes de regressão linear Ø summary(modelo3) Analise completa remove(list = ls()) x=c(10,20,25,30,35,40) y=c(10,15,30,35,40,35) 87 #MODELO LINEAR modelo1=lm(y~x) --> #Modelo de equação anova(modelo1) ----> #Para proceder a ANOVA Analysis of Variance Table Response: y Df Sum Sq Mean Sq F value Pr(>F) x 1 617.14 617.14 20.51 0.01059 * Residuals 4 120.36 30.09 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Como o p-value é menor que o nível do teste de significância, há regressão e significante pelo teste F ao nível de 5% de significância. > summary(modelo1) --> #Para obter os R Call: lm(formula = y ~ x) Residuals: 1 2 3 4 5 6 -0.3571 -5.6429 4.2143 4.0714 3.9286 -6.2143 Coeficientes: Estima-te Stud. Error t value Pr (>|t|) (Intercept) 0.07143 6.45718 0.011 0.9917 x 1.02857 0.22712 4.529 0.0106 * --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Intercepto (a): Como o p-value é maior que o nível do teste de significância, o intercepto não é significante pelo teste T Coeficiente angular da reta: Como o p-value é menor que o nível do teste de significância, o coeficiente angular da reta é significante pelo teste T ao nível de 5% de significância OBS: O intercepto pode ser ou não significativo, uma vez que indica qual seria o valor da resposta (y), caso o tratamento (x) fosse 0. 88 O coeficiente angula da reta (x), é de interesse que seja significativo, pois indica a taxa de acréscimo ou decréscimo da variável resposta para quando se aumenta um valor de x. Além disso, implica que, se ocorre variações em x (tratamentos), também haverá variações nas respostas (y). O r2 indica o quanto aquela variação da variável resposta (y) e explicada pela variável explicativa (x) utilizando esse modelo de regressão. Residual standard error: 5.485 on 4 degrees of freedom Multiple R-squared: 0.8368, Adjusted R-squared: 0.796 F-statistic: 20.51 on 1 and 4 DF, p-value: 0.01059 #Modelo Quadrático modelo2=lm(y~x+I(x^2)) anova(modelo2) Analysis of Variance Table Response: y Df Sum Sq Mean Sq F value Pr(>F) x 1 617.14 617.14 19.2356 0.02195 * I(x^2) 1 24.11 24.11 0.7514 0.44981 Residuals 3 96.25 32.08 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 summary(modelo2) y = 1,0286*x + 0,0714ns R² = 0,8368 0 5 10 15 20 25 30 35 40 45 0 5 10 15 20 25 30 35 40 45 PROD 89 Como o p-value é menor que o nível do teste de significância, há regressão e significante pelo teste F ao nível de 5% de significância. Call: lm(formula = y ~ x + I(x^2)) Residuals: 1 2 3 4 5 6 2.321 -7.250 2.071 2.464 3.929 -3.536 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -11.17857 14.59095 -0.766 0.499 x 2.10000 1.25808 1.669 0.194 I(x^2) -0.02143 0.02472 -0.867 0.450 Intercepto (a): Como o p-value é maior que o nível do teste de significância, o intercepto não é significante pelo teste T; Coeficiente angular da reta: Como o p-value é maior que o nível do teste de significância, o coeficiente angular da reta não é significante pelo teste T; Coeficiente quadrático da reta (I[x^2]): Como o p-value é maior que o nível do teste de significância, o coeficiente angular da reta não é significante pelo teste T. OBS: O intercepto pode ser ou não significativo, uma vez que indica qual seria o valor da resposta (y), caso o tratamento (x) fosse 0. Coeficiente quadrático da reta (I[x^2]), é de interesse que seja significativo, pois indica a taxa de acréscimo ou decréscimo da variável resposta para quando se aumenta um valor de x. Além disso, implica que, se ocorre variações em x (tratamentos), também haverá variações nas respostas (y). O r2 indica o quanto aquela variação da variável resposta (y) e explicada pela variável explicativa (x) utilizando esse modelo de regressão. 90 Residual standard error: 5.664 on 3 degrees of freedom Multiple R-squared: 0.8695, Adjusted R-squared: 0.7825 F-statistic: 9.994 on 2 and 3 DF, p-value: 0.04715 #MODELO CÚBICO modelo3=lm(y~x+I(x^2)+I(x^3)) anova(modelo3) Analysis of Variance Table Response: y Df Sum Sq Mean Sq F value Pr(>F) x 1 617.14 617.14 90.8434 0.01083 * I(x^2) 1 24.11 24.11 3.5486 0.20028 I(x^3) 1 82.66 82.66 12.1680 0.07327 . Residuals 2 13.59 6.79 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Como o p-value é menor que o nível do teste de significância, há regressão e significante pelo teste F ao nível de 5% de significância. summary(modelo3) Call: lm(formula = y ~ x + I(x^2) + I(x^3)) y = -0,0214x2ns + 2,1xns - 11,179ns R² = 0,8695 0 5 10 15 20 25 30 35 40 45 0 5 10 15 20 25 30 35 40 45 PROD 91 Residuals: 1 2 3 4 5 6 0.2019 -1.7391 2.9193 -1.3509 -0.3106 0.2795 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 49.440994
Compartilhar