Análises Estatísticas com R: DBC e DIC

0

AnaBCTerra

05/01/2021

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Análise Estatística

10.088 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Universidade José do Rosário Vellano 
Ana Beatriz Carvalho Terra 
 
 
 
 
 
 
 
 
 
 
 
APOSTILA PARA ANÁLISES ESTATÍTICAS UTILIZANDO O SOFTWARE R 
 
 
 
 
 
 
 
 
 
 
 
 
ALFENAS 
2020 
 
Sumário 
Delineamento em Blocos Casualizados (DBC) .......................................................................... 3 
Delineamento Inteiramente casualizado (DIC) ........................................................................ 8 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Delineamento em Blocos Casualizados (DBC) 
1. Montando a tabela no excel 
Para que o R consiga ler os dados é importante que a tabulação de forma adequada. 
Atente-se para evitar palavras com acento no cabeçalho. Quanto mais simples a escrita, 
melhor para evitar erros de digitação na hora de dar os comandos no software. A figura 1 
indica como as informações devem ser dispostas nas células. 
 
Figura 1: Disposição das informações na tabela do excel 
Feito isso, o arquivo deverá ser salvo em .csv (separado por vírgulas). Para 
executar basta ir em Arquivo – Salvar como - .csv (separado por vírgula), conforme 
ilustrado na figura 2. 
 
Figura 2: Modo de salvar a tabela para importação no R 
Uma vez feita a tabela e salva no formato apropriado, o próximo passo é abrir o 
programa estatístico R studio para então dar início às análises. 
2. Análise de Variância DBC 
Para dar início, primeiramente deve-se abrir o programa R studio e criar um script. 
Colocar o script para salvar na mesma pasta em que se encontra os arquivos do excel. 
Feito isso, fechar o R studio. Agora você deverá ir na pasta onde estão salvos os arquivos 
(script e excel.csv) e clicar duas vezes no script para abrir. 
Assim que o programa reabrir, o seu diretório estará definido, ou seja, o R saberá 
de onde importar as informações e então será possível prosseguir com as análises. O 
primeiro passo é sempre atualizar a biblioteca a ser utilizada no R. No caso das análises 
de experimentação o pacote a ser utilizado é “ExpDes.pt 
library(ExpDes.pt) 
 Posteriormente iremos criar um objeto para armazenar as nossas informações: 
dado <- read.csv ("ExemploDBC.csv", header = TRUE, dec = ",", sep = ";") 
“ExemploDBC.csv” é o nome do arquivo que queremos importar. 
Header = TRUE indica que na tabela há cabeçalho 
Dec = “,” mostra que as casas decimais estão separadas por vírgula 
Sep = “;” demonstra que os dados no arquivo .csv estão separados por ponto e 
vírgula. 
Para chamar objeto e verificar se os dados foram armazenados corretamente: 
dado (e executar) – irá aparecer as informações contidas na tabela do excel 
> dado 
 Cultivares Bloco Producao 
1 A I 9 
2 B I 21 
3 C I 22 
4 D I 15 
5 E I 12 
6 A II 13 
7 B II 27 
8 C II 29 
 
Feito isso vamos avaliar a estrutura desses dados por meio da função: 
str(dado) 
> str(dado) 
'data.frame': 20 obs. of 3 variables: 
 $ Cultivares: chr "A" "B" "C" "D" ... 
 $ Bloco : chr "I" "I" "I" "I" ... 
 $ Producao : int 9 21 22 15 12 13 27 29 11 18 ... 
 
Observa-se que os dados Cultivares e Bloco são caracteres (chr) e Producao é 
inteiro (int). Para que a anova possa ser feita, precisamos transformar os dados de 
Cultivares e Bloco em fatores, para isso usamos as funções: 
dado$Cultivares <- as.factor(dado$Cultivares) 
dado$Bloco <- as.factor(dado$Bloco) 
Ao usar o as.factor estamos transformando a variável em questão em fator. Ao 
pedir a estrutura dos dados, podemos observar as alterações: 
str(dado) 
> str(dado) 
'data.frame': 20 obs. of 3 variables: 
 $ Cultivares: Factor w/ 5 levels "A","B","C","D",..: 1 2 3 4 5 1 2 3 4 5 ... 
 $ Bloco : Factor w/ 4 levels "I","II","III",..: 1 1 1 1 1 2 2 2 2 2 ... 
 $ Producao : int 9 21 22 15 12 13 27 29 11 18 ... 
 
O próximo passo é fazer o attach, para deixar o banco de dados disponível para 
selecionar as colunas apenas com os seus respectivos nomes, facilitando a manipulação 
dos dados: 
attach(dado) 
Por fim, vamos fazer a análise de variância por meio da função pré estabelecida 
pelo R, preenchendo com os nossos dados. A função original é: 
dbc(trat, bloco, resp, quali = TRUE, mcomp = "tukey", nl=FALSE, 
hvar='oneillmathews', sigT = 0.05, sigF = 0.05) 
Substituindo pelos nossos dados teremos 
dbc(Cultivares, Bloco, Producao, quali = TRUE, mcomp="sk", 
hvar="oneillmathews", sigT=0.05, sigF=0.05) 
Lembrando que o “tukey” ou o “sk” (Scott-knott) irá variar de acordo com o teste 
estatístico a ser usado no seu trabalho. 
Por fim, teremos a tabela de anova e do teste de médias conforme indicado na 
figura 3. 
 
Figura 3: Quadro de Anova e resultado do teste de médias 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Delineamento Inteiramente casualizado (DIC) 
1. Tabela do excel 
Assim como para o DBC o primeiro passo é criar a tabela do excel com as 
informações dispostas adequadamente (figura 4) e, posteriormente salvar como .csv 
(separado por vírgulas) conforme indicado na figura 2. 
 
Figura 4: Disposição das informações na tabela do excel 
 
2. Análise de Variância DIC 
Novamente, o primeiro passo é abrir o R studio, criar um script e salvá-lo na 
pasta onde encontra-se o arquivo .csv com seus dados. Feito isso, fechar o R studio, 
abrir a pasta com os arquivos salvos e clicar duas vezes para abrir o script do R e salvar 
o diretório, dessa forma, o programa saberá de onde ele deverá tirar as informações. 
Agora com o R studio aberto no script salvo, o primeiro comando a ser dado é a 
solicitação do pacote para a análise estatística, assim como no DBC, será utilizado o 
ExpDes.pt 
require(ExpDes.pt) 
Após executar o comando do pacote, iremos criar um objeto para salvar os 
nossos dados a serem analisados: 
dado1 <- read.csv ("ExemploDIC.csv", header = TRUE, dec = ",", sep = ";") 
“ExemploDIC.csv” é o nome do arquivo que queremos importar. 
Header = TRUE indica que na tabela há cabeçalho 
Dec = “,” mostra que as casas decimais estão separadas por vírgula 
Sep = “;” demonstra que os dados no arquivo .csv estão separados por ponto e 
vírgula. 
Para chamar objeto e verificar se os dados foram armazenados corretamente: 
dado1 (e executar) – irá aparecer as informações contidas na tabela do excel: 
> dado1 
 Hibridos Rep Altura. 
1 A I 2.25 
2 A II 2.23 
3 A III 2.20 
4 A IV 2.24 
5 A V 2.22 
6 A VI 2.26 
7 A VII 2.20 
8 B I 1.62 
9 B II 1.75 
10 B III 1.71 
 
Para então verificar a estrutura dos dados usaremos a função: 
Str(dado1) 
'data.frame': 42 obs. of 3 variables: 
 $ Hibridos: chr "A" "A" "A" "A" ... 
 $ Rep : chr "I" "II" "III" "IV" ... 
 $ Altura. : num 2.25 2.23 2.2 2.24 2.22 2.26 2.2 1.62 1.75 1.71 ... 
Nota-se que, tanto Híbrido como Rep estão como caracteres. Para o DIC 
precisamos transformar apenas o Hibrido em fator e, para isso, usaremos a função 
as.factor conforme indicado: 
dado1$Hibridos <- as.factor(dado1$Hibridos) 
Ao solicitar novamente a estrutura dos dados já podemos observar as alterações: 
Str(dado1) 
'data.frame': 42 obs. of 3 variables: 
 $ Hibridos: Factor w/ 6 levels "A","B","C","D",..: 1 1 1 1 1 1 1 2 2 2 ... 
 $ Rep : chr "I" "II" "III" "IV" ... 
 $ Altura. : num 2.25 2.23 2.2 2.24 2.22 2.26 2.2 1.62 1.75 1.71 ... 
 
O próximo passo é fazer o attach, para deixar o banco de dados disponível para 
selecionar as colunas apenas com os seus respectivos nomes, facilitando a manipulação 
dos dados: 
attach(dado1) 
Por fim, para fazer a análise de variância será utilizada a função pré estabelecida 
pelo R, preenchendo com os nossos dados. A função original é: 
dic(trat, resp, quali = TRUE, mcomp= "tukey", nl = FALSE, 
hvar='bartlett', sigT = 0.05, sigF = 0.05) 
Substituindo com as nossas informações: 
dic (Hibridos, Altura., quali = TRUE, mcomp = "sk", hvar='bartlett', 
 sigT = 0.05,sigF = 0.05) 
*Lembrando que o teste pode ser substituído de acordo com seu trabalho. 
Executando o comando, teremos a tabela com o resultado da ANOVA e do teste 
de médias, conforme figura 5. 
 
Figura 5: Resultado da ANOVA e do teste de médias