Prévia do material em texto
Universidade José do Rosário Vellano
Ana Beatriz Carvalho Terra
APOSTILA PARA ANÁLISES ESTATÍTICAS UTILIZANDO O SOFTWARE R
ALFENAS
2020
Sumário
Delineamento em Blocos Casualizados (DBC) .......................................................................... 3
Delineamento Inteiramente casualizado (DIC) ........................................................................ 8
Delineamento em Blocos Casualizados (DBC)
1. Montando a tabela no excel
Para que o R consiga ler os dados é importante que a tabulação de forma adequada.
Atente-se para evitar palavras com acento no cabeçalho. Quanto mais simples a escrita,
melhor para evitar erros de digitação na hora de dar os comandos no software. A figura 1
indica como as informações devem ser dispostas nas células.
Figura 1: Disposição das informações na tabela do excel
Feito isso, o arquivo deverá ser salvo em .csv (separado por vírgulas). Para
executar basta ir em Arquivo – Salvar como - .csv (separado por vírgula), conforme
ilustrado na figura 2.
Figura 2: Modo de salvar a tabela para importação no R
Uma vez feita a tabela e salva no formato apropriado, o próximo passo é abrir o
programa estatístico R studio para então dar início às análises.
2. Análise de Variância DBC
Para dar início, primeiramente deve-se abrir o programa R studio e criar um script.
Colocar o script para salvar na mesma pasta em que se encontra os arquivos do excel.
Feito isso, fechar o R studio. Agora você deverá ir na pasta onde estão salvos os arquivos
(script e excel.csv) e clicar duas vezes no script para abrir.
Assim que o programa reabrir, o seu diretório estará definido, ou seja, o R saberá
de onde importar as informações e então será possível prosseguir com as análises. O
primeiro passo é sempre atualizar a biblioteca a ser utilizada no R. No caso das análises
de experimentação o pacote a ser utilizado é “ExpDes.pt
library(ExpDes.pt)
Posteriormente iremos criar um objeto para armazenar as nossas informações:
dado <- read.csv ("ExemploDBC.csv", header = TRUE, dec = ",", sep = ";")
“ExemploDBC.csv” é o nome do arquivo que queremos importar.
Header = TRUE indica que na tabela há cabeçalho
Dec = “,” mostra que as casas decimais estão separadas por vírgula
Sep = “;” demonstra que os dados no arquivo .csv estão separados por ponto e
vírgula.
Para chamar objeto e verificar se os dados foram armazenados corretamente:
dado (e executar) – irá aparecer as informações contidas na tabela do excel
> dado
Cultivares Bloco Producao
1 A I 9
2 B I 21
3 C I 22
4 D I 15
5 E I 12
6 A II 13
7 B II 27
8 C II 29
Feito isso vamos avaliar a estrutura desses dados por meio da função:
str(dado)
> str(dado)
'data.frame': 20 obs. of 3 variables:
$ Cultivares: chr "A" "B" "C" "D" ...
$ Bloco : chr "I" "I" "I" "I" ...
$ Producao : int 9 21 22 15 12 13 27 29 11 18 ...
Observa-se que os dados Cultivares e Bloco são caracteres (chr) e Producao é
inteiro (int). Para que a anova possa ser feita, precisamos transformar os dados de
Cultivares e Bloco em fatores, para isso usamos as funções:
dado$Cultivares <- as.factor(dado$Cultivares)
dado$Bloco <- as.factor(dado$Bloco)
Ao usar o as.factor estamos transformando a variável em questão em fator. Ao
pedir a estrutura dos dados, podemos observar as alterações:
str(dado)
> str(dado)
'data.frame': 20 obs. of 3 variables:
$ Cultivares: Factor w/ 5 levels "A","B","C","D",..: 1 2 3 4 5 1 2 3 4 5 ...
$ Bloco : Factor w/ 4 levels "I","II","III",..: 1 1 1 1 1 2 2 2 2 2 ...
$ Producao : int 9 21 22 15 12 13 27 29 11 18 ...
O próximo passo é fazer o attach, para deixar o banco de dados disponível para
selecionar as colunas apenas com os seus respectivos nomes, facilitando a manipulação
dos dados:
attach(dado)
Por fim, vamos fazer a análise de variância por meio da função pré estabelecida
pelo R, preenchendo com os nossos dados. A função original é:
dbc(trat, bloco, resp, quali = TRUE, mcomp = "tukey", nl=FALSE,
hvar='oneillmathews', sigT = 0.05, sigF = 0.05)
Substituindo pelos nossos dados teremos
dbc(Cultivares, Bloco, Producao, quali = TRUE, mcomp="sk",
hvar="oneillmathews", sigT=0.05, sigF=0.05)
Lembrando que o “tukey” ou o “sk” (Scott-knott) irá variar de acordo com o teste
estatístico a ser usado no seu trabalho.
Por fim, teremos a tabela de anova e do teste de médias conforme indicado na
figura 3.
Figura 3: Quadro de Anova e resultado do teste de médias
Delineamento Inteiramente casualizado (DIC)
1. Tabela do excel
Assim como para o DBC o primeiro passo é criar a tabela do excel com as
informações dispostas adequadamente (figura 4) e, posteriormente salvar como .csv
(separado por vírgulas) conforme indicado na figura 2.
Figura 4: Disposição das informações na tabela do excel
2. Análise de Variância DIC
Novamente, o primeiro passo é abrir o R studio, criar um script e salvá-lo na
pasta onde encontra-se o arquivo .csv com seus dados. Feito isso, fechar o R studio,
abrir a pasta com os arquivos salvos e clicar duas vezes para abrir o script do R e salvar
o diretório, dessa forma, o programa saberá de onde ele deverá tirar as informações.
Agora com o R studio aberto no script salvo, o primeiro comando a ser dado é a
solicitação do pacote para a análise estatística, assim como no DBC, será utilizado o
ExpDes.pt
require(ExpDes.pt)
Após executar o comando do pacote, iremos criar um objeto para salvar os
nossos dados a serem analisados:
dado1 <- read.csv ("ExemploDIC.csv", header = TRUE, dec = ",", sep = ";")
“ExemploDIC.csv” é o nome do arquivo que queremos importar.
Header = TRUE indica que na tabela há cabeçalho
Dec = “,” mostra que as casas decimais estão separadas por vírgula
Sep = “;” demonstra que os dados no arquivo .csv estão separados por ponto e
vírgula.
Para chamar objeto e verificar se os dados foram armazenados corretamente:
dado1 (e executar) – irá aparecer as informações contidas na tabela do excel:
> dado1
Hibridos Rep Altura.
1 A I 2.25
2 A II 2.23
3 A III 2.20
4 A IV 2.24
5 A V 2.22
6 A VI 2.26
7 A VII 2.20
8 B I 1.62
9 B II 1.75
10 B III 1.71
Para então verificar a estrutura dos dados usaremos a função:
Str(dado1)
'data.frame': 42 obs. of 3 variables:
$ Hibridos: chr "A" "A" "A" "A" ...
$ Rep : chr "I" "II" "III" "IV" ...
$ Altura. : num 2.25 2.23 2.2 2.24 2.22 2.26 2.2 1.62 1.75 1.71 ...
Nota-se que, tanto Híbrido como Rep estão como caracteres. Para o DIC
precisamos transformar apenas o Hibrido em fator e, para isso, usaremos a função
as.factor conforme indicado:
dado1$Hibridos <- as.factor(dado1$Hibridos)
Ao solicitar novamente a estrutura dos dados já podemos observar as alterações:
Str(dado1)
'data.frame': 42 obs. of 3 variables:
$ Hibridos: Factor w/ 6 levels "A","B","C","D",..: 1 1 1 1 1 1 1 2 2 2 ...
$ Rep : chr "I" "II" "III" "IV" ...
$ Altura. : num 2.25 2.23 2.2 2.24 2.22 2.26 2.2 1.62 1.75 1.71 ...
O próximo passo é fazer o attach, para deixar o banco de dados disponível para
selecionar as colunas apenas com os seus respectivos nomes, facilitando a manipulação
dos dados:
attach(dado1)
Por fim, para fazer a análise de variância será utilizada a função pré estabelecida
pelo R, preenchendo com os nossos dados. A função original é:
dic(trat, resp, quali = TRUE, mcomp= "tukey", nl = FALSE,
hvar='bartlett', sigT = 0.05, sigF = 0.05)
Substituindo com as nossas informações:
dic (Hibridos, Altura., quali = TRUE, mcomp = "sk", hvar='bartlett',
sigT = 0.05,sigF = 0.05)
*Lembrando que o teste pode ser substituído de acordo com seu trabalho.
Executando o comando, teremos a tabela com o resultado da ANOVA e do teste
de médias, conforme figura 5.
Figura 5: Resultado da ANOVA e do teste de médias