A maior rede de estudos do Brasil

Grátis
224 pág.
Estatistica usado o R

Pré-visualização | Página 12 de 50

o texto no R clicar com o botão direito do mouse e
escolher “Copy”:
Agora, é só colar o conteúdo no Word ou programa equivalente. Em qualquer editor de texto
no Windows, a forma de se fazer isso é a mesma utilizada acima no processo de copiar os dados do
R bastando trocar a opção “Copy” pela opção “Colar” (ou “Paste”). Para obter uma formatação no
Word igual ao que aparece no R troque a fonte do texto colado para “courier new”.
Uma outra necessidade de exportação de dados pode ser quando se deseja exportar uma
tabulação qualquer (for exemplo uma tabela de freqüências, com uma ou mais variáveis) para um
programa de planilha eletrônica. Bem, nós podemo usar neste caso a nossa já conhecida função
write.table(), pois ela funciona também com outros tipos de objetos fora bancos de dados.
Para dar um exemplo, vamos dizer que desejamos fazer uma tabulação das espécies segundo
o critério delas terem pétalas maiores ou menores do que a mediana do grupo inteiro. Inicialmente,
vamos descobrir essa mediana:
> median(Petal.Length)
[1] 4.35
7
Muito bem, vamos então criar um vetor para agrupar as espécies segundo essa mediana (não
se preocupe em entender a sintaxe por enquanto):
> g.petala <- ifelse(Petal.Length<4.35,"<4.35",">=4.35")
> table(Species, g.petala)
 g.petala
Species <4.35 >=4.35
 setosa 50 0
 versicolor 25 25
 virginica 0 50
No primeiro comando, criamos o objeto g.petala que contém os agrupamentos, depois
fizemos uma tabela para comparar as espécies com os grupos. Podemos guardar essa tabela em um
objeto se quisermos. Faça assim:
g.petala <- ifelse(Petal.Length<4.35,"<4.35",">=4.35")
output <- table(Species, g.petala)
Confira o conteúdo do objeto output. Deverá ser a mesma tabela acima. Agora podemos
usar a nossa velha amiga;
write.table(output, file="petalas.csv", row.names=F, sep=",", quote=F)
A única diferença é que o formato da tabela exportada é um pouco diferente (será uma
tabela de freqüências por grupos em vez de uma tabela 3x2). Veja um exemplo após a importação
para o Calc:
No caso da saída de uma função ser um gráfico, o procedimento de copiar e colar é outro.
Vamos fazer boxplots para comparar os tamanhos das pétalas por espécie.
8
> boxplot(Sepal.Length ~ Species, xlab="Espécie", ylab="Tamanho da
Pétala", main="Boxplots do Tamanho da Pétala por Espécie")
Um arquivo gráfico pode ser copiado pelo R através de de dois formatos: Bitmap ou
“metafile”. Esses formatos se diferem entre si por vantagens e desvantagens que cada um possui.
Uma dentre outras vantagens do formato “metafile” é o fato dele gerar arquivos de tamanho menor. 
Para copiar um arquivo no formato “metafile”, primeiro se certifique que a janela gráfica
está selecionada (para tanto, apenas clique em qualquer área dentro da janela), e então escolha no
menu “File” dentro de “Copy to the Clipboard” a opção “as Metafile”:
Depois é só colar no seu editor de texto preferido, ou até mesmo na sua planilha. Colando
no formato “metafile” podemos editar a figura através de um duplo clique sobre a figura permitindo
alterar o título do gráfico, valores que aparecem nos eixos, etc, se você tiver um programa que
permita editar “metafiles”
9
Módulo Estatística I no R
Autor: Antonio Guilherme Fonseca Pacheco
Pré-requisitos: Conhecimento prévio do ambiente R. Especificamente, o leitor deve estar
familiarizado com os módulos “Básico”, “Entrada e Saída de Dados” e também “Manuseando
dados no R”.
Bibliotecas necessárias: ISwR
Este é um módulo especial da série de módulos destinados ao aprendizado do ambiente R. A
abrangência deste módulo é o conteúdo a ser dado em um curso básico de Bioestatística para alunos
de pós-graduação, ministrado em qualquer instituição de ensino superior.
O objetivo desse módulo não é tornar o leitor um especialista em R, nem sequer um
utilizador freqüente do programa, mas sim usar o R como uma ferramenta de ensino da
Bioestatística. Alunos que já conhecem o R podem usar esse módulo sem recorrer a nenhum outro
módulo básico sobre o R, mas para aqueles que nunca trabalharam com ele, é fundamental a leitura
dos 3 módulos básicos contidos no material “Aprendendo R” e também a leitura prévia do módulo
“Manuseando um Banco de Dados no R”
Este módulo é baseado no livro Introductory Statistics with R, escrito pelo professor Peter
Dalgaard, que é um dos membros do core de desenvolvimento do R. A adoção deste livro como
referência leva em conta o fato dele ter quase todos os seus exemplos em bioestatística (que é a área
pela qual eu me interesso) e de ter disponível no próprio CRAN uma biblioteca com todos os
bancos de dados necessários, chamada ISwR.
Os tópicos abordados nesse instrutivo acompanham aqueles que serão abordados nas aulas
teóricas do curso de Estatística I, a saber:
• Probabilidade e distribuições
• Estatística descritiva
• Distribuições amostrais
• Teste de Hipóteses, poder e tamanho da amostra
• Testes para uma e duas amostras (contínuos)
• Proporções
• ANOVA
• Regressão e correlação
A programação de um curso como este é para ser dado em 8 aulas, cada uma abordando um
destes temas citados, fora as aulas para o aprendizado do R. Sendo assim, vamos dividir esses
tópicos em aulas não necessariamente do mesmo tamanho,como vocês poderão perceber no
calendário do curso. Cada aula terá o tempo de 3 a 4 horas e meia, dependendo dos conteúdos a
serem estudados. Esse é o tempo médio para que o aluno possa ler e treinar cada uma dessas aulas.
Claro que isso é uma média mesmo, e algumas pessoas necessitarão de mais dedicação para
acompanhar o ritmo das aulas.
Nem todas as aulas necessitarão da biblioteca , mas sempre que isso acontecer, será
indicado no início da aula. Nem todas as aulas também estão contempladas no nosso livro de
referência, ma sempre que estiverem, as páginas correspondentes estarão também indicadas.
Convenções e dicas
Se você já leu os outros tutoriais deste material, já deve estar acostumado com as
convenções (que não são muitas) usadas neste material. Sempre que estivermos nos referindo a um
código ou saída de texto do R, usaremos a fonte Courier New tamanho 10 como em:
choose(1000, 30)
Existem dois tipos básicos de apresentação dos comandos. Esse acima, que não tem
nenhuma saída de texto abaixo e também não é precedido do símbolo do prompt do R “>”, será
geralmente para ser copiado e colado no prompt do R para se obter a saída. Já os do tipo:
> mean(notas)
[1] 7.01
São em geral apenas para a observação dos resultados (claro que isso não impede que o
comando seja usado, mas só tome cuidado para não colar o símbolo “>” junto, porque neste caso vai
dar erro no R).
Existe ainda mais um tipo, que é igual ao primeiro, no sentido que é para ser copiado e
colado também, mas de uma maneira mais complexa. São as funções. Elas têm esse jeitão:
var.pop <- function (x) 
{
 sum((x-mean(x))^2)/length(x)
}
Módulo Estatística I no R
Autor: Antonio Guilherme Fonseca Pacheco
Pré-requisitos: Conhecimento prévio do ambiente R. Especificamente, o leitor deve estar
familiarizado com os módulos “Básico”, “Entrada e Saída de Dados” e também “Manuseando
dados no R”.
Bibliotecas necessárias: Nenhuma
Aula 1 – Probabilidade e distribuições
Livro: páginas 45 a 55
Essa aula na verdade conterá muita recordação do módulo básico onde falamos sobre
distribuições e gráficos. Ficarei à vontade inclusive para copiar algumas partes do texto já escrito. O
motivo dessa repetição é não só aprofundar um pouco essas noções que foram passadas, mas
também permitir a introdução ao assunto para aqueles que se sentiram capazes de não estudar o
módulo básico.
Probabilidade
A função sample()
Distribuições Discretas
Distribuições Contínuas
Distribuições no R
• Densidade
• Acumulativa
• Quantis
• Números pseudo-aleatórios
Exercícios
Probabilidade
Inicialmente, vamos falar de probabilidades e amostras aleatórias. Como você já deve ter
notado, a inferência estatística é baseada sempre em uma amostra aleatória que é tirada de uma
determinada população