Aula 3 (pratica)

•

UFJF

0

1

0

1

0

Isadora Lupchinski

30.05.2015

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Análise Exploratória de Dados

470 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

AED: Conjunto de dados lidos de um arquivo em estrutura de dados (data.frame) 
Após a mudança para o diretório correspondente, fazer a leitura do arquivo de dados video<-read.table 
(‘video_data.txt’, header=T) criando um objeto denominado video. O arquivo representa um conjunto de dados 
sobre jovens estudantes e seus hábitos de estudo e de jogar vídeo games. Disponibilize as variáveis através da 
função attach(video). Você terá disponível todas as variáveis para análise pelo nome, sem necessitar do nome do 
objeto video. Se quiser ver a planilha (que poderá ser editada, inclusive com acréscimo de variáveis) utilize a função 
fix(video). Você terá os dados conforme descrição a seguir: 
 
Var. Descrição Rótulos* 
time no. horas jogando VG na semana anterior à pesquisa 
like o quanto gosta de jogar 1=nunca jogou; 2=muito;3=mais ou 
menos;4=pouco; 5=não 
where onde joga 1=cybercafé; 2=casa (console); 3=casa(PC); 
4= 1 e 2 ou 3; 5=2 e 3; 6=1, 2 e 3 
freq frequência com que joga 1=diária; 2=semanal; 3=mensal; 
4=semestral 
busy joga quando está ocupado? 1=sim; 0=não 
edu jogos educativos? 1=sim; 0=não 
sex gênero 1=masculino; 2=feminino 
age idade idade do aluno em anos 
home tem computador na sua casa? 1=sim; 0=não 
math você odeia matemática? 1=sim; 0=não 
work número de horas trabalhadas (estudo) na semana anterior à 
pesquisa 
número de horas 
own possui notebook? 1=sim; 0=não 
CD seu notebook tem drive de CD? 1=sim; 0=não 
email você tem endereço eletrônico? 1=sim; 0=não 
grade que conceito vc espera na disciplina de Estatística? 4=A; 3=B; 2=C; 1=D; 0=R 
* 99 indica para as variáveis categóricas (“factors”), um valor não observado (NA). 
a) Vc poderia indicar de uma vez que os valores ‘99’ significam NA através do argumento na.strings=’99’ na 
função read.table. 
b) utilize o comando mode(objeto) para verificar que atributos o mesmo tem. Vc vai verificar que é do tipo list, 
que permite todos os tipos de variáveis: numéricas, caracteres, complexo, lógico, função, expressão, etc. 
c) utilize o comando str(objeto)para ter uma descrição do conjunto de dados. 
d) verifique na tabela acima quais são as variáveis categóricas (chamadas em geral de “factors”), já que todas 
as variáveis inicialmente são entendidas como numéricas (inteiras ou contínuas) e então indique para cada 
uma quantas categorias (“levels”) existem e quais os rótulos dados para cada categoria, de acordo com o 
script a seguir para a variável like e para a variável busy: 
flike<-factor(like, levels=1:5, labels =c (‘nunca’,’muito’,’+ou-‘,’pouco’,’não’))#transforma os valores 
#numéricos em 5 níveis, de 1 a 5 e o restante em NA e dá rótulos aos níveis ou categorias. 
Poderia também ter usado a função levels: 
levels(flike)[1]<-'nunca'; levels(flike)[2]<-'muito'; levels(flike)[3]<-'+ ou -'; levels(flike)[4]<-'pouco' 
levels(flike)[5]<-'não' 
Para a variável busy teríamos: 
fbusy<-factor(busy, levels=c(0,1),labels = c(‘não’,’sim’)) 
e) Para testar o que foi feito, solicite box-plots da variável idade para cada nível da variável sex 
f) Vamos ver como poderíamos separar a base de dados, por exemplo, em dois grupos: meninos e meninas 
MENINAS<-subset(objeto,sex==0) 
MENINOS<-subset(objeto, sex==1) 
g) Vamos agora, por exemplo, pedir a média aritmética da variável número de horas jogando VG (time) para 
cada subconjunto; mean(MENINOS$time), ou os 5 números representativos para cada subconjunto.