Baixe o app para aproveitar ainda mais
Prévia do material em texto
AED: Conjunto de dados lidos de um arquivo em estrutura de dados (data.frame) Após a mudança para o diretório correspondente, fazer a leitura do arquivo de dados video<-read.table (‘video_data.txt’, header=T) criando um objeto denominado video. O arquivo representa um conjunto de dados sobre jovens estudantes e seus hábitos de estudo e de jogar vídeo games. Disponibilize as variáveis através da função attach(video). Você terá disponível todas as variáveis para análise pelo nome, sem necessitar do nome do objeto video. Se quiser ver a planilha (que poderá ser editada, inclusive com acréscimo de variáveis) utilize a função fix(video). Você terá os dados conforme descrição a seguir: Var. Descrição Rótulos* time no. horas jogando VG na semana anterior à pesquisa like o quanto gosta de jogar 1=nunca jogou; 2=muito;3=mais ou menos;4=pouco; 5=não where onde joga 1=cybercafé; 2=casa (console); 3=casa(PC); 4= 1 e 2 ou 3; 5=2 e 3; 6=1, 2 e 3 freq frequência com que joga 1=diária; 2=semanal; 3=mensal; 4=semestral busy joga quando está ocupado? 1=sim; 0=não edu jogos educativos? 1=sim; 0=não sex gênero 1=masculino; 2=feminino age idade idade do aluno em anos home tem computador na sua casa? 1=sim; 0=não math você odeia matemática? 1=sim; 0=não work número de horas trabalhadas (estudo) na semana anterior à pesquisa número de horas own possui notebook? 1=sim; 0=não CD seu notebook tem drive de CD? 1=sim; 0=não email você tem endereço eletrônico? 1=sim; 0=não grade que conceito vc espera na disciplina de Estatística? 4=A; 3=B; 2=C; 1=D; 0=R * 99 indica para as variáveis categóricas (“factors”), um valor não observado (NA). a) Vc poderia indicar de uma vez que os valores ‘99’ significam NA através do argumento na.strings=’99’ na função read.table. b) utilize o comando mode(objeto) para verificar que atributos o mesmo tem. Vc vai verificar que é do tipo list, que permite todos os tipos de variáveis: numéricas, caracteres, complexo, lógico, função, expressão, etc. c) utilize o comando str(objeto)para ter uma descrição do conjunto de dados. d) verifique na tabela acima quais são as variáveis categóricas (chamadas em geral de “factors”), já que todas as variáveis inicialmente são entendidas como numéricas (inteiras ou contínuas) e então indique para cada uma quantas categorias (“levels”) existem e quais os rótulos dados para cada categoria, de acordo com o script a seguir para a variável like e para a variável busy: flike<-factor(like, levels=1:5, labels =c (‘nunca’,’muito’,’+ou-‘,’pouco’,’não’))#transforma os valores #numéricos em 5 níveis, de 1 a 5 e o restante em NA e dá rótulos aos níveis ou categorias. Poderia também ter usado a função levels: levels(flike)[1]<-'nunca'; levels(flike)[2]<-'muito'; levels(flike)[3]<-'+ ou -'; levels(flike)[4]<-'pouco' levels(flike)[5]<-'não' Para a variável busy teríamos: fbusy<-factor(busy, levels=c(0,1),labels = c(‘não’,’sim’)) e) Para testar o que foi feito, solicite box-plots da variável idade para cada nível da variável sex f) Vamos ver como poderíamos separar a base de dados, por exemplo, em dois grupos: meninos e meninas MENINAS<-subset(objeto,sex==0) MENINOS<-subset(objeto, sex==1) g) Vamos agora, por exemplo, pedir a média aritmética da variável número de horas jogando VG (time) para cada subconjunto; mean(MENINOS$time), ou os 5 números representativos para cada subconjunto.
Compartilhar