Baixe o app para aproveitar ainda mais
Prévia do material em texto
FUNDAMENTOS DE TI PARA CLOUD COMPUTING GRÁFICOS NO AMBIENTE ESTATÍSTICO R Importação de Arquivos; Introdução ao Gráfico; Gráfico de Dispersão; Conclusão. GRÁFICOS NO AMBIENTE ESTATÍSTICO R AGENDA GRÁFICOS NO AMBIENTE ESTATÍSTICO R IIMPORTAÇÃO DE ARQUIVOS A importação de arquivos em R pode ser feita basicamente de duas maneiras: a partir da leitura de arquivos; a partir da leitura de bases de dados; O ambiente R permite também a chamada de consultas expressas em SQL; Vamos foca na leitura de dados armazenados em arquivos. GRÁFICOS NO AMBIENTE ESTATÍSTICO R IIMPORTAÇÃO DE ARQUIVOS A forma mais comum é a leitura de arquivos com valores separados por um identificador, como os arquivos CSV (comma separated values); O CSV é um formato de exportação frequentemente presente em ambientes que armazenam ou exploram dados, como em SGBD ou em planilhas Excel; GRÁFICOS NO AMBIENTE ESTATÍSTICO R IIMPORTAÇÃO DE ARQUIVOS Na importação de um arquivo é possível escolher o tipo de separador a ser usado no arquivo; A leitura de um arquivo CSV no ambiente R é feita pela função read.table( ) que exige três parâmetros de entrada: o caminho do arquivo (pode ser um caminho local ou um endereço na web); um indicador (header), de que a primeira linha é um cabeçalho (TRUE) ou já é um conteúdo de dados (FALSE); tipo de separador (sep), refere-se ao caractere usado para separar os valores contidos no arquivo. GRÁFICOS NO AMBIENTE ESTATÍSTICO R IIMPORTAÇÃO DE ARQUIVOS Utilizaremos o conjunto de dados da Universidade da Califórnia (UC), disponivel em http://archive.ics.uci.edu/ml/ GRÁFICOS NO AMBIENTE ESTATÍSTICO R IIMPORTAÇÃO DE ARQUIVOS Dentre o conjunto de dados da Universidade da Califórnia utilizaremos a base de dados Iris; Esta base foi disponibilizada na UC pelo estatístico R. A. Fisher em 1988 e tem sido amplamente utilizada pela comunidade científica; GRÁFICOS NO AMBIENTE ESTATÍSTICO R IIMPORTAÇÃO DE ARQUIVOS Iris corresponde a uma classe de plantas com flor, a qual divide-se em três tipos de flores (classes): Setosa; Virginica; Versicolor; Uma característica importante desse repositório é que, ao organizar os agrupamentos, a classe Setosa distingue-se bem das demais; GRÁFICOS NO AMBIENTE ESTATÍSTICO R IIMPORTAÇÃO DE ARQUIVOS Desta forma a Setosa possui quatro atributos: Comprimento da Sépala; Largura da Sépala; Comprimento da Pétala; Largura da Pétala; Esses atributos estão em unidades de centímetros(cm); O número de objetos agrupados da Setosa é da ordem de 150; GRÁFICOS NO AMBIENTE ESTATÍSTICO R IIMPORTAÇÃO DE ARQUIVOS GRÁFICOS NO AMBIENTE ESTATÍSTICO R IIMPORTAÇÃO DE ARQUIVOS Segue, abaixo, um exemplo de uma amostra normalizada da base de dados Iris: GRÁFICOS NO AMBIENTE ESTATÍSTICO R IIMPORTAÇÃO DE ARQUIVOS A leitura do arquivo pode ser feita da seguinte forma: GRÁFICOS NO AMBIENTE ESTATÍSTICO R IIMPORTAÇÃO DE ARQUIVOS Ou ainda da seguinte forma: GRÁFICOS NO AMBIENTE ESTATÍSTICO R INTRODUÇÃO A capacidade gráfica representa um componente muito importante e extremamente versátil do Ambiente R; O ambiente R inclui funções para a criação de vários tipos de gráficos, como gráficos de barras, de setores, de linhas, de dispersão, dentre outros; GRÁFICOS NO AMBIENTE ESTATÍSTICO R INTRODUÇÃO Essas funções estão disponíveis no pacote graphics, nativo do ambiente; Há ainda outros tipos de gráficos possíveis, mais sofisticados, cujas funções para criação estão disponíveis no pacote lattice, por exemplo; GRÁFICOS NO AMBIENTE ESTATÍSTICO R INTRODUÇÃO A construção dos gráficos deve levar em consideração o tipo de variável que se pretende representar; Na tabela abaixo, apresenta-se um resumo dos tipos de gráficos, mais comuns, que deve ser feito para cada tipo de variável; GRÁFICOS NO AMBIENTE ESTATÍSTICO R INTRODUÇÃO Segue tabela abaixo com um resumo das funções para criação de gráficos: GRÁFICOS NO AMBIENTE ESTATÍSTICO R GRÁFICO DE DISPERSÃO (SCATTER PLOT) OU ESPALHAMENTO Permite a visualização da distribuição dos exemplares de um conjunto de dados; A função plot( ) constrói esse gráfico a partir dos valores atribuídos a uma série de parâmetros, listados na tabela a seguir; GRÁFICOS NO AMBIENTE ESTATÍSTICO R GRÁFICO DE DISPERSÃO (SCATTER PLOT) OU ESPALHAMENTO GRÁFICOS NO AMBIENTE ESTATÍSTICO R GRÁFICO DE DISPERSÃO (SCATTER PLOT) OU ESPALHAMENTO Para fazer o gráfico utilizando a função plot( ), vamos criar dois vetores com as informações da Pétala e da Sépala: GRÁFICOS NO AMBIENTE ESTATÍSTICO R GRÁFICO DE DISPERSÃO (SCATTER PLOT) OU ESPALHAMENTO Conhecer a importação de arquivos; Conheceremos outros tipos de gráficos. GRÁFICOS NO AMBIENTE ESTATÍSTICO R CONCLUSÃO
Compartilhar