Buscar

Fundamentos de TI para Cloud Computing com R

Prévia do material em texto

FUNDAMENTOS DE TI PARA CLOUD COMPUTING
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
Importação de Arquivos;
Introdução ao Gráfico;
Gráfico de Dispersão;
Conclusão.
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
AGENDA
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
A importação de arquivos em R pode ser feita basicamente de duas maneiras: 
a partir da leitura de arquivos;
a partir da leitura de bases de dados;
O ambiente R permite também a chamada de consultas expressas em SQL;
Vamos foca na leitura de dados armazenados em arquivos. 
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
A forma mais comum é a leitura de arquivos com valores separados por um identificador, como os arquivos CSV (comma separated values);
O CSV é um formato de exportação frequentemente presente em ambientes que armazenam ou exploram dados, como em SGBD ou em planilhas Excel;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
Na importação de um arquivo é possível escolher o tipo de separador a ser usado no arquivo;
A leitura de um arquivo CSV no ambiente R é feita pela função read.table( ) que exige três parâmetros de entrada:
o caminho do arquivo (pode ser um caminho local ou um endereço na web);
um indicador (header), de que a primeira linha é um cabeçalho (TRUE) ou já é um conteúdo de dados (FALSE);
tipo de separador (sep), refere-se ao caractere usado para separar os valores contidos no arquivo.
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
Utilizaremos o conjunto de dados da Universidade da Califórnia (UC), disponivel em http://archive.ics.uci.edu/ml/ 
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
Dentre o conjunto de dados da Universidade da Califórnia utilizaremos a base de dados Iris;
Esta base foi disponibilizada na UC pelo estatístico R. A. Fisher em 1988 e tem sido amplamente utilizada pela comunidade científica;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
Iris corresponde a uma classe de plantas com flor, a qual divide-se em três tipos de flores (classes):
Setosa;
Virginica;
Versicolor;
Uma característica importante desse repositório é que, ao organizar os agrupamentos, a classe Setosa distingue-se bem das demais;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
Desta forma a Setosa possui quatro atributos:
Comprimento da Sépala;
Largura da Sépala;
Comprimento da Pétala;
Largura da Pétala;
Esses atributos estão em unidades de centímetros(cm);
O número de objetos agrupados da Setosa é da ordem de 150;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
Segue, abaixo, um exemplo de uma amostra normalizada da base de dados Iris:
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
A leitura do arquivo pode ser feita da seguinte forma:
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
IIMPORTAÇÃO DE ARQUIVOS
Ou ainda da seguinte forma:
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
INTRODUÇÃO
A capacidade gráfica representa um componente muito importante e extremamente versátil do Ambiente R;
O ambiente R inclui funções para a criação de vários tipos de gráficos, como gráficos de barras, de setores, de linhas, de dispersão, dentre outros;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
INTRODUÇÃO
Essas funções estão disponíveis no pacote graphics, nativo do ambiente;
Há ainda outros tipos de gráficos possíveis, mais sofisticados, cujas funções para criação estão disponíveis no pacote lattice, por exemplo;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
INTRODUÇÃO
A construção dos gráficos deve levar em consideração o tipo de variável que se pretende representar;
Na tabela abaixo, apresenta-se um resumo dos tipos de gráficos, mais comuns, que deve ser feito para cada tipo de variável;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
INTRODUÇÃO
Segue tabela abaixo com um resumo das funções para criação de gráficos: 
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
GRÁFICO DE DISPERSÃO (SCATTER PLOT) OU ESPALHAMENTO
Permite a visualização da distribuição dos exemplares de um conjunto de dados;
A função plot( ) constrói esse gráfico a partir dos valores atribuídos a uma série de parâmetros, listados na tabela a seguir;
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
GRÁFICO DE DISPERSÃO (SCATTER PLOT) OU ESPALHAMENTO
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
GRÁFICO DE DISPERSÃO (SCATTER PLOT) OU ESPALHAMENTO
Para fazer o gráfico utilizando a função plot( ), vamos criar dois vetores com as informações da Pétala e da Sépala:
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
GRÁFICO DE DISPERSÃO (SCATTER PLOT) OU ESPALHAMENTO
Conhecer a importação de arquivos;
Conheceremos outros tipos de gráficos.
GRÁFICOS NO AMBIENTE ESTATÍSTICO R
CONCLUSÃO

Continue navegando