Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal do Rio Grande do Norte Centro de Tecnologia - CT Departamento de Engenharia de Produção ESTATÍSTICA PARA ENGENHARIA DE PRODUÇÃO Prof. Luciano Queiroz Natal/RN 10/02/14 Sumário Software R Estatística descritiva Por que aprender R? Custo (R$) Disponibilidade para as plataformas UNIX, Windows, MacOS Software Livre Possibilidade de criar e compartilhar pacotes Contém implementações de métodos avançados, que não são facilmente encontrados em outros programas estatísticos Alta confiabilidade dos resultados; Capacidade de produção de gráficos de alta qualidade É amplamente utilizado não apenas na academia, mas em empresas como: Google, New York Times, Pfizer, Bank of America, Merck, InterContinental Hotels Group, Shell, etc. Ao clicar o ícone do R na área de trabalho, uma janela de comando fica disponível. Cada vez que o R é iniciado, cria-se uma nova sessão. O processo de utilização do R requer que o usuário digite comandos na janela de comandos e aperte “enter” para que o comando seja executado. O R é case-sensitive, ou seja, Peso≠peso O prompt “ > ” indica que o R está pronto para receber um comando. O “+” indica que ainda falta receber algum comando. Para finalizar a sessão, utiliza-se o comando q(). E depois sim para salvar. Por exemplo: >exp() >sin() >cos() >log() >pi >Inf >-Inf >letters ou LETTERS >month.abb ou month.name O R já possui em sua base de dados diversas funções pré-programadas: + : adição - : subtração * : multiplicação / : divisão ^: exponenciação (): ordenamento de operações %% : resto de divisão %=% : divisão inteira []: corte e extração de dados “ ”: delimitação de um caractere R utiliza os seguintes símbolos para realizar operações aritméticas entre outras: • > : maior que • >= : maior que ou igual a • < : menor que • <= : menor que ou igual a • == : igualdade • != : diferença • sqrt() : raiz quadrada Variáveis O resultado da avaliação de comandos são impressos na tela do R. No entanto, um resultado pode ser armazenado através da atribuição do valor calculado a uma variável. A atribuição de valores se dá através da utilização do operador “<-”. Nomes de variáveis podem incluir letras, números e caracteres “.” ou “a”, desde que iniciem com uma letra ou “.”. EXERCÍCIO 1 Equações: (6+45x25)= A (5x100-490)²= B A-B=Z (5.772+9.877/44)/A= O (975/B+987x65)= T √86.644= U (876²-18.774+8774/763)= K √π= P Objetos Toda informação é armazenada em R na forma de objetos. Variáveis são apenas um tipo de objeto. Durante uma sessão, todos os objetos são armazenados na área de trabalho ou workspace. Podemos visualizar o conteúdo da área de trabalho utilizando as funções objects() ou ls(). Para remover objetos utilizamos as funções remove() ou rm(). Objetos Sempre ao iniciar o R, definir o diretório de trabalho. Depois de definido o diretório, caso deseje utilizar algum conjunto de dados, utilizar o comando >read.table, para inserir o arquivo de dados no R. Arquivos somente com números Arquivos com diferentes variáveis OBS: Caso deseje utilizar a linha com as variáveis digite TRUE, caso contrario use FALSE. Estatística Descritiva Media: >mean() Mediana: >median() Moda: >subset(table(),table()==max(table())) Amplitude máxima: max() Amplitude mínima: min() 1º ao 5º quartil: > fivenum() Desvio padrão: > sd() Variância: > var() Coeficiente de Variação: >cv() O comando >summary() exibe os principais dados descritivos. EXERCÍCIO 2 No arquivo “maquinas.txt”, estão expressos o tempo de produção de um determinado produto em duas diferentes máquinas A e B. Calcule a estatística descritiva dessa amostra (media, mediana, moda, os quartis, desvio padrão e variância) Lembrete: Quando os dados possuírem uma variável denominada ou mais de uma variável, utilize o comando de definição da variável que é representado por (objeto$variável). Exemplos de variáveis: tempo, idade, peso, atividade, etc. HISTOGRAMA >hist() DIAGRAMA DE FOLHAS >stem() Variáveis quantitativas Variáveis quantitativas Boxplot: EXERCÍCIO 3 1- Em uma planilha estavam expostos os seguintes tempos de produção de um determinado item “tempo.txt”. Passe estes valores para o R, chame o objeto de tempo. Usando funções do R ache o tempo máximo, mínimo e o tempo médio de produção desse item. 2- Faça um diagrama de folhas, um histograma e um boxplot do tempo de produção; Variáveis qualitativas No arquivo “funcionarios.txt” está descrito o sexo e idade em variáveis qualitativas. >plot (Sexo) >plot(Idade) >plot(Sexo, Idade)
Compartilhar