Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA Prof Paulo Renato A. Firmino praf62@gmail.com Aulas 01-02 EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 2 Motivação/Justificativa • brain storm: Escreva o que vier à cabeça ao ler os textos: “SUA PROFISSÃO” “A ESTATÍSTICA” • Haverá mesmo alinhamento entre esses dois mundos? “A ESTATÍSTICA NA MINHA PROFISSÃO” Elabore um problema característico da sua futura área de atuação profissional cuja solução requeira conceitos estatísticos • https://docs.google.com/forms/d/18Y78WXmYdsek8vxpx_JkzcnLNrAkszSV_nKFmQWFSt8/viewform • Envie em até uma semana EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 3 Referências • BÁSICAS 1. Grupo de discussão: 2015_1_EM_estatistica@googlegroups.com 2. BARBETTA, P. A.; REIS, M. M.; BORNIA, A. C. Estatística: para cursos de engenharia e informática. 3ª Ed. São Paulo: Atlas, 2010. 3. BUSSAB, W. O. & MORETIN, C. A. Estatística Básica. 6 ed. SP: Saraiva, 2010. 4. MONTGOMERY, D. C. & GEORGE, C. R. Estatística aplicada e probabilidade para engenheiros. Livros Técnicos e Científicos, 2003. 5. VIEIRA, S.; HOFFMANN, R. Estatística Experimental. São Paulo: Editora Atlas, l989. 179 p. 6. GONÇALVES, F. A. Introdução à Estatística: estatística descritiva. São Paulo: Atlas, 1976. 224p. 7. http://www.r-tutor.com/content/r-tutorial-ebook 8. http://rstudio.org/ • DADOS 1. Software reliability: https://sw.thecsiac.com/databases/sled/swrel.php 2. General: http://www.statsci.org/datasets.html 3. General from R: http://stat.ethz.ch/R-manual/R-patched/library/datasets/html/00Index.html 4. Recife: http://dados.recife.pe.gov.br/ 4 Estatística- Sumário • Plano de Ensino.pdf EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 5 Estatística • Busca-se responder questões, testar hipóteses, prever o futuro, diagnosticar causas • Converte dados em informação, permitindo um diferencial competitivo: Maior controle interno Maior capacidade de planejamento Redução de incertezas Otimização • A Estatística ajuda a medir e elevar a Qualidade • Ela nos permite medir riscos Decidir racionalmente EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 6 Estatística • Estágios para o estudo estatístico: Exemplo 1. Formulação: Declara-se o problema e discrima-se as variáveis de interesse • Ex.: Perfil sócio-profissional dos alunos da turma – Variáveis de interesse: ??? – https://docs.google.com/forms/d/1THDAYuQk-e2mDNxxR7LApvPY_yE0H19zunOnwwpXFpo/viewform 2. Planejamento: Determina-se como coletar os dados e quais ferramemtas estatísticas serão adotadas • Ex.: Selecioar aleatoriamente 8 alunos – Como selecionar e, então, coletar os dados? 3. Análise exploratória: Tem-se o primeiro contato estatístico com os dados disponíveis. Estudam-se prováveis erros de registro 4. Análise Inferencial: Modela-se o problema e infere-se sobre a população baseando-se nas conclusões amostrais EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 7 Tipos de Variáveis • Qualitativas: Seus possíveis resultados são qualidades, atributos, categorias: Nominais: Não há qualquer relação matemática entre as categorias da variável Ordinais: Pode-se ordenar as categorias • Quantitativas: Seus possíveis resultados são quantidades numéricas, resultantes de uma contagem ou mensuração: Discretas: Seus possíveis resultados formam um conjunto finito ou enumerável Contínuas: Seus possíveis resultados formam um inervalo de números reais • Rotineiramente variáveis qualitativas são registradas com valores numéricos, gerando a falsa impressão de serem quantitativas discretas Tipos de variáveis 8 Qualitativas Valores são qualidades Quantitativas Valores são quantidades Nominais Valores não permitem qualquer operação matemática Ordinais Valores permitem ordenação Discretas Valores formam um conjunto finito ou enumerável Contínuas Valores são números reais •Marca (1- Dell, 2-HP, 3-Positivo, ...) •Cor (1- branco, 2- prata, 3- preto, ...) •País de origem (1- BR, 2- CH, 3-EUA, ...) •Nível de estresse (1- baixo, 2-médio, 3-alto) •Escolaridade(1-ens fundam, 2-ens médio, 3- ens sup) •Qualidade de vida (1- boa, 2- ruim) •Nº de itens defeituosos (0, 1, 2, ...) •Nº de reincidências de quebra (0, 1, 2, ...) •Nº de peças defeituosas dentre n compradas (0, 1, ..., n) •Peso (>0) •Tempo até o reparo (≥0) •Saldo bancário (número real) Variáveis Funções dos resultados do experimento EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 9 Variáveis (Qualitativas) Nominais • Cada categoria pode ser rotulada por um número, o qual não possui significado matemático: 3+3=6 é falsa, 5>3 é falsa … • É comum o uso da freqüência de ocorrências de cada categoria [freq(·)] como fonte de análise: freq(1) + freq(2) = 6 é verdadeira, freq(1) > freq(3) é verdadeira … • As categorias devem ser mutuamente exclusivas e exaustivas • Exemplo: cor de produto, marca de produto, região de procedência de insumo EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 10 Variáveis (Qualitativas) Ordinais • Cada categoria pode ser rotulada por um número proporcional à sua magnitude relativa às demais categorias: Suas categorias podem ser ordenadas entre si 1 < 2 é verdadeira… • Contudo, a distância entre os rótulos das categorias não é matemática definida: 6 = 2·3 pode ser falsa, 4 – 3 = 1 pode ser falsa … • As categorias devem ser mutuamente exclusivas e exaustivas • Exemplo: Avaliação (de péssimo a ótimo), Condição (de inaceitável a ideal), Degradação (de mínima a máxima) EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 11 Variáveis Quantitativas • Cada categoria é, de fato, um número real (para variáveis contínuas) ou inteiro (para variáveis discretas): A distância entre as categorias é matematicamente definida 1 < 2 é verdadeira, 4 – 3 = 1 é verdadeira … • Podem-se usar todas as operações matemáticas 6 = 2·3 é verdadeira, 4 = 16/4 é verdadeira … • Exemplo: Número de ocorrências de determinada categoria de uma variável nominal [freq(·)], Peso de componente, Tempo de falha de componente, inflação, juros EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 12 Tipos de Variáveis - Exercício • Exercício 1: Identificar (justificando se preciso) o tipo e a escala (conjunto de possíveis resultados) das seguintes variáveis: 1. Tempo até a falha 2. Preferência por dada marca 3. Cor da peça 4. Satisfação de um cliente 5. Tempo de execução de determinada tarefa manual 6. Tipo de memória a ser fabricada para PCs 7. PIB EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 13 Tipos de Variáveis • Note-se que a depender do tipo da variável em mãos, o analista pode ou não utilizar medidas como a média e a variância, por exemplo • A média aritmética soma valores e ao final divide tal soma pelo número de observações EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 14 Estatística Descritiva – Tabelas • Distribuições de frequência: Expõem distribuições de percentagens, proporções, freqüências Agrupam os dados relativos a uma variável Tempo de falha (T) freq [0, 20) 53 [20, 30) 38 [30, 40) 7 [40, -) 2 Degradação (Y) Baixa Moderada Alta freq 53 40 7 Fornecedor (X) A B freq 53 47 table(x) minimum = min(x); maximum = max(x) n = length(x) k = round(sqrt(n)) h = (maximum-minimum)/k grid = seq(minimum, maximum, by=h) freq = cut(x, grid, include.lowest=TRUE, right=FALSE) table(freq) EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 15Estatística Descritiva – Tabelas • Exercício 1: Elabore a distribuição de frequências para os seguintes casos 1. Sexo de entrevistados (1- masc, 2-femin): 1, 2, 2, 1, 1, 1, 2, 2, 2, 1, 1, 2, 1 2. Grau de instrução de entrevistados (1- sem formação, 2-1º grau, 3- 2º grau, 4-outros): 1, 4, 1, 2, 2, 4, 3, 3, 1, 2, 3, 2, 2, 3 3. Nº de homens em grupos de 6 pessoas de uma comunidade: 0, 3, 2, 1, 5, 3, 2, 1, 0, 2, 3, 1, 2, 4, 3, 2, 3, 4, 0, 0 4. Elabore distribuições de frequência para o conjunto de dados “BD01”, em anexo. EstatEstatíísticastica-- Paulo Renato A. FirminoPaulo Renato A. Firmino 16 Estatística Descritiva – Tabelas • Distribuições de frequências para Variáveis contínuas: 1. O número de subintervalos (subintervalos, classes), k, pode ser definido como o inteiro mais próximo da raiz quadrada de n (o número de observações) 2. Os subintervalos podem ter a mesma amplitude (diferença entre os extremos) ou amplitudes diferentes 3. A amplitude dos subintervalos pode ser definida como a razão entre a amplitude da amostra e k Exemplo: tempo até a falha = {5, 10, 2.3, 4.5, 4.1, 3, 7, 2, 4, 0.3} Exercício 2: agrupar os dados relativos aos tempos de manutenção: {2, 14, 1.2, 7, 5.4, 3, 7, 3.5, 4, 1.9, 4.7, 1.3, 7.9, 9.5, 1.2}
Compartilhar