Baixe o app para aproveitar ainda mais
Prévia do material em texto
Transição Black Belt Bem vindos! O que é o curso de Black Belt? Os arquivos relativos ao exercícios podem ser encontrados em nosso site: www.fm2s.com.br Revendo o modelo de Melhoria O saber profundo Deming postula que a melhoria deve se basear em 4 pilares: Use charts to explain your ideasDe onde veio o que vamos estudar? VISÃO SISTÊMICA A organização é um sistema composto de processos. Esses processos estão correlacionados. É preciso enxergar essa correlação. TEORIA DO CONHECIMENTO Precisamos saber como gerar conhecimento sobre o que estamos fazendo e saber como disseminá-lo para toda a empresa ENTENDIMENTO DA VARIAÇÃO Processos variam, indicadores variam. É necessário estudar e aprender com essa variação. PSICOLOGIA Empresas são feitas de pessoas. Cada um tem seus objetivos e ambições. Entendê-los é vital para o sucesso da organização. 1. A visão sistêmica Enxergando nossa organização como um sistema Use charts to explain your ideas1. A visão sistêmica Um sistema é um grupo interdependente de itens, pessoas e/ou processos trabalhando em direção a um propósito comum. Toda organização é um sistema. Use charts to explain your ideas1. A visão sistêmica Para melhorar… … precisamos enxergar os processos e suas inter-relações! Use charts to explain your ideasComo enxergar processos? Podemos seguir alguns passos: 1. Entenda o propósito da organização; 2. Entenda a cultura da organização; 3. Localize as pessoas e as unidades de trabalho dentro da organização; 4. Faça o SIPOC de cada unidade de trabalho; 5. Una as informações em um mapa de processos. O SIPOC Passos do Processo FO R N E C E D O R E S SaídasEntradas Processo C L IE N T E S O Mapa de processos O Mapa de Processos (LoP) nos ajuda: • Colocar todos os processos em perspectiva; • Classificar os nossos processos; • Descrever todos os processos da empresa; • Direcionar nossa atenção crítica para cada um dos processos, buscando melhorias; • Entender as relações entre nossos processos. O Mapa de processos Temos 3 classificações de processos: • Mainstay: os processos que adicionam valor ao cliente • Drivers: processos que direcionam o negócio • Support: processos que são necessários para apoiar o negócio O Mapa de processos Projeto e re-projeto de produtos e processos Planejamento Para Melhoria Pesquisa de Mercado Medição & Feedback Clientes Distribuição Processos de apoio Produção de produtos e serviços Fornecedores A B C D E F G Necessidade Propósito da organização Processos “Drivers” Processos “Mainstay” Processos “Support” Comece pela missão Missão da EMPRESA “A EMPRESA desenvolve e integra teorias, métodos e ferramentas da Ciência de Melhoria; fornece educação, treinamento e orientação para líderes e grupos com o objetivo de ajudar as organizações na redução de problemas de qualidade, redução de custos dos processos, aumento das expectativas dos clientes e no desenvolvimento do seu sistema de melhoria contínua” Mainstay Desenvolver e Integrar teorias, métodos e ferramentas da ciência de gestão Fornecer educação e treinamento Conduzir orientação para líderes e grupos de melhoria Desenvolver novos negócios Preparar as atividades nos clientes Desenvolver e Integrar teorias, métodos e ferramentas da ciência de melhoria Fornecer educação e treinamento Conduzir orientação para líderes e grupos de melhoria Planejar logística de atividades Agendamento de atividades Manter séde e equipamentos Fazer distribuição do resultado Faturar clientes Gerenciar o controle financeiro Desenvolver novos produtos Desenvolver planejamento das atividades nos clientes Comunicar-se com clientes Negociar e fechar novos negócios Obter conhecimento de fora do sistema Desenvolver material didático Desenvolver os integrantes Fazer e catalogar propostas Medir feedback e o desempenho da organização Ajustar plano operacional Planejar investimentos Desenvolver planejamento estratégico Desenvolver novos negócios Preparar as atividades nos clientes Desenvolver e Integrar teorias, métodos e ferramentas da ciência de melhoria Fornecer educação e treinamento Conduzir orientação para líderes e grupos de melhoria Manter site atualizado Criar e manter portfólio de produtos Manter biblioteca de materiais e arquivos técnicos Criar e enviar comunicações aos atendidos Criar e manter histórico dos clientes Planejar logística de atividades Agendamento de atividades Manter séde e equipamentos Fazer distribuição do resultado Faturar clientes Gerenciar o controle financeiro Relacionamento com fornecedores diversos Desenvolver novos produtos Desenvolver planejamento das atividades nos clientes Contratar e integrar novos consultores e colaboradores Comunicar-se com clientes Negociar e fechar novos negócios Obter conhecimento de fora do sistema 1 1 2 Desenvolver material didático Organizar arquivos de trabalho diário 2 Planejar auto- desenvolvi- mento dos integrantes Desenvolver os integrantes Planejar o crescimento da organização Definir distribuição de trabalhos aos integrantes Customizar produtos para neessidades dos clientes Planejar precificação Fazer e catalogar propostas Desenhar e redesenhar o sistema Conduzir reuniões p/ entender necessidades dos clientes Medir o desempenho da organização Ajustar prioridades das atividades do negócio Conduzir reuniões de troca de experiências Planejar investimentos Desenvolver planejamento estratégicoDesenvolver novos negócios Manter lista de contatos de empresas prospects Obter e analisar feedback de clientes Preparar as atividades nos clientes Integrar teorias, métodos e ferramentas Desenvolver materiais e roteiros de aula/workshop Desenvolver métodos / ferramentas Conduzir Workshops Conduzir treinamento Conduzir coaching de grupos de melhoria Responder duvidas técnicas dos clientes Planejar e participar de checkpoint Manter site atualizado Criar e manter portfólio de produtos Gerenciar propriedade dos arquivos e materiais Organizar arquivos de trabalho diário Manter biblioteca de arquivos técnicos Criar e enviar comunicações aos atendidos Criar e manter histórico dos clientes Atualizar lista de contatos nos clientes atendidos Organizar e arquivar Casos de sucesso dos clientes Planejar logística de atividades Agendamento de atividades Planejar viagens de trabalho Preparar materiais impressos Manter equipamentos Manter a séde da empresa Fazer distribuição do resultado Faturar clientes Completar relatórios de despesas Gerenciar o controle financeiro trabalhar com gráficas Trabalhar com empresas de transportes Relacionamento com fornecedores diversos Conduzir encontros de troca de experiências dos clientesDesenvolver novos produtos Conduzir coaching de líderança Preparar Coaching de grupos de melhoria Desenvolver planejamento das atividades nos clientes Conduzir reuniões de negócio Ler e responder e- mails, recados etc. Enviar materiais Trabalhar com contador Pagar contas e fornecedores Gerenciar atividades bancárias Contratar e integrar novos consultores e colaboradores Comunicar-se com clientes Negociar e fechar novos negócios Comprar equipamentos e suprimentos Participar de seminários externos Obter conhecimento de fora do sistema Pesquisar na literatura Cobrar clientes1 1 2 2 Desenvolver material didático Use o LoP para avaliar a maturidade Pontuação Definição Operacional da Pontuação 1 Processo não está definido. É um novo processo que ainda precisa ser projetado e documentado. 2 Há uma compreensão geral do processo pelas pessoas que atuam nele. Não há documentação, procedimentos ou especificações. Nenhum trabalho formal de melhoria do processo foi realizado recentemente. 3 O processo foi definido por todos os seus públicos interessados (gerentes, funcionários, fornecedores e clientes). O objetivo do processo é compreendido. Existe documentação do processo: fluxogramas, procedimentos, políticas, normas, descrições de atribuições e atividades, manuais de treinamento, ou outros documentos de suporte. 4 O processo está bem definido e mensurações do desempenho e qualidade dos resultados/ saídas do processo são utilizadas para monitorá-lo. Métodos gráficos, como gráficos de controle, são utilizados para avaliar e aprender com as medições. 5 Processo foi formalmente melhorado ao longo do último ano. Mensurações contínuas são realizadas no processo, incluindo as entradas dos fornecedores e feedback dos clientes. Normas e documentação do processo são atualizadas conforme as melhorias implementadas no processo. 6 Mensurações chave do processo e dos seus resultados são previsíveis. Os produtos e serviços gerados pelo processo atendem as especificações consistentemente. Use o LoP para mapear melhorias Grupo Subprocesso Status Ação para atingir maturidade/melhori a Prioridade para ação Última alteração no processo Objetivo Responsável IC Marketing Produzir vídeos marketing Processo informal - sem agendamento ou metodologia Contratar profissional, agendar entregas na agenda 24/04/2016 Gerar leads Murilo Produzir e-books e planilhas Entregas agendadas - Necessita pessoal Distribuição dos temas para cada um dos integrantes, revisão da agenda. Padronização da linguagem, com instrução para geração de conteúdo. 24/04/2016 Gerar leads Murilo Materiais/mês Produzir posts Entregas agendadas - Entrega feia pelo Virgilio - Falta instrução Realizar medição do processo e seu resultado 24/04/2016 Melhorar SEO Virgilio vst organica/mês 2. Teoria do conhecimento Aprendendo a aprender Use charts to explain your ideasA construção da melhoria Capacidade de gerar melhorias aumentada Conhecimento profundo Conhecimento específico no assunto (método científico) Use charts to explain your ideasOs componentes do conhecimento Dados originais “evidências” Predição Grau de convicção na predição, baseado na evidência Use charts to explain your ideasO método científico F 1. Tudo começa quando observamos um fato ou fenômeno Use charts to explain your ideasO método científico F 2. Após a observação, fazemos uma análise para entender o fenômeno. O entendimento ao final da análise aparece na forma de uma hipótese, ou teoria, que explica o fenômeno observado. H Use charts to explain your ideasO método científico F H Fp 3. Com base na hipótese, elaboramos uma predição: por exemplo, como o processo vai se comportar após a mudança. Use charts to explain your ideasO método científico F H Fp 4. Com base nas predições, realizamos um experimento para observar os fatos reais. Será que eles são iguais às predições? FR Use charts to explain your ideasO método científico F H Fp FR H2 5. Após realizado o experimento, observamos os fatos reais e elaboramos uma segunda versão de nossa hipótese. Use charts to explain your ideasO método científico F H Fp FR H2 ... Hs Para completar o método, repetimos este ciclo até termos uma hipótese sólida. Lembrem-se: nenhuma hipótese explica tudo, mas alguas hipóteses são úteis. Use charts to explain your ideasO ciclo PDSA Use charts to explain your ideasO ciclo PDSA Tempo C o nh ec im en to 3. Psicologia A parte humana da mudança A psicologia Entender a “psicologia” do sistema é entender como as pessoas da organização interagem entre si e com o sistema. O campo da psicologia é amplo e dinâmico. Nosso foco será em ideias, métodos, ferramentas e teorias que nos ajudem a entender essas interações Diferenças entre pessoas Cada pessoa possui um modelo mental, ou seja, uma forma de pensar. Essa forma de pensar é dependente da cultura de cada um e de suas experiências de vida. O comportamento é direcionado pela motivação As pessoas se comportam conforme suas próprias motivações intrínsecas. Cada um tem um fator de motivação e desmotivação, que depende de seus modelos mentais Alinhamento da cultura organizacional Os agentes de melhoria devem saber como alinhar as motivações de cada um, com o propósito da empresa. Isso geralmente acontece com um entendimento e engenharia de cada um dos modelos mentais. Propósito da organização Como fazer isso? O tema será abordado em maiores detalhes posteriormente, mas podemos indicar alguns mecanismos básicos que valem a pena ser conhecidos: • A mente se molda através de recompensas. • A mente recebe estímulos do meio e produz respostas. • Cada estímulo pode ser positivo ou negativo (de acordo com o ego ou contrário a ele). • Cada resposta tem um efeito individual e coletivo. • Cada resposta tem um efeito de curto prazo e de longo prazo. Como fazer isso? Como montar a mente a partir do ambiente externo? Como trabalhar o comportamento? Escolas psicológicas: • Comportamental (Behaviorism): Skinner; • Psicanalítica: Freud, Adler, Jung; • De sistemas: Lewis, Barker, Maturana • Humanística/Gestalt: Goldstein, Rogers, Maslow • ... Como fazer isso? Segundo a psicologia de Maslow todos temos necessidades, das mais básicas às mais complexas. Satisfazer essas necessidades gera felicidade. Aplicada a organização, devemos fornecer meios para que estas necessidades sejam satisfeitas. Quais são essas necessidades? A “pirâmide” de Maslow A “pirâmide” de Maslow Maslow nunca apresentou essa hierarquia entre necessidades como uma pirâmide. Além dessas necessidades, ele postulou duas outras: • Curiosidade científica; • Beleza estética. Uma pessoa, percorre o caminho de baixo para cima, tentando se autoconhecer. Essa filosofia está diretamente ligada com as ideias de Carl Rogers. A Melhoria e a Psicologia Humanística 4. Entendimento da variação Onde entra a estatística! Conceitos básicos Causas de variação: • Todos os dados, indicadores e métricas sofrem variação. Devemos aprender com elas. Temos dois tipos principais de causas: • Causas comuns: são aquelas que são inerentes ao processo (ou sistema) ao longo do tempo, afetam todos os que trabalham no processo e todos os resultados deste processo. • Causas especiais: são aquelas que não são parte do processo (ousistema) todo o tempo, ou não afetam todo, mas surgem devido a circunstâncias específicas. Como identificar essas causas? Causas comuns acontecem no tempo, por isso precisamos de ferramentas dinâmicas: • Gráficos de tendência; • Gráficos de controle Como identificar essas causas? Para a correta aplicação das ferramentas, devemos entender que existem 3 tipos de variáveis: • Variáveis de contagem; • Variáveis de classificação; • Variáveis contínuas; Cada variável é representada por uma distribuição estatística específica. Como identificar essas causas? Os gráficos de controle nos ajuda a identificar as causas, mas para isso, eles se valem de modelos estatísticos específicos, dependentes dos tipos de variáveis. Como identificar essas causas? O gráfico de individuais, por exemplo, utiliza a distribuição normal para identificar pontos fora do comportamento natural. Como identificar essas causas? Com base nas propriedades da distribuição, se formam regras para identificação de conjuntos. Uma observação além de um limite de controle. Uma sequência de oito ou mais pontos acima ou abaixo da média. Uma sequência de seis ou mais pontos crescentes ou decrescentes. Como atuar sobre essas causas? Dependendo do tipo de causa, devemos tomar um tipo de ação: Sofisticação estatística A utilização de modelos estatísticos de maneira mais aprofundada nos ajuda a entender como ações (variáveis de entrada) impactam no comportamento do desempenho (variáveis de saída). Desempenho Ação Sofisticação estatística No curso de Black Belt iremos aprofundar a teoria sobre estes modelos estatísticos. Desempenho Ação Use charts to explain your ideasRecapitulando… VISÃO SISTÊMICA A organização é um sistema composto de processos. Esses processos estão correlacionados. É preciso enxergar essa correlação. TEORIA DO CONHECIMENTO Precisamos saber como gerar conhecimento sobre o que estamos fazendo e saber como disseminá-lo para toda a empresa ENTENDIMENTO DA VARIAÇÃO Processos variam, indicadores variam. É necessário estudar e aprender com essa variação. PSICOLOGIA Empresas são feitas de pessoas. Cada um tem seus objetivos e ambições. Entendê-los é vital para o sucesso da organização. Probabilidade e Inferência Use charts to explain your ideasIncerteza e Intuição Use charts to explain your ideasIncerteza e Intuição Use charts to explain your ideasIncerteza e Intuição • A intuição humana é mal adaptada a situações que envolvem incertezas. • Pesquisas recentes mostram que nossos processos cerebrais são deficientes em situações que envolvem o acaso. • Processos aleatórios são fundamentais na natureza, no cotidiano e na vida organizacional. Sendo assim, necessitamos de técnicas que nos ajude a enfrenta- los. Use charts to explain your ideasEssas técnicas… • A teoria atual da probabilidade veio se desenvolvendo desde o século XVI (com Galileu e Cardamo), teve grandes contribuições no século XVII e XVIII (com Pascal, Fermat, Moivre e Bernoulli) e continua até hoje a ser desenvolvido. • Seu desenvolvimento teórico é muitas vezes associado a jogos de azar (desde que os livros de estatística contam a história de Chevalier de Mère, que supostamente pediu ajuda a Pascal para ganhar nos jogos de azar). Use charts to explain your ideasAfinal, o que significa probabilidade? • É uma medida de incerteza. • A probabilidade de um evento é a chance numérica de ocorrência do evento. • É medida por um número que varia entre 0 e 1 (0 é a probabilidade de um evento impossível e 1 é a probabilidade de um evento certo). Use charts to explain your ideasExperimento Aleatório Um experimento cujo resultado não pode ser previsto com certeza, antes do experimento ser rodado. Exemplos: • Saldo mensal - {lucro, breakeven, prejuízo} • Tempo para realizar uma tarefa - {t:t>0} • Número de cervejas consumidas em 1 semana: {0, 1, 2, ... } Use charts to explain your ideasEvento e espaço amostral • Cada resultado possível de experimento aleatório é um evento simples. • O espaço amostral é a coleção de todos os eventos simples (ele pode ser finito, infinito enumerável ou infinito não enumerável). • Um evento é um subconjunto do espaço amostral (um conjunto com um ou mais eventos simples). • O evento vazio é o conjunto com nenhum evento simples (conjunto vazio). • A probabilidade de um evento é a soma das probabilidades dos eventos simples que formam o evento. • A probabilidade do evento vazio é zero. Use charts to explain your ideasTipos de probabilidade • Clássica • Frequentista • Subjetiva • Bayesiana Use charts to explain your ideasProbabilidade clássica Para eventos igualmente prováveis S= {S1, S2, ..., Sn} é o espaço amostral 𝑃 𝑆𝑖 = 1 𝑛 onde 𝑃 simboliza a probabilidade e 𝑆𝑖 é o resultado de um experimento aleatório com 𝑛 resultados possíveis, 𝑖 = 1,… , 𝑛. Seja um evento 𝐸 formado por 𝑚 eventos igualmente prováveis: 𝑃 𝐸 = 𝑖=1 𝑚 1 𝑛 = 𝑚 𝑛 Use charts to explain your ideasProbabilidade clássica Para eventos não necessariamente igualmente prováveis S= {S1, S2, ..., Sn} conjunto de eventos possíveis 𝑃 𝑆𝑖 = 𝑝𝑖 onde 𝑝𝑖 é a probabilidade de ocorrência de 𝑆𝑖 , 𝑖 = 1, … , 𝑛 e calculável a partir de suposições. Exemplo: Uma moeda com duas faces (Cara e Coroa) não equilibrada. S={Cara, Coroa} P(Cara)=P1, P(Coroa)=P2; P1P2 Use charts to explain your ideasProbabilidade clássica: cálculo O cálculo da probabilidade pode ser simples: • Supomos um dado com seis faces. Qual a probabilidade de cada uma dessas faces? {1,2,3,4,5,6,} 𝑃 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜 = 𝑖 = 1 6 para 𝑖 = 1,… , 6 Evento 𝐸 = resultados pares 𝑃 𝐸 = 𝑃 2,4,6 = 1 6 + 1 6 + 1 6 = 1 2 Use charts to explain your ideasProbabilidade clássica: cálculo Ou pode ser complexa: • Supomos o jogo de poker com um baralho de 52 cartas. Sequencia real: 5 cartas seguidas do mesmo naipe do 10 ao Ás. P (Sequencia real) = ? Sequência de cor: 5 cartas seguidas do mesmo naipe. P (Sequencia de cor) = ? Use charts to explain your ideasCuidado! Qual é a chance do primeiro bebê que vai nascer mês que vem na cidade de Manaus seja do sexo masculino? Nem sempre Ter apenas dois resultados possíveis garante que as probabilidades sejam iguais! Use charts to explain your ideasProbabilidade Frequentista Seja 𝑅1, … , 𝑅𝑘 o conjunto de resultados possíveis de um experimento realizado 𝑛 vezes e que cada resultado ocorre 𝑛𝑖 vezes. Então 𝑃 𝑅𝑖 = 𝑛𝑖 𝑛 E 𝑛𝑖 𝑛 = 𝑝𝑖 Use charts to explain your ideasProbabilidade Subjetiva A probabilidade subjetiva é a chance da ocorrência de um evento segundo um indivíduo. Ela se baseia na experiência, no domínio do assunto, no grau de convicção ou simplesmente na expressão de um desejo do indivíduo. Exemplo: Qual é a chance de você ser promovido? Use charts to explain your ideasBayesiana Exemplo: o caso de uma pessoa que surge no mundo (talvez Adão, talvez alguém saído da caverna de Platão) e vê o nascer do sol pela primeira vez. A princípio, ele não sabe se é um fenômeno típico ou algum episódio insólito. Porém, a cada dia que sobrevive e vê o nascer do sol, aumenta sua confiança de que se trata de uma característica permanente da natureza. Aos poucos, por meio dessa forma de dedução apenas estatística, a probabilidade que ele aplica à previsão de que o sol irá nascer no dia seguinte se aproxima de 100%, embora nunca chegue a esse ponto. Use charts to explain your ideasBayesiana )( )(*)|( )|( BP APABP BAP O foco do teoremaé a probabilidade condicionada. Ou seja, fala da probabilidade de uma teoria ou hipótese ser verdadeira se tiver havido determinado acontecimento. Vamos ao exemplo da história da cueca encontrada no armário ao chegar de viagem. Use charts to explain your ideasExercício! A lei de Benford (descoberta por Simon Newcomb observando tabelas de livros de logaritmo) sugere que a porcentagem de ocorrência de números 1 a 9 na primeira casa decimal dos resultados segue a seguinte probabilidade: Que tipo de probabilidade é esta? Como isso poderia ser usado em negócios? Prim dígito 1 2 3 4 5 6 7 8 9 Freq Relat 0.301 0.176 0.125 0.097 0.079 0.067 0.058 0.051 0.046 Operações com conjuntos Para entender os axiomas da probabilidade Use charts to explain your ideasOperações básicas A união de dois eventos A e B é o evento formado por todos os resultados que estão em A ou B. • Notação: AB A intersecção de dois eventos A e B é o evento formado por todos os resultados que estão em A e B. • Notação: AB O evento complementar de um evento A é formado pelos resultados que não estão em A. • Notação: A´ • Dois eventos A e B tal que a intersecção deles é vazia são mutuamente excludentes ou disjuntos. Use charts to explain your ideasRepresentação gráfica AB AB A´ A Use charts to explain your ideasAxiomas da probabilidade Independente do tipo de probabilidade (clássica, subjetiva ou frequentista), algumas regras são válidas para se manipular e analisar probabilidades. Use charts to explain your ideasAxiomas da probabilidade 1. P (S) = 1, S o espaço amostral 2. Qualquer que seja o evento 𝐴 0 ≤ 𝑃 𝐴 ≤ 1 0 ≤ 𝑃 𝐴 ≤ 1 3. Se A 1 e A 2 são dois eventos que disjuntos 𝐴1 ∩ 𝐴2 = ∅ , então 𝑃(𝐴1 ∪ 𝐴2) = 𝑃(𝐴1) + 𝑃( 𝐴2) Generalizando, se A1, A2, ... , Ak são eventos mutuamente disjuntos, então 𝑃(𝐴1 ∪ 𝐴2 ∪ … ∪ 𝐴𝑘 ) = 𝑃(𝐴1) + 𝑃(𝐴2) + … + 𝑃( 𝐴𝑘) 4. Se A1 e A2 são dois eventos quaisquer, então 𝑃(𝐴1 ∪ 𝐴2) = 𝑃(𝐴1) + 𝑃( 𝐴2) − 𝑃(𝐴1 ∩ 𝐴2) Use charts to explain your ideasNotação Denotaremos eventos por letras maiúsculas 𝐴, 𝐵,… Seja 𝐴 um evento Ex1: 𝐴: evento dos números pares no jogo de dados 𝐴 = 2, 4, 6 Ex2: 𝐴: evento onde o tempo para responder a uma solicitação de crédito é maior que 9 dias úteis 𝐴 = 𝑡: 𝑡 > 9 Distribuições de probabilidade Use charts to explain your ideasVariável Aleatória Uma variável aleatória (v.a.) é uma função que atribui um número real a cada resultado do espaço amostral de um experimento aleatório Variável aleatória discreta • Assume valores em um conjunto finito ou infinito enumerável Variável aleatória contínua • Assume valores em um intervalo finito ou infinito de números reais Notação: em geral a v.a. é denotada por uma letra maiúscula do final do alfabeto (X, Y, Z, …); Use charts to explain your ideasExemplo Um garoto conta estrelas e as classifica conforme o seu brilho. As classificações podem ser colocadas como “muito brilhante”, “com brilho médio” e “pouco brilhantes”. X é a variável aleatória que que define o problema acima. (-1 para pouco brilho, 0 para brilho médio e 1 para muito brilhantes. A distribuição de X fica como: Classificação Porcentagem Muito brilhante 10% Brilho médio 70% Pouco brilhantes 20% X Prob -1 0.2 0 0.7 1 0.1 Use charts to explain your ideasDistribuição de probabilidade discreta Exemplo: em um censo é coletado o número de filhos do casal: Para uma família escolhida ao acaso, qual a probabilidade que ela tenha 2 filhos? Nº de Filhos %. 0 10% 1 30% 2 35% 3 20% 4 5% Use charts to explain your ideasDistribuição de probabilidade discreta Para uma variável aleatória discreta X com valores x1, x2, ..., xn a distribuição de probabilidade é dada por: 𝑓(𝑥𝑖) = 𝑃(𝑋 = 𝑥𝑖) A distribuição de probabilidade satisfaz 𝑓 𝑥𝑖 = 1 Use charts to explain your ideasDistribuição de probabilidade discreta Seja 𝑋 o número de filhos do casal; • 𝑋 = {0, 1, 2, 3, 4} • 𝑃(𝑋 = 𝑥𝑖) = {0.1, 0.3, 0.35, 0.20, 0.05}, para 𝑥𝑖 = 0, 1, 2, 3, 4 • 𝑋 é uma v.a. discreta • 𝑃 𝑋 = 𝑖 = 1 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 P (X ) 0 1 2 3 4 X Média e variância populacional Use charts to explain your ideasMédia ou valor esperado Seja 𝑋 v.a. discreta com distribuição {𝑥𝑖 , 𝑃(𝑥𝑖); 𝑖 = 1,2,… 𝑛}, onde 𝑃(𝑥𝑖) = 𝑃(𝑋 = 𝑥𝑖) então, E X = 𝑀é𝑑𝑖𝑎 𝑋 = (𝑣𝑎𝑙𝑜𝑟 × 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒), ou 𝐸 𝑋 = 𝜇 = 𝑖=1 𝑛 𝑥𝑖𝑃 𝑥𝑖 Use charts to explain your ideasExercício Uma empresa de seguros vende uma apólice para 1500 proprietários de um modelo de bicicleta mountain bike que protege contra roubo por dois anos. O custo de reposição dessa bicicleta é R$500,00. Suponha que a probabilidade de um indivíduo ser roubado durante o período de proteção é 0.15. Assuma que a probabilidade de mais de um roubo por indivíduo é zero e que os eventos são independentes. a. Qual é o preço de venda da apólice para que haja um equilíbrio para a empresa(ganho zero, perda zero)? b. Se a probabilidade de roubo for 0.10, qual é o ganho esperado por apólice dado o valor de venda determinado em (a)? Use charts to explain your ideasAplicação em processos decisórios Uma fábrica de móveis deve decidir se realiza uma ampliação da capacidade instalada agora ou se aguarda mais um ano. Uma análise econômica diz que se ela expande agora e as condições econômicas permanecerem boas, ela realizará um lucro de R$328.000,00 no próximo ano; caso haja uma recessão, ela terá um prejuízo de R$80.000,00. Se ela adia a expansão para o próximo ano, ela terá um lucro de R$160.000,00 se as condições permanecerem boas e terá um lucro de R$16.000,00 se houver recessão. Se as chances de que ocorra uma recessão é de 2/3, qual é a decisão que maximiza seu lucro? Use charts to explain your ideasPropriedades da média Seja 𝑎 e 𝑏 duas constantes e 𝑋 e 𝑌 duas variáveis aleatórias. Então: • 𝐸(𝑎) = 𝑎 • 𝐸(𝑏𝑋) = 𝑏𝐸(𝑋) • 𝐸(𝑎 + 𝑋) = 𝑎 + 𝐸(𝑋) • 𝐸(𝑎𝑋 + 𝑏𝑌) = 𝑎𝐸(𝑋) + 𝑏𝐸(𝑌) Use charts to explain your ideasVariância Fornece uma medida de dispersão (variação) dos valores em torno da média 𝑉𝑎𝑟 𝑋 = 𝜎2 = 𝑥𝑖 − 𝜇 2𝑃 𝑥𝑖 𝐷𝑒𝑠𝑣𝑖𝑜𝑃𝑎𝑑𝑟ã𝑜 𝑋 = 𝜎 = 𝑉𝑎𝑟 𝑋 Pode-se mostrar que: 𝑉𝑎𝑟 𝑋 = 𝐸 𝑋2 − 𝐸 𝑋 2 onde 𝐸 𝑋2 = 𝑥𝑖 2𝑃 𝑥𝑖 Use charts to explain your ideasPropriedades da variância Seja a e b duas constantes e 𝑋 e 𝑌 duas variáveis aleatórias. Então: • 𝑉𝑎𝑟 𝑋 ≥ 0 • 𝑉𝑎𝑟(𝑎) = 0 • 𝑉𝑎𝑟(𝑎 + 𝑋) = 𝑉𝑎𝑟(𝑋) • 𝑉𝑎𝑟(𝑏𝑋) = 𝑏2𝑉𝑎𝑟(𝑋) • 𝑉𝑎𝑟 𝑎 + 𝑏𝑋 = 𝑏2𝑉𝑎𝑟 𝑋 • 𝑉𝑎𝑟 𝑋 ± 𝑌 = 𝑉𝑎𝑟 𝑋 + 𝑉𝑎𝑟 𝑌 , 𝑠𝑒 𝑋 𝑒 𝑌 𝑠ã𝑜 𝑒𝑠𝑡𝑎𝑡í𝑠𝑡𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒𝑠 Use charts to explain your ideasPropriedades da variância Um sistema de envasamento consiste em encher um vidro com líquido. Os vidros utilizados tem peso médio de 20g e desvio padrão 0.5g. A quantidade de líquido em peso que é colocada no litro pode ser regulada, sendo o valor nominal igual a 185g. O desvio padrão do sistema de envasamento é 2g. Qual é o peso médio e o desvio padrão do vidro cheio? Modelos probabilísticos Use charts to explain your ideasModelos probabilísticos Modelos são usados em todas as áreas da ciência para representar o mundo natural, simplificando-os, mas mantendo suas principais propriedades. “Todos os modelos estão errados, porém, alguns são úteis” George Box Use charts to explain your ideasDistribuição discreta uniforme O modelo mais simples de distribuição discreta é o uniforme: f(x) = 1/n sendo n= número de valores que a variável aleatóriapode assumir Use charts to explain your ideasEnsaios de Bernoulli Considere 𝑛 repetições sucessivas de um ensaio (ou teste) com apenas dois resultados possíveis que respeite as seguintes regras: a) Em cada ensaio podem ocorrer somente dois resultados possíveis (Sucesso (S) e Fracasso (F)). b) Para cada ensaio, a probabilidade de que ocorra um Sucesso, denotada por 𝑃(𝑆), é a mesma, e é denotada por p, ou seja, 𝑃(𝑆) = 𝑝. A probabilidade de um Fracasso, 𝑃(𝐹), é dada por 1 − 𝑝, ou seja, 𝑃(𝐹) = 1 − 𝑝. A quantidade 1 − 𝑝 é denotada por 𝑞. Temos então 𝑝 + 𝑞 = 1. c) Cada ensaio é independente. Use charts to explain your ideasEnsaios de Bernoulli Se associarmos ao evento S o valor de 1 e ao evento F o valor 0, a distribuição de probabilidade de X é: Além disso: a) 𝐸(𝑋) = 0 ∗ (1 − 𝑝) + 1 ∗ 𝑝 = 𝑝 b) 𝑉𝑎𝑟 𝑋 = 𝐸 𝑋2 − 𝐸 𝑋 2 = 02 ∗ 1 − 𝑝 + 12 ∗ 𝑝 + 𝑝2 = 𝑝(1 − 𝑝) X P(X) 0 1-p 1 p Use charts to explain your ideasExperimento Binomial Um experimento Binomial obedece as seguintes propriedades 1. O experimento consiste de um sequencia de n ensaios idênticos 2. Dois resultados são possíveis em cada ensaio: Sucesso e Fracasso (Ensaio de Bernoulli) 3. p = P(S) não muda de ensaio para ensaio 4. Os ensaios são independentes Use charts to explain your ideasDistribuição Binomial Considere um experimento Binomial: • Seja X o número de Sucessos nos n ensaios • A variável 𝑋 pode assumir os valores 0,1,2, . . , 𝑛. Então, 𝑃 𝑋 = 𝑚 = 𝑛 𝑚 𝑝𝑚 1 − 𝑝 𝑛 onde 𝑛 𝑚 = 𝑛! 𝑚! 𝑛−𝑚 ! , para 𝑚 = 0,1,2,… , 𝑛 Denotamos 𝑋~𝐵𝑖𝑛 𝑛, 𝑝 Use charts to explain your ideasO triângulo de Pascal Linha 0 1 1 1 1 2 1 2 1 3 1 3 3 1 4 1 4 6 4 1 5 1 5 10 10 5 1 6 1 6 15 20 15 6 1 7 1 7 21 35 35 21 7 1 8 1 8 28 56 70 56 28 8 1 9 1 9 36 84 126 126 84 36 9 1 10 1 10 45 120 210 252 210 120 45 10 1 Use charts to explain your ideasO triângulo de Pascal Use charts to explain your ideasPropriedades da B(n,p) 1. 𝐸 𝑋 = 𝜇 = 𝑛𝑝 2. 𝑉𝑎𝑟 𝑋 = 𝜎2 = 𝑛𝑝 1 − 𝑝 Se definirmos p= 𝑋𝑖 n = X, então 1. 𝐸 𝑝 = 𝐸 𝑋 = 𝑝 2. 𝑉𝑎𝑟( 𝑝) = 𝑉𝑎𝑟 𝑋 = 𝑝(1−𝑝) 𝑛 Use charts to explain your ideasExemplo Um processo está produzindo garrafas de vidro em uma linha de produção continua. A história passada mostra que 1% das garrafas tem uma ou mais falhas. Se retirar uma amostra de 10 unidades do processo, qual é a probabilidade de que haverá 0 garrafas não conformes? n = 10 p = 0,01 m = 0 %4,9001,0101,0. 0 10 )( 1.)( 100 xp pp m n xp nm Use charts to explain your ideasExercício Um gerente de conta especial faz vinte ligações por dia para clientes para oferecer um novo produto. De experiência passada ele estima que a chance de vender o produto para um cliente é 0.10. a) Se sua meta diária é realizar 4 vendas, qual é a probabilidade que ele atinja a meta em um determinado dia? b) Qual é o número médio de vendas que ele realiza por dia? c) Qual é o desvio padrão do número de vendas? d) Qual é o valor mais provável de venda? Use charts to explain your ideasDistribuição de Poisson Um evento S ocorre no tempo (ou espaço) obedecendo os seguintes postulados: a) Independência: o número de vezes que S ocorre em qualquer intervalo de tempo é independente do número de ocorrências de S em qualquer outro intervalo de tempo disjunto. b) Falta de agrupamento: a chance de duas ou mais ocorrências de S simultâneas pode ser assumida como sendo zero. c) Razão: a número médio de ocorrências de S por unidade de tempo é uma constante, denotada por l, e ela não muda com o tempo. Use charts to explain your ideasDistribuição de Poisson Seja X o número de ocorrências de S por unidade de tempo. Se os postulados anteriores são válidos, então 𝑋~𝑃 𝜆 e 𝑃 𝑋 = 𝑥 = 𝑒−𝜆𝜆𝑥 𝑥! , 𝑥 = 0,1,2, . . . onde 𝜆 é o parâmetro que indica o número médio de ocorrências de X em um intervalo de tempo unitário Use charts to explain your ideasPropriedades da distribuição de Poisson Então temos que: 1. E X = λ 2. Var X = λ2 Use charts to explain your ideasExemplo Uma linha de produção está fabricando mísseis guiados. Quando cada míssil é concluído, uma auditoria é conduzida por um representante da Força Aérea e todas as não-conformidades são anotadas. Mesmo que apenas não conformidades maiores sejam motivo de rejeição, o contratante principal quer controlar não- conformidades menores também. Então, problemas menores como letras borradas, pequenas rebarbas, etc., são registrados durante a auditoria. Os dados históricos mostram que, em média, cada míssil tem 3 não-conformidades menores. Qual é a probabilidade de que o próximo míssil terá 0 não conformidades? x = 0 λ = 3 %5 !0 )3( )( 03 e op Use charts to explain your ideasExercício! Ao enlatar leite em pó, é necessário acrescentar um dosador. A não inclusão do dosador é considerada uma falha. O número de falhas que ocorrem em um lote produzido tem distribuição de Poisson com número médio de falhas igual a 5. 1. Qual é a probabilidade que em um lote: a) Uma lata esteja sem o dosador? b) Duas ou mais latas estejam sem o dosador? 2. Qual é o número mais provável de falhas que ocorrem em um lote? Distribuições para variáveis aleatórias contínuas Use charts to explain your ideasVariável aleatória contínua Em um Call Center o tempo de atendimento de um cliente é monitorado. Os valores possíveis são em princípio, infinitos dentro de um intervalo (a,b), a<b. Nesse caso, não faz sentido perguntar qual é a probabilidade de que o tempo de atendimento seja igual a um valor to . Na realidade, essa probabilidade é igual a zero. O que se pode perguntar é qual é a probabilidade que o tempo de atendimento esteja dentro de um intervalo (x,y), ou seja, P(x<t<y) Use charts to explain your ideasVariável aleatória contínua A figura abaixo mostra o histograma de amostras de tamanho 20, 100, 1000 e 10000 da mesma distribuição com uma função contínua f(x) aproximando o histograma. Observe que quanto maior o tamanho da amostra, melhor a aproximação. A porcentagem de valores abaixo de 9 é aproximada pela área sob a curva à esquerda de 9. Quanto maior o tamanho da amostra, melhor a aproximação. %(t < 9) ≅ −∞ 9 𝑓 𝑥 𝑑𝑥 Use charts to explain your ideasVariável aleatória contínua Valores % de valores (histograma) Probabilidade (distribuição) (Y < 60) 𝑃 𝑌 < 60 = 0.185 P( Y < 60) = 0.167 (Y >70 𝑃 𝑌 > 70 = 0.140 P (Y > 70) = 0.146 60 ≤ y ≤70 𝑃 60 ≤ 𝑦 ≤ 70 = 0.675 P(60 ≤ y ≤70) = 0.687 Use charts to explain your ideasFunção densidade de probabilidade Propriedades da f.d.p. 1. 𝑓 𝑥 ≥ 0, ∀ 𝑥 2. A área sob a curva definida por f(x) é igual a 1, ou seja, −∞ ∞ 𝑓 𝑥 𝑑𝑥 = 1 3. 𝑃(𝑎 ≤ 𝑥 ≤ 𝑏) = á𝑟𝑒𝑎 𝑠𝑜𝑏 𝑎 𝑐𝑢𝑟𝑣𝑎 𝑒𝑛𝑡𝑟𝑒 𝑜𝑠 𝑝𝑜𝑛𝑡𝑜𝑠 𝑎 𝑒 𝑏, ou seja, 𝑎 𝑏 𝑓 𝑥 𝑑𝑥 Use charts to explain your ideasFunção densidade de probabilidade Propriedades da f.d.p. Onde: μ = média ou mediana da população σ = é o desvio padrão da população Use charts to explain your ideasFunção distribuição acumulada Se 𝑋 é um v.a. contínua a função de distribuição acumulada (fda) é 𝐹(𝑥) = 𝑃(𝑋 <= 𝑥). Propriedades 1. 𝐹(𝑥) é uma função não decrescente de 𝑥 2. 𝐹 −∞ = 0 3. 𝐹 ∞ = 1 Use charts to explain your ideasMédia e variância de v.a. contínuas • Uma variável aleatória contínua 𝑋, em geral, também tem uma média e uma variância com o mesmo significado e as mesmas interpretações discutidas anteriormente para o caso discreto, mas o seu cálculoenvolve integrais e não serão objeto de nosso trabalho aqui. • Para as distribuições que estudaremos aqui, a média e a variância serão fornecidas em cada caso. Use charts to explain your ideasA distribuição normal (Gaussiana) Dentre as muitas distribuições contínuas usadas em estatística, a mais importante é a Distribuição Normal ou Gaussiana. Ela tem a forma de um sino e está associada com os nomes de Pierre Laplace e Carl Gauss. Seu estudo remonta ao século XVIII Use charts to explain your ideasA distribuição normal (Gaussiana) Importância • O “teorema central do limite”. • A robustez ou insensibilidade dos procedimentos estatísticos mais comumente usados a desvios da suposição de distribuição normal. Use charts to explain your ideasTeorema Central do Limite Independentemente da forma da distribuição da população ou universo, a distribuição dos valores médios das amostras colhidas a partir desse universo tenderá a uma distribuição normal a medida que o tamanho da amostra for crescendo. Pode também ser demonstrado que a média das médias das amostras será igual à média do universo e que o desvio padrão das médias será igual ao desvio padrão do universo dividido pela raiz quadrada do tamanho da amostra. Use charts to explain your ideasTeorema Central do Limite Seja 𝜀 o erro “total” de medição. Sob certas condições, geralmente encontradas no mundo da experimentação, podemos escrever 𝜀 como a soma dos seus componentes 𝜀 = 𝑎1𝜀1 + ⋯+ 𝑎𝑛𝜀𝑛 Exemplo: 𝜀: 𝑒𝑟𝑟𝑜 𝑛𝑎 𝑚𝑒𝑑𝑖çã𝑜 𝑑𝑎 𝑎𝑙𝑡𝑢𝑟𝑎 𝑑𝑒 𝑢𝑚𝑎 𝑝𝑒𝑠𝑠𝑜𝑎 𝜀1: 𝑒𝑟𝑟𝑜 𝑑𝑒 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑔𝑒𝑚 𝜀2: 𝑒𝑟𝑟𝑜 𝑎𝑛𝑎𝑙í𝑡𝑖𝑐𝑜 𝜀3: 𝑒𝑟𝑟𝑜 𝑑𝑜 𝑠𝑖𝑠𝑡𝑒𝑚𝑎 𝑑𝑒 𝑚𝑒𝑑𝑖çã𝑜 etc... Use charts to explain your ideasO teorema central do limite Imagine o lançamento de dados. Qual é a probabilidade para a média do valor dos dados? Use charts to explain your ideasTeorema Central do Limite Resultado Importante: Seja X1, X2, ..., Xn uma amostra aleatória de uma variável aleatória X com média , variância 2 e distribuição F(x) e seja a média da amostra dada por 𝑋 = 𝑋𝑖 𝑛 Então a distribuição de 𝑋 converge para a distribuição Normal com média e variância 2/n, ou seja, 𝑋~𝑁 𝜇, 𝜎2 𝑛 Use charts to explain your ideasSuposição de normalidade Muitas técnicas estatísticas são derivadas da suposição de normalidade das observações originais. Em muitos casos, aproximação, em vez de normalidade exata, é tudo que se requer para que estes métodos sejam aplicáveis. Considerando isto, eles são ditos robustos à não- normalidade. Desta forma, a menos que seja especificamente alertado, não se deve ter excessiva preocupação acerca de normalidade exata. Use charts to explain your ideasA distribuição normal Muitas características de qualidade contínuas tem distribuição razoavelmente simétrica e podem ser aproximadas por uma curva em forma de sino conhecida como Curva Normal, que corresponde à distribuição Normal ou Gaussiana. A função da densidade de probabilidade é dada pela equação: Use charts to explain your ideasA distribuição normal Muitas características de qualidade contínuas tem distribuição razoavelmente simétrica e podem ser aproximadas por uma curva em forma de sino conhecida como Curva Normal, que corresponde à distribuição Normal ou Gaussiana; De ns ity 207205204203202201200199198197196195 0.4 0.3 0.2 0.1 0.0 Normal Use charts to explain your ideasDefinição da Curva Normal Toda Curva Normal é definida por dois números: 1) Média: medida do centro. 2) Desvio padrão: medida de dispersão. Use charts to explain your ideasPropriedades da Curva Normal Para qualquer curva normal, temos: Use charts to explain your ideasPropriedades da Curva Normal Quando X~𝑁(0,1) , chamamos distribuição normal padrão e as probabilidades encontram-se tabeladas Softwares, como o Excel, também possuem fórmulas que realizam esse cálculo Use charts to explain your ideas Propriedades da Curva Normal com a 𝑁 𝜇, 𝜎2 Seja 𝑋~𝑁 𝜇, 𝜎2 : Considere 𝑍 = 𝑋−𝜇 𝜎 . Pode-se mostrar que 𝑍 tem distribuição normal e 𝐸 𝑍 = 𝐸 𝑋 − 𝜇 𝜎 = 1 𝜎 𝐸 𝑋 − 𝜇 = 0 𝑉𝑎𝑟 𝑍 = 𝑉𝑎𝑟 𝑋 − 𝜇 𝜎 = 1 𝜎2 𝑉𝑎𝑟 𝑋 = 𝜎2 𝜎2 = 1 Portanto, 𝑍~𝑁 0,1 Use charts to explain your ideas Propriedades da Curva Normal com a 𝑁 𝜇, 𝜎2 Se quisermos calcular 𝑃(𝑋 < 𝑏) fazemos: 𝑃 𝑋 < 𝑏 = 𝑃 𝑋 − 𝜇 𝜎 < 𝑏 − 𝜇 𝜎 = 𝑃 𝑍 < 𝑧0 onde 𝑧0 = 𝑏−𝜇 𝜎 Procuramos na tabela 𝑁(0,1) o valor 𝑧0 Use charts to explain your ideasExemplo O diâmetro de uma peça pode ser aproximado pela distribuição Normal com média 0.2508 e desvio padrão 0.0005. A especificação para do diâmetro da peça é 0.2500±0.0015. Qual é a proporção de peças que são produzidas dentro da especificação? 92%0.919240.000000.91024 4.6)P(Z1.4)P(Z1.4)Z4.6P( 0.0005 0.2508-0.2515 Z 0.0005 0.2508-0.2485 P0.2515)XP(0.2485 Use charts to explain your ideasPropriedades da Curva Normal O seguinte resultado é útil quando temos de trabalhar com a soma de duas ou mais variáveis aleatórias Normais. Se Xi ~ N(μi,σi2) , i=1,2,...,n são variáveis aleatórias independentes e a1, a2, ... an constantes. Então 𝑎𝑖𝑋𝑖 ~𝑁 𝑎𝑖 𝜇𝑖 , 𝑎𝑖 2𝜎𝑖 2 ou seja, a combinação de variáveis com distribuição Normal também tem distribuição Normal. Use charts to explain your ideasExemplo Prático Suponha verificamos a resistência à ruptura de um processo de colagem fio de ouro usado na produção de um microcircuito e descobrimos que a força média do processo é 9 e o desvio padrão é de 4. O processo de distribuição é normal. Se a especificação de engenharia é de no mínimo 3, qual a percentagem do processo estará abaixo da especificação inferior? Como nossos dados partiram de um amostra, utilizamos: Da tabela Sigma, para Z=-1,5, temos a probabilidade de que 6,68% da área seja menor que o valor de Z. Use charts to explain your ideasExercício! O peso bruto de um produto é a soma do peso líquido mais o peso da embalagem. Suponha que a máquina que embala o produto é tal que o peso líquido colocado na embalagem tem distribuição Normal com média igual a 300 g e desvio padrão igual a 2 gramas. O peso da embalagem tem distribuição Normal com média igual a 5 g e desvio padrão igual a 0.5 g. a) Qual é a distribuição do peso bruto do produto? b) Qual dos dois processos é mais preciso? Use charts to explain your ideasDistribuição exponencial A distribuição exponencial é muito utilizada quando trabalhamos com tempo para ocorrência de um evento, por exemplo, tempo para atendimento de uma chamada) 𝑓 𝑥 = 𝛼𝑒−𝛼𝑥 onde x 0 1086420 2.0 1.5 1.0 0.5 0.0 X De ns ity 0.5 1 2 Alfa Distribution Plot Exponential Use charts to explain your ideasDistribuição exponencial A função distribuição acumulada é dada por: 𝐹 𝑥 = 𝑃 𝑋 ≤ 𝑥 = 1 − 𝑒 −𝑥 𝛼 1086420 1.0 0.8 0.6 0.4 0.2 0.0 x F( x) Distribuição Exponencial: Função Distrib. Acum. Use charts to explain your ideasPropriedades da distribuição exponencial Se 𝑋~𝐸𝑥𝑝 𝛼 , então: • 𝐸 𝑋 = 1 𝛼 • 𝑉𝑎𝑟 𝑋 = 1 𝛼2 Use charts to explain your ideasRelação entre Poisson e Exponencial Quando usamos a distribuição de Poisson para modelar, por exemplo, o número de ligações em um intervalo de tempo é possível mostrar que o tempo entre duas ligações sucessivas terá distribuição exponencial, ou seja, sob certas condições: Seja 𝑋: o número de chamadas e 𝑌: tempo entre essas chamadas 𝑋~𝑃 𝜆 ⇔ 𝑌~𝐸𝑥𝑝 𝜆 Use charts to explain your ideasExemplo A companhiade água da cidade A, registra uma média de 500 vazamentos no sistema por ano. Qual é a probabilidade de que a equipe que trabalho aos finais de semana, das 18:00 da sexta-feira até as 6:00 da segunda-feira, não tenha nenhuma chamada? Comecemos por converter 500 vazamentos por ano para horas. Deste modo, podemos esperar que a cada (8670 horas)/ 500 vazamentos = 17,52 horas a cada vazamento, Se a equipe irá trabalhar por 60 horas, temos: %7,961)60( 52,1760 exp A equipe poderá ficar tranquila em 3,3% dos finais de semana Use charts to explain your ideasExercício Suponha que o tempo entre duas ligações seja modelada por uma distribuição exponencial de parâmetro 1 minuto. Qual a chance de não acontecerem mais do que 3 ligações em um minuto? Inferência sobre a forma Use charts to explain your ideasInferência O termo inferência é definido como: 1. ato ou processo de derivar conclusões lógicas das premissas conhecidas ou assumidas como verdade, ou 2. ato de raciocínio lógico a partir de conhecimento ou baseado em evidências factuais. A inferência estatística proporciona informações que são usadas no processo inferir ou predizer sobre algo. Na maioria das aplicações práticas da estatística enumerativa, como o Seis Sigma, nós fazemos inferências sobre populações com base nos dados de uma amostra. Use charts to explain your ideasInferência Considere uma população ou um processo e uma variável de interesse medida em uma amostra. Os dados da amostra podem ser usados para realizar inferências sobre a população ou o processo. As características (parâmetros) de interesse são em geral: • A forma da distribuição da variável • A média • O desvio padrão Use charts to explain your ideasInferência sobre a forma O objetivo é identificar se existe uma distribuição conhecida que pode ser usada para aproximar a distribuição dos valores, como por exemplo a Distribuição Normal, ou Log Normal, ou Weibull. Isso pode ser feito ajustando-se o gráfico probabilístico de uma determinada distribuição aos dados. Caso o gráfico seja aproximadamente uma reta, a distribuição correspondente pode ser usada. Use charts to explain your ideasInferência sobre a forma Uma empresa monitorou o tempo gasto para atender uma chamada de um cliente em um call center. Trinta atendimentos forma medidos. Os dados obtidos encontram-se na tabela abaixo. Chamada Tempo Chamada Tempo Chamada Tempo 1 2.53 11 5.57 21 4.81 2 5.52 12 4.60 22 4.82 3 3.53 13 3.84 23 7.19 4 3.26 14 5.37 24 2.39 5 6.31 15 3.42 25 5.52 6 4.04 16 4.51 26 5.01 7 4.09 17 1.84 27 1.94 8 1.22 18 6.89 28 4.60 9 3.42 19 3.53 29 2.35 10 5.01 20 6.75 30 2.07 Use charts to explain your ideasGráfico probabilístico O gráfico Probabilístico Normal indica que a distribuição Normal é adequada para descrever a distribuição do tempo de atendimento. tempo de atendimento Pe rc en t 1086420 99 95 90 80 70 60 50 40 30 20 10 5 1 Mean 4.198 StDev 1.588 N 30 AD 0.222 P-Value 0.813 Probability Plot of tempo de atendimento Normal - 95% CI Use charts to explain your ideasEstabilidade e normalidade Observation In di vi du al V al ue 28252219161310741 10 8 6 4 2 0 _ X=4.20 UCL=9.65 LCL=-1.25 I Chart of tempo de atendimento tempo de atendimento Pe rc en t 87654321 30 25 20 15 10 5 0 Mean 4.198 StDev 1.588 N 30 Histogram of tempo de atendimento Normal Não há evidência de que o processo não esteja sob controle O gráfico sugere que a distribuição Normal é adequada para descrever a distribuição do tempo de atendimento Use charts to explain your ideasInferência sobre a forma A inferência sobre a média e o desvio padrão da população pode ser feita de três formas: • Estimação pontual • Intervalo de confiança • Teste de hipóteses Obs.: • Essas inferências só fazem sentido se os dados se ajustam a uma distribuição e se o processo está estável. • É importante fazer inicialmente o gráfico de controle e em seguida o gráfico probabilístico. Use charts to explain your ideasEstimação pontual Representa-se os valores de uma amostra de tamanho n por x1, x2, ... , xn. A estimação pontual da média e do desvio padrão da população são dados pela média amostral e pelo desvio padrão respectivamente: 1n )x(x s :Padrão Desvio n x x :Média 2 i i Use charts to explain your ideasIntervalo de confiança para média A estimação pontual não fornece informação sobre a precisão da estimativa. A precisão de uma estimativa pode ser medida através da margem de erro. A margem de erro da estimativa pontual da média é dada por: *2M.E. n s Use charts to explain your ideasIntervalo de confiança para média ) n s * tx , n s *tx( 1)(n0.025,1)(n0.025, n s *t*2 1)(n0.025, t0.025,(n-1) é o percentil 2.5% da distribuição t-Student com (n-1) graus de liberdade. A amplitude do intervalo de confiança é dada por: Um intervalo de confiança de 95% para a média populacional é dado por: Use charts to explain your ideasIntervalo de confiança para desvio padrão 2 0.975 2 0.025 χ 1)-(n s , χ 1)-(n s X20.025,(n-1) e X20.025,(n-1) são os percentis 2.5% e 97.5% respectivamente da distribuição Qui-quadrado com (n-1) graus de liberdade Um intervalo de confiança de 95% para o desvio padrão populacional é dado por: Use charts to explain your ideasExemplo no Minitab 7654321 Median Mean 5.004.754.504.254.003.753.50 1st Q uartile 3.0775 Median 4.3000 3rd Q uartile 5.4075 Maximum 7.1900 3.6055 4.7912 3.4452 4.9665 1.2644 2.1342 A -Squared 0.22 P-V alue 0.813 Mean 4.1983 StDev 1.5876 V ariance 2.5205 Skewness 0.026119 Kurtosis -0.694410 N 30 Minimum 1.2200 A nderson-Darling Normality Test 95% C onfidence Interv al for Mean 95% C onfidence Interv al for Median 95% C onfidence Interv al for StDev 95% Confidence Intervals Summary for tempo de atendimento Teste de hipóteses Use charts to explain your ideasTeste de Hipóteses A inferência estatística geralmente envolve 4 passos: 1. Formulação de hipóteses sobre a população ou o estado da natureza; 2. Coletar uma amostra de observações da população; 3. Cálculo das estatísticas baseados na amostra; 4. Aceitar ou refutar a hipótese com base num critério de aceitação pré-determinado. Por isto, testar hipótese é tão importante Use charts to explain your ideasExemplo: trajeto • Você utiliza um determinado trajeto para o trabalho todos os dias. • Você coleta os tempos de deslocamento dos últimos 2 anos. Use charts to explain your ideasExemplo: trajeto • Um colega lhe propõe um novo trajeto (supostamente mais rápido). • Passo 1: formalização do teste: 𝐻0: 𝜇 ≥ 30 𝑣𝑠. 𝐻𝐴: 𝜇 < 30 Use charts to explain your ideasExemplo: trajeto No dia seguinte você utiliza o trajeto sugerido e gasta 29 minutos... Qual a sua decisão? Devemos coletar mais dados! Use charts to explain your ideasExemplo: trajeto • 9 observações são coletadas 𝑋 = 29. • 𝑝𝑟𝑒𝑐𝑖𝑠ã𝑜 ≈ 1 𝑞𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎çã𝑜 = 1 𝜎 • A precisão de 𝑋 pode ser calculado como: 𝜎 𝑋 = 𝑉𝑎𝑟 𝑋 = 𝑉𝑎𝑟 1 𝑛 𝑋𝑖 = 𝜎 𝑛 • Quanto maior a amostra, maior a precisão! Use charts to explain your ideasExemplo: trajeto Critério: 𝐶∗ = 𝑋 − 𝜇 Precisamos corrigir o critério pela precisão 𝐶 = 𝑋 − 𝜇 𝜎/ 𝑛 Supondo 𝜎 = 1 𝐶 = 29 − 30 1/ 9 = −3 Qual a sua decisão?𝐶 esta suficientemente afastado? Use charts to explain your ideasExemplo: trajeto Como visto anteriormente, 𝑋~𝑁 0,1/3 ⇒ 𝐶~𝑁 0,1 Calculamos 𝑃(𝐶 < −3) utilizando a tabela da 𝑁 0,1 . Quanto menor for 𝑃(𝐶 < −3) maior a evidência de 𝐻𝐴 e, portanto, rejeitamos 𝐻0. -3 0 Use charts to explain your ideasExemplo: trajeto Dessa forma completamos os 4 passos: 1. Teste: 𝐻0: 𝜇 = 30 𝑣𝑠. 𝐻𝐴: 𝜇 < 30 2. Critério: 𝐶 = 𝑋−𝜇 𝜎/ 𝑛 3. Distribuição de referência: 𝐶~𝑁 0,1 4. Nível de significância: 𝑃 𝐶 ≤ −3 = 0.001 Use charts to explain your ideasExemplo: trajeto Caso 𝜎 tenha que ser estimado por: 𝑆 = 𝑥𝑖 − 𝑋 𝑛 − 1 O critério fica: 𝐶 = 𝑋 − 𝜇 𝑆/ 𝑛 ~𝑡𝑛−1 obs: 𝑡𝑛−1= t de student com 𝑛 − 1 graus de liberdade. Use charts to explain your ideasExemplo: trajeto Suponha que na realização dos 9 trajetos os tempos tenham sido: 30.1, 29.7, 27.3, 29.1, 28.3, 28.4, 31.0, 28.1, 29.0 Nesse caso: 𝑋 = 29 𝑆 = 1.132 𝑡 = 𝑋 − 𝜇 𝑆/ 𝑛 = −2.65 𝑃 𝑡8 < −2.65 = 0.015 Use charts to explain your ideasExemplo: trajeto Observação: Uma diferença que é estatisticamente significante pode não ser significante do ponto de vista prático! Use charts to explain your ideasExemplo: Call Center Voltando ao exemplo anterior, uma empresa monitorou o tempo gasto para atender uma chamada de um cliente em um call center. Trinta atendimentos forma medidos. Os dados obtidos encontram-se na tabela abaixo: Chamada Tempo Chamada Tempo Chamada Tempo 1 2.53 11 5.57 21 4.81 2 5.52 12 4.60 22 4.82 3 3.53 13 3.84 23 7.19 4 3.26 14 5.37 24 2.39 5 6.31 15 3.42 25 5.52 6 4.04 16 4.51 26 5.01 7 4.09 17 1.84 27 1.94 8 1.22 18 6.89 28 4.60 9 3.42 19 3.53 29 2.35 10 5.01 20 6.75 30 2.07 Use charts to explain your ideasExemplo: Call Center No exemplo, suponha que o objetivo era que o tempo médio de atendimento fosse igual a 3.50 minutos. O objetivo estava sendo alcançado? Teste de Hipótese Ho: 0 = 3.50 H1:0 3.50 n s μy t: testedo Critério 00 Use charts to explain your ideasExemplo: Call Center Calculando o critério: p-valor = 0.023 Há evidência para rejeitar H0. OBS. O gráfico de controle deve ser feito antes do cálculo do p- valor. Caso haja causas especiais atuando no processo, não se deve calcular o p-valor 2.41 30 1.5876 .5034.1983 n s μy t 00 Use charts to explain your ideasExemplo: Call Center One-Sample T: tempo de atendimento Test of mu = 3.5 vs not = 3.5 Variable tempo de atendimento N Mean StDev SE Mean 30 4.19833 1.58760 0.28985 95% CI T p (3.60551; 4.79115) 2.41 0.023 Use charts to explain your ideasPasso a passo 1. Formalização do teste, ou tradução do problema a ser resolvido na forma de um teste de hipóteses: formule as hipótese nula e alternativa (P) 2. Construção de um critério para realizar o teste (P) 3. Planeje a coleta de dados (P) 4. Realize a coleta de dados (D) 5. Calcule a estatística (critério) (S) 6. Compare o critério com uma distribuição de referência e calcule a evidência contra a hipótese nula (p-valor – nível de significância) (S) 7. Decida o que fazer (A) Use charts to explain your ideasAnálise de p-valor • Se o p-valor for menor que 1%, rejeita-se a hipótese nula; • Se o p-valor for maior que 10%, não rejeita-se a hipótese nula; • Se o p-valor estiver entre 1% e 10%, deve-se considerar outros fatores para se tomar uma decisão, como o risco, custo, etc.; Obs. As recomendações acima são as usuais e são adequadas para a maior parte dos casos. Porém, a decisão de rejeitar ou não uma hipótese deve ser feita levando em consideração os riscos e custos associados com a decisão. Significância estatística não é a mesma coisa que importância! Use charts to explain your ideasTestes de hipótese • Existem vários possíveis testes de hipóteses. • Qual usar, depende do tipo de grandeza que estamos testando. • Iremos ver essa questão em mais detalhes na parte de “análise de população”. Use charts to explain your ideasTestes de hipótese O que temos que saber para realizar corretamente um teste de hipótese? • O tipo de variável (atributo ou contínua); • O que estamos testando (médias, variâncias, mínimos quadrados, etc.); • Tipo de variável (dependente ou independente. O Minitab 17 nos ajuda a escolher o teste correto para cada situação. ANOVA ANOVA A análise de variância (ANOVA) testa a hipótese de que as médias de duas ou mais populações são iguais. Análises ANOVA testam a importância de um ou mais fatores comparando as médias das variáveis de resposta em diferentes níveis dos fatores. Verificando se o fator exerce influência. A hipótese nula afirma que todas as médias das populações (médias dos níveis dos fatores) são iguais, enquanto a hipótese alternativa afirma que pelo menos uma é diferente. O nome "analise de variância" é baseado na abordagem na qual o procedimento usa variâncias para determinar se as médias são diferentes. O procedimento compara a variância entre as médias do grupo à variância dentro dos grupos como para determinar se os grupos são todos parte de uma população maior ou populações separadas com características diferentes. ANOVA Para realizar um teste ANOVA: é necessário haver uma variável resposta contínua e pelo menos um fator categórico com dois ou mais níveis dados de populações com distribuições aproximadamente normal, com variâncias iguais entre fatores amostras aleatórias e independentes Via de regra, os procedimentos ANOVA funcionam bem mesmo quando a pressuposição de normalidade é violada, exceto quando uma ou mais distribuições são altamente assimétricas ou quando as variâncias são muito diferentes ANOVA Exemplo Máquina A Máquina B Máquina C 4 2 -3 8 0 1 5 1 -2 7 2 -1 6 4 0 Dados obtidos de um experimento completamente aleatorizado Será que estas máquinas são iguais? Ou há diferença entre elas? ANOVA E o que é serem iguais? H0 => μa = μb = μc e H1 => μa ≠ μb ≠ μc E como avaliar isto? Comparando-se a variabilidade dentro do grupo com a variabilidade entre os grupos. Quanto maior for a variabilidade entre os grupos, maior a evidência de que há diferença entre as médias e, que a hipótese H0 não é verdadeira. ANOVA E como calcularmos? Define-se a soma total dos quadrados: calculada a partir de todos os dados, em que é a média amostral global. Note que a estimativa usual de variância de uma amostra é: _ x ANOVA E como calcularmos? Podemos dividi-la como: em que ANOVA E como calcularmos? Aqui SQD é utilizado para denotar soma de quadrados dentro de grupo e SQE para a soma de quadrado entre grupos. Agora tendo separado a variabilidade, é possível mostrar que podemos obter estimativas independentes da variância populacional comum σ2 a partir destas duas quantidades. Elas são chamadas de valores quadrados médios, e obtemos as seguintes estimativas: m é o número de grupos, e N é o tamanho amostral total, aqui 3. ANOVA Como estas estimativas de variância são construídas a partir de dois tipos diferentes de variabilidade, quanto mais elas diferirem, mais evidência existe de diferença nas médias. Teste => Como os resultados são expressos Soma dos Quadrados Graus de Liberdade Quadrado das Médias Teste P-valor ANOVA Exemplo Aplica-se um teste ANOVA e: Nota-se que que sabemos é que, pelo menos, as duas máquinas extremas (A e C) são diferentes. A ANOVA não nos diz se A e B ou B e C são significativamente diferentes A tabela ANOVA mostra que F calculado é de 62,067/2,4 = 25,681 e o F crítico em ά = 0,05 (95%de confiança) com o numerador df=2 e o denominador df = 12 é 3,885. Como 25,68 > 3,88 nós rejeitamos a hipótese nula e concluímos que as máquinas produzem resultados diferentes Análise de Regressão Estatística: Engenharia reversa é difícil ◉ O problema da inferência, ela é exatamente uma engenharia reversa ◉ Todo dia, somos presenteados com observações e solicitados a construir teorias (PDSA) – o que foi colocado numa caixa preta para produzir o mundo que vemos? ◉ “Pela forma das nuvens e o modo como se movem, nós lutamos para retroceder, resolver x, o sistema que as formou” Estudar Relações Entre Variáveis O Variáveis de Input Variáveis de Processo Variáveis de Output PI X1,, X2 , ... , Xk Y Y = f(X1,, X2 , ... , Xk) S C Sistema de Causas Estudo de Relações Entre Variáveis ◉Passo 1: Classifique as variáveis sob dois critérios: A variável é Y ou X? • Y: Variáveis de saída do processo cujo comportamento você quer explicar. • Nomenclatura: variáveis resposta, variáveis dependentes • X: Variáveis de processo ou de entrada, candidatas a explicar o comportamento das variáveis resposta. • Nomenclatura: variáveis explicativas, variáveis independentes, fatores; 2) Variáveis de estratificação A variável é numérica ou categórica? Estudar Relações Entre Variáveis ◉Passo 2: Identifique a técnica a ser utilizada na tabela abaixo: Y numérica Y categórica X numérica Gráfico de dispersão Gráfico de dispersão estratificado X categórica Dot-plot estratificado Gráfico de Tendência estratificado Tabela de contingência Gráfico de barras Gráfico de Dispersão Gráfico de Dispersão “Comecei com uma folha de papel quadriculada, com uma escala horizontal no alto, como referência para as estaturas dos filhos, e outra lateral de cima para baixo, para as estaturas dos pais, e aí punha uma marca a lápis no ponto apropriado da estatura de cada filho em relação à de seu pai.” “Pelo gráfico, observa-se: filhos de pais altos, costumam ser mais altos que a média, mas não tão altos como seus próprios pais. O mesmo acontece aos filhos de pais baixos.” Galton inventara o tipo de gráfico que hoje chamamos de gráfico de dispersão. Reinventou, na verdade. Quem o fez pela primeira vez foi John Herschel em 1833, para estudar órbitas de estrelas binárias. Gráfico de Dispersão Mas cuidado. Não faça como Alphonse Bertillon, criminologista francês com o espírito semelhante ao de Galton. No sistema Bertillon, cada suspeito detido era medido e seus dados preenchidos em cartões e armazenados para uso futuro. Se o mesmo homem fosse novamente apanhado, identificá-lo era simples questão de pegar o medidor, registrar seus números e compará-los com os cartões no arquivo. Problema: as medidas corporais não são inteiramente independentes. Pessoas de pés grandes, costumam ter mãos grandes também. Gráfico de Dispersão Job Tempo_prod N_Setups Job Tempo_prod N_Setups 1 61 6 26 20 4 2 129 14 27 75 10 3 77 5 28 94 12 4 115 8 29 95 7 5 79 8 30 38 7 6 95 10 31 50 6 7 88 9 32 40 3 8 67 8 33 73 10 9 158 12 34 91 11 10 67 5 35 38 4 11 160 13 36 69 6 12 37 7 37 58 7 13 30 2 38 91 14 14 86 9 39 36 7 15 187 15 40 151 10 16 72 8 41 103 9 17 78 8 42 93 8 18 132 14 43 112 11 19 38 6 44 163 12 20 34 5 45 78 9 21 90 7 46 62 8 22 93 11 47 58 8 23 114 8 48 107 9 24 65 5 49 112 7 25 86 12 50 72 10 Uma empresa coletou dados de Tempo para produzir um item e Número de set-ups de 50 linhas de produção . Os dados estão na tabela ao lado. Há alguma relação entre essas duas variáveis? Gráfico de Dispersão Análise de Gráficos de Dispersão Aspectos a serem observados em m Gráfico de Dispersão Direção Forma Força Coeficiente de correlação linear Fórmula -1 ≤ r ≤ 1 Obs: O coeficiente r mede o grau de associação linear entre duas variáveis. Valor de r baixo (próximo de zero) não indica que as variáveis não estão relacionadas. Não interprete o valor de r sem o gráfico de dispersão. A interpretação de r (se é alto) depende do contexto 22 yyxx yyxx r ii ii Estudo de Relações O proprietário de uma casa está interessado no efeito do seu aparelho de ar condicionado na conta de luz. Para isso, ele anotou o número de horas que usou o seu aparelho de ar condicionado a cada dia, durante 21 dias. Também monitorou o medidor de consumo de eletricidade durante estes dias e mediu a quantidade de eletricidade usada em quilowatt-hora. Finalmente, anotou também o número de vezes que a secadora de roupas foi usada por dia. Os dados estão na tabela seguinte Dia Kwh AC Dia Kwh AC 1 35 1.5 12 65 8,0 2 63 4.5 13 77 7,5 3 66 5.0 14 75 8,0 4 17 2.0 15 62 7,5 5 94 8.5 16 85 12,0 6 79 6.0 17 43 6,0 7 93 13.5 18 57 2,5 8 66 8.0 19 33 5,0 9 94 12.5 20 65 7,5 10 82 7.5 21 33 6,0 11 78 6.5 Dados do Estudo de Consumo de Energia Elétrica AC Kw h 14121086420 100 90 80 70 60 50 40 30 20 10 Scatterplot of Kwh vs AC Correlação entre Kwh e AC : 0.765 Gráfico de Dispersão e Correlação Questões não respondidas pela correlação Do valor de r pode-se concluir que quando o uso do ar condicionado aumenta, o número de quilowatt-hora consumido também aumenta. Isso não é surpresa. Algumas questões mais importantes são: Quantos Kwh serão consumidos para cada hora de uso do ar ? Qual é a previsão de consumo total de quilowatt-hora em um dia com um número especificado de horas de uso do ar condicionado? Qual é a média estimada do consumo em quilowatt-hora para dias com um especificado número de horas de uso do ar condicionado? Qual é a margem de erro para o consumo em Kwh predito? Essas questões podem ser respondidas com a análise de regressão AC Kw h 14121086420 100 90 80 70 60 50 40 30 20 10 Scatterplot of Kwh vs AC Gráfico de dispersão com uma reta desenhada manualmente. Como medir a “qualidade” da reta ajustada? Ajuste de uma reta Ajuste de uma reta X Y 60 65 70 75 80 85 90 95 80 100 120 140 160 180 200 220 (x,y) x y yˆ )ˆ( yyresíduo Ajuste de uma reta Reta ajustada e resíduos X Y 60 65 70 75 80 85 90 95 80 100 120 140 160 180 200 220 Ajuste de uma reta ◉Considere um conjunto de n pares de dados (x,y) e o gráfico de dispersão X,Y ◉Para cada reta y=a+bx desenhada no gráfico, calcule o valor y_ajustado=a+bx ◉O resíduo é a diferença (y - y_ajustado) ◉A soma do quadrados dos resíduos é uma medida da qualidade do ajuste (“proximidade da reta aos pontos do gráfico”) ◉A “melhor reta” é aquela que tem a menor Soma dos Quadrados dos Resíduos e é chamada de Reta de Mínimos Quadrados Ajuste de Regressão por Mínimos Quadrados Melhor reta: mínimo seja )yˆ(y que talbˆ e aˆ x,bˆaˆyˆ 2 rx,y – Coeficiente de correlação entre x e y sx e sy – desvio padrão de x e y respectivamente xbˆyaˆ e s s rbˆ :Solução x y yx, Reta Ajustada por Mínimos Quadrados AC Kw h 14121086420 100 90 80 70 60 50 40 30 20 10 S 14.4530 R-Sq 58.6% R-Sq(adj) 56.4% Fitted Line Plot Kwh = 27.85 + 5.341 AC Ajuste de Regressão: Interpretação ◉Considere a reta ajustada por mínimos quadrados Kwh=27.85+5.341AC. ◉Como interpretar os coeficientes 27.85 e 5.341? ◉Que se pode afirmar sobre o consumo de energia quando se usa o ar condicionado por 10 horas? ◉Obs: Nem sempre os coeficientes são interpretáveis. Ajuste de Regressão: Interpretação◉Observe que a faixa de variação de AC é de 1.5 a 13.5. ◉Usar a equação para valores de AC fora da faixa de dados observados é extrapolação. ◉Extrapolação tem que ser feita com cuidado. Muitas vezes obtém-se valores absurdos! Ajuste de Regressão Algumas equações importantes: 1R0 , SQ SQ R3. SQSQSQ )yˆ(y)yyˆ()y(y 2. )yˆ(y)yyˆ()y(y 1. 2 Total Ajuste2 ResíduoAjusteTotal 2 ii 2 i 2 i iiii Se os pontos estão alinhados em uma reta, yAjustado = y, SQResíduo= 0 e R2 = 1 R2 é chamado de Coeficiente de Determinação e mede a “qualidade do ajuste” Quando o ajuste é feito através de uma reta, R = rx,y Ajuste de Regressão Regression Analysis: Kwh versus AC The regression equation is Kwh = 27.85 + 5.341 AC S = 14.4530 R-Sq = 58.6% R-Sq(adj) = 56.4% Analysis of Variance Source DF SS MS F P Regression 1 5609.66 5609.66 26.85 0.000 Error 19 3968.91 208.89 Total 20 9578.57 - Equação da reta de mínimos quadrados - R2 - SQAjuste - SQResíduo -SQTotal Estimativa e Margem de Erro ◉Suponha que você queira estimar o consumo médio em quilowatt-hora quando o ar condicionado fica ligado por oito horas. ◉Usando a equação de regressão, substitua AC na equação de regressão por 8 e obtenha: KWH predito = 27.85 + (5.34*8) = 70.57 ◉Esse valor é uma estimativa baseada nos dados do estudo. ◉Qual é a margem de erro dessa estimativa? ◉Sem entrar em detalhes sobre como calcular a margem de erro, vamos obtê-la com o auxílio do MINITAB Estimativa e Margem de Erro ◉O valor estimado é 70.58; ◉A margem de erro é 6.99 (77.57-70.58); ◉Esse valor é aproximadamente 2*SE Fit; ◉Podemos dizer que estamos 95% confiantes que o consumo médio de energia quando usamos o ar condicionado por 8 horas estará entre 63.59 Kwh e 77.57 Khw. Obs AC Fit SE Fit 95% CI 1 8.00 70.58 3.34 (63.59; 77.57) Predição e Margem de Erro ◉Suponha que você queira predizer o consumo em quilowatt-hora quando o ar condicionado for ligado por oito horas; ◉Usando a equação de regressão, substitua AC na equação de regressão por 8 e obtenha: KWH predito = 27.85 + (5.34*8) = 70.57. ◉Esse valor é uma predição baseada nos dados do estudo. ◉Qual é a margem de erro dessa predição? ◉Sem entrar em detalhes sobre como calcular a margem de erro, vamos obtê-la com o auxílio do MINITAB Predição e Margem de Erro ◉O valor estimado é 70.58; ◉A margem de erro é 31.05 (101.63 -70.58); ◉Podemos dizer que estamos 95% confiantes que o consumo de energia quando usarmos o ar condicionado por 8 horas estará entre 39.53 Kwh e 101.63 Khw; ◉Observe a diferença entre estimar a média de consumo e predizer o consumo para um dia específico. Obs AC Fit SE Fit 95% PI 1 8.00 70.58 3.34 (39.53; 101.63) A Reta de Regressão com os Limites de Confiança ◉É útil visualizar o gráfico com os dados, a reta ajustada, os limites de predição e os limites de confiança; ◉Os limites de predição e de confiança são curvas em torno da reta de regressão; ◉Para cada valor de AC pode-se visualizar graficamente o valor ajustado, os intervalos de confiança e os intervalos de predição. Reta Ajustada por Mínimos Quadrados, Curva de Confiança de 95% e Curva de Predição de 95% AC Kw h 14121086420 140 120 100 80 60 40 20 0 S 14.4530 R-Sq 58.6% R-Sq(adj) 56.4% Regression 95% CI 95% PI Fitted Line Plot Kwh = 27.85 + 5.341 AC Margem de Erro das Estimativas ◉As estimativas de mínimos quadrados de a e b são obtidas a partir dos dados do experimento; ◉Se repetirmos o experimento nas mesmas condições (para os mesmos valores de x) os valores de y (resposta) quase certamente serão diferentes; conseqüentemente, as estimativas de a e b serão diferentes; ◉É importante apresentar as estimativas de a e b com respectivas margens de erro. Margem de Erro das Estimativas ◉Dizemos que a variável regressora X é útil para explicar (entender) a variável resposta Y se o coeficiente angular da reta (b) é diferente de zero; ◉Em um experimento, o valor de b calculado por Mínimos Quadrados pode ser numericamente diferente de zero mas essa diferença pode ser simplesmente devido ao acaso; ◉Então, uma questão importante a ser respondida é: O coeficiente angular da reta é significativamente diferente de zero? ◉Essa pergunta pode ser respondida calculando-se a Margem de Erro da estimativa ou o p-valor associado com a estimativa Margem de Erro das Estimativas ◉A margem de erro de uma estimativa é aproximadamente 2 vezes o erro padrão da estimativa (com 95% de confiança); ◉É possível calcular o erro padrão da estimativa dos coeficientes da reta de regressão com um software estatístico (MINITAB, por exemplo); ◉Com a Margem de Erro pode-se construir um Intervalo de Confiança para os coeficientes da reta; ◉As estimativas dos coeficientes com respectivos erros padrões e Intervalos de Confiança de 95% estão no slide seguinte Margem de Erro e Intervalo de Confiança The regression equation is Kwh = 27.9 + 5.34 AC Predictor Coef SE Coef T P Constant 27.851 7.807 3.57 0.002 AC 5.341 1.031 5.18 0.000 Estimativas Erro PadrãoCoeficientes Margem de Erro (b) = 2*1.031 = 2.061 IC de 95% (b): (3.28 ; 7.402) Margem de Erro (a) = 2*7.807 = 15.614 IC de 95% (a): (12.237 ; 43.465) Margem de Erro e Intervalo de Confiança ◉Com base nos Intervalos de Confiança podemos afirmar que os coeficientes linear e angular da reta são significativamente diferentes de zero; ◉A mesma resposta poderia ser obtida com base no p- valor das estimativas; ◉Como os p-valores são muito pequenos, concluímos que os coeficientes são significativamente (estatisticamente) diferentes de zero. Resíduos e Outliers ◉Cada caso (observação) no conjunto de dados tem uma resposta y e um valor predito pelo modelo, yajustado ◉A diferença entre y e yajustado é chamada de resíduo res=y-yajustado ◉Cada caso tem seu resíduo ◉Se o resíduo é pequeno, a predição é boa para aquele caso (o que é “pequeno” depende de cada problema) Resíduos e Outliers Considere os quatro conjunto de dados da tabela abaixo Conjunto de Dados 1 Conjunto de Dados 2 Conjunto de Dados 3 Conjunto de Dados 4 X Y X Y X Y X Y 10.00 8.04 10.00 9.14 10.00 7.46 8.00 6.58 8.00 6.95 8.00 8.14 8.00 6.77 8.00 5.76 13.00 7.58 13.00 8.74 13.00 12.74 8.00 7.71 9.00 8.81 9.00 8.77 9.00 7.11 8.00 8.84 11.00 8.33 11.00 9.26 11.00 7.81 8.00 8.47 14.00 9.96 14.00 8.10 14.00 8.84 8.00 7.04 6.00 7.24 6.00 6.13 6.00 6.08 8.00 5.25 4.00 4.26 4.00 3.10 4.00 5.39 19.00 12.50 12.00 10.84 12.00 9.13 12.00 8.15 8.00 5.56 7.00 4.82 7.00 7.26 7.00 6.42 8.00 7.91 5.00 5.68 5.00 4.74 5.00 5.73 8.00 6.89 Resíduos e Outliers Variável Mean Std.Dev. X1 9.0 3.32 Y1 7.5 2.03 X2 9.0 3.32 Y2 7.5 2.03 X3 9.0 3.32 Y3 7.5 2.03 X4 9.0 3.32 Y4 7.5 2.03 A tabela ao lado apresenta o coeficiente de correlação, reta ajustada e R2 para cada conjunto de dados Conjunto r Reta ajustada R 2 1 0.86 y = 3.0+0.5x 0.668 2 0.86 y = 3.0+0.5x 0.668 3 0.86 y = 3.0+0.5x 0.668 4 0.86 y = 3.0+0.5x 0.668 A tabela ao lado apresenta a média e desvio padrão para cada variável Resíduos e Outliers 1 2 3 4 Retas ajustadas Resíduos e Outliers ◉Como se pode perceber, não é suficiente calcular os coeficientes da reta. Fazer o gráfico de dispersão é fundamental para verificar se o modelo utilizado
Compartilhar