Buscar

apostila blac belt

Prévia do material em texto

Transição Black Belt
Bem vindos!
O que é o curso de Black Belt?
Os arquivos relativos ao exercícios podem ser encontrados em nosso 
site: 
www.fm2s.com.br
Revendo o 
modelo de 
Melhoria
O saber profundo
Deming postula que a melhoria deve 
se basear em 4 pilares:
Use charts to explain your ideasDe onde veio o que vamos estudar?
VISÃO SISTÊMICA
A organização é um sistema composto 
de processos. Esses processos estão 
correlacionados. É preciso enxergar 
essa correlação.
TEORIA DO CONHECIMENTO
Precisamos saber como gerar 
conhecimento sobre o que estamos 
fazendo e saber como disseminá-lo 
para toda a empresa
ENTENDIMENTO DA VARIAÇÃO
Processos variam, indicadores variam. 
É necessário estudar e aprender com 
essa variação.
PSICOLOGIA
Empresas são feitas de pessoas. Cada 
um tem seus objetivos e ambições. 
Entendê-los é vital para o sucesso da 
organização.
1. A visão sistêmica
Enxergando nossa organização como um sistema
Use charts to explain your ideas1. A visão sistêmica
Um sistema é um grupo interdependente de itens, pessoas e/ou 
processos trabalhando em direção a um propósito comum.
Toda organização é um sistema.
Use charts to explain your ideas1. A visão sistêmica
Para melhorar…
… precisamos enxergar os processos 
e suas inter-relações!
Use charts to explain your ideasComo enxergar processos?
Podemos seguir alguns passos:
1. Entenda o propósito da organização;
2. Entenda a cultura da organização;
3. Localize as pessoas e as unidades de trabalho 
dentro da organização;
4. Faça o SIPOC de cada unidade de trabalho;
5. Una as informações em um mapa de processos.
O SIPOC
Passos do Processo
FO
R
N
E
C
E
D
O
R
E
S
 
SaídasEntradas Processo
C
L
IE
N
T
E
S
 
O Mapa de processos
O Mapa de Processos (LoP) nos ajuda:
• Colocar todos os processos em perspectiva;
• Classificar os nossos processos;
• Descrever todos os processos da empresa;
• Direcionar nossa atenção crítica para cada um dos 
processos, buscando melhorias;
• Entender as relações entre nossos processos.
O Mapa de processos
Temos 3 classificações de processos:
• Mainstay: os processos que adicionam valor ao 
cliente
• Drivers: processos que direcionam o negócio
• Support: processos que são necessários para apoiar 
o negócio
O Mapa de processos
Projeto e 
re-projeto
de produtos e 
processos
Planejamento 
Para Melhoria
Pesquisa 
de Mercado
Medição 
& Feedback
Clientes
Distribuição
Processos de apoio
Produção de produtos e serviços
Fornecedores
A
B
C
D
E
F
G
Necessidade
Propósito da 
organização
Processos
“Drivers”
Processos 
“Mainstay”
Processos
“Support”
Comece pela missão
Missão da EMPRESA
“A EMPRESA desenvolve e integra teorias, métodos
e ferramentas da Ciência de Melhoria; fornece
educação, treinamento e orientação para líderes e
grupos com o objetivo de ajudar as organizações na
redução de problemas de qualidade, redução de
custos dos processos, aumento das expectativas
dos clientes e no desenvolvimento do seu sistema
de melhoria contínua”
Mainstay
Desenvolver e 
Integrar
teorias, 
métodos e 
ferramentas
da ciência de 
gestão Fornecer educação
e treinamento
Conduzir orientação 
para líderes e grupos de 
melhoria
Desenvolver 
novos negócios
Preparar as 
atividades nos 
clientes
Desenvolver e 
Integrar 
teorias, 
métodos e 
ferramentas 
da ciência de 
melhoria Fornecer educação 
e treinamento
Conduzir orientação 
para líderes e grupos de 
melhoria
Planejar logística de 
atividades
Agendamento de 
atividades
Manter séde e 
equipamentos
Fazer distribuição 
do resultado
Faturar clientes
Gerenciar o controle financeiro
Desenvolver 
novos 
produtos
Desenvolver 
planejamento 
das atividades 
nos clientes
Comunicar-se 
com clientes
Negociar e 
fechar novos 
negócios
Obter
conhecimento de 
fora do sistema
Desenvolver 
material 
didático
Desenvolver os 
integrantes
Fazer e 
catalogar 
propostas
Medir feedback e o desempenho da 
organização
Ajustar plano 
operacional
Planejar 
investimentos
Desenvolver planejamento estratégico
Desenvolver 
novos negócios
Preparar as 
atividades nos 
clientes
Desenvolver e 
Integrar 
teorias, 
métodos e 
ferramentas 
da ciência de 
melhoria Fornecer educação 
e treinamento
Conduzir orientação 
para líderes e grupos de 
melhoria
Manter site 
atualizado 
Criar e manter 
portfólio de produtos
Manter 
biblioteca de 
materiais e 
arquivos 
técnicos
Criar e enviar 
comunicações aos 
atendidos
Criar e 
manter 
histórico 
dos 
clientes
Planejar logística de 
atividades
Agendamento de 
atividades
Manter séde e 
equipamentos
Fazer distribuição 
do resultado
Faturar clientes
Gerenciar o controle financeiro
Relacionamento com 
fornecedores diversos
Desenvolver 
novos 
produtos
Desenvolver 
planejamento 
das atividades 
nos clientes
Contratar e 
integrar novos 
consultores e 
colaboradores
Comunicar-se 
com clientes
Negociar e 
fechar novos 
negócios
Obter 
conhecimento de 
fora do sistema
1
1
2
Desenvolver 
material 
didático
Organizar arquivos
de trabalho diário
2
Planejar auto-
desenvolvi-
mento dos 
integrantes
Desenvolver os 
integrantes
Planejar o 
crescimento da 
organização
Definir 
distribuição de 
trabalhos aos 
integrantes
Customizar 
produtos para 
neessidades dos 
clientes
Planejar 
precificação
Fazer e 
catalogar 
propostas
Desenhar e 
redesenhar o 
sistema
Conduzir 
reuniões p/ 
entender 
necessidades 
dos clientes 
Medir o 
desempenho da 
organização
Ajustar 
prioridades 
das atividades 
do negócio
Conduzir 
reuniões de 
troca de 
experiências
Planejar 
investimentos
Desenvolver 
planejamento 
estratégicoDesenvolver 
novos negócios
Manter 
lista de 
contatos 
de 
empresas 
prospects
Obter e analisar 
feedback de clientes
Preparar as 
atividades nos 
clientes
Integrar teorias, 
métodos e 
ferramentas
Desenvolver 
materiais e roteiros 
de aula/workshop
Desenvolver 
métodos / 
ferramentas
Conduzir 
Workshops
Conduzir 
treinamento
Conduzir 
coaching 
de grupos 
de melhoria Responder 
duvidas técnicas 
dos clientes
Planejar e 
participar 
de 
checkpoint
Manter site 
atualizado 
Criar e manter 
portfólio de produtos
Gerenciar 
propriedade 
dos arquivos 
e materiais
Organizar arquivos
de trabalho diário
Manter 
biblioteca 
de arquivos 
técnicos
Criar e enviar 
comunicações aos 
atendidos
Criar e 
manter 
histórico 
dos 
clientes
Atualizar lista de 
contatos nos 
clientes atendidos
Organizar 
e arquivar 
Casos de 
sucesso 
dos 
clientes
Planejar 
logística de 
atividades
Agendamento de 
atividades
Planejar 
viagens de 
trabalho
Preparar 
materiais 
impressos
Manter 
equipamentos
Manter a séde 
da empresa
Fazer distribuição 
do resultado
Faturar clientes
Completar relatórios 
de despesas
Gerenciar o 
controle 
financeiro
trabalhar 
com gráficas
Trabalhar com 
empresas de 
transportes Relacionamento com 
fornecedores diversos
Conduzir 
encontros de troca 
de experiências 
dos clientesDesenvolver 
novos 
produtos
Conduzir 
coaching 
de 
líderança
Preparar Coaching 
de grupos de 
melhoria
Desenvolver 
planejamento 
das atividades 
nos clientes
Conduzir
reuniões de 
negócio
Ler e responder e-
mails, recados etc.
Enviar 
materiais
Trabalhar com 
contador
Pagar contas 
e 
fornecedores
Gerenciar 
atividades 
bancárias
Contratar e 
integrar novos 
consultores e 
colaboradores
Comunicar-se 
com clientes
Negociar e 
fechar novos 
negócios
Comprar 
equipamentos e 
suprimentos
Participar de 
seminários 
externos
Obter 
conhecimento de 
fora do sistema
Pesquisar na 
literatura
Cobrar clientes1
1
2
2
Desenvolver 
material 
didático
Use o LoP para avaliar a maturidade
Pontuação Definição Operacional da Pontuação
1 Processo não está definido. É um novo processo que ainda precisa ser projetado e 
documentado.
2 Há uma compreensão geral do processo pelas pessoas que atuam nele. Não há documentação, 
procedimentos ou especificações. Nenhum trabalho formal de melhoria do processo foi 
realizado recentemente. 
3 O processo foi definido por todos os seus públicos interessados (gerentes, funcionários, 
fornecedores e clientes). O objetivo do processo é compreendido. Existe documentação do 
processo: fluxogramas, procedimentos, políticas, normas, descrições de atribuições e atividades, 
manuais de treinamento, ou outros documentos de suporte.
4 O processo está bem definido e mensurações do desempenho e qualidade dos resultados/ 
saídas do processo são utilizadas para monitorá-lo. Métodos gráficos, como gráficos de controle, 
são utilizados para avaliar e aprender com as medições. 
5 Processo foi formalmente melhorado ao longo do último ano. Mensurações 
contínuas são realizadas no processo, incluindo as entradas dos fornecedores e 
feedback dos clientes. Normas e documentação do processo são atualizadas 
conforme as melhorias implementadas no processo. 
6 Mensurações chave do processo e dos seus resultados são previsíveis. Os 
produtos e serviços gerados pelo processo atendem as especificações 
consistentemente. 
Use o LoP para mapear melhorias
Grupo
Subprocesso
Status
Ação para atingir 
maturidade/melhori
a
Prioridade 
para ação
Última 
alteração 
no 
processo
Objetivo
Responsável IC
Marketing Produzir vídeos marketing
Processo informal - sem 
agendamento ou 
metodologia
Contratar 
profissional, agendar 
entregas na agenda
24/04/2016 Gerar leads Murilo
Produzir e-books e planilhas
Entregas agendadas -
Necessita pessoal
Distribuição dos 
temas para cada um 
dos integrantes, 
revisão da agenda. 
Padronização da 
linguagem, com 
instrução para 
geração de 
conteúdo.
24/04/2016 Gerar leads Murilo Materiais/mês
Produzir posts
Entregas agendadas -
Entrega feia pelo Virgilio -
Falta instrução
Realizar medição do 
processo e seu 
resultado
24/04/2016
Melhorar 
SEO
Virgilio vst organica/mês
2. Teoria do conhecimento
Aprendendo a aprender
Use charts to explain your ideasA construção da melhoria
Capacidade 
de gerar 
melhorias 
aumentada
Conhecimento profundo
Conhecimento específico no assunto (método científico)
Use charts to explain your ideasOs componentes do conhecimento
Dados originais 
“evidências”
Predição
Grau de convicção 
na predição, 
baseado na 
evidência
Use charts to explain your ideasO método científico
F
1. Tudo começa quando observamos um fato ou 
fenômeno
Use charts to explain your ideasO método científico
F
2. Após a observação, fazemos uma análise para
entender o fenômeno. O entendimento ao final
da análise aparece na forma de uma hipótese, ou
teoria, que explica o fenômeno observado.
H
Use charts to explain your ideasO método científico
F
H
Fp
3. Com base na hipótese, elaboramos uma
predição: por exemplo, como o processo vai se
comportar após a mudança.
Use charts to explain your ideasO método científico
F
H
Fp
4. Com base nas predições, realizamos um
experimento para observar os fatos reais. Será
que eles são iguais às predições?
FR
Use charts to explain your ideasO método científico
F
H
Fp FR
H2
5. Após realizado o experimento, observamos os
fatos reais e elaboramos uma segunda versão
de nossa hipótese.
Use charts to explain your ideasO método científico
F
H
Fp FR
H2
...
Hs
Para completar o método, repetimos este ciclo
até termos uma hipótese sólida. Lembrem-se:
nenhuma hipótese explica tudo, mas alguas
hipóteses são úteis.
Use charts to explain your ideasO ciclo PDSA
Use charts to explain your ideasO ciclo PDSA
Tempo
C
o
nh
ec
im
en
to
3. Psicologia
A parte humana da mudança
A psicologia
Entender a “psicologia” do sistema é entender
como as pessoas da organização interagem
entre si e com o sistema.
O campo da psicologia é amplo e dinâmico.
Nosso foco será em ideias, métodos,
ferramentas e teorias que nos ajudem a
entender essas interações
Diferenças entre pessoas
Cada pessoa possui
um modelo mental, ou
seja, uma forma de
pensar.
Essa forma de pensar é
dependente da cultura
de cada um e de suas
experiências de vida.
O comportamento é direcionado pela 
motivação
As pessoas se comportam conforme suas próprias
motivações intrínsecas.
Cada um tem um fator de motivação e desmotivação,
que depende de seus modelos mentais
Alinhamento da cultura organizacional
Os agentes de melhoria devem saber como alinhar as
motivações de cada um, com o propósito da empresa.
Isso geralmente acontece com um entendimento e
engenharia de cada um dos modelos mentais.
Propósito da organização
Como fazer isso?
O tema será abordado em maiores detalhes
posteriormente, mas podemos indicar alguns
mecanismos básicos que valem a pena ser conhecidos:
• A mente se molda através de recompensas.
• A mente recebe estímulos do meio e produz
respostas.
• Cada estímulo pode ser positivo ou negativo (de
acordo com o ego ou contrário a ele).
• Cada resposta tem um efeito individual e coletivo.
• Cada resposta tem um efeito de curto prazo e de
longo prazo.
Como fazer isso?
Como montar a mente a partir do ambiente externo?
Como trabalhar o comportamento?
Escolas psicológicas:
• Comportamental (Behaviorism): Skinner;
• Psicanalítica: Freud, Adler, Jung;
• De sistemas: Lewis, Barker, Maturana
• Humanística/Gestalt: Goldstein, Rogers, Maslow
• ...
Como fazer isso?
Segundo a psicologia de Maslow todos temos
necessidades, das mais básicas às mais complexas.
Satisfazer essas necessidades gera felicidade.
Aplicada a organização, devemos fornecer meios para
que estas necessidades sejam satisfeitas.
Quais são essas necessidades?
A “pirâmide” de Maslow
A “pirâmide” de Maslow
Maslow nunca apresentou essa hierarquia entre
necessidades como uma pirâmide.
Além dessas necessidades, ele postulou duas outras:
• Curiosidade científica;
• Beleza estética.
Uma pessoa, percorre o caminho de baixo para cima,
tentando se autoconhecer. Essa filosofia está
diretamente ligada com as ideias de Carl Rogers.
A Melhoria e a Psicologia Humanística
4. Entendimento da variação
Onde entra a estatística!
Conceitos básicos
Causas de variação:
• Todos os dados, indicadores e métricas sofrem variação.
Devemos aprender com elas.
Temos dois tipos principais de causas:
• Causas comuns: são aquelas que são inerentes ao processo (ou
sistema) ao longo do tempo, afetam todos os que trabalham no
processo e todos os resultados deste processo.
• Causas especiais: são aquelas que não são parte do processo
(ousistema) todo o tempo, ou não afetam todo, mas surgem
devido a circunstâncias específicas.
Como identificar essas causas?
Causas comuns acontecem no tempo, por isso
precisamos de ferramentas dinâmicas:
• Gráficos de tendência;
• Gráficos de controle
Como identificar essas causas?
Para a correta aplicação das ferramentas, devemos
entender que existem 3 tipos de variáveis:
• Variáveis de contagem;
• Variáveis de classificação;
• Variáveis contínuas;
Cada variável é representada por uma distribuição
estatística específica.
Como identificar essas causas?
Os gráficos de controle
nos ajuda a identificar as
causas, mas para isso,
eles se valem de
modelos estatísticos
específicos, dependentes
dos tipos de variáveis.
Como identificar essas causas?
O gráfico de individuais, por exemplo, utiliza a distribuição
normal para identificar pontos fora do comportamento
natural.
Como identificar essas causas?
Com base nas propriedades da distribuição, se formam
regras para identificação de conjuntos.
Uma observação além de um 
limite de controle.
Uma sequência de oito ou 
mais pontos acima ou 
abaixo da média.
Uma sequência de seis ou 
mais pontos crescentes ou 
decrescentes.
Como atuar sobre essas causas?
Dependendo do tipo de causa, devemos tomar um tipo de
ação:
Sofisticação estatística
A utilização de modelos estatísticos de maneira mais
aprofundada nos ajuda a entender como ações (variáveis de
entrada) impactam no comportamento do desempenho
(variáveis de saída).
Desempenho
Ação
Sofisticação estatística
No curso de Black Belt iremos aprofundar a teoria sobre
estes modelos estatísticos.
Desempenho
Ação
Use charts to explain your ideasRecapitulando…
VISÃO SISTÊMICA
A organização é um sistema composto 
de processos. Esses processos estão 
correlacionados. É preciso enxergar 
essa correlação.
TEORIA DO CONHECIMENTO
Precisamos saber como gerar 
conhecimento sobre o que estamos 
fazendo e saber como disseminá-lo 
para toda a empresa
ENTENDIMENTO DA VARIAÇÃO
Processos variam, indicadores variam. 
É necessário estudar e aprender com 
essa variação.
PSICOLOGIA
Empresas são feitas de pessoas. Cada 
um tem seus objetivos e ambições. 
Entendê-los é vital para o sucesso da 
organização.
Probabilidade 
e Inferência
Use charts to explain your ideasIncerteza e Intuição
Use charts to explain your ideasIncerteza e Intuição
Use charts to explain your ideasIncerteza e Intuição
• A intuição humana é mal adaptada a situações que
envolvem incertezas.
• Pesquisas recentes mostram que nossos processos
cerebrais são deficientes em situações que envolvem
o acaso.
• Processos aleatórios são fundamentais na natureza,
no cotidiano e na vida organizacional. Sendo assim,
necessitamos de técnicas que nos ajude a enfrenta-
los.
Use charts to explain your ideasEssas técnicas…
• A teoria atual da probabilidade veio se
desenvolvendo desde o século XVI (com Galileu e
Cardamo), teve grandes contribuições no século XVII
e XVIII (com Pascal, Fermat, Moivre e Bernoulli) e
continua até hoje a ser desenvolvido.
• Seu desenvolvimento teórico é muitas vezes
associado a jogos de azar (desde que os livros de
estatística contam a história de Chevalier de Mère,
que supostamente pediu ajuda a Pascal para ganhar
nos jogos de azar).
Use charts to explain your ideasAfinal, o que significa probabilidade?
• É uma medida de incerteza.
• A probabilidade de um evento é a chance numérica
de ocorrência do evento.
• É medida por um número que varia entre 0 e 1 (0 é a
probabilidade de um evento impossível e 1 é a
probabilidade de um evento certo).
Use charts to explain your ideasExperimento Aleatório
Um experimento cujo resultado não pode ser previsto
com certeza, antes do experimento ser rodado.
Exemplos:
• Saldo mensal - {lucro, breakeven, prejuízo}
• Tempo para realizar uma tarefa - {t:t>0}
• Número de cervejas consumidas em 1 semana:
{0, 1, 2, ... }
Use charts to explain your ideasEvento e espaço amostral
• Cada resultado possível de experimento aleatório é um evento
simples.
• O espaço amostral é a coleção de todos os eventos simples (ele
pode ser finito, infinito enumerável ou infinito não enumerável).
• Um evento é um subconjunto do espaço amostral (um conjunto 
com um ou mais eventos simples).
• O evento vazio é o conjunto com nenhum evento simples 
(conjunto vazio).
• A probabilidade de um evento é a soma das probabilidades dos 
eventos simples que formam o evento.
• A probabilidade do evento vazio é zero.
Use charts to explain your ideasTipos de probabilidade
• Clássica
• Frequentista
• Subjetiva
• Bayesiana
Use charts to explain your ideasProbabilidade clássica
Para eventos igualmente prováveis
S= {S1, S2, ..., Sn} é o espaço amostral
𝑃 𝑆𝑖 =
1
𝑛
onde 𝑃 simboliza a probabilidade e 𝑆𝑖 é o resultado de um 
experimento aleatório com 𝑛 resultados possíveis, 𝑖 = 1,… , 𝑛.
Seja um evento 𝐸 formado por 𝑚 eventos igualmente prováveis:
𝑃 𝐸 = 
𝑖=1
𝑚
1
𝑛
=
𝑚
𝑛
Use charts to explain your ideasProbabilidade clássica
Para eventos não necessariamente igualmente prováveis
S= {S1, S2, ..., Sn} conjunto de eventos possíveis
𝑃 𝑆𝑖 = 𝑝𝑖
onde 𝑝𝑖 é a probabilidade de ocorrência de 𝑆𝑖 , 𝑖 = 1, … , 𝑛 e 
calculável a partir de suposições.
Exemplo: 
Uma moeda com duas faces (Cara e Coroa) não equilibrada.
S={Cara, Coroa}
P(Cara)=P1, P(Coroa)=P2; P1P2
Use charts to explain your ideasProbabilidade clássica: cálculo
O cálculo da probabilidade pode ser simples: 
• Supomos um dado com seis faces. Qual a probabilidade de cada 
uma dessas faces? {1,2,3,4,5,6,}
𝑃 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜 = 𝑖 =
1
6
para 𝑖 = 1,… , 6
Evento 𝐸 = resultados pares
𝑃 𝐸 = 𝑃 2,4,6 =
1
6
+
1
6
+
1
6
=
1
2
Use charts to explain your ideasProbabilidade clássica: cálculo
Ou pode ser complexa:
• Supomos o jogo de poker com um baralho de 52 cartas. 
Sequencia real: 5 cartas seguidas do 
mesmo naipe do 10 ao Ás.
P (Sequencia real) = ?
Sequência de cor: 5 cartas seguidas do 
mesmo naipe.
P (Sequencia de cor) = ?
Use charts to explain your ideasCuidado!
Qual é a chance do primeiro bebê
que vai nascer mês que vem na
cidade de Manaus seja do sexo
masculino?
Nem sempre
Ter apenas dois resultados possíveis 
garante que as probabilidades sejam 
iguais!
Use charts to explain your ideasProbabilidade Frequentista
Seja 𝑅1, … , 𝑅𝑘 o conjunto de resultados possíveis de 
um experimento realizado 𝑛 vezes e que cada resultado 
ocorre 𝑛𝑖 vezes. Então
𝑃 𝑅𝑖 =
𝑛𝑖
𝑛
E
 
𝑛𝑖
𝑛
= 𝑝𝑖
Use charts to explain your ideasProbabilidade Subjetiva
A probabilidade subjetiva é a chance da ocorrência de
um evento segundo um indivíduo. Ela se baseia na
experiência, no domínio do assunto, no grau de
convicção ou simplesmente na expressão de um desejo
do indivíduo.
Exemplo:
Qual é a chance de você ser promovido?
Use charts to explain your ideasBayesiana
Exemplo: o caso de uma pessoa que surge no
mundo (talvez Adão, talvez alguém saído da caverna
de Platão) e vê o nascer do sol pela primeira vez. A
princípio, ele não sabe se é um fenômeno típico ou
algum episódio insólito. Porém, a cada dia que
sobrevive e vê o nascer do sol, aumenta sua
confiança de que se trata de uma característica
permanente da natureza. Aos poucos, por meio
dessa forma de dedução apenas estatística, a
probabilidade que ele aplica à previsão de que o sol
irá nascer no dia seguinte se aproxima de 100%,
embora nunca chegue a esse ponto.
Use charts to explain your ideasBayesiana )(
)(*)|(
)|(
BP
APABP
BAP 
O foco do teoremaé a probabilidade condicionada.
Ou seja, fala da probabilidade de uma teoria ou
hipótese ser verdadeira se tiver havido determinado
acontecimento. Vamos ao exemplo da história da
cueca encontrada no armário ao chegar de viagem.
Use charts to explain your ideasExercício!
A lei de Benford (descoberta por Simon Newcomb
observando tabelas de livros de logaritmo) sugere que a
porcentagem de ocorrência de números 1 a 9 na
primeira casa decimal dos resultados segue a seguinte
probabilidade:
Que tipo de probabilidade é esta?
Como isso poderia ser usado em negócios?
Prim
dígito
1 2 3 4 5 6 7 8 9
Freq Relat 0.301 0.176 0.125 0.097 0.079 0.067 0.058 0.051 0.046
Operações com conjuntos
Para entender os axiomas da probabilidade
Use charts to explain your ideasOperações básicas
A união de dois eventos A e B é o evento formado por todos os 
resultados que estão em A ou B.
• Notação: AB
A intersecção de dois eventos A e B é o evento formado por todos 
os resultados que estão em A e B.
• Notação: AB
O evento complementar de um evento A é formado pelos 
resultados que não estão em A.
• Notação: A´
• Dois eventos A e B tal que a intersecção deles é vazia são 
mutuamente excludentes ou disjuntos.
Use charts to explain your ideasRepresentação gráfica
AB
AB
A´
A
Use charts to explain your ideasAxiomas da probabilidade
Independente do tipo de probabilidade 
(clássica, subjetiva ou frequentista), algumas 
regras são válidas para se manipular e analisar 
probabilidades.
Use charts to explain your ideasAxiomas da probabilidade
1. P (S) = 1, S o espaço amostral
2. Qualquer que seja o evento 𝐴 0 ≤ 𝑃 𝐴 ≤ 1
0 ≤ 𝑃 𝐴 ≤ 1
3. Se A 1 e A 2 são dois eventos que disjuntos 𝐴1 ∩ 𝐴2 = ∅ , então
𝑃(𝐴1 ∪ 𝐴2) = 𝑃(𝐴1) + 𝑃( 𝐴2)
Generalizando, se A1, A2, ... , Ak são eventos mutuamente disjuntos, então
𝑃(𝐴1 ∪ 𝐴2 ∪ … ∪ 𝐴𝑘 ) = 𝑃(𝐴1) + 𝑃(𝐴2) + … + 𝑃( 𝐴𝑘)
4. Se A1 e A2 são dois eventos quaisquer, então
𝑃(𝐴1 ∪ 𝐴2) = 𝑃(𝐴1) + 𝑃( 𝐴2) − 𝑃(𝐴1 ∩ 𝐴2)
Use charts to explain your ideasNotação
Denotaremos eventos por letras maiúsculas 𝐴, 𝐵,…
Seja 𝐴 um evento
Ex1: 𝐴: evento dos números pares no jogo de dados
𝐴 = 2, 4, 6
Ex2: 𝐴: evento onde o tempo para responder a uma solicitação de 
crédito é maior que 9 dias úteis
𝐴 = 𝑡: 𝑡 > 9
Distribuições de probabilidade
Use charts to explain your ideasVariável Aleatória
Uma variável aleatória (v.a.) é uma função que atribui um número 
real a cada resultado do espaço amostral de um experimento 
aleatório
Variável aleatória discreta
• Assume valores em um conjunto finito ou infinito enumerável
Variável aleatória contínua
• Assume valores em um intervalo finito ou infinito de números 
reais
Notação: em geral a v.a. é denotada por uma letra maiúscula do 
final do alfabeto (X, Y, Z, …);
Use charts to explain your ideasExemplo
Um garoto conta estrelas e as classifica conforme o seu brilho. As
classificações podem ser colocadas como “muito brilhante”, “com
brilho médio” e “pouco brilhantes”.
X é a variável aleatória que que define o problema acima. (-1 para
pouco brilho, 0 para brilho médio e 1 para muito brilhantes. A
distribuição de X fica como:
Classificação Porcentagem
Muito brilhante 10%
Brilho médio 70%
Pouco brilhantes 20%
X Prob
-1 0.2
0 0.7
1 0.1
Use charts to explain your ideasDistribuição de probabilidade discreta
Exemplo: em um censo é coletado o número de filhos do casal:
Para uma família escolhida ao acaso, qual a probabilidade que ela 
tenha 2 filhos?
Nº de Filhos %.
0 10%
1 30%
2 35%
3 20%
4 5%
Use charts to explain your ideasDistribuição de probabilidade discreta
Para uma variável aleatória discreta X com valores x1, x2, 
..., xn a distribuição de probabilidade é dada por:
𝑓(𝑥𝑖) = 𝑃(𝑋 = 𝑥𝑖)
A distribuição de probabilidade satisfaz
 𝑓 𝑥𝑖 = 1
Use charts to explain your ideasDistribuição de probabilidade discreta
Seja 𝑋 o número de filhos do casal;
• 𝑋 = {0, 1, 2, 3, 4}
• 𝑃(𝑋 = 𝑥𝑖) = {0.1, 0.3, 0.35, 0.20, 0.05}, para 𝑥𝑖 =
0, 1, 2, 3, 4
• 𝑋 é uma v.a. discreta
• 𝑃 𝑋 = 𝑖 = 1
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
P
(X
)
0 1 2 3 4
X
Média e variância populacional
Use charts to explain your ideasMédia ou valor esperado
Seja 𝑋 v.a. discreta com distribuição {𝑥𝑖 , 𝑃(𝑥𝑖); 𝑖 =
1,2,… 𝑛}, onde 
𝑃(𝑥𝑖) = 𝑃(𝑋 = 𝑥𝑖)
então, 
E X = 𝑀é𝑑𝑖𝑎 𝑋 = (𝑣𝑎𝑙𝑜𝑟 × 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒), 
ou
𝐸 𝑋 = 𝜇 = 
𝑖=1
𝑛
𝑥𝑖𝑃 𝑥𝑖
Use charts to explain your ideasExercício
Uma empresa de seguros vende uma apólice para 1500
proprietários de um modelo de bicicleta mountain bike que protege
contra roubo por dois anos. O custo de reposição dessa bicicleta é
R$500,00. Suponha que a probabilidade de um indivíduo ser
roubado durante o período de proteção é 0.15. Assuma que a
probabilidade de mais de um roubo por indivíduo é zero e que os
eventos são independentes.
a. Qual é o preço de venda da apólice para que haja um equilíbrio
para a empresa(ganho zero, perda zero)?
b. Se a probabilidade de roubo for 0.10, qual é o ganho esperado
por apólice dado o valor de venda determinado em (a)?
Use charts to explain your ideasAplicação em processos decisórios
Uma fábrica de móveis deve decidir se realiza uma ampliação da
capacidade instalada agora ou se aguarda mais um ano.
Uma análise econômica diz que se ela expande agora e as
condições econômicas permanecerem boas, ela realizará um lucro
de R$328.000,00 no próximo ano; caso haja uma recessão, ela terá
um prejuízo de R$80.000,00.
Se ela adia a expansão para o próximo ano, ela terá um lucro de
R$160.000,00 se as condições permanecerem boas e terá um lucro
de R$16.000,00 se houver recessão.
Se as chances de que ocorra uma recessão é de 2/3, qual é a
decisão que maximiza seu lucro?
Use charts to explain your ideasPropriedades da média
Seja 𝑎 e 𝑏 duas constantes e 𝑋 e 𝑌 duas variáveis 
aleatórias. Então:
• 𝐸(𝑎) = 𝑎
• 𝐸(𝑏𝑋) = 𝑏𝐸(𝑋)
• 𝐸(𝑎 + 𝑋) = 𝑎 + 𝐸(𝑋)
• 𝐸(𝑎𝑋 + 𝑏𝑌) = 𝑎𝐸(𝑋) + 𝑏𝐸(𝑌)
Use charts to explain your ideasVariância
Fornece uma medida de dispersão (variação) dos 
valores em torno da média
𝑉𝑎𝑟 𝑋 = 𝜎2 = 𝑥𝑖 − 𝜇
2𝑃 𝑥𝑖
𝐷𝑒𝑠𝑣𝑖𝑜𝑃𝑎𝑑𝑟ã𝑜 𝑋 = 𝜎 = 𝑉𝑎𝑟 𝑋
Pode-se mostrar que:
𝑉𝑎𝑟 𝑋 = 𝐸 𝑋2 − 𝐸 𝑋 2
onde 𝐸 𝑋2 = 𝑥𝑖
2𝑃 𝑥𝑖
Use charts to explain your ideasPropriedades da variância
Seja a e b duas constantes e 𝑋 e 𝑌 duas variáveis 
aleatórias. Então:
• 𝑉𝑎𝑟 𝑋 ≥ 0
• 𝑉𝑎𝑟(𝑎) = 0
• 𝑉𝑎𝑟(𝑎 + 𝑋) = 𝑉𝑎𝑟(𝑋)
• 𝑉𝑎𝑟(𝑏𝑋) = 𝑏2𝑉𝑎𝑟(𝑋)
• 𝑉𝑎𝑟 𝑎 + 𝑏𝑋 = 𝑏2𝑉𝑎𝑟 𝑋
• 𝑉𝑎𝑟 𝑋 ± 𝑌 = 𝑉𝑎𝑟 𝑋 + 𝑉𝑎𝑟 𝑌 ,
𝑠𝑒 𝑋 𝑒 𝑌 𝑠ã𝑜 𝑒𝑠𝑡𝑎𝑡í𝑠𝑡𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒𝑠
Use charts to explain your ideasPropriedades da variância
Um sistema de envasamento consiste em encher um 
vidro com líquido. Os vidros utilizados tem peso médio 
de 20g e desvio padrão 0.5g. 
A quantidade de líquido em peso que é colocada no 
litro pode ser regulada, sendo o valor nominal igual a 
185g. 
O desvio padrão do sistema de envasamento é 2g. 
Qual é o peso médio e o desvio padrão do vidro cheio?
Modelos 
probabilísticos
Use charts to explain your ideasModelos probabilísticos
Modelos são usados em todas as áreas da ciência para
representar o mundo natural, simplificando-os, mas
mantendo suas principais propriedades.
“Todos os modelos estão errados, porém, alguns são
úteis”
George Box
Use charts to explain your ideasDistribuição discreta uniforme
O modelo mais simples de distribuição discreta é o 
uniforme:
f(x) = 1/n
sendo n= número de valores que a variável aleatóriapode assumir
Use charts to explain your ideasEnsaios de Bernoulli
Considere 𝑛 repetições sucessivas de um ensaio (ou teste) com 
apenas dois resultados possíveis que respeite as seguintes regras:
a) Em cada ensaio podem ocorrer somente dois resultados 
possíveis (Sucesso (S) e Fracasso (F)).
b) Para cada ensaio, a probabilidade de que ocorra um 
Sucesso, denotada por 𝑃(𝑆), é a mesma, e é denotada por p, 
ou seja, 𝑃(𝑆) = 𝑝. A probabilidade de um Fracasso, 𝑃(𝐹), é 
dada por 1 − 𝑝, ou seja, 𝑃(𝐹) = 1 − 𝑝. A quantidade 1 − 𝑝 é 
denotada por 𝑞. Temos então 𝑝 + 𝑞 = 1.
c) Cada ensaio é independente.
Use charts to explain your ideasEnsaios de Bernoulli
Se associarmos ao evento S o valor de 1 e ao evento F o 
valor 0, a distribuição de probabilidade de X é:
Além disso:
a) 𝐸(𝑋) = 0 ∗ (1 − 𝑝) + 1 ∗ 𝑝 = 𝑝
b) 𝑉𝑎𝑟 𝑋 = 𝐸 𝑋2 − 𝐸 𝑋 2
= 02 ∗ 1 − 𝑝 + 12 ∗ 𝑝 + 𝑝2
= 𝑝(1 − 𝑝)
X P(X)
0 1-p
1 p
Use charts to explain your ideasExperimento Binomial
Um experimento Binomial obedece as seguintes 
propriedades
1. O experimento consiste de um sequencia de n 
ensaios idênticos
2. Dois resultados são possíveis em cada ensaio: 
Sucesso e Fracasso (Ensaio de Bernoulli)
3. p = P(S) não muda de ensaio para ensaio
4. Os ensaios são independentes
Use charts to explain your ideasDistribuição Binomial
Considere um experimento Binomial:
• Seja X o número de Sucessos nos n ensaios
• A variável 𝑋 pode assumir os valores 0,1,2, . . , 𝑛.
Então, 
𝑃 𝑋 = 𝑚 =
𝑛
𝑚
𝑝𝑚 1 − 𝑝 𝑛
onde 
𝑛
𝑚
=
𝑛!
𝑚! 𝑛−𝑚 !
, para 𝑚 = 0,1,2,… , 𝑛
Denotamos 𝑋~𝐵𝑖𝑛 𝑛, 𝑝
Use charts to explain your ideasO triângulo de Pascal
Linha
0 1
1 1 1
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
8 1 8 28 56 70 56 28 8 1
9 1 9 36 84 126 126 84 36 9 1
10 1 10 45 120 210 252 210 120 45 10 1
Use charts to explain your ideasO triângulo de Pascal
Use charts to explain your ideasPropriedades da B(n,p)
1. 𝐸 𝑋 = 𝜇 = 𝑛𝑝
2. 𝑉𝑎𝑟 𝑋 = 𝜎2 = 𝑛𝑝 1 − 𝑝
Se definirmos p=
 𝑋𝑖
n =
 X, então
1. 𝐸 𝑝 = 𝐸 𝑋 = 𝑝
2. 𝑉𝑎𝑟( 𝑝) = 𝑉𝑎𝑟 𝑋 =
𝑝(1−𝑝)
𝑛
Use charts to explain your ideasExemplo
Um processo está produzindo garrafas de vidro em uma linha de
produção continua. A história passada mostra que 1% das garrafas
tem uma ou mais falhas. Se retirar uma amostra de 10 unidades do
processo, qual é a probabilidade de que haverá 0 garrafas não
conformes?
n = 10
p = 0,01
m = 0
 
  %4,9001,0101,0.
0
10
)(
1.)(
100 













xp
pp
m
n
xp
nm
Use charts to explain your ideasExercício
Um gerente de conta especial faz vinte ligações por dia para
clientes para oferecer um novo produto. De experiência passada
ele estima que a chance de vender o produto para um cliente é
0.10.
a) Se sua meta diária é realizar 4 vendas, qual é a probabilidade
que ele atinja a meta em um determinado dia?
b) Qual é o número médio de vendas que ele realiza por dia?
c) Qual é o desvio padrão do número de vendas?
d) Qual é o valor mais provável de venda?
Use charts to explain your ideasDistribuição de Poisson
Um evento S ocorre no tempo (ou espaço) obedecendo 
os seguintes postulados:
a) Independência: o número de vezes que S ocorre em
qualquer intervalo de tempo é independente do número de
ocorrências de S em qualquer outro intervalo de tempo
disjunto.
b) Falta de agrupamento: a chance de duas ou mais
ocorrências de S simultâneas pode ser assumida como
sendo zero.
c) Razão: a número médio de ocorrências de S por unidade de
tempo é uma constante, denotada por l, e ela não muda com
o tempo.
Use charts to explain your ideasDistribuição de Poisson
Seja X o número de ocorrências de S por unidade de 
tempo. Se os postulados anteriores são válidos, então 
𝑋~𝑃 𝜆 e
𝑃 𝑋 = 𝑥 =
𝑒−𝜆𝜆𝑥
𝑥!
, 𝑥 = 0,1,2, . . .
onde 𝜆 é o parâmetro que indica o número médio de 
ocorrências de X em um intervalo de tempo unitário
Use charts to explain your ideasPropriedades da distribuição de Poisson
Então temos que:
1. E X = λ
2. Var X = λ2
Use charts to explain your ideasExemplo
Uma linha de produção está fabricando mísseis guiados. Quando
cada míssil é concluído, uma auditoria é conduzida por um
representante da Força Aérea e todas as não-conformidades são
anotadas. Mesmo que apenas não conformidades maiores sejam
motivo de rejeição, o contratante principal quer controlar não-
conformidades menores também. Então, problemas menores como
letras borradas, pequenas rebarbas, etc., são registrados durante a
auditoria. Os dados históricos mostram que, em média, cada míssil
tem 3 não-conformidades menores. Qual é a probabilidade de que
o próximo míssil terá 0 não conformidades?
x = 0
λ = 3
%5
!0
)3(
)(
03



e
op
Use charts to explain your ideasExercício!
Ao enlatar leite em pó, é necessário acrescentar um dosador. A não
inclusão do dosador é considerada uma falha. O número de falhas
que ocorrem em um lote produzido tem distribuição de Poisson
com número médio de falhas igual a 5.
1. Qual é a probabilidade que em um lote:
a) Uma lata esteja sem o dosador?
b) Duas ou mais latas estejam sem o dosador?
2. Qual é o número mais provável de falhas que ocorrem em um
lote?
Distribuições para variáveis aleatórias contínuas
Use charts to explain your ideasVariável aleatória contínua
Em um Call Center o tempo de atendimento de um
cliente é monitorado. Os valores possíveis são em
princípio, infinitos dentro de um intervalo (a,b), a<b.
Nesse caso, não faz sentido perguntar qual é a
probabilidade de que o tempo de atendimento seja
igual a um valor to . Na realidade, essa probabilidade é
igual a zero.
O que se pode perguntar é qual é a probabilidade que o
tempo de atendimento esteja dentro de um intervalo
(x,y), ou seja, P(x<t<y)
Use charts to explain your ideasVariável aleatória contínua
A figura abaixo mostra o histograma de amostras de tamanho 20,
100, 1000 e 10000 da mesma distribuição com uma função
contínua f(x) aproximando o histograma. Observe que quanto maior
o tamanho da amostra, melhor a aproximação. A porcentagem de
valores abaixo de 9 é aproximada pela área sob a curva à esquerda
de 9. Quanto maior o tamanho da amostra, melhor a aproximação.
%(t < 9) ≅ −∞
9
𝑓 𝑥 𝑑𝑥
Use charts to explain your ideasVariável aleatória contínua
Valores % de valores 
(histograma)
Probabilidade
(distribuição)
(Y < 60) 𝑃 𝑌 < 60 = 0.185 P( Y < 60) = 0.167
(Y >70 𝑃 𝑌 > 70 = 0.140 P (Y > 70) = 0.146
60 ≤ y ≤70 𝑃 60 ≤ 𝑦 ≤ 70
= 0.675
P(60 ≤ y ≤70) = 
0.687
Use charts to explain your ideasFunção densidade de probabilidade
Propriedades da f.d.p.
1. 𝑓 𝑥 ≥ 0, ∀ 𝑥
2. A área sob a curva definida por f(x) é igual a 1, ou 
seja,
 
−∞
∞
𝑓 𝑥 𝑑𝑥 = 1
3. 𝑃(𝑎 ≤ 𝑥 ≤ 𝑏) =
á𝑟𝑒𝑎 𝑠𝑜𝑏 𝑎 𝑐𝑢𝑟𝑣𝑎 𝑒𝑛𝑡𝑟𝑒 𝑜𝑠 𝑝𝑜𝑛𝑡𝑜𝑠 𝑎 𝑒 𝑏, ou seja,
 
𝑎
𝑏
𝑓 𝑥 𝑑𝑥
Use charts to explain your ideasFunção densidade de probabilidade
Propriedades da f.d.p.
Onde:
μ = média ou mediana da população
σ = é o desvio padrão da população
Use charts to explain your ideasFunção distribuição acumulada
Se 𝑋 é um v.a. contínua a função de distribuição 
acumulada (fda) é 𝐹(𝑥) = 𝑃(𝑋 <= 𝑥).
Propriedades
1. 𝐹(𝑥) é uma função não decrescente de 𝑥
2. 𝐹 −∞ = 0
3. 𝐹 ∞ = 1
Use charts to explain your ideasMédia e variância de v.a. contínuas
• Uma variável aleatória contínua 𝑋, em geral, também
tem uma média e uma variância com o mesmo
significado e as mesmas interpretações discutidas
anteriormente para o caso discreto, mas o seu cálculoenvolve integrais e não serão objeto de nosso
trabalho aqui.
• Para as distribuições que estudaremos aqui, a média
e a variância serão fornecidas em cada caso.
Use charts to explain your ideasA distribuição normal (Gaussiana)
Dentre as muitas distribuições contínuas usadas em estatística, a
mais importante é a Distribuição Normal ou Gaussiana.
Ela tem a forma de um sino e está associada com os nomes de
Pierre Laplace e Carl Gauss.
Seu estudo remonta ao século XVIII
Use charts to explain your ideasA distribuição normal (Gaussiana)
Importância
• O “teorema central do limite”.
• A robustez ou insensibilidade dos procedimentos
estatísticos mais comumente usados a desvios da
suposição de distribuição normal.
Use charts to explain your ideasTeorema Central do Limite
Independentemente da forma da distribuição da
população ou universo, a distribuição dos valores
médios das amostras colhidas a partir desse universo
tenderá a uma distribuição normal a medida que o
tamanho da amostra for crescendo.
Pode também ser demonstrado que a média das
médias das amostras será igual à média do universo e
que o desvio padrão das médias será igual ao desvio
padrão do universo dividido pela raiz quadrada do
tamanho da amostra.
Use charts to explain your ideasTeorema Central do Limite
Seja 𝜀 o erro “total” de medição.
Sob certas condições, geralmente encontradas no
mundo da experimentação, podemos escrever 𝜀 como a
soma dos seus componentes
𝜀 = 𝑎1𝜀1 + ⋯+ 𝑎𝑛𝜀𝑛
Exemplo:
𝜀: 𝑒𝑟𝑟𝑜 𝑛𝑎 𝑚𝑒𝑑𝑖çã𝑜 𝑑𝑎 𝑎𝑙𝑡𝑢𝑟𝑎 𝑑𝑒 𝑢𝑚𝑎 𝑝𝑒𝑠𝑠𝑜𝑎
𝜀1: 𝑒𝑟𝑟𝑜 𝑑𝑒 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑔𝑒𝑚
𝜀2: 𝑒𝑟𝑟𝑜 𝑎𝑛𝑎𝑙í𝑡𝑖𝑐𝑜
𝜀3: 𝑒𝑟𝑟𝑜 𝑑𝑜 𝑠𝑖𝑠𝑡𝑒𝑚𝑎 𝑑𝑒 𝑚𝑒𝑑𝑖çã𝑜
etc...
Use charts to explain your ideasO teorema central do limite
Imagine o lançamento de dados. Qual é a probabilidade
para a média do valor dos dados?
Use charts to explain your ideasTeorema Central do Limite
Resultado Importante:
Seja X1, X2, ..., Xn uma amostra aleatória de uma variável aleatória X 
com média , variância 2 e distribuição F(x) e seja a média da 
amostra dada por
 𝑋 = 
𝑋𝑖
𝑛
Então a distribuição de 𝑋 converge para a distribuição Normal com 
média  e variância 2/n, ou seja,
 𝑋~𝑁 𝜇,
𝜎2
𝑛
Use charts to explain your ideasSuposição de normalidade
Muitas técnicas estatísticas são derivadas da suposição
de normalidade das observações originais.
Em muitos casos, aproximação, em vez de normalidade
exata, é tudo que se requer para que estes métodos
sejam aplicáveis.
Considerando isto, eles são ditos robustos à não-
normalidade.
Desta forma, a menos que seja especificamente
alertado, não se deve ter excessiva preocupação acerca
de normalidade exata.
Use charts to explain your ideasA distribuição normal
Muitas características de qualidade contínuas tem
distribuição razoavelmente simétrica e podem ser
aproximadas por uma curva em forma de sino
conhecida como Curva Normal, que corresponde à
distribuição Normal ou Gaussiana. A função da
densidade de probabilidade é dada pela equação:
Use charts to explain your ideasA distribuição normal
Muitas características de qualidade contínuas tem distribuição
razoavelmente simétrica e podem ser aproximadas por uma curva
em forma de sino conhecida como Curva Normal, que corresponde
à distribuição Normal ou Gaussiana;
De
ns
ity
207205204203202201200199198197196195
0.4
0.3
0.2
0.1
0.0
Normal 
Use charts to explain your ideasDefinição da Curva Normal
Toda Curva Normal é definida por dois números:
1) Média: medida do centro.
2) Desvio padrão: medida de dispersão.
Use charts to explain your ideasPropriedades da Curva Normal
Para qualquer curva normal, temos:
Use charts to explain your ideasPropriedades da Curva Normal
Quando X~𝑁(0,1) , chamamos distribuição normal
padrão e as probabilidades encontram-se tabeladas
Softwares, como o Excel, também possuem fórmulas
que realizam esse cálculo
Use charts to explain your ideas
Propriedades da Curva Normal com a 
𝑁 𝜇, 𝜎2
Seja 𝑋~𝑁 𝜇, 𝜎2 :
Considere 𝑍 = 𝑋−𝜇
𝜎
. Pode-se mostrar que 𝑍 tem 
distribuição normal e
𝐸 𝑍 = 𝐸
𝑋 − 𝜇
𝜎
=
1
𝜎
𝐸 𝑋 − 𝜇 = 0
𝑉𝑎𝑟 𝑍 = 𝑉𝑎𝑟
𝑋 − 𝜇
𝜎
=
1
𝜎2
𝑉𝑎𝑟 𝑋 =
𝜎2
𝜎2
= 1
Portanto, 𝑍~𝑁 0,1
Use charts to explain your ideas
Propriedades da Curva Normal com a 
𝑁 𝜇, 𝜎2
Se quisermos calcular 𝑃(𝑋 < 𝑏) fazemos:
𝑃 𝑋 < 𝑏 = 𝑃
𝑋 − 𝜇
𝜎
<
𝑏 − 𝜇
𝜎
= 𝑃 𝑍 < 𝑧0
onde 𝑧0 =
𝑏−𝜇
𝜎
Procuramos na tabela 𝑁(0,1) o valor 𝑧0
Use charts to explain your ideasExemplo
O diâmetro de uma peça pode ser aproximado pela distribuição Normal
com média 0.2508 e desvio padrão 0.0005. A especificação para do
diâmetro da peça é 0.2500±0.0015. Qual é a proporção de peças que são
produzidas dentro da especificação? 92%0.919240.000000.91024
4.6)P(Z1.4)P(Z1.4)Z4.6P(
0.0005
0.2508-0.2515
Z
0.0005
0.2508-0.2485
P0.2515)XP(0.2485


 





Use charts to explain your ideasPropriedades da Curva Normal
O seguinte resultado é útil quando temos de trabalhar com a soma 
de duas ou mais variáveis aleatórias Normais.
Se Xi ~ N(μi,σi2) , i=1,2,...,n são variáveis aleatórias independentes e a1, 
a2, ... an constantes. Então
 𝑎𝑖𝑋𝑖 ~𝑁 𝑎𝑖 𝜇𝑖 , 𝑎𝑖
2𝜎𝑖
2
ou seja, a combinação de variáveis com distribuição Normal 
também tem distribuição Normal.
Use charts to explain your ideasExemplo Prático
Suponha verificamos a resistência à ruptura de um processo de
colagem fio de ouro usado na produção de um microcircuito e
descobrimos que a força média do processo é 9 e o desvio padrão
é de 4. O processo de distribuição é normal. Se a especificação de
engenharia é de no mínimo 3, qual a percentagem do processo
estará abaixo da especificação inferior?
Como nossos dados partiram de um amostra, utilizamos:
Da tabela Sigma, para Z=-1,5, temos a probabilidade de que 6,68%
da área seja menor que o valor de Z.
Use charts to explain your ideasExercício!
O peso bruto de um produto é a soma do peso líquido mais o peso
da embalagem. Suponha que a máquina que embala o produto é
tal que o peso líquido colocado na embalagem tem distribuição
Normal com média igual a 300 g e desvio padrão igual a 2 gramas.
O peso da embalagem tem distribuição Normal com média igual a
5 g e desvio padrão igual a 0.5 g.
a) Qual é a distribuição do peso bruto do produto?
b) Qual dos dois processos é mais preciso?
Use charts to explain your ideasDistribuição exponencial
A distribuição exponencial é muito utilizada quando trabalhamos com 
tempo para ocorrência de um evento, por exemplo, tempo para 
atendimento de uma chamada)
𝑓 𝑥 = 𝛼𝑒−𝛼𝑥
onde x 0
1086420
2.0
1.5
1.0
0.5
0.0
X
De
ns
ity
0.5
1
2
Alfa
Distribution Plot
Exponential
Use charts to explain your ideasDistribuição exponencial
A função distribuição acumulada é dada por:
𝐹 𝑥 = 𝑃 𝑋 ≤ 𝑥 = 1 − 𝑒 
−𝑥
𝛼
1086420
1.0
0.8
0.6
0.4
0.2
0.0
x
F(
x)
Distribuição Exponencial: Função Distrib. Acum.
Use charts to explain your ideasPropriedades da distribuição exponencial
Se 𝑋~𝐸𝑥𝑝 𝛼 , então:
• 𝐸 𝑋 =
1
𝛼
• 𝑉𝑎𝑟 𝑋 =
1
𝛼2
Use charts to explain your ideasRelação entre Poisson e Exponencial
Quando usamos a distribuição de Poisson para modelar,
por exemplo, o número de ligações em um intervalo de
tempo é possível mostrar que o tempo entre duas
ligações sucessivas terá distribuição exponencial, ou
seja, sob certas condições:
Seja 𝑋: o número de chamadas e 𝑌: tempo entre essas
chamadas
𝑋~𝑃 𝜆 ⇔ 𝑌~𝐸𝑥𝑝 𝜆
Use charts to explain your ideasExemplo
A companhiade água da cidade A, registra uma média
de 500 vazamentos no sistema por ano. Qual é a
probabilidade de que a equipe que trabalho aos finais
de semana, das 18:00 da sexta-feira até as 6:00 da
segunda-feira, não tenha nenhuma chamada?
Comecemos por converter 500 vazamentos por ano para horas. Deste
modo, podemos esperar que a cada (8670 horas)/ 500 vazamentos = 17,52
horas a cada vazamento, Se a equipe irá trabalhar por 60 horas, temos: %7,961)60( 52,1760  exp
A equipe poderá ficar tranquila em 3,3% dos finais de semana
Use charts to explain your ideasExercício 
Suponha que o tempo entre duas ligações seja
modelada por uma distribuição exponencial de
parâmetro 1 minuto.
Qual a chance de não acontecerem mais do que 3
ligações em um minuto?
Inferência 
sobre a forma
Use charts to explain your ideasInferência
O termo inferência é definido como:
1. ato ou processo de derivar conclusões lógicas das premissas
conhecidas ou assumidas como verdade, ou
2. ato de raciocínio lógico a partir de conhecimento ou baseado em
evidências factuais. A inferência estatística proporciona
informações que são usadas no processo inferir ou predizer sobre
algo.
Na maioria das aplicações práticas da estatística enumerativa,
como o Seis Sigma, nós fazemos inferências sobre populações com
base nos dados de uma amostra.
Use charts to explain your ideasInferência
Considere uma população ou um processo e uma variável de 
interesse medida em uma amostra.
Os dados da amostra podem ser usados para realizar inferências 
sobre a população ou o processo.
As características (parâmetros) de interesse são em geral:
• A forma da distribuição da variável
• A média
• O desvio padrão
Use charts to explain your ideasInferência sobre a forma
O objetivo é identificar se existe uma distribuição
conhecida que pode ser usada para aproximar a
distribuição dos valores, como por exemplo a
Distribuição Normal, ou Log Normal, ou Weibull.
Isso pode ser feito ajustando-se o gráfico probabilístico
de uma determinada distribuição aos dados. Caso o
gráfico seja aproximadamente uma reta, a distribuição
correspondente pode ser usada.
Use charts to explain your ideasInferência sobre a forma
Uma empresa monitorou o tempo gasto para atender uma
chamada de um cliente em um call center. Trinta atendimentos
forma medidos. Os dados obtidos encontram-se na tabela abaixo.
Chamada Tempo Chamada Tempo Chamada Tempo 
1 2.53 11 5.57 21 4.81 
2 5.52 12 4.60 22 4.82 
3 3.53 13 3.84 23 7.19 
4 3.26 14 5.37 24 2.39 
5 6.31 15 3.42 25 5.52 
6 4.04 16 4.51 26 5.01 
7 4.09 17 1.84 27 1.94 
8 1.22 18 6.89 28 4.60 
9 3.42 19 3.53 29 2.35 
10 5.01 20 6.75 30 2.07 
 
Use charts to explain your ideasGráfico probabilístico
O gráfico Probabilístico Normal indica que a distribuição Normal é
adequada para descrever a distribuição do tempo de atendimento.
tempo de atendimento
Pe
rc
en
t
1086420
99
95
90
80
70
60
50
40
30
20
10
5
1
Mean 4.198
StDev 1.588
N 30
AD 0.222
P-Value 0.813
Probability Plot of tempo de atendimento
Normal - 95% CI
Use charts to explain your ideasEstabilidade e normalidade
Observation
In
di
vi
du
al
 V
al
ue
28252219161310741
10
8
6
4
2
0
_
X=4.20
UCL=9.65
LCL=-1.25
I Chart of tempo de atendimento
tempo de atendimento
Pe
rc
en
t
87654321
30
25
20
15
10
5
0
Mean 4.198
StDev 1.588
N 30
Histogram of tempo de atendimento
Normal 
Não há evidência de que o
processo não esteja sob
controle
O gráfico sugere que a distribuição
Normal é adequada para descrever a
distribuição do tempo de
atendimento
Use charts to explain your ideasInferência sobre a forma
A inferência sobre a média e o desvio padrão da população pode 
ser feita de três formas:
• Estimação pontual
• Intervalo de confiança
• Teste de hipóteses
Obs.: 
• Essas inferências só fazem sentido se os dados se ajustam a 
uma distribuição e se o processo está estável.
• É importante fazer inicialmente o gráfico de controle e em 
seguida o gráfico probabilístico.
Use charts to explain your ideasEstimação pontual
Representa-se os valores de uma amostra de tamanho n por x1, x2, 
... , xn.
A estimação pontual da média e do desvio padrão da população
são dados pela média amostral e pelo desvio padrão
respectivamente: 1n
)x(x
s :Padrão Desvio
n
x
x :Média
2
i
i






Use charts to explain your ideasIntervalo de confiança para média
A estimação pontual não fornece informação sobre a precisão da
estimativa.
A precisão de uma estimativa pode ser medida através da margem
de erro.
A margem de erro da estimativa pontual da média é dada por:
 *2M.E.
n
s

Use charts to explain your ideasIntervalo de confiança para média
) 
n
s
* tx , 
n
s
*tx( 1)(n0.025,1)(n0.025,  
 
n
s
*t*2 1)(n0.025, 
t0.025,(n-1) é o percentil 2.5% da distribuição t-Student
com (n-1) graus de liberdade.
A amplitude do intervalo de confiança é dada por:
Um intervalo de confiança de 95% para a média populacional é 
dado por:
Use charts to explain your ideasIntervalo de confiança para desvio padrão








2
0.975
2
0.025 χ
1)-(n
s , 
χ
1)-(n
s
X20.025,(n-1) e X20.025,(n-1) são os percentis 2.5% e 97.5% 
respectivamente da distribuição Qui-quadrado com 
(n-1) graus de liberdade
Um intervalo de confiança de 95% para o desvio padrão
populacional é dado por:
Use charts to explain your ideasExemplo no Minitab
7654321
Median
Mean
5.004.754.504.254.003.753.50
1st Q uartile 3.0775
Median 4.3000
3rd Q uartile 5.4075
Maximum 7.1900
3.6055 4.7912
3.4452 4.9665
1.2644 2.1342
A -Squared 0.22
P-V alue 0.813
Mean 4.1983
StDev 1.5876
V ariance 2.5205
Skewness 0.026119
Kurtosis -0.694410
N 30
Minimum 1.2200
A nderson-Darling Normality Test
95% C onfidence Interv al for Mean
95% C onfidence Interv al for Median
95% C onfidence Interv al for StDev
95% Confidence Intervals
Summary for tempo de atendimento
Teste de hipóteses
Use charts to explain your ideasTeste de Hipóteses
A inferência estatística geralmente envolve 4 passos:
1. Formulação de hipóteses sobre a população ou o 
estado da natureza;
2. Coletar uma amostra de observações da população;
3. Cálculo das estatísticas baseados na amostra;
4. Aceitar ou refutar a hipótese com base num critério 
de aceitação pré-determinado.
Por isto, testar hipótese é tão importante
Use charts to explain your ideasExemplo: trajeto
• Você utiliza um determinado trajeto para o trabalho 
todos os dias.
• Você coleta os tempos de deslocamento dos últimos 
2 anos.
Use charts to explain your ideasExemplo: trajeto
• Um colega lhe propõe um novo trajeto
(supostamente mais rápido).
• Passo 1: formalização do teste:
𝐻0: 𝜇 ≥ 30 𝑣𝑠. 𝐻𝐴: 𝜇 < 30
Use charts to explain your ideasExemplo: trajeto
No dia seguinte você utiliza o trajeto sugerido e 
gasta 29 minutos...
Qual a sua decisão?
Devemos coletar mais dados!
Use charts to explain your ideasExemplo: trajeto
• 9 observações são coletadas 𝑋 = 29.
• 𝑝𝑟𝑒𝑐𝑖𝑠ã𝑜 ≈
1
𝑞𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎çã𝑜
=
1
𝜎
• A precisão de 𝑋 pode ser calculado como:
𝜎 𝑋 = 𝑉𝑎𝑟 𝑋 = 𝑉𝑎𝑟
1
𝑛
 𝑋𝑖 =
𝜎
𝑛
• Quanto maior a amostra, maior a precisão!
Use charts to explain your ideasExemplo: trajeto
Critério: 𝐶∗ = 𝑋 − 𝜇
Precisamos corrigir o critério pela precisão
𝐶 =
 𝑋 − 𝜇
𝜎/ 𝑛
Supondo 𝜎 = 1
𝐶 =
29 − 30
1/ 9
= −3
Qual a sua decisão?𝐶 esta suficientemente afastado?
Use charts to explain your ideasExemplo: trajeto
Como visto anteriormente, 𝑋~𝑁 0,1/3 ⇒ 𝐶~𝑁 0,1
Calculamos 𝑃(𝐶 < −3) utilizando a tabela da 𝑁 0,1 .
Quanto menor for 𝑃(𝐶 < −3) maior a evidência de 𝐻𝐴 e, 
portanto, rejeitamos 𝐻0.
-3 0
Use charts to explain your ideasExemplo: trajeto
Dessa forma completamos os 4 passos:
1. Teste: 𝐻0: 𝜇 = 30 𝑣𝑠. 𝐻𝐴: 𝜇 < 30
2. Critério: 𝐶 =
 𝑋−𝜇
𝜎/ 𝑛
3. Distribuição de referência: 𝐶~𝑁 0,1
4. Nível de significância: 𝑃 𝐶 ≤ −3 = 0.001
Use charts to explain your ideasExemplo: trajeto
Caso 𝜎 tenha que ser estimado por:
𝑆 =
 𝑥𝑖 − 𝑋
𝑛 − 1
O critério fica:
𝐶 =
 𝑋 − 𝜇
𝑆/ 𝑛
~𝑡𝑛−1
obs: 𝑡𝑛−1= t de student com 𝑛 − 1 graus de liberdade.
Use charts to explain your ideasExemplo: trajeto
Suponha que na realização dos 9 trajetos os tempos 
tenham sido:
30.1, 29.7, 27.3, 29.1, 28.3, 28.4, 31.0, 28.1, 29.0
Nesse caso:
 𝑋 = 29 𝑆 = 1.132 𝑡 =
 𝑋 − 𝜇
𝑆/ 𝑛
= −2.65
𝑃 𝑡8 < −2.65 = 0.015
Use charts to explain your ideasExemplo: trajeto
Observação:
Uma diferença que é estatisticamente 
significante pode não ser significante do 
ponto de vista prático!
Use charts to explain your ideasExemplo: Call Center
Voltando ao exemplo anterior, uma empresa monitorou o tempo gasto
para atender uma chamada de um cliente em um call center. Trinta
atendimentos forma medidos. Os dados obtidos encontram-se na tabela
abaixo:
Chamada Tempo Chamada Tempo Chamada Tempo 
1 2.53 11 5.57 21 4.81 
2 5.52 12 4.60 22 4.82 
3 3.53 13 3.84 23 7.19 
4 3.26 14 5.37 24 2.39 
5 6.31 15 3.42 25 5.52 
6 4.04 16 4.51 26 5.01 
7 4.09 17 1.84 27 1.94 
8 1.22 18 6.89 28 4.60 
9 3.42 19 3.53 29 2.35 
10 5.01 20 6.75 30 2.07 
 
Use charts to explain your ideasExemplo: Call Center
No exemplo, suponha que o objetivo era que o tempo médio de
atendimento fosse igual a 3.50 minutos. O objetivo estava sendo
alcançado?
Teste de Hipótese
Ho: 0 = 3.50 H1:0  3.50
n
s
μy
 t: testedo Critério 00


Use charts to explain your ideasExemplo: Call Center
Calculando o critério:
p-valor = 0.023 
Há evidência para rejeitar H0.
OBS. O gráfico de controle deve ser feito antes do cálculo do p-
valor. Caso haja causas especiais atuando no processo, não se deve
calcular o p-valor
2.41
30
1.5876
.5034.1983
n
s
μy
t 00 




Use charts to explain your ideasExemplo: Call Center
One-Sample T: tempo de atendimento 
Test of mu = 3.5 vs not = 3.5
Variable tempo de atendimento 
N Mean StDev SE Mean
30 4.19833 1.58760 0.28985
95% CI T p
(3.60551; 4.79115) 2.41 0.023
Use charts to explain your ideasPasso a passo
1. Formalização do teste, ou tradução do problema a ser resolvido na 
forma de um teste de hipóteses: formule as hipótese nula e alternativa 
(P)
2. Construção de um critério para realizar o teste (P)
3. Planeje a coleta de dados (P)
4. Realize a coleta de dados (D)
5. Calcule a estatística (critério) (S)
6. Compare o critério com uma distribuição de referência e calcule a 
evidência contra a hipótese nula (p-valor – nível de significância) 
(S)
7. Decida o que fazer (A)
Use charts to explain your ideasAnálise de p-valor
• Se o p-valor for menor que 1%, rejeita-se a hipótese
nula;
• Se o p-valor for maior que 10%, não rejeita-se a
hipótese nula;
• Se o p-valor estiver entre 1% e 10%, deve-se
considerar outros fatores para se tomar uma decisão,
como o risco, custo, etc.;
Obs. As recomendações acima são as usuais e são adequadas para a
maior parte dos casos. Porém, a decisão de rejeitar ou não uma hipótese
deve ser feita levando em consideração os riscos e custos associados com
a decisão. Significância estatística não é a mesma coisa que importância!
Use charts to explain your ideasTestes de hipótese
• Existem vários possíveis testes de hipóteses.
• Qual usar, depende do tipo de grandeza que estamos
testando.
• Iremos ver essa questão em mais detalhes na parte
de “análise de população”.
Use charts to explain your ideasTestes de hipótese
O que temos que saber para realizar corretamente um
teste de hipótese?
• O tipo de variável (atributo ou contínua);
• O que estamos testando (médias, variâncias, mínimos
quadrados, etc.);
• Tipo de variável (dependente ou independente.
O Minitab 17 nos ajuda a escolher o teste correto para
cada situação.
ANOVA
ANOVA
A análise de variância (ANOVA) testa a hipótese de que
as médias de duas ou mais populações são iguais.
 Análises ANOVA testam a importância de um ou mais fatores comparando as médias das
variáveis de resposta em diferentes níveis dos fatores. Verificando se o fator exerce
influência.
 A hipótese nula afirma que todas as médias das populações (médias dos níveis dos
fatores) são iguais, enquanto a hipótese alternativa afirma que pelo menos uma é
diferente.
O nome "analise de variância" é baseado na abordagem na qual o
procedimento usa variâncias para determinar se as médias são
diferentes. O procedimento compara a variância entre as médias
do grupo à variância dentro dos grupos como para determinar se
os grupos são todos parte de uma população maior ou
populações separadas com características diferentes.
ANOVA
Para realizar um teste ANOVA:
 é necessário haver uma variável resposta contínua e pelo menos um
fator categórico com dois ou mais níveis
 dados de populações com distribuições aproximadamente normal,
com variâncias iguais entre fatores
 amostras aleatórias e independentes
Via de regra, os procedimentos ANOVA funcionam bem mesmo
quando a pressuposição de normalidade é violada, exceto quando
uma ou mais distribuições são altamente assimétricas ou quando
as variâncias são muito diferentes
ANOVA Exemplo
Máquina A Máquina B Máquina C
4 2 -3
8 0 1
5 1 -2
7 2 -1
6 4 0
Dados obtidos de um experimento completamente aleatorizado
Será que estas máquinas são iguais? Ou há diferença entre elas?
ANOVA
E o que é serem iguais?
H0 => μa = μb = μc e H1 => μa ≠ μb ≠ μc
E como avaliar isto?
Comparando-se a variabilidade dentro do grupo com a
variabilidade entre os grupos.
Quanto maior for a variabilidade entre os grupos, maior a evidência
de que há diferença entre as médias e, que a hipótese H0 não é
verdadeira.
ANOVA
E como calcularmos?
Define-se a soma total dos quadrados:
calculada a partir de todos os dados, em que é a média amostral
global.
Note que a estimativa usual de variância de uma amostra é:
_
x
ANOVA
E como calcularmos?
Podemos dividi-la como:
em que
ANOVA
E como calcularmos?
Aqui SQD é utilizado para denotar soma de quadrados dentro de
grupo e SQE para a soma de quadrado entre grupos.
Agora tendo separado a variabilidade, é possível mostrar que
podemos obter estimativas independentes da variância
populacional comum σ2 a partir destas duas quantidades. Elas são
chamadas de valores quadrados médios, e obtemos as seguintes
estimativas:
m é o número de grupos, e N é o tamanho amostral total, aqui 3.
ANOVA
Como estas estimativas de variância são construídas a partir de dois tipos diferentes de
variabilidade, quanto mais elas diferirem, mais evidência existe de diferença nas médias.
Teste =>
Como os resultados são expressos
Soma dos 
Quadrados
Graus de 
Liberdade
Quadrado das 
Médias
Teste P-valor
ANOVA Exemplo
Aplica-se um teste ANOVA e:
Nota-se que que sabemos é que, pelo menos, as duas máquinas extremas (A e C) são
diferentes. A ANOVA não nos diz se A e B ou B e C são significativamente diferentes
A tabela ANOVA mostra que F
calculado é de 62,067/2,4 = 25,681 e
o F crítico em ά = 0,05 (95%de
confiança) com o numerador df=2 e
o denominador df = 12 é 3,885. Como
25,68 > 3,88 nós rejeitamos a
hipótese nula e concluímos que as
máquinas produzem resultados
diferentes
Análise de 
Regressão
Estatística: Engenharia reversa é difícil
◉ O problema da inferência, ela é exatamente uma engenharia
reversa
◉ Todo dia, somos presenteados com observações e solicitados a
construir teorias (PDSA) – o que foi colocado numa caixa preta para
produzir o mundo que vemos?
◉ “Pela forma das nuvens e o modo como se movem, nós lutamos
para retroceder, resolver x, o sistema que as formou”
Estudar Relações Entre Variáveis
O
Variáveis
de Input
Variáveis de
Processo
Variáveis de
Output
PI
X1,, X2 , ... , Xk Y
Y = f(X1,, X2 , ... , Xk)
S C
Sistema de Causas
Estudo de Relações Entre Variáveis
◉Passo 1: Classifique as variáveis sob dois critérios:
A variável é Y ou X?
• Y: Variáveis de saída do processo cujo comportamento você quer 
explicar. 
• Nomenclatura: variáveis resposta, variáveis dependentes
• X: Variáveis de processo ou de entrada, candidatas a explicar o 
comportamento das variáveis resposta.
• Nomenclatura: variáveis explicativas, variáveis independentes, fatores; 2) Variáveis 
de estratificação
A variável é numérica ou categórica?
Estudar Relações Entre Variáveis
◉Passo 2: Identifique a técnica a ser utilizada na tabela 
abaixo:
Y numérica Y categórica
X numérica
Gráfico de dispersão
Gráfico de dispersão 
estratificado
X categórica
Dot-plot estratificado
Gráfico de Tendência 
estratificado
Tabela de 
contingência
Gráfico de barras
Gráfico de Dispersão
Gráfico de Dispersão
“Comecei com uma folha de papel quadriculada, com uma escala horizontal no
alto, como referência para as estaturas dos filhos, e outra lateral de cima para
baixo, para as estaturas dos pais, e aí punha uma marca a lápis no ponto
apropriado da estatura de cada filho em relação à de seu pai.”
“Pelo gráfico, observa-se: filhos de pais altos, costumam ser mais altos que a
média, mas não tão altos como seus próprios pais. O mesmo acontece aos filhos
de pais baixos.”
Galton inventara o tipo de gráfico que hoje chamamos de gráfico de dispersão.
Reinventou, na verdade. Quem o fez pela primeira vez foi John Herschel em
1833, para estudar órbitas de estrelas binárias.
Gráfico de Dispersão
Mas cuidado. Não faça como Alphonse Bertillon, criminologista francês
com o espírito semelhante ao de Galton. No sistema Bertillon, cada
suspeito detido era medido e seus dados preenchidos em cartões e
armazenados para uso futuro. Se o mesmo homem fosse novamente
apanhado, identificá-lo era simples questão de pegar o medidor,
registrar seus números e compará-los com os cartões no arquivo.
Problema: as medidas corporais não são inteiramente independentes.
Pessoas de pés grandes, costumam ter mãos grandes também.
Gráfico de Dispersão
Job Tempo_prod N_Setups Job Tempo_prod N_Setups 
1 61 6 26 20 4 
2 129 14 27 75 10 
3 77 5 28 94 12 
4 115 8 29 95 7 
5 79 8 30 38 7 
6 95 10 31 50 6 
7 88 9 32 40 3 
8 67 8 33 73 10 
9 158 12 34 91 11 
10 67 5 35 38 4 
11 160 13 36 69 6 
12 37 7 37 58 7 
13 30 2 38 91 14 
14 86 9 39 36 7 
15 187 15 40 151 10 
16 72 8 41 103 9 
17 78 8 42 93 8 
18 132 14 43 112 11 
19 38 6 44 163 12 
20 34 5 45 78 9 
21 90 7 46 62 8 
22 93 11 47 58 8 
23 114 8 48 107 9 
24 65 5 49 112 7 
25 86 12 50 72 10 
 
Uma empresa coletou dados
de Tempo para produzir um
item e Número de set-ups de
50 linhas de produção .
Os dados estão na tabela ao
lado. Há alguma relação
entre essas duas variáveis?
Gráfico de Dispersão
Análise de Gráficos de Dispersão
 Aspectos a serem observados em m 
Gráfico de Dispersão
 Direção
 Forma
 Força
Coeficiente de correlação linear
Fórmula
-1 ≤ r ≤ 1
Obs:
O coeficiente r mede o grau de associação linear entre duas
variáveis. Valor de r baixo (próximo de zero) não indica que as
variáveis não estão relacionadas. Não interprete o valor de r sem o
gráfico de dispersão. A interpretação de r (se é alto) depende do
contexto
  
   




22
yyxx
yyxx
r
ii
ii
Estudo de Relações
O proprietário de uma casa está interessado no efeito do seu
aparelho de ar condicionado na conta de luz. Para isso, ele anotou o
número de horas que usou o seu aparelho de ar condicionado a
cada dia, durante 21 dias.
Também monitorou o medidor de consumo de eletricidade durante
estes dias e mediu a quantidade de eletricidade usada em
quilowatt-hora. Finalmente, anotou também o número de vezes
que a secadora de roupas foi usada por dia. Os dados estão na
tabela seguinte
Dia Kwh AC Dia Kwh AC 
1 35 1.5 12 65 8,0 
2 63 4.5 13 77 7,5 
3 66 5.0 14 75 8,0 
4 17 2.0 15 62 7,5 
5 94 8.5 16 85 12,0 
6 79 6.0 17 43 6,0 
7 93 13.5 18 57 2,5 
8 66 8.0 19 33 5,0 
9 94 12.5 20 65 7,5 
10 82 7.5 21 33 6,0 
11 78 6.5 
 
Dados do Estudo de Consumo de Energia 
Elétrica
AC
Kw
h
14121086420
100
90
80
70
60
50
40
30
20
10
Scatterplot of Kwh vs AC
Correlação entre Kwh e AC : 0.765
Gráfico de Dispersão e Correlação
Questões não respondidas pela correlação
 Do valor de r pode-se concluir que quando o uso do ar
condicionado aumenta, o número de quilowatt-hora
consumido também aumenta.
 Isso não é surpresa. Algumas questões mais importantes
são:
 Quantos Kwh serão consumidos para cada hora de uso do ar ?
 Qual é a previsão de consumo total de quilowatt-hora em um dia com um
número especificado de horas de uso do ar condicionado?
 Qual é a média estimada do consumo em quilowatt-hora para dias com
um especificado número de horas de uso do ar condicionado?
 Qual é a margem de erro para o consumo em Kwh predito?
 Essas questões podem ser respondidas com a análise de
regressão
AC
Kw
h
14121086420
100
90
80
70
60
50
40
30
20
10
Scatterplot of Kwh vs AC
Gráfico de dispersão com uma reta desenhada
manualmente.
Como medir a “qualidade” da reta ajustada?
Ajuste de uma reta
Ajuste de uma reta
X
Y
60
65
70
75
80
85
90
95
80 100 120 140 160 180 200 220
(x,y)
x
y
yˆ
)ˆ( yyresíduo 
Ajuste de uma reta
Reta ajustada e resíduos
X
Y
60
65
70
75
80
85
90
95
80 100 120 140 160 180 200 220
Ajuste de uma reta
◉Considere um conjunto de n pares de dados (x,y) e o gráfico de dispersão
X,Y
◉Para cada reta y=a+bx desenhada no gráfico, calcule o valor
y_ajustado=a+bx
◉O resíduo é a diferença (y - y_ajustado)
◉A soma do quadrados dos resíduos é uma medida da qualidade do ajuste
(“proximidade da reta aos pontos do gráfico”)
◉A “melhor reta” é aquela que tem a menor Soma dos Quadrados dos
Resíduos e é chamada de Reta de Mínimos Quadrados
Ajuste de Regressão por Mínimos Quadrados
Melhor reta:
 

mínimo seja )yˆ(y
 que talbˆ e aˆ x,bˆaˆyˆ
2
rx,y – Coeficiente de correlação entre x e y
sx e sy – desvio padrão de x e y respectivamente
xbˆyaˆ e 
s
s
rbˆ
:Solução
x
y
yx, 
Reta Ajustada por Mínimos Quadrados
AC
Kw
h
14121086420
100
90
80
70
60
50
40
30
20
10
S 14.4530
R-Sq 58.6%
R-Sq(adj) 56.4%
Fitted Line Plot
Kwh = 27.85 + 5.341 AC
Ajuste de Regressão: Interpretação
◉Considere a reta ajustada por mínimos quadrados
Kwh=27.85+5.341AC.
◉Como interpretar os coeficientes 27.85 e 5.341?
◉Que se pode afirmar sobre o consumo de energia 
quando se usa o ar condicionado por 10 horas?
◉Obs: Nem sempre os coeficientes são interpretáveis.
Ajuste de Regressão: Interpretação◉Observe que a faixa de variação de AC é de 1.5 a 13.5.
◉Usar a equação para valores de AC fora da faixa de
dados observados é extrapolação.
◉Extrapolação tem que ser feita com cuidado. Muitas
vezes obtém-se valores absurdos!
Ajuste de Regressão
Algumas equações importantes:
1R0 ,
SQ
SQ
 R3.
SQSQSQ
)yˆ(y)yyˆ()y(y 2.
)yˆ(y)yyˆ()y(y 1.
2
Total
Ajuste2
ResíduoAjusteTotal
2
ii
2
i
2
i
iiii





 Se os pontos estão alinhados em uma reta, yAjustado = y, SQResíduo= 0 e R2 = 1
 R2 é chamado de Coeficiente de Determinação e mede a “qualidade do ajuste”
 Quando o ajuste é feito através de uma reta, R = rx,y
Ajuste de Regressão
Regression Analysis: Kwh versus AC 
The regression equation is
Kwh = 27.85 + 5.341 AC 
S = 14.4530 R-Sq = 58.6%  R-Sq(adj) = 56.4%
Analysis of Variance
Source DF SS MS F P
Regression 1 5609.66  5609.66 26.85 0.000
Error 19 3968.91  208.89
Total 20 9578.57 
 - Equação da reta de mínimos quadrados
 - R2
 - SQAjuste
 - SQResíduo
 -SQTotal
Estimativa e Margem de Erro
◉Suponha que você queira estimar o consumo médio em
quilowatt-hora quando o ar condicionado fica ligado por oito horas.
◉Usando a equação de regressão, substitua AC na equação de
regressão por 8 e obtenha:
KWH predito = 27.85 + (5.34*8) = 70.57
◉Esse valor é uma estimativa baseada nos dados do estudo.
◉Qual é a margem de erro dessa estimativa?
◉Sem entrar em detalhes sobre como calcular a margem de erro,
vamos obtê-la com o auxílio do MINITAB
Estimativa e Margem de Erro
◉O valor estimado é 70.58;
◉A margem de erro é 6.99 (77.57-70.58);
◉Esse valor é aproximadamente 2*SE Fit;
◉Podemos dizer que estamos 95% confiantes que o
consumo médio de energia quando usamos o ar
condicionado por 8 horas estará entre 63.59 Kwh e 77.57
Khw.
Obs AC Fit SE Fit 95% CI 
1 8.00 70.58 3.34 (63.59; 77.57) 
Predição e Margem de Erro
◉Suponha que você queira predizer o consumo em quilowatt-hora
quando o ar condicionado for ligado por oito horas;
◉Usando a equação de regressão, substitua AC na equação de
regressão por 8 e obtenha:
KWH predito = 27.85 + (5.34*8) = 70.57.
◉Esse valor é uma predição baseada nos dados do estudo.
◉Qual é a margem de erro dessa predição?
◉Sem entrar em detalhes sobre como calcular a margem de erro,
vamos obtê-la com o auxílio do MINITAB
Predição e Margem de Erro
◉O valor estimado é 70.58;
◉A margem de erro é 31.05 (101.63 -70.58);
◉Podemos dizer que estamos 95% confiantes que o consumo de
energia quando usarmos o ar condicionado por 8 horas estará entre
39.53 Kwh e 101.63 Khw;
◉Observe a diferença entre estimar a média de consumo e predizer
o consumo para um dia específico.
Obs AC Fit SE Fit 95% PI 
1 8.00 70.58 3.34 (39.53; 101.63)
A Reta de Regressão com os Limites de 
Confiança
◉É útil visualizar o gráfico com os dados, a reta ajustada,
os limites de predição e os limites de confiança;
◉Os limites de predição e de confiança são curvas em
torno da reta de regressão;
◉Para cada valor de AC pode-se visualizar graficamente
o valor ajustado, os intervalos de confiança e os
intervalos de predição.
Reta Ajustada por Mínimos Quadrados, Curva de 
Confiança de 95% e Curva de Predição de 95%
AC
Kw
h
14121086420
140
120
100
80
60
40
20
0
S 14.4530
R-Sq 58.6%
R-Sq(adj) 56.4%
Regression
95% CI
95% PI
Fitted Line Plot
Kwh = 27.85 + 5.341 AC
Margem de Erro das Estimativas
◉As estimativas de mínimos quadrados de a e b são
obtidas a partir dos dados do experimento;
◉Se repetirmos o experimento nas mesmas condições
(para os mesmos valores de x) os valores de y (resposta)
quase certamente serão diferentes; conseqüentemente,
as estimativas de a e b serão diferentes;
◉É importante apresentar as estimativas de a e b com
respectivas margens de erro.
Margem de Erro das Estimativas
◉Dizemos que a variável regressora X é útil para explicar (entender)
a variável resposta Y se o coeficiente angular da reta (b) é diferente
de zero;
◉Em um experimento, o valor de b calculado por Mínimos
Quadrados pode ser numericamente diferente de zero mas essa
diferença pode ser simplesmente devido ao acaso;
◉Então, uma questão importante a ser respondida é: O coeficiente
angular da reta é significativamente diferente de zero?
◉Essa pergunta pode ser respondida calculando-se a Margem de
Erro da estimativa ou o p-valor associado com a estimativa
Margem de Erro das Estimativas
◉A margem de erro de uma estimativa é aproximadamente 2 vezes
o erro padrão da estimativa (com 95% de confiança);
◉É possível calcular o erro padrão da estimativa dos coeficientes da
reta de regressão com um software estatístico (MINITAB, por
exemplo);
◉Com a Margem de Erro pode-se construir um Intervalo de
Confiança para os coeficientes da reta;
◉As estimativas dos coeficientes com respectivos erros padrões e
Intervalos de Confiança de 95% estão no slide seguinte
Margem de Erro e Intervalo de Confiança
The regression equation is
Kwh = 27.9 + 5.34 AC
Predictor Coef SE Coef T P
Constant 27.851 7.807 3.57 0.002
AC 5.341 1.031 5.18 0.000
Estimativas Erro PadrãoCoeficientes
Margem de Erro (b) = 2*1.031 = 2.061 IC de 95% (b): (3.28 ; 7.402)
Margem de Erro (a) = 2*7.807 = 15.614 IC de 95% (a): (12.237 ; 43.465)
Margem de Erro e Intervalo de Confiança
◉Com base nos Intervalos de Confiança podemos
afirmar que os coeficientes linear e angular da reta são
significativamente diferentes de zero;
◉A mesma resposta poderia ser obtida com base no p-
valor das estimativas;
◉Como os p-valores são muito pequenos, concluímos
que os coeficientes são significativamente
(estatisticamente) diferentes de zero.
Resíduos e Outliers
◉Cada caso (observação) no conjunto de dados tem uma resposta
y e um valor predito pelo modelo, yajustado
◉A diferença entre y e yajustado é chamada de resíduo
res=y-yajustado
◉Cada caso tem seu resíduo
◉Se o resíduo é pequeno, a predição é boa para aquele caso (o que
é “pequeno” depende de cada problema)
Resíduos e Outliers
Considere os quatro conjunto de dados da tabela abaixo
Conjunto 
de Dados 1 
 Conjunto 
de Dados 2 
 Conjunto 
de Dados 3 
 Conjunto 
de Dados 4 
X Y X Y X Y X Y 
10.00 8.04 10.00 9.14 10.00 7.46 8.00 6.58 
8.00 6.95 8.00 8.14 8.00 6.77 8.00 5.76 
13.00 7.58 13.00 8.74 13.00 12.74 8.00 7.71 
9.00 8.81 9.00 8.77 9.00 7.11 8.00 8.84 
11.00 8.33 11.00 9.26 11.00 7.81 8.00 8.47 
14.00 9.96 14.00 8.10 14.00 8.84 8.00 7.04 
6.00 7.24 6.00 6.13 6.00 6.08 8.00 5.25 
4.00 4.26 4.00 3.10 4.00 5.39 19.00 12.50 
12.00 10.84 12.00 9.13 12.00 8.15 8.00 5.56 
7.00 4.82 7.00 7.26 7.00 6.42 8.00 7.91 
5.00 5.68 5.00 4.74 5.00 5.73 8.00 6.89 
 
Resíduos e Outliers
Variável Mean Std.Dev. 
X1 9.0 3.32 
Y1 7.5 2.03 
X2 9.0 3.32 
Y2 7.5 2.03 
X3 9.0 3.32 
Y3 7.5 2.03 
X4 9.0 3.32 
Y4 7.5 2.03 
 
 A tabela ao lado apresenta o
coeficiente de correlação, reta
ajustada e R2 para cada conjunto de
dados
Conjunto r Reta ajustada R
2
 
1 0.86 y = 3.0+0.5x 0.668 
2 0.86 y = 3.0+0.5x 0.668 
3 0.86 y = 3.0+0.5x 0.668 
4 0.86 y = 3.0+0.5x 0.668 
 
 A tabela ao lado apresenta a média e 
desvio padrão para cada variável
Resíduos e Outliers
1 2
3 4
Retas ajustadas
Resíduos e Outliers
◉Como se pode perceber, não é suficiente calcular os coeficientes
da reta. Fazer o gráfico de dispersão é fundamental para verificar se
o modelo utilizado

Continue navegando