Buscar

Predições com regressão logística (1)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Predições com regressão logística 
 
 
Em uma manhã fria de janeiro de 1986, no Centro Espacial Kennedy (Kennedy Space Center), no Cabo Canaveral, deu-
se o lançamento do Space Shuttle Challenger. Pouco mais de um minuto após o lançamento, vê-se uma enorme 
explosão no ar. As pessoas ficam atônitas, sem entender, mas percebem que algo terrível aconteceu. O conjunto 
composto pelo veículo espacial e seus propulsores explodiram, matando a tripulação: cinco astronautas e dois 
especialistas. O presidente Ronald Reagan convoca uma comissão, a Rogers Commission. Naquela manhã, a 
temperatura era de 2,2 oC na hora do lançamento, muito abaixo da média histórica. 
 
Fonte: Galrad / Wikimedia Commons. 
 
Vamos usar este caso para ilustrar uma importante aplicação de regressão logística em estudos de confiabilidade. 
Estudos de confiabilidade têm, em seu centro, o estudo do comportamento probabilístico das falhas. Usam-se, então, de 
modelos de probabilidade para interpretar, predizer e prevenir a ocorrência de falhas. 
O acidente foi causado por uma falha no anel de vedação de um dos foguetes de propelente sólido do ônibus especial. 
Descobriu-se que essas falhas ocorriam com mais frequência em baixas temperaturas. Um modelo de regressão 
logística foi ajustado aos dados do histórico de falhas dos anéis de vedação versus temperatura de lançamento. Ao 
fazermos isso, obtemos: 
log[ p(x) / ( 1 − p(x) ) ]=5,37−0,31xlog[ p(x) / ( 1 − p(x) ) ]=5,37−0,31x 
onde: 
x=Temperatura no dia do lanamento x=Temperatura no dia do lanamento 
(oC) 
p(x)=Probabilidade de falha do anel de vedaa~op(x)=Probabilidade de falha do anel de vedaa~o 
(O-ring) 
Por meio de algumas operações podemos isolar do lado esquerdo da equação, chegando a: 
p(x)=[ exp(5,37−0,31x) ] / [ 1+exp(5,37−0,31x) ]p(x)=[ exp(5,37−0,31x) ] / [ 1+exp(5,37−0,31x) ] 
Desenvolvido o modelo preditivo de classificação por regressão logística, podemos usá-lo para fazer predições da 
probabilidade de falha dos anéis de vedação. Veja as duas situações a seguir: 
x=27,2x=27,2 ⇒⇒ p(27,2)=0,048p(27,2)=0,048 
x=2,2x=2,2 ⇒⇒ p(2,2)=0,991p(2,2)=0,991 
É notória a influência da temperatura no aumento da probabilidade de falhas dos O-rings. Para uma temperatura de 27,2 
oC, que é a mais alta temperatura do histórico de lançamento do ônibus especial, a probabilidade de falha é de 4,8%, 
enquanto para uma temperatura de 2,2 oC — temperatura na hora do lançamento, no dia do acidente —, a 
probabilidade é de 99,1%, quase de cem por cento. 
 
Vamos Praticar 
Agora que você compreendeu as funções e objetivos da construção de modelos de regressão para predição, 
pratiquemos um pouco mais sobre este assunto por meio da aplicação do conhecimento adquirido no estudo de caso 
proposto. Analise e interprete os resultados da pesquisa e responda às seguintes perguntas: 
1) As variáveis estudadas foram se houve ou não falha do componente e qual era a temperatura de lançamento do 
ônibus? Qual delas é a variável-resposta e qual a variável de entrada? São qualitativas ou quantitativas? 
2) Imagine que você está estudando a resistência à ruptura de uma certa peça em função da tração aplicada a ela. Você 
decide aplicar regressão logística para modelar o comportamento da peça, imaginando poder calcular a probabilidade de 
ruptura desta em função da tração a ela aplicada. Seria esta uma situação similar à que vimos relativa à falha de O-
rings? Explique. 
3) Imagine que você está estudando o efeito de ingestão de açúcares na ocorrência de diabetes em uma determinada 
população. Você decide aplicar regressão logística para modelar a ocorrência de diabetes, imaginando poder calcular a 
probabilidade de uma pessoa tornar-se diabética em função da quantidade média de açúcares ingeridos por dia, em um 
estudo observacional em longo prazo. Seria esta uma situação similar à que vimos relativamente à falha de O-rings? 
Explique. 
4) Reflita sobre outras situações similares por meio das quais você poderia aplicar essa mesma técnica (regressão linear 
múltipla) para gerar conhecimento a partir de dados. Ao final, disponibilize seu trabalho no fórum da seção. 
 
1) Temperatura no dia do lançamento do ônibus > Quantitativa (Variável de entrada) 
Falha do anel de vedação > Qualitativa (Variável resposta) 
 
A temperatura era de 2,2 oC na hora do lançamento. 
 
 
2) Exatamente pois quanto maior a tração aplicada a peça maior a probabilidade de ruptura. São similares 
(probabilidade de ruptura da peça e falha do anel de vedação) também variável de entrada (tração aplicada e 
temperatura na hora do lançamento). 
 
3) Seria similar pois a probabilidade de tornar-se diabético e a probabilidade de falha do anel de vedação são 
variáveis resposta (Qualitativa), já a temperatura de lançamento e quantidade média de açúcar ingeridos por dia 
são variáveis de entrada (Quantitativa). 
 
4) Ambas as técnicas podem ser utilizadas nas TIC`S (Tecnologias de informação e comunicação) juntamente com 
Big data para e-commerce e empresas de marketing criarem campanhas publicitárias e de vendas baseadas em 
regressão linear e múltipla. As variáveis qualitativas e quantitativas fornecem excelentes informações sobre o 
comportamento dos consumidores facilitando identificação do público alvo, nichos, período de consumo, regiões 
dos clientes, tipos de mercadoria, sazonalidades de compra, datas comemorativas. Informações de grande 
interesse para empresários, produtores e fabricantes. 
	Vamos Praticar

Continue navegando