Baixe o app para aproveitar ainda mais
Prévia do material em texto
Predições com regressão logística Em uma manhã fria de janeiro de 1986, no Centro Espacial Kennedy (Kennedy Space Center), no Cabo Canaveral, deu- se o lançamento do Space Shuttle Challenger. Pouco mais de um minuto após o lançamento, vê-se uma enorme explosão no ar. As pessoas ficam atônitas, sem entender, mas percebem que algo terrível aconteceu. O conjunto composto pelo veículo espacial e seus propulsores explodiram, matando a tripulação: cinco astronautas e dois especialistas. O presidente Ronald Reagan convoca uma comissão, a Rogers Commission. Naquela manhã, a temperatura era de 2,2 oC na hora do lançamento, muito abaixo da média histórica. Fonte: Galrad / Wikimedia Commons. Vamos usar este caso para ilustrar uma importante aplicação de regressão logística em estudos de confiabilidade. Estudos de confiabilidade têm, em seu centro, o estudo do comportamento probabilístico das falhas. Usam-se, então, de modelos de probabilidade para interpretar, predizer e prevenir a ocorrência de falhas. O acidente foi causado por uma falha no anel de vedação de um dos foguetes de propelente sólido do ônibus especial. Descobriu-se que essas falhas ocorriam com mais frequência em baixas temperaturas. Um modelo de regressão logística foi ajustado aos dados do histórico de falhas dos anéis de vedação versus temperatura de lançamento. Ao fazermos isso, obtemos: log[ p(x) / ( 1 − p(x) ) ]=5,37−0,31xlog[ p(x) / ( 1 − p(x) ) ]=5,37−0,31x onde: x=Temperatura no dia do lanamento x=Temperatura no dia do lanamento (oC) p(x)=Probabilidade de falha do anel de vedaa~op(x)=Probabilidade de falha do anel de vedaa~o (O-ring) Por meio de algumas operações podemos isolar do lado esquerdo da equação, chegando a: p(x)=[ exp(5,37−0,31x) ] / [ 1+exp(5,37−0,31x) ]p(x)=[ exp(5,37−0,31x) ] / [ 1+exp(5,37−0,31x) ] Desenvolvido o modelo preditivo de classificação por regressão logística, podemos usá-lo para fazer predições da probabilidade de falha dos anéis de vedação. Veja as duas situações a seguir: x=27,2x=27,2 ⇒⇒ p(27,2)=0,048p(27,2)=0,048 x=2,2x=2,2 ⇒⇒ p(2,2)=0,991p(2,2)=0,991 É notória a influência da temperatura no aumento da probabilidade de falhas dos O-rings. Para uma temperatura de 27,2 oC, que é a mais alta temperatura do histórico de lançamento do ônibus especial, a probabilidade de falha é de 4,8%, enquanto para uma temperatura de 2,2 oC — temperatura na hora do lançamento, no dia do acidente —, a probabilidade é de 99,1%, quase de cem por cento. Vamos Praticar Agora que você compreendeu as funções e objetivos da construção de modelos de regressão para predição, pratiquemos um pouco mais sobre este assunto por meio da aplicação do conhecimento adquirido no estudo de caso proposto. Analise e interprete os resultados da pesquisa e responda às seguintes perguntas: 1) As variáveis estudadas foram se houve ou não falha do componente e qual era a temperatura de lançamento do ônibus? Qual delas é a variável-resposta e qual a variável de entrada? São qualitativas ou quantitativas? 2) Imagine que você está estudando a resistência à ruptura de uma certa peça em função da tração aplicada a ela. Você decide aplicar regressão logística para modelar o comportamento da peça, imaginando poder calcular a probabilidade de ruptura desta em função da tração a ela aplicada. Seria esta uma situação similar à que vimos relativa à falha de O- rings? Explique. 3) Imagine que você está estudando o efeito de ingestão de açúcares na ocorrência de diabetes em uma determinada população. Você decide aplicar regressão logística para modelar a ocorrência de diabetes, imaginando poder calcular a probabilidade de uma pessoa tornar-se diabética em função da quantidade média de açúcares ingeridos por dia, em um estudo observacional em longo prazo. Seria esta uma situação similar à que vimos relativamente à falha de O-rings? Explique. 4) Reflita sobre outras situações similares por meio das quais você poderia aplicar essa mesma técnica (regressão linear múltipla) para gerar conhecimento a partir de dados. Ao final, disponibilize seu trabalho no fórum da seção. 1) Temperatura no dia do lançamento do ônibus > Quantitativa (Variável de entrada) Falha do anel de vedação > Qualitativa (Variável resposta) A temperatura era de 2,2 oC na hora do lançamento. 2) Exatamente pois quanto maior a tração aplicada a peça maior a probabilidade de ruptura. São similares (probabilidade de ruptura da peça e falha do anel de vedação) também variável de entrada (tração aplicada e temperatura na hora do lançamento). 3) Seria similar pois a probabilidade de tornar-se diabético e a probabilidade de falha do anel de vedação são variáveis resposta (Qualitativa), já a temperatura de lançamento e quantidade média de açúcar ingeridos por dia são variáveis de entrada (Quantitativa). 4) Ambas as técnicas podem ser utilizadas nas TIC`S (Tecnologias de informação e comunicação) juntamente com Big data para e-commerce e empresas de marketing criarem campanhas publicitárias e de vendas baseadas em regressão linear e múltipla. As variáveis qualitativas e quantitativas fornecem excelentes informações sobre o comportamento dos consumidores facilitando identificação do público alvo, nichos, período de consumo, regiões dos clientes, tipos de mercadoria, sazonalidades de compra, datas comemorativas. Informações de grande interesse para empresários, produtores e fabricantes. Vamos Praticar
Compartilhar