Logo Passei Direto
Buscar
A jovem cientista de dados, tendo em mãos os dados que lhe foram passados pelo gerente do banco, precisou denominá-los corretamente para a fase de treino (ajuste) do algoritmo preditivo. Ela escolheu a regressão logística como seu algoritmo preditivo, para classificar o potencial (a probabilidade) de uma pessoa ficar ou não inadimplente com o pagamento das faturas do cartão de crédito.
Analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
( ) A jovem cientista de dados escolheu como variável resposta a renda mensal da pessoa, e tratou as demais variáveis como variáveis de entrada.
( ) A jovem cientista de dados escolheu o gasto médio mensal da pessoa com cartão de crédito como a variável resposta, e tratou as demais como variáveis de entrada.
( ) A jovem cientista de dados não definiu qualquer das quatro variáveis como a variável resposta, e decidiu realizar uma análise baseada em aprendizagem não supervisionada.
( ) A jovem cientista de dados escolheu como variável resposta se a pessoa havia, ao longo do período pesquisado, ficado inadimplente com o pagamento das faturas do cartão ao menos uma vez (Sim ou Não), e tratou as demais variáveis como variáveis de entrada.
User badge image
Testando o Conhecimento

há 6 meses

Respostas

User badge image

Ed Verified user icon

há 6 meses

Vamos analisar cada uma das afirmativas sobre a escolha da jovem cientista de dados: ( ) A jovem cientista de dados escolheu como variável resposta a renda mensal da pessoa, e tratou as demais variáveis como variáveis de entrada. É falsa (F). A renda mensal não é a variável resposta correta para o problema de inadimplência, pois o foco é na probabilidade de inadimplência, não na renda. ( ) A jovem cientista de dados escolheu o gasto médio mensal da pessoa com cartão de crédito como a variável resposta, e tratou as demais como variáveis de entrada. É falsa (F). Assim como a renda, o gasto médio mensal não é a variável resposta que indica se a pessoa ficou inadimplente ou não. ( ) A jovem cientista de dados não definiu qualquer das quatro variáveis como a variável resposta, e decidiu realizar uma análise baseada em aprendizagem não supervisionada. É falsa (F). O enunciado menciona que ela escolheu a regressão logística, que é uma técnica de aprendizagem supervisionada, indicando que ela definiu uma variável resposta. ( ) A jovem cientista de dados escolheu como variável resposta se a pessoa havia, ao longo do período pesquisado, ficado inadimplente com o pagamento das faturas do cartão ao menos uma vez (Sim ou Não), e tratou as demais variáveis como variáveis de entrada. É verdadeira (V). Esta afirmação está correta, pois a variável resposta em um modelo de regressão logística para esse contexto é, de fato, a inadimplência (Sim ou Não). Portanto, a sequência correta é: F - F - F - V.

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Ao longo das nossas discussões, demos foco a um classificador chamado de regressão logística que, apesar do nome regressão (esse nome por razões históricas e por conta de algumas de suas características), é usado como um classificador. Mas também vimos que existem outros tipos de classificadores. Relativamente a esse assunto de algoritmos de classificação, analise as afirmativas a seguir.
Está correto o que se afirma em:
Regressão logística é o único método de aprendizagem supervisionada que é utilizado para classificação, todos outros métodos são métodos de regressão.
Apesar do nome regressão logística, o que acaba sendo um pouco confuso para iniciantes, na verdade este é um dos vários métodos de aprendizagem supervisionada utilizado para classificação.
Dentre os métodos utilizados para classificação se encontram regressão logística, análise discriminante linear (LDA = Linear Discriminant Analysis), árvores de decisão para classificação, máquinas de vetores de suporte (SVM = support vector machines) e k-vizinhos mais próximos (KNN = k-nearest neighbors).
Regressão linear não é um método de classificação, mas, sim, um dos métodos preditivos de aprendizagem supervisionada usados na predição de valores de variáveis respostas quantitativas.

Entre as técnicas das quais lançou mão para a visualização dos dados da amostra, uma jovem cientista de dados usou gráficos de dispersão. Como cientista de dados, ela sabia exatamente em que situações empregar gráficos de dispersão. E você, será que você também já sabe?
Analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
( ) Gráficos de dispersão, em inglês chamados de scatter plots, só podem ser usados para a visualização de uma única variável, a qual deve ser obrigatoriamente uma variável qualitativa.
( ) Gráficos de dispersão são usados para a visualização da relação entre duas variáveis quantitativas, em que os dados das duas variáveis são plotados aos pares.

Discutimos o que são aprendizagem supervisionada e não supervisionada. Vimos que é na forma como tratamos as variáveis estudadas que se dá a diferença entre esses dois tipos de aprendizagens, supervisionada e não supervisionada. Esses dois tipos são os mais importantes dentre os diversos tipos de aprendizagem.
Relativamente a esse assunto, analise as afirmativas a seguir.
Na aprendizagem supervisionada, definimos uma das variáveis estudadas como sendo a variável resposta, a qual responde em função dos valores assumidos pelas outras variáveis, as quais são chamadas de variáveis de entrada.
Especificamente na aprendizagem supervisionada, também denominamos uma variável resposta de variável de saída ou variável dependente.
Especificamente na aprendizagem supervisionada, também denominamos uma variável de entrada de variável regressora, variável preditora ou variável independente.
Na aprendizagem não supervisionada, tratamos todas as variáveis estudadas da mesma forma, sem procurar explicar o comportamento de uma delas em função dos valores assumidos pelas outras.

Tarefas de classificação são muitos comuns na estatística e na ciência dos dados, por serem muito comuns em todas atividades humanas, na ciência, na vida social ou nos negócios. Especificamente, discutimos aplicações de modelos preditivos de classificação baseados em modelos de regressão logística simples ou múltipla.
Com isso em mente, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
Regressão logística pode ser empregada na predição do peso médio (massa corporal média) de uma pessoa em função de sua altura, idade e sexo.
Regressão logística pode ser empregada na predição do consumo médio.

Mais conteúdos dessa disciplina