Logo Passei Direto
Buscar

Gestão da Qualidade

Humanas / Sociais
Um epidemiologista deseja agrupar pacientes com uma síndrome complexa com base em seus padrões de sintomas, mas não possui subtipos pré-definidos. Ele decide usar um algoritmo de aprendizado não-supervisionado. Qual das seguintes opções é uma técnica de avaliação que ele pode usar para determinar o número ideal de clusters (k) sem ter conhecimento dos "subtipos verdadeiros" dos pacientes? Grupo de escolhas da pergunta Regressão Logística, pois modela a probabilidade de um paciente pertencer a um subtipo. Informação Mútua Normalizada (NMI), pois avalia a quantidade de informação compartilhada com os grupos reais. Índice de Rand Ajustado (ARI), pois mede a similaridade entre o resultado do algoritmo e o agrupamento real. Coeficiente de Silhueta (Silhouette), pois avalia a coesão e a separação dos clusters formados.
User badge image
Gabriela Candida Cunha

há 2 meses

Respostas

User badge image

Ed Verified user icon

há 2 meses

Para determinar o número ideal de clusters (k) em um algoritmo de aprendizado não-supervisionado, o epidemiologista precisa de uma técnica que avalie a qualidade dos clusters formados, sem ter acesso a subtipos pré-definidos. Vamos analisar as opções: 1. Regressão Logística: Essa técnica é usada para modelar a probabilidade de um evento ocorrer, mas não é adequada para determinar o número de clusters em aprendizado não-supervisionado. 2. Informação Mútua Normalizada (NMI): Essa técnica mede a quantidade de informação compartilhada entre dois agrupamentos, mas requer um agrupamento real para comparação, o que não se aplica aqui, já que não há subtipos conhecidos. 3. Índice de Rand Ajustado (ARI): Assim como o NMI, o ARI mede a similaridade entre o resultado do algoritmo e um agrupamento real, o que também não é aplicável na ausência de subtipos verdadeiros. 4. Coeficiente de Silhueta (Silhouette): Essa técnica avalia a coesão (quão próximos estão os pontos dentro de um cluster) e a separação (quão distantes estão os clusters entre si). É uma abordagem adequada para determinar a qualidade dos clusters formados sem precisar de subtipos conhecidos. Diante dessa análise, a opção correta é: Coeficiente de Silhueta (Silhouette), pois avalia a coesão e a separação dos clusters formados.

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Mais conteúdos dessa disciplina