Aprendizagem Supervisionada No aprendizado de máquina e na mineração de dados, o aprendizado supervisionado é uma técnica para inferir uma função a partir dos dados de treinamento. Os dados de treinamento consistem em pares de objetos (geralmente vetores): um componente do par são os dados de entrada e o outro são os resultados desejados. A saída da função pode ser um valor numérico (como em problemas de regressão) ou um rótulo de classe (como em problemas de classificação) O objetivo do aprendizado supervisionado é criar uma função capaz de prever o valor correspondente a qualquer objeto de entrada válido após a visualização de uma série de exemplos, os dados de treinamento. Para fazer isso, você precisa generalizar a partir dos dados apresentados para situações nunca vistas anteriormente. A aprendizagem supervisionada pode gerar modelos de dois tipos. Geralmente gera uma função que transforma os dados de entrada nos resultados desejados. Para resolver um certo problema de aprendizagem supervisionada (por exemplo, aprender a reconhecer a escrita à mão), é necessário considerar várias etapas: • Determine o tipo de exemplos de treinamento. Antes de fazer qualquer outra coisa, você deve decidir que tipo de dados usar para treinar o modelo. Por exemplo, pode ser um único caractere de escrita à mão, uma palavra inteira escrita à mão ou uma linha inteira de escrita à mão. • Monte um conjunto de treinamento. O conjunto de treinamento precisa das características do uso da função no mundo real. Assim, um conjunto de objetos de entrada é coletado e as saídas correspondentes também são coletadas, tanto humanas quanto de medições especializadas. • Determine a função de entrada a partir da representação da função aprendida. A precisão da função aprendida é altamente dependente de como o objeto de entrada é representado. Normalmente, o objeto de entrada é transformado em um vetor de recursos, que contém uma série de recursos que são descritivos do objeto. O número de recursos não deve ser muito grande, por causa da maldição da dimensionalidade, mas deve ser grande o suficiente para prever com precisão a saída. • Determine a estrutura da função apropriada para resolver e o problema e a técnica de aprendizagem correspondente. Por exemplo, você pode escolher usar uma rede neural artificial ou uma árvore de decisão. • Conclua o design. O engenheiro então executa o algoritmo de aprendizagem em todo o treinamento obtido. Os parâmetros do algoritmo de aprendizagem podem ser ajustados otimizando o desempenho em um subconjunto deles (chamado de conjunto de validação) do conjunto de treinamento ou por validação cruzada. Após a configuração e aprendizagem dos parâmetros, o desempenho do algoritmo pode ser medido usando um conjunto de testes independente do treinamento. Outro termo para aprendizagem supervisionada é classificação. Uma ampla variedade de classificadores está disponível, cada um com seus pontos fortes e fracos. O desempenho do classificador é altamente dependente das características dos dados a serem classificados. Não existe uma classificação única que funcione melhor em todos os problemas dados, o que também é conhecido como Teorema Sem Almoço Grátis. Vários testes empíricos foram realizados para comparar o desempenho do classificador e encontrar as características dos dados que determinam o desempenho do classificador. Determinar um classificador adequado para um determinado problema, porém ainda mais uma arte do que uma ciência.