Quando temos um conjunto de dados muito volumoso devido, por exemplo, à execução de um algoritmo de vetorização que tenha gerado muitas dimensões, ...
Quando temos um conjunto de dados muito volumoso devido, por exemplo, à execução de um algoritmo de vetorização que tenha gerado muitas dimensões, uma estratégia é reduzir esse número para aliviar o consumo de recursos computacionais bem como evitar a maldição e dimensionalidade (em palavras rápidas, ruído causado pela correlação inerente ao excesso de colunas de um conjunto de dados). No caso da redução de dimensionalidade, qual biblioteca podemos utilizar?
Uma biblioteca muito utilizada para redução de dimensionalidade em Python é a scikit-learn. Ela possui diversas técnicas de redução de dimensionalidade, como PCA (Principal Component Analysis), t-SNE (t-Distributed Stochastic Neighbor Embedding) e LLE (Locally Linear Embedding), entre outras.
0
0
Faça como milhares de estudantes: teste grátis o Passei Direto
Compartilhar