Pré-processar dados para aprendizado de máquina e aprendizado profundo

Você pode usar o Databricks Feature Store para criar novos recursos, explorar e reutilizar recursos existentes e selecionar recursos para treinamento e modelo de pontuação do aprendizado de máquina.

Em dataset grandes, você pode usar Spark SQL e MLlib para engenharia de recursos. A biblioteca de terceiros incluída no Databricks Runtime ML, como Scikit-Learn também fornece métodos auxiliares úteis. Para obter exemplos, consulte o seguinte Notebook machine learning para Scikit-Learn e MLlib:

Para processamento de recursos de aprendizagem profunda mais complexos, este exemplo Notebook ilustra como usar o aprendizado de transferência para caracterização:

Recursos para aprendizado de transferência