機械学習とディープラーニング のためのデータの前処理

Databricks Feature Store を使用して、新しい機能の作成、既存の機能の探索と再利用、機械学習モデルのトレーニングとスコアリングのための機能の選択を行うことができます。

大規模なデータセットでは、特徴エンジニアリングに Spark SQL と MLlib を使用できます。 Scikit-Learn などの Databricks Runtime 機械学習に含まれるサードパーティのライブラリも、便利なヘルパー メソッドを提供します。例については、 Scikit-Learn と MLlib の次の機械学習ノートブックを参照してください。

より複雑なディープラーニング特徴処理の場合、このサンプル ノートブックは、特徴量化に転移学習を使用する方法を示しています。