モデルトレーニングの例

このセクションでは、多くの一般的なオープンソースライブラリを使用して Databricks で機械学習モデルをトレーニングする方法を示す例を紹介します。

また、 Mosaic AutoML を使用すると、モデル トレーニング用のデータセットが自動的に準備され、scikit-learn や XGBoost などのオープンソース ライブラリを使用して一連の試行が実行され、各試行実行のソース コードを含む Python ノートブックが作成されるため、コードを確認、再現、および変更できます。

機械学習の例

パッケージ

ノートブック

機能

Scikit-Learn

機械学習のチュートリアル

Unity Catalog、分類モデル、MLflow、HyperoptとMLflowによる自動ハイパーパラメーターチューニング

Scikit-Learn

エンドツーエンドの例

Unity Catalog、 分類モデル 、 MLflow、 Hyperopt and MLflowによる自動ハイパーパラメーターチューニング 、 XGBoost

MLlib

MLLibの例

二項分類、決定木、GBT回帰、構造化ストリーミング、カスタムトランスフォーマー

XGBoost

XGBoostの例

Python、PySpark、Scala、シングルノードワークロード、分散トレーニング

ハイパーパラメータチューニングの例

Databricksでのハイパーパラメータチューニングに関する一般的な情報については、「ハイパーパラメーターチューニング」を参照してください。

パッケージ

ノートブック

機能

オプツナ

Optunaを始めよう

Optuna、分散型Optuna、 Scikit-Learn、 MLflow

Hyperopt

分散hyperopt

分散hyperopt、Scikit-Learn、MLflow

Hyperopt

モデルの比較

分散hyperoptを使用して、ハイパーパラメータ空間でさまざまなモデルタイプを同時に検索する

Hyperopt

分散トレーニングのアルゴリズムとhyperopt

Hyperopt、MLlib

Hyperopt

Hyperoptのベストプラクティス

さまざまなサイズのデータセットのベストプラクティス