MLflow エクスペリメントを使用してトレーニングのランを整理する
エクスペリメントは、 モデルのトレーニングを実行するための組織の単位です。 エクスペリメントには、ワークスペースとノートブックの 2 種類があります。
ワークスペースエクスペリメントは、 Databricks Machine Learning UI または MLflow API から作成できます。 ワークスペースエクスペリメントはどのノートブックにも関連付けられておらず、どのノートブックもエクスペリメント ID またはエクスペリメント名を使用してこれらのエクスペリメントへの実行をログに記録できます。
ノートブック エクスペリメントは、特定のノートブックに関連付けられています。 Databricks は、 mlflow.start_run() を使用して実行を開始するときにアクティブなエクスペリメントがない場合、ノートブック エクスペリメントを自動的に作成します。
アクセスできるワークスペース内のすべてのエクスペリメントを表示するには、サイドバーで [ 機械学習] > [エクスペリメント ] を選択します。
ワークスペースのエクスペリメントの作成
このセクションでは、Databricks UI を使用してワークスペースエクスペリメントを作成する方法について説明します。 ワークスペースエクスペリメントは、 ワークスペース から直接作成することも 、[エクスペリメント] ページから作成することもできます。
MLflow API 、または databricks_mlflow_experiment を使った Databricks Terraform プロバイダー を使用することもできます。
ワークスペース エクスペリメントへの実行のログ記録の手順については、「 ログ記録のサンプル ノートブック」を参照してください。
サイドバーの 「ワークスペース 」をクリックします 。
エクスペリメントを作成するフォルダーに移動します。
フォルダーを右クリックし、[ MLflow エクスペリメントの作成] > を選択します。
[MLflow エクスペリメントの作成] ダイアログで、エクスペリメントの名前とオプションの成果物の場所を入力します。 アーティファクトの場所を指定しない場合、アーティファクトは
dbfs:/databricks/mlflow-tracking/<experiment-id>
に格納されます。Databricks では、 DBFS、GCS、Azure Blob Storage の成果物の場所がサポートされています。.
アーティファクトを GCS に保存するには、
gs://<bucket-name>/<file-path-inside-bucket>
という形式の URI を指定します。GCS に格納された成果物は、MLflow UI に表示されません。オブジェクト・ストレージ・クライアントを使用してダウンロードする必要があります。注
成果物を DBFS 以外の場所に格納すると、成果物は MLflow UI に表示されません。 DBFS以外の場所に格納されているモデルは、モデルレジストリに登録できません。
[ 作成] をクリックします。 空のエクスペリメントが表示されます。
エクスペリメントページから新しいワークスペースエクスペリメントを作成することもできます。 新しいエクスペリメントを作成するには、ドロップダウン メニューを使用します 。 ドロップダウン メニューから、AutoML エクスペリメントまたは空白 (空) エクスペリメント のいずれかを選択できます。
AutoML エクスペリメント. [ AutoML エクスペリメントの構成 ] ページが表示されます。 Auto機械学習の使用に関する情報については、「 Databricks Auto機械学習 UI を使用して機械学習モデルをトレーニングする」を参照してください。
ブランクエクスペリメント. [ MLflow エクスペリメントの作成 ] ダイアログが表示されます。 ダイアログに名前とオプションのアーティファクトの場所を入力して、新しいワークスペースエクスペリメントを作成します。 デフォルトのアーティファクトの場所は
dbfs:/databricks/mlflow-tracking/<experiment-id>
です。このエクスペリメントへの実行をログに記録するには、エクスペリメント パスを指定して
mlflow.set_experiment()
を呼び出します。 エクスペリメントのパスは、エクスペリメント ページの上部に表示されます。 詳細とノートブックの例については、「 ログ記録のサンプル ノートブック 」を参照してください。
ノートブックエクスペリメントの作成
ノートブックで mlflow.start_run() コマンド を使用すると、実行によってメトリクスとパラメータがアクティブなエクスペリメントに記録されます。 アクティブなエクスペリメントがない場合、Databricks はノートブック エクスペリメントを作成します。 ノートブック エクスペリメントは、対応するノートブックと同じ名前と ID を共有します。 ノートブック ID は、 ノートブックの URL と ID の末尾にある数値識別子です。
または、 mlflow.set_experiment() で既存のノートブックへの Databricks ワークスペース パスを渡して、そのノートブック エクスペリメントを作成することもできます。
ノートブック エクスペリメントへの実行のログ記録の手順については、「 ノートブックのサンプルのログ記録」を参照してください。
注
API (Python の MlflowClient.tracking.delete_experiment()
など) を使用してノートブックエクスペリメントを削除すると、ノートブック自体がごみ箱フォルダーに移動されます。
エクスペリメントの表示
アクセスできる各エクスペリメントは、[エクスペリメント] ページに表示されます。 このページから、任意のエクスペリメントを表示できます。 エクスペリメント名をクリックすると、エクスペリメントのページが表示されます。
エクスペリメントページにアクセスするその他の方法:
ワークスペースのエクスペリメントページには、ワークスペースメニューからアクセスできます。
ノートブックエクスペリメントのページには、ノートブックからアクセスできます。
エクスペリメントを検索するには、[ エクスペリメントのフィルター ] フィールドにテキストを入力して Enter キーを押すか、虫眼鏡アイコンをクリックします。 エクスペリメント リストが変更され、[ 名前]、[ 作成者]、[ 場所]、または [ 説明 ] 列に検索テキストを含むエクスペリメントのみが表示されます。
テーブル内のエクスペリメントの名前をクリックして、そのエクスペリメントページを表示します。
エクスペリメント ページには、エクスペリメントに関連付けられているすべての実行が一覧表示されます。 テーブルから、エクスペリメントの実行 名をクリックすると、エクスペリメントに関連付けられている実行の実行ページを開くことができます。 [ ソース ] 列では、実行を作成したノートブックのバージョンにアクセスできます。 また、メトリクスまたはパラメーター設定で実行を 検索およびフィルター処理 することもできます。
ノートブックエクスペリメントの表示
ノートブックの右側のサイドバーで、 エクスペリメント アイコン をクリックします。
エクスペリメント Runs サイドバーが表示され、ノートブック エクスペリメントに関連付けられている各実行の概要(実行パラメーターやメトリクスなど) が表示されます。 サイドバーの上部には、最後にログに記録されたノートブックの実行先であるエクスペリメントの名前 (ノートブックのエクスペリメントまたはワークスペースのエクスペリメント) が表示されます。
サイドバーから、エクスペリメントページに移動することも、実行に直接移動することもできます。
エクスペリメントを表示するには、右端の [エクスペリメント の実行] の横にある [エクスペリメントの実行] をクリックします 。
実行を表示するには、 実行の名前をクリックします。
エクスペリメントの管理
所有するエクスペリメントの名前変更、削除、または権限の管理は、[エクスペリメント] ページ、[ エクスペリメント] ページ、またはワークスペース メニューから行うことができます。
注
Databricks Git フォルダー内のノートブックによって作成された MLflow エクスペリメントの権限を直接名前変更、削除、または管理することはできません。 これらのアクションは Git フォルダー レベルで実行する必要があります。
エクスペリメント一覧ページまたはエクスペリメントページからエクスペリメントの名前を変更する
プレビュー
この機能はパブリックプレビュー段階です。
エクスペリメント ページまたはエクスペリメント ページからエクスペリメントの名前を変更するには、 をクリックして [ 名前の変更] を選択します。
エクスペリメント名のコピー
エクスペリメント名をコピーするには、体験ページの上部にあります。 MLflowコマンド set_experiment
でこの名前を使用して、アクティブなMLflowエクスペリメントを設定できます。
ノートブックのエクスペリメントサイドバーから エクスペリメント名をコピーすることもできます。
ノートブックエクスペリメントの削除
ノートブック エクスペリメントはノートブックの一部であり、個別に削除することはできません。 ノートブックを削除すると、関連付けられている ノートブック エクスペリメントが削除されます。 UI を使用してノートブック エクスペリメントを削除すると、ノートブックも削除されます。
API を使用してノートブックのエクスペリメントを削除するには、 Workspace API を使用して、ノートブックとエクスペリメントの両方がワークスペースから削除されるようにします。
ワークスペースまたはノートブックのエクスペリメントを [エクスペリメント] ページまたは [エクスペリメント] ページから削除します。
プレビュー
この機能はパブリックプレビュー段階です。
エクスペリメント ページまたはエクス ペリメント ページからエクスペリメントを削除するには、 をクリックして [ 削除] を選択します。
ノートブック エクスペリメントを削除すると、ノートブックも削除されます。
エクスペリメントのアクセス許可を変更する
エクスペリメントのアクセス許可を [ エクスペリメント] ページから変更するには、[ 共有] をクリックします。
所有するエクスペリメントのアクセス許可は、 エクスペリメント ページから変更できます。 [ アクション] 列をクリックし 、[アクセス許可 ] を選択します。
拡張機能のアクセス許可レベルの詳細については、 MLflow拡張機能 ACL」を参照してください。
ワークスペース間でエクスペリメントをコピーする
ワークスペース間で MLflow エクスペリメントを移行するには、コミュニティ主導の オープンソース プロジェクト MLflow エクスポート/インポートを使用できます。
これらのツールを使用すると、次のことができます。
同じトラッキング サーバーまたは別のトラッキング サーバー内の他のデータサイエンティストと共有および共同作業します。 たとえば、エクスペリメントを別のユーザーからワークスペースに複製できます。
MLflow エクスペリメントをコピーし、ローカル追跡サーバーから Databricks ワークスペースに実行します。
ミッション クリティカルなエクスペリメントとモデルを別の Databricks ワークスペースにバックアップします。