MLflow エクスペリメント

MLflow エクスペリメントデータソースには、MLflow エクスペリメント実行データを読み込むための標準 API が用意されています。ノートブックのエクスペリメントからデータを読み込むことも、MLflow エクスペリメント名またはエクスペリメント ID を使用することもできます。

要件

Databricks Runtime 6.0 機械学習以上。

ノートブックエクスペリメントからデータを読み込む

ノートブックエクスペリメントからデータを読み込むには、 load().

df = spark.read.format("mlflow-experiment").load()
display(df)

val df = spark.read.format("mlflow-experiment").load()
display(df)

エクスペリメント ID を使用したデータのロード

1 つ以上のワークスペースエクスペリメントからデータをロードするには、次に示すようにエクスペリメント ID を指定します。

df = spark.read.format("mlflow-experiment").load("3270527066281272")
display(df)

val df = spark.read.format("mlflow-experiment").load("3270527066281272,953590262154175")
display(df)

エクスペリメント名を使用したデータの読み込み

エクスペリメント名を load() メソッドに渡すこともできます。

expId = mlflow.get_experiment_by_name("/Shared/diabetes_experiment/").experiment_id
df = spark.read.format("mlflow-experiment").load(expId)
display(df)

val expId = mlflow.getExperimentByName("/Shared/diabetes_experiment/").get.getExperimentId
val df = spark.read.format("mlflow-experiment").load(expId)
display(df)

メトリクスとパラメータに基づくデータのフィルタリング

このセクションの例では、エクスペリメントからデータをロードした後にデータをフィルタリングする方法を示します。

df = spark.read.format("mlflow-experiment").load("3270527066281272")
filtered_df = df.filter("metrics.loss < 0.01 AND params.learning_rate > '0.001'")
display(filtered_df)

val df = spark.read.format("mlflow-experiment").load("3270527066281272")
val filtered_df = df.filter("metrics.loss < 1.85 AND params.num_epochs > '30'")
display(filtered_df)

スキーマ

データソースによって返される DataFrame のスキーマは次のとおりです。

root
|-- run_id: string
|-- experiment_id: string
|-- metrics: map
|    |-- key: string
|    |-- value: double
|-- params: map
|    |-- key: string
|    |-- value: string
|-- tags: map
|    |-- key: string
|    |-- value: string
|-- start_time: timestamp
|-- end_time: timestamp
|-- status: string
|-- artifact_uri: string