Databricks外部からの MLflow トラッキング サーバーへのアクセス

独自のアプリケーションから MLflow 追跡サーバーにログを記録することもできます。 この記事では、必要な構成手順について説明します。 まず、MLflow をインストールし、資格情報を構成します (ステップ 1)。 次に、アプリケーションを構成します (ステップ 2)。

オープンソーストラッキングサーバーを起動してログに記録する方法については、 MLflow オープンソースのドキュメントを参照してください。

ステップ 1: 環境を構成する

Databricks でホストされている MLflow 追跡サーバーにアクセスするように環境を構成するには:

  1. pip install mlflowを使用してMLflowをインストールします。

  2. 認証の構成

    1. REST API トークンを生成する

    2. トークンを使用して資格情報を指定し、環境変数を設定します。

      # Configure MLflow to communicate with a Databricks-hosted tracking server
      export MLFLOW_TRACKING_URI=databricks
      # Specify the workspace hostname and token
      export DATABRICKS_HOST="..."
      export DATABRICKS_TOKEN="..."
      

ステップ 2: MLflow アプリケーションを構成する

資格情報ファイルの作成時に --profile を使用してプロファイル名を指定した場合は 、追跡 URIdatabricksまたは databricks://<profileName>に設定して、Databricks にログを記録するように MLflow アプリケーションを構成します。たとえば、 MLFLOW_TRACKING_URI 環境変数を "databricks" に設定することでこれを実現できます。