ジョブAPI 2.0

重要

この記事では、Jobs API のバージョン 2.0 について説明します。ただし、Databricks では、新規および既存のクライアントとスクリプトに Jobs API 2.1 を使用することをお勧めします。バージョン 2.0 から 2.1 への変更の詳細については、「 Jobs API 2.0 から 2.1 への更新」を参照してください。

ジョブ API を使用すると、ジョブを作成、編集、および削除できます。ジョブ API への要求の最大許容サイズは 10 MB です。

Databricks ジョブを使用した複数のタスクのオーケストレーションをサポートするジョブ API の更新の詳細については、「ジョブ API 2.0 から 2.1 への更新」を参照してください。

警告

シークレットをハードコーディングしたり、プレーンテキストで保存したりしないでください。シークレット API を使用して、Databricks CLI でシークレットを管理します。シークレットユーティリティ (dbutils.secrets) を使用するノートブックとジョブでシークレットを参照します。

注

ジョブ API 要求を行うときに 500 レベルのエラーが発生した場合、Databricks では、最大 10 分間 (再試行間隔は 30 秒以上) 要求を再試行することをお勧めします。

重要

Databricks REST APIsにアクセスするには、認証する必要があります。

創造する

エンドポイント	HTTP メソッド
`2.0/jobs/create`	`POST`

新しいジョブを作成します。

例

この例では、毎晩午後 10 時 15 分に JAR タスクを実行するジョブを作成します。

依頼

curl --netrc --request POST \
https://<databricks-instance>/api/2.0/jobs/create \
--data @create-job.json \
| jq .

create-job.json:

{
  "name": "Nightly model training",
  "new_cluster": {
    "spark_version": "7.5.x-scala2.12",
    "node_type_id": "n1-highmem-4",
    "num_workers": 10
  },
  "libraries": [
    {
      "jar": "dbfs:/my-jar.jar"
    },
    {
      "maven": {
        "coordinates": "org.jsoup:jsoup:1.7.2"
      }
    }
  ],
  "timeout_seconds": 3600,
  "max_retries": 1,
  "schedule": {
    "quartz_cron_expression": "0 15 22 * * ?",
    "timezone_id": "America/Los_Angeles"
  },
  "spark_jar_task": {
    "main_class_name": "com.databricks.ComputeModels"
  }
}

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
ソリューションに適したフィールドを含む create-job.json の内容。

この例では、.netrc を使用します。ファイルと JQ。

応答

{
  "job_id": 1
}

要求構造

重要

新しいジョブクラスターでジョブを実行すると、ジョブはジョブコンピュート (自動) ワークロードとして扱われ、ジョブコンピュートの価格が適用されます。
既存の汎用クラスターでジョブを実行すると、汎用コンピュート (対話型) ワークロードとして扱われ、汎用コンピュートの価格が適用されます。

フィールド名	タイプ	説明
`existing_cluster_id` 又は `new_cluster`	`STRING` または新規クラスター	existing_cluster_idの場合、このジョブのすべての実行に使用される既存のクラスターの ID。既存のクラスターでジョブを実行するときに、クラスターが応答しなくなった場合は、クラスターを手動で再起動する必要がある場合があります。信頼性を高めるために、新しいクラスターでジョブを実行することをお勧めします。 new_clusterの場合は、実行ごとに作成されるクラスターの説明。パイプラインタスクを指定する場合、このフィールドは空にすることができます。
`notebook_task` または `spark_jar_task` 、 `spark_python_task` 、 `spark_submit_task` 、または `pipeline_task` `run_job_task`	ノートブックタスク OR SparkJarTask OR SparkPythonTask OR SparkSubmitTask OR PipelineTask OR RunJobTask	notebook_task の場合、このジョブでノートブックを実行する必要があることを示します。このフィールドは、spark_jar_task と組み合わせて指定することはできません。 spark_jar_taskの場合、このジョブが JAR を実行する必要があることを示します。 spark_python_taskの場合、このジョブで Python ファイルを実行することを示します。 spark_submit_taskの場合、このジョブが spark 送信スクリプトによって起動される必要があることを示します。 pipeline_taskの場合、このジョブが Delta Live Tables パイプラインを実行する必要があることを示します。 run_job_taskの場合、このジョブが別のジョブを実行する必要があることを示します。
`name`	`STRING`	ジョブのオプションの名前。デフォルト値は `Untitled`です。
`libraries`	ライブラリの配列	ジョブを実行するクラスターにインストールするライブラリのオプションのリスト。デフォルト値は空のリストです。
`email_notifications`	ジョブメール通知	このジョブの実行の開始時と完了時、およびこのジョブが削除されたときに通知される Eメールアドレスのオプションのセット。デフォルトの動作では、Eメールは送信されません。
`webhook_notifications`	ウェブフック通知	このジョブの実行が開始、完了、または失敗したときに通知するシステム宛先のオプションのセット。
`notification_settings`	ジョブ通知設定	このジョブの各 `email_notifications` および `webhook_notifications` に通知を送信するときに使用されるオプションの通知設定。
`timeout_seconds`	`INT32`	このジョブの各実行に適用されるオプションのタイムアウト。デフォルトの動作では、タイムアウトはありません。
`max_retries`	`INT32`	失敗した実行を再試行するオプションの最大数。実行は、 `FAILED` result_stateまたは `INTERNAL_ERROR` `life_cycle_state`で完了した場合、失敗したと見なされます。値 -1 は無期限に再試行することを意味し、値 0 は再試行しないことを意味します。デフォルトの動作は、再試行しないことです。
`min_retry_interval_millis`	`INT32`	失敗した実行の開始とその後の再試行実行の間のオプションの最小間隔 (ミリ秒単位)。既定の動作では、失敗した実行がすぐに再試行されます。
`retry_on_timeout`	`BOOL`	タイムアウト時にジョブを再試行するかどうかを指定するオプションのポリシー。デフォルトの動作では、タイムアウト時に再試行しません。
`schedule`	クロンスケジュール	このジョブのオプションの定期的なスケジュール。デフォルトの動作では、ジョブ UI で [ 今すぐ実行 ] をクリックするか、API 要求を `runNow`に送信することによってトリガーされたときにジョブが実行されます。
`max_concurrent_runs`	`INT32`	ジョブの並列実行の最大許容数(オプション)。同じジョブの複数の実行を同時に実行できるようにする場合は、この値を設定します。これは、たとえば、頻繁なスケジュールでジョブをトリガーし、連続した実行を互いにオーバーラップさせる場合や、入力パラメーターが異なる複数の実行をトリガーする場合に便利です。この設定は、新しい実行にのみ影響します。たとえば、ジョブの同時実行数が 4 で、並列アクティブ実行が 4 つあるとします。次に、同時実行を 3 に設定しても、アクティブな実行は強制終了されません。ただし、それ以降は、アクティブな実行が 3 つ未満でない限り、新しい実行はスキップされます。この値は 1000 を超えることはできません。この値を 0 に設定すると、すべての新しい実行がスキップされます。デフォルトの動作では、並列実行は 1 つだけ許可されます。

応答構造

フィールド名	タイプ	説明
`job_id`	`INT64`	新しく作成されたジョブの正規識別子。

{
  "jobs": [
    {
      "job_id": 1,
      "settings": {
        "name": "Nightly model training",
        "new_cluster": {
          "spark_version": "7.5.x-scala2.12",
          "node_type_id": "n1-highmem-4",
          "num_workers": 10
        },
        "libraries": [
          {
            "jar": "dbfs:/my-jar.jar"
          },
          {
            "maven": {
              "coordinates": "org.jsoup:jsoup:1.7.2"
            }
          }
        ],
        "timeout_seconds": 100000000,
        "max_retries": 1,
        "schedule": {
          "quartz_cron_expression": "0 15 22 * * ?",
          "timezone_id": "America/Los_Angeles",
          "pause_status": "UNPAUSED"
        },
        "spark_jar_task": {
          "main_class_name": "com.databricks.ComputeModels"
        }
      },
      "created_time": 1457570074236
    }
  ]
}

応答構造

フィールド名	タイプ	説明
`jobs`	ジョブの配列	ジョブのリスト。

削除

エンドポイント	HTTP メソッド
`2.0/jobs/delete`	`POST`

ジョブを削除し、 JobSettings.email_notificationsで指定されたアドレスにEメールを送信します。ジョブが既に削除されている場合、アクションは発生しません。ジョブが削除されると、その詳細も実行履歴もジョブ UI または API に表示されません。ジョブは、この要求の完了時に削除されることが保証されます。ただし、この要求を受信する前にアクティブだった実行は、まだアクティブである可能性があります。これらは非同期的に終了します。

例

curl --netrc --request POST \
https://<databricks-instance>/api/2.0/jobs/delete \
--data '{ "job_id": <job-id> }'

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
<job-id> をジョブの ID に置き換えます (例: 123)。

この例では、.netrc を使用します。ファイル。

要求構造

フィールド名	タイプ	説明
`job_id`	`INT64`	削除するジョブの正規識別子。このフィールドは必須です。

取得

エンドポイント	HTTP メソッド
`2.0/jobs/get`	`GET`

1 つのジョブに関する情報を取得します。

例

依頼

curl --netrc --request GET \
'https://<databricks-instance>/api/2.0/jobs/get?job_id=<job-id>' \
| jq .

又は：

curl --netrc --get \
https://<databricks-instance>/api/2.0/jobs/get \
--data job_id=<job-id> \
| jq .

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
<job-id> をジョブの ID に置き換えます (例: 123)。

この例では、.netrc を使用します。ファイルと JQ。

応答

{
  "job_id": 1,
  "settings": {
    "name": "Nightly model training",
    "new_cluster": {
      "spark_version": "7.5.x-scala2.12",
      "node_type_id": "n1-highmem-4",
      "aws_attributes": {
        "availability": "ON_DEMAND"
      },
      "num_workers": 10
    },
    "libraries": [
      {
        "jar": "dbfs:/my-jar.jar"
      },
      {
        "maven": {
          "coordinates": "org.jsoup:jsoup:1.7.2"
        }
      }
    ],
    "email_notifications": {
      "on_start": [],
      "on_success": [],
      "on_failure": []
    },
    "webhook_notifications": {
      "on_start": [
        {
          "id": "bf2fbd0a-4a05-4300-98a5-303fc8132233"
        }
      ],
      "on_success": [
        {
          "id": "bf2fbd0a-4a05-4300-98a5-303fc8132233"
        }
      ],
      "on_failure": []
    },
    "timeout_seconds": 100000000,
    "max_retries": 1,
    "schedule": {
      "quartz_cron_expression": "0 15 22 * * ?",
      "timezone_id": "America/Los_Angeles",
      "pause_status": "UNPAUSED"
    },
    "spark_jar_task": {
      "main_class_name": "com.databricks.ComputeModels"
    }
  },
  "created_time": 1457570074236
}

要求構造

フィールド名	タイプ	説明
`job_id`	`INT64`	情報を取得するジョブの正規識別子。このフィールドは必須です。

応答構造

フィールド名	タイプ	説明
`job_id`	`INT64`	このジョブの正規識別子。
`creator_user_name`	`STRING`	作成者のユーザー名。ユーザーが削除された場合、このフィールドは応答に含まれません。
`settings`	ジョブ設定	このジョブとそのすべての実行の設定。これらの設定は、エンドポイントのリセットまたは更新を使用して更新できます。
`created_time`	`INT64`	このジョブが作成された時刻 (エポックミリ秒単位) (1970 年 1 月 1 日 UTC からのミリ秒単位)。

リセット

エンドポイント	HTTP メソッド
`2.0/jobs/reset`	`POST`

特定のジョブのすべての設定を上書きします。 Update エンドポイントを使用して、ジョブ設定を部分的に更新します。

例

この要求例では、ジョブ 2 が作成例のジョブ 1 と同じになります。

curl --netrc --request POST \
https://<databricks-instance>/api/2.0/jobs/reset \
--data @reset-job.json \
| jq .

reset-job.json:

{
  "job_id": 2,
  "new_settings": {
    "name": "Nightly model training",
    "new_cluster": {
      "spark_version": "7.5.x-scala2.12",
      "node_type_id": "n1-highmem-4",
      "aws_attributes": {
        "availability": "ON_DEMAND"
      },
      "num_workers": 10
    },
    "libraries": [
      {
        "jar": "dbfs:/my-jar.jar"
      },
      {
        "maven": {
          "coordinates": "org.jsoup:jsoup:1.7.2"
        }
      }
    ],
    "email_notifications": {
      "on_start": [],
      "on_success": [],
      "on_failure": []
    },
    "webhook_notifications": {
      "on_start": [
        {
          "id": "bf2fbd0a-4a05-4300-98a5-303fc8132233"
        }
      ],
      "on_success": [
        {
          "id": "bf2fbd0a-4a05-4300-98a5-303fc8132233"
        }
      ],
      "on_failure": []
    },
    "timeout_seconds": 100000000,
    "max_retries": 1,
    "schedule": {
      "quartz_cron_expression": "0 15 22 * * ?",
      "timezone_id": "America/Los_Angeles",
      "pause_status": "UNPAUSED"
    },
    "spark_jar_task": {
      "main_class_name": "com.databricks.ComputeModels"
    }
  }
}

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
ソリューションに適したフィールドを含む reset-job.json の内容。

この例では、.netrc を使用します。ファイルと JQ。

要求構造

フィールド名

タイプ

説明

job_id

INT64

リセットするジョブの正規識別子。このフィールドは必須です。

new_settings

ジョブ設定

ジョブの新しい設定。これらの設定は、古い設定を完全に置き換えます。

フィールド JobSettings.timeout_seconds に対する変更は、アクティブな実行に適用されます。他のフィールドへの変更は、今後の実行にのみ適用されます。

更新

エンドポイント	HTTP メソッド
`2.0/jobs/update`	`POST`

既存のジョブの特定の設定を追加、変更、または削除します。 [エンドポイントのリセット ] を使用して、すべてのジョブ設定を上書きします。

例

この要求例では、ライブラリを削除し、作成例で定義されているジョブ 1 に Email 通知設定を追加します。

curl --netrc --request POST \
https://<databricks-instance>/api/2.0/jobs/update \
--data @update-job.json \
| jq .

update-job.json:

{
  "job_id": 1,
  "new_settings": {
    "existing_cluster_id": "1201-my-cluster",
    "email_notifications": {
      "on_start": [ "someone@example.com" ],
      "on_success": [],
      "on_failure": []
    }
  },
  "fields_to_remove": ["libraries"]
}

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
ソリューションに適したフィールドを含む update-job.json の内容。

この例では、.netrc を使用します。ファイルと JQ。

要求構造

フィールド名

タイプ

説明

job_id

INT64

更新するジョブの正規識別子。このフィールドは必須です。

new_settings

ジョブ設定

ジョブの新しい設定。

配列を除き、 new_settingsで指定された最上位フィールドは完全に置き換えられます。配列は、 task_key や job_cluster_keyなどのそれぞれのキーフィールドに基づいてマージされ、同じキーを持つ配列エントリは完全に置き換えられます。配列のマージを除き、入れ子になったフィールドの部分的な更新はサポートされていません。

フィールド JobSettings.timeout_seconds に対する変更は、アクティブな実行に適用されます。他のフィールドへの変更は、今後の実行にのみ適用されます。

fields_to_remove

の配列 STRING

ジョブ設定の最上位フィールドを削除します。ネストされたフィールドの削除は、 tasks 配列と job_clusters 配列のエントリを除き、サポートされていません。たとえば、このフィールドの有効な引数は次のとおりです。 ["libraries", "schedule", "tasks/task_1", "job_clusters/Default"]

このフィールドはオプションです。

今すぐ実行

重要

ワークスペースは、並列タスクの実行回数が 1000 回に制限されています。すぐに開始できない実行を要求すると、 429 Too Many Requests 応答が返されます。
ワークスペースが 1 時間に作成できるジョブの数は 10000 に制限されています ("実行の送信" を含む)。この制限は、REST API およびノートブックワークフローによって作成されたジョブにも影響します。

エンドポイント	HTTP メソッド
`2.0/jobs/run-now`	`POST`

今すぐジョブを実行し、トリガーされた実行の run_id を返します。

ヒント

Create を [今すぐ実行] と共に呼び出す場合は、代わりに Runs 送信エンドポイントを使用して、ジョブを作成せずにワークロードを直接送信できます。

例

curl --netrc --request POST \
https://<databricks-instance>/api/2.0/jobs/run-now \
--data @run-job.json \
| jq .

run-job.json:

ノートブックジョブのリクエストの例:

{
  "job_id": 1,
  "notebook_params": {
    "name": "john doe",
    "age": "35"
  }
}

JAR ジョブの要求の例を次に示します。

{
  "job_id": 2,
  "jar_params": [ "john doe", "35" ]
}

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
ソリューションに適したフィールドを含む run-job.json の内容。

この例では、.netrc を使用します。ファイルと JQ。

要求構造

フィールド名	タイプ	説明
`job_id`	`INT64`
`jar_params`	の配列 `STRING`	JARタスクを持つジョブのパラメーターのリスト(例: `"jar_params": ["john doe", "35"]`。パラメーターは、Spark JAR タスクで指定されたメインクラスの main 関数を呼び出すために使用されます。 `run-now`時に指定しない場合、デフォルトでは空のリストになります。jar_params をノートブックと組み合わせて指定することはできません。このフィールドの JSON 表現 (つまり、 `{"jar_params":["john doe","35"]}`) は 10,000 バイトを超えることはできません。
`notebook_params`	パラムペアの地図	ノートブックタスクを含むジョブのキーから値へのマップ(例: `"notebook_params": {"name": "john doe", "age": "35"}`。マップはノートブックに渡され、 dbutils.widgets.get 関数を使用してアクセスできます。 `run-now`時に指定しない場合、トリガーされた実行ではジョブの基本パラメーターが使用されます。 jar_params と組み合わせてノートブックを指定することはできません。このフィールドの JSON 表現 (つまり、 `{"notebook_params":{"name":"john doe","age":"35"}}`) は 10,000 バイトを超えることはできません。
`python_params`	の配列 `STRING`	Python タスクを持つジョブのパラメーターのリスト。 `"python_params": ["john doe", "35"]`。パラメーターは、コマンドラインパラメーターとして Python ファイルに渡されます。 `run-now`時に指定すると、job設定で指定されたパラメーターが上書きされます。このフィールドの JSON 表現 (つまり、 `{"python_params":["john doe","35"]}`) は 10,000 バイトを超えることはできません。
`spark_submit_params`	の配列 `STRING`	スパーク送信タスクを持つジョブのパラメーターのリスト (例: `"spark_submit_params": ["--class", "org.apache.spark.examples.SparkPi"]`。パラメーターは、コマンドラインパラメーターとして spark-submit スクリプトに渡されます。 `run-now`時に指定すると、job設定で指定されたパラメーターが上書きされます。このフィールドの JSON 表現は、10,000 バイトを超えることはできません。
`idempotency_token`	`STRING`	ジョブ実行要求のべき等性を保証するオプションのトークン。指定されたトークンを使用した実行が既に存在する場合、要求は新しい実行を作成しませんが、代わりに既存の実行の ID を返します。指定されたトークンを使用した実行が削除されると、エラーが返されます。べき等トークンを指定すると、失敗したときに要求が成功するまで再試行できます。 Databricks は、そのべき等トークンを使用して 1 回の実行が正確に起動されることを保証します。このトークンは最大 64 文字である必要があります。たとえば、`"idempotency_token": "123"`などです。

応答構造

フィールド名	タイプ	説明
`run_id`	`INT64`	新しくトリガーされた実行のグローバル一意 ID。
`number_in_job`	`INT64`	ジョブのすべての実行におけるこの実行のシーケンス番号。

実行の送信

重要

ワークスペースは、並列タスクの実行回数が 1000 回に制限されています。すぐに開始できない実行を要求すると、 429 Too Many Requests 応答が返されます。
ワークスペースが 1 時間に作成できるジョブの数は 10000 に制限されています ("実行の送信" を含む)。この制限は、REST API およびノートブックワークフローによって作成されたジョブにも影響します。

エンドポイント	HTTP メソッド
`2.0/jobs/runs/submit`	`POST`

1 回限りの実行を送信します。このエンドポイントを使用すると、ジョブを作成せずにワークロードを直接送信できます。 jobs/runs/get API を使用して、ジョブの送信後に実行状態を確認します。

例

依頼

curl --netrc --request POST \
https://<databricks-instance>/api/2.0/jobs/runs/submit \
--data @submit-job.json \
| jq .

submit-job.json:

{
  "run_name": "my spark task",
  "new_cluster": {
    "spark_version": "7.5.x-scala2.12",
    "node_type_id": "n1-highmem-4",
    "aws_attributes": {
      "availability": "ON_DEMAND"
    },
    "num_workers": 10
  },
  "libraries": [
    {
      "jar": "dbfs:/my-jar.jar"
    },
    {
      "maven": {
        "coordinates": "org.jsoup:jsoup:1.7.2"
      }
    }
  ],
  "spark_jar_task": {
    "main_class_name": "com.databricks.ComputeModels"
  }
}

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
ソリューションに適したフィールドを含む submit-job.json の内容。

この例では、.netrc を使用します。ファイルと JQ。

応答

{
  "run_id": 123
}

要求構造

重要

新しいジョブクラスターでジョブを実行すると、ジョブはジョブコンピュート (自動) ワークロードとして扱われ、ジョブコンピュートの価格が適用されます。
既存の汎用クラスターでジョブを実行すると、汎用コンピュート (対話型) ワークロードとして扱われ、汎用コンピュートの価格が適用されます。

フィールド名	タイプ	説明
`existing_cluster_id` 又は `new_cluster`	`STRING` または新規クラスター	existing_cluster_idの場合、このジョブのすべての実行に使用される既存のクラスターの ID。既存のクラスターでジョブを実行するときに、クラスターが応答しなくなった場合は、クラスターを手動で再起動する必要がある場合があります。信頼性を高めるために、新しいクラスターでジョブを実行することをお勧めします。 new_clusterの場合は、実行ごとに作成されるクラスターの説明。パイプラインタスクを指定する場合、このフィールドは空にすることができます。
`notebook_task` または `spark_jar_task` 、 `spark_python_task` 、 `spark_submit_task` 、または `pipeline_task` `run_job_task`	ノートブックタスク OR SparkJarTask OR SparkPythonTask OR SparkSubmitTask OR PipelineTask OR RunJobTask	notebook_task の場合、このジョブでノートブックを実行する必要があることを示します。このフィールドは、spark_jar_task と組み合わせて指定することはできません。 spark_jar_taskの場合、このジョブが JAR を実行する必要があることを示します。 spark_python_taskの場合、このジョブで Python ファイルを実行することを示します。 spark_submit_taskの場合、このジョブが spark 送信スクリプトによって起動される必要があることを示します。 pipeline_taskの場合、このジョブが Delta Live Tables パイプラインを実行する必要があることを示します。 run_job_taskの場合、このジョブが別のジョブを実行する必要があることを示します。
`run_name`	`STRING`	実行のオプションの名前。デフォルト値は `Untitled`です。
`webhook_notifications`	ウェブフック通知	このジョブの実行が開始、完了、または失敗したときに通知するシステム宛先のオプションのセット。
`notification_settings`	ジョブ通知設定	この実行の各 `webhook_notifications` に通知を送信するときに使用されるオプションの通知設定。
`libraries`	ライブラリの配列	ジョブを実行するクラスターにインストールするライブラリのオプションのリスト。デフォルト値は空のリストです。
`timeout_seconds`	`INT32`	このジョブの各実行に適用されるオプションのタイムアウト。デフォルトの動作では、タイムアウトはありません。
`idempotency_token`	`STRING`	ジョブ実行要求のべき等性を保証するオプションのトークン。指定されたトークンを使用した実行が既に存在する場合、要求は新しい実行を作成しませんが、代わりに既存の実行の ID を返します。指定されたトークンを使用した実行が削除されると、エラーが返されます。べき等トークンを指定すると、失敗したときに要求が成功するまで再試行できます。 Databricks は、そのべき等トークンを使用して 1 回の実行が正確に起動されることを保証します。このトークンは最大 64 文字である必要があります。たとえば、`"idempotency_token": "123"`などです。

応答構造

フィールド名	タイプ	説明
`run_id`	`INT64`	新しく送信された実行の正規識別子。

実行リスト

エンドポイント	HTTP メソッド
`2.0/jobs/runs/list`	`GET`

リストは、開始時刻の降順で実行されます。

注

実行は 60 日後に自動的に削除されます。 60 日を超えて参照する場合は、有効期限が切れる前に古い実行結果を保存する必要があります。 UI を使用してエクスポートするには、「ジョブ実行結果のエクスポート」を参照してください。ジョブ API を使用してエクスポートするには、「エクスポートの実行」を参照してください。

例

依頼

curl --netrc --request GET \
'https://<databricks-instance>/api/2.0/jobs/runs/list?job_id=<job-id>&active_only=<true-false>&offset=<offset>&limit=<limit>&run_type=<run-type>' \
| jq .

又は：

curl --netrc --get \
https://<databricks-instance>/api/2.0/jobs/runs/list \
--data 'job_id=<job-id>&active_only=<true-false>&offset=<offset>&limit=<limit>&run_type=<run-type>' \
| jq .

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
<job-id> をジョブの ID に置き換えます (例: 123)。
<true-false> true または falseで.
<offset> を offset 値に置き換えます。
<limit> を limit 値に置き換えます。
<run-type> を run_type 値に置き換えます。

この例では、.netrc を使用します。ファイルと JQ。

応答

{
  "runs": [
    {
      "job_id": 1,
      "run_id": 452,
      "number_in_job": 5,
      "state": {
        "life_cycle_state": "RUNNING",
        "state_message": "Performing action"
      },
      "task": {
        "notebook_task": {
          "notebook_path": "/Users/donald@duck.com/my-notebook"
        }
      },
      "cluster_spec": {
        "existing_cluster_id": "1201-my-cluster"
      },
      "cluster_instance": {
        "cluster_id": "1201-my-cluster",
        "spark_context_id": "1102398-spark-context-id"
      },
      "overriding_parameters": {
        "jar_params": ["param1", "param2"]
      },
      "start_time": 1457570074236,
      "end_time": 1457570075149,
      "setup_duration": 259754,
      "execution_duration": 3589020,
      "cleanup_duration": 31038,
      "run_duration": 3879812,
      "trigger": "PERIODIC"
    }
  ],
  "has_more": true
}

要求構造

フィールド名	タイプ	説明
`active_only` 又は `completed_only`	`BOOL` 又は `BOOL`	active_only が `true`の場合、アクティブな実行のみが結果に含まれます。それ以外の場合は、アクティブな実行と完了した実行の両方を一覧表示します。アクティブな実行とは、 `PENDING`、`RUNNING`、または RunLifecycleState `TERMINATING` で実行されることです。このフィールドは、completed_only が `true`の場合 `true` できません。 completed_only が `true`の場合、完了した実行のみが結果に含まれます。それ以外の場合は、アクティブな実行と完了した実行の両方を一覧表示します。このフィールドは、active_only が `true`の場合 `true` できません。
`job_id`	`INT64`	リストするジョブが実行されます。省略すると、ジョブサービスはすべてのジョブからの実行を一覧表示します。
`offset`	`INT32`	返される最初の実行のオフセット (最新の実行を基準にした)。
`limit`	`INT32`	返す実行数。この値は、0 より大きく 1000 未満である必要があります。デフォルト値は 20 です。要求で制限が 0 に指定されている場合、サービスは代わりに最大制限を使用します。
`run_type`	`STRING`	返す実行の種類。実行の種類の説明については、「実行」を参照してください。

応答構造

フィールド名	タイプ	説明
`runs`	実行の配列	最近開始されたものから最も少ないものまでの実行のリスト。
`has_more`	`BOOL`	true の場合、指定されたフィルターに一致する追加の実行を一覧表示できます。

実行取得

エンドポイント	HTTP メソッド
`2.0/jobs/runs/get`	`GET`

実行のメタデータを取得します。

注

実行は 60 日後に自動的に削除されます。 60 日を超えて参照する場合は、有効期限が切れる前に古い実行結果を保存する必要があります。 UI を使用してエクスポートするには、「ジョブ実行結果のエクスポート」を参照してください。ジョブ API を使用してエクスポートするには、「エクスポートの実行」を参照してください。

例

依頼

curl --netrc --request GET \
'https://<databricks-instance>/api/2.0/jobs/runs/get?run_id=<run-id>' \
| jq .

又は：

curl --netrc --get \
https://<databricks-instance>/api/2.0/jobs/runs/get \
--data run_id=<run-id> \
| jq .

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
<run-id> を実行の ID に置き換えます (例: 123)。

この例では、.netrc を使用します。ファイルと JQ。

応答

{
  "job_id": 1,
  "run_id": 452,
  "number_in_job": 5,
  "state": {
    "life_cycle_state": "RUNNING",
    "state_message": "Performing action"
  },
  "task": {
    "notebook_task": {
      "notebook_path": "/Users/someone@example.com/my-notebook"
    }
  },
  "cluster_spec": {
    "existing_cluster_id": "1201-my-cluster"
  },
  "cluster_instance": {
    "cluster_id": "1201-my-cluster",
    "spark_context_id": "1102398-spark-context-id"
  },
  "overriding_parameters": {
    "jar_params": ["param1", "param2"]
  },
  "start_time": 1457570074236,
  "end_time": 1457570075149,
  "setup_duration": 259754,
  "execution_duration": 3589020,
  "cleanup_duration": 31038,
  "run_duration": 3879812,
  "trigger": "PERIODIC"
}

要求構造

フィールド名	タイプ	説明
`run_id`	`INT64`	メタデータを取得する実行の正規識別子。このフィールドは必須です。

応答構造

フィールド名	タイプ	説明
`job_id`	`INT64`	この実行を含むジョブの正規識別子。
`run_id`	`INT64`	実行の正規識別子。この ID は、すべてのジョブのすべての実行で一意です。
`number_in_job`	`INT64`	ジョブのすべての実行におけるこの実行のシーケンス番号。この値は 1 から始まります。
`original_attempt_run_id`	`INT64`	この実行が以前の実行試行の再試行である場合、このフィールドには元の試行のrun_idが含まれます。それ以外はrun_idと同じです。
`state`	実行状態	実行の結果とライフサイクルの状態。
`schedule`	クロンスケジュール	定期的なスケジューラによってトリガーされた場合に、この実行をトリガーした cron スケジュール。
`task`	ジョブタスク	実行によって実行されるタスク (存在する場合)。
`cluster_spec`	クラスタスペック	この実行が作成されたときのジョブのクラスター仕様のスナップショット。
`cluster_instance`	クラスターインスタンス	この実行に使用されるクラスター。新しいクラスターを使用するように実行が指定されている場合、このフィールドは、ジョブサービスが実行のクラスターを要求したときに設定されます。
`overriding_parameters`	実行パラメーター	この実行に使用されるパラメーター。
`start_time`	`INT64`	この実行が開始された時刻 (エポックミリ秒単位) (1970 年 1 月 1 日 UTC からのミリ秒数)。これは、ジョブタスクの実行が開始される時刻ではない場合があります (たとえば、ジョブが新しいクラスターで実行するようにスケジュールされている場合)、これはクラスター作成呼び出しが発行された時刻です。
`end_time`	`INT64`	この実行が終了した時刻 (エポックミリ秒) (1970 年 1 月 1 日 UTC からのミリ秒)。ジョブがまだ実行中の場合、このフィールドは 0 に設定されます。
`setup_duration`	`INT64`	クラスターのセットアップにかかった時間 (ミリ秒単位)。新しいクラスターで実行される実行の場合、これはクラスターの作成時間であり、既存のクラスターで実行される実行の場合、この時間は非常に短くする必要があります。実行の合計時間は、 `setup_duration`、 `execution_duration`、および `cleanup_duration`の合計です。 `setup_duration` フィールドは、マルチタスクジョブの実行では 0 に設定されます。マルチタスクジョブ実行の合計期間は、 `run_duration` フィールドの値です。
`execution_duration`	`INT64`	JAR またはノートブックでコマンドを実行してから、コマンドが完了、失敗、タイムアウト、キャンセル、または予期しないエラーが発生するまでにかかる時間 (ミリ秒単位)。実行の合計時間は、 `setup_duration`、 `execution_duration`、および `cleanup_duration`の合計です。 `execution_duration` フィールドは、マルチタスクジョブの実行では 0 に設定されます。マルチタスクジョブ実行の合計期間は、 `run_duration` フィールドの値です。
`cleanup_duration`	`INT64`	クラスターを終了し、関連するアーティファクトをクリーンアップするのにかかった時間 (ミリ秒単位)。実行の合計時間は、 `setup_duration`、 `execution_duration`、および `cleanup_duration`の合計です。 `cleanup_duration` フィールドは、マルチタスクジョブの実行では 0 に設定されます。マルチタスクジョブ実行の合計期間は、 `run_duration` フィールドの値です。
`run_duration`	`INT64`	ジョブの実行とそのすべての修復が完了するまでにかかった時間 (ミリ秒単位)。このフィールドは、マルチタスクジョブ実行に対してのみ設定され、タスク実行に対しては設定されません。タスクの実行時間は、 `setup_duration`、 `execution_duration`、および `cleanup_duration`の合計です。
`trigger`	トリガータイプ	この実行を開始したトリガーの種類。
`creator_user_name`	`STRING`	作成者のユーザー名。ユーザーが削除された場合、このフィールドは応答に含まれません
`run_page_url`	`STRING`	実行の詳細ページへの URL。

実行結果のエクスポート

エンドポイント	HTTP メソッド
`2.0/jobs/runs/export`	`GET`

ジョブ実行タスクをエクスポートおよび取得します。

注

ノートブックの実行のみを HTML 形式でエクスポートできます。他の種類の実行のエクスポートは失敗します。

例

依頼

curl --netrc --request GET \
'https://<databricks-instance>/api/2.0/jobs/runs/export?run_id=<run-id>' \
| jq .

又は：

curl --netrc --get \
https://<databricks-instance>/api/2.0/jobs/runs/export \
--data run_id=<run-id> \
| jq .

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
<run-id> を実行の ID に置き換えます (例: 123)。

この例では、.netrc を使用します。ファイルと JQ。

応答

{
  "views": [ {
    "content": "<!DOCTYPE html><html><head>Head</head><body>Body</body></html>",
    "name": "my-notebook",
    "type": "NOTEBOOK"
  } ]
}

JSON 応答から HTML ノートブックを抽出するには、この Python スクリプトをダウンロードして実行します。

注

__DATABRICKS_NOTEBOOK_MODEL オブジェクトのノートブック本体がエンコードされます。

要求構造

フィールド名	タイプ	説明
`run_id`	`INT64`	実行の正規識別子。このフィールドは必須です。
`views_to_export`	ビューからエクスポートへ	エクスポートするビュー (コード、ダッシュボード、またはすべて)。デフォルトは CODE です。

応答構造

フィールド名	タイプ	説明
`views`	ビューアイテムの配列	HTML 形式でエクスポートされたコンテンツ (ビュー項目ごとに 1 つ)。

実行のキャンセル

エンドポイント	HTTP メソッド
`2.0/jobs/runs/cancel`	`POST`

ジョブの実行を取り消します。実行は非同期的に取り消されるため、この要求が完了しても実行がまだ実行されている可能性があります。実行はまもなく終了します。実行がすでにターミナル life_cycle_stateにある場合、このメソッドは何も実行されません。

このエンドポイントは、 run_id パラメーターが有効であることを検証し、無効なパラメーターの場合は HTTP 状態コード 400 を返します。

例

curl --netrc --request POST \
https://<databricks-instance>/api/2.0/jobs/runs/cancel \
--data '{ "run_id": <run-id> }'

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
<run-id> を実行の ID に置き換えます (例: 123)。

この例では、.netrc を使用します。ファイル。

要求構造

フィールド名	タイプ	説明
`run_id`	`INT64`	キャンセルする実行の正規識別子。このフィールドは必須です。

すべての実行タスクのキャンセル

エンドポイント	HTTP メソッド
`2.0/jobs/runs/cancel-all`	`POST`

ジョブのすべてのアクティブな実行を取り消します。実行は非同期的に取り消されるため、新しい実行の開始が妨げられることはありません。

このエンドポイントは、 job_id パラメーターが有効であることを検証し、無効なパラメーターの場合は HTTP 状態コード 400 を返します。

例

curl --netrc --request POST \
https://<databricks-instance>/api/2.0/jobs/runs/cancel-all \
--data '{ "job_id": <job-id> }'

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
<job-id> をジョブの ID に置き換えます (例: 123)。

この例では、.netrc を使用します。ファイル。

要求構造

フィールド名	タイプ	説明
`job_id`	`INT64`	すべての実行を取り消すジョブの正規識別子。このフィールドは必須です。

タスク実行結果の取得

エンドポイント	HTTP メソッド
`2.0/jobs/runs/get-output`	`GET`

1 つのタスク実行の出力とメタデータを取得します。ノートブックタスクが dbutils.notebook.exit() を介して値を返す場合呼び出しの場合、このエンドポイントを使用してその値を取得できます。 Databricks は、出力の最初の 5 MB を返すようにこの API を制限します。より大きな結果を返すために、ジョブの結果をクラウドストレージサービスに保存できます。

このエンドポイントは、 run_id パラメーターが有効であることを検証し、無効なパラメーターの場合は HTTP 状態コード 400 を返します。

実行は 60 日後に自動的に削除されます。 60 日を超えて参照する場合は、有効期限が切れる前に古い実行結果を保存する必要があります。 UI を使用してエクスポートするには、「ジョブ実行結果のエクスポート」を参照してください。ジョブ API を使用してエクスポートするには、「エクスポートの実行」を参照してください。

例

依頼

curl --netrc --request GET \
'https://<databricks-instance>/api/2.0/jobs/runs/get-output?run_id=<run-id>' \
| jq .

又は：

curl --netrc --get \
https://<databricks-instance>/api/2.0/jobs/runs/get-output \
--data run_id=<run-id> \
| jq .

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
<run-id> を実行の ID に置き換えます (例: 123)。

この例では、.netrc を使用します。ファイルと JQ。

応答

{
  "metadata": {
    "job_id": 1,
    "run_id": 452,
    "number_in_job": 5,
    "state": {
      "life_cycle_state": "TERMINATED",
      "result_state": "SUCCESS",
      "state_message": ""
    },
    "task": {
      "notebook_task": {
        "notebook_path": "/Users/someone@example.com/my-notebook"
      }
    },
    "cluster_spec": {
      "existing_cluster_id": "1201-my-cluster"
    },
    "cluster_instance": {
      "cluster_id": "1201-my-cluster",
      "spark_context_id": "1102398-spark-context-id"
    },
    "overriding_parameters": {
      "jar_params": ["param1", "param2"]
    },
    "start_time": 1457570074236,
    "setup_duration": 259754,
    "execution_duration": 3589020,
    "cleanup_duration": 31038,
    "run_duration": 3879812,
    "trigger": "PERIODIC"
  },
  "notebook_output": {
    "result": "the maybe truncated string passed to dbutils.notebook.exit()"
  }
}

要求構造

フィールド名	タイプ	説明
`run_id`	`INT64`	実行の正規識別子。複数のタスクを持つジョブの場合、これはタスク実行の `run_id` です。「実行の取得出力」を参照してください。このフィールドは必須です。

応答構造

フィールド名

タイプ

説明

notebook_output 又は error

ノートブック出力又は STRING

notebook_outputの場合は、ノートブックタスクの出力 (使用可能な場合)。 dbutils.notebook.exit() を呼び出さずに (正常または失敗で) 終了したノートブックタスクは、空の出力を持つと見なされます。このフィールドは設定されますが、結果値は空になります。

error の場合、出力が使用できない理由を示すエラーメッセージ。メッセージは構造化されておらず、正確な形式は変更される可能性があります。

metadata

実行

出力を除く実行のすべての詳細。

実行の削除

エンドポイント	HTTP メソッド
`2.0/jobs/runs/delete`	`POST`

非アクティブな実行を削除します。実行がアクティブな場合にエラーを返します。

例

curl --netrc --request POST \
https://<databricks-instance>/api/2.0/jobs/runs/delete \
--data '{ "run_id": <run-id> }'

取り替える：

<databricks-instance> を Databricks ワークスペースのインスタンス名に置き換えます (例: 1234567890123456.7.gcp.databricks.com)。
<run-id> を実行の ID に置き換えます (例: 123)。

この例では、.netrc を使用します。ファイル。

要求構造

フィールド名	タイプ	説明
`run_id`	`INT64`	メタデータを取得する実行の正規識別子。

データ構造

このセクションの内容：

オートスケール
クラスターインスタンス
ClusterLogConf
クラスタスペック
クラスタータグ
クロンスケジュール
DbfsStorageInfo
GCSSストレージ情報
Google クラウドの属性
InitScriptInfo
ジョブ
ジョブメール通知
ジョブ通知設定
ジョブ設定
ジョブタスク
ジョブヘルスルール
ジョブヘルスルール
ライブラリ
Maven Library
新しいクラスター
ノートブック出力
ノートブックタスク
パラムペア
パイプラインタスク
PythonPyPiLibrary
RCranライブラリ
実行
ジョブタスクの実行
実行ライフサイクル状態
実行パラメーター
実行結果状態
実行状態
スパークコンファレンスペア
スパークエンビペア
スパークジャータスク
SparkPythonTask
SparkSubmitTask
トリガータイプ
アイテムを表示
ビュータイプ
ビューからエクスポートへ
ウェブフック
ウェブフック通知
ワークスペースストレージ情報

オートスケール

クラスターワーカーの最小数と最大数を定義する範囲。

フィールド名	タイプ	説明
`min_workers`	`INT32`	使用率が低い場合にクラスターをスケールダウンできるワーカーの最小数。また、作成後にクラスターが持つワーカーの初期数でもあります。
`max_workers`	`INT32`	過負荷時にクラスターがスケールアップできるワーカーの最大数。 max_workers厳密にmin_workersより大きい必要があります。

クラスタインスタンス

実行で使用されるクラスターと Spark コンテキストの識別子。これら 2 つの値は一緒になって、すべての時間にわたって実行コンテキストを識別します。

フィールド名

タイプ

説明

cluster_id

STRING

実行で使用されるクラスターの正規識別子。このフィールドは、既存のクラスターでの実行で常に使用できます。新しいクラスターでの実行の場合、クラスターが作成されると使用可能になります。この値は、 /#setting/sparkui/$cluster_id/driver-logsを参照してログを表示するために使用できます。ログは、実行が完了した後も引き続き使用できます。

識別子がまだ使用できない場合、応答にはこのフィールドは含まれません。

spark_context_id

STRING

実行で使用される Spark コンテキストの正規識別子。このフィールドは、実行が開始されると入力されます。この値を使用すると、 /#setting/sparkui/$cluster_id/$spark_context_idを参照して Spark UI を表示できます。 Spark UI は、実行が完了した後も引き続き使用できます。

識別子がまだ使用できない場合、応答にはこのフィールドは含まれません。

クラスタログコンフィグ

クラスターログへのパス。

フィールド名	タイプ	説明
	DbfsStorageInfo	クラスターログの DBFS の場所。目的地を指定する必要があります。例えば `{ "dbfs" : { "destination" : "dbfs:/home/cluster_log" } }`

クラスタスペック

重要

新しいジョブクラスターでジョブを実行すると、ジョブはジョブコンピュート (自動) ワークロードとして扱われ、ジョブコンピュートの価格が適用されます。
既存の汎用クラスターでジョブを実行すると、汎用コンピュート (対話型) ワークロードとして扱われ、汎用コンピュートの価格が適用されます。

フィールド名

タイプ

説明

existing_cluster_id 又は new_cluster

STRING または新規クラスター

existing_cluster_idの場合、このジョブのすべての実行に使用される既存のクラスターの ID。既存のクラスターでジョブを実行するときに、クラスターが応答しなくなった場合は、クラスターを手動で再起動する必要がある場合があります。信頼性を高めるために、新しいクラスターでジョブを実行することをお勧めします。

new_clusterの場合は、実行ごとに作成されるクラスターの説明。

パイプラインタスクを指定する場合、このフィールドは空にすることができます。

libraries

ライブラリの配列

ジョブを実行するクラスターにインストールするライブラリのオプションのリスト。デフォルト値は空のリストです。

クラスタタグ

クラスタータグの定義。

Cronスケジュール

フィールド名	タイプ	説明
`quartz_cron_expression`	`STRING`	ジョブのスケジュールを記述する Quartz 構文を使用した Cron 式。詳細については、 cron トリガーを参照してください。このフィールドは必須です。
`timezone_id`	`STRING`	Java タイムゾーン ID。ジョブのスケジュールは、このタイムゾーンに関して解決されます。詳細については、 Java タイムゾーンを参照してください。このフィールドは必須です。
`pause_status`	`STRING`	このスケジュールが停止するかどうかを示します。 "停止する" または "UN停止する" のいずれかです。

DbfsStorageInfo (英語)

DBFS ストレージ情報。

フィールド名	タイプ	説明
`destination`	`STRING`	DBFS の宛先。例： `dbfs:/my/path`

GCSSストレージ情報

Google Cloud Storage(GCS)のストレージ情報。

フィールド名	タイプ	説明
`destination`	`STRING`	ファイルの宛先。例： `gs://...`

Google クラウドの属性

Google クラウドに関するクラスター作成時に設定される属性です。

フィールド名	タイプ	説明
`use_preemptible_executors`	`BOOL`	プリエンプティブルエグゼキューターを使用します。
`google_service_account`	`STRING`	Google サービスアカウントクラスターが Google Identity での認証に使用する電子メールアドレス。このフィールドは、 GCS と BigQuery のデータソースでの認証に使用されます。
`boot_disk_size`	`INT32`	各インスタンスに割り当てられたディスクのサイズ (GB 単位)。この値は 100 から 4096 の間でなければなりません。

重要

GCS と BigQuery で使用するには、データソースへのアクセスに使用する Google サービスアカウントが、Databricks アカウントの設定時に指定した SA と同じプロジェクトに存在する必要があります。

InitScriptInfo (英語)

initスクリプトへのパス。

フィールド名

タイプ

説明

workspace OR dbfs (非推奨)

又は gcs

ワークスペースストレージ情報

DbfsStorageInfo (非推奨)

GCSSストレージ情報

initスクリプトのワークスペースの場所。目的地を指定する必要があります。例えば { "workspace" : { "destination" : "/Users/someone@domain.com/init_script.sh" } }

(非推奨)initスクリプトの DBFS の場所。目的地を指定する必要があります。例えば { "dbfs" : { "destination" : "dbfs:/home/init_script" } }

Google Cloud Storage (GCS) の init スクリプトの場所。宛先を指定する必要があります。例えば { "gcs": { "destination" : "gs://..." } }

ジョブ

フィールド名	タイプ	説明
`job_id`	`INT64`	このジョブの正規識別子。
`creator_user_name`	`STRING`	作成者のユーザー名。ユーザーが既に削除されている場合、このフィールドは応答に含まれません。
`run_as`	`STRING`	ジョブの実行に使用するユーザー名。 `run_as` は現在のジョブ設定に基づいており、ジョブ・アクセス制御が無効になっている場合はジョブの作成者に設定され、ジョブ・アクセス制御が有効な場合は `is_owner` 権限に設定されます。
`settings`	ジョブ設定	このジョブとそのすべての実行の設定。これらの設定は、 `resetJob` メソッドを使用して更新できます。
`created_time`	`INT64`	このジョブが作成された時刻 (エポックミリ秒単位) (1970 年 1 月 1 日 UTC からのミリ秒単位)。

JobEmailNotifications(ジョブメール通知)

重要

on_start、on_success、およびon_failure フィールドは、ラテン文字 (ASCII 文字セット) のみを受け入れます。 ASCII 以外の文字を使用すると、エラーが返されます。無効な非 ASCII 文字の例としては、中国語、日本語の漢字、絵文字などがあります。

フィールド名	タイプ	説明
`on_start`	の配列 `STRING`	実行の開始時に通知される Eメールアドレスのリスト。ジョブの作成、リセット、または更新時に指定しない場合、リストは空になり、通知は送信されません。
`on_success`	の配列 `STRING`	実行が正常に完了したときに通知される Eメールアドレスのリスト。実行が `TERMINATED` `life_cycle_state` と `SUCCESSFUL` `result_state`で終了した場合、実行は正常に完了したと見なされます。ジョブの作成、リセット、または更新時に指定しない場合、リストは空になり、通知は送信されません。
`on_failure`	の配列 `STRING`	実行が失敗したときに通知される Eメールアドレスのリスト。実行が `INTERNAL_ERROR` `life_cycle_state` または `SKIPPED`、 `FAILED`、または `TIMED_OUT` result_stateで終了した場合、実行は失敗したと見なされます。ジョブの作成、リセット、または更新時にこれが指定されていない場合、リストは空になり、通知は送信されません。
`on_duration_warning_threshold_exceeded`	の配列 `STRING`	実行時間が [`health`] フィールドの `RUN_DURATION_SECONDS` メトリクスに指定されたしきい値を超えたときに通知される Eメールアドレスのリスト。`RUN_DURATION_SECONDS` メトリクスのルールがジョブの [`health`] フィールドで指定されていない場合、通知は送信されません。
`no_alert_for_skipped_runs`	`BOOL`	true の場合、実行がスキップされた場合、 `on_failure` で指定された受信者に Email を送信しません。

フィールド名	タイプ	説明
`on_start`	ウェブフックの配列	実行の開始時に通知されるシステム宛先のオプションのリスト。ジョブの作成、リセット、または更新時に指定しない場合、リストは空になり、通知は送信されません。 `on_start` プロパティには、最大 3 つの宛先を指定できます。
`on_success`	ウェブフックの配列	実行が正常に完了したときに通知されるシステム宛先のオプションのリスト。実行が `TERMINATED` `life_cycle_state` と `SUCCESSFUL` `result_state`で終了した場合、実行は正常に完了したと見なされます。ジョブの作成、リセット、または更新時に指定しない場合、リストは空になり、通知は送信されません。 `on_success` プロパティには、最大 3 つの宛先を指定できます。
`on_failure`	ウェブフックの配列	実行が失敗したときに通知されるシステム宛先のオプションのリスト。実行が `INTERNAL_ERROR` `life_cycle_state` または `SKIPPED`、 `FAILED`、または `TIMED_OUT` result_stateで終了した場合、実行は失敗したと見なされます。ジョブの作成、リセット、または更新時にこれが指定されていない場合、リストは空になり、通知は送信されません。 `on_failure` プロパティには、最大 3 つの宛先を指定できます。
`on_duration_warning_threshold_exceeded`	ウェブフックの配列	実行時間が [`health`] フィールドの `RUN_DURATION_SECONDS` メトリクスに指定されたしきい値を超えたときに通知されるシステム宛先のオプションのリスト。`on_duration_warning_threshold_exceeded` プロパティには、最大 3 つの宛先を指定できます。

JobNotificationSettings (ジョブ通知設定)

フィールド名	タイプ	説明
`no_alert_for_skipped_runs`	`BOOL`	true の場合、実行がスキップされた場合、 `on_failure` で指定された受信者に通知を送信しません。
`no_alert_for_canceled_runs`	`BOOL`	true の場合、実行がキャンセルされた場合に、 `on_failure` で指定された受信者に通知を送信しません。
`alert_on_last_attempt`	`BOOL`	true の場合、再試行された実行について `on_start` で指定された受信者に通知を送信せず、実行の最後の再試行まで `on_failure` で指定された受信者に通知を送信しません。

ジョブ設定

重要

新しいジョブクラスターでジョブを実行すると、ジョブはジョブコンピュート (自動) ワークロードとして扱われ、ジョブコンピュートの価格が適用されます。
既存の汎用クラスターでジョブを実行すると、汎用コンピュート (対話型) ワークロードとして扱われ、汎用コンピュートの価格が適用されます。

ジョブの設定。これらの設定は、 resetJob メソッドを使用して更新できます。

フィールド名	タイプ	説明
`existing_cluster_id` 又は `new_cluster`	`STRING` または新規クラスター	existing_cluster_idの場合、このジョブのすべての実行に使用される既存のクラスターの ID。既存のクラスターでジョブを実行するときに、クラスターが応答しなくなった場合は、クラスターを手動で再起動する必要がある場合があります。信頼性を高めるために、新しいクラスターでジョブを実行することをお勧めします。 new_clusterの場合は、実行ごとに作成されるクラスターの説明。パイプラインタスクを指定する場合、このフィールドは空にすることができます。
`notebook_task` または `spark_jar_task` 、 `spark_python_task` 、 `spark_submit_task` 、または `pipeline_task` `run_job_task`	ノートブックタスク OR SparkJarTask OR SparkPythonTask OR SparkSubmitTask OR PipelineTask OR RunJobTask	notebook_task の場合、このジョブでノートブックを実行する必要があることを示します。このフィールドは、spark_jar_task と組み合わせて指定することはできません。 spark_jar_taskの場合、このジョブが JAR を実行する必要があることを示します。 spark_python_taskの場合、このジョブで Python ファイルを実行することを示します。 spark_submit_taskの場合、このジョブが spark 送信スクリプトによって起動される必要があることを示します。 pipeline_taskの場合、このジョブが Delta Live Tables パイプラインを実行する必要があることを示します。 run_job_taskの場合、このジョブが別のジョブを実行する必要があることを示します。
`name`	`STRING`	ジョブのオプションの名前。デフォルト値は `Untitled`です。
`libraries`	ライブラリの配列	ジョブを実行するクラスターにインストールするライブラリのオプションのリスト。デフォルト値は空のリストです。
`email_notifications`	ジョブメール通知	このジョブの実行が開始または完了したとき、およびこのジョブが削除されたときに通知されるオプションの Eメールアドレスのセット。デフォルトの動作では、Eメールは送信されません。
`webhook_notifications`	ウェブフック通知	このジョブの実行が開始、完了、または失敗したときに通知するシステム宛先のオプションのセット。
`notification_settings`	ジョブ通知設定	このジョブの各 `email_notifications` および `webhook_notifications` に通知を送信するときに使用されるオプションの通知設定。
`timeout_seconds`	`INT32`	このジョブの各実行に適用されるオプションのタイムアウト。デフォルトの動作では、タイムアウトはありません。
`max_retries`	`INT32`	失敗した実行を再試行するオプションの最大数。実行は、 `FAILED` result_stateまたは `INTERNAL_ERROR` `life_cycle_state`で完了した場合、失敗したと見なされます。値 -1 は無期限に再試行することを意味し、値 0 は再試行しないことを意味します。デフォルトの動作は、再試行しないことです。
`min_retry_interval_millis`	`INT32`	試行間のオプションの最小間隔 (ミリ秒単位)。既定の動作では、失敗した実行がすぐに再試行されます。
`retry_on_timeout`	`BOOL`	タイムアウト時にジョブを再試行するかどうかを指定するオプションのポリシー。デフォルトの動作では、タイムアウト時に再試行しません。
`schedule`	クロンスケジュール	このジョブのオプションの定期的なスケジュール。デフォルトの動作では、ジョブUIで[今すぐ実行]をクリックするか、APIリクエストを `runNow`に送信することによってトリガーされた場合にのみジョブが実行されます。
`max_concurrent_runs`	`INT32`	ジョブの並列実行の最大許容数(オプション)。同じジョブの複数の実行を同時に実行できるようにする場合は、この値を設定します。これは、たとえば、頻繁なスケジュールでジョブをトリガーし、連続した実行を互いにオーバーラップさせる場合や、入力パラメーターが異なる複数の実行をトリガーする場合に便利です。この設定は、新しい実行にのみ影響します。たとえば、ジョブの同時実行数が 4 で、並列アクティブ実行が 4 つあるとします。次に、同時実行を 3 に設定しても、アクティブな実行は強制終了されません。ただし、それ以降は、アクティブな実行が 3 つ未満でない限り、新しい実行はスキップされます。この値は 1000 を超えることはできません。この値を 0 に設定すると、すべての新しい実行がスキップされます。デフォルトの動作では、並列実行は 1 つだけ許可されます。
`health`	ジョブヘルスルール	ジョブに対して定義されたオプションの正常性ルールのセット。

ジョブタスク

フィールド名

タイプ

説明

notebook_task または spark_jar_task 、 spark_python_task 、 spark_submit_task 、または pipeline_task run_job_task

ノートブックタスク OR SparkJarTask OR SparkPythonTask OR SparkSubmitTask OR PipelineTask OR RunJobTask

notebook_task の場合、このジョブでノートブックを実行する必要があることを示します。このフィールドは、spark_jar_task と組み合わせて指定することはできません。

spark_jar_taskの場合、このジョブが JAR を実行する必要があることを示します。

spark_python_taskの場合、このジョブで Python ファイルを実行することを示します。

spark_submit_taskの場合、このジョブが spark 送信スクリプトによって起動される必要があることを示します。

pipeline_taskの場合、このジョブが Delta Live Tables パイプラインを実行する必要があることを示します。

run_job_taskの場合、このジョブが別のジョブを実行する必要があることを示します。

ジョブヘルスルール

フィールド名	タイプ	説明
`metric`	`STRING`	特定の正常性ルールに対して評価される正常性メトリクスを指定します。有効な値は `RUN_DURATION_SECONDS`です。
`operator`	`STRING`	ヘルスメトリクス値を指定したしきい値と比較するために使用する演算子を指定します。有効な値は `GREATER_THAN`です。
`value`	`INT32`	正常性ルールに準拠するために正常性メトリクスが満たす必要があるしきい値を指定します。

ジョブヘルスルール

フィールド名	タイプ	説明
`rules`	ジョブヘルスルールの配列	ジョブに対して定義できる正常性ルールのオプションのセット。

ライブラリ

フィールド名

タイプ

説明

jar または egg 、 whl 、 pypi 、または maven cran

STRING OR STRING OR STRING OR PythonPyPiLibrary OR MavenLibrary OR RCranLibrary

jar の場合、インストールする JAR の URI。 DBFS と GCS (gs) URI がサポートされています。たとえば、 { "jar": "dbfs:/mnt/databricks/library.jar"} や { "jar": "gs://my-bucket/library.jar" }などです。 GCS を使用する場合は、クラスターにライブラリに対する読み取りアクセス権があることを確認します。

egg の場合、インストールする egg の URI。 DBFS と GCS の URI がサポートされています。たとえば、 { "egg": "dbfs:/my/egg" } や { "egg": "gs://my-bucket/egg" }などです。

whl の場合、インストールする wheel または圧縮された wheels の URI。 DBFS と GCS の URI がサポートされています。たとえば、 { "whl": "dbfs:/my/whl" } や { "whl": "gs://my-bucket/whl" }などです。 GCS を使用する場合は、クラスターにライブラリに対する読み取りアクセス権があることを確認します。また、 wheel ファイル名には正しい規則を使用する必要があります。 zip wheels をインストールする場合は、ファイル名の接尾辞を .wheelhouse.zipにする必要があります。

pypiの場合、インストールするPyPIライブラリの指定。 repo フィールドの指定は省略可能であり、指定しない場合は、既定の pip インデックスが使用されます。例えば： { "package": "simplejson", "repo": "https://my-repo.com" }

Maven の場合は、インストールする Maven ライブラリの指定。例えば： { "coordinates": "org.jsoup:jsoup:1.7.2" }

cranの場合、インストールするCRANライブラリの指定。

Mavenライブラリ

フィールド名

タイプ

説明

coordinates

STRING

グラドルスタイルの Maven 座標。たとえば、 org.jsoup:jsoup:1.7.2です。このフィールドは必須です。

repo

STRING

MavenパッケージをインストールするためのMaven リポジトリ。省略すると、Maven 中央リポジトリと Spark パッケージの両方が検索されます。

exclusions

の配列 STRING

除外する依存関係のリスト。たとえば、 ["slf4j:slf4j", "*:hadoop-client"]です。

Maven 依存関係の除外: https://maven.apache.org/guides/introduction/introduction-to-optional-and-excludes-dependencies.html。

新規クラスタ

フィールド名	タイプ	説明
`num_workers` 又は `autoscale`	`INT32` OR オートスケール	num_workersの場合、このクラスターに必要なワーカーノードの数。クラスターには、1 つの Spark ドライバーとワーカーエグゼキューターがあり、合計でワーカー + 1 つの Spark ノードがあります。クラスターのプロパティを読み取る場合、このフィールドには、実際の現在のワーカー数ではなく、必要なワーカー数が反映されます。たとえば、クラスターのサイズが 5 人から 10 人のワーカーに変更された場合、このフィールドは 10 人のワーカーのターゲットサイズを反映するようにすぐに更新されますが、 `spark_info` にリストされているワーカーは、新しいノードがプロビジョニングされるにつれて 5 から 10 に徐々に増加します。オートスケールの場合、負荷に基づいてクラスターを自動的にスケールアップおよびスケールダウンするために必要なパラメーター。
`spark_version`	`STRING`	クラスターの Spark バージョン。使用可能な Spark バージョンの一覧は、 GET 2.0/クラスター/spark-versions 呼び出しを使用して取得できます。このフィールドは必須です。
`spark_conf`	スパークコンファレンスペア	オプションのユーザー指定の Spark 構成キーと値のペアのセットを含むオブジェクト。また、追加のJVMオプションの文字列を、それぞれ `spark.driver.extraJavaOptions` と `spark.executor.extraJavaOptions` を介してドライバーとエグゼキューターに渡すこともできます。例 Spark confs: `{"spark.speculation": true, "spark.streaming.ui.retainedBatches": 5}` または `{"spark.driver.extraJavaOptions": "-verbose:gc -XX:+PrintGCDetails"}`
`gcp_attributes`	Google クラウドの属性	Google クラウド上で動作するクラスターに関する属性です。クラスターの作成時に指定しない場合は、一連のデフォルト値が使用されます。
`node_type_id`	`STRING`	このフィールドは、1 つの値を使用して、このクラスター内の各 Spark ノードで使用可能なリソースをエンコードします。たとえば、Spark ノードは、メモリまたはコンピュートを集中的に使用するワークロード用にプロビジョニングおよび最適化できます使用可能なノードの種類の一覧は、 GET 2.0/クラスター/list-node-types 呼び出しを使用して取得できます。このフィールド、 `instance_pool_id` フィールド、またはノードタイプIDまたはインスタンスプールIDを指定するクラスターポリシーは必須です。
`driver_node_type_id`	`STRING`	Spark ドライバーのノードの種類。このフィールドはオプションです。設定されていない場合、ドライバーノードの種類は、上記で定義した `node_type_id` と同じ値として設定されます。
`ssh_public_keys`	の配列 `STRING`	空の配列に設定します。クラスター SSH には対応していません。
`custom_tags`	クラスタータグ	常に空の配列に設定されます。
`cluster_log_conf`	ClusterLogConf	Spark ログを長期保存先に配信するための構成。 1 つのクラスターに指定できる宛先は 1 つだけです。 confが指定されている場合、ログは `5 mins`ごとに宛先に配信されます。ドライバーログの保存先は `<destination>/<cluster-id>/driver`ですが、エグゼキューターログの保存先は `<destination>/<cluster-id>/executor`です。
`init_scripts`	InitScriptInfoの配列	initスクリプトを格納するための構成。スクリプトはいくつでも指定できます。スクリプトは、指定された順序で順番に実行されます。 `cluster_log_conf` を指定すると、initスクリプトログが `<destination>/<cluster-id>/init_scripts`に送信されます。
`spark_env_vars`	スパークエンビペア	オプションのユーザー指定の環境変数のキーと値のペアのセットを含むオブジェクト。形式 (X,Y) のキーと値のペアは、ドライバーとワーカーの起動時にそのまま (つまり、 `export X='Y'`) エクスポートされます。追加の `SPARK_DAEMON_JAVA_OPTS`セットを指定するには、次の例に示すように、 `$SPARK_DAEMON_JAVA_OPTS` に追加することをお勧めします。これにより、すべての既定の databricks マネージド環境変数も含まれます。 Spark 環境変数の例: `{"SPARK_WORKER_MEMORY": "28000m", "SPARK_LOCAL_DIRS": "/local_disk0"}` または `{"SPARK_DAEMON_JAVA_OPTS": "$SPARK_DAEMON_JAVA_OPTS -Dspark.shuffle.service.enabled=true"}`
`enable_elastic_disk`	`BOOL`	Akways を false に設定します。
`instance_pool_id`	`STRING`	クラスター・ノードに使用するインスタンス・プールのオプションのID。詳細は、インスタンスプールAPI を参照してください。

ノートブック出力

フィールド名	タイプ	説明
`result`	`STRING`	dbutils.ノートブック.exit() に渡される値。Databricks は、値の最初の 1 MB を返すようにこの API を制限します。より大きな結果を得るには、ジョブで結果をクラウドストレージサービスに保存できます。このフィールドは、 `dbutils.notebook.exit()` が呼び出されなかった場合は存在しません。
`truncated`	`BOOLEAN`	結果が切り捨てられたかどうか。

ノートブックタスク

すべての出力セルは8MBのサイズの影響を受けます。セルの出力のサイズが大きい場合、残りの実行はキャンセルされ、実行は失敗としてマークされます。その場合、他のセルからのコンテンツ出力の一部も欠落している可能性があります。

フィールド名

タイプ

説明

notebook_path

STRING

Databricks ワークスペースで実行するノートブックの絶対パス。このパスはスラッシュで始まる必要があります。このフィールドは必須です。

revision_timestamp

LONG

ノートブックのリビジョンのタイムスタンプ。

base_parameters

パラムペアの地図

このジョブの各実行に使用される基本パラメーター。パラメーターを指定して run-now 呼び出しによって実行が開始された場合、2 つのパラメーターマップがマージされます。 base_parameters と run-nowに同じキーを指定すると、 run-now の値が使用されます。

[ジョブ実行に関するコンテキストをジョブタスクに渡す] を使用して、ジョブ実行に関する情報を含むパラメーターを設定します。

ジョブの base_parameters または run-now オーバーライドパラメーターで指定されていないパラメーターをノートブックが受け取る場合は、ノートブックの既定値が使用されます。

これらのパラメーターをノートブックで取得するには、 dbutils.widgets.get を使用します。

パラメータペア

ノートブックタスクを実行するジョブの名前ベースのパラメーター。

重要

このデータ構造のフィールドは、ラテン文字 (ASCII 文字セット) のみを受け入れます。 ASCII 以外の文字を使用すると、エラーが返されます。無効な非 ASCII 文字の例としては、中国語、日本語の漢字、絵文字などがあります。

タイプ	説明
`STRING`	パラメーター名。値を取得するには、 dbutils.widgets.get に渡します。
`STRING`	パラメーター値。

パイプラインタスク

フィールド名	タイプ	説明
`pipeline_id`	`STRING`	実行する Delta Live Tables パイプラインタスクの完全な名前。

PythonPyPiライブラリ

フィールド名	タイプ	説明
`package`	`STRING`	インストールする PyPI パッケージの名前。オプションの正確なバージョン指定もサポートされています。例: `simplejson` と `simplejson==3.8.0`. このフィールドは必須です。
`repo`	`STRING`	パッケージが見つかるリポジトリ。指定しない場合は、既定の pip インデックスが使用されます。

RCranライブラリ

フィールド名	タイプ	説明
`package`	`STRING`	インストールする CRAN パッケージの名前。このフィールドは必須です。
`repo`	`STRING`	パッケージが見つかるリポジトリ。指定しない場合は、既定の CRAN リポジトリが使用されます。

実行

出力を除く実行に関するすべての情報。出力は、 getRunOutput メソッドを使用して個別に取得できます。

フィールド名	タイプ	説明
`job_id`	`INT64`	この実行を含むジョブの正規識別子。
`run_id`	`INT64`	実行の正規識別子。この ID は、すべてのジョブのすべての実行で一意です。
`creator_user_name`	`STRING`	作成者のユーザー名。ユーザーが既に削除されている場合、このフィールドは応答に含まれません。
`number_in_job`	`INT64`	ジョブのすべての実行におけるこの実行のシーケンス番号。この値は 1 から始まります。
`original_attempt_run_id`	`INT64`	この実行が以前の実行試行の再試行である場合、このフィールドには元の試行のrun_idが含まれます。それ以外はrun_idと同じです。
`state`	実行状態	実行の結果とライフサイクルの状態。
`schedule`	クロンスケジュール	定期的なスケジューラによってトリガーされた場合に、この実行をトリガーした cron スケジュール。
`task`	ジョブタスク	実行によって実行されるタスク (存在する場合)。
`cluster_spec`	クラスタスペック	この実行が作成されたときのジョブのクラスター仕様のスナップショット。
`cluster_instance`	クラスターインスタンス	この実行に使用されるクラスター。新しいクラスターを使用するように実行が指定されている場合、このフィールドは、ジョブサービスが実行のクラスターを要求したときに設定されます。
`overriding_parameters`	実行パラメーター	この実行に使用されるパラメーター。
`start_time`	`INT64`	この実行が開始された時刻 (エポックミリ秒単位) (1970 年 1 月 1 日 UTC からのミリ秒数)。これは、ジョブタスクの実行が開始される時刻ではない場合があります (たとえば、ジョブが新しいクラスターで実行するようにスケジュールされている場合)、これはクラスター作成呼び出しが発行された時刻です。
`setup_duration`	`INT64`	クラスターのセットアップにかかった時間 (ミリ秒単位)。新しいクラスターで実行される実行の場合、これはクラスターの作成時間であり、既存のクラスターで実行される実行の場合、この時間は非常に短くする必要があります。
`execution_duration`	`INT64`	JAR またはノートブックでコマンドを実行してから、コマンドが完了、失敗、タイムアウト、キャンセル、または予期しないエラーが発生するまでにかかる時間 (ミリ秒単位)。
`cleanup_duration`	`INT64`	クラスターを終了し、関連するアーティファクトをクリーンアップするのにかかった時間 (ミリ秒単位)。実行の合計時間は、setup_duration、execution_duration、およびcleanup_durationの合計です。
`end_time`	`INT64`	この実行が終了した時刻 (エポックミリ秒) (1970 年 1 月 1 日 UTC からのミリ秒)。ジョブがまだ実行中の場合、このフィールドは 0 に設定されます。
`trigger`	トリガータイプ	この実行を開始したトリガーの種類。
`run_name`	`STRING`	実行のオプションの名前。デフォルト値は `Untitled`です。最大許容長は、UTF-8 エンコードで 4096 バイトです。
`run_page_url`	`STRING`	実行の詳細ページへの URL。
`run_type`	`STRING`	実行の種類。 `JOB_RUN` - 通常のジョブ実行。 [今すぐ実行] で作成された実行。 `WORKFLOW_RUN` - ワークフローの実行。 dbutils.ノートブック.run で作成された実行。 `SUBMIT_RUN` - 実行を送信します。 [今すぐ実行] で作成された実行。
`attempt_number`	`INT32`	トリガーされたジョブ実行に対するこの実行試行のシーケンス番号。実行の最初の試行のattempt_numberは 0 です。最初の実行試行が失敗し、ジョブに再試行ポリシー (`max_retries` > 0) がある場合、後続の実行は、元の試行の ID の `original_attempt_run_id` と増分 `attempt_number`を使用して作成されます。実行は成功するまで再試行され、最大 `attempt_number` はジョブの `max_retries` 値と同じです。

ジョブタスクの実行

フィールド名	タイプ	説明
`job_id`	`INT32`	実行するジョブの一意の識別子。このフィールドは必須です。

RunLifeCycleState (英語)

実行のライフサイクル状態。許可される状態遷移は次のとおりです。

QUEUED -> PENDING
PENDING -> RUNNING -> TERMINATING -> TERMINATED
PENDING -> SKIPPED
PENDING -> INTERNAL_ERROR
RUNNING -> INTERNAL_ERROR
TERMINATING -> INTERNAL_ERROR

状態	説明
`QUEUED`	実行はトリガーされましたが、次のいずれかの制限に達したためキューに入れられました。ワークスペース内の最大並列アクティブ実行数。ワークスペース内で実行される並列`Run Job`タスクの最大数。ジョブの最大並列実行。この状態に到達するには、ジョブまたは実行でキューイングが有効になっている必要があります。
`PENDING`	実行が開始されました。ジョブの設定された最大並列実行にすでに達している場合、実行はリソースを準備せずに直ちに`SKIPPED`状態に移行します。それ以外の場合は、クラスターの準備と実行が進行中です。
`RUNNING`	この実行のタスクは実行中です。
`TERMINATING`	この実行のタスクが完了し、クラスターと実行コンテキストがクリーンアップされています。
`TERMINATED`	この実行のタスクが完了し、クラスターと実行コンテキストがクリーンアップされました。この状態はターミナルです。
`SKIPPED`	同じジョブの以前の実行が既にアクティブであったため、この実行は中止されました。この状態はターミナルです。
`INTERNAL_ERROR`	長期間にわたるネットワーク障害など、ジョブサービスの障害を示す例外状態。新しいクラスターでの実行が `INTERNAL_ERROR` 状態で終了した場合、ジョブサービスはできるだけ早くクラスターを終了します。この状態はターミナルです。

パラメータの実行

この実行のパラメーター。ジョブタスクの種類に応じて、jar_params、 python_params、またはノートブックのいずれか 1 つだけを run-now 要求で指定する必要があります。 Spark JAR タスクまたは Python タスクを使用するジョブは位置ベースのパラメーターのリストを受け取り、ノートブックタスクを使用するジョブはキー値マップを取得します。

フィールド名	タイプ	説明
`jar_params`	の配列 `STRING`	Spark JAR タスクを持つジョブのパラメーターのリスト (例: `"jar_params": ["john doe", "35"]`。パラメーターは、Spark JAR タスクで指定されたメインクラスの main 関数を呼び出すために使用されます。 `run-now`時に指定しない場合、デフォルトでは空のリストになります。jar_params をノートブックと組み合わせて指定することはできません。このフィールドの JSON 表現 (つまり、 `{"jar_params":["john doe","35"]}`) は 10,000 バイトを超えることはできません。 [ジョブ実行に関するコンテキストをジョブタスクに渡す] を使用して、ジョブ実行に関する情報を含むパラメーターを設定します。
`notebook_params`	パラムペアの地図	ノートブックタスクを含むジョブのキーから値へのマップ(例: `"notebook_params": {"name": "john doe", "age": "35"}`。マップはノートブックに渡され、 dbutils.widgets.get 関数を使用してアクセスできます。 `run-now`時に指定しない場合、トリガーされた実行ではジョブの基本パラメーターが使用されます。ノートブックをjar_paramsと併用して指定することはできません。 [ジョブ実行に関するコンテキストをジョブタスクに渡す] を使用して、ジョブ実行に関する情報を含むパラメーターを設定します。このフィールドの JSON 表現 (つまり、 `{"notebook_params":{"name":"john doe","age":"35"}}`) は 10,000 バイトを超えることはできません。
`python_params`	の配列 `STRING`	Python タスクを持つジョブのパラメーターのリスト。 `"python_params": ["john doe", "35"]`。パラメーターは、コマンドラインパラメーターとして Python ファイルに渡されます。 `run-now`時に指定すると、job設定で指定されたパラメーターが上書きされます。このフィールドの JSON 表現 (つまり、 `{"python_params":["john doe","35"]}`) は 10,000 バイトを超えることはできません。 [ジョブ実行に関するコンテキストをジョブタスクに渡す] を使用して、ジョブ実行に関する情報を含むパラメーターを設定します。重要これらのパラメーターは、ラテン文字 (ASCII 文字セット) のみを受け入れます。 ASCII 以外の文字を使用すると、エラーが返されます。無効な非 ASCII 文字の例としては、中国語、日本語の漢字、絵文字などがあります。
`spark_submit_params`	の配列 `STRING`	スパーク送信タスクを持つジョブのパラメーターのリスト (例: `"spark_submit_params": ["--class", "org.apache.spark.examples.SparkPi"]`。パラメーターは、コマンドラインパラメーターとして spark-submit スクリプトに渡されます。 `run-now`時に指定すると、job設定で指定されたパラメーターが上書きされます。このフィールドの JSON 表現 (つまり、 `{"python_params":["john doe","35"]}`) は 10,000 バイトを超えることはできません。 [ジョブ実行に関するコンテキストをジョブタスクに渡す] を使用して、ジョブ実行に関する情報を含むパラメーターを設定します。重要これらのパラメーターは、ラテン文字 (ASCII 文字セット) のみを受け入れます。 ASCII 以外の文字を使用すると、エラーが返されます。無効な非 ASCII 文字の例としては、中国語、日本語の漢字、絵文字などがあります。

RunResultState (結果状態の実行)

実行の結果の状態。

life_cycle_state = TERMINATEDの場合:実行にタスクがある場合、結果は使用可能であることが保証され、タスクの結果を示します。
life_cycle_state = PENDING、 RUNNING、または SKIPPEDの場合、結果の状態は使用できません。
life_cycle_state = TERMINATING または lifecyclestate = INTERNAL_ERRORの場合 : 実行にタスクがあり、それを開始できた場合、結果の状態は使用可能です。

いったん使用可能になると、結果の状態は変更されません。

状態	説明
`SUCCESS`	タスクは正常に完了しました。
`FAILED`	タスクはエラーで完了しました。
`TIMEDOUT`	タイムアウトに達した後、実行が停止しました。
`CANCELED`	実行はユーザーの要求で取り消されました。

RunState (実行状態)

フィールド名	タイプ	説明
`life_cycle_state`	実行ライフサイクル状態	実行ライフサイクルにおける実行の現在の場所の説明。このフィールドは、応答で常に使用できます。
`result_state`	実行結果状態	実行の結果の状態。使用できない場合、応答にはこのフィールドは含まれません。 result_stateの可用性の詳細については、「 RunResultState 」を参照してください。
`user_cancelled_or_timedout`	`BOOLEAN`	実行がタイムアウトしたために、ユーザーが手動で取り消されたか、スケジューラによって手動で取り消されたか。
`state_message`	`STRING`	現在の状態を説明するメッセージ。このフィールドは構造化されておらず、正確な形式は変更される可能性があります。

SparkConfPair(スパークコンフィペア)

Spark 構成のキーと値のペア。

タイプ	説明
`STRING`	構成プロパティ名。
`STRING`	構成プロパティの値。

スパークエンペア

Spark 環境変数のキーと値のペア。

重要

ジョブ・クラスターで環境変数を指定する場合、このデータ構造のフィールドはラテン文字 (ASCII 文字セット) のみを受け入れます。 ASCII 以外の文字を使用すると、エラーが返されます。無効な非 ASCII 文字の例としては、中国語、日本語の漢字、絵文字などがあります。

タイプ	説明
`STRING`	環境変数名。
`STRING`	環境変数の値。

SparkJarタスク

フィールド名

タイプ

説明

jar_uri

STRING

2016 年 4 月以降は非推奨です。代わりに、 libraries フィールドを使用して jar を指定します。例については、「作成」を参照してください。

main_class_name

STRING

実行する main メソッドを含むクラスの完全な名前。このクラスは、ライブラリとして提供される JAR に含まれている必要があります。

コードでは、 SparkContext.getOrCreate を使用して Spark コンテキストを取得する必要があります。そうしないと、ジョブの実行が失敗します。

parameters

の配列 STRING

main メソッドに渡されるパラメーター。

[ジョブ実行に関するコンテキストをジョブタスクに渡す] を使用して、ジョブ実行に関する情報を含むパラメーターを設定します。

SparkPythonタスク

フィールド名

タイプ

説明

python_file

STRING

実行する Python ファイルの URI。 DBFS パスがサポートされています。このフィールドは必須です。

parameters

の配列 STRING

Python ファイルに渡されるコマンドラインパラメーター。

[ジョブ実行に関するコンテキストをジョブタスクに渡す] を使用して、ジョブ実行に関する情報を含むパラメーターを設定します。

SparkSubmitTask(スパーク送信タスク)

重要

Spark 送信タスクは、新しいクラスターでのみ呼び出すことができます。
new_cluster仕様では、 libraries と spark_conf はサポートされていません。代わりに、 --jars と --py-files を使用して Java および Python ライブラリを追加し、 --conf Spark 構成を設定します。
master、 deploy-mode、および executor-cores は、Databricks によって自動的に構成されます。パラメーターで指定 することはできません 。
既定の場合、Spark 送信ジョブは使用可能なすべてのメモリ (Databricks サービス用の予約済みメモリを除く) を使用します。 --driver-memoryと --executor-memory を小さい値に設定して、ヒープ外で使用する余地を残すことができます。
--jars、 --py-files、--files 引数は DBFS パスをサポートします。

たとえば、JAR が DBFS にアップロードされていると仮定すると、次のパラメーターを設定して SparkPi を実行できます。

{
  "parameters": [
    "--class",
    "org.apache.spark.examples.SparkPi",
    "dbfs:/path/to/examples.jar",
    "10"
  ]
}

フィールド名

タイプ

説明

parameters

の配列 STRING

spark に渡されるコマンドラインパラメーターが送信されます。

[ジョブ実行に関するコンテキストをジョブタスクに渡す] を使用して、ジョブ実行に関する情報を含むパラメーターを設定します。

トリガーの種類

これらは、実行を起動できるトリガーの種類です。

タイプ	説明
`PERIODIC`	定期的に実行をトリガーするスケジュール (cron スケジューラなど)。
`ONE_TIME`	1 回の実行を開始する 1 回限りのトリガー。これは、UI または API を介してオンデマンドで 1 回の実行をトリガーした場合に発生します。
`RETRY`	以前に失敗した実行の再試行としてトリガーされる実行を示します。これは、障害が発生した場合にジョブの再実行を要求したときに発生します。

ビューアイテム

エクスポートされたコンテンツは HTML 形式です。たとえば、エクスポートするビューがダッシュボードの場合、ダッシュボードごとに 1 つの HTML 文字列が返されます。

フィールド名	タイプ	説明
`content`	`STRING`	ビューのコンテンツ。
`name`	`STRING`	表示項目の名前。コードビューの場合は、ノートブックの名前。ダッシュボードビューの場合は、ダッシュボードの名前。
`type`	ビュータイプ	表示項目のタイプ。

ビュータイプ

タイプ	説明
`NOTEBOOK`	ノートブックビュー項目。
`DASHBOARD`	ダッシュボードビュー項目。

ViewsToExport (ビューからエクスポート)

エクスポートするビュー: コード、すべてのダッシュボード、またはすべて。

タイプ	説明
`CODE`	ノートブックのコードビュー。
`DASHBOARDS`	ノートブックのすべてのダッシュボードビュー。
`ALL`	ノートブックのすべてのビュー。

Webhook

フィールド名	タイプ	説明
`id`	`STRING`	システム通知先を参照する識別子。このフィールドは必須です。

WebhookNotifications (英語)

フィールド名	タイプ	説明
`on_start`	ウェブフックの配列	実行の開始時に通知されるシステム宛先のオプションのリスト。ジョブの作成、リセット、または更新時に指定しない場合、リストは空になり、通知は送信されません。 `on_start` プロパティには、最大 3 つの宛先を指定できます。
`on_success`	ウェブフックの配列	実行が正常に完了したときに通知されるシステム宛先のオプションのリスト。実行が `TERMINATED` `life_cycle_state` と `SUCCESSFUL` `result_state`で終了した場合、実行は正常に完了したと見なされます。ジョブの作成、リセット、または更新時に指定しない場合、リストは空になり、通知は送信されません。 `on_success` プロパティには、最大 3 つの宛先を指定できます。
`on_failure`	ウェブフックの配列	実行が失敗したときに通知されるシステム宛先のオプションのリスト。実行が `INTERNAL_ERROR` `life_cycle_state` または `SKIPPED`、 `FAILED`、または `TIMED_OUT` `result_state`で終了した場合、実行は失敗したと見なされます。ジョブの作成、リセット、または更新時にこれが指定されていない場合、リストは空になり、通知は送信されません。 `on_failure` プロパティには、最大 3 つの宛先を指定できます。
`on_duration_warning_threshold_exceeded`	ウェブフックの配列	実行時間が [`health`] フィールドの `RUN_DURATION_SECONDS` メトリクスに指定されたしきい値を超えたときに通知されるシステム宛先のオプションのリスト。`on_duration_warning_threshold_exceeded` プロパティには、最大 3 つの宛先を指定できます。

ワークスペースストレージ情報

ワークスペースのストレージ情報。

フィールド名	タイプ	説明
`destination`	`STRING`	ファイルの宛先。例： `/Users/someone@domain.com/init_script.sh`