スケジュールに従ってジョブを実行する
スケジュールされたトリガーを使用してジョブを構成し、時間ベースのスケジュールで実行します。
スケジュールされたトリガーの種類には、次の 2 つのオプションがあります。
指定した時間単位と間隔に基づいてジョブを定期的に実行する単純なスケジュールを定義します。 たとえば、ジョブが最初に実行された時点から 12 時間ごとにジョブが実行されるようにスケジュールします。
ジョブを実行する期間、時間、およびタイム・ゾーンをより詳細に制御できる拡張スケジュールを定義します。
注:
単純なスケジュールでは、最初の実行の時間を指定することはできません。 スケジューラは、スケジュールを構成するときに時間を選択します。
ジョブスケジュールの追加
ジョブのスケジュールを定義するには、次のようにします。
サイドバーで、「 ワークフロー」をクリックします。
[ジョブ] タブの [名前] 列でジョブ名をクリックします。
[ジョブの詳細] パネルで、[トリガーの追加] をクリックします。
[トリガーの種類] で、 [スケジュール済み] を選択します。
[スケジュールの種類] で、[シンプル] または [詳細] を選択します。
シンプル: ジョブを実行する間隔と時間単位を指定します。
詳細: 期間、開始時刻、およびタイム ゾーンを指定します。 オプションで、「 Show Cron Syntax 」チェックボックスを選択して、 Quartz Cron Syntaxでスケジュールを表示および編集します。
[保存]をクリックします。
ノートブックの UI で直接ノートブック ジョブをスケジュールすることもできます。
注:
Databricks では、cron 式の構成に関係なく、ジョブのスケジュールによってトリガーされる後続の実行間に 10 秒の最小間隔が適用されます。
夏時間または UTC を観測するタイム ゾーンを選択できます。 夏時間を監視するタイム ゾーンを選択すると、時間単位のジョブがスキップされるか、 夏時間が開始または終了するときに 1 時間または 2 時間遅れて表示される場合があります。 毎時 (絶対時間) に実行するには、[UTC] を選択します。
ジョブ スケジューラは、待機時間の短いジョブ用ではありません。 ネットワークまたはクラウドの問題により、ジョブの実行が最大で数分遅れることがあります。 このような状況では、スケジュールされたジョブは、サービスが利用可能になるとすぐに実行されます。