Delta Live Tables プロパティのリファレンス
この記事では、Databricks Delta Live Tables JSON 設定仕様とテーブル プロパティのリファレンスを提供します。 これらのさまざまなプロパティと構成の使用方法の詳細については、次の記事を参照してください。
Delta Live Tables パイプライン構成
田畑 |
---|
種類: このパイプラインのグローバル一意識別子。 ID はシステムによって割り当てられ、変更することはできません。 |
種類: このパイプラインのわかりやすい名前。 この名前は、UI でパイプライン ジョブを識別するために使用できます。 |
種類: パイプラインの実行に必要な出力データとメタデータが格納される DBFS またはクラウド ストレージ上の場所。 テーブルとメタデータは、この場所のサブディレクトリに格納されます。
パイプラインの作成後に |
種類: パイプラインを実行するクラスターの Spark 構成に追加する設定のオプションの一覧。 これらの設定は Delta Live Tables ランタイムによって読み取られ、Spark 構成を介してパイプラインで使用できます。 要素は |
種類: パイプライン コードと必要な成果物を含むノートブックの配列。 |
種類: クラスターがパイプラインを実行するための仕様の配列。 これが指定されていない場合、パイプラインはパイプラインの既定のクラスター構成を自動的に選択します。 |
種類: パイプラインを デフォルト値は |
種類: パイプラインの更新が完了したとき、再試行可能なエラーで失敗したとき、再試行不可能なエラーで失敗したとき、またはフローが失敗した場合の Email 通知の仕様のオプションの配列。 |
種類: パイプラインを継続的に実行するかどうかを示すフラグ。 デフォルト値は |
種類: パイプライン出力データを保持するためのデータベースの名前。 |
種類: 使用する Delta Live Tables ランタイムのバージョン。 サポートされている値は次のとおりです。
|
タイプ パイプラインを実行する Delta Live Tables 製品エディション。 この設定では、パイプラインの要件に基づいて最適な製品エディションを選択できます。
|
種類: パイプラインを実行するために 「What is Photon?」 を使用するかどうかを示すフラグ。 Photon は Databricks の高性能 Spark エンジンです。 Photon対応パイプラインは、Photon以外のパイプラインとは異なるレートで課金されます。
|
種類: 再試行可能なエラーが発生したときにパイプラインの更新が失敗する前にフローを再試行する最大試行回数。 デフォルト値は 2 です。 デフォルトにより、再試行可能なエラーが発生すると、Delta Live Tables ランタイムは、最初の試行を含めてフローの実行を 3 回試行します。 |
種類: 再試行可能なエラーが発生したときに更新が失敗する前に更新を再試行する最大回数。 再試行は完全な更新として実行されます。 デフォルトは 5 です。 このパラメーターは、実稼働モードで実行されるトリガー更新にのみ適用されます。 パイプラインが開発モードで実行されている場合、再試行はありません。 |
Delta Live Tables テーブルのプロパティ
注:
トゥームストーン管理動作を制御するテーブル プロパティはパイプライン設定に置き換えられ、既存または新規のパイプラインは新しいパイプライン設定を使用する必要があります。 SCD タイプ 1 クエリのトゥームストーン管理の制御を参照してください。
Delta Lake でサポートされているテーブル プロパティに加えて、次のテーブル プロパティを設定できます。
テーブルのプロパティ |
---|
デフォルト: このテーブルの自動的にスケジュールされた最適化を有効または無効にします。 |
デフォルト: なし このテーブルを Z-order する列名のコンマ区切りリストを含むオプションの文字列。 例えば |
デフォルト: このテーブルに対して完全更新を許可するかどうかを制御します。 |
パイプラインのトリガー間隔
パイプライン トリガー間隔は、Delta Live Tables パイプライン全体に対して、またはデータセット宣言の一部として指定できます。 「 パイプラインのトリガー間隔」を参照してください。
|
---|
デフォルトはフロータイプに基づいています。
値は、数値に時間単位を加えたものです。 有効な時間単位は次のとおりです。
値を定義するときに単数形または複数形の単位を使用できます。
|
ユーザーが設定できないクラスター属性
Delta Live Tablesクラスターのライフサイクルを管理するため、多くのクラスター設定はDelta Live Tablesによって設定され、パイプライン構成またはパイプラインで使用されるクラスター ポリシーのいずれかでユーザーが手動で構成することはできません。 次の表に、これらの設定と、手動で設定できない理由を示します。
田畑 |
---|
Delta Live Tables は、パイプラインの更新の実行に使用されるクラスターの名前を設定します。 これらの名前は上書きできません。 |
これらの値は、システムによって自動的に設定されます。 |
Delta Live Tables クラスターは、最新の機能を含むように継続的に更新されるカスタムバージョンの Databricks Runtime で実行されます。 Spark のバージョンは Databricks Runtime バージョンにバンドルされており、オーバーライドすることはできません。 |
Delta Live Tables はクラスターの自動終了と再利用のロジックを管理するため、クラスターの自動終了時間をオーバーライドすることはできません。 |
パイプラインでPhotonを有効にすることでこのフィールドを制御できますが、この値を直接設定することはできません。 |
この値は、システムによって自動的に設定されます。 |
このフィールドはシステムによって設定され、読み取り専用です。 |
Delta Live Tables はクラスターのライフサイクルを管理するため、パイプラインクラスターでカスタムコンテナを使用することはできません。 |
この値はシステムによって設定され、オーバーライドすることはできません。 |