タグを使用して使用状況を監視する
コストを監視し、 Databricks 使用量を組織のビジネスユニットやチーム (チャージバックなど) に正確に帰属させるために、カスタムタグをワークスペースとコンピュートリソースに追加できます。 Databricks では、使用状況データを表示するために システムテーブル (パブリック プレビュー) を使用することをお勧めします。 「課金利用 システムテーブル リファレンス」を参照してください。注: タグ データはグローバルにレプリケートできます。 そのため、リソースのセキュリティを損なう可能性のあるタグ名や値は使用しないでください。 たとえば、個人情報や機密情報を含むタグ名は使用しないでください。
アカウント コンソールのDatabricks課金利用グラフでは、個々のタグごとに使用状況を集計できます。 同じページからダウンロードした課金利用CSVレポートには、デフォルトとカスタムタグも含まれます。 タグはGKE および GCE ラベルにも伝播します。
タグ付けされたオブジェクトとリソース
Databricks によって管理される次のオブジェクトにカスタム タグを追加できます。
オブジェクト |
タグ付けインターフェース(UI) |
タグ付けインターフェース (API) |
---|---|---|
プール |
Databricks ワークスペースのプール UI |
|
All-purposeとジョブコンピュート |
Databricks ワークスペースのコンピュート UI |
|
SQLウェアハウス |
Databricks ワークスペースの SQL ウェアハウス UI |
警告
キーName
を持つカスタム タグをクラスターに割り当てないでください。 すべてのクラスターにはタグName
があり、その値は Databricks によって設定されます。 キーName
に関連付けられた値を変更すると、クラスターは Databricks によって追跡できなくなります。 その結果、クラスターはアイドル状態になった後も終了されず、使用コストが発生し続ける可能性があります。
デフォルトタグ
Databricks 、汎用コンピュートに次の デフォルト タグを追加します。
タグキー |
値 |
---|---|
|
定数値: |
|
クラスターの Databricks 内部 ID |
|
クラスターの名前 |
|
クラスターを作成したユーザーのユーザー名(Eメールアドレス) |
ジョブ クラスターでは、 Databricks次の デフォルト タグも適用されます。
タグキー |
値 |
---|---|
|
ジョブ名 |
|
ジョブID |
Databricks は、すべてのプールに次のデフォルト タグを追加します。
タグキー |
値 |
---|---|
|
定数値: |
|
プールを作成したユーザーの Databricks 内部 ID |
|
プールの Databricks 内部 ID |
タグの伝播
クラスター タグとプール タグは、コストの集計に使用できる 3 つの異なる方法で伝播されます。
DBUレポート内のタグ: タグは課金利用システムログおよびダウンロードされたレポートのDBU使用状況レポートに伝播されます。
各ポッドの GKE (Kubernetes) ラベル: タグは GKE ポッドのラベルに伝播されます。 これにより、 GKE 使用状況測定を使用して、すべてのDatabricksコンピュートリソースのコストを分類できるようになります。
各 VM とその永続ディスクの GCE ラベル: タグは、VM とその永続ディスクなどの GCE リソースのラベルに伝播されます。 これにより、GCE 使用状況測定を使用してコストを分類できるようになります。これは、すべてのDatabricksコンピュートリソースの Google Cloud コストを集計する場合、GKE ラベルよりも正確です。 タグのキーと値は、GCE ラベル形式の制限に準拠するように変換されます。
タグ付けのベストプラクティス
タグは手動で入力できるため、組織ではキーと値のペアを標準化する必要があります。 Databricks では、すべてのユーザーと共有できるキーと値の命名に関するビジネス ポリシーを作成することをお勧めします。
すべてのリソースには、使用量をビジネスユニットまたはプロジェクトに帰属させる一般的なキーでタグ付けする必要があります。 たとえば、財務チームが年間予算用に作成したジョブ コンピュート リソースには、
business-unit:finance
タグとproject:annual-budget
タグが含まれる場合があります。より詳細な知見を得るには、特異性の高いキーを使用してタグを割り当てます。 たとえば、ロール、製品、サービス、または顧客に基づいてキーを作成できます。
該当する場合、ワークスペース管理者は、コンピュート ポリシーと予算ポリシーを使用してタグを適用する必要があります。 カスタムタグの適用をご覧ください。
GCE ラベルの制限
GKE ラベルは、Databricks タグのキーと値を直接使用できます。
GCE ラベルには制限があります。
キーと値は、小文字、数字、アンダースコア、ダッシュのみで構成する必要があります。
GCE ラベルのキーと値の最大長は 63 文字です。
GCE ラベルに伝播できるタグの最大数は 54 です。
GCE 形式のルールに準拠するために、タグは GCE ラベルのキーと値になる前に変換されます。 変換後に重複がある場合、タグ定義内で後から(下位に)表示されるキーと値のペアが保持されます。
次の表は、GKE と GCE デフォルト クラスタータグを比較したものです。
GKE ラベル キー |
GKE ラベル値 |
GCE ラベルキー |
GCE ラベル値 |
---|---|---|---|
|
|
|
|
|
Databricks ID |
|
Databricks ID |
|
顧客定義名 |
|
小文字の顧客定義名。 文字が文字、数字、アンダースコア、ダッシュでない場合は削除されます。 たとえば、 |
|
作成者ユーザーのEメールアドレス |
|
作成者ユーザーのEメールアドレス |
次の表は、GKE と GCE のデフォルトのインスタンス プール タグを比較したものです。
GKE ラベル キー |
GKE ラベル値 |
GCE ラベルキー |
GCE ラベル値 |
---|---|---|---|
|
Databricks ID |
|
Databricks ID |
|
Databricks ID |
|
Databricks ID |
次の表は、その他すべてのタグ (カスタム タグ) について GKE と GCE を比較したものです。
GKE ラベル キー |
GKE ラベル値 |
GCE ラベルキー |
GCE ラベル値 |
---|---|---|---|
顧客定義キー |
顧客定義の値 |
小文字の顧客定義キー。 文字が文字、数字、アンダースコア、ダッシュでない場合は削除されます。 たとえば、 |
顧客が定義した小文字の値。 文字が文字、数字、アンダースコア、ダッシュでない場合は削除されます。 たとえば、 |