Delta Sharing の Databricks-to-Databricks プロトコルを使用したデータの共有 (プロバイダー向け)

この記事では、Databricks 間 Delta Sharing を使用して、アカウントやクラウド ホストに関係なく、Databricks ユーザーが Unity Catalogが有効になっているワークスペースにアクセスできる限り、Databricks ユーザーとデータを安全に共有する方法の概要について説明します。

データ受信者 (Databricks データが共有されているユーザーまたはユーザーのグループ) の場合は、「Delta Sharingを使用して共有されたデータにアクセスする (受信者の場合)」を参照してください。

Databricks to Databricks Delta Sharingは誰が使用すべきですか?

Delta Sharing を使用してデータを共有するには、3 つの方法があります。

  1. この記事で取り上げる Databricks 間共有プロトコルを使用すると、Unity Catalog 対応ワークスペースのデータを、Unity Catalog 対応 Databricks ワークスペースにもアクセスできるユーザーと共有できます。

    このアプローチでは、Databricks に組み込まれている Delta Sharing サーバーを使用し、プロバイダーと受信者の両方に対してノートブック共有、Unity Catalog データガバナンス、監査、使用状況追跡のサポートを提供します。 Unity Catalog との統合により、プロバイダーと受信者の両方のセットアップとガバナンスが簡素化され、パフォーマンスが向上します。

  2. Databricks オープン共有プロトコル を使用すると、Unity Catalog 対応の Databricks ワークスペースで管理しているデータを、任意のコンピューティング プラットフォームのユーザーと共有できます。

    Delta Sharingオープン共有プロトコルを使用したデータの共有 (プロバイダー向け)」を参照してください。

  3. オープンソースの Delta Sharing サーバーの顧客管理実装 により、Databricks かどうかに関係なく、任意のプラットフォームから任意のプラットフォームに共有できます。

    github.com/delta-io/delta-sharing を参照してください。

Delta Sharingの概要とこれら 3 つのアプローチに関する詳細については、 Delta Sharing使用してデータと AI 資産を安全に共有する」を参照してください。

DatabricksからDatabricks Delta Sharing へのワークフロー

このセクションでは、Databricks 間の共有ワークフローの概要と、各ステップの詳細なドキュメントへのリンクを示します。

Databricks対Databricks Delta Sharing モデルの場合:

  1. データ 受信者 は、データ プロバイダーが共有しているデータにアクセスするために使用する Databricks ワークスペースにアタッチされている Databricks Unity Catalog メタストアの一意の 共有識別子 をデータ プロバイダー に提供します。

    詳しくは、 ステップ 1: 受信者の共有識別子をリクエストするをご覧ください。

  2. データ プロバイダーは、プロバイダーの Unity Catalog メタストアに 共有 を作成します。 この名前付きオブジェクトには、メタストアに登録されているテーブル、ビュー、ボリューム、ノートブックのコレクションが含まれます。

    詳しくは、 Delta Sharingの共有の作成と管理を参照してください。

  3. データ プロバイダーは、プロバイダーの Unity Catalog メタストアに受信者オブジェクトを作成します。 この名前付きオブジェクトは、共有に含まれるデータにアクセスするユーザーまたはユーザーのグループと、ユーザーまたはユーザー グループが共有へのアクセスに使用するワークスペースにアタッチされている Unity Catalog メタストアの共有識別子を表します。 共有識別子は、セキュリティで保護された接続を有効にするキー識別子です。

    詳細については、「 ステップ 2: 受信者を作成する」を参照してください。

  4. データ プロバイダーは、受信者に共有へのアクセス権を付与します。

    詳細については、「 Delta Sharing データ共有へのアクセスの付与と管理 (プロバイダー向け)」を参照してください。

  5. 共有は受信者の Databricks ワークスペースで使用できるようになり、ユーザーはカタログ エクスプローラー、Databricks CLI、または Databricks ノートブックまたは Databricks SQL クエリー エディターの SQL コマンドを使用してアクセスできます。

    共有内のテーブル、ビュー、ボリューム、ノートブックにアクセスするには、メタストア管理者または 特権ユーザーが 共有からカタログを作成する必要があります。 その後、そのユーザーまたは適切な特権を付与された別のユーザーは、カタログおよびカタログ内のオブジェクトへのアクセス権を他のユーザーに付与できます。 共有カタログとデータ資産に対するアクセス許可の付与は、Unity Catalog に登録されている他の資産の場合と同様に機能しますが、重要な違いは、Delta Sharing 共有から作成されたカタログ内のオブジェクトに対する読み取りアクセス権のみをユーザーに付与できることです。

    共有ノートブックはカタログ レベルで存在し、カタログに対する USE CATALOG 権限を持つすべてのユーザーがアクセスできます。

    詳細については、「 Databricks 間 Delta Sharing (受信者用) を使用して共有されたデータの読み取り」を参照してください。