インジェスト 用のデータ アクセスを構成する
この記事では、Databricks ユーザーが GCS から Databricks のテーブルにデータを読み込めるように、管理者ユーザーが Google Cloud Storage (GCS) のバケット内のデータへのアクセスを構成する方法について説明します。
この記事では、ソース データへのセキュリティで保護されたアクセスを構成する次の方法について説明します。
(推奨) Unity Catalog ボリュームを作成します。
ストレージ資格情報を使用して Unity Catalog 外部ロケーションを作成します。
始める前に
GCS でデータへのアクセスを設定する前に、次のものがあることを確認してください。
Google クラウド サービス アカウントの GCS バケット内のデータ。
Unity Catalog ボリュームを使用してデータにアクセスするには (推奨)、ボリュームに対する
READ VOLUME
特権。 詳細については、「 ボリュームとUnity Catalog の特権とセキュリティ保護可能なオブジェクト の作成と操作 」を参照してください。Unity Catalog外部ロケーションを使用してデータにアクセスするには、外部ロケーションに対する
READ FILES
権限が必要です。 詳細については、 「クラウド ストレージを Databricks に接続するための外部ロケーションを作成する」を参照してください。
Databricks SQLウェアハウス。 SQLウェアハウスを作成するには、 「SQLウェアハウスの作成」を参照してください。
Databricks SQL ユーザーインターフェイスに精通している。
クラウドストレージへのアクセスを構成する
GCS へのアクセスを設定するには、次のいずれかの方法を使用します。
(推奨)Unity Catalog ボリュームを作成します。 詳細については、「 ボリュームの作成と操作」を参照してください。
ストレージ認証情報を使用してUnity Catalog外部ロケーションを構成します。 外部ロケーションの詳細については、 「クラウド ストレージを Databricks に接続するための外部ロケーションを作成する」を参照してください。
次のステップ
この記事のステップを完了すると、ユーザーは COPY INTO
コマンドを実行して、GCS バケットから Databricks ワークスペースにデータを読み込むことができます。
Unity Catalogボリュームまたは外部ロケーションを使用してデータをロードするには、「Unity Catalogボリュームまたは外部ロケーションで COPY INTO を使用してデータをロードする」を参照してください。