インジェスト用のデータ アクセスを構成する

この記事では、Databricks ユーザーが GCS から Databricks のテーブルにデータを読み込むことができるように、管理者ユーザーが Google Cloud Storage (GCS) のバケット内のデータへのアクセスを構成する方法について説明します。

この記事では、ソース データへの安全なアクセスを構成する次の方法について説明します。

  • (推奨)Unity Catalog ボリュームを作成します。

  • ストレージ資格情報を使用して Unity Catalog 外部ロケーションを作成します。

始める前に

GCS でデータへのアクセスを設定する前に、次のものがあることを確認してください。

  • Google クラウド サービス アカウントの GCS バケット内のデータ。

クラウドストレージへのアクセスを構成する

次のいずれかの方法を使用して、GCS へのアクセスを設定します。

クリーンアップ

クラウドアカウントとDatabricksの関連リソースを保持しなくなった場合は、それらをクリーンアップできます。

SQLウェアハウスを停止する

SQLウェアハウスを他のタスクに使用していない場合は、追加コストを避けるために SQLウェアハウスを停止する必要があります。

  1. SQLペルソナのサイドバーで、[SQLウェアハウス] をクリックします。

  2. SQLウェアハウスの名前の横にある [停止] をクリックします。

  3. プロンプトが表示されたら、もう一度 [停止 ] をクリックします。

次のステップ

この記事のステップを完了すると、ユーザーは COPY INTO コマンドを実行して、 GCS バケットから Databricks ワークスペースにデータを読み込むことができます。