ネットワーキング
この記事では、Databricks アカウントとワークスペースのデプロイと管理のためのネットワーク構成を紹介します。
Databricksアーキテクチャの概要
Databricks は、 コントロール プレーンと コンピュート プレーンで動作します。
コントロール プレーンには、Databricks アカウントで Databricks が管理するバックエンド サービスが含まれます。Web アプリケーションはコントロール プレーンにあります。
コンピュート平面は、データが処理される場所です。コンピュート平面には、使用するコンピュートに応じて 2 つのタイプがあります。
クラシックDatabricksコンピュートの場合、コンピュート リソースは、クラシック コンピュート プレーンと呼ばれる Google クラウド リソース内にあります。 これは、Google クラウド リソース内のネットワークとそのリソースを指します。
サーバレス コンピュートの場合、サーバレス コンピュート リソースは Databricks アカウントの サーバレス コンピュート プレーン で実行されます。
アーキテクチャの詳細については、「 Databricks アーキテクチャの概要」を参照してください。
安全なネットワーク接続
Databricks は既定でセキュリティで保護されたネットワーク環境を提供しますが、組織に追加のニーズがある場合は、次の図に示すさまざまなネットワーク接続間でネットワーク接続機能を構成できます。
ユーザーとアプリケーションから Databricks へ: アクセスを制御し、ユーザーとその Databricks ワークスペース間のプライベート接続を提供する機能を構成できます。 「ユーザーから Databricks へのネットワーク」を参照してください。
コントロール プレーンとクラシック コンピュート プレーン: クラスターなどのクラシック コンピュート リソースは、Google クラウド リソースにデプロイされ、コントロール プレーンに接続されます。 従来のネットワーク接続機能を使用すると、独自の仮想プライベート クラウドに従来のコントロール プレーン リソースをデプロイし、クラスターからコントロール プレーンへのプライベート接続を有効にすることができます。 クラシック コンピュート プレーン ネットワークを参照してください。
サーバーレス コンピュート プレーンとストレージ: Databricks サーバーレス コンピュート プレーンからのアクセスを許可するように、リソース上でファイアウォールを構成できます。 「サーバレス コンピュート プレーン ネットワーキング」を参照してください。
GCP ストレージ ネットワーキング機能を構成して、コンピュート プレーンとGoogle Cloud Storageの間の接続を保護できます。 詳細については、レイクハウスフェデレーションのネットワークに関する推奨事項を参照してください。
コントロールプレーンとサーバレスコンピュートプレーン間の接続は、パブリックインターネットではなく、常にクラウドネットワークバックボーンを介して行われます。