Google クラウドで Databricks フリートライアルを開始する
これらは、フリートライアルの有効期限が切れた後に従量課金制のサブスクリプションになるフリートライアルサブスクリプションで Databricks にサブスクライブする方法についての詳細な手順です。
注:
会社に契約サブスクリプションがある場合は、これらの手順を使用しないでください。 Google Marketplace プライベート オファーを使用してサブスクリプションを作成する方法については、Databricks アカウント チームにお問い合わせください。
Google Marketplaceで新しいアプリケーションを設定することにすでに精通している場合は、 代わりに新しいフリートライアル サブスクリプションを作成するための短いクイックスタート手順を使用できます。
ユーザーが Databricks on Google Cloudで稼働できるようにするには、次のことを行う必要があります。
Google Cloud Marketplace で Databricks サブスクリプションを作成します。 これにより、Databricks アカウントが作成されます。 あなたはアカウント所有者であり、初期設定を実行できるのはあなただけですが、他のユーザーをアカウント管理者として割り当てて、後続のアカウント管理タスクを実行することができます。
少なくとも 1 つの Databricks ワークスペースを作成します。 ワークスペースは、チームがすべての Databricks アセットにアクセスするために使用する環境です。
ワークスペースにユーザーとグループを追加します。
このプロセスの概要については、「Databricks on Google Cloudのデプロイ」をご覧ください。
要件
Databricks on Google Cloud アカウントを作成する前に、次のことを行います。
Google の請求先アカウントが必要です。
Google Identity and Access Management(IAM)には、次のロールが必要です。
roles/billing.admin
対象の Cloud 請求先アカウント または プロジェクトが配置されている Google Cloud 組織の 請求管理者()。このロールをお持ちでない場合は、組織管理者に連絡してアクセスをリクエストしてください。使用する 予定の請求先アカウントに関連付けられているプロジェクトのビューア (
roles/viewer
)。 閲覧者でない場合は、プロジェクトの所有者に連絡してアクセスをリクエストするか、 新しいプロジェクトを作成して適切な権限を付与することができます。 新しいプロジェクトを作成する場合は、 請求を有効にし 、プロジェクトを目的の Cloud 請求先アカウントにリンクする必要があります。
Google Cloud の組織、プロジェクト、請求の関係については、 Cloud Billing のアクセス制御に関する Google のドキュメントをご覧ください。 Google Cloud 全体でのロールと権限の詳細については、 ロールについてに関するドキュメントをご覧ください。
Databricks サブスクリプションをキャンセルできるユーザーは、組織内で自分だけとは限りません。 サブスクリプションは、請求先アカウントに対する
consumerprocurement.orders.cancel
権限を持つ組織内の Google Cloud ユーザー(請求先アカウントの請求管理者ロールまたは親組織の組織オーナーロール)がキャンセルできます。重要
Databricks では、Databricks サブスクリプションをキャンセルできる Google Cloud ユーザーのセットが正しいユーザー セットであることを確認することをお勧めします。 アクセス範囲が広すぎると、サブスクリプションが誤ってキャンセルされ、Databricks アカウント内のすべてのワークスペースが削除される可能性があります。 ワークスペースの削除は元に戻せません。
ワークスペースをデプロイするには、Google Cloud プロジェクトが必要です。 プロジェクト ID は、Databricks ワークスペースを作成するときに必要です。 これは、請求先アカウントに関連付けられているものと同じ Google Cloud プロジェクトである 必要はありません 。 ワークスペースの作成時に、プロジェクト で必要なDatabricks GoogleAPIs がまだ有効になっていない場合は、 で有効にします。
ワークスペースをデプロイする Google Cloud プロジェクトがまだない場合は、ここで作成します。
Google ワークスペース または Cloud Identity で Google アカウントが有効になっていることを確認します。
Google Cloud Console 内で Google Cloud Identity 組織オブジェクトが定義されていることを確認します。 必要に応じて、 組織の作成と管理に関する Google のドキュメントを参照してください。
プロジェクトを作成します。 Google のドキュメント記事「 組織の作成と管理」を参照してください。 プロジェクトの親組織を定義する必要があります。 プロジェクトの作成時にプロジェクト ID を指定しない場合、プロジェクト ID は自動的に生成されます。
Google Cloud プロジェクト ID をコピーします。 これは、Databricks ワークスペースを作成するために必要です。
プロジェクトがあるが、その ID がわからない場合は、 Google Cloud Platform Console の [リソースの管理 ] ページに移動します。 プロジェクトを見つけて、その ID をコピーします。
ワークスペースと一緒に使用してクラスタリングを実行する予定の Google Cloud プロジェクトには、適切な割り当てが必要です。 プロジェクトに必要なリソースクォータを確認します。クォータの引き上げをリクエストし、承認を待つ必要がある場合があります。 クォータを変更する場合は、変更が有効になるまで 15 分待ってからワークスペースを作成してください。 昇給をリクエストした場合は、クォータの更新に関するEメールの確認を受け取ってから15分待ちます。
ワークスペースを作成する準備をするには、ワークスペースの作成に必要な権限を確認します。 「必要な権限」を参照してください。
Google Cloud 組織のポリシーでドメイン制限付き共有が有効になっている場合は、Databricks の Google Cloud 顧客 ID(
C01p0oudw
)と自分の組織の顧客 ID の両方がポリシーの許可リストに含まれていることを確認してください。 Google の記事「組織のポリシーの設定」を参照してください。 サポートが必要な場合は、ワークスペースをプロビジョニングする前に、Databricks アカウント チームにお問い合わせください。
Databricks フリートライアルと最初のワークスペースを設定する
注:
会社に契約サブスクリプションがある場合は、これらの手順を使用しないでください。 Google Marketplace プライベート オファーを使用してサブスクリプションを作成する方法については、Databricks アカウント チームにお問い合わせください。
Google Cloud の リストDatabricksMarketplace に移動します。
このページにアクセスする方法は他にもあります。 Google Cloud Marketplace Explorer に移動し、Marketplace の検索ボックスを使用して「Databricks」を検索し、[Databricks] をクリックします。また、Google Cloud Console に移動し、左側のナビゲーションの [パートナー ソリューション] で [Databricks] をクリックすることもできます。
上部のナビゲーションのプロジェクト ピッカーで、 Databricksで使用する課金アカウントに関連付けられている Google Cloud プロジェクトを選択します。 これは、ワークスペースをデプロイするために使用するプロジェクトと同じである必要はありません。
価格、キャンセル、変更ポリシー、利用規約を確認します。
Databricks は、Databricks ユニット (DBU) での Databricks の使用に対して課金されます。 ワークロードが消費する DBU の数は、Databricks コンピュートの種類 (汎用またはジョブ) や Google Cloud マシンの種類など、さまざまな要因によって異なります。 詳細については、 価格ページを参照してください。
Google Cloud アカウントで追加費用が発生します:
Google Cloudは、Databricks がアカウント内の Databricks インフラストラクチャ用に作成する GKE クラスターに対して、ワークスペースごとの追加費用を請求します。 価格は変更される可能性があるため、 最新の価格を確認してください。
GKE クラスタリングの費用は、 Databricks クラスタリングがアイドル状態の場合でも適用されます。 このアイドル時間の費用を削減するために、 Databricks は、 Databricks Runtime クラスタリングが 5 日間アクティブでない場合、アカウント内の GKE クラスタリングを削除します。 VPC バケットや GCS バケットなどの他のリソースは変更されません。 次回 Databricks Runtime クラスタリングが開始されると、 Databricks によって GKE クラスタリングが再作成されるため、 Databricks Runtime クラスタリングの初期起動時間が長くなります。 GKE クラスタリングの削除によって毎月の費用が削減される例として、 Databricks Runtime クラスタリングを月の 1 日に使用し、残りの期間に再度クラスタリングを使用しなかった場合、GKE の使用量はアイドル タイムアウトが有効になる 5 日前で、それ以上の費用は発生せず、その月の費用は約 33 ドルになります。
ページの上部にある [ 購読] をクリックします。
[注文の概要] ページで、次の操作を行います。
サブスクリプション期間を選択します。
請求先アカウントを選択します。 ピッカーに表示されるデフォルトの請求先アカウントは、プレビュー ページの上部ナビゲーションで選択したプロジェクトに基づいています。 複数のプロジェクトにアクセスできる場合、請求先アカウント ピッカーには追加の請求先アカウント オプションが表示されます。
「利用規約」セクションをお読みください。
チェックボックスを選択して、請求と利用規約への同意を確認します。
「サブスクライブ」をクリックします。
「ご注文リクエストがDatabricksに送信されました」というポップアップで、 Databricksで登録するをクリックします。
[Databricks へようこそ] ポップアップ ウィンドウで、次の操作を行います。
会社名を入力します。 Eメール アドレスは入力しないでください。
[ Google でログイン] をクリックします。 Google から Google アカウント Eメール アドレスの選択を求められる場合があります。
ID を確認し、アクセスを確認すると、Google Cloud Marketplace に Databricks のリストが表示されます。 上部にある青いボタン [ プロバイダーで管理] をクリックします。 上部の青いボタンに「Databricksで登録する」と表示されている場合は、数秒待ってからWebページを再読み込みしてください。青いボタンに 「プロバイダーで管理」と表示されるまで繰り返し、そのボタンをクリックします。
重要
サブスクリプションをアクティブ化するには、 プロバイダーの[管理 ]をクリックすることが重要です。
「Googleを辞めます」ポップアップで、「 OK」をクリックします。 場合によっては、Google アカウント Eメール アドレスを選択し、本人確認を行う必要があります。
Databricks アカウント コンソールが表示され、ワークスペースを作成および管理できます。 アカウントコンソールのWebページをブックマークすることができます。 「Databricks アカウントの管理」を参照してください。
Databricks アカウントコンソールで、[ワークスペースの作成] をクリックして最初のワークスペースを作成します。詳細については 、「アカウント コンソールを使用してワークスペースを作成する 」を参照してください。
ほとんどのアカウントでは、ワークスペースは Unity Catalog by Default が有効になっており、一元化されたデータガバナンスと ID 管理を提供します。 「Unity Catalog とは」および「Unity Catalog のセットアップと管理」を参照してください。
ワークスペースの作成に関する考慮事項
ワークスペースを作成するときは、次の点を考慮してください。
大規模なクラスタリングまたは多数のワークスペースを使用する場合は、 ネットワークDatabricks サイジング計算機 を使用して GKE サブネット範囲を計算し、 ジョブを実行するのに十分な IP スペースがワークスペースにあることを確認します。
Databricks によってワークスペース用に起動される Google Kubernetes Engine(GKE)クラスタリングを変更またはカスタマイズしないでください。クラスタリングをカスタマイズする必要がある場合は、 Databricks アカウントチームにお問い合わせください。
Databricks ワークスペースにログインする
Databricks ワークスペースのユーザーは、OpenID Connect 仕様に準拠し、OpenID 認定を受けた Google の OAuth 2.0 実装を使用して、Google Cloud Identity アカウントで認証します。 Databricks は、Google への認証要求で OpenID プロファイル スコープ値を提供します。 必要に応じて、Google Cloud Identity アカウントを外部の SAML 2.0 ID プロバイダ(IdP)と連携するように設定して、ユーザーの認証情報を確認できます。 Google Cloud Identity は、Microsoft Entra ID、Okta、Ping、その他の IdP と連携できます。 ただし、 Databricks は Google Identity Platform APIsとのみ直接やり取りします。
ワークスペースユーザーがワークスペースにログインするには、次の 3 つの方法があります。
すべてのユーザーが自分のワークスペース URL を直接使用できる: ワークスペース ユーザー、ワークスペース管理者、アカウント管理者は、ワークスペース URL を直接使用できます。 ユーザーは、Databricks と Google の Cloud Identity OAuth 2.0 実装との統合を通じて認証されます。 ユーザーがワークスペースに追加されると、ユーザーは URL を含む Eメール を受け取ります。
すべてのユーザーは、Databricks アカウントコンソールからワークスペースにアクセスできます: Databricksユーザー名 (Eメール アドレス) を使用してアカウントコンソールにログインし、ワークスペースタブに移動してワークスペースを見つけ、[開く] をクリックします。
アカウント 管理者は 、Google Cloud Console を使用してワークスペースにアクセスすることもできます: アカウント 管理者は、Google Identity OAuth 2.0 で認証して Databricks アカウント コンソールにアクセスします。 アカウント コンソールには、選択可能なワークスペースの一覧が表示されます。 認証トークンを使用してワークスペースのログインページにリダイレクトされます。 トークンが受け入れられた場合、再度ログインするように求められます。 最初のログイン時に、OAuth スコープに同意するように求められます。