DataGrip と Databricks の統合

この記事では、Databricks によって提供もサポートもされていない DataGrip について説明します。 プロバイダーに問い合わせるには、「 DataGrip サポート」を参照してください。

DataGrip は、データベース開発者向けの統合開発環境 (IDE) であり、クエリーコンソール、スキーマナビゲーション、実行計画、スマートコード補完、リアルタイム分析とクイックフィックス、リファクタリング、バージョン管理の統合、およびその他の機能を提供します。

この記事では、ローカル開発コンピューターを使用して DataGrip をインストール、構成、および使用して Databricks のデータベースを操作する方法について説明します。

この記事は、macOS、 Databricks JDBC ドライバー バージョン 2.6.36、 DataGrip バージョン 2023.3.1 でテストされています。

要件

DataGrip をインストールする前に、ローカル開発マシンが以下の要件を満たしている必要があります。

  • Linux、macOS、または Windows オペレーティング システム。

  • Databricks JDBC ドライバー をローカルの開発コンピューターにダウンロードし、ダウンロードした DatabricksJDBC42-<version>.zip ファイルから DatabricksJDBC42.jar ファイルを抽出します。

  • DataGrip に接続するための DatabricksクラスターまたはSQL ウェアハウス

ステップ1:DataGrip をインストールする

DataGripをダウンロードしてインストールします

  • Linux: .zip ファイルをダウンロードし、その内容を抽出して、 Install-Linux-tar.txt ファイルの指示に従います。

  • macOS: .dmg ファイルをダウンロードして実行します。

  • Windows: .exe ファイルをダウンロードして実行します。

詳細については、DataGrip Web サイトで DataGrip をインストールする を参照してください。

ステップ 2: DataGrip 用の Databricks JDBC ドライバーを構成する

以前にダウンロードした Databricks JDBC ドライバーに関する情報を使用して DataGrip をセットアップします。

  1. DataGripを起動します。

  2. [ ファイル] > [データソース] をクリックします。

  3. [データソースとドライバ]ダイアログ ボックスで、[ドライバ]タブをクリックします。

  4. +(ドライバ)ボタンをクリックしてドライバを追加します。

  5. [名前] に「 Databricks」と入力します。

  6. [全般] タブの [ドライバー ファイル] リストで、[+ (追加)] ボタンをクリックします。

  7. カスタム JAR」をクリックします

  8. 前に抽出した DatabricksJDBC42.jar ファイルを参照して選択し、[ 開く] をクリックします。

  9. [クラス] で [com.databricks.client.jdbc.Driver] を選択します。

  10. OK をクリックします。

ステップ 3: DataGrip を Databricks データベース に接続する

  1. DataGrip で、[ ファイル > データソース] をクリックします。

  2. [データソース] タブで、[+ (追加)] ボタンをクリックします。

  3. 前の手順で追加した Databricks ドライバーを選択します。

  4. [全般] タブの [URL] に、Databricks リソースの [JDBC URL] フィールドの値を入力します。JDBC URL フィールドの構文については、「Databricks JDBC ドライバーの認証設定」を参照してください。

  5. [ 接続のテスト] をクリックします。

    ヒント

    接続をテストする前に、リソースを開始する必要があります。 そうしないと、リソースの開始中にテストが完了するまでに数分かかる場合があります。

  6. 接続が成功した場合は、[ スキーマ ] タブで、アクセスできるようにするスキーマのボックス ( [すべてのスキーマ] など) をオンにします。

  7. OK をクリックします。

DataGrip がアクセスするリソースごとに、この手順を繰り返します。

ステップ 4: DataGrip を使用してテーブル を参照する

DataGrip を使用して、Databricks ワークスペース内のテーブルにアクセスします。

  1. DataGrip の データベース ウィンドウで、リソース ノードを展開し、参照するスキーマを展開して、 テーブルを展開します。

  2. テーブルをダブルクリックします。 テーブルの最初の行セットが表示されます。

このステップ の手順を繰り返して、追加のテーブルにアクセスします。

他のスキーマのテーブルにアクセスするには、 データベース ウィンドウのツール バーで [データソースのプロパティ ] アイコンをクリックします。 [データソースとドライバー] ダイアログ ボックスの [スキーマ] タブで、アクセスする追加の各スキーマのチェック ボックスをオンにし、[OK ] をクリックします。

ステップ 5: DataGripを使用して SQL ステートメント を実行する

DataGripを使用して、samplesカタログのnyctaxiスキーマからサンプルtripsテーブルをロードします。

  1. DataGripで、[ファイル]>[ 新規>SQLファイル]をクリックします

  2. ファイルの名前を入力します(例: select_trips)。

  3. select_trips.sql ファイル」タブで、次のSQL文を入力します。

    SELECT * FROM samples.nyctaxi.trips;
    
  4. SELECT ステートメントを選択します。

  5. ファイルタブのツールバーで、[ 実行] アイコンをクリックします。

次のステップ