Preset に接続
Presetは、組織全体に最新のビジネスインテリジェンスを提供します。 Presetは、オープンソースのApache Supersetを搭載した、強力で使いやすいデータ探索および視覚化プラットフォームを提供します。
Databricks SQLウェアハウス (以前の Databricks SQLエンドポイント) と Databricks クラスターをPresetと統合できます。
Presetに手動で接続する
このセクションでは、Databricks ワークスペース内の既存の SQLウェアハウスまたはクラスターをPresetに接続します。
要件
Presetと手動で統合する前に、次のものが必要です。
Databricks ワークスペース内のクラスターまたは SQLウェアハウス。
クラスターまたは SQLウェアハウスの接続の詳細 (具体的には、 サーバーのホスト名、 ポート、 および HTTP パス の値)。
Databricksの個人アクセストークン。 個人アクセストークンを作成するには、次の手順を実行します。
Databricks ワークスペースで、上部のバーにある Databricks ユーザー名をクリックし、ドロップダウンから[設定]を選択します。
[ 開発者] をクリックします。
[アクセストークン] の横にある [管理] をクリックします。
[ 新しいトークンの生成] をクリックします。
(任意)今後このトークンを識別するのに役立つコメントを入力し、トークンのデフォルトの有効期間である90日を変更します。有効期間のないトークンを作成するには(非推奨)、[有効期間 (日) ] ボックスを空白のままにしてください。
[生成] をクリックします。
表示されたトークンを安全な場所にコピーし、[完了] をクリックします。
注
コピーしたトークンは、必ず安全な場所に保存してください。 コピーしたトークンを他のユーザーと共有しないでください。 コピーしたトークンを紛失した場合、まったく同じトークンを再生成することはできません。 代わりに、この手順を繰り返して新しいトークンを作成する必要があります。 コピーしたトークンを紛失した場合、またはトークンが侵害されたと思われる場合は、アクセストークン ページでトークンの横にあるごみ箱 (取り消し) アイコンをクリックして、ワークスペースからそのトークンをすぐに削除することを強くお勧めします。
ワークスペースでトークンを作成または使用できない場合は、ワークスペース管理者がトークンを無効にしているか、トークンを作成または使用する権限を付与していない可能性があります。 ワークスペース管理者または次のトピックを参照してください。
注
セキュリティのベスト プラクティスとして、自動化されたツール、システム、スクリプト、アプリを使用して認証する場合、 Databricksでは、ワークスペース ユーザーではなく、サービス プリンシパルに属する個人のアクセス トークンを使用することをお勧めします。 サービスプリンシパルのトークンを作成するには、 「サービスプリンシパルのトークンの管理」を参照してください。
接続するステップ
Presetに手動で接続するには、次の手順を実行します。
新しいPresetアカウントを作成するか、 既存のPresetアカウントにサインインします。
[ + ワークスペース] をクリックします。
[ 新しいワークスペースの追加 ] ダイアログで、ワークスペースの名前を入力し、最も近いワークスペース領域を選択して、[ 保存] をクリックします。
ワークスペース タイルをクリックしてワークスペースを開きます。
ツール バーの [ カタログ > データベース] をクリックします。
[ + データベース] をクリックします。
[ データベースの接続 ] ダイアログの [ サポートされているデータベース] リストで、次のいずれかを選択します。
SQL ウェアハウスの場合は、[ウェアハウスDatabricks SQL] を選択します。
クラスターの場合は、[ Databricks 対話型クラスター] を選択します。
[SQLAlchemy URI] に次の値を入力します。
SQLウェアハウスの場合:
databricks+pyodbc://token:{access token}@{server hostname}:{port}/{database name}
クラスターの場合:
databricks+pyhive://token:{access token}@{server hostname}:{port}/{database name}
取り替える:
{access token}
要件からの Databricks 個人用アクセストークン値を使用します。{server hostname}
を要件の [サーバー ホスト名 ] の値に置き換えます。{port}
要件の [ポート ] の値を使用します。{database name}
を Databricks ワークスペース内のターゲット データベースの名前に置き換えます。
たとえば、SQLウェアハウスの場合:
databricks+pyodbc://token:dapi...@dbc-a1b2345c-d6e7.cloud.databricks.com:443/default
たとえば、クラスターの場合:
databricks+pyhive://token:dapi...@dbc-a1b2345c-d6e7.cloud.databricks.com:443/default
[ 詳細設定 ] タブをクリックし 、[その他] を展開します。
[エンジン パラメーター] に、次の値を入力します。
SQLウェアハウスの場合:
{"connect_args": {"http_path": "sql/1.0/warehouses/****", "driver_path": "/opt/simba/spark/lib/64/libsparkodbc_sb64.so"}}
クラスターの場合:
{"connect_args": {"http_path": "sql/protocolv1/o/****"}}
sql/1.0/warehouses/****
またはsql/protocolv1/o/****
要件の HTTP パス 値に置き換え ます。たとえば、SQLウェアハウスの場合:
{"connect_args": {"http_path": "sql/1.0/warehouses/ab12345cd678e901", "driver_path": "/opt/simba/spark/lib/64/libsparkodbc_sb64.so"}}
たとえば、クラスターの場合:
{"connect_args": {"http_path": "sql/protocolv1/o/1234567890123456/1234-567890-buyer123"}}
[ 基本 ] タブをクリックし、[ 接続のテスト] をクリックします。
注
接続のトラブルシューティングについては、Preset Web サイトの「 Databricks のデータベース接続チュートリアル 」を参照してください。
接続が成功したら、[ 接続] をクリックします。
次のステップ
Preset Web サイトで次の 1 つ以上のリソースを調べます。