Databricks JDBC ドライバーのドライバー機能設定

この記事では、 Databricks JDBC ドライバーの特別なドライバー機能と高度なドライバー機能の設定を構成する方法について説明します。

この記事は、次の Databricks JDBC ドライバーの記事の情報を補足するものです。

Databricks JDBC ドライバーの Databricks 接続を構成するには、コンピュート リソース設定、認証設定、および次のドライバー機能設定のいずれかを、JDBC 接続 URL または JDBC 接続プロパティのプログラムによるコレクションに結合する必要があります。 接続 URL と接続プロパティのコレクションのどちらを使用するかは、ターゲット アプリ、ツール、クライアント、SDK、または API の要件によって異なります。 JDBC 接続 URL と JDBC 接続プロパティのプログラムによるコレクションの例については、「 Databricks JDBC ドライバーの認証設定」を参照してください。

Databricks JDBC ドライバーは、次の特別な高度なドライバー機能設定を提供します。

JDBCでのANSI SQL-92クエリーのサポート

レガシーSpark JDBCドライバーは、ANSI SQL-92言語のSQLクエリーを許可しており、クエリーをサーバーに送信する前にDatabricks SQL言語に変換します。ただし、アプリケーションがDatabricks SQLを直接生成する場合、またはアプリケーションがDatabricksに固有の非ANSI SQL-92標準SQL構文を使用する場合、Databricksでは接続構成としてUseNativeQuery=1を設定することをお勧めしています。この設定を使用すると、ドライバーはSQLクエリーをそのままDatabricksに渡します。

デフォルトのカタログとスキーマ

デフォルトのカタログとスキーマを指定するには、JDBC接続URLにConnCatalog=<catalog-name>;ConnSchema=<schema-name>を追加します。

JDBCで大規模なクエリー結果を抽出する

大規模なクエリー結果を抽出するときに最高のパフォーマンスを実現するには、以下の最適化が含まれている最新バージョンのJDBCドライバーを使用してください。

JDBCでのArrowシリアライズ

JDBC ドライバー バージョン 2.6.16 以降では、 Apache Arrow を使用する最適化されたクエリ結果シリアル化形式がサポートされています。

ログ記録を有効にする

JDBC ドライバーでのログ記録を有効にするには、重要なイベントのみをログに記録するように1から6までのすべてのドライバー アクティビティをログに記録するようにLogLevelプロパティを設定します。 LogPath プロパティを、ログ ファイルを保存するフォルダーへの完全なパスに設定します。

詳細については、 Databricks JDBC Driver Guide』Configuring Logging セクションを参照してください。