Databricks JDBC ドライバーのドライバー機能設定
この記事では、 Databricks JDBC ドライバーの特別なドライバー機能と高度なドライバー機能の設定を構成する方法について説明します。
Databricks JDBC ドライバーは、次の特別な高度なドライバー機能設定を提供します。
JDBCでのANSI SQL-92クエリーのサポート
レガシーSpark JDBCドライバーは、ANSI SQL-92言語のSQLクエリーを許可しており、クエリーをサーバーに送信する前にDatabricks SQL言語に変換します。ただし、アプリケーションがDatabricks SQLを直接生成する場合、またはアプリケーションがDatabricksに固有の非ANSI SQL-92標準SQL構文を使用する場合、Databricksでは接続構成としてUseNativeQuery=1
を設定することをお勧めしています。この設定を使用すると、ドライバーはSQLクエリーをそのままDatabricksに渡します。
デフォルトのカタログとスキーマ
デフォルトのカタログとスキーマを指定するには、JDBC接続URLにConnCatalog=<catalog-name>;ConnSchema=<schema-name>
を追加します。
JDBCで大規模なクエリー結果を抽出する
大規模なクエリー結果を抽出するときに最高のパフォーマンスを実現するには、以下の最適化が含まれている最新バージョンのJDBCドライバーを使用してください。
JDBCでのArrowシリアライズ
JDBC ドライバー バージョン 2.6.16 以降では、 Apache Arrow を使用する最適化されたクエリ結果シリアル化形式がサポートされています。
ログ記録を有効にする
JDBC ドライバーでのログ記録を有効にするには、重要なイベントのみをログに記録するように1
から6
までのすべてのドライバー アクティビティをログに記録するようにLogLevel
プロパティを設定します。 LogPath
プロパティを、ログ ファイルを保存するフォルダーへの完全なパスに設定します。
詳細については、 Databricks JDBC Driver Guide』の Configuring Logging
セクションを参照してください。