Databricksインテグレーションの概要
ここに記載されている記事では、Databricks で使用できるさまざまなデータソース、BI ツール、開発者ツールに接続する方法に関する情報を提供します。 これらの多くは、当社の パートナーシステムを通じて入手できます。
データソース
Databricksでは、CSV、Delta Lake、JSON、Parquet、XML、等様々なデータ形式からデータを読み込み、書き込むことができます。また、Amazon S3、Google BigQuery、Cloud Storage、Snowflake等のデータストレージプロバイダーからもデータを読み書きすることが可能です。
包括的な一覧と接続手順については、「データ ソースへの接続 」および 「データ形式のオプション」を参照してください。
BIツール
Databricksは、Power BIやTableauなどといったユーザーに人気のあるBIツールとの統合を検証済です。DatabricksのクラスターやSQLウェアハウスを介し、多くの場合ローコードまたはノーコードでデータを操作できます。
接続手順を含む包括的な一覧については、「 BI と可視化」を参照してください。
その他のETLツール
Databricks は、あらゆる種類の データソース へのアクセスに加えて、dbt、Prophecy、Azure Data Factory などの ETL/ELT ツール、Airflow などのデータパイプラインオーケストレーションツール、DataGrip、DBeaver、SQL Workbench/J などのSQLデータベース ツールとの統合を提供します。
接続手順については、以下を参照してください。
ETL ツール: データの準備と変換
SQLデータベースツール: SQL データベースツールを使用する
IDEおよびその他の開発者ツール
Databricks 、 DataGrip 、IntelliJ、 PyCharm 、Visual Studio Code などの開発者ツールをサポートしており、プログラムでDatabricksコンピュートにアクセスできます。
開発者をサポートするツールの包括的なリストについては、 「Databricks での開発」を参照してください。
Git
Databricks Git フォルダーは、お気に入りのGit プロバイダーとのリポジトリレベルの統合を提供します。それにより、Databricks ノートブックでコードを開発し、リモートGitリポジトリと同期することが可能です。 「Databricks Git フォルダーと Git の統合」を参照してください。