ストリーミングデータソースの構成

Databricks は、Databricks レイクハウスへの直近のデータ取り込みのためにストリーム メッセージング サービスと統合できます。 Databricks は、レイクハウス内の強化および変換されたデータを他のストリーミング システムと同期することもできます。

構造化ストリーミングは、Apache Spark でサポートされているファイル形式へのネイティブ ストリーミング アクセスを提供しますが、Databricks では、クラウドオブジェクトストレージからデータを読み取るほとんどの構造化ストリーミング操作で Auto Loader をお勧めします。 「Auto Loaderとは」を参照してください。

ストリーミング メッセージを Delta Lake に取り込むと、メッセージを無期限に保持できるため、保持しきい値によるデータ損失を恐れることなくデータ ストリームを再生できます。

メッセージ キューからのストリーミングの特定の構成の詳細については、以下を参照してください。