ストリーミングデータソースの構成
Databricks は、Databricks レイクハウスへの直近のデータ取り込みのためにストリーム メッセージング サービスと統合できます。 Databricks は、レイクハウス内の強化および変換されたデータを他のストリーミング システムと同期することもできます。
構造化ストリーミングは、Apache Spark でサポートされているファイル形式へのネイティブ ストリーミング アクセスを提供しますが、Databricks では、クラウドオブジェクトストレージからデータを読み取るほとんどの構造化ストリーミング操作で Auto Loader をお勧めします。 「 Auto Loaderとは」を参照してください。
ストリーミング メッセージを Delta Lake に取り込むと、メッセージを無期限に保持できるため、保持しきい値によるデータ損失を恐れることなくデータ ストリームを再生できます。
メッセージ キューからのストリーミングの特定の構成の詳細については、以下を参照してください。