Delta Lake でのバリアントのサポート

プレビュー

この機能はパブリックプレビュー段階です。

Delta Lake に半構造化データを保存するために、 VARIANTデータ型を使用できます。 VARIANTの操作例については、「バリアント データのクエリ」を参照してください。

バリアント サポートが有効になっているテーブルを読み書きするには、Databricks Runtime 15.3 以降を使用する必要があります。

Deltaテーブルでバリアントを有効にする

バリアントを有効にするには、次のように、 VARIANT タイプの列を持つ新しいテーブルを作成します。

CREATE TABLE table_name (variant_column VARIANT)

また、次の構文を使用して、既存のテーブルで VARIANT のサポートを有効にすることもできます。

ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')

警告

バリアントを有効にすると、テーブルプロトコルがアップグレードされます。 アップグレード後、バリアントをサポートしていない Delta Lake クライアントではテーブルを読み取ることができなくなります。 「Databricks は Delta Lake の機能互換性をどのように管理しますか?」を参照してください。

制限事項

次の制限があります。

  • バリアント型列を使用してテーブルをパーティション分割することはできません。

  • バリアント列はテーブルのクラスタリング キーにすることはできません。

  • バリアント列を GROUP BY 句または ORDER BY 句で使用することはできません。

  • バリアント列で DISTINCT を呼び出すことはできません。

  • SQL セット演算子 (INTERSECTUNIONEXCEPT) をバリアント列で使用することはできません。

  • 列生成を使用してバリアント列を作成することはできません。

  • Delta はバリアント列のminValuesまたはmaxValues統計を収集しません。