Delta Lake でのバリアントのサポート
プレビュー
この機能はパブリックプレビュー段階です。
Delta Lake に半構造化データを保存するために、 VARIANT
データ型を使用できます。 VARIANT
の操作例については、「バリアント データのクエリ」を参照してください。
バリアント サポートが有効になっているテーブルを読み書きするには、Databricks Runtime 15.3 以降を使用する必要があります。
Deltaテーブルでバリアントを有効にする
バリアントを有効にするには、次のように、 VARIANT
タイプの列を持つ新しいテーブルを作成します。
CREATE TABLE table_name (variant_column VARIANT)
また、次の構文を使用して、既存のテーブルで VARIANT
のサポートを有効にすることもできます。
ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')
警告
バリアントを有効にすると、テーブルプロトコルがアップグレードされます。 アップグレード後、バリアントをサポートしていない Delta Lake クライアントではテーブルを読み取ることができなくなります。 「Databricks は Delta Lake の機能互換性をどのように管理しますか?」を参照してください。
制限事項
次の制限があります。
バリアント型列を使用してテーブルをパーティション分割することはできません。
バリアント列はテーブルのクラスタリング キーにすることはできません。
バリアント列を
GROUP BY
句またはORDER BY
句で使用することはできません。バリアント列で
DISTINCT
を呼び出すことはできません。SQL セット演算子 (
INTERSECT
、UNION
、EXCEPT
) をバリアント列で使用することはできません。列生成を使用してバリアント列を作成することはできません。
Delta はバリアント列の
minValues
またはmaxValues
統計を収集しません。