Unity Catalog オブジェクトにAI が生成したコメントを追加する

この記事では、AI によって生成された Unity Catalog オブジェクトとテーブル列のコメント (AI によって生成されたドキュメントとも呼ばれます) を紹介し、それらがどのように機能するかを説明し、それらを追加および編集する方法を示し、よく寄せられる質問に回答します。

サポートされているオブジェクト

AI によって生成されたコメントは、次の Unity Catalog オブジェクトでサポートされています。

  • カタログ

  • スキーマ

  • テーブル

  • テーブルの列

  • 関数

  • モデル

  • ボリューム

AI が生成したコメントは、ビューやマテリアライズドビューをサポートしていません。

AIが生成したコメントはどのように機能するか?

オブジェクトの所有者またはオブジェクトを変更する権限を持つユーザーは、カタログエクスプローラを使用して、Unity Catalog によって管理されるオブジェクトとテーブル列の AI 生成コメントを表示および追加できます。 コメントは、テーブル スキーマや列名などのアカウント オブジェクトのメタデータを取り込む大規模言語モデル (LLM) によって強化されます。

AI によって生成されたコメントは、ユーザーが Unity Catalog によって管理されるデータをすばやく見つけられるようにします。

重要

AI が生成するコメントは、スキーマに基づいてオブジェクトとテーブル列の一般的な説明を提供することを目的としています。 説明は、さまざまな業界のいくつかのオープンデータセットの例スキーマを使用して、ビジネスおよびエンタープライズのコンテキストでのデータに合わせて調整されています。 このモデルは、有害または不適切な説明の生成を回避することを確認するために、数百のシミュレートされたサンプルで評価されました。

AI モデルは常に正確であるとは限らないため、保存する前にコメントを確認する必要があります。 Databricks では、不正確な点がないか確認するために、AI によって生成されたコメントを人間が確認することを強く推奨しています。 このモデルは、PII を含む列の検出などのデータ分類タスクには依存しないでください。

コメントが追加されたときに表示するには、オブジェクトに対する SELECT 権限、親スキーマに対する USE SCHEMA 、および親カタログに対する USE CATALOG 権限が必要です。

コメントの提案の生成に使用されるモデルに関する情報については、「AIで生成されたコメントについてよく寄せられる質問」を参照してください。

始める前に

AI 生成コメントを使用する前に、ワークスペースで AI 支援機能を有効にする必要があります。 これはデフォルトで有効になっています。 有効になっていない場合、ワークスペース管理者は次の操作を行う必要があります。

  1. 「設定」で、 「詳細設定」タブに移動し、 「その他」セクションまで下にスクロールします。

  2. パートナーによる AI 支援機能オプションをオンにします。

AIが生成したコメントを追加する

カタログエクスプローラを使用して、提案されたコメントを表示し、編集し、オブジェクトやテーブルの列に追加する必要があります。

必要な権限: AI が提案するコメントを表示、編集、および追加するには、オブジェクトの所有者であるか、オブジェクトに対する MODIFY 権限を持っている必要があります。

AI が提案するコメントをオブジェクトに追加する

  1. Databricksワークスペースで、カタログ アイコンカタログをクリックします。

  2. オブジェクトを検索または参照して選択します。

  3. [ About this <object> ] パネルで、[ AI generate] をクリックします。

    AIが生成したコメントボタン

    AI がコメントを生成するのに少し時間がかかる場合があります。

  4. 「承諾」をクリックしてコメントをそのまま受け入れるか、「編集」をクリックしてコメントを変更する前に保存します。

AI が提案するコメントをテーブル列に追加する

  1. Databricksワークスペースで、カタログ アイコンカタログをクリックします。

  2. テーブルを検索または参照して選択します。

  3. テーブルの列見出しの上にある [AI generate] をクリックします。

    各列にコメントが生成されます。

  4. 列のコメントの横にあるチェックマークをクリックして、コメントを受け入れるか、保存せずに閉じます。

AI生成コメントを更新する

オブジェクトの所有者またはオブジェクトに対する MODIFY 権限を持つユーザーは、カタログエクスプローラのUI を使用して、いつでもコメントを更新できます。 インラインチャットアシスタントは、コメントの編集を支援し、 テキストを短くしたり 、テキストを別の言語に 翻訳 したりするオプションを提供します。

AIが生成するコメントインラインアシスタント

ALTER または COMMENT ON SQL コマンドを使用することもできます。

AI が生成したコメントについてよく寄せられる質問

このセクションでは、AI が生成したコメント (AI が生成したドキュメントとも呼ばれます) に関する一般的な情報を、よくある質問の形式で提供します。

AI 生成ドキュメント機能はどのようなサービスを使用しますか?

HIPPA コンプライアンスが有効になっているワークスペースでは、AI生成されたコメントで外部モデル パートナーを使用して応答を提供する場合があります。

GCP 上の他のすべてのワークスペースでは、AI が生成するコメントは、テーブルと列に内部の大規模言語モデル(LLM)を使用します。 他の Unity Catalog オブジェクトやインライン アシスタントに外部モデル パートナーを使用する場合があります。

モデルが内部モデルか外部モデルかにかかわらず、これらのモデルに送信されたデータはモデルのトレーニングには使用されません。 モデル自体はステートレスであり、プロンプトや入力候補はモデルプロバイダーによって保存されません。

モデルサービングエンドポイントはどのリージョンでホストされていますか?

欧州連合 (EU) のデータは EU にとどまります。 外部パートナー モデルの場合、欧州連合 (EU) ワークスペースは EU でホストされている外部モデルを使用します。 他のすべてのリージョンでは、米国でホストされている外部モデルが使用されます。 内部 Databricks モデルの場合、欧州連合 (EU) ワークスペースはeu-west-1でホストされているモデルを使用します。 他のすべてのトラフィックは、パブリック プレビュー中に us-west-2 リージョンに送信されます。

Databricks と外部モデル パートナー間でデータはどのように暗号化されますか?

Databricks と外部モデル パートナー間のトラフィックは、業界標準の TLS 1.2 暗号化を使用して転送中に暗号化されます。

保存時にすべてが暗号化されますか?

Databricks ワークスペース内に保存されるすべてのデータは、AES-256 ビットで暗号化されます。 当社の外部パートナーは、送信されたプロンプトや完了内容を一切保存しません。

モデルにはどのようなデータが送信されますか?

Databricks は、各 API リクエストで次のメタデータをモデルに送信します。

  • カタログ (カタログ名、現在のコメント、カタログの種類)

  • スキーマ (カタログ名、スキーマ名、現在のコメント)

  • テーブル (カタログ名、スキーマ名、テーブル名、現在のコメント)

  • 関数 (カタログ名、スキーマ名、関数名、現在のコメント、パラメーター、定義)

  • モデル (カタログ名、スキーマ名、モデル名、現在のコメント、エイリアス)

  • ボリューム (カタログ名、スキーマ名、ボリューム名、現在のコメント)

  • 列名 (列名、型、主キーかどうか、現在の列のコメント)

承認されたコメントは、Unity Catalog の残りのメタデータと共に Databricks コントロール プレーン データベースに格納されます。 コントロールプレーンデータベースはAES-256ビットで暗号化されています。