AI が生成したコメントを表に追加する

プレビュー

この機能はパブリックプレビュー段階です。

テーブルの所有者またはテーブルを変更するアクセス許可を持つユーザーは、カタログ エクスプローラーを使用して、Unity Catalog によって管理される任意のテーブルまたはテーブル列に対して AI によって生成されたコメントを表示および追加できます。 コメントは、テーブル スキーマや列名などのテーブル メタデータを考慮する大規模言語モデル (LLM) によって強化されます。

AIが生成したコメントはどのように機能しますか?

AI によって生成されたコメント (AI によって生成されたドキュメントとも呼ばれます) は、ユーザーが Unity Catalog によって管理されているデータをすばやく検出するのに役立つ方法を提供します。

重要

AI によって生成されたコメントは、スキーマに基づいてテーブルと列の一般的な説明を提供することを目的としています。 説明は、さまざまな業界の複数のオープンデータセットからのスキーマの例を使用して、ビジネスおよびエンタープライズコンテキストのデータに合わせて調整されています。 このモデルは、有害または不適切な記述を生成しないことを検証するために、何百ものシミュレートされたサンプルで評価されました。

AIモデルは常に正確であるとは限らず、コメントは保存する前に確認する必要があります。 Databricks では、AI によって生成されたコメントを人間がレビューして、不正確さをチェックすることを強くお勧めします。 このモデルは、PII を含む列の検出などのデータ分類タスクに依存しないでください。

テーブルに対する USE SCHEMA 権限と SELECT 権限を持つユーザーは、追加されたコメントを表示できます。

コメント候補の生成に使用されるモデルの詳細については、 AI によって生成されたテーブル コメントに関してよく寄せられる質問 を参照してください。

AIが生成したコメントを追加する

「カタログエクスプローラ」(Catalog Explorer) を使用して、提案されたコメントを表示、編集し、テーブルや列に追加する必要があります。

必要なアクセス許可: AI が提案するコメントを表示、編集、追加するには、テーブルの所有者であるか、テーブルに対する MODIFY 権限を持っている必要があります。

AI が生成したコメントをテーブルに追加するには、次のようにします。

  1. Databricks ワークスペースで、カタログ アイコン [カタログ] をクリックします 。

  2. テーブルを検索または参照して選択します。

  3. [タグ] フィールドの下にある [AI Suggested Comment] フィールドを表示します。

    AIが生成したコメント編集フィールド

    AI がコメントを生成するのに少し時間がかかる場合があります。

  4. コメントをそのまま受け入れるには [承諾 ] をクリックし、保存する前に変更するには [編集] をクリックします。

AI が生成したコメントを列に追加するには、次のようにします。

  1. Databricks ワークスペースで、カタログ アイコン [カタログ] をクリックします 。

  2. テーブルを検索または参照して選択します。

  3. 」タブで、「 AI生成 」ボタンをクリックします。

    各列にコメントが生成されます。

  4. 列のコメントの横にあるチェックマークをクリックして、コメントを受け入れるか、保存せずに閉じます。

テーブルの所有者またはテーブルに対する MODIFY 権限を持つユーザーは、カタログエクスプローラ UI または SQL コマンド (ALTER TABLE または COMMENT ON) を使用して、テーブルと列のコメントをいつでも更新できます。

AI が生成したテーブル コメントに関してよく寄せられる質問

このセクションでは、AI が生成したテーブル コメント (AI が生成したドキュメントとも呼ばれます) に関する一般的な情報を、よくある質問の形式で提供します。

AI 生成ドキュメント機能では、どのようなサービスが使用されますか?

HIPPA 準拠が有効になっているワークスペースでは、AI によって生成されたコメントで、外部モデル パートナーを使用して応答を提供する場合があります。

GCP の他のすべてのワークスペースでは、AI が生成したコメントは内部の大規模言語モデル(LLM)を使用します。

モデルが内部か外部かにかかわらず、これらのモデルに送信されたデータはモデルのトレーニングには使用されません。 モデル自体はステートレスであり、プロンプトや補完はモデルプロバイダーによって保存されません。

モデルサービング エンドポイントはどのリージョンでホストされていますか?

欧州連合 (EU) のデータは EU にとどまります。 外部パートナー モデルの場合、欧州連合 (EU) ワークスペースは EU でホストされている外部モデルを使用します。 他のすべてのリージョンでは、米国でホストされている外部モデルが使用されます。 内部 Databricks モデルの場合、欧州連合 (EU) ワークスペースでは、 eu-west-1でホストされているモデルが使用されます。 他のすべてのトラフィックは、パブリック プレビュー中に us-west-2 リージョンに送信されます。

Databricks と外部モデル パートナーの間でデータはどのように暗号化されますか?

Databricks と外部モデル パートナー間のトラフィックは、業界標準の TLS 1.2 暗号化を使用して転送中に暗号化されます。

保存時にすべてが暗号化されますか?

Databricks ワークスペース内に格納されているデータはすべて、AES-256 ビットで暗号化されます。 外部パートナーは、送信されたプロンプトや完了を保存しません。

モデルにはどのようなデータが送信されますか?

Databricks は、各 API 要求で次のメタデータをモデルに送信します。

  • テーブル スキーマ (カタログ名、スキーマ名、テーブル名、現在のコメント)

  • 列名 (列名、型、主キーかどうか、現在の列のコメント)

承認されたテーブルまたは列のコメントは、残りの Unity Catalog メタデータと共に Databricks コントロール プレーン データベースに格納されます。 コントロール プレーン データベースは AES-256 ビットで暗号化されています。