AI/BI Genieスペースでの作業
プレビュー
この機能は パブリック プレビュー段階です。 「ワークスペースでGenieスペースを有効にする」を参照してください。
概要
データアナリストなどのドメイン専門家は、データセット、サンプル クエリ、テキスト ガイドラインを使用して Genieスペースを構成し、Genieがビジネス上の質問を分析クエリに変換する手助けをします。 セットアップ後、ビジネス ユーザーは質問をしたり、運用データを理解するための視覚化を生成したりできます。 genieのセマンティックナレッジは、データが変更されたり、ユーザーが新しい質問を投げかけたりしたときに、継続的に更新できます。DatabricksIQの詳細については、「DatabricksIQを活用した機能」を参照してください。
AI/BI genie は、注釈が付けられたテーブルと列の名前と説明を使用して、自然言語の質問を同等の SQL クエリに変換します。 次に、生成されたクエリと結果テーブル (可能な場合) で応答します。 genieが回答を生成できない場合は、回答を提供しようとするときにフォローアップの質問を明確にすることができます。
使用例
さまざまな非技術者層に対応するために、さまざまなGenieスペースを作成できます。次のシナリオでは、考えられる 2 つのユース ケースについて説明します。
必要な権限
Genieスペースを作成、編集、使用するには、次の権限が必要です。
コンピュートの権限: Genieスペースの作成者、編集者、およびユーザーには、スペースに指定されたデフォルト SQLウェアハウスへの CAN USE アクセス権が必要です。 作成者は、スペースを作成するときに デフォルトの SQLウェアハウスを選択します。 CAN RUN権限を持つ任意のSQL ウェアハウスを選択できます。
データ アクセス権限:スペースを操作するすべてのユーザーは、スペースで使用されるデータに対して少なくとも
SELECT
権限が必要です。Genieスペースの権限:ユーザーがGenieやスペースで使用されるデータを操作するには、Genieスペースでの実行可能(CAN RUN)権限が必要です。Genieスペースの権限と能力の完全なマッピングについては、「 GenieスペースのACL」を参照してください。
注:
データとコンピュートへのアクセスを設定するには、通常は管理者に制限されている上位の権限が必要です。「SQLウェアハウスの作成」と「Unity Catalogでの特権の管理」を参照してください。
ワークスペースでGenieスペースを有効にする
Genieは、アカウントレベルとGenieスペースが作成されるワークスペースで有効化される必要があるパートナーが提供するAI機能を使用します。Genieスペースを有効にするには、次の各設定を確認します。
パートナーが提供する AI 機能は、アカウント レベルで有効になります。 アカウント管理者は、次の手順を完了することでこの機能を有効にできます。
アカウントコンソールのサイドバーで、[設定]をクリックします。
[機能有効化]タブをクリックします。
[ パートナーが提供する AI 機能を有効にする ] オプションをオンにします。
パートナー向けの AI 機能は 、ワークスペース レベルで有効にする前に、アカウント レベルで有効にする必要があります。
パートナーが提供する AI 支援機能は 、ワークスペースで有効にする必要があります。 ワークスペース管理者は、次の手順を使用してこの機能を有効にできます。
ワークスペースにログインします。
Databricksワークスペースの上部のバーにあるユーザー名をクリックし、[設定]を選択します。
[詳細設定]タブをクリックし、[その他]セクションまで下にスクロールします。
パートナーが提供する AI 支援機能 オプションをオンにします。
genieワークスペースのプレビューページから有効にする必要があります。ワークスペース管理者は、このプレビューを有効にできます。 「Databricks プレビューの管理」を参照してください。
セットアップと使用の制限
容量:
ワークスペースには、最大 1,000 個の Genieスペースを含めることができます。
テキスト処理:
各 Genieスペースには、質問ごとに約14,000 トークン のトークン制限があります。 トークンは、 Genieが言語を処理および理解するために使用するテキストの基本単位です。 たとえば、命令として含まれているテキストやメタデータに含まれるテキストは、トークンに変換されます。 トークンの制限には、テーブルメタデータ (列名、説明、テーブル名、キー定義など)、命令、サンプル SQL ステートメント、信頼できるアセット、および以前のチャット会話が含まれます。 Genieスペースがこの制限に近づくか、それを超えると、製品から警告またはエラーが通知されます。
このようなエラーのトラブルシューティングについては、「 トークンの制限により要求が処理されない」を参照してください。
新しいGenieスペースを作成する
ワークスペースで Genieスペースが有効になっている場合、データアナリストは次の手順を実行して、ビジネスユーザー向けのドメイン固有の Genieスペースエクスペリエンスを作成できます。
サイドバーの「genie」をクリックします。
画面の右上隅にある [新規 ] をクリックします。
[新規] ダイアログで、初期設定を選択します。オプションについては、次のように説明します。
タイトル: タイトルは、他のワークスペース オブジェクトとともにワークスペース ブラウザーに表示されます。エンドユーザーがGenieスペースを見つけるのに役立つタイトルを選択します。
説明: ユーザーがGenieスペースを開いたときに説明が表示されます。 このテキスト領域を使用して、スペースの目的を説明します。
デフォルト ウェアハウス : このコンピュート リソースは、SQL Genieスペースで生成される ステートメントを強化します。エンドユーザーは、スペースを操作するためにこのウェアハウスにアクセスする必要があります。 Genieスペースでは、プロまたはサーバレス ウェアハウスSQL使用できます。最適なパフォーマンスを得るために、 Databricks はサーバレス SQLウェアハウスを使用することをお勧めします。
テーブル: Genieスペースは 1 つ以上のテーブルに基づくことができます。[テーブルを追加] ボタンをクリックすると新しいダイアログが開き、追加するUnity Catalogテーブルを選択できます。
質問サンプル:質問サンプルは任意です。チャットに表示され、ユーザーが質問できるタイプの例を提供します。作成中に追加することも、後でスペースの設定から追加することもできます。
どのデータを使うべきですか?
Unity Catalogの1 つ以上のマネージドテーブルを用いて新しい Genieスペースを作成できます。AI/BI Genieは応答を生成するために、Unity Catalogオブジェクトに添付されたメタデータを使用します。 適切に注釈が付けられたデータセットと、提供する具体的な指示を組み合わせることが、エンドユーザーにとって好ましいエクスペリエンスを生み出す鍵となります。
Databricksでは、次のことを推奨しています。
分析用にデータをキュレーションする:ビューをレイヤー化して列数を減らし、ユースケース固有の情報を追加して回答の質を高めます。
Genieスペース内のテーブルと列の数を最小限に抑える: 特定のドメインの質問に答えるために必要なテーブルと列のみを取り込む。不要なテーブルや列があると、 genie が混乱を招いたり、誤った回答を出したり、エラーメッセージが表示されたりする可能性があります。
指示を与える
指示は、 Genieの応答をガイドして、特定のドメイン内の固有の専門用語、ロジック、および概念を処理できるようにするのに役立ちます。 包括的な指示は、シームレスで直感的な Genieスペースエクスペリエンスに不可欠です。 指示を入力するための指示ペインを開くには、Genieスペースのサイドバーの指示 をクリックします。このペインを使用して、 一般的な命令、 SQL クエリの例、 および SQL 関数を追加します。
一般的な指示
あなたのビジネスや対応の嗜好を明確に伝えるプレーンテキストの指示を提供し、 Genieがそれに従うようにしましょう。 指示を 1 つの包括的なメモとして書式設定したり、トピックごとに分類して整理したりできます。
以下は、一般的な手順に含めることができる情報の例を示しています。
会社固有のビジネス情報:
「私たちの会計年度は2月に始まります」
値、エイリアス、または共通フィルタ:
「フィルターを適用するときは、常に小文字に変換し、like演算子を使用してください。」
「フィルター値のステータスに略語を使用してください。」
質問に答える関数を指定し、戻り値の指示を提供します。
「四半期には
adventureworks.oneb.get_quarter(date)
UDFを使用してください。get_quarter()
の出力は四半期で、1、2、3、または 4 のいずれかです。これを使用して、必要に応じてデータをフィルタリングします。
SQL クエリの例
SQLクエリの例は、Genieの訓練の助けとなるようにあなたが準備するSQLクエリです。クエリの例を追加すると、データを使用して質問に答える方法を効果的にGenieに示すことができます。 また、サンプルの質問を追加して、サンプル クエリで回答すると思われる質問の種類について genie に教えることもできます。 genie が一致する質問を受け取った場合、サンプル クエリを直接使用して回答を提供できます。同様の質問を受けた場合は、サンプルクエリの手がかりを使用して、応答で提供されるSQLを構造化できます。 次の例のように、組織とデータに固有のロジックを強調するサンプルの提供に重点を置きます。
-- Return our current total open pipeline by region.
-- Opportunities are only considered pipelines if they are tagged as such.
SELECT
a.region__c AS `Region`,
sum(o.amount) AS `Open Pipeline`
FROM
sales.crm.opportunity o
JOIN sales.crm.accounts a ON o.accountid = a.id
WHERE
o.forecastcategory = 'Pipeline' AND
o.stagename NOT ILIKE '%closed%'
GROUP BY ALL;
SQL クエリにパラメーターを追加する
パラメーターを使用すると、実行時に置き換えられる特定の値のプレースホルダーを含むサンプル クエリを記述できます。 パラメーターを使用すると、 Genieはユーザーの質問から特定の入力を受け取り、サンプル クエリの構造を再利用して、検証済みの回答を信頼できる資産として提供できます。 たとえば、前の SQL クエリを調整して、 o.forecastcategory
値でフィルター処理するパラメーターを含めると、クエリでさまざまな予測カテゴリにタグ付けされた営業案件に関する質問に対処できます。 パラメーター化されたクエリを使用して、信頼できる資産としてラベル付けされた応答を生成する方法の詳細については、「AI/BI Genieスペースで信頼できる資産を使用する」を参照してください。
次のコード スニペットは、 o.forecastcategory
値のパラメーターを追加して変更した前の例を示しています。 パラメーター は、名前付きパラメーター マーカーと同じ構文を使用します。 名前付きパラメーター マーカーを参照してください。
-- Return our current pipeline at a stage by region.
-- Opportunities are only considered pipelines if they are tagged as such.
SELECT
a.region__c AS `Region`,
sum(o.amount) AS `Open Pipeline`
FROM
sales.crm.opportunity o
JOIN sales.crm.accounts a ON o.accountid = a.id
WHERE
o.forecastcategory = :forecast_category AND
o.stagename NOT ILIKE '%closed%'
GROUP BY ALL;
クエリにパラメーターを追加するには:
クエリ内のパラメーターを配置する場所にカーソルを置きます。
[パラメーターを追加]をクリックし、新しいパラメーターを追加します。
これにより、デフォルト名が
parameter
の新しいパラメーターが作成されます。 デフォルト名を変更するには、クエリエディタで名前を置き換えます。 エディターにコロンの後にパラメーター名 (:parameter_name
) を入力して、パラメーターを追加することもできます。
クエリーパラメータの編集
パラメーターを編集するには、次の手順を実行します。
パラメーター名の横にあるをクリックします パラメーターの詳細ダイアログが表示され、次の構成オプションが含まれます。
キーワード: クエリ内のパラメーターを表すキーワード。 これは、クエリ内のテキストを直接更新することによってのみ変更できます。
表示名: genie チャット エクスペリエンスで使用する人間が判読できる名前。 genie がパラメータ化されたクエリを使用して応答を生成する場合、応答には表示名と関連する値が含まれます。
種類: サポートされている種類には、 文字列、 日付、 日付と時刻、 数値があります。
デフォルト型は 文字列です。
数値データ型では、10 進数と整数のどちらかを指定できます。デフォルトの数値型は 10 進数です。
注:
実際の入力値が選択したパラメーターの種類と一致しない場合、 genie は入力値を誤った種類として扱い、結果が不正確になる可能性があります。
UI の別の部分をクリックして、ダイアログを閉じます。
SQL 関数
SQL 関数は、 Unity Catalog に格納され、特定の質問に答えるために genie が使用するカスタム関数です。 genie これらの関数を呼び出して、ユーザー指定の任意のパラメーターを挿入できますが、基になる SQL コンテンツにアクセスすることはできません。 つまり、 SQL 関数は、 genie アクセスまたは編集できないはずの複雑な引数や計算を含む一般的な特定の質問に答えるのに理想的です。 Unity Catalog に関数を登録する方法については、「 SQL テーブル関数を作成する 」および 「Unity Catalog でのユーザー定義関数 (UDF)」を参照してください。
信頼できる資産
パラメータ化されたサンプルクエリまたは SQL 関数の正確なテキストを使用して応答を生成すると、 genie は応答を 信頼できる資産としてマークします。 信頼できるアセットは、結果の精度に対する追加の保証層を宇宙のユーザーに伝えることを目的としています。 「AI/BI Genieスペースで信頼できるアセットを使用する」を参照してください。
Genieスペースでチャットする
ほとんどのGenieスペースインタラクションはチャットウィンドウで行われます。
新しいチャット ウィンドウには、厳選されたサンプルの質問のセットが含まれています。これらのサンプルの質問は、ユーザーがGenieスペースでどのような質問をできるかを理解するのに役立ちます。ユーザーが質問を入力するテキストフィールドは、画面の下部近くにあります。
回答はテキストフィールドの上に表示されます。ユーザーが質問を入力すると、左ペインのチャット履歴スレッドに保存されます。
チャット履歴
チャット履歴のスレッドはユーザーごとに保存され、過去の質問や回答を参照することができます。ユーザーは、チャットスレッドから質問を再送信または修正することもできます。左ペインの新規チャットボタンをクリックすると、新しいスレッドが開始されます。
各チャットスレッドは、以前に尋ねられた質問に関するコンテキストを保持します。 これにより、ユーザーはフォローアップの質問をして、結果セットをさらに探索したり、焦点を合わせたりすることができます。
回答の構成
正確な回答の構成は、質問によって異なります。多くの場合、回答には自然言語による説明と、関連する結果セットを示す表が含まれています。すべての回答には、質問に答えるために生成されたSQLクエリが含まれます。[生成されたコードの表示] をクリックして、生成されたクエリを表示します。
応答の右下には、オプションのアクションが含まれています。 レスポンスCSVをクリップボードにコピーし、CSVファイルとしてダウンロードし、Genieスペースの指示として追加し、回答に賛成票を投じるか、反対票を投じることができます。
表形式のデータを含む回答の後に、クイックアクションタイルのセットが表示されます。これらを使用して、ビジュアライゼーションを生成できます。
クエリ結果を取得した後、言葉で説明することでビジュアライゼーション を生成することもできます。
回答に対するフィードバックの提供
各AI/BI genie応答には、親指を立てる、または下げるフィードバック ボタンが含まれています。 Databricks では、このメカニズムを使用して、ユーザーにスペースに関するフィードバックを提供するよう促すことを推奨しています。
クエリ結果を含む応答の場合、ユーザーは をクリックして、Genie スペース エディターによるレビューを要求できます。生成された回答の品質や正確性について疑問がある場合は、レビュー用にマークし、必要に応じてコメントや質問を追加できます。
ビジネス ユーザーは、レビュー用にマークした質問の更新を [履歴 ] ページで確認できます。 Genieスペースに対して少なくともCAN MANAGE権限を持つユーザーは、特定の交換を確認し、リクエストにコメントし、応答を確認または修正できます。 モニタリングページでフィードバックにアクセスし、リクエストを確認できます。 その後、そのフィードバックを使用して、応答を調整し、スペースでの試行錯誤を行うことができます。 「レビュー履歴とフィードバック」を参照してください。
レビュー履歴とフィードバック
Genieスペースは、1回限りのデプロイメントではなく、データチームとビジネスユーザーが知識を蓄積するための継続的なコラボレーションツールとなることを目的としています。 ビジネスユーザーが答えを必要としている新しい質問を理解することは、知識の構築に不可欠です。 履歴ページでは、個々の質問と回答、ユーザーから提供された「サムズアップ」または「サムズダウン」のフィードバック、レビュー対象としてマークされた質問を表示できます。 履歴ページを開くには、 Genieスペースのサイドバーで「 履歴 」をクリックします。
履歴ページには、スペースで尋ねられたすべての質問と回答が表示されます。 時間、評価、ユーザー、またはステータスで質問をフィルタリングできます。 スペースをモニタリングすることで、 Genieスペースの編集者は、ビジネスユーザーから寄せられた問い合わせや、 Genieスペースがどのように応答したかを積極的に理解することができます。
Genieが苦手とする質問を特定することで、Genieスペースに対して具体的な指示を出し、回答を改善することができます。質問をクリックすると、質問と回答のテキストが開きます。このビューからチャットスレッド全体にアクセスすることもできます。
生成されたSQLを編集する
任意の応答で生成された SQL を確認して編集できます。 Genieスペースの作成者は通常、 Genieが誤った回答を生成しているかどうかを認識できる領域とデータを知っています。 多くの場合、生成された SQL クエリを少し手動で調整するだけでエラーを修正できます。 応答に対して生成された SQL を表示するには、 「生成されたコードを表示」をクリックしてクエリを調べます。
Space で 以上の権限を持っている場合は、生成された SQLステートメントを編集して修正できます。CAN EDITGenie修正が完了したら、クエリを実行します。 その後、それを指示として保存し、将来的にgenieに答え方を教えることができます。 編集したクエリを保存するには、指示として保存 をクリックします。
ベンチマークによる回答の評価
ベンチマークを使用すると、Genieスペースでの個々の回答のテストと評価をスケールアップできます。 指示とは異なり、ベンチマークはGenieスペースを評価するためのものであり、情報を提供するものではありません。 genieは、 のコンテキストを改善するためにベンチマーク質問や例SQL genieを使用しません。
ベンチマークを使用すると、テスト問題のコレクションを実行し、その回答を使用して genieの精度を測定できます。 必要に応じて、SQL 応答が期待どおりの結果を返すように含めることができます。 ベンチマーク問題が実行されると、 genieの回答は、ステートメント SQL 提供された結果と比較され、正確性が採点されます。 SQLの回答が提供されていない場合、質問はレビュー対象としてマークされます。
「Genieスペースでのベンチマークの使用」を参照してください。
Genieスペースのクローン
Genieスペースをクローンすると、すべてのセットアップコンテキストと手順を含むコピーが作成されます。これは、十分に開発されたスペースがあり、追加のテストのために新しいスペースを作成したり、元のスペースのコンテキストを再利用したりする場合に便利です。 スペースをクローンすると、新しいスペースは元のスペースから独立しているため、元のスペースに影響を与えずに編集や調整を行うことができます。
次のエレメントは、クローン作成された Genieスペースにコピーされます。
テーブルと設定
一般的な指示
SQL クエリの例
SQL 関数
既存のチャット スレッドと 履歴 データは、新しいスペースにコピーされません。
Genieスペースをクローンするには、次の手順を実行します。
クローンを作成するGenieスペースを開きます。
スペースの右上隅にある ケバブメニューをクリックします。
[クローンを作成] をクリックします。
(オプション) 「クローン」 ダイアログで、クローン作成されたGenieスペースの新しい名前とワークスペース・フォルダの場所を指定します。
[クローン] をクリックして、新しいスペースを作成します。
Genieスペースの回答はどのように生成されますか?
Genieスペースは、テーブル名と列名および説明を使用して、自然言語の質問に対する回答を生成します。テーブル内の実際のデータは、Genieからは非表示のままです。
スペース準備のベストプラクティス
構築する前に、宇宙のユーザーが回答できるようにする明確に定義された一連の質問を設定します。
回答の品質を確認するには、Genieスペースをテストします。モデルが期待どおりの回答を提供するかどうかを確認するには、次のことを試してください。
提供した質問を言い換えてください。
データセットに関連するその他の質問をしてください。
質問に対して期待通りの回答が得られるまで、 Genieスペースの指示を追加および調整します。
ベスト プラクティスに関する詳細なガイダンスと問題のトラブルシューティングについては、「 効果的な Genieスペースのキュレーション」を参照してください。