Databricks アシスタントとは
プレビュー
この機能は現在、パブリックプレビュー段階です。プレビュー段階の機能は無料で使用できます。最終価格は、一般公開(GA)前に決定・通知されます。
Databricks アシスタントは、AI ベースのコンパニオンペアプログラマとして機能し、ノートブック、クエリー、ファイルの作成効率を高めることができます。コードとクエリーを生成、最適化、完成、説明、修正することで、質問に迅速に答えることができます。
このページでは、アシスタントに関する一般的な情報をよくある質問の形式で提供します。 プライバシーとセキュリティに関する質問については、「 プライバシーとセキュリティ」を参照してください。
Databricks アシスタントを有効または無効にする
Databricks Assistant は [デフォルト] で有効になっています。
Databricks Assistant のアカウント内のすべてのワークスペースを有効または無効にするには、次の手順に従います。
アカウント管理者として、アカウントコンソールにログインします。
「 設定 」をクリックします。
[機能の有効化] タブをクリックします。
[ パートナーを利用した AI 支援機能 ] セクションで、[ 有効 ] または [無効 ] を選択し、[ 保存] をクリックします。 この機能のワークスペース設定の上書きを防ぐには、 [ 強制 ] トグルを [オン] に設定します。
アカウント設定でワークスペース設定の上書きが許可されている場合、ワークスペース管理者は特定のワークスペースを有効または無効にできます。 これを行うには、ワークスペース設定を使用して、次のようにアカウントコンソールのデフォルト設定を上書きします。
ワークスペースの 管理者設定ページに移動します。
「 詳細設定 」タブをクリックします。
[ パートナーを利用した AI 支援機能 ] ドロップダウン メニューを使用して選択します。
「保存」をクリックします。
Databricks Assistant を使用してコーディングの提案やヘルプを得る
Databricks アシスタントにアクセスするには、ノートブック、ファイル エディター、または SQL エディターの左側のサイドバーにあるアシスタント アイコン をクリックします。
画面の左側に [アシスタント] パネルが表示されます。
Databricks アシスタントの機能の一部を以下に示します。
生成:自然言語を使用して SQL クエリーを生成できます。
説明:クエリーまたはコードブロックをハイライトすると、Databricks アシスタントが明確かつ簡潔な英語でロジックを説明します。
修正:構文エラーとランタイムエラーが説明され、ワンクリックで修正できます。
変換と最適化:Pandas コードを PySpark に変換して、実行を高速化できます。
Databricks Assistant によって生成されたコードは、Databricks コンピュート環境内での実行を目的としています。 Databricks でサポートされているプログラミング言語、フレームワーク、およびダイアレクトでコードを作成するように最適化されています。 これは、汎用のプログラミング・アシスタントとして意図されたものではありません。 アシスタントは、ユーザーのクエリーに適切に答えるために、ドキュメントなどの Databricks ナレッジ ベースからの情報を使用することがよくあります。 ユーザーの質問が、Databricksドキュメント、Unity Catalog、ワークスペース内のユーザー コードからの知識で回答できる質問に関連している場合に、最適なパフォーマンスを発揮します。
ユーザーは、アシスタントによって生成されたコードは間違いを犯す可能性があるため、実行前に必ず確認する必要があります。
Databricks Assistant によって使用されるサービス
Databricks Assistant は、Microsoft が運営するAzure OpenAIなどのサードパーティ サービスを使用して応答を提供する場合があります。 これらのサービスには、それぞれのデータ管理ポリシーが適用されます。 これらのサービスに送信されたデータは、モデルのトレーニングには使用されません。 Azure OpenAI の場合、 Databricks 不正行為モニタリングをオプトアウトしているため、プロンプトや応答はAzure OpenAI に保存されません。 詳細については、 Azureデータ管理ポリシー」を参照してください。
返される結果の精度を向上させるためのヒント
できるだけ具体的に指示してください。テーブルを指定し、データがどのようなものであるかを示す例を提供してください。
Databricks アシスタントは、テーブルと列のスキーマとメタデータを認識します。これにより、自然言語を使用して非常に正確なクエリーを生成することができます。たとえば、テーブルに列
userID
とState
がある場合、Databricks アシスタントにワシントンに住むユーザーのリストを生成するよう依頼できます。Databricks アシスタントはテーブルと列のメタデータにのみアクセスでき、行レベルのデータにはアクセスできません。そのため、実際のデータがユニークな形式をしている場合、クエリーを正しく記述できない場合があります。たとえば、列
Price
があり、各値に通貨単位(例えば、$10.99 USD、$5.99 CAD)が付加されている場合、列が DECIMAL ではないため、クエリーが返す値の合計で問題が発生する可能性があります。この場合は、列をパースするための具体的な指示を Databricks アシスタントに与えてみてください。例:「クラッカーからの総収入を合計してください。価格は文字列値であり、「$10.99 USD」のように各通貨の値に通貨単位が付加されています」
Databricks アシスタントは会話の履歴を考慮するため、会話を進めながら質問を改善していくことができます。
フィードバックを送る
フィードバックを送信する最善の方法は、ノートブックと SQL エディタの「フィードバックの提供」リンクを使用することです。assistant-feedback@databricks.com
またはアカウントチームにメールを送信することもできます。
当社は主に、プロンプトの正確性ではなく、製品の改善に関する提案やユーザーエクスペリエンスの問題についてお聞きしたいと考えています。アシスタントから役に立たない提案を受け取った場合は、「役に立たない」の親指ボタンをクリックしてフィードバックをご提供ください。
プライバシーとセキュリティ
Q:モデルにはどのようなデータが送信されますか?
Databricks アシスタントは、API リクエストのたびにコードとメタデータをモデルに送信します。これは、データに対してより関連性の高い結果を返すのに役立ちます。例えば、以下のようなものが送信されます。
現在のノートブックセルまたは [SQL エディタ] タブ内のコード/クエリー
テーブルと列の名前と説明
以前の質問
お気に入りのテーブル
Q: モデルに送信されるメタデータは、ユーザーのUnity Catalog権限を尊重しますか?
はい、モデルに送信されるすべてのデータはユーザーのUnity Catalog権限を尊重するため、ユーザーが表示する権限を持たないテーブルに関連するメタデータは送信されません。
Q:結果が得られるクエリーを実行してから質問した場合、クエリーの結果はモデルに送信されますか?
いいえ。セル内のコードの内容、テーブルに関するメタデータ、およびユーザーが入力したテキストのみがモデルと共有されます。「エラー修正」機能の場合、Databricks はエラー出力のスタックトレースも共有します。
Q:Databricks アシスタントは危険なコードを実行しますか?
いいえ。Databricks アシスタントがユーザーに代わってコードを自動的に実行することはありません。AI モデルは間違いを犯したり、意図を誤解したり、幻覚を見せたり、間違った答えを出したりする可能性があります。AI が生成したコードは、実行する前に必ず確認してください。
Q: Databricks は、アシスタントの応答の正確性と適切性を評価するための評価を行いましたか?
はい。Databricks には、ヘイトスピーチ、安全でないコード、迅速な脱獄、サードパーティの著作権コンテンツなどの有害な応答がアシスタントによって生成されるのを防ぐための軽減策があります。 Databricks は、軽減策の堅牢性を評価するために、何千ものシミュレートされたユーザー入力を使用して、すべての AI 支援機能の広範なテストを実施しました。 これらの評価では、Python、Databricks SQL、R、Scala 言語でのコード生成など、アシスタントの想定されるユース ケースに焦点を当てました。