Databricks Assistantとは

Databricks Assistant は、ノートブック、クエリ、ダッシュボード、ファイルの作成をより効率的にする AI ベースのペアプログラマーおよびサポートエージェントです。コードとクエリの生成、最適化、完了、説明、修正を行うことで、質問に迅速に回答するのに役立ちます。

このページでは、アシスタントに関する一般的な情報を提供します。プライバシーとセキュリティに関する質問については、「プライバシーとセキュリティ」を参照してください。

Databricks Assistant はどのように役立ちますか?

Databricks Assistant は次のタスクに役立ちます。

コードの生成、デバッグ、最適化、および説明。以下をご覧ください：
AI/BI ダッシュボードでデータの視覚化を作成します。「Databricks Assistant を使用して視覚化を作成する」を参照してください。
ジョブエラーの診断 (パブリックプレビュー機能)。デバッグジョブを参照してください。
自然言語を使用して、データの分析、視覚化の作成、データのフィルタリングを行います。「Databricks Genie とは何か?」および「自然言語プロンプトを使用してデータをフィルター処理する」を参照してください。
Databricksドキュメントで関連するヘルプを見つけてください。

アシスタントは Unity Catalog メタデータを使用して、社内のテーブル、列、説明、一般的なデータ資産を理解し、パーソナライズされた応答を提供します。

Databricks Assistantによって生成されたコードは、 Databricksコンピュート環境で実行することを目的としています。 Databricks でサポートされているプログラミング言語、フレームワーク、方言でコードを作成するように最適化されています。汎用プログラミング・アシスタントを意図したものではありません。アシスタントは、ユーザーのクエリによりよく答えるために、 Databricksドキュメント Web サイトやナレッジベースなどのDatabricksリソースの情報を使用することがよくあります。ユーザーの質問が、 Databricksドキュメント、 Unity Catalog 、およびワークスペースのユーザーコードからの知識で回答できる質問に関連している場合に、最も効果を発揮します。

Databricks Assistantからコーディングのサポートを受ける

Databricks Assistantにアクセスするには、ノートブック、ファイルエディター、または SQL エディターの左側のサイドバーにあるアシスタントアイコンをクリックします。

[アシスタント] ウィンドウは、画面の左側または右側に開くことができます。

アシスタントによって生成されたコードは間違いを犯す可能性があるため、ユーザーは実行する前に必ず確認する必要があります。

Databricks Assistantを使用してデータのビジュアライゼーションを作成する

ダッシュボードを作成するときに、Databricks Assistantを使用できます。既存のダッシュボードデータセットで視覚化を作成するときに、アシスタントに質問して、生成されたグラフの形式で応答を受け取ります。ダッシュボードでアシスタントを使用するには、まず 1 つ以上のデータセットを作成し、次に視覚化ウィジェットをキャンバスに追加します。視覚化ウィジェットには、新しいグラフを説明するプロンプトが含まれています。表示するグラフの説明を入力すると、アシスタントがそれを生成します。グラフを承認または却下したり、説明を変更して新しいものを生成したりできます。

ダッシュボードでのアシスタントの使用の詳細と例については、「Databricks Assistant を使用してビジュアライゼーションを作成する」を参照してください。

Databricks Assistant によって使用されるサービス

Databricks Assistant は、Microsoft が運営するAzure OpenAIなどのサードパーティのサービスを使用して応答を提供する場合があります。

これらのサービスには、それぞれのデータ管理ポリシーが適用されます。これらのサービスに送信されたデータは、モデルのトレーニングには使用されません。詳細については、「Azureデータ管理ポリシー」を参照してください。

Azure OpenAI の場合、 Databricksは不正行為モニタリングをオプトアウトしているため、プロンプトや応答はAzure OpenAIに保存されません。

結果の精度を向上させるためのヒント

プロンプト「テーブルの検索」を使用すると、より適切な応答が得られます。 テーブル内のデータについて質問する前に、アシスタントに、主題やその他の特性別に関連テーブルを検索するように依頼してください。例: Find tables related to NFL games.
必要な応答の構造を指定します。 Databricks Assistant が提供する構造と詳細は、同じプロンプトであっても異なります。 Databricks Assistant はテーブルと列のスキーマおよびメタデータを認識しているため、自然言語を使用して質問することができます。例: List active and retired NFL quarterbacks' passing completion rate, for those who had over 500 attempts in a season. アシスタントは、 s.player_id や s.attemptsなどの列のデータを使用して回答します。
行レベルのデータ値の例を挙げます。 Databricks Assistant は行レベルのデータにアクセスできないため、より正確な回答を得るにはデータの例を提供してください。例: List the average height for each position in inches. これは、データセットが 6-2のように高さをフィートとインチで表示するため、エラーを返します。
コードスニペットを [アシスタント] ウィンドウで実行してテストします。 [アシスタント] ペインをスクラッチパッドとして使用して、クエリとアシスタントの回答の反復を保存します。コードをノートブックに追加する準備ができるまで、ペインでコードを実行して編集することができます。
ノートブックでセルアクションを使用します。 セルアクションには、コードのドキュメント化 (コメント)、修正、説明などの一般的なタスクへのショートカットが含まれます。

詳細な例については、「Databricks Assistant の 5 つのヒント」を参照してください。

Databricks Assistantは会話の履歴を考慮するため、会話を進めながら質問を改善していくことができます。

Databricks Assistant の価格はいくらですか?

現在のDatabricks Assistant機能はすべて、すべての顧客が追加料金なしで利用できます。

ユーザーは、コンピューター、クエリ、ジョブなどを実行するために使用するコンピュートに対してのみ料金を支払います。不正使用を防ぐために、公正な使用制限が設けられています。ほとんどのユーザーは、これらの制限の影響を受けません。

フィードバックを送る

フィードバックを送信する最適な方法は、ノートブックと SQL エディターの[フィードバックの提供]リンクを使用することです。 assistant-feedback@ databricks.com に電子メールを送信することもできます。またはアカウントチームにお問い合わせください。

プロンプトの正確さに関するフィードバックではなく、製品の改善提案やユーザーエクスペリエンスの問題を共有します。アシスタントから役に立たない提案を受け取った場合は、[役に立たない] ボタンをクリックします。

アシスタント機能の地理的な可用性

Databricks Assistant は、顧客コンテンツを処理する際に Geos を使用してデータの保存場所を管理する指定サービスです。さまざまな地域でのアシスタント機能の可用性の詳細については、「Databricks 指定サービス」を参照してください。

ヒント

Databricks Assistant を有効にできない場合は、 AI 機能のワークスペース Geography 内でデータ処理を強制するを無効にする必要がある場合があります。「クロスジオ処理を有効にする」を参照してください。

プライバシーとセキュリティ

Q：モデルにはどのようなデータが送信されますか？

Databricks Assistantは、API リクエストのたびにコードとメタデータをモデルに送信します。これは、データに対してより関連性の高い結果を返すのに役立ちます。例えば、以下のようなものが送信されます。

現在のノートブックセルまたは [SQL エディタ] タブ内のコード/クエリー
テーブルと列の名前と説明
以前の質問
お気に入りのテーブル

Q: モデルに送信されるメタデータは、ユーザーのUnity Catalog権限を遵守しますか?

はい、モデルに送信されるすべてのデータはユーザーのUnity Catalog権限を尊重するため、ユーザーが表示する権限を持たないテーブルに関連するメタデータは送信されません。

Q：結果が得られるクエリーを実行してから質問した場合、クエリーの結果はモデルに送信されますか？

いいえ。セル内のコードの内容、テーブルに関するメタデータ、およびユーザーが入力したテキストのみがモデルと共有されます。「エラー修正」機能の場合、Databricks はエラー出力のスタックトレースも共有します。

Q：Databricks Assistantは危険なコードを実行しますか？

いいえ。Databricks Assistant はユーザーに代わってコードを自動的に実行しません。 AI モデルは間違いを犯したり、意図を誤解したり、幻覚を起こしたり、間違った答えを出したりしてしまう可能性があります。 AI によって生成されたコードを実行する前に確認してテストします。

Q: Databricks は、アシスタントの応答の正確性と適切性を評価するための評価を行いましたか?

はい。Databricks には、ヘイトスピーチ、安全でないコード、迅速な脱獄、サードパーティの著作権コンテンツなどの有害な応答がアシスタントによって生成されるのを防ぐための軽減策があります。 Databricks は、軽減策の堅牢性を評価するために、何千ものシミュレートされたユーザー入力を使用して、すべての AI 支援機能の広範なテストを実施しました。これらの評価では、Python、Databricks SQL、R、Scala 言語でのコード生成など、アシスタントの想定されるユースケースに焦点を当てました。