Databricks Assistantとは

Databricks Assistant は、ノートブック、クエリ、ダッシュボード、ファイルの作成をより効率的にする AI ベースのペア プログラマーおよびサポート エージェントです。 コードとクエリを生成、最適化、完了、説明、修正することで、質問に迅速に回答するのに役立ちます。

このページでは、アシスタントに関する一般的な情報を提供します。 プライバシーとセキュリティに関する質問については、「 プライバシーとセキュリティ」を参照してください。

パートナー提供機能と Databricks 提供機能

Databricks Assistant は、さまざまなタスクの生産性を向上させる AI 駆動型機能のコレクションです。

一部のアシスタント機能はパートナーによって提供されており、Databricks によって提供されていないモデルに依存しています。 次の表では、アシスタントの機能と各機能のモデル プロバイダーについて説明します。

アシスタント機能

機能の説明

モデル プロバイダー

アシスタントチャット

さまざまなタスクを支援するために製品全体で利用できる AI チャット パネル。

パートナー主導

アシスタントセルアクションのプロンプト

1 つのセル内のコードの自然言語変換。

パートナー主導

アシスタント AI ベースのオートコンプリート(パブリック プレビュー)

入力時のインライン コード候補。

Databricks

アカウントの場合: Databricks Assistant 機能を有効または無効にする

パートナーが提供する Databricks Assistant 機能はデフォルトで有効になっています。 ただし、管理者はアカウント内のすべてのワークスペースに対してパートナー駆動アシスタント機能を無効にすることができます。

ヒント

アカウントに対してパートナーが提供するDatabricks Assistant機能を有効または無効にする操作は、監査ログにアカウント イベントとして記録されます。 アカウント イベントを参照してください。

  1. アカウント管理者として、アカウントコンソールにログインします。

  2. 設定」をクリックします。

  3. [詳細設定]タブをクリックします。

  4. [その他] > [パートナーによる AI 支援機能]セクションで、 [オン]または[オフ] を選択します。

ユーザーの場合: アシスタント機能を有効または無効にする

管理者以外のユーザーを含むすべてのユーザーは、 デベロッパー 設定でユーザー プロフィールのアシスタント機能を有効または無効にできます。

  1. Databricks ワークスペースの上部バーにあるユーザー名をクリックし、 [設定] をクリックします。

  2. [ユーザー]の下で、 [開発者]タブをクリックします。

  3. 実験的な機能の下で、 Databricks Assistant のオートコンプリート新しいアシスタントの切り替えを使用します。

Databricks Assistantからコーディングのサポートを受ける

Databricks Assistantにアクセスするには、ノートブック、ファイル エディター、または SQL エディターの左側のサイドバーにあるアシスタント アイコン 製品内ヘルプアシスタントアイコン - 色 をクリックします。

Databricks Assistantアイコンとパネルの場所

[アシスタント] ウィンドウは、画面の左側または右側に開くことができます。

Databricks Assistantの機能の一部を以下に示します。

  • 生成:自然言語を使用して SQL クエリーを生成できます。

  • 説明:クエリーまたはコードブロックをハイライトすると、Databricks Assistantが明確かつ簡潔な英語でロジックを説明します。

  • 修正:構文エラーとランタイムエラーが説明され、ワンクリックで修正できます。

  • 変換と最適化:Pandas コードを PySpark に変換して、実行を高速化できます。

Databricks Assistantによって生成されたコードはすべて、 Databricksコンピュート環境で実行することを目的としています。 Databricks でサポートされているプログラミング言語、フレームワーク、方言でコードを作成するように最適化されています。 これは、汎用のプログラミング・アシスタントとして意図されたものではありません。 アシスタントは、ユーザーのクエリに適切に回答するために、Databricks ドキュメント Web サイトやナレッジ ベースなどのDatabricksリソースからの情報を頻繁に使用します。 ユーザーの質問が、Databricks ドキュメント、 Unity Catalog 、ワークスペース内のユーザー コードからの知識で回答できる質問に関連している場合に、最も効果的に機能します。

アシスタントによって生成されたコードは間違いを犯す可能性があるため、ユーザーは実行する前に必ず確認する必要があります。

Databricks Assistantを使用してデータのビジュアライゼーションを作成する

ダッシュボードを作成するときに、Databricks Assistantを使用できます。 既存のダッシュボード データセットで視覚化を作成するときに、アシスタントに質問して、生成されたグラフの形式で応答を受け取ります。 ダッシュボードでアシスタントを使用するには、まず 1 つ以上のデータセットを作成し、次に視覚化ウィジェットをキャンバスに追加します。 視覚化ウィジェットには、新しいグラフを説明するプロンプトが含まれています。 表示するグラフの説明を入力すると、アシスタントがそれを生成します。 グラフを承認または却下したり、説明を変更して新しいものを生成したりできます。

ダッシュボードでのアシスタントの使用の詳細と例については、「Databricks Assistant を使用してビジュアライゼーションを作成する」を参照してください。

Databricks Assistant によって使用されるサービス

Databricks Assistant は、Microsoft が運営するAzure OpenAIなどのサードパーティのサービスを使用して応答を提供する場合があります。

これらのサービスには、それぞれのデータ管理ポリシーが適用されます。 これらのサービスに送信されたデータは、モデルのトレーニングには使用されません。 詳細については、「Azureデータ管理ポリシー」を参照してください。

Azure OpenAI の場合、 Databricksは 不正行為モニタリングをオプトアウトしているため、プロンプトや応答はAzure OpenAIに保存されません。

結果の精度を向上させるためのヒント

  • プロンプト「テーブルの検索」を使用すると、より適切な応答が得られます。 テーブル内のデータについて質問する前に、アシスタントに、主題やその他の特性別に関連テーブルを検索するように依頼してください。 例: Find tables related to NFL games.

  • 必要な応答の構造を指定します。 Databricks Assistant が提供する構造と詳細は、同じプロンプトであっても異なります。 Databricks Assistant はテーブルと列のスキーマおよびメタデータを認識しているため、自然言語を使用して質問することができます。 例: List active and retired NFL quarterbacks' passing completion rate, for those who had over 500 attempts in a season. アシスタントは、 s.player_ids.attemptsなどの列のデータを使用して回答します。

  • 行レベルのデータ値の例を挙げます。 Databricks Assistant は行レベルのデータにアクセスできないため、より正確な回答を得るにはデータの例を提供してください。 例: List the average height for each position in inches. これは、データセットが 6-2のように高さをフィートとインチで表示するため、エラーを返します。

  • コード スニペットを [アシスタント] ウィンドウで実行してテストします。 [アシスタント] ペインをスクラッチパッドとして使用して、クエリとアシスタントの回答の反復を保存します。 コードをノートブックに追加する準備ができるまで、ペインでコードを実行して編集することができます。

    コード スニペットを [アシスタント] ウィンドウで実行してテストする。
  • ノートブックでセルアクションを使用します。 セル アクションには、コードのドキュメント化 (コメント)、修正、説明などの一般的なタスクへのショートカットが含まれます。

    「/doc」セル アクションを指定すると、アシスタントにコードにコメントを付けるよう促します。

詳細な例については、 「Databricks Assistant の 5 つのヒント」を参照してください。

Databricks Assistantは会話の履歴を考慮するため、会話を進めながら質問を改善していくことができます。

Databricks Assistant の価格はいくらですか?

現在のDatabricks Assistant機能はすべて、すべての顧客が追加料金なしで利用できます。

ユーザーは、コンピューター、クエリ、ジョブなどを実行するために使用するコンピュートに対してのみ料金を支払います。 不正使用を防ぐために、公正な使用制限が設けられています。 ほとんどのユーザーは、これらの制限の影響を受けません。

フィードバックを送る

フィードバックを送信する最適な方法は、ノートブックと SQL エディターの[フィードバックの提供]リンクを使用することです。 assistant-feedback @ databricks に電子メールを送信することもできます comまたはアカウント チームにお問い合わせください。

プロンプトの正確さに関するフィードバックではなく、製品の改善提案やユーザー エクスペリエンスの問題を共有します。 アシスタントから役に立たない提案を受け取った場合は、[役に立たない] サムダウン アイコン ボタンをクリックします。

アシスタント機能の地理的な可用性

Databricks Assistant は、顧客コンテンツを処理する際に Geos を使用してデータの保存場所を管理する指定サービスです。 さまざまな地域でのアシスタント機能の可用性の詳細については、 「Databricks 指定サービス」を参照してください。

プライバシーとセキュリティ

Q:モデルにはどのようなデータが送信されますか?

Databricks Assistantは、API リクエストのたびにコードとメタデータをモデルに送信します。これは、データに対してより関連性の高い結果を返すのに役立ちます。例えば、以下のようなものが送信されます。

  • 現在のノートブックセルまたは [SQL エディタ] タブ内のコード/クエリー

  • テーブルと列の名前と説明

  • 以前の質問

  • お気に入りのテーブル

Q: モデルに送信されるメタデータは、ユーザーのUnity Catalog権限を遵守しますか?

はい、モデルに送信されるすべてのデータはユーザーのUnity Catalog権限を尊重するため、ユーザーが表示する権限を持たないテーブルに関連するメタデータは送信されません。

Q:結果が得られるクエリーを実行してから質問した場合、クエリーの結果はモデルに送信されますか?

いいえ。セル内のコードの内容、テーブルに関するメタデータ、およびユーザーが入力したテキストのみがモデルと共有されます。「エラー修正」機能の場合、Databricks はエラー出力のスタックトレースも共有します。

Q:Databricks Assistantは危険なコードを実行しますか?

いいえ。Databricks Assistant はユーザーに代わってコードを自動的に実行しません。 AI モデルは間違いを犯したり、意図を誤解したり、幻覚を起こしたり、間違った答えを出したりしてしまう可能性があります。 AI によって生成されたコードを実行する前に確認してテストします。

Q: Databricks は、アシスタントの応答の正確性と適切性を評価するための評価を行いましたか?

はい。Databricks には、ヘイトスピーチ、安全でないコード、迅速な脱獄、サードパーティの著作権コンテンツなどの有害な応答がアシスタントによって生成されるのを防ぐための軽減策があります。 Databricks は、軽減策の堅牢性を評価するために、何千ものシミュレートされたユーザー入力を使用して、すべての AI 支援機能の広範なテストを実施しました。 これらの評価では、Python、Databricks SQL、R、Scala 言語でのコード生成など、アシスタントの想定されるユース ケースに焦点を当てました。