Databricks アシスタントを使用する

プレビュー

この機能は現在、パブリックプレビュー段階です。プレビュー段階の機能は無料で使用できます。最終価格は、一般公開(GA)前に決定・通知されます。

Databricks Assistant は、Databricks ノートブック、SQL エディター、ファイル エディターで利用できるコンテキスト認識 AI アシスタントです。 Databricks Assistant を使用すると、会話型インターフェイスを使用してデータをクエリできるため、Databricks 内での生産性が向上します。 タスクを英語で説明し、アシスタントに Python コードまたは SQL クエリを生成させ、複雑なコードを説明させ、エラーを自動的に修正させることができます。 アシスタントはUnity Catalogメタデータを使用してテーブル、列、説明、社内全体で人気のあるデータ資産を理解し、パーソナライズされた応答を提供します。

Databricks アシスタントは次のタスクを実行できます。

  • コードを生成します。

  • エラーの特定と修正の提案を含む、コードをデバッグします。

  • コードを変換して最適化します。

  • コードを説明する。

  • Databricks ドキュメントで関連情報を見つけるのに役立ちます。

Databricks アシスタントはデフォルトで有効になっています。 管理者は、アカウント内のすべてのワークスペースに対して Databricks Assistant を無効または有効にすることができます。 管理者がワークスペース設定のオーバーライドを許可している場合、ワークスペース管理者は特定のワークスペースに対してDatabricks Assistant を有効または無効にすることができます。 詳細については、 「Databricks Assistant を有効または無効にする」を参照してください。

アカウントに対するDatabricks Assistant の有効化は、監査ログにアカウント イベントとして記録されます。 アカウント レベルのアカウント イベントを参照してください。

追加情報

次の記事には、Databricks Assistant の使用に関する追加情報が含まれています。

Databricks アシスタントの使用方法

Databricks Assistant は、ノートブック、SQL エディター、ファイル エディターで利用できます。 このドキュメントではノートブックに焦点を当てています。 他の製品での使用方法も同様です。

ノートブックでは、Databricks アシスタントはアシスタント ペインまたはコード セルのインラインで使用できます。

ノートブックのセルで Databricks アシスタントを使用する

コード セルで Databricks アシスタントを直接使用するには、MacOS の場合はCmd + i 、Windows の場合はCtrl + iを押します。 セル内にテキストボックスが表示されます。 英語で質問またはコメントを入力し、 Enter キー(セルを実行する場合のようにShift+Enter キーではありません) を押すと、アシスタントが応答を生成します。

使用中のインラインアシスタントのスクリーンショット

また、 /と入力して一般的なコマンドのリストを表示することもできます。たとえば、 /explainと入力するとセル内のコードを説明し、 /fixと入力するとコードにエラーがある場合に修正を提案し、 /docと入力するとドキュメントのコメントが提案されます。あなたのコードのために。

/fix または /docを使用すると、アシスタントは提案された変更を差分ウィンドウに表示します。[同意する] を選択して提案された変更を受け入れるか、[拒否] を選択して元のコードを保持します。提案されたコードを受け入れる場合、コードは自動的に実行されません。 コードを実行する前に、コードを確認できます。 生成されたコードが意図したものではない場合は、コメントに詳細や情報を追加して再試行してください。 「 Databricks Assistant の使用に関するヒント 」を参照してください。

コードのオートコンプリートの場合、ノートブックのセルよりもアシスタント ペインを使用した方がパフォーマンスが向上する可能性があります。

ノートブックのセルでアシスタントを終了するには、クローズアシスタントセルの右上隅にあります。 アシスタントは、生成されたコードを 承認 または 拒否 すると自動的に閉じます。

[アシスタント] ウィンドウを使用する

[アシスタント] ペインを開くには、左側のサイドバーの をクリックします Databricks アシスタントアイコン

使用中のアシスタントペインのスクリーンショット

[アシスタント] ウィンドウの下部にあるテキスト ボックスに質問を入力し、 Enter キーを押すか、テキスト ボックスの右側にある をクリックします アシスタントテキストの入力 。 アシスタントに回答が表示されます。 次のスクリーンショットは、アシスタントが [アシスタント] ウィンドウでコードを生成した後に実行できるアクションを示しています。

アイコンは、アシスタントペインのコードボックスの上部にあります

同じクエリを再度実行して、別の回答を生成できます。 これを行うには、回答の上にカーソルを置き、 をクリックします 再生するアイコン

ウィンドウを閉じるには、アイコンをもう一度クリックするか、セルの右上隅にある をクリックします クローズアシスタント 。 をクリックすると、ペインを全幅に拡大できます。全幅アイコンを開く ;クリック全幅アイコンを閉じるペインをデフォルトの幅に戻すには、

アシスタントペインの上部にあるアイコン

[アシスタント] ウィンドウでは、ウィンドウやノートブックを閉じた場合でも会話が追跡されます。 以前の会話を消去するには、[アシスタント] ペインの右上にある をクリックします クリアアシスタント

AIベースのオートコンプリート

プレビュー

この機能はパブリックプレビュー段階です。

AI ベースのオートコンプリートにより、Databricks ノートブック、SQL エディター、ファイル エディターに入力するときにインライン コードの候補が表示されます。 インライン コードの提案は、Python と SQL で利用できます。

インラインコードの提案を有効または無効にする

この機能は、次のようにユーザーごとに有効にする必要があります。

  1. ユーザー設定アイコン 設定 」をクリックします 。

  2. 実験的な機能の下で、 Databricks Assistant Autocompleteを切り替えます。

注:

ワークスペースでこの機能を無効にするには、Databricks にお問い合わせください。

インライン コードの提案を使用する

入力すると、候補が自動的に表示されます。 提案を受け入れるには、 Tabを押します。 手動で提案をトリガーするには、Option + Shift + Space (macOS の場合) または Control + Shift + Space (Windows の場合) を押します。

コード完全なSQL
コード完了Python

AI ベースのオートコンプリートでは、コメントからコードを生成することもできます。

コメントからコード補完

コードのデバッグ

Databricks Assistant を使用してコードを修正するには、アシスタント ウィンドウで質問するか、エラーが発生したときにセルの結果に表示される[エラーの診断]ボタンをクリックします。 下のタブには、Python および SQL コードの例が表示されます。

アシスタントのデバッグ例
アシスタントのデバッグ例

コードの説明

Databricks Assistant は、コード スニペットの詳細な説明を提供できます。 提供するプロンプトには、"簡潔にする" や "コードを 1 行ずつ説明する" などの用語を含めて、提供される説明の詳細レベルを要求できます。 Databricks Assistant にコードにコメントを追加するよう依頼することもできます。

Databricks ドキュメントで関連情報を見つける

Databricks アシスタントは、Databricks ドキュメントに基づく質問にノートブック エディターから直接回答するのに役立ちます。

Databricks ドキュメントに基づいて質問に回答します

Databricks アシスタントを使用するためのヒント

このセクションには、Databricks Assistant を使用する際の一般的なヒントとベスト プラクティスが含まれています。

Databricks Assistant はコンテキストを使用してより適切な回答を提供します

Databricks Assistant は、テーブルと列のスキーマとメタデータにアクセスできます。 これにより、自然言語を使用して、より正確なクエリを生成できます。 たとえば、テーブルに State 列がある場合、Databricks Assistant にミシガン州に住むユーザーのリストを生成するように依頼できます。

Databricks アシスタントは次のコンテキストを使用します。

  • 現在のノートブック セルまたは Databricks SQL エディター タブ内のコードまたはクエリ。

  • テーブルと列の名前と説明。

  • 以前のプロンプトの質問。

  • お気に入りのテーブルとアクティブなテーブル。

  • エラーの診断 機能の場合、エラー出力からのスタックトレース。

DataFrame から列を選択する場合、開始クエリを指定すると、より正確な結果を得ることができます。 たとえば、 SELECT * FROM <table_name>のようなステートメントを指定します。 これにより、Databricks Assistant は列名を取得できるようになり、推測する必要がなくなります。

Databricks Assistant は会話履歴を使用してより適切で正確な回答を提供するため、プロンプト全体を書き直さなくても、以前の応答の出力を変更するように Databricks Assistant に依頼できます。 アシスタントのチャット履歴を使用して、アシスタント ペインでDataFrames繰り返しクリーンアップ、探索、フィルタリング、スライスすることができます。

具体的な指示

Databricks Assistant が提供する構造と詳細は、同じプロンプトであっても時々変化します。 アシスタントが希望する形式、詳細レベルなどで必要な情報を返すことができるように、できる限り多くのガイダンスを提供するようにしてください。 例えば:

  • 「このコードを数文で説明してください」または「このコードを行ごとに説明してください」。

  • 「MatPlotLib を使用してビジュアライゼーションを作成」または「Seaborn を使用してビジュアライゼーションを作成」。

行レベルのデータ値の例を挙げる

Databricks Assistant は行レベルのデータを使用しないため、最も正確な回答を得るには、プロンプトにさらに詳細な情報を提供する必要がある場合があります。 カタログエクスプローラーでテーブルまたは列のコメントを使用して、サンプルデータの行を追加します。 たとえば、高さの列が feet-inchesという形式であるとします。 アシスタントがデータを解釈できるように、「高さの列は文字列形式であり、ハイフンで区切られています。」などのコメントを追加します。 例: '6-2'。 テーブルと列のコメントの詳細については、 「Markdown コメントを使用してカタログ エクスプローラーでデータをドキュメント化する」を参照してください。

また、操作を実行するために列のデータ型の変換が必要な場合は、詳細を指定する必要がある場合もあります。 たとえば、「このコードをPandasからPySparkに変換します。これには、 Pandas DataFrameをPySpark DataFrameに変換し、列 churn のデータ型をBooleanから整数に変更するために必要なコードが含まれます」。

Shift+Enter を使用して、チャット テキスト ボックスに新しい行を追加します

Shift+Enter キーを使用して、[アシスタント チャット] テキスト ボックスに新しい行を追加できます。これにより、Databricks Assistant へのメッセージの書式設定と整理が簡単になります。

Databricks アシスタントのチャット ウィンドウでコードを編集して実行する

アシスタント ペインでコードを実行して検証したり、スクラッチパッドとして使用したりできます。 コードを実行するには、コードを実行するアイコンアシスタント ペインのコード ボックスの左上隅にあります。 下のタブには、Python および SQL コードの例が表示されます。

アシスタントペインでコードを実行する
アシスタントペインでコードを実行する

[アシスタント] ペインでコードを実行すると、出力が表示され、変数がノートブックで使用できるようになります。

コードをノートブックに移動する前に、Databricks アシスタントが生成したコードをアシスタント チャット ボックスで直接編集することもできます。