Databricks アシスタントを使用する
プレビュー
この機能は現在、パブリックプレビュー段階です。プレビュー段階の機能は無料で使用できます。最終価格は、一般公開(GA)前に決定・通知されます。
Databricks Assistant は、Databricks ノートブック、SQL エディター、ファイル エディターで利用できるコンテキスト認識 AI アシスタントです。 Databricks Assistant を使用すると、会話型インターフェイスを使用してデータをクエリできるため、Databricks 内での生産性が向上します。 タスクを英語で説明し、アシスタントに Python コードまたは SQL クエリを生成させ、複雑なコードを説明させ、エラーを自動的に修正させることができます。 アシスタントはUnity Catalogメタデータを使用してテーブル、列、説明、社内全体で人気のあるデータ資産を理解し、パーソナライズされた応答を提供します。
Databricks アシスタントは次のタスクを実行できます。
コードを生成します。
エラーの特定と修正の提案を含む、コードをデバッグします。
コードを変換して最適化します。
コードを説明する。
Databricks ドキュメントで関連情報を見つけるのに役立ちます。
Databricks アシスタントはデフォルトで有効になっています。 管理者は、アカウント内のすべてのワークスペースに対して Databricks Assistant を無効または有効にすることができます。 管理者がワークスペース設定のオーバーライドを許可している場合、ワークスペース管理者は特定のワークスペースに対してDatabricks Assistant を有効または無効にすることができます。 詳細については、 「Databricks Assistant を有効または無効にする」を参照してください。
アカウントに対するDatabricks Assistant の有効化は、監査ログにアカウント イベントとして記録されます。 アカウント レベルのアカウント イベントを参照してください。
Databricks アシスタントの使用方法
Databricks Assistant は、ノートブック、SQL エディター、ファイル エディターで利用できます。 このドキュメントではノートブックに焦点を当てています。 他の製品での使用方法も同様です。
ノートブックでは、Databricks アシスタントはアシスタント ペインまたはコード セルのインラインで使用できます。
ノートブックのセルで Databricks アシスタントを使用する
コード セルで Databricks アシスタントを直接使用するには、MacOS の場合はCmd + i
、Windows の場合はCtrl + i
を押します。 セル内にテキストボックスが表示されます。 英語で質問またはコメントを入力し、 Enter キー(セルを実行する場合のようにShift+Enter キーではありません) を押すと、アシスタントが応答を生成します。
また、 /
と入力して一般的なコマンドのリストを表示することもできます。たとえば、 /explain
と入力するとセル内のコードを説明し、 /fix
と入力するとコードにエラーがある場合に修正を提案し、 /doc
と入力するとドキュメントのコメントが提案されます。あなたのコードのために。
/fix
または /doc
を使用すると、アシスタントは提案された変更を差分ウィンドウに表示します。[同意する] を選択して提案された変更を受け入れるか、[拒否] を選択して元のコードを保持します。提案されたコードを受け入れる場合、コードは自動的に実行されません。 コードを実行する前に、コードを確認できます。 生成されたコードが意図したものではない場合は、コメントに詳細や情報を追加して再試行してください。 「 Databricks Assistant の使用に関するヒント 」を参照してください。
コードのオートコンプリートの場合、ノートブックのセルよりもアシスタント ペインを使用した方がパフォーマンスが向上する可能性があります。
ノートブックのセルでアシスタントを終了するには、セルの右上隅にあります。 アシスタントは、生成されたコードを 承認 または 拒否 すると自動的に閉じます。
[アシスタント] ウィンドウを使用する
[アシスタント] ペインを開くには、左側のサイドバーの をクリックします 。
[アシスタント] ウィンドウの下部にあるテキスト ボックスに質問を入力し、 Enter キーを押すか、テキスト ボックスの右側にある をクリックします 。 アシスタントに回答が表示されます。 次のスクリーンショットは、アシスタントが [アシスタント] ウィンドウでコードを生成した後に実行できるアクションを示しています。
同じクエリを再度実行して、別の回答を生成できます。 これを行うには、回答の上にカーソルを置き、 をクリックします 。
ウィンドウを閉じるには、アイコンをもう一度クリックするか、セルの右上隅にある をクリックします 。 をクリックすると、ペインを全幅に拡大できます。 ;クリックペインをデフォルトの幅に戻すには、
[アシスタント] ウィンドウでは、ウィンドウやノートブックを閉じた場合でも会話が追跡されます。 以前の会話を消去するには、[アシスタント] ペインの右上にある をクリックします 。
AIベースのオートコンプリート
プレビュー
この機能はパブリックプレビュー段階です。
AI ベースのオートコンプリートにより、Databricks ノートブック、SQL エディター、ファイル エディターに入力するときにインライン コードの候補が表示されます。 インライン コードの提案は、Python と SQL で利用できます。
コードのデバッグ
Databricks Assistant を使用してコードを修正するには、アシスタント ウィンドウで質問するか、エラーが発生したときにセルの結果に表示される[エラーの診断]ボタンをクリックします。 下のタブには、Python および SQL コードの例が表示されます。
コードの説明
Databricks Assistant は、コード スニペットの詳細な説明を提供できます。 提供するプロンプトには、"簡潔にする" や "コードを 1 行ずつ説明する" などの用語を含めて、提供される説明の詳細レベルを要求できます。 Databricks Assistant にコードにコメントを追加するよう依頼することもできます。
Databricks アシスタントを使用するためのヒント
このセクションには、Databricks Assistant を使用する際の一般的なヒントとベスト プラクティスが含まれています。
Databricks Assistant はコンテキストを使用してより適切な回答を提供します
Databricks Assistant は、テーブルと列のスキーマとメタデータにアクセスできます。 これにより、自然言語を使用して、より正確なクエリを生成できます。 たとえば、テーブルに State 列がある場合、Databricks Assistant にミシガン州に住むユーザーのリストを生成するように依頼できます。
Databricks アシスタントは次のコンテキストを使用します。
現在のノートブック セルまたは Databricks SQL エディター タブ内のコードまたはクエリ。
テーブルと列の名前と説明。
以前のプロンプトの質問。
お気に入りのテーブルとアクティブなテーブル。
エラーの診断 機能の場合、エラー出力からのスタックトレース。
DataFrame から列を選択する場合、開始クエリを指定すると、より正確な結果を得ることができます。 たとえば、 SELECT * FROM <table_name>
のようなステートメントを指定します。 これにより、Databricks Assistant は列名を取得できるようになり、推測する必要がなくなります。
Databricks Assistant は会話履歴を使用してより適切で正確な回答を提供するため、プロンプト全体を書き直さなくても、以前の応答の出力を変更するように Databricks Assistant に依頼できます。 アシスタントのチャット履歴を使用して、アシスタント ペインでDataFrames繰り返しクリーンアップ、探索、フィルタリング、スライスすることができます。
具体的な指示
Databricks Assistant が提供する構造と詳細は、同じプロンプトであっても時々変化します。 アシスタントが希望する形式、詳細レベルなどで必要な情報を返すことができるように、できる限り多くのガイダンスを提供するようにしてください。 例えば:
「このコードを数文で説明してください」または「このコードを行ごとに説明してください」。
「MatPlotLib を使用してビジュアライゼーションを作成」または「Seaborn を使用してビジュアライゼーションを作成」。
行レベルのデータ値の例を挙げる
Databricks Assistant は行レベルのデータを使用しないため、最も正確な回答を得るには、プロンプトにさらに詳細な情報を提供する必要がある場合があります。 カタログエクスプローラーでテーブルまたは列のコメントを使用して、サンプルデータの行を追加します。 たとえば、高さの列が feet
-inches
という形式であるとします。 アシスタントがデータを解釈できるように、「高さの列は文字列形式であり、ハイフンで区切られています。」などのコメントを追加します。 例: '6-2'。 テーブルと列のコメントの詳細については、 「Markdown コメントを使用してカタログ エクスプローラーでデータをドキュメント化する」を参照してください。
また、操作を実行するために列のデータ型の変換が必要な場合は、詳細を指定する必要がある場合もあります。 たとえば、「このコードをPandasからPySparkに変換します。これには、 Pandas DataFrameをPySpark DataFrameに変換し、列 churn のデータ型をBooleanから整数に変更するために必要なコードが含まれます」。