Visual Studio Code の Databricks 拡張機能を使用して、Python ノートブックをジョブとして実行します

この記事では、Visual Studio Code 用の Databricks 拡張機能を使用して、Python ノートブックを Databricks ジョブとして実行する方法について説明します。 「Visual Studio Code の Databricks 拡張機能とは」を参照してください。

代わりに Python ファイルを Databricks ジョブとして実行するには、「 Visual Studio Code の Databricks 拡張機能を使用して Python ファイルをジョブとして実行する」を参照してください。 代わりに、R、Scala、または SQL ノートブックを Databricks ジョブとして実行するには、「 Visual Studio Code の Databricks 拡張機能を使用して R、Scala、または SQL ノートブックをジョブとして実行する」を参照してください。

この情報では、Visual Studio Code 用の Databricks 拡張機能が既にインストールおよび設定されていることを前提としています。 「Visual Studio Code 用の Databricks 拡張機能のインストール」を参照してください。

拡張機能とコード プロジェクトを開いた状態で、次の操作を行います。

注:

次の手順では、一般公開されている Visual Studio Code の Databricks 拡張機能バージョン 1 を使用します。 現在プライベート プレビュー段階にある Visual Studio Code バージョン 2 の Databricks 拡張機能に関するこの手順を完了するには、「Visual Studio Code バージョン 2 の Databricks 拡張機能を使用して Python ファイルをジョブとして実行する」に進んでください。

  1. コード プロジェクトで、ジョブとして実行する Python ノートブックを開きます。

    ヒント

    Visual Studio Code で Python ノートブック ファイルを作成するには、まず [ファイル] > [ 新しいファイル] をクリックし、[ Python ファイル] を選択して、新しいファイルを .py ファイル拡張子で保存します。

    .py ファイルを Databricks ノートブックに変換するには、ファイルの先頭に特別なコメント # Databricks notebook sourceを追加し、各セルの前に特別なコメント # COMMAND ----------を追加します。詳しくは、「 ファイルをインポートしてノートブックに変換する」をご覧ください。

    Databricks ノートブックとして書式設定された Python コード ファイル1
  2. 次のいずれかを実行します。

    • エクスプローラー ビュー (エクスプローラー>表示) で、ノートブック ファイルを右クリックし、コンテキスト メニューから [Databricks でワークフローとしてファイルを実行] を選択します。

      実行 Databricks コンテキスト メニュー コマンドのワークフローとしてファイル 1
    • ノートブック ファイル エディターのタイトル バーで、再生 ([実行] または [デバッグ]) アイコンの横にあるドロップダウン矢印をクリックします。 次に、ドロップダウン リストで [ Databricks のワークフローとしてファイルを実行] をクリックします。

      実行 Databricks エディター コマンドのワークフローとしてファイル 2

[ Databricks ジョブの実行] というタイトルの新しいエディター タブが表示されます。 ノートブックはワークスペース内のジョブとして実行され、ノートブックとその出力は新しいエディタータブの [ 出力 ] 領域に表示されます。

ジョブの実行に関する情報を表示するには、 Databricks ジョブ 実行エディター タブの [タスク実行 ID] リンクをクリックします。ワークスペースが開き、ジョブ実行の詳細がワークスペースに表示されます。

Visual Studio Code バージョン 2 の Databricks 拡張機能を使用して、Python ファイルをジョブとして実行します

注:

Visual Studio Code の Databricks 拡張機能バージョン 2 は、プライベート プレビュー段階にあります。

この手順は、Visual Studio Code バージョン 2 の Databricks 拡張機能がすでにインストールされ、設定されていることを前提としています 。「 Visual Studio Code バージョン 2 の Databricks 拡張機能をインストールして開く」を参照してください。

  1. コード プロジェクトで、ジョブとして実行する Python ノートブックを開きます。

    ヒント

    Visual Studio Code で Python ノートブック ファイルを作成するには、まず [ファイル] > [ 新しいファイル] をクリックし、[ Python ファイル] を選択して、新しいファイルを .py ファイル拡張子で保存します。

    .py ファイルを Databricks ノートブックに変換するには、ファイルの先頭に特別なコメント # Databricks notebook sourceを追加し、各セルの前に特別なコメント # COMMAND ----------を追加します。詳しくは、「 ファイルをインポートしてノートブックに変換する」をご覧ください。

    Databricks ノートブックとして書式設定された Python コード ファイル1
  2. 次のいずれかを実行します。

    • エクスプローラービュー ( [表示] > [エクスプローラー] ) でノートブック ファイルを右クリックし、コンテキスト メニューから[Databricks で実行] > [ワークフローとしてファイルを実行]を選択します。

    • ノートブック ファイル エディターのタイトル バーで、 Databricks での実行アイコンをクリックし、 [ワークフローとして実行]をクリックします。

[ Databricks ジョブの実行] というタイトルの新しいエディター タブが表示されます。 ノートブックはワークスペース内のジョブとして実行され、ノートブックとその出力は新しいエディタータブの [ 出力 ] 領域に表示されます。

ジョブの実行に関する情報を表示するには、 Databricks ジョブ 実行エディター タブの [タスク実行 ID] リンクをクリックします。ワークスペースが開き、ジョブ実行の詳細がワークスペースに表示されます。