クラスターライブラリ

クラスター ライブラリは、クラスター上で実行されているすべてのノートブックとジョブで使用できます。 この記事では、Databricks ワークスペースでのライブラリのインストールUI の使用方法について詳しく説明します。

次の方法を使用して、クラスターにライブラリをインストールできます。

クラスターにライブラリをインストール

クラスタにライブラリをインストールするには、以下の手順に従ってください。

  1. コンピュートアイコン サイドバー の 「コンピュート 」をクリックします

  2. クラスター名をクリックします。

  3. [ライブラリ] タブをクリックします。

  4. [新規インストール]をクリックします。

  5. [ライブラリをインストール] ダイアログが表示されます。

  6. [ライブラリのソース] オプションのいずれかを選択し、表示される手順に従い、その後 [インストール] をクリックします。

重要

Databricks Runtime 14.3 LTS 以下を使用する場合、ライブラリは DBFS からインストールできます。 ただし、どのワークスペース ユーザーでも DBFS に保存されているライブラリ ファイルを変更できます。 ワークスペースの ライブラリ のセキュリティを強化するために、DatabricksDBFS Databricks Runtime15.1 以降では、ライブラリ ファイルを ルートに保存することは非推奨となり、 デフォルト によって無効になっています。DBFSルートへのライブラリの保存は非推奨であり、デフォルトで無効になっていますを参照してください。

代わりに、 、 Databricksライブラリ、PythonJAR ファイル、Spark コネクタを含むすべてのライブラリをワークスペース ファイルまたはUnity Catalog ボリュームにアップロードするか、ライブラリ パッケージ リポジトリを使用すること をお勧めします 。ワークロードがこれらのパターンをサポートしていない場合は、クラウドオブジェクトストレージに保存されているライブラリを使用することもできます。

すべてのクラスター アクセス モードがすべてのライブラリ構成をサポートしているわけではありません。 「クラスタースコープのライブラリ」を参照してください。

ライブラリのソース

手順

ワークスペース

ワークスペース ファイルを選択するか、Whl、zip 形式のホイールハウス、JAR、ZIP、tar、またはrequirements.txt ファイルをアップロードします。 「ワークスペース ファイルからライブラリをインストールする」を参照してください。

ボリューム

ボリュームからWhl、JAR、またはrequirements.txtファイルを選択します。 「ボリュームからライブラリをインストールする」を参照してください。

ファイルパス/GCS

ライブラリのタイプを選択し、ライブラリ オブジェクトに完全な URI を指定します (例: /Workspace/path/to/library.whl/Volumes/path/to/library.whl 、またはgs://bucket-name/path/to/library.whl )。 「オブジェクト ストレージからライブラリをインストールする」を参照してください。

PyPI

PyPI パッケージ名を入力します。 PyPIパッケージを参照してください。

Maven

Maven 座標を指定します。 Maven または Spark パッケージを参照してください。

CRAN

パッケージの名前を入力します。 CRAN パッケージを参照してください。

DBFS (推奨されません)

JAR または Whl ファイルを DBFS ルートにロードします。 DBFS に保存されているファイルはどのワークスペース ユーザーでも変更できるため、これは推奨されません。

クラスターにライブラリをインストールしても、そのクラスターに既にアタッチされているノートブックには、新しいライブラリがすぐに表示されません。 最初にノートブックを デタッチ してから、クラスター に再度アタッチ する必要があります。

注:

インストールに 2 時間以上かかったライブラリは失敗としてマークされます。

init スクリプトを使用してライブラリをインストール

ライブラリにカスタム構成が必要な場合、ワークスペースやクラスターライブラリインターフェイスを使ってライブラリをインストールできないことがあります。この場合は、代わりに、initスクリプトを使用すると、ライブラリをインストールできます。

以下は、クラスターの初期化時に pip を使用して Databricks Runtime クラスターに Python ライブラリをインストールする init スクリプトの例です。

#!/bin/bash

/databricks/python/bin/pip install astropy

クラスターからライブラリをアンインストール

注:

クラスターからライブラリをアンインストールしても、クラスターを再起動するまでライブラリは削除されません。クラスターを再起動するまで、アンインストールされたライブラリのステータスは [再起動時のアンインストールを保留中] と表示されます。

ライブラリをアンインストールするには、クラスター UI を使用できます。

  1. コンピュートアイコン サイドバー の 「コンピュート 」をクリックします

  2. クラスター名をクリックします。

  3. [ライブラリ] タブをクリックします。

  4. ライブラリをアンインストールするクラスターの横にあるチェックボックスをオンにし、[アンインストール] をクリックしてから [確認] をクリックします。ステータスが [再起動時のアンインストールを保留中] に変わります。

[再起動] をクリックし、[確認] をクリックしてライブラリをアンインストールします。ライブラリはクラスターの [ライブラリ] タブから削除されます。

クラスターにインストールされているライブラリを表示

  1. コンピュートアイコン サイドバー の 「コンピュート 」をクリックします

  2. クラスター名をクリックします。

  3. ライブラリ 」タブをクリックします。 タブには、ライブラリごとに、名前とバージョン、タイプ、 インストールステータス、およびアップロードされている場合はソースファイルが表示されます。

クラスターにインストールされたライブラリを更新

クラスターにインストールされたライブラリを更新するには、古いバージョンのライブラリをアンインストールし、新しいバージョンをインストールします。

注:

Requirements.txtファイルは、アンインストールと再起動の必要はありません。 requirements.txtファイルの内容を変更した場合は、再インストールするだけで、インストールされたファイルの内容を更新できます。