Databricks で Python プロセスを再起動します。
Databricks で Python プロセスをプログラムで再起動して、ローカルにインストールまたはアップグレードされたライブラリが現在の SparkSession の Python カーネルで正しく機能することを確認できます。
Python プロセスを再起動すると、Python の状態情報が失われます。 Databricks では、ノートブックの先頭にすべてのセッション スコープ ライブラリをインストールし、続行する前に dbutils.library.restartPython()
を実行して Python プロセスをクリーンアップすることをお勧めします。
このプロセスは、インタラクティブ ノートブックやジョブでスケジュールされた Python タスクで使用できます。
dbutils.library.restartPython
とは何ですか?
ヘルパー関数 dbutils.library.restartPython()
は、Databricks ノートブックで Python プロセスを再起動するための推奨される方法です。
注
dbutils.library
サブモジュールのほとんどの関数は非推奨です。Databricks では、 %pip
を使用してノートブック スコープのすべてのライブラリ インストールを管理することを強くお勧めします。 ノートブック スコープの Python ライブラリに関するページを参照してください。
Pythonプロセスをいつ再起動する必要がありますか?
次のいずれかを含むローカルインストールを実行するたびに、Pythonプロセスを再起動することをお勧めします。
Databricks Runtimeに含まれるパッケージのバージョンを指定する。
Databricks Runtimeに含まれるパッケージのカスタムバージョンのインストール .
%pip install <library-name> --upgrade
を使用してライブラリを明示的に最新バージョンに更新する。ローカル
requirements.txt
ファイルからのカスタム環境の構成。Databricks Runtimeに含まれている依存ライブラリのバージョンを変更する必要があるライブラリをインストールする。