Reinicie o processo Python no Databricks

Você pode reiniciar programaticamente o processo do Python no Databricks para garantir que as bibliotecas instaladas ou atualizadas localmente funcionem corretamente no kernel do Python para sua SparkSession atual.

Ao reiniciar o processo Python, você perde as informações de estado do Python. Databricks recomenda instalar todas as bibliotecas com escopo de sessão no início de um Notebook e executar dbutils.library.restartPython() para limpar o processo do Python antes de continuar.

O senhor pode usar esse processo no Notebook interativo ou para Python tarefa agendada com o Job.

O que é `dbutils.library.restartPython`?

A função auxiliar dbutils.library.restartPython() é a maneira recomendada de reiniciar o processo Python em um Databricks Notebook.

Observação

A maioria das funções no submódulo dbutils.library está obsoleta. Databricks recomenda enfaticamente o uso de %pip para gerenciar todas as instalações de bibliotecas com escopo Notebook . Consulte Biblioteca Python com escopoNotebook.

Quando você deve reiniciar seu processo Python?

É uma boa ideia reiniciar o processo Python sempre que executar uma instalação local que inclua qualquer um dos itens a seguir:

Especificar uma versão de um pacote incluído no Databricks Runtime.
Instalando uma versão personalizada de um pacote incluído no Databricks Runtime.
Atualizar explicitamente uma biblioteca para a versão mais recente usando %pip install <library-name> --upgrade.
Configurando um ambiente personalizado a partir de um arquivo requirements.txt local.
Instalar uma biblioteca que requer a alteração das versões de bibliotecas dependentes incluídas no Databricks Runtime.

Reinicie o processo Python no Databricks

O que é dbutils.library.restartPython?

Quando você deve reiniciar seu processo Python?

O que é `dbutils.library.restartPython`?