Use o código do Visual Studio com o Databricks Connect para Python

Observação

Este artigo abrange Databricks Connect para Databricks Runtime 13.3 LTS e acima.

Este artigo aborda como usar o Databricks Connect for Python com Visual Studio Code. O Databricks Connect permite conectar IDEs populares, servidores Notebook e outros aplicativos personalizados a clusters Databricks. Consulte O que é o Databricks Connect?. Para a versão Scala destes artigos, consulte Use Visual Studio Code with Databricks Connect for Scala.

Observação

Antes de começar a usar o Databricks Connect, você deve configurar o cliente Databricks Connect.

Dica

A extensão Databricks para o Visual Studio Code já tem suporte integrado para Databricks Connect para Databricks Runtime 13.3 LTS e acima. Consulte Depurar código usando o Databricks Connect para a extensão Databricks para Visual Studio Code.

Para usar o Databricks Connect com Visual Studio Code e Python, siga estas instruções.

  1. comece o código do Visual Studio.

  2. Abra a pasta que contém seu ambiente virtual Python (File > Open Folder).

  3. No Visual Studio Code Terminal (view > Terminal), ative o ambiente virtual.

  4. Defina o interpretador Python atual como aquele referenciado no ambiente virtual:

    1. Na paleta de comandos (view > comando Palette), digite Python: Select Interpreter e pressione Enter.

    2. Selecione o caminho para o interpretador Python referenciado no ambiente virtual.

  5. Adicione à pasta um arquivo de código Python (.py) que contém o código de exemplo ou seu próprio código. Se você usar seu próprio código, deverá inicializar no mínimo DatabricksSession conforme mostrado no código de exemplo.

  6. Para executar o código, clique em execução > execução sem depuração no menu principal. Todo o código Python é executado localmente, enquanto todo o código PySpark que envolve operações DataFrame é executado nos clusters no workspace remoto do Databricks e as respostas de execução são enviadas de volta ao chamador local.

  7. Para depurar o código:

    1. Com o arquivo de código Python aberto, defina quaisquer pontos de interrupção onde deseja que seu código seja pausado durante a execução.

    2. Clique no ícone de execução e depuração na barra lateral ou clique em view > execução no menu principal.

    3. Na de execução e depuração view, clique no botão execução e depuração .

    4. Siga as instruções na tela para começar a executar e eliminar o código.

    Todo o código Python é depurado localmente, enquanto todo o código PySpark continua a ser executado nos clusters no workspace remoto do Databricks. O código principal do mecanismo Spark não pode ser depurado diretamente do cliente.

Para obter instruções mais específicas de execução e depuração, consulte Configurar e executar o depurador e depuração Python no VS Code.