Use PyCharm com Databricks Connect para Python
Observação
Este artigo abrange Databricks Connect para Databricks Runtime 13.3 LTS e acima.
Este artigo aborda como usar o Databricks Connect for Python com PyCharm. O Databricks Connect permite conectar IDEs populares, servidores Notebook e outros aplicativos personalizados a clusters Databricks. Consulte O que é o Databricks Connect?.
Observação
Antes de começar a usar o Databricks Connect, você deve configurar o cliente Databricks Connect.
O IntelliJ IDEA Ultimate também fornece suporte de plugin para PyCharm com Python. Para obter detalhes, consulte Plug-in Python para IntelliJ IDEA Ultimate.
Para usar o Databricks Connect com o PyCharm e o Python, siga estas instruções para o venv ou o Poetry. Este artigo foi testado com PyCharm Community Edition 2023.3.5. Se o senhor usar uma versão ou edição diferente do PyCharm, as instruções a seguir poderão variar.
Use PyCharm com venv e Databricks Connect para Python
começar PyCharm.
Crie um projeto: clique em Arquivo > Novo Projeto.
Na caixa de diálogo New Project (Novo projeto ), clique em Pure Python.
Para Location, clique no ícone da pasta e selecione o caminho para o ambiente virtual
venv
existente que você criou em Instalar o Databricks Connect for Python.Para Tipo de interpretador, clique em Ambiente personalizado.
Para Environment, selecione Select existing (Selecionar existente).
Para Type, selecione Python.
Para Path (Caminho), use o ícone de pasta ou a lista suspensa para selecionar o caminho para o interpretador Python no ambiente virtual
venv
existente.Dica
O interpretador Python para um ambiente virtual
venv
normalmente é instalado em</path-to-venv>/bin
. Para mais informações, consulte venv.Clique em OK.
Clique em Criar.
Adicione ao projeto um arquivo de código Python (
.py
) que contém o código de exemplo ou seu próprio código. Se você usar seu próprio código, deverá inicializar no mínimoDatabricksSession
conforme mostrado no código de exemplo.Com o arquivo de código Python aberto, defina quaisquer pontos de interrupção onde deseja que seu código seja pausado durante a execução.
Para executar o código, clique em execução > execução. Todo o código Python é executado localmente, enquanto todo o código PySpark que envolve operações DataFrame é executado nos clusters no workspace remoto do Databricks e as respostas de execução são enviadas de volta ao chamador local.
Para depurar o código, clique em execução > Depurar. Todo o código Python é depurado localmente, enquanto todo o código PySpark continua a ser executado nos clusters no workspace remoto do Databricks. O código principal do mecanismo Spark não pode ser depurado diretamente do cliente.
Siga as instruções na tela para começar a executar ou eliminar o código.
Para obter instruções mais específicas de execução e depuração, consulte Executar sem nenhuma configuração anterior e Depurar.
Use PyCharm com Poetry e Databricks Connect para Python
começar PyCharm.
Crie um projeto: clique em Arquivo > Novo Projeto.
Na caixa de diálogo New Project (Novo projeto ), clique em Pure Python.
Para Location, clique no ícone da pasta e, em seguida, selecione o caminho para o ambiente virtual Poetry existente que você criou em Instalar o Databricks Connect for Python.
Para Tipo de interpretador, clique em Ambiente personalizado.
Para Environment, selecione Select existing (Selecionar existente).
Para Type, selecione Python.
Para Path (Caminho), use o ícone de pasta ou a lista suspensa para selecionar o caminho para o interpretador Python no ambiente virtual Poetry existente.
Dica
Certifique-se de selecionar o caminho para o interpretador Python. Não selecione o caminho para o executável Poetry.
Para obter informações sobre onde a versão do sistema do interpretador Python está instalada, consulte Como adicionar Python ao PATH.
Clique em OK.
Clique em Criar.
Adicione ao projeto um arquivo de código Python (
.py
) que contém o código de exemplo ou seu próprio código. Se você usar seu próprio código, deverá inicializar no mínimoDatabricksSession
conforme mostrado no código de exemplo.Com o arquivo de código Python aberto, defina quaisquer pontos de interrupção onde deseja que seu código seja pausado durante a execução.
Para executar o código, clique em execução > execução. Todo o código Python é executado localmente, enquanto todo o código PySpark que envolve operações DataFrame é executado nos clusters no workspace remoto do Databricks e as respostas de execução são enviadas de volta ao chamador local.
Para depurar o código, clique em execução > Depurar. Todo o código Python é depurado localmente, enquanto todo o código PySpark continua a ser executado nos clusters no workspace remoto do Databricks. O código principal do mecanismo Spark não pode ser depurado diretamente do cliente.
Siga as instruções na tela para começar a executar ou eliminar o código.
Para obter instruções mais específicas de execução e depuração, consulte Executar sem nenhuma configuração anterior e Depurar.