sync
grupo de comando
Observação
Esta informação se aplica às versões 0.205 e acima do Databricks CLI, que estão em Public Preview. Para encontrar sua versão da CLI do Databricks, execute databricks -v
.
Além disso, observe que o grupo de comando sync
pode sincronizar as alterações de arquivos de uma máquina de desenvolvimento local somente para os arquivos do usuário workspace (/Users
) em seu Databricks workspace. Não é possível sincronizar com arquivos DBFS (dbfs:/
). Para sincronizar as alterações de arquivo de uma máquina de desenvolvimento local para o DBFS (dbfs:/
) em seu Databricks workspace, use os utilitários dbx sync.
O grupo de comandos sync
na CLI do Databricks permite a sincronização unidirecional de alterações de arquivo em um diretório do sistema de arquivos local para um diretório em um workspace remoto do Databricks.
Observação
sync
Os comandos não podem sincronizar alterações de arquivo de um diretório dentro de um workspace remoto do Databricks, de volta para um diretório dentro de um sistema de arquivos local.
Você executa sync
comandos anexando-os a databricks sync
. Para exibir ajuda para o comando sync
, execução databricks sync -h
.
Importante
Para instalar a CLI da Databricks, consulte Instalar ou atualizar a CLI da Databricks. Para configurar a autenticação para a CLI do Databricks, consulte Autenticação para a CLI do Databricks.
Sincronize gradualmente as alterações de arquivo local para um diretório remoto
Para executar uma sincronização única, incremental e unidirecional de alterações de arquivo em um diretório do sistema de arquivos local, para um diretório em um workspace remoto do Databricks, execute o comando sync
, da seguinte maneira:
databricks sync <local-directory-path> <remote-directory-path>
Por exemplo, para fazer uma sincronização incremental única e unidirecional de todas as alterações de arquivo na pasta chamada my-folder
dentro do diretório de trabalho atual local, para um caminho específico dentro do workspace remoto, execute o seguinte comando:
databricks sync ./my-folder/ /Users/someone@example.com/
Neste exemplo, apenas as alterações de arquivo desde a última execução do comando sync
são sincronizadas com /Users/someone@example.com/
. Por default, o URL workspace no perfil DEFAULT
do chamador é usado para determinar o workspace remoto com o qual sincronizar.
Sincronize totalmente as alterações de arquivos locais em um diretório remoto
Para executar uma sincronização única, completa e unidirecional das alterações de arquivo em um diretório do sistema de arquivos local para um diretório em um workspace remoto do Databricks, independentemente de quando o último comando sync
foi executado, use a opção --full
, por exemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --full
Sincronize continuamente as alterações de arquivos locais em um diretório remoto
Para ativar a sincronização contínua e unidirecional de alterações de arquivo em um diretório de sistema de arquivos local, para um diretório em um workspace remoto do Databricks, use a opção --watch
, por exemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch
A sincronização unidirecional continua até que o comando seja interrompido no terminal, geralmente pressionando Ctrl + c
ou Ctrl + z
.
A sondagem de possíveis eventos de sincronização ocorre uma vez por segundo por default. Para alterar esse intervalo, use a opção --interval
junto com o número de segundos para a pesquisa seguido do caractere s
, por exemplo, por cinco segundos:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s
Altere o formato de saída do andamento da sincronização
A informação de progresso de sincronização é enviada para o terminal em formato de texto por default. Para especificar o formato de saída do andamento da sincronização, use a opção --output
, especificando text
(o default, se --output
não for especificado de outra forma) ou json
, por exemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --output json