Erros e solução de problemas das pastas Git do Databricks
Siga as orientações abaixo para responder a mensagens de erro comuns ou para solucionar problemas com as pastas Git do Databricks.
Invalid credentials
Tente o seguinte:
Confirme se as configurações de integração do Git (Settings > Linked account) estão corretas.
Você deve inserir o nome de usuário e tokens do provedor Git.
Confirme se o senhor selecionou o provedor Git correto em **Settings** > **Linked account.
Certifique-se de que seus access tokens pessoal ou senha de aplicativo tenham o acesso correto ao repo.
Se o SSO estiver habilitado em seu provedor Git, autorize seus tokens para SSO.
Teste seus tokens com a linha de comando do Git. Substitua as strings de texto entre colchetes angulares:
git clone https://<username>:<personal-access-token>@github.com/<org>/<repo-name>.git
Secure connection...SSL problems
Este erro ocorre se o seu servidor Git não estiver acessível a partir do Databricks. Para acessar um servidor Git privado, entre em contato com sua equipe account do Databricks
<link>: Secure connection to <link> could not be established because of SSL problems
Erros de tempo limite
Operações caras, como clonar um repositório grande ou fazer check-out de uma ramificação grande, podem resultar em erros de tempo limite, mas as operações podem ser concluídas em segundo plano. Você também pode tentar novamente mais tarde se o workspace estiver sobrecarregado no momento.
Para trabalhar com um repositório grande, experimente o checkout esparso.
404 erros
Se você receber um erro 404 ao tentar abrir um arquivo que não sejaNotebook , tente aguardar alguns minutos e tente novamente. Há um atraso de alguns minutos entre o momento em que o workspace é ativado e o momento em que o aplicativo da web seleciona o sinalizador de configuração.
Estado de cabeça separada
Uma pasta Git da Databricks pode entrar no estado de cabeça desconectada se:
A ramificação remota é excluída. O Databricks tentou recuperar as alterações locais não confirmadas na ramificação aplicando essas alterações à ramificação default . Se a ramificação default tiver alterações conflitantes, o Databricks aplica as alterações em um Snapshot da ramificação default (cabeçote desanexado).
Um usuário ou entidade de serviço fez check-out de um repositório remoto em tags usando a API `update repo`.
Para se recuperar deste estado:
Clique no botão
create branch
para criar um novo branch com base no commit atual ou use o dropdown “Selecionar branch” para verificar um branch existente.commit e push se quiser manter as alterações. Para descartar as alterações, clique no kebab em Alterações.
Resolver conflitos de nomes Notebook
Notebook diferentes com nomes de arquivos idênticos ou semelhantes podem causar um erro ao criar um repo ou pull request, como Cannot perform Git operation due to conflicting names
ou A folder cannot contain a notebook with the same name as a notebook, file, or folder (excluding file extensions).
Um conflito de nomenclatura pode ocorrer mesmo com diferentes extensões de arquivo. Por exemplo, esses dois arquivos entram em conflito:
notebook.ipynb
notebook.py
Erros sugerem reclonagem
There was a problem with deleting folders. The repo could be in an inconsistent state and re-cloning is recommended.
Esse erro indica que ocorreu um problema ao excluir pastas do repositório. Isso pode deixar o repositório em um estado inconsistente, onde ainda existem pastas que deveriam ter sido excluídas. Se esse erro ocorrer, o Databricks recomenda excluir e clonar novamente o repositório para Reset seu estado.
No experiment...found
ou erros de IU do MLflow
Você pode ver uma mensagem de erro do Databricks No experiment for node found
ou um erro no MLflow ao trabalhar em um experimento Notebook logs MLflow, antes da versão 3.72 da plataforma. Para resolver o erro, logs uma nova execução no Notebook associado a esse experimento.
Observação
Isso se aplica somente aos experimentos do site Notebook. Não há suporte para a criação de novos experimentos em pastas Git.
O notebook aparece como modificado sem nenhuma edição visível do usuário
Se todas as linhas de um Notebook aparecerem modificadas sem nenhuma edição do usuário, as modificações podem ser alterações nos caracteres de final de linha. O Databricks usa caracteres de final de linha LF no estilo Linux e isso pode ser diferente dos finais de linha em arquivos enviados de sistemas Windows.
Se o seu Notebook for exibido como modificado, mas não for possível ver nenhuma edição óbvia do usuário, as "modificações" podem ser alterações nos caracteres de "fim de linha" normalmente invisíveis. Os caracteres de fim de linha podem ser diferentes entre sistemas operacionais e formatos de arquivo.
Para diagnosticar esse problema, verifique se o senhor tem um arquivo .gitattributes
. Se o senhor tiver:
Ele não deve conter
* text eol=crlf
.Se o senhor não estiver usando o Windows como ambiente, remova a configuração. Tanto seu ambiente de desenvolvimento nativo quanto o Databricks usam caracteres de fim de linha do Linux.
Se o senhor estiver usando o Windows, altere a configuração para
* text=auto
. O Git agora armazenará internamente todos os arquivos com finais de linha no estilo do Linux, mas fará o checkout para caracteres de final de linha específicos da plataforma (como o Windows) automaticamente.
Se o senhor já tiver feito o commit de arquivos com caracteres de fim de linha do Windows no Git, execute os seguintes passos:
Limpar todas as alterações pendentes.
Atualize o arquivo
.gitattributes
com a recomendação acima. commit a mudança.execução
git add --renormalize
. commit e enviar todas as alterações.