Erros e solução de problemas das pastas Git do Databricks

Siga as orientações abaixo para responder a mensagens de erro comuns ou para solucionar problemas com as pastas Git do Databricks.

Invalid credentials

Tente o seguinte:

  • Confirme se as configurações de integração do Git (Settings > Linked account) estão corretas.

    • Você deve inserir o nome de usuário e tokens do provedor Git.

  • Confirme se o senhor selecionou o provedor Git correto em **Settings** > **Linked account.

  • Certifique-se de que seus access tokens pessoal ou senha de aplicativo tenham o acesso correto ao repo.

  • Se o SSO estiver habilitado em seu provedor Git, autorize seus tokens para SSO.

  • Teste seus tokens com a linha de comando do Git. Substitua as strings de texto entre colchetes angulares:

    git clone https://<username>:<personal-access-token>@github.com/<org>/<repo-name>.git
    

Secure connection...SSL problems

Este erro ocorre se o seu servidor Git não estiver acessível a partir do Databricks. Para acessar um servidor Git privado, entre em contato com sua equipe account do Databricks

<link>: Secure connection to <link> could not be established because of SSL problems

Erros de tempo limite

Operações caras, como clonar um repositório grande ou fazer check-out de uma ramificação grande, podem resultar em erros de tempo limite, mas as operações podem ser concluídas em segundo plano. Você também pode tentar novamente mais tarde se o workspace estiver sobrecarregado no momento.

Para trabalhar com um repositório grande, experimente o checkout esparso.

404 erros

Se você receber um erro 404 ao tentar abrir um arquivo que não sejaNotebook , tente aguardar alguns minutos e tente novamente. Há um atraso de alguns minutos entre o momento em que o workspace é ativado e o momento em que o aplicativo da web seleciona o sinalizador de configuração.

Estado de cabeça separada

Uma pasta Git da Databricks pode entrar no estado de cabeça desconectada se:

  • A ramificação remota é excluída. O Databricks tentou recuperar as alterações locais não confirmadas na ramificação aplicando essas alterações à ramificação default . Se a ramificação default tiver alterações conflitantes, o Databricks aplica as alterações em um Snapshot da ramificação default (cabeçote desanexado).

  • Um usuário ou entidade de serviço fez check-out de um repositório remoto em tags usando a API `update repo`.

Para se recuperar deste estado:

  1. Clique no botão create branch para criar um novo branch com base no commit atual ou use o dropdown “Selecionar branch” para verificar um branch existente.

  2. commit e push se quiser manter as alterações. Para descartar as alterações, clique no kebab em Alterações.

Resolver conflitos de nomes Notebook

Notebook diferentes com nomes de arquivos idênticos ou semelhantes podem causar um erro ao criar um repo ou pull request, como Cannot perform Git operation due to conflicting names ou A folder cannot contain a notebook with the same name as a notebook, file, or folder (excluding file extensions).

Um conflito de nomenclatura pode ocorrer mesmo com diferentes extensões de arquivo. Por exemplo, esses dois arquivos entram em conflito:

  • notebook.ipynb

  • notebook.py

Diagrama: Conflito de nomes para Notebook, arquivo ou pasta.

Para corrigir o conflito de nomes

  • Renomeie o Notebook, arquivo ou pasta que contribui para o estado de erro.

    • Se esse erro ocorrer ao clonar o repositório, será necessário renomear Notebook, arquivos ou pastas no repositório Git remoto.

Erros sugerem reclonagem

There was a problem with deleting folders. The repo could be in an inconsistent state and re-cloning is recommended.

Esse erro indica que ocorreu um problema ao excluir pastas do repositório. Isso pode deixar o repositório em um estado inconsistente, onde ainda existem pastas que deveriam ter sido excluídas. Se esse erro ocorrer, o Databricks recomenda excluir e clonar novamente o repositório para Reset seu estado.

No experiment...found ou erros de IU do MLflow

Você pode ver uma mensagem de erro do Databricks No experiment for node found ou um erro no MLflow ao trabalhar em um experimento Notebook logs MLflow, antes da versão 3.72 da plataforma. Para resolver o erro, logs uma nova execução no Notebook associado a esse experimento.

Observação

Isso se aplica somente aos experimentos do site Notebook. Não há suporte para a criação de novos experimentos em pastas Git.

O notebook aparece como modificado sem nenhuma edição visível do usuário

Se todas as linhas de um Notebook aparecerem modificadas sem nenhuma edição do usuário, as modificações podem ser alterações nos caracteres de final de linha. O Databricks usa caracteres de final de linha LF no estilo Linux e isso pode ser diferente dos finais de linha em arquivos enviados de sistemas Windows.

Se o seu Notebook for exibido como modificado, mas não for possível ver nenhuma edição óbvia do usuário, as "modificações" podem ser alterações nos caracteres de "fim de linha" normalmente invisíveis. Os caracteres de fim de linha podem ser diferentes entre sistemas operacionais e formatos de arquivo.

Para diagnosticar esse problema, verifique se o senhor tem um arquivo .gitattributes. Se o senhor tiver:

  • Ele não deve conter * text eol=crlf.

  • Se o senhor não estiver usando o Windows como ambiente, remova a configuração. Tanto seu ambiente de desenvolvimento nativo quanto o Databricks usam caracteres de fim de linha do Linux.

  • Se o senhor estiver usando o Windows, altere a configuração para * text=auto. O Git agora armazenará internamente todos os arquivos com finais de linha no estilo do Linux, mas fará o checkout para caracteres de final de linha específicos da plataforma (como o Windows) automaticamente.

Se o senhor já tiver feito o commit de arquivos com caracteres de fim de linha do Windows no Git, execute os seguintes passos:

  1. Limpar todas as alterações pendentes.

  2. Atualize o arquivo .gitattributes com a recomendação acima. commit a mudança.

  3. execução git add --renormalize. commit e enviar todas as alterações.