Compartilhamento de uso de dados o protocolo de compartilhamento aberto Delta Sharing (para provedores)

Este artigo apresenta uma visão geral de como os provedores podem usar o protocolo de compartilhamento aberto Delta Sharing para compartilhar dados do seu Unity Catalog habilitado Databricks workspace com qualquer usuário em qualquer plataforma de computação, em qualquer lugar.

Observação

Se o senhor for um destinatário de dados (um usuário ou grupo de usuários com quem os dados estão sendo compartilhados), consulte Acessar dados compartilhados com o senhor usando o Delta Sharing (para destinatários).

Quem deve usar o protocolo de compartilhamento aberto Delta Sharing?

Há três maneiras de compartilhar o uso de dados Delta Sharing:

  1. O protocolo de compartilhamento aberto Databricks , abordado neste artigo, permite que o senhor compartilhe dados gerenciados em um Unity Catalog habilitado Databricks workspace com usuários em qualquer plataforma de computação.

    Essa abordagem usa o servidor Delta Sharing incorporado ao Databricks e é útil quando o senhor gerenciar o uso de dados Unity Catalog e deseja compartilhá-lo com usuários que não usam o Databricks ou não têm acesso a um Unity Catalog-enabled Databricks workspace. A integração com o Unity Catalog no lado do provedor simplifica a configuração e a governança para os provedores.

  2. Uma implementação de gerenciar o cliente do servidor de código aberto Delta Sharing permite que o senhor compartilhe de qualquer plataforma para qualquer plataforma, seja ela Databricks ou não.

    Consulte github.com/delta-io/delta-sharing.

  3. O protocolo de compartilhamento Databricks-to-Databricks permite que o senhor compartilhe dados do seu Unity Catalog habilitado workspace com usuários que também tenham acesso a um Unity Catalog habilitado Databricks workspace.

    Veja em Compartilhamento de uso de dados o protocolo Delta Sharing Databricks-to-Databricks (para provedores).

Para obter uma introdução ao site Delta Sharing e mais informações sobre essas três abordagens, consulte O que é Delta Sharing?

Delta Sharing open compartilhamento fluxo de trabalho

Esta seção fornece uma visão geral de alto nível do fluxo de trabalho de compartilhamento aberto, com links para a documentação detalhada de cada passo.

No modelo de compartilhamento aberto Delta Sharing:

  1. O provedor de dados cria um destinatário, que é um objeto nomeado que representa um usuário ou grupo de usuários com o qual o provedor de dados deseja compartilhar dados.

    Quando o provedor de dados cria o destinatário, o site Databricks gera tokens, um arquivo de credencial que inclui os tokens e um link de ativação que o provedor de dados pode enviar ao destinatário para acessar o arquivo de credencial.

    Para obter detalhes, consulte o passo 1: Criar o destinatário.

  2. O provedor de dados cria um compartilhamento, que é um objeto nomeado que contém uma coleção de tabelas registradas em um metastore Unity Catalog no account do provedor.

    Para obter detalhes, consulte Criar e gerenciar compartilhamentos para o Delta Sharing.

  3. O provedor de dados concede ao destinatário acesso ao compartilhamento.

    Para obter detalhes, consulte gerenciar o acesso a Delta Sharing data shares (para provedores).

  4. O provedor de dados envia o link de ativação para o destinatário por meio de um canal seguro, juntamente com instruções para usar o link de ativação para download o arquivo de credencial que o destinatário usará para estabelecer uma conexão segura com o provedor de dados para receber os dados compartilhados.

    Para obter detalhes, consulte o passo 2: Obter o link de ativação.

  5. O destinatário dos dados segue o link de ativação para fazer o download do arquivo de credencial e, em seguida, usa o arquivo de credencial para acessar os dados compartilhados.

    Os dados compartilhados estão disponíveis somente para leitura. Os usuários podem acessar o uso de dados na plataforma ou nas ferramentas de sua preferência.

    Para obter detalhes, consulte Ler dados compartilhados usando o compartilhamento aberto do Delta Sharing (para destinatários).

Considerações sobre configuração e segurança para compartilhamento aberto

Um bom gerenciamento de tokens é key para compartilhar dados com segurança quando o senhor usa o modelo de compartilhamento aberto:

  • Os provedores de dados que pretendem usar o compartilhamento aberto devem configurar a vida útil dos tokens de destinatário do default quando ativarem o Delta Sharing para seu metastore Unity Catalog. A Databricks recomenda que o senhor configure os tokens para expirar. Consulte Ativar o Delta Sharing em um metastore.

  • Se o senhor precisar modificar o tempo de vida dos tokens do default, consulte Modificar o tempo de vida dos tokens do destinatário.

  • Incentive os destinatários a gerenciar seus arquivos de credenciais de downloads com segurança.

  • Para obter mais informações sobre o gerenciamento de tokens e a segurança do compartilhamento aberto, consulte gerenciar recipient tokens (compartilhamento aberto).

Os provedores de dados podem oferecer segurança adicional atribuindo listas de acesso IP para restringir o acesso dos destinatários a locais específicos da rede. Consulte Restringir o acesso do destinatário do Delta Sharing usando listas de acesso IP (compartilhamento aberto).