Compartilhamento de uso de dados o protocolo de compartilhamento aberto Delta Sharing (para provedores)
Este artigo apresenta uma visão geral de como os provedores podem usar o protocolo de compartilhamento aberto Delta Sharing para compartilhar dados do seu Unity Catalog habilitado Databricks workspace com qualquer usuário em qualquer plataforma de computação, em qualquer lugar.
Observação
Se o senhor for um destinatário de dados (um usuário ou grupo de usuários com quem os dados estão sendo compartilhados), consulte Acessar dados compartilhados com o senhor usando o Delta Sharing (para destinatários).
Quem deve usar o protocolo de compartilhamento aberto Delta Sharing?
Há três maneiras de compartilhar o uso de dados Delta Sharing:
O protocolo de compartilhamento aberto Databricks , abordado neste artigo, permite que o senhor compartilhe dados gerenciados em um Unity Catalog habilitado Databricks workspace com usuários em qualquer plataforma de computação.
Essa abordagem usa o servidor Delta Sharing incorporado ao Databricks e é útil quando o senhor gerenciar o uso de dados Unity Catalog e deseja compartilhá-lo com usuários que não usam o Databricks ou não têm acesso a um Unity Catalog-enabled Databricks workspace. A integração com o Unity Catalog no lado do provedor simplifica a configuração e a governança para os provedores.
Uma implementação de gerenciar o cliente do servidor de código aberto Delta Sharing permite que o senhor compartilhe de qualquer plataforma para qualquer plataforma, seja ela Databricks ou não.
Consulte github.com/delta-io/delta-sharing.
O protocolo de compartilhamento Databricks-to-Databricks permite que o senhor compartilhe dados do seu Unity Catalog habilitado workspace com usuários que também tenham acesso a um Unity Catalog habilitado Databricks workspace.
Para obter uma introdução ao site Delta Sharing e mais informações sobre essas três abordagens, consulte O que é Delta Sharing?
Delta Sharing open compartilhamento fluxo de trabalho
Esta seção fornece uma visão geral de alto nível do fluxo de trabalho de compartilhamento aberto, com links para a documentação detalhada de cada passo.
No modelo de compartilhamento aberto Delta Sharing:
O provedor de dados cria um destinatário, que é um objeto nomeado que representa um usuário ou grupo de usuários com o qual o provedor de dados deseja compartilhar dados.
Quando o provedor de dados cria o destinatário, o site Databricks gera tokens, um arquivo de credencial que inclui os tokens e um link de ativação que o provedor de dados pode enviar ao destinatário para acessar o arquivo de credencial.
Para obter detalhes, consulte o passo 1: Criar o destinatário.
O provedor de dados cria um compartilhamento, que é um objeto nomeado que contém uma coleção de tabelas registradas em um metastore Unity Catalog no account do provedor.
Para obter detalhes, consulte Criar e gerenciar compartilhamentos para o Delta Sharing.
O provedor de dados concede ao destinatário acesso ao compartilhamento.
Para obter detalhes, consulte gerenciar o acesso a Delta Sharing data shares (para provedores).
O provedor de dados envia o link de ativação para o destinatário por meio de um canal seguro, juntamente com instruções para usar o link de ativação para download o arquivo de credencial que o destinatário usará para estabelecer uma conexão segura com o provedor de dados para receber os dados compartilhados.
Para obter detalhes, consulte o passo 2: Obter o link de ativação.
O destinatário dos dados segue o link de ativação para fazer o download do arquivo de credencial e, em seguida, usa o arquivo de credencial para acessar os dados compartilhados.
Os dados compartilhados estão disponíveis somente para leitura. Os usuários podem acessar o uso de dados na plataforma ou nas ferramentas de sua preferência.
Para obter detalhes, consulte Ler dados compartilhados usando o compartilhamento aberto do Delta Sharing (para destinatários).
Considerações sobre configuração e segurança para compartilhamento aberto
Um bom gerenciamento de tokens é key para compartilhar dados com segurança quando o senhor usa o modelo de compartilhamento aberto:
Os provedores de dados que pretendem usar o compartilhamento aberto devem configurar a vida útil dos tokens de destinatário do default quando ativarem o Delta Sharing para seu metastore Unity Catalog. A Databricks recomenda que o senhor configure os tokens para expirar. Consulte Ativar o Delta Sharing em um metastore.
Se o senhor precisar modificar o tempo de vida dos tokens do default, consulte Modificar o tempo de vida dos tokens do destinatário.
Incentive os destinatários a gerenciar seus arquivos de credenciais de downloads com segurança.
Para obter mais informações sobre o gerenciamento de tokens e a segurança do compartilhamento aberto, consulte gerenciar recipient tokens (compartilhamento aberto).
Os provedores de dados podem oferecer segurança adicional atribuindo listas de acesso IP para restringir o acesso dos destinatários a locais específicos da rede. Consulte Restringir o acesso do destinatário do Delta Sharing usando listas de acesso IP (compartilhamento aberto).