Compartilhe uso de dados no protocolo de compartilhamento aberto Delta Sharing (para provedores)

Este artigo fornece uma visão geral de como os provedores podem usar o protocolo de compartilhamento aberto Delta Sharing para compartilhar dados do seu workspace do Databricks habilitado para Unity Catalog com qualquer usuário em qualquer plataforma de computação, em qualquer lugar.

Observação

Se você for um destinatário de dados (um usuário ou grupo de usuários com quem os dados estão sendo compartilhados), consulte Acessar dados compartilhados com você usando Delta compartilhamento (para destinatários).

Quem deve usar o protocolo de compartilhamento aberto Delta Sharing?

Existem três maneiras de compartilhar uso de dados Delta compartilhamento:

  1. O protocolo de compartilhamento aberto do Databricks, abordado nestes artigos, permite compartilhar dados que você gerencia em um workspace do Databricks habilitado para Unity Catalog com usuários em qualquer plataforma de computação.

    Essa abordagem usa o servidor de compartilhamento Delta que é integrado ao Databricks e é útil quando você gerencia o uso de dados Unity Catalog e deseja compartilhá-lo com usuários que não usam o Databricks ou não têm acesso a um Unity Catalogdo Databricks habilitado para workspace. A integração com o Unity Catalog no lado do provedor simplifica a configuração e a governança dos provedores.

  2. Uma implementação gerenciada pelo cliente do servidor de compartilhamento Delta de código aberto permite compartilhar de qualquer plataforma para qualquer plataforma, seja Databricks ou não.

    Consulte github.com/delta-io/delta-sharing.

  3. O protocolo de compartilhamento Databricks-to-Databricks permite que você compartilhe dados do seu workspace habilitado para Catálogo Unity com usuários que também têm acesso a um workspace Databricks habilitado para Catálogo Unity.

    Consulte Compartilhar uso de dados no protocolo Delta compartilhamento Databricks-to-Databricks (para provedores).

Para obter uma introdução ao Delta Sharing e mais informações sobre essas três abordagens, consulte Compartilhar dados e IA ativo com segurança usando o Delta Sharing.

Delta Sharing open sharing fluxo de trabalho

Esta seção fornece uma visão geral de alto nível do fluxo de trabalho de compartilhamento aberto, com links para a documentação detalhada de cada passo.

No modelo de compartilhamento aberto Delta Sharing:

  1. O provedor de dados cria um destinatário, que é um objeto nomeado que representa um usuário ou grupo de usuários com quem o provedor de dados deseja compartilhar dados.

    Quando o provedor de dados cria o destinatário, o Databricks gera um tokens, um arquivo de credencial que inclui os tokens e um link de ativação que o provedor de dados pode enviar ao destinatário para acessar o arquivo de credencial.

    Para obter detalhes, consulte o passo 1: Criar o destinatário.

  2. O provedor de dados cria um compartilhamento, que é um objeto nomeado que contém uma coleção de tabelas registradas em um metastore do Unity Catalog na account do provedor .

    Para obter detalhes, consulte Criar e gerenciar compartilhamentos para Delta Sharing.

  3. O provedor de dados concede ao destinatário acesso ao compartilhamento.

    Para obter detalhes, consulte gerenciar o acesso a Delta Sharing data shares (para provedores).

  4. O provedor de dados envia o link de ativação ao destinatário por meio de um canal seguro, juntamente com instruções para usar o link de ativação para downloads o arquivo de credencial que o destinatário usará para estabelecer uma conexão segura com o provedor de dados para receber os dados compartilhados.

    Para detalhes, consulte o passo 2: Obtenha o link de ativação.

  5. O destinatário dos dados segue o link de ativação para downloads o arquivo de credencial e, em seguida, usa o arquivo de credencial para acessar os dados compartilhados.

    Os dados compartilhados estão disponíveis somente para leitura. Os usuários podem acessar o uso de dados em sua plataforma ou ferramentas de sua escolha.

    Para obter detalhes, consulte Ler dados compartilhados usando compartilhamento aberto Delta Sharing (para destinatários).

Considerações de configuração e segurança para compartilhamento aberto

Um bom gerenciamento tokens é key para compartilhar dados com segurança quando você usa o modelo de compartilhamento aberto:

Os provedores de dados podem oferecer segurança adicional atribuindo listas de acesso IP para restringir o acesso dos destinatários a locais específicos da rede. Consulte Restringir o acesso do destinatário do Delta Sharing usando listas de acesso IP (compartilhamento aberto).