Compartilhar uso de dados no protocolo Delta compartilhamento Databricks-to-Databricks (para provedores)

Este artigo fornece uma visão geral de como usar o compartilhamento Databricks-to-Databricks Delta para compartilhar dados com segurança com qualquer usuário do Databricks, independentemente da account ou do host cloud , desde que esse usuário tenha acesso a um workspace habilitado para Unity Catalog.

Observação

Se você for um destinatário de dados (um usuário ou grupo de usuários com quem os dados do Databricks estão sendo compartilhados), consulte Acessar dados compartilhados com você usando Delta compartilhamento (para destinatários).

Quem deve usar Delta Sharing de Databricks para Databricks?

Existem três maneiras de compartilhar uso de dados Delta compartilhamento.

  1. O protocolo de compartilhamento Databricks-to-Databricks, abordado nestes artigos, permite compartilhar dados do seu workspace habilitado para Catálogo Unity com usuários que também têm acesso a um workspace Databricks habilitado para Catálogo Unity.

    Essa abordagem usa o servidor Delta Sharing integrado ao Databricks e fornece suporte para compartilhamento Notebook , governança de dados do Unity Catalog, auditoria e acompanhamento de uso para provedores e destinatários. A integração com o Unity Catalog simplifica a configuração e a governança para provedores e destinatários e melhora o desempenho.

  2. O protocolo de compartilhamento aberto do Databricks permite que você compartilhe dados que você gerencia em um workspace do Databricks habilitado para Unity Catalog com usuários em qualquer plataforma de computação.

    Consulte Compartilhar uso de dados no protocolo de compartilhamento aberto Delta Sharing (para provedores).

  3. Uma implementação gerenciada pelo cliente do servidor de compartilhamento Delta de código aberto permite compartilhar de qualquer plataforma para qualquer plataforma, seja Databricks ou não.

    Consulte github.com/delta-io/delta-sharing.

Para obter uma introdução ao Delta Sharing e mais informações sobre essas três abordagens, consulte Compartilhar dados e IA ativo com segurança usando o Delta Sharing.

Databricks-to-Databricks Delta Sharing fluxo de trabalho

Esta seção fornece uma visão geral de alto nível do fluxo de trabalho de compartilhamento Databricks-para-Databricks, com links para documentação detalhada para cada passo.

No modelo de compartilhamento Databricks-to-Databricks Delta:

  1. Um destinatário de dados fornece a um provedor de dados o identificador de compartilhamento exclusivo para o metastore Databricks Unity Catalog que está anexado ao workspace Databricks que o destinatário (que representa um usuário ou grupo de usuários) usará para acessar os dados que o provedor de dados está compartilhando.

    Para obter detalhes, consulte o passo 1: Solicitar o identificador de compartilhamento do destinatário.

  2. O provedor de dados cria um compartilhamento no metastore do Unity Catalog do provedor. Este objeto nomeado contém uma coleção de tabelas, view, volumes e Notebook registrados no metastore.

    Para obter detalhes, consulte Criar e gerenciar compartilhamentos para Delta Sharing.

  3. O provedor de dados cria um objeto de destinatário no metastore do Unity Catalog do provedor. Esse objeto nomeado representa o usuário ou grupo de usuários que acessará os dados incluídos no compartilhamento, juntamente com o identificador de compartilhamento do metastore do Unity Catalog que está anexado ao workspace que o usuário ou grupo de usuários usará para acessar o compartilhamento. O identificador de compartilhamento é o identificador key que permite a conexão segura.

    Para obter detalhes, consulte o passo 2: Criar o destinatário.

  4. O provedor de dados concede ao destinatário acesso ao compartilhamento.

    Para obter detalhes, consulte Conceder e gerenciar acesso a compartilhamentos de dados de compartilhamento Delta (para provedores).

  5. O compartilhamento fica disponível no workspace do Databricks do destinatário e os usuários podem acessá-lo usando o Catalog Explorer, a CLI do Databricks ou comandos SQL em um Notebook do Databricks ou no editor query Databricks SQL .

    Para acessar as tabelas, view, volumes e Notebook em um compartilhamento, um administrador do metastore ou usuário privilegiado deve criar um catálogo a partir do compartilhamento. Então, esse usuário ou outro usuário ao qual foi concedido o privilégio apropriado poderá conceder a outros usuários acesso ao catálogo e aos objetos no catálogo. A concessão de permissões em catálogos compartilhados e ativos de dados funciona da mesma forma que qualquer outro ativo registrado no Unity Catalog, com a importante distinção de que os usuários só podem receber acesso de leitura em objetos em catálogos criados a partir de compartilhamentos Delta Sharing.

    Notebook compartilhado ao vivo no nível do catálogo e qualquer usuário com o privilégio USE CATALOG no catálogo pode acessá-los.

    Para obter detalhes, consulte Ler dados compartilhados usando o compartilhamento Delta do Databricks-to-Databricks (para destinatários).