Acesse os dados compartilhados com o senhor usando o Delta Sharing (para destinatários)

Este artigo mostra como acessar os dados que foram compartilhados com o senhor usando o site Delta Sharing.

Delta Sharing e destinatários de dados

Delta Sharing é um padrão aberto para o compartilhamento seguro de dados. Um usuário do Databricks, chamado de provedor de dados neste contexto, pode usar o Delta Sharing no Databricks para compartilhar dados com uma pessoa ou grupo fora de sua organização, chamado de destinatário de dados.

Databricks-to-Databricks compartilhamento e compartilhamento aberto

O modo como o usuário acessa os dados depende do fato de o usuário ser um usuário do site Databricks e de o provedor de dados ter ou não configurado os dados compartilhados com o usuário para Databricks-to-Databricks compartilhamento ou compartilhamento aberto.

No modelo Databricks-to-Databricks , o senhor deve ser um usuário em um Databricks workspace que esteja habilitado para Unity Catalog. Um membro da sua equipe fornece ao provedor de dados um identificador exclusivo para o metastore do Unity Catalog, e o provedor de dados o utiliza para criar uma conexão de compartilhamento segura. Os dados compartilhados ficam disponíveis para acesso em seu site workspace. Se necessário, um membro da sua equipe configura o controle de acesso granular a esses dados.

No modelo de compartilhamento aberto, o senhor pode usar qualquer ferramenta que desejar (inclusive o Databricks) para acessar os dados compartilhados. O provedor de dados envia ao senhor um URL de ativação por meio de um canal seguro. Siga-o para fazer o download de um arquivo de credencial que lhe permite acessar os dados compartilhados com o senhor.

Os dados compartilhados não são fornecidos diretamente pela Databricks, mas por provedores de dados executados na Databricks.

Observação

Databricks poderá coletar informações sobre o uso e o acesso dos destinatários dos dados aos dados compartilhados (incluindo a identificação de qualquer indivíduo ou empresa que acesse o arquivo de credenciais em conexão com tais informações) e poderá compartilhá-las com o provedor de dados aplicável.

Obter acesso aos dados compartilhados com o senhor

O modo como o senhor acessa os dados depende do fato de o provedor de dados ter compartilhado os dados com o senhor usando o protocolo de compartilhamento aberto ou o protocolo de compartilhamento Databricks-to-Databricks. Consulte Databricks-to-Databricks compartilhamento e open compartilhamento.

Obter acesso no modelo Databricks-to-Databricks

No modelo Databricks-to-Databricks:

  1. O provedor de dados envia ao senhor instruções para encontrar um identificador exclusivo para o Unity Catalog metastore associado ao seu Databricks workspace, e o senhor o envia a ele.

    O identificador do compartilhamento é uma cadeia de caracteres que consiste em cloud, região e UUID (o identificador exclusivo do metastore), no formato <cloud>:<region>:<uuid>. Por exemplo, aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.

    Para obter o identificador de compartilhamento usando o Catalog Explorer:

    1. No seu workspace do Databricks, clique em Ícone de catálogo Catálogo.

    2. Na parte superior do painel Catálogo, clique no ícone de engrenagem ícone de engrenagem e selecione Delta Sharing.

      Como alternativa, na página de acesso rápido, clique no botão Delta Sharing >.

      1. No Shared with me tab, clique no nome da sua organização de compartilhamento Databricks no canto superior direito e selecione Copy compartilhamento identifier (Copiar identificador de compartilhamento).

    Para obter o identificador de compartilhamento usando uma consulta do Notebook ou Databricks SQL, use a função default SQL CURRENT_METASTORE. Se usar um Notebook, ele deverá ser executado em um clustercompartilhado ou de usuário único no workspace que o senhor usará para acessar os dados compartilhados.

    SELECT CURRENT_METASTORE();
    
  2. O provedor de dados cria:

    • Um destinatário no site Databricks account para representar o senhor e os usuários da sua organização que acessarão os dados.

    • Um compartilhamento, que é uma representação das tabelas, volumes e visualizações a serem compartilhados com o senhor.

  3. O senhor acessa os dados compartilhados com o senhor. O senhor ou alguém da sua equipe pode, se necessário, configurar o acesso granular a esses dados para os seus usuários. Consulte Ler dados compartilhados usando Databricks-to-Databricks Delta Sharing (para destinatários).

Obtenha acesso no modelo de compartilhamento aberto

No modelo de compartilhamento aberto:

  1. O provedor de dados cria:

    • Um destinatário em Databricks account para representar o senhor e os usuários da sua organização que acessarão os dados. Um arquivo de tokens e credenciais é gerado como parte dessa configuração.

    • Um compartilhamento, que é uma representação das tabelas e partições a serem compartilhadas com o senhor.

  2. O provedor de dados envia ao senhor um URL de ativação por meio de um canal seguro. Siga-o para fazer o download de um arquivo de credencial que lhe permite acessar os dados compartilhados com o senhor.

    Importante

    Não compartilhe o link de ativação com ninguém. O senhor pode fazer o download de um arquivo de credencial apenas uma vez. Se o senhor acessar o link de ativação novamente depois que o arquivo de credencial já tiver sido baixado, o botão de download do arquivo de credencial será desativado.

    Se o senhor perder o link de ativação antes de usá-lo, entre em contato com o provedor de dados.

  3. Armazene o arquivo de credenciais em um local seguro.

    Não compartilhe o arquivo de credenciais com ninguém fora do grupo de usuários que deve ter acesso aos dados compartilhados. Se o senhor precisar compartilhá-la com alguém da sua organização, a Databricks recomenda o uso de um gerenciador de senhas.

Ler os dados compartilhados

A forma como o senhor lê os dados que foram compartilhados com segurança usando o Delta Sharing depende de ter recebido um arquivo de credencial (o modelo de compartilhamento aberto) ou de estar usando um Databricks workspace e de ter fornecido ao provedor de dados seu identificador de compartilhamento (o modelo Databricks-to-Databricks ).

Ler o arquivo de uso compartilhado de dados a credenciais (abrir compartilhamento)

Se os dados foram compartilhados com o senhor usando o protocolo de compartilhamento aberto Delta Sharing, o senhor usa o arquivo de credencial que baixou para se autenticar no site Databricks account do provedor de dados e ler os dados compartilhados. O acesso persiste enquanto os tokens subjacentes forem válidos e o provedor continuar a compartilhar os dados. Os provedores gerenciam a expiração e a rotação de tokens. As atualizações dos dados estão disponíveis para o senhor quase em tempo real. O senhor pode ler e fazer cópias dos dados compartilhados, mas não pode modificar os dados de origem.

Para saber como acessar e ler o uso compartilhado de dados do arquivo de credenciais em Databricks, Apache Spark, Pandas e Power BI, consulte Ler dados compartilhados usando o compartilhamento aberto Delta Sharing (para destinatários).

Leia o uso compartilhado de dados Databricks-to-Databricks compartilhamento

Se os dados tiverem sido compartilhados com o senhor usando o modelo Databricks-to-Databricks, não será necessário nenhum arquivo de credencial para acessar os dados compartilhados. Databricks cuida da conexão segura, e os dados compartilhados podem ser descobertos automaticamente em seu site Databricks workspace.

Para saber como encontrar, ler e gerenciar esses dados compartilhados em seu Databricks workspace, consulte Ler dados compartilhados usando Databricks-to-Databricks Delta Sharing (para destinatários).

Auditar o uso de dados compartilhados

Se o senhor tiver acesso a um Databricks workspace, poderá usar o Databricks audit logs para saber quem na sua organização está acessando qual uso de dados Delta Sharing. Consulte Auditar e monitorar o compartilhamento de dados.