Acesse os dados compartilhados com o senhor usando o Delta Sharing (para destinatários)
Este artigo mostra como acessar os dados que foram compartilhados com o senhor usando o site Delta Sharing.
Delta Sharing e destinatários de dados
Delta Sharing é um padrão aberto para o compartilhamento seguro de dados. Um usuário do Databricks, chamado de provedor de dados neste contexto, pode usar o Delta Sharing no Databricks para compartilhar dados com uma pessoa ou grupo fora de sua organização, chamado de destinatário de dados.
Databricks-to-Databricks compartilhamento e compartilhamento aberto
O modo como o usuário acessa os dados depende do fato de o usuário ser um usuário do site Databricks e de o provedor de dados ter ou não configurado os dados compartilhados com o usuário para Databricks-to-Databricks compartilhamento ou compartilhamento aberto.
No modelo Databricks-to-Databricks , o senhor deve ser um usuário em um Databricks workspace que esteja habilitado para Unity Catalog. Um membro da sua equipe fornece ao provedor de dados um identificador exclusivo para o metastore do Unity Catalog, e o provedor de dados o utiliza para criar uma conexão de compartilhamento segura. Os dados compartilhados ficam disponíveis para acesso em seu site workspace. Se necessário, um membro da sua equipe configura o controle de acesso granular a esses dados.
No modelo de compartilhamento aberto, o senhor pode usar qualquer ferramenta que desejar (inclusive o Databricks) para acessar os dados compartilhados. O provedor de dados envia ao senhor um URL de ativação por meio de um canal seguro. Siga-o para fazer o download de um arquivo de credencial que lhe permite acessar os dados compartilhados com o senhor.
Os dados compartilhados não são fornecidos diretamente pela Databricks, mas por provedores de dados executados na Databricks.
Observação
Databricks poderá coletar informações sobre o uso e o acesso dos destinatários dos dados aos dados compartilhados (incluindo a identificação de qualquer indivíduo ou empresa que acesse o arquivo de credenciais em conexão com tais informações) e poderá compartilhá-las com o provedor de dados aplicável.
Obter acesso aos dados compartilhados com o senhor
O modo como o senhor acessa os dados depende do fato de o provedor de dados ter compartilhado os dados com o senhor usando o protocolo de compartilhamento aberto ou o protocolo de compartilhamento Databricks-to-Databricks. Consulte Databricks-to-Databricks compartilhamento e open compartilhamento.
Obter acesso no modelo Databricks-to-Databricks
No modelo Databricks-to-Databricks:
O provedor de dados envia ao senhor instruções para encontrar um identificador exclusivo para o Unity Catalog metastore associado ao seu Databricks workspace, e o senhor o envia a ele.
O identificador do compartilhamento é uma cadeia de caracteres que consiste em cloud, região e UUID (o identificador exclusivo do metastore), no formato
<cloud>:<region>:<uuid>
. Por exemplo,aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef
.Para obter o identificador de compartilhamento usando o Catalog Explorer:
No seu workspace do Databricks, clique em Catálogo.
Na parte superior do painel Catálogo, clique no ícone de engrenagem e selecione Delta Sharing.
Como alternativa, na página de acesso rápido, clique no botão Delta Sharing >.
No Shared with me tab, clique no nome da sua organização de compartilhamento Databricks no canto superior direito e selecione Copy compartilhamento identifier (Copiar identificador de compartilhamento).
Para obter o identificador de compartilhamento usando uma consulta do Notebook ou Databricks SQL, use a função default SQL
CURRENT_METASTORE
. Se usar um Notebook, ele deverá ser executado em um clustercompartilhado ou de usuário único no workspace que o senhor usará para acessar os dados compartilhados.SELECT CURRENT_METASTORE();
O provedor de dados cria:
Um destinatário no site Databricks account para representar o senhor e os usuários da sua organização que acessarão os dados.
Um compartilhamento, que é uma representação das tabelas, volumes e visualizações a serem compartilhados com o senhor.
O senhor acessa os dados compartilhados com o senhor. O senhor ou alguém da sua equipe pode, se necessário, configurar o acesso granular a esses dados para os seus usuários. Consulte Ler dados compartilhados usando Databricks-to-Databricks Delta Sharing (para destinatários).
Obtenha acesso no modelo de compartilhamento aberto
No modelo de compartilhamento aberto:
O provedor de dados cria:
Um destinatário em Databricks account para representar o senhor e os usuários da sua organização que acessarão os dados. Um arquivo de tokens e credenciais é gerado como parte dessa configuração.
Um compartilhamento, que é uma representação das tabelas e partições a serem compartilhadas com o senhor.
O provedor de dados envia ao senhor um URL de ativação por meio de um canal seguro. Siga-o para fazer o download de um arquivo de credencial que lhe permite acessar os dados compartilhados com o senhor.
Importante
Não compartilhe o link de ativação com ninguém. O senhor pode fazer o download de um arquivo de credencial apenas uma vez. Se o senhor acessar o link de ativação novamente depois que o arquivo de credencial já tiver sido baixado, o botão de download do arquivo de credencial será desativado.
Se o senhor perder o link de ativação antes de usá-lo, entre em contato com o provedor de dados.
Armazene o arquivo de credenciais em um local seguro.
Não compartilhe o arquivo de credenciais com ninguém fora do grupo de usuários que deve ter acesso aos dados compartilhados. Se o senhor precisar compartilhá-la com alguém da sua organização, a Databricks recomenda o uso de um gerenciador de senhas.
Ler os dados compartilhados
A forma como o senhor lê os dados que foram compartilhados com segurança usando o Delta Sharing depende de ter recebido um arquivo de credencial (o modelo de compartilhamento aberto) ou de estar usando um Databricks workspace e de ter fornecido ao provedor de dados seu identificador de compartilhamento (o modelo Databricks-to-Databricks ).
Ler o arquivo de uso compartilhado de dados a credenciais (abrir compartilhamento)
Se os dados foram compartilhados com o senhor usando o protocolo de compartilhamento aberto Delta Sharing, o senhor usa o arquivo de credencial que baixou para se autenticar no site Databricks account do provedor de dados e ler os dados compartilhados. O acesso persiste enquanto os tokens subjacentes forem válidos e o provedor continuar a compartilhar os dados. Os provedores gerenciam a expiração e a rotação de tokens. As atualizações dos dados estão disponíveis para o senhor quase em tempo real. O senhor pode ler e fazer cópias dos dados compartilhados, mas não pode modificar os dados de origem.
Para saber como acessar e ler o uso compartilhado de dados do arquivo de credenciais em Databricks, Apache Spark, Pandas e Power BI, consulte Ler dados compartilhados usando o compartilhamento aberto Delta Sharing (para destinatários).
Leia o uso compartilhado de dados Databricks-to-Databricks compartilhamento
Se os dados tiverem sido compartilhados com o senhor usando o modelo Databricks-to-Databricks, não será necessário nenhum arquivo de credencial para acessar os dados compartilhados. Databricks cuida da conexão segura, e os dados compartilhados podem ser descobertos automaticamente em seu site Databricks workspace.
Para saber como encontrar, ler e gerenciar esses dados compartilhados em seu Databricks workspace, consulte Ler dados compartilhados usando Databricks-to-Databricks Delta Sharing (para destinatários).
Auditar o uso de dados compartilhados
Se o senhor tiver acesso a um Databricks workspace, poderá usar o Databricks audit logs para saber quem na sua organização está acessando qual uso de dados Delta Sharing. Consulte Auditar e monitorar o compartilhamento de dados.