Acesse os dados compartilhados com o senhor usando o Delta Sharing (para destinatários)
Este artigo mostra como acessar os dados que foram compartilhados com o senhor usando o site Delta Sharing.
Delta Sharing e destinatários de dados
Delta Sharing é um padrão aberto para o compartilhamento seguro de dados. Um usuário do Databricks, chamado de provedor de dados, pode usar o Delta Sharing para compartilhar dados com uma pessoa ou grupo fora de sua organização, chamado de destinatário de dados.
Databricks-to-Databricks compartilhamento e compartilhamento aberto
O modo como o usuário acessa os dados depende do fato de o usuário ser um usuário do site Databricks e de o provedor de dados ter ou não configurado os dados compartilhados com o usuário para Databricks-to-Databricks compartilhamento ou compartilhamento aberto.
No modelo Databricks-to-Databricks , o senhor deve ser um usuário em um Databricks workspace que esteja habilitado para Unity Catalog. Um membro da sua equipe fornece ao provedor de dados um identificador exclusivo para o metastore do Unity Catalog, e o provedor de dados o utiliza para criar uma conexão de compartilhamento segura. Os dados compartilhados ficam disponíveis para acesso em seu site workspace. Se necessário, um membro da sua equipe configura o controle de acesso granular a esses dados.
No modelo de compartilhamento aberto, o senhor pode usar qualquer ferramenta que desejar (inclusive o Databricks) para acessar os dados compartilhados. O provedor de dados envia ao senhor um URL de ativação por meio de um canal seguro. Siga-o para fazer o download de um arquivo de credencial que lhe permite acessar os dados compartilhados com o senhor.
Termos de uso
Os dados compartilhados não são fornecidos diretamente pela Databricks, mas por provedores de dados executados na Databricks.
Observação
Ao acessar os dados compartilhados de um provedor de dados como um destinatário de dados, o destinatário de dados declara que foi autorizado a acessar o(s) compartilhamento(s) de dados fornecido(s) pelo provedor de dados e reconhece que (1) o Databricks não tem nenhuma responsabilidade por tais dados ou pelo uso de tais dados compartilhados pelo destinatário de dados, e (2) o Databricks poderá coletar informações sobre o uso e o acesso do destinatário dos dados aos dados compartilhados (incluindo a identificação de qualquer indivíduo ou empresa que acesse o arquivo de credenciais em conexão com tais informações) e poderá compartilhá-las com o provedor de dados aplicável.
Obter acesso aos dados compartilhados com o senhor
O modo como o senhor acessa os dados depende do fato de o provedor de dados ter compartilhado os dados com o senhor usando o protocolo de compartilhamento aberto ou o protocolo de compartilhamento Databricks-to-Databricks. Consulte Databricks-to-Databricks compartilhamento e open compartilhamento.
Obter acesso no modelo Databricks-to-Databricks
No modelo Databricks-to-Databricks:
O provedor de dados envia ao senhor instruções para encontrar um identificador exclusivo para o Unity Catalog metastore associado ao seu Databricks workspace, e o senhor o envia a ele.
O identificador do compartilhamento é uma cadeia de caracteres que consiste em cloud, região e UUID (o identificador exclusivo do metastore), no formato
<cloud>:<region>:<uuid>
. Por exemplo,aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef
.Para obter o identificador de compartilhamento usando o Catalog Explorer:
No seu workspace do Databricks, clique em Catálogo.
Na parte superior do painel Catálogo, clique no ícone de engrenagem e selecione Delta Sharing.
Como alternativa, na página de acesso rápido, clique no botão Delta Sharing >.
No Shared with me tab, clique no nome da sua organização de compartilhamento Databricks no canto superior direito e selecione Copy compartilhamento identifier (Copiar identificador de compartilhamento).
Para obter o identificador de compartilhamento usando uma consulta do Notebook ou Databricks SQL, use a função default SQL
CURRENT_METASTORE
. Se usar um Notebook, ele deverá ser executado em um clustercompartilhado ou de usuário único no workspace que o senhor usará para acessar os dados compartilhados.SELECT CURRENT_METASTORE();
O provedor de dados cria:
Um destinatário no site Databricks account para representar o senhor e os usuários da sua organização que acessarão os dados.
Um compartilhamento, que é uma representação das tabelas, volumes e visualizações a serem compartilhados com o senhor.
O senhor acessa os dados compartilhados com o senhor. O senhor ou alguém da sua equipe pode, se necessário, configurar o acesso granular a esses dados para os seus usuários. Consulte Ler dados compartilhados usando Databricks-to-Databricks Delta Sharing (para destinatários).
Obtenha acesso no modelo de compartilhamento aberto
No modelo de compartilhamento aberto:
O provedor de dados cria:
Um destinatário em Databricks account para representar o senhor e os usuários da sua organização que acessarão os dados. Um arquivo de tokens e credenciais é gerado como parte dessa configuração.
Um compartilhamento, que é uma representação das tabelas e partições a serem compartilhadas com o senhor.
O provedor de dados envia ao senhor um URL de ativação por meio de um canal seguro. Siga-o para fazer o download de um arquivo de credencial que lhe permite acessar os dados compartilhados com o senhor.
Importante
Não compartilhe o link de ativação com ninguém. O senhor pode fazer o download de um arquivo de credencial apenas uma vez. Se o senhor acessar o link de ativação novamente depois que o arquivo de credencial já tiver sido baixado, o botão de download do arquivo de credencial será desativado.
Se o senhor perder o link de ativação antes de usá-lo, entre em contato com o provedor de dados.
Armazene o arquivo de credenciais em um local seguro.
Não compartilhe o arquivo de credenciais com ninguém fora do grupo de usuários que deve ter acesso aos dados compartilhados. Se o senhor precisar compartilhá-la com alguém da sua organização, a Databricks recomenda o uso de um gerenciador de senhas.
Ler os dados compartilhados
A forma como o senhor lê os dados que foram compartilhados com segurança usando o Delta Sharing depende de ter recebido um arquivo de credencial (o modelo de compartilhamento aberto) ou de estar usando um Databricks workspace e de ter fornecido ao provedor de dados seu identificador de compartilhamento (o modelo Databricks-to-Databricks ).
Ler o arquivo de uso compartilhado de dados a credenciais (abrir compartilhamento)
Se os dados foram compartilhados com o senhor usando o protocolo de compartilhamento aberto Delta Sharing, o senhor usa o arquivo de credencial que baixou para se autenticar no site Databricks account do provedor de dados e ler os dados compartilhados. O acesso persiste enquanto os tokens subjacentes forem válidos e o provedor continuar a compartilhar os dados. Os provedores gerenciam a expiração e a rotação de tokens. As atualizações dos dados estão disponíveis para o senhor quase em tempo real. O senhor pode ler e fazer cópias dos dados compartilhados, mas não pode modificar os dados de origem.
Para saber como acessar e ler o uso compartilhado de dados do arquivo de credenciais em Databricks, Apache Spark, Pandas e Power BI, consulte Ler dados compartilhados usando o compartilhamento aberto Delta Sharing (para destinatários).
Leia o uso compartilhado de dados Databricks-to-Databricks compartilhamento
Se os dados tiverem sido compartilhados com o senhor usando o modelo Databricks-to-Databricks, não será necessário nenhum arquivo de credencial para acessar os dados compartilhados. Databricks cuida da conexão segura, e os dados compartilhados podem ser descobertos automaticamente em seu site Databricks workspace.
Para saber como encontrar, ler e gerenciar esses dados compartilhados em seu Databricks workspace, consulte Ler dados compartilhados usando Databricks-to-Databricks Delta Sharing (para destinatários).
Auditar o uso de dados compartilhados
Se o senhor tiver acesso a um Databricks workspace, poderá usar o Databricks audit logs para saber quem na sua organização está acessando qual uso de dados Delta Sharing. Consulte Auditar e monitorar o compartilhamento de dados.