governança de dados com o Unity Catalog

Este guia mostra como gerenciar dados e acesso a objetos de IA no Databricks. Para obter informações sobre a segurança do Databricks, consulte o guia Security and compliance . A Databricks fornece governança centralizada para dados e IA com o Unity Catalog e o Delta Sharing.

Centralize o controle de acesso usando o Unity Catalog

O Unity Catalog é uma solução de governança refinada para dados e IA na plataforma Databricks. Ajuda a simplificar a segurança e a governança dos seus dados e da IA ativa, fornecendo um local central para administrar e auditar o acesso aos dados e à IA ativa.

Na maioria das contas, o Unity Catalog é ativado por default quando o senhor cria um workspace. Para obter detalhes, consulte Ativação automática do Unity Catalog.

Para uma discussão sobre como usar o Unity Catalog de forma eficaz, consulte as práticas recomendadas do Unity Catalog.

Rastreie a linhagem de dados usando o Unity Catalog

O senhor pode usar o Unity Catalog para capturar a linhagem de dados em tempo de execução em consultas em qualquer idioma executadas em clusters do Databricks ou em SQL warehouse. A linhagem é capturada até o nível da coluna e inclui Notebook, fluxo de trabalho e dashboards relacionados à consulta. Para saber mais, consulte Captura e view linhagem de dados usando o Unity Catalog.

Descubra o uso de dados Catalog Explorer

O Databricks Catalog Explorer fornece uma UI para explorar e gerenciar dados e IA ativa, incluindo esquemas (bancos de dados), tabelas, volumes (dados não tabulares) e modelos de ML registrados, juntamente com permissões ativas, proprietários de dados, locais externos e credenciais. Você pode usar a percepções tab no Catalog Explorer para as view consultas e usuários recentes mais frequentes de qualquer tabela cadastrada no Unity Catalog.

Compartilhar uso de dados Delta compartilhamento

Delta Sharing é um protocolo aberto desenvolvido pela Databricks para compartilhamento seguro de dados e IA ativa com outras organizações, ou com outras equipes dentro de sua organização, independentemente de quais plataformas de computação elas usam.

Configurar o log de auditoria

O Databricks fornece acesso a logs de auditoria de atividades realizadas por usuários do Databricks, permitindo que sua empresa monitore padrões detalhados de uso do Databricks.

O Unity Catalog permite que você acesse e query facilmente os dados operacionais da sua account , incluindo logs de auditoria, uso faturável e linhagem usando tabelas do sistema (Visualização pública).

Configurar identidade

Toda boa história de governança de dados começa com uma base sólida de identidade. Para saber como configurar melhor a identidade no Databricks, consulte Melhores práticas de identidade.

Soluções legadas de governança de dados

A Databricks também fornece esses modelos de governança herdados:

  • O controle de acesso da tabela é um modelo legado de governança de dados que permite conceder e revogar programaticamente o acesso a objetos gerenciados pelo Hive metastore integrado do seu espaço de trabalho. A Databricks recomenda que você use o Unity Catalog em vez do controle de acesso da tabela. O Unity Catalog simplifica a segurança e a governança dos seus dados, fornecendo um local central para administrar e auditar o acesso aos dados em vários workspace da sua account.