governança de dados com o Unity Catalog
Este guia mostra como gerenciar dados e acesso a objetos de IA no Databricks. Para obter informações sobre a segurança do Databricks, consulte o guia Security and compliance . A Databricks fornece governança centralizada para dados e IA com o Unity Catalog e o Delta Sharing.
Centralize o controle de acesso usando o Unity Catalog
O Unity Catalog é uma solução de governança refinada para dados e IA na plataforma Databricks. Ajuda a simplificar a segurança e a governança dos seus dados e da IA ativa, fornecendo um local central para administrar e auditar o acesso aos dados e à IA ativa.
Na maioria das contas, o Unity Catalog é ativado por default quando o senhor cria um workspace. Para obter detalhes, consulte Ativação automática do Unity Catalog.
Para uma discussão sobre como usar o Unity Catalog de forma eficaz, consulte as práticas recomendadas do Unity Catalog.
Rastreie a linhagem de dados usando o Unity Catalog
O senhor pode usar o site Unity Catalog para capturar a linhagem de dados em tempo de execução em consultas em qualquer idioma executadas em um Databricks cluster ou SQL warehouse. A linhagem é capturada até o nível da coluna e inclui Notebook, Job e dashboards relacionados à consulta. Para saber mais, consulte Capture e view linhagem de dados usando Unity Catalog.
Descubra o uso de dados Catalog Explorer
O Databricks Catalog Explorer fornece uma UI para explorar e gerenciar dados e IA ativa, incluindo esquemas (bancos de dados), tabelas, volumes (dados não tabulares) e modelos de ML registrados, juntamente com permissões ativas, proprietários de dados, locais externos e credenciais. Você pode usar a percepções tab no Catalog Explorer para as view consultas e usuários recentes mais frequentes de qualquer tabela cadastrada no Unity Catalog.
Configurar o log de auditoria
A Databricks fornece acesso aos registros de auditoria das atividades realizadas pelos usuários da Databricks, permitindo que sua empresa monitore os padrões detalhados de uso da Databricks.
Unity Catalog permite que o senhor acesse e consulte facilmente os dados operacionais do seu account, incluindo auditoria logs, uso faturável e linhagem usando tabelas do sistema (Public Preview).
Configurar identidade
Toda boa história de governança de dados começa com uma forte base de identidade. Para saber como configurar melhor a identidade no Databricks, consulte Práticas recomendadas de identidade.
Soluções legadas de governança de dados
A Databricks também fornece esses modelos de governança herdados:
O controle de acesso da tabela é um modelo legado de governança de dados que permite conceder e revogar programaticamente o acesso a objetos gerenciados pelo Hive metastore integrado do seu espaço de trabalho. A Databricks recomenda que você use o Unity Catalog em vez do controle de acesso da tabela. O Unity Catalog simplifica a segurança e a governança dos seus dados, fornecendo um local central para administrar e auditar o acesso aos dados em vários workspace da sua account.