Recomendações para trabalhar com DBFS root

Databricks usa o diretório DBFS root como um localdefault para algumas ações workspace . Databricks recomenda não armazenar quaisquer dados de produção ou informações confidenciais na DBFS root. Este artigo enfoca as recomendações para evitar a exposição acidental de dados confidenciais na DBFS root.

Observação

O Databricks configura um local de armazenamento privado separado para dados persistentes e configurações no armazenamento em cloud de propriedade do cliente, conhecido como DBFS interno. Este local não é exposto aos usuários.

Eduque os usuários para não armazenar dados na DBFS root

Como a DBFS root é acessível a todos os usuários em um workspace, todos os usuários podem acessar quaisquer dados armazenados aqui. É importante instruir os usuários a evitar o uso desse local para armazenar dados confidenciais. O local default para gerenciar tabelas no Hive metastore no Databricks é a DBFS root; para evitar que os usuários finais que criam tabelas gerenciadas gravem na DBFS root, declare um local no armazenamento externo ao criar bancos de dados no Hive metastore.

Use o log de auditoria para monitorar a atividade

Observação

Para obter detalhes sobre os eventos de auditoria do DBFS, consulte Eventos do DBFS.