Atualizar uma tabela de recursos do espaço de trabalho para o Unity Catalog

Esta página descreve como atualizar uma tabela de recursos workspace existente para o Unity Catalog.

Primeiro, você deve atualizar a tabela Delta workspace subjacente. Siga estas instruções: Atualize tabelas e view para o Catálogo do Unity.

Depois que a tabela e os dados subjacentes estiverem disponíveis no Unity Catalog, use upgrade_workspace_table para atualizar os metadados da tabela de recursos workspace para o Unity Catalog, conforme ilustrado no código a seguir. A Databricks recomenda sempre usar a versão mais recente do databricks-feature-engineering para essas operações, independentemente da versão do Databricks Runtime que você está usando.

%pip install databricks-feature-engineering --upgrade

dbutils.library.restartPython()

from databricks.feature_engineering import UpgradeClient
upgrade_client = UpgradeClient()
upgrade_client.upgrade_workspace_table(
  source_workspace_table='recommender_system.customer_features',
  target_uc_table='ml.recommender_system.customer_features'
)

Os seguintes metadados são atualizados para o Unity Catalog:

  • keyprimária

  • Colunas de série temporal

  • Comentários de tabelas e colunas (descrições)

  • tagsde tabela e coluna

  • Linhagem Notebook e Job

Se a tabela de destino tiver comentários de tabela ou coluna existentes diferentes da tabela de origem, o método de atualização ignora os comentários de atualização e logs um aviso. Se você estiver usando a versão 0.1.2 ou abaixo de databricks-feature-engineering, um erro é gerado e a atualização não é executada. Para todos os outros metadados, uma incompatibilidade entre a tabela de destino e a tabela de origem causa um erro e impede a atualização. Para ignorar o erro e substituir quaisquer metadados existentes na tabela de destino Unity Catalog , passe overwrite = True para a API:

upgrade_client.upgrade_workspace_table(
  source_workspace_table='recommender_system.customer_features',
  target_uc_table='ml.recommender_system.customer_features',
  overwrite=True
)

Observação

  • Antes de chamar essa API, você deve primeiro atualizar a tabela Delta workspace subjacente para o Unity Catalog.

  • A atualização de tags e colunas de série temporal não tem suporte no Databricks Runtime 13.2 ML e abaixo.

  • Lembre-se de notificar produtores e consumidores sobre a tabela de recursos atualizada para começar a usar o novo nome da tabela no Unity Catalog. Se a tabela de destino no Unity Catalog tiver sido atualizada usando CREATE TABLE AS SELECT ou uma forma semelhante que clonou a tabela de origem, as atualizações na tabela de origem não serão sincronizadas automaticamente na tabela de destino.