Automatizar a configuração do Unity Catalog usando o Terraform
O senhor pode automatizar a configuração do Unity Catalog usando o provedor Databricks Terraform. Este artigo fornece links para o guia de implementação do provedor Terraform Unity Catalog e para a documentação de referência do recurso, juntamente com os requisitos ("Before you begin") e dicas de validação e implementação.
Antes de começar
Para automatizar a configuração do Unity Catalog usando o Terraform, o senhor deve ter o seguinte:
Seu Databricks account deve estar no plano Premium.
Na nuvem do Google, o senhor deve ter a capacidade de criar buckets GCS e atribuir permissões aos buckets GCS que criar.
O senhor deve ter pelo menos um Databricks workspace que deseja usar com Unity Catalog. Consulte Criar um workspace usando o console account .
Para usar o provedor Databricks Terraform para configurar um metastore para o Unity Catalog, o armazenamento para o metastore, qualquer armazenamento externo e todas as credenciais de acesso relacionadas, o senhor deve ter o seguinte:
Uma nuvem do Google account.
Um projeto de nuvem do Google no site account.
Use o provedor Databricks Terraform 1.8.0 ou superior. Sempre use a versão mais recente do provedor.
A Databricks on Google Cloud account no projeto.
Uma conta do Google e um serviço do Google account com as permissões necessárias.
Em sua máquina de desenvolvimento local, você deve ter:
A CLI do Terraform. Consulte Download do Terraform no site do Terraform.
O SDK do Google Cloud, conectado por meio do comando gcloud auth application-default login -project=<project-id>, em que
<project-id>
é o ID do projeto de destino do Google Cloud. Para obter mais detalhes, consulte Instalação do SDK do Google Cloud e Autorização da CLI do gcloud no site do Google Cloud.
Para usar o provedor Databricks Terraform para configurar todos os outros componentes de infraestrutura do Unity Catalog, o senhor deve ter o seguinte:
Um workspace do Databricks.
Um Databricks pessoal access token, para permitir que o Terraform chame o Databricks APIs dentro do seu Databricks workspace. Consulte também Monitorar e revogar pessoal access tokens.
Em sua máquina de desenvolvimento local, você deve ter:
A CLI do Terraform. Consulte Download do Terraform no site do Terraform.
Um dos seguintes:
Databricks CLI versão 0.205 ou acima, configurado com seu Databricks pessoal access token executando
databricks configure --host <workspace-url> --profile <some-unique-profile-name>
. Consulte Instalar ou atualizar a Databricks CLI Databricks access token autenticação e pessoal.Os dois seguintes Databricks variável de ambiente:
DATABRICKS_HOST
, definido como o valor da URL da instância do workspace do Databricks, por exemplohttps://1234567890123456.7.gcp.databricks.com
DATABRICKS_TOKEN
, definido como o valor de seu Databricks pessoal access token. Consulte também Monitorar e revogar pessoal access tokens.
Para definir essas variáveis de ambiente, consulte a documentação do sistema operacional.
Observação
Como prática recomendada de segurança, ao se autenticar com ferramentas, sistemas, scripts e aplicativos automatizados, o site Databricks recomenda que o senhor use o access tokens pessoal pertencente à entidade de serviço em vez do workspace de usuários. Para criar tokens o site para uma entidade de serviço, consulte gerenciar tokens para uma entidade de serviço.
Terraform provedor Unity Catalog guia de implementação e documentação de referência de recurso
Para saber como implantar todos os pré-requisitos e habilitar Unity Catalog o para workspace um, consulte o recurso de pré-requisito implantado e a habilitação do Unity Catalog na Databricks Terraform documentação do provedor .
Se o senhor já tiver alguns componentes de infraestrutura do Unity Catalog, poderá usar o Terraform para implantar componentes adicionais de infraestrutura do Unity Catalog, conforme necessário. Consulte cada seção do guia mencionado no parágrafo anterior e a seção Unity Catalog da documentação do provedor Databricks Terraform.
Validar, planejar, implantar ou destruir o recurso
Para validar a sintaxe das configurações do Terraform sem implantá-las, execute o comando
terraform validate
.Para mostrar as ações que Terraform tomaria para implantar as configurações, execute o comando
terraform plan
. Esse comando não implanta as configurações de fato.Para implantar as configurações, execute o comando
terraform deploy
.Para excluir o recurso implantado, execute o comando
terraform destroy
.