Configurar acesso a dados para ingestão

Este artigo descreve como os usuários administradores podem configurar o acesso aos dados em um bucket no Google Cloud Storage (GCS) para que os usuários do Databricks possam carregar dados do GCS em uma tabela no Databricks.

Este artigo descreve as seguintes maneiras de configurar o acesso seguro aos dados de origem:

  • (Recomendado) Crie um volume do Unity Catalog.

  • Crie um local externo do Unity Catalog com uma credencial de armazenamento.

Antes de começar

Antes de configurar o acesso aos dados no GCS, verifique se você tem o seguinte:

  • Dados em um intervalo do GCS na clouds sua do serviço do Google account.

  • Um Databricks SQL armazém. Para criar um SQL warehouse, consulte Criar um SQL warehouse.

  • Familiaridade com a interface de usuário Databricks SQL .

Configurar o acesso ao armazenamento clouds

Use um dos seguintes métodos para configurar o acesso ao GCS:

Limpar

Você pode limpar os recursos associados em sua account cloud e Databricks se não quiser mais mantê-los.

Parar o SQL warehouse

Se você não estiver usando o SQL warehouse para nenhuma outra tarefa, interrompa o SQL warehouse para evitar custos adicionais.

  1. Na persona SQL , na barra lateral, clique em SQL warehouse.

  2. Ao lado do nome do SQL warehouse, clique em Parar.

  3. Quando solicitado, clique em Parar novamente.

Próximos passos

Depois de concluir as etapas deste artigo, os usuários poderão executar o comando COPY INTO para carregar os dados do bucket do GCS em seu workspace do Databricks.