Configurar o acesso aos dados para ingestão

Este artigo descreve como os usuários administradores podem configurar o acesso aos dados em um bucket em Google Cloud Storage (GCS) para que os usuários de Databricks possam carregar dados de GCS em uma tabela em Databricks.

Este artigo descreve as seguintes maneiras de configurar o acesso seguro aos dados de origem:

  • (Recomendado) Crie um volume do Unity Catalog.

  • Crie um local externo do Unity Catalog com uma credencial de armazenamento.

Antes de começar

Antes de configurar o acesso aos dados no GCS, verifique se o senhor tem o seguinte:

  • Dados em um bucket GCS em seu serviço de nuvem do Google account.

  • Um Databricks SQL armazém. Para criar um SQL warehouse, consulte Criar um SQL warehouse.

  • Familiaridade com a interface de usuário do site Databricks SQL.

Configurar o acesso ao armazenamento em nuvem

Use um dos métodos a seguir para configurar o acesso ao GCS:

Limpe

O senhor pode limpar o recurso associado nos sites cloud account e Databricks se não quiser mais mantê-los.

Parar o SQL warehouse

Se o senhor não estiver usando o SQL warehouse para nenhuma outra tarefa, deverá interromper o SQL warehouse para evitar custos adicionais.

  1. Na seção SQL persona, na barra lateral, clique em SQL warehouse.

  2. Ao lado do nome do site SQL warehouse, clique em Stop (Parar).

  3. Quando solicitado, clique em Parar novamente.

Próximas etapas

Depois de concluir os passos deste artigo, os usuários podem executar o comando COPY INTO para carregar os dados do bucket GCS em seu site Databricks workspace.