Configurar o acesso aos dados para ingestão
Este artigo descreve como os usuários administradores podem configurar o acesso aos dados em um bucket em Google Cloud Storage (GCS) para que os usuários de Databricks possam carregar dados de GCS em uma tabela em Databricks.
Este artigo descreve as seguintes maneiras de configurar o acesso seguro aos dados de origem:
(Recomendado) Crie um volume do Unity Catalog.
Crie um local externo do Unity Catalog com uma credencial de armazenamento.
Antes de começar
Antes de configurar o acesso aos dados no GCS, verifique se o senhor tem o seguinte:
Dados em um bucket GCS em seu serviço de nuvem do Google account.
Para acessar o uso de dados a Unity Catalog volume (recomendado), o privilégio
READ VOLUME
no volume. Para obter mais informações, consulte O que são volumes Unity Catalog? e Unity Catalog privileges and securable objects.Para acessar o uso de dados em Unity Catalog local externo, o privilégio
READ FILES
no local externo. Para obter mais informações, consulte Criar um local externo para conectar o armazenamento cloud a Databricks.
Um Databricks SQL armazém. Para criar um SQL warehouse, consulte Criar um SQL warehouse.
Familiaridade com a interface de usuário do site Databricks SQL.
Configurar o acesso ao armazenamento em nuvem
Use um dos métodos a seguir para configurar o acesso ao GCS:
(Recomendado) Crie um volume do Unity Catalog. Para obter mais informações, consulte O que são volumes Unity Catalog?
Configure um local externo do Unity Catalog com uma credencial de armazenamento. Para obter mais informações sobre locais externos, consulte Criar um local externo para conectar o armazenamento cloud a Databricks.
Limpe
O senhor pode limpar o recurso associado nos sites cloud account e Databricks se não quiser mais mantê-los.
Parar o SQL warehouse
Se o senhor não estiver usando o SQL warehouse para nenhuma outra tarefa, deverá interromper o SQL warehouse para evitar custos adicionais.
Na seção SQL persona, na barra lateral, clique em SQL warehouse.
Ao lado do nome do site SQL warehouse, clique em Stop (Parar).
Quando solicitado, clique em Parar novamente.
Próximas etapas
Depois de concluir os passos deste artigo, os usuários podem executar o comando COPY INTO
para carregar os dados do bucket GCS em seu site Databricks workspace.
Para carregar o uso de dados em um volume Unity Catalog ou em um local externo, consulte Carregar uso de dados COPY INTO com volumes Unity Catalog ou locais externos.