Configurar acesso a dados para ingestão
Este artigo descreve como os usuários administradores podem configurar o acesso aos dados em um bucket no Google Cloud Storage (GCS) para que os usuários do Databricks possam carregar dados do GCS em uma tabela no Databricks.
Este artigo descreve as seguintes maneiras de configurar o acesso seguro aos dados de origem:
(Recomendado) Crie um volume do Unity Catalog.
Crie um local externo do Unity Catalog com uma credencial de armazenamento.
Antes de começar
Antes de configurar o acesso aos dados no GCS, verifique se você tem o seguinte:
Dados em um intervalo do GCS na clouds sua do serviço do Google account.
Para acessar o uso de dados em um volume do Unity Catalog (recomendado), o privilégio
READ VOLUME
no volume. Para obter mais informações, consulte Criar e trabalhar com volumes e privilégios e objetos protegíveis do Catálogo do Unity.Para acessar o uso de dados em um local externo do Unity Catalog, o privilégio
READ FILES
no local externo. Para obter mais informações, consulte Criar um local externo para conectar o armazenamento em nuvem à Databricks.
Um Databricks SQL armazém. Para criar um SQL warehouse, consulte Criar um SQL warehouse.
Familiaridade com a interface de usuário Databricks SQL .
Configurar o acesso ao armazenamento clouds
Use um dos seguintes métodos para configurar o acesso ao GCS:
(Recomendado) Crie um volume Unity Catalog . Para obter mais informações, consulte Criar e trabalhar com volumes.
Configure um local externo do Unity Catalog com uma credencial de armazenamento. Para obter mais informações sobre locais externos, consulte Criar um local externo para conectar o armazenamento em nuvem à Databricks.
Limpar
Você pode limpar os recursos associados em sua account cloud e Databricks se não quiser mais mantê-los.
Parar o SQL warehouse
Se você não estiver usando o SQL warehouse para nenhuma outra tarefa, interrompa o SQL warehouse para evitar custos adicionais.
Na persona SQL , na barra lateral, clique em SQL warehouse.
Ao lado do nome do SQL warehouse, clique em Parar.
Quando solicitado, clique em Parar novamente.
Próximos passos
Depois de concluir as etapas deste artigo, os usuários poderão executar o comando COPY INTO
para carregar os dados do bucket do GCS em seu workspace do Databricks.
Para carregar o uso de dados em um volume ou local externo do Catálogo do Unity, consulte Carregar uso de dados COPY INTO com volumes ou locais externos do Catálogo do Unity.