Integração DBeaver com Databricks

Observação

Este artigo abrange o DBeaver, que não é fornecido nem suportado pelo Databricks. Para entrar em contato com o provedor, consulte a página Problemas do repositório dbeaver/dbeaver no GitHub.

DBeaver é uma ferramenta de banco de dados multiplataforma local para desenvolvedores, administradores de banco de dados, analista de dados, engenheiro de dados e outros que precisam trabalhar com bancos de dados. O DBeaver suporta Databricks, bem como outros bancos de dados populares.

Este artigo descreve como usar sua máquina de desenvolvimento local para instalar, configurar e usar o código aberto DBeaver comunidade Edition (CE) gratuito para trabalhar com bancos de dados no Databricks.

Observação

Este artigo foi testado com macOS, Databricks JDBC Driver versão 2.6.36 e DBeaver CE versão 23.3.0.

Requisitos

Antes de instalar o DBeaver, sua máquina de desenvolvimento local deve atender aos seguintes requisitos:

  • Um sistema operacional Linux de 64 bits, macOS ou Windows de 64 bits. (Linux de 32 bits é compatível, mas não recomendado.)

  • O Databricks JDBC Driver em sua máquina de desenvolvimento local, extraindo o arquivo DatabricksJDBC42.jar do arquivo downloads DatabricksJDBC42-<version>.zip.

O senhor também deve ter um Databricks clusters ou SQL warehouse para se conectar ao DBeaver.

passo 1: Instalar o DBeaver

downloads e instale o DBeaver CE da seguinte maneira:

  • Linux: downloads e executa um dos instaladores do Linux na página downloads do site DBeaver. As opções de instalação snap e flatpak também são fornecidas nesta página.

  • macOS: Use Homebrew para execução brew install --cask dbeaver-community ou use MacPorts para execução sudo port install dbeaver-community. Um instalador macOS também está disponível na página downloads no site DBeaver.

  • Windows: Use Chocolatey para executar choco install dbeaver. Um instalador do Windows também está disponível na página downloads no site da DBeaver.

passo 2: configurar o driver JDBC Databricks para DBeaver

Configure o DBeaver com informações sobre o Databricks JDBC Driver que você downloads anteriormente.

  1. começar DBeaver.

  2. Se você for solicitado a criar um novo banco de dados, clique em Não.

  3. Se você for solicitado a se conectar ou selecionar um banco de dados, clique em Cancelar.

  4. Clique em Banco de dados > Gerenciador de driver.

  5. Na caixa de diálogo Gerenciador de driver , clique em Novo.

  6. Na caixa de diálogo Criar novo driver , clique na tab biblioteca .

  7. Clique em Adicionar arquivo.

  8. Navegue até a pasta para a qual você extraiu o driver JDBC do Databricks.

  9. Navegue um nível abaixo para localizar o arquivo .jar .

  10. Realce o arquivo .jar e clique em Abrir.

  11. Na tab Configurações , para Nome do driver , insira Databricks.

  12. Na tab Configurações , para Nome da classe , insira com.databricks.client.jdbc.Driver.

  13. Clique em OK.

  14. Na caixa de diálogo Gerenciador de driver , clique em Fechar.

passo 3: Conecte o DBeaver aos seus bancos de dados Databricks

Use o DBeaver para se conectar aos clusters ou SQL warehouse para acessar os bancos de dados em seu workspace Databricks.

  1. No DBeaver, clique em Banco de Dados > Nova Conexão de Banco de Dados.

  2. Na caixa de diálogo Conectar a um banco de dados , na guia Todos , clique em Databricks e clique em Avançar.

  3. Clique na Principal tab e insira um valor no campo URL JDBC para seu recurso Databricks. Para a sintaxe do campo URL JDBC , consulte Configurações de autenticação para o driver JDBC do Databricks.

  4. Clique em Testar conexão.

    Dica

    Você deve começar seu recurso Databricks antes de testar sua conexão. Caso contrário, o teste pode demorar vários minutos para ser concluído enquanto o recurso começa.

  5. Se a conexão for bem-sucedida, na caixa de diálogo Teste de conexão , clique em OK.

  6. Na caixa de diálogo Conectar a um banco de dados , clique em Concluir.

Na janela Database Navigator , uma entrada Databricks é exibida. Para alterar o nome da conexão para facilitar a identificação:

  1. Clique com o botão direito do mouse em Databricks e clique em Editar conexão.

  2. Na caixa de diálogo Configuração da conexão , clique em Geral.

  3. Para Connection name, substitua Databricks por um nome diferente para a conexão.

  4. Clique em OK.

Repita as instruções nesta passo para cada recurso que deseja que o DBeaver acesse.

passo 4: Use DBeaver para procurar objetos de dados

Use o DBeaver para acessar objetos de dados em seu workspace Databricks, como tabelas e propriedades de tabelas, view, índices, tipos de dados e outros tipos de objetos de dados.

  1. No DBeaver, na janela Database Navigator , clique com o botão direito do mouse na conexão que deseja usar.

  2. Se Conectar estiver ativado, clique nele. (Se Connect estiver desabilitado, você já está conectado.)

    Dica

    Você deve começar seu recurso antes de tentar se conectar a ele. Caso contrário, a conexão pode demorar vários minutos para ser concluída enquanto o recurso começa.

  3. Expanda a conexão à qual você acabou de se conectar.

  4. Expanda e navegue pelos objetos de dados disponíveis. Clique duas vezes em um objeto de dados para obter mais informações sobre ele.

Repita as instruções nesta passo para acessar objetos de dados adicionais.

passo 5: Use o DBeaver para executar instruções SQL

Use o DBeaver para carregar a tabela trips de amostra do esquema samples do catálogo nyctaxi .

  1. No DBeaver, na janela Database Navigator , clique com o botão direito do mouse na conexão que deseja usar.

  2. Se Conectar estiver ativado, clique nele. (Se Connect estiver desabilitado, você já está conectado.)

    Dica

    Você deve começar seu recurso antes de tentar se conectar a ele. Caso contrário, a conexão pode demorar vários minutos para ser concluída enquanto o recurso começa.

  3. Clique em Editor SQL > Novo Script SQL.

  4. Na (nome da conexão) Script-1 tab, insira esta instrução SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Clique em Editor SQL > Executar script SQL.

Próximos passos