Conecte-se ao Looker
Este artigo descreve como usar o Looker com clusters Databricks ou Databricks SQL warehouse (anteriormente Databricks SQL endpoint).
Importante
Quando tabelas derivadas persistentes (PDTs) estão habilitadas, por default , o Looker gera novamente PDTs a cada 5 minutos conectando-se ao banco de dados associado. Databricks recomenda que você altere a frequência default para evitar incorrer em custos compute em excesso. Para obter mais informações, consulte Ativar e gerenciar tabelas derivadas persistentes (PDTs).
Requisitos
Antes de se conectar ao Looker manualmente, você precisa do seguinte:
Um clusters ou SQL warehouse em seu workspace do Databricks.
Os detalhes de conexão para seus clusters ou SQL warehouse, especificamente os valores Server hostname, Port e HTTP Path .
Um site pessoal da Databricks access token. Para criar um access token pessoal, faça o seguinte:
Em seu Databricks workspace, clique em seu nome de usuário Databricks na barra superior e selecione Settings (Configurações ) no menu suspenso.
Clique em Desenvolvedor.
Ao lado do access token, clique em gerenciar.
Clique em Gerar novos tokens.
(Opcional) Insira um comentário que o ajude a identificar esse token no futuro e altere o tempo de vida padrão do token de 90 dias. Para criar um token sem vida útil (não recomendado), deixe a caixa Duração (dias) vazia (em branco).
Clique em Gerar.
Copie o token exibido em um local seguro e clique em Concluído.
Observação
Certifique-se de salvar os tokens copiados em um local seguro. Não compartilhe seus tokens copiados com outras pessoas. Se você perder os tokens copiados, não poderá regenerar exatamente os mesmos tokens. Em vez disso, você deve repetir este procedimento para criar novos tokens. Se você perder os tokens copiados ou acreditar que os tokens foram comprometidos, o Databricks recomenda fortemente que você exclua imediatamente esses tokens do seu workspace clicando no ícone da lixeira (Revogar) ao lado dos tokens na página access tokens .
Se o senhor não conseguir criar ou usar o site tokens no seu workspace, isso pode ocorrer porque o administrador do workspace desativou o tokens ou não lhe deu permissão para criar ou usar o tokens. Consulte o administrador do site workspace ou os tópicos a seguir:
Observação
Como prática recomendada de segurança, ao se autenticar com ferramentas, sistemas, scripts e aplicativos automatizados, o site Databricks recomenda que o senhor use o access tokens pessoal pertencente à entidade de serviço em vez do workspace de usuários. Para criar o site tokens para uma entidade de serviço, consulte gerenciar tokens para uma entidade de serviço.
Conectar-se ao Looker manualmente
Para se conectar ao Looker manualmente, faça o seguinte:
No Looker, clique em Admin > Conexões > Adicionar conexão.
Insira um Nome exclusivo para a conexão.
Dica
Os nomes de conexão devem conter apenas letras minúsculas, números e sublinhados. Outros caracteres podem ser aceitos, mas podem causar resultados inesperados posteriormente.
Para Dialeto, selecione Databricks.
Para Host Remoto, insira o hostnamedo servidor dos requisitos.
Para Porta, insira a Porta dos requisitos.
Para Banco de dados, insira o nome do banco de dados no workspace que deseja acessar por meio da conexão (por exemplo,
default
).Para Nome de usuário, insira a palavra
token
.Para Senha, insira seus access tokens pessoal dos requisitos.
Para Parâmetros Adicionais, insira
transportMode=http;ssl=1;httpPath=<http-path>
, substituindo<http-path>
pelo valor do Caminho HTTP dos requisitos.Para PDT And Datagroup Maintenance programar, insira uma expressão
cron
válida para alterar a frequência default para regenerar PDTs. A frequência default é a cada cinco minutos.Se você quiser traduzir query para outros fusos horários, ajuste o fuso horárioquery .
Para os restantes campos manter o default, nomeadamente:
Mantenha o default Max Connections e Connection pool Timeout .
Deixe o fuso horário do banco de dados em branco (supondo que você esteja armazenando tudo em UTC).
Clique em Testar essas configurações.
Se o teste for bem-sucedido, clique em Adicionar conexão.
Modele seu banco de dados no Looker
Esta seção cria um projeto e executa o gerador. Os passos a seguir assumem que existem tabelas permanentes armazenadas no banco de dados para sua conexão.
No menu Revelação , ative o Modo de Desenvolvimento.
Clique em Desenvolver > Gerenciar Projetos LookML.
Clique em Novo projeto LookML.
Digite um nome de projeto exclusivo.
Dica
Os nomes dos projetos devem conter apenas letras minúsculas, números e sublinhados. Outros caracteres podem ser aceitos, mas podem produzir resultados inesperados posteriormente.
Para Connection, selecione o nome da conexão da passo 2.
Para Schemas, insira
default
, a menos que você tenha outros bancos de dados para modelar por meio da conexão.Para os restantes campos manter o default, nomeadamente:
Deixe o Ponto de partida definido como Gerar modelo a partir do esquema do banco de dados.
Deixe view Build From definida como All Tables.
Clique em Criar projeto.
Depois de criar o projeto e a execução do gerador, o Looker exibe uma interface de usuário com um arquivo .model
e vários arquivos .view
. O arquivo .model
mostra as tabelas no esquema e quaisquer relações join descobertas entre elas, e os arquivos .view
listam cada dimensão (coluna) disponível para cada tabela no esquema.
Próximos passos
Para começar a trabalhar com seu projeto, consulte os seguintes recursos no site do Looker:
Habilitar e gerenciar tabelas derivadas persistentes (PDTs)
O Looker pode reduzir os tempos query e as cargas do banco de dados criando tabelas derivadas persistentes (PDTs). Um PDT é uma tabela derivada que o Looker grava em um esquema temporário em seu banco de dados. O Looker então regenera o PDT no programar que você especificar. Para obter mais informações, consulte Tabelas derivadas persistentes (PDTs) na documentação do Looker.
Para habilitar PDTs para uma conexão de banco de dados, selecione Tabelas Derivadas Persistentes para essa conexão e conclua as instruções na tela. Para obter mais informações, consulte Tabelas derivadas persistentes e Configuração de credenciais de login separadas para processos PDT na documentação do Looker.
Quando os PDTs estão ativados, por default , o Looker regenera os PDTs a cada 5 minutos conectando-se ao banco de dados associado. O Looker reinicia o recurso Databricks associado se ele for interrompido. Databricks recomenda que você altere a frequência default definindo o campo programar PDT And Datagroup Maintenance para sua conexão de banco de dados para uma expressão cron
válida. Para obter mais informações, consulte PDT and Datagroup Maintenance programar na documentação do Looker.
Para habilitar PDTs ou alterar a frequência de regeneração de PDT para uma conexão de banco de dados existente, clique em Admin > Conexões de banco de dados, clique em Editar ao lado de sua conexão de banco de dados e siga as instruções anteriores.