Conecte o Power BI aos Databricks
O Microsoft Power BI é um serviço de análise de negócios que oferece visualizações interativas com recursos de inteligência de Business Intelligence de autoatendimento, permitindo que os usuários criem relatórios e painéis por si mesmos, sem necessidade de depender de pessoal de tecnologia da informação ou administradores de banco de dados.
Quando você utiliza o Databricks como fonte de dados no Power BI, é possível estender os benefícios do desempenho e da tecnologia do Databricks para além dos cientistas de dados e engenheiros de dados, alcançando todos os usuários de negócios.
Publicar no Power BI Online a partir da Databricks
Ao usar o Databricks como fonte de dados com o Power BI Online, o senhor pode criar o conjunto de dados Power BI a partir de tabelas ou esquemas diretamente da interface do usuário Databricks.
Requisitos
Seus dados devem estar em Unity Catalog, e seu compute (cluster) deve estar habilitado para Unity Catalog. Hive metastore não é suportado no momento.
O senhor deve ter uma licença premium (capacidade premium ou licença premium por usuário) do Power BI.
O senhor deve conceder as seguintes permissões ao aplicativo Entra ID registrado que está usando para publicar do Databricks para o Power BI:
Conteúdo. Criar
conjunto de dados.ReadWrite.All
workspace.ReadWrite.All
Report.ReadWrite.all
Para obter mais informações, consulte Microsoft Entra Permissions.
Observação
Normalmente, o consentimento do Entra Admin é necessário para essas permissões, especialmente para o acesso de nível workspace e datasetem Power BI. Consulte Revisar solicitações de consentimento do administrador para obter instruções.
Em Power BI workspace settings, o senhor deve habilitar Users can edit data models in Power BI serviço (preview) para editar o modelo semântico depois de publicado. O senhor também pode editar o Semantic Model usando o Tabular Editor, fazendo uma conexão usando o endpoint XMLA.
Se o senhor precisar ativar a gravação de XML no site Power BI workspace, siga este link para obter instruções.
Se o seu Power BI workspace usa um link privado, o senhor deve atualizar manualmente as credenciais do datasource do datasetem Power BI.
Publicar tabelas do Databricks em um conjunto de dados do Power BI
Faça login em seu Databricks workspace e clique em Catalog na barra lateral para abrir o Catalog Explorer.
Selecione um recurso compute na lista suspensa no canto superior direito.
Abra um catálogo e selecione o esquema ou as tabelas a serem publicadas. Não selecione em um site Hive metastore ou no catálogo de amostras.
No canto superior direito, clique em Use with BI tools (Usar com ferramentas de BI ) para um esquema ou Open in a dashboard (Abrir em um painel) para uma tabela.
Selecione Publish to Power BI workspace .
Na caixa de diálogo Conectar a parceiros, clique em Conectar a Microsoft Entra ID para autenticar.
No espaço de trabalhoPower BI , selecione Power BI workspace.
No conjunto de dados Mode, selecione DirectQuery ou Import.
Em Authentication Method (Método de autenticação) em Power BI, selecione OAuth ou PAT (Personal access token).
A Databricks recomenda o uso do OAuth, pois ele permite o controle de acesso refinado e a auditoria no nível do usuário. OAuth talvez seja necessário configurar as credenciais na página de configurações Power BI dataset em fonte de dados credentials. Se o senhor selecionar Personal access token (PAT), um PAT será criado em seu nome para permitir que o site Power BI acesse o modelo semântico.
Em Nome do conjunto de dados, selecione Publicar como um novo conjunto de dados ou Usar um conjunto de dados existente.
Quando o senhor escolhe Usar um datasetexistente, o seguinte é verdadeiro:
Se o site dataset existir, ele não será substituído. As atualizações só acrescentam novos registros em um determinado esquema.
Se a tabela selecionada não fizer parte do site dataset existente, ela será adicionada.
Se a tabela já estava em seu site dataset e novas colunas foram adicionadas após a última atualização, essas colunas serão automaticamente adicionadas.
Você pode escolher um modelo de armazenamento diferente para a nova tabela para criar um modelo semântico composto.
Se o senhor tiver um modelo semântico existente que deseja atualizar enquanto mantém as conexões de dados existentes, selecione Use an existing dataset. Se o senhor quiser criar um novo dataset com um novo modelo semântico, selecione Publish as new data set (Publicar como novo conjunto de dados).
Clique em Publicar no Power BI.
Em 10 a 20 segundos, quando o dataset for publicado, clique em Open Power BI para abrir seu Power BI dataset em um novo tab.
recurso e notas
Ao publicar um esquema contendo várias tabelas, todas as tabelas com colunas são publicadas. Tabelas sem colunas não são publicadas.
Os comentários sobre as colunas de uma tabela no Databricks são copiados para as descrições das colunas correspondentes no Power BI.
As relações key estrangeiras são preservadas no site publicado dataset. No entanto, o Power BI suporta apenas um caminho de relacionamento ativo entre duas tabelas. Quando vários caminhos estão presentes no esquema do Databricks, algumas das relações correspondentes no Power BI são definidas como inativas. Posteriormente, o senhor pode alterar quais relações estão ativas ou inativas no modelo de dados view em Power BI.
Ao usar OAuth ou um gateway de dados on-premises, as credenciais talvez precisem ser configuradas em " fonte de dados credentials" na página de configurações Power BI dataset .
Solução de problemas
Erro |
Notas |
---|---|
"Aprovação necessária" ao iniciar o Publish to Power BI pela primeira vez |
Se o senhor vir essa mensagem, precisará da aprovação do Entra Admin antes de conceder permissões para esse recurso de integração. Entre em contato com o administrador do Entra para aprovar a solicitação. Siga este link para obter instruções. |
Exceção licenciada do PowerBinot |
Certifique-se de que o senhor tenha uma licença do Power BI Premium. |
Não foi possível implantar este dataset. Entre em contato com um administrador de capacidade para garantir que o suporte à leitura/gravação de XMLA esteja ativado nas configurações de capacidade do Power BI Premium e, em seguida, tente novamente. Para obter informações adicionais, consulte 'Suporte de leitura/gravação XMLA' na documentação do produto. |
Entre em contato com o administrador de capacidade do Power BI para ativar os recursos de leitura e gravação no endpoint XMLA nas configurações de capacidade. Siga este link para obter instruções. |
O recurso de endpoint XMLA está desativado. Ative o recurso Analyze in Excel no PowerBI.com para ativar esse recurso. |
Entre em contato com o administrador de capacidade do Power BI para ativar os recursos de leitura e gravação no endpoint XMLA nas configurações de capacidade. Siga este link para obter instruções. |
Capacidade não ativa |
Sua capacidade pode ser pausa. Entre em contato com o administrador de capacidade para verificar o status da capacidade. |
O banco de dados com o nome de ' |
Verifique se você tem as permissões para criar um modelo semântico. Em seguida, tente novamente Publicar no Power BI para publicar o modelo semântico com um número de versão incrementado. |
Você não pode usar o modo Direct Lake junto com outros modos de armazenamento no mesmo modelo. O modelo composto não suporta o modo Direct Lake. Remova as tabelas não suportadas ou mude-as para o modo Direct Lake. |
Como o Publish to Power BI cria um modelo semântico com o modo Import ou DirectQuery, ele não pode ser usado para publicar em um dataset existente que use o modo Direct Lake. Siga este link para saber mais. |
O usuário ' |
Verifique se o senhor está publicando em Power BI workspace com um modo de licença Premium. O senhor não pode publicar em um site workspace com um modo de licença Pro. |
Ou o usuário ' |
O senhor pode ter a função Viewer no site Power BI workspace. Verifique se você tem as permissões para criar um modelo semântico. O senhor pode acessar esse link para obter mais informações. |
"Falha ao atualizar as credenciais da fonte de dados: [Microsoft][ThriftExtension] (14) Resposta inesperada do servidor durante uma conexão HTTP: A resposta de erro Unauthorized/Forbidden foi retornada, mas nenhuma mensagem de tokens expirados foi recebida." ao editar as credenciais da fonte de dados em Power BI |
Verifique se o site Databricks workspace é acessível publicamente. Se o seu workspace estiver usando Private Link ou listas de acesso IP, talvez seja necessário configurar um gateway Power BI on-premises . |
Conectar o Power BI Desktop ao Databricks
Você pode conectar o Power BI Desktop aos clusters do Databricks SQL warehouses.
Requisitos
Power BI Desktop 2.85.681.0 ouacima. Para utilizar os dados gerenciados pelo Unity Catalog com o Power BI, é necessário usar o Power BI Desktop 2.98.683.0 ouacima (lançamento de outubro de 2021).
Observação
O Power BI Desktop requer Windows. Uma alternativa para outros sistemas operacionais é executar o Power BI Desktop em um host físico ou em uma máquina virtual baseada no Windows e, em seguida, conectá-lo a partir do seu sistema operacional.
Se você usa uma versão do Power BI Desktop abaixo de 2.85.681.0, o senhor também precisa instalar o driver ODBC da Databricks no mesmo ambiente do Power BI Desktop.
Um access tokenpessoal do Databricks.
Observação
Como prática recomendada de segurança ao autenticar com access tokens pessoal, Databricks recomenda que o senhor use access tokens pessoal pertencente à entidade de serviço em vez de workspace usuários. Para criar o site tokens para uma entidade de serviço, consulte gerenciar tokens para uma entidade de serviço.
Conecte o Power BI Desktop ao Databricks usando o Partner Connect
Você pode usar o Partner Connect para se conectar a um cluster ou SQL warehouse a partir do Power BI Desktop em apenas alguns cliques.
Certifique-se de que sua account Databricks, workspace e o usuário conectado atendam aos requisitos para Partner Connect.
Na barra lateral, clique em parceiros Conectar.
Clique no bloco Power BI.
Na caixa de diálogo Conectar-se a parceiros , para compute, escolha o nome do recurso compute do Databricks que você deseja conectar.
Escolha Fazer download do arquivo de conexão.
Abra o arquivo de conexão baixado, que inicia o Power BI Desktop.
No Power BI Desktop, insira suas credenciais de autenticação:
Token de acesso pessoal: insira seu token de acesso pessoal do Databricks.
Nome de usuário/senha: Não aplicável.
ID de entrada da Microsoft: Não aplicável.
Clique em Conectar.
Selecione os dados do Databricks a serem consultados no Power BI Navigator.
Conectar o Power BI Desktop ao Databricks manualmente
Siga estas instruções, dependendo do método de autenticação escolhido, para se conectar a clusters ou SQL warehouse com o Power BI Desktop. Os armazéns Databricks SQL são recomendados ao usar o Power BI no modo DirectQuery .
Observação
Para se conectar mais rapidamente com o Power BI Desktop, use Partner Connect.
Obtenha o hostname do servidor e o caminho HTTP.
Inicie o Power BI Desktop.
Clique em Obter dados ou Arquivo > Obter dados.
Clique em Obter dados para começar.
Pesquise Databricks e clique no conector:
Azure Databricks
Observação
Embora o nome do conector seja Azure Databricks, ele funciona com Databricks on Google Cloud.
Clique em Conectar.
Insira o Nome de host do servidor e o Caminho HTTP.
Selecione seu modo de conectividade de dados. Para obter informações sobre a diferença entre Importar e DirectQuery, consulte Usar DirectQuery no Power BI Desktop.
Clique em OK.
Clique no seu método de autenticação:
Token de acesso pessoal: insira seu token de acesso pessoal do Databricks.
Nome de usuário/senha: Não aplicável.
ID de entrada da Microsoft: Não aplicável.
Clique em Conectar.
Selecione os dados do Databricks a serem consultados no Power BI Navigator.
Usando uma consulta SQL personalizada
O conector Databricks fornece a fonte de dados Databricks.Query
que permite que um usuário forneça uma consulta SQL personalizada.
Siga os passos descritos em Conectar com o Power BI Desktop para criar uma conexão, usando Importar como o modo de conectividade de dados.
No Navegador, clique com o botão direito do mouse no item mais superior que contém o nome do host e o caminho HTTP selecionados e clique em Transformar Dados para abrir o Editor do Power Query.
Na barra de função, substitua o nome da função
Databricks.Catalogs
porDatabricks.Query
e aplique a alteração. Isso cria uma função do Power Query que usa uma consulta SQL como parâmetro.Digite a consulta SQL no campo de parâmetro e clique em Invoke. Isso executa a consulta e uma nova tabela é criada com os resultados da consulta como conteúdo.
Detecção automatizada de proxy HTTP
O Power BI Desktop versão 2.104.941.0e acima (versão de maio de 2022) tem suporte integrado para detectar a configuração de proxy HTTP em todo o sistema Windows.
O Power BI Desktop pode detectar e usar automaticamente a configuração de proxy HTTP em todo o sistema Windows.
Se o servidor proxy não fornecer um ponto de distribuição CRL (CDP), o Power BI poderá mostrar a seguinte mensagem de erro:
Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."
Para corrigir esse erro, execute os passos a seguir:
Crie o arquivo
C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini
se ele não existir.Adicione a seguinte configuração ao seu arquivo
microsoft.sparkodbc.ini
:[Driver] CheckCertRevocation=0
Conector de Compartilhamento Delta do Power BI
Com o conector Power BI Delta Sharing, os usuários podem descobrir, analisar e visualizar conjuntos de dados compartilhados com eles por meio do protocolo Delta Sharing. O protocolo permite a troca segura de conjuntos de dados entre produtos e plataformas, aproveitando o REST e o armazenamento em nuvem.
Para obter instruções de conexão, consulte Power BI: Ler dados compartilhados.
Limitações
O conector Databricks suporta proxy da Web. No entanto, as configurações automáticas de proxy definidas em .pac arquivos não são suportados.
No conector Databricks, a fonte de dados
Databricks.Query
não é suportada em combinação com o modo DirectQuery.Os dados que o conector Delta Sharing carrega devem caber na memória da sua máquina. Para garantir isso, o conector limita o número de linhas importadas ao Limite de linha definido anteriormente.