Conecte o Power BI aos Databricks

O Microsoft Power BI é um serviço de análise de negócios que oferece visualizações interativas com recursos de inteligência de Business Intelligence de autoatendimento, permitindo que os usuários criem relatórios e painéis por si mesmos, sem necessidade de depender de pessoal de tecnologia da informação ou administradores de banco de dados.

Quando você utiliza o Databricks como fonte de dados no Power BI, é possível estender os benefícios do desempenho e da tecnologia do Databricks para além dos cientistas de dados e engenheiros de dados, alcançando todos os usuários de negócios.

Você pode conectar o Power BI Desktop aos clusters do Databricks SQL warehouses.

Requisitos

  • Power BI Desktop 2.85.681.0 ouacima. Faça o download da versão mais recente. Para utilizar os dados gerenciados pelo Unity Catalog com o Power BI, é necessário usar o Power BI Desktop 2.98.683.0 ouacima (lançamento de outubro de 2021).

    Observação

    O Power BI Desktop requer Windows. Uma alternativa para outros sistemas operacionais é executar o Power BI Desktop em um host físico ou em uma máquina virtual baseada no Windows e, em seguida, conectá-lo a partir do seu sistema operacional.

    Se você usa uma versão do Power BI Desktop abaixo de 2.85.681.0, o senhor também precisa instalar o driver ODBC da Databricks no mesmo ambiente do Power BI Desktop.

Conecte o Power BI Desktop ao Databricks usando o Partner Connect

Você pode usar o Partner Connect para se conectar a um cluster ou SQL warehouse a partir do Power BI Desktop em apenas alguns cliques.

  1. Certifique-se de que sua account Databricks, workspace e o usuário conectado atendam aos requisitos para Partner Connect.

  2. Na barra lateral, clique em Botão Conexão do parceiro parceiros Conectar.

  3. Clique no bloco Power BI.

  4. Na caixa de diálogo Conectar-se a parceiros , para compute, escolha o nome do recurso compute do Databricks que você deseja conectar.

  5. Escolha Fazer download do arquivo de conexão.

  6. Abra o arquivo de conexão baixado, que inicia o Power BI Desktop.

  7. No Power BI Desktop, insira suas credenciais de autenticação:

    • Token de acesso pessoal: insira seu token de acesso pessoal do Databricks.

    • Nome de usuário/senha: Não aplicável.

    • ID de entrada da Microsoft: Não aplicável.

  8. Clique em Conectar.

  9. Selecione os dados do Databricks a serem consultados no Power BI Navigator.

    Navegador do Power BI

Conectar o Power BI Desktop ao Databricks manualmente

Siga estas instruções, dependendo do método de autenticação escolhido, para se conectar a clusters ou SQL warehouse com o Power BI Desktop. Os armazéns Databricks SQL são recomendados ao usar o Power BI no modo DirectQuery .

Observação

Para se conectar mais rapidamente com o Power BI Desktop, use Partner Connect.

  1. Obtenha o hostname do servidor e o caminho HTTP.

  2. Inicie o Power BI Desktop.

  3. Clique em Obter dados ou Arquivo > Obter dados.

  4. Clique em Obter dados para começar.

  5. Pesquise Databricks e clique no conector:

    • Azure Databricks

      Observação

      Embora o nome do conector seja Azure Databricks, ele funciona com Databricks on Google Cloud.

  6. Clique em Conectar.

  7. Insira o Nome de host do servidor e o Caminho HTTP.

  8. Selecione seu modo de conectividade de dados. Para obter informações sobre a diferença entre Importar e DirectQuery, consulte Usar DirectQuery no Power BI Desktop.

  9. Clique em OK.

  10. Clique no seu método de autenticação:

    • Token de acesso pessoal: insira seu token de acesso pessoal do Databricks.

    • Nome de usuário/senha: Não aplicável.

    • ID de entrada da Microsoft: Não aplicável.

  11. Clique em Conectar.

  12. Selecione os dados do Databricks a serem consultados no Power BI Navigator.

    Navegador do Power BI

Usando uma consulta SQL personalizada

O conector Databricks fornece a fonte de dados Databricks.Query que permite que um usuário forneça uma consulta SQL personalizada.

  1. Siga os passos descritos em Conectar com o Power BI Desktop para criar uma conexão, usando Importar como o modo de conectividade de dados.

  2. No Navegador, clique com o botão direito do mouse no item mais superior que contém o nome do host e o caminho HTTP selecionados e clique em Transformar Dados para abrir o Editor do Power Query.

    Clique em Transformar Dados no Navegador
  3. Na barra de função, substitua o nome da função Databricks.Catalogs por Databricks.Query e aplique a alteração. Isso cria uma função do Power Query que usa uma consulta SQL como parâmetro.

  4. Insira a consulta SQL desejada no campo de parâmetro e clique em Invocar. Isso executa a consulta e uma nova tabela é gerada com os resultados da consulta como seu conteúdo.

Detecção automatizada de proxy HTTP

O Power BI Desktop versão 2.104.941.0e acima (versão de maio de 2022) tem suporte integrado para detectar a configuração de proxy HTTP em todo o sistema Windows. Faça o download da versão mais recente.

O Power BI Desktop pode detectar e usar automaticamente a configuração de proxy HTTP em todo o sistema Windows.

Se o servidor proxy não fornecer um ponto de distribuição CRL (CDP), o Power BI poderá mostrar a seguinte mensagem de erro:

Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."

Para corrigir esse erro, execute os passos a seguir:

  1. Crie o arquivo C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini se ele não existir.

  2. Adicione a seguinte configuração ao seu arquivo microsoft.sparkodbc.ini:

    [Driver]
    CheckCertRevocation=0
    

Conector de Compartilhamento Delta do Power BI

Com o conector Power BI Delta Sharing, os usuários podem descobrir, analisar e visualizar conjuntos de dados compartilhados com eles por meio do protocolo Delta Sharing. O protocolo permite a troca segura de conjuntos de dados entre produtos e plataformas, aproveitando o REST e o armazenamento em nuvem.

Para obter instruções de conexão, consulte Power BI: ler dados compartilhados.

Limitações

  • O conector Databricks suporta proxy da Web. No entanto, as configurações automáticas de proxy definidas em .pac arquivos não são suportados.

  • No conector Databricks, a fonte de dados Databricks.Query não é suportada em combinação com o modo DirectQuery.

  • Os dados que o conector Delta Sharing carrega devem caber na memória da sua máquina. Para garantir isso, o conector limita o número de linhas importadas ao Limite de linha definido anteriormente.

Recursos adicionais

Suporte