Power BIをDatabricksに接続する

Microsoft Power BIは、セルフサービスのビジネスインテリジェンス機能を備えたインタラクティブなビジュアライゼーションを提供するビジネスアナリティクスサービスであり、ITスタッフやデータベース管理者に依存することなく、エンドユーザー自身がレポートやダッシュボードを作成することができます。

DatabricksをPower BIのデータソースとして使用すると、データサイエンティストやデータエンジニアだけでなく、すべてのビジネスユーザーに、Databricksのパフォーマンスとテクノロジーのメリットを提供することができます。

Databricks から Power BI Online に公開する

Online で Databricksをデータソースとして使用すると、Power BIPower BI DatabricksUI から直接テーブルまたはスキーマから データセットを作成できます。

要件

  • データは Unity Catalogにあり、コンピュート (クラスター) は Unity Catalog 有効になっている必要があります。 Hive metastore は現在サポートされていません。

  • プレミアム (プレミアム容量またはプレミアム ユーザーごとのライセンス) Power BI ライセンスが必要です。

  • Databricks から Power BI への発行に使用している登録済みの Entra ID アプリに、次のアクセス許可を付与する必要があります。

    • Content.Create

    • Dataset.ReadWrite.All

    • Workspace.ReadWrite.All

    • Report.ReadWrite.All

    詳細については、「Entra のアクセス許可Microsoft」を参照してください。

    Entra 管理者の同意は、通常、これらのアクセス許可 (特に Power BI のワークスペースとデータセット レベルのアクセス) に必要です。手順については、「 管理者の同意要求を確認する 」を参照してください。

  • Power BI ワークスペースの設定で、公開後にセマンティック モデルを編集するには、 [ ユーザーは Power BI サービスでデータ モデルを編集できる (プレビュー)] を有効にする必要があります。 また、XMLA エンドポイントを使用して接続を作成することで、表形式エディターを使用してセマンティック モデルを編集することもできます。

  • Power BI ワークスペースで XML 書き込みを有効にする必要がある場合は、この リンク で手順を確認してください。

  • Power BI ワークスペースでプライベート リンクを使用している場合は、Power BI でデータセットのデータソース資格情報を手動で更新する必要があります。

Databricks テーブルを Power BI データセットに発行する

  1. Databricks ワークスペースにサインインし、サイドバーの [ カタログ ] をクリックしてカタログアイコン [カタログ エクスプローラー] を開きます。

  2. 右上のドロップダウンリストからコンピュートリソースを選択します。

  3. カタログを開き、公開するスキーマまたはテーブルを選択します。 Hive metastoreやサンプルカタログから選択しないでください。

  4. 右上の [ Use with BI tools] (スキーマの [Use with BI tools] (BI ツールと共に使用 ) をクリックするか、テーブルの [ Open in a dashboard] (ダッシュボードで開く ) をクリックします。

  5. [Power BI ワークスペースに発行] を選択します。

  6. [ パートナーに接続 ] ダイアログで、[Microsoft Entra ID に接続して 認証する] をクリックします。

  7. Power BIワークスペースで、Power BIワークスペースを選択します。

  8. データセット Modeで、DirectQuery または Import を選択します。

  9. Power BIの認証方法でOAuthまたはPAT(Personal アクセストークン)を選択します。

    Databricks では、きめ細かなアクセス制御とユーザー レベルの監査を可能にするため、OAuth の使用をお勧めします。 OAuth 資格情報は、 Power BI データセット設定ページの データソース資格情報で構成する必要がある場合があります。 [Personal アクセストークン (PAT)] を選択すると、ユーザーに代わって PAT が作成され、 Power BI セマンティック モデルにアクセスできるようになります。

  10. [データセット名] で、[新しいデータ セットとして発行] または [既存のデータ セットを使用する] を選択します。

    [ 既存のデータセットを使用する] を選択すると、次の条件が当てはまります。

    • データセットが存在する場合、上書きされません。 更新では、特定のスキーマに新しいレコードのみが追加されます。

      • 選択したテーブルが既存のデータセットの一部でない場合は、追加されます。

      • テーブルが既にデータセットに含まれていて、前回の更新後に新しい列が追加された場合、それらの列は自動的に追加されます。

      • 新しいテーブルに別のストレージモデルを選択して、 複合セマンティックモデルを作成できます。

    既存のセマンティックモデルがあり、既存のデータ接続を維持しながら更新する場合は、[ 既存のデータセットを使用する] を選択します。 新しいセマンティックモデルを使用して新しいデータセットを作成する場合は、[ 新しいデータセットとして発行] を選択します。

  11. [Power BI に公開] をクリックします。

  12. データセットが発行されたら 10 秒から 20 秒後に、 [ Power BI を開く ] をクリックして、新しいタブで Power BI データセットを開きます。

機能と注意事項

  • 複数のテーブルを含むスキーマをパブリッシュすると、カラムを持つすべてのテーブルがパブリッシュされます。 列のないテーブルは公開されません。

  • Databricks のテーブルの列のコメントは、Power BI の対応する列の説明にコピーされます。

  • 外部キーの関係は、公開されたデータセットに保持されます。 ただし、Power BI では、任意の 2 つのテーブル間のアクティブなリレーションシップ パスが 1 つだけサポートされます。 Databricks のスキーマに複数のパスが存在する場合、Power BI の対応するリレーションシップの一部が非アクティブに設定されます。 後で Power BI のデータ モデル ビューで、アクティブまたは非アクティブなリレーションシップを変更できます。

  • OAuth またはオンプレミスのデータ ゲートウェイを使用する場合は、Power BI データセット設定ページの [データソース credentials] で資格情報を構成する必要がある場合があります。

トラブルシューティング

エラー

Power BI への公開を初めて起動するときに "承認が必要"

このメッセージが表示された場合、この統合機能に権限を付与する前に、Entra管理者の承認が必要です。 Entra管理者に連絡して、リクエストを承認してください。 手順については、この リンク をたどってください。

PowerBINotLicensedException (英語)

Power BI Premium ライセンスがあることを確認します。

このデータセットをデプロイできませんでした。 容量管理者に問い合わせて、Power BI Premium 容量の容量設定で XMLA の読み取り/書き込みサポートが有効になっていることを確認してから、もう一度やり直してください。 詳細については、製品ドキュメントの「XMLA 読み取り/書き込みサポート」を参照してください。

Power BI 容量管理者に問い合わせて、容量設定の XMLA エンドポイント読み取り機能と書き込み機能を有効にしてください。手順については、この リンク をたどってください。

XMLA エンドポイント機能は無効です。 この機能を有効にするには、PowerBI.com で Excel で分析機能をオンにします。

Power BI 容量管理者に問い合わせて、容量設定の XMLA エンドポイント読み取り機能と書き込み機能を有効にしてください。手順については、この リンク をたどってください。

CapacityNotActive(アクティブでない)

容量が停止する場合があります。 容量管理者に連絡して、容量のステータスを確認してください。

'<ccon>***</ccon>' という名前のデータベースは、'<ccon>ワークスペース </ccon>' *** にすでに存在します。

セマンティック モデルを作成する権限があることを確認します。 次に、Power BI への発行を再試行して、バージョン番号がインクリメントされたセマンティック モデルを発行します。

Direct Lake モードを同じモデル内の他のストレージ モードと一緒に使用することはできません。 複合モデルは Direct Lake モードをサポートしていません。 サポートされていないテーブルを削除するか、Direct Lake モードに切り替えます。

Power BI に発行すると、インポート モードまたは DirectQuery モードでセマンティック モデルが作成されるため、Direct Lake モードを使用する既存のデータセットに発行するために使用することはできません。 詳細については、この リンク をたどってください。

'<euii>* * *</euii>' ユーザーには、Discover メソッドを呼び出す権限がありません。

Premium ライセンス モードで Power BI ワークスペースに発行していることを確認します。 Pro ライセンス モードのワークスペースにパブリッシュすることはできません。

'<euii>* * *</euii>' ユーザーに '***' に新しいオブジェクトを作成する権限がないか、オブジェクトが存在しません。

Power BI ワークスペースで閲覧者ロールを持っている場合があります。 セマンティック モデルを作成するアクセス許可があるかどうかを確認します。 詳細については、この リンク をたどってください。

"Failed to update Source, credentials: [Microsoft][ThriftExtension] (14) Unexpected response from server during a HTTP connection: Unauthorized/Forbidden error response returned but no token, expired message received."(データソースの資格情報を更新できませんでした: [ ][ThriftExtension] (14) HTTP 接続中にサーバーからの予期しない応答: Unauthorized/Forbidden error response returned but no token expired message received." (データソースの資格情報の更新に失敗しました: [ ][ThriftExtension] (14) Unexpected response from server during a HTTP connection: Unauthorized/Forbidden error response returned but no token expired message received." (データソースの資格情報の更新に失敗しました: [ Power BIでデータソースの認証情報を編集する場合

Databricks ワークスペースがパブリックにアクセス可能かどうかを確認します。 ワークスペースで Private Link または IP アクセス リストを使用している場合は、Power BI オンプレミス ゲートウェイの構成が必要になることがあります。

Power BI Desktop を Databricks に接続する

Power BI DesktopをDatabricksクラスターおよびDatabricks SQLウェアハウスに接続できます。

要件

  • Power BI Desktop 2.85.681.0以降。Unity Catalogで管理されているデータをPower BIで使用するには、Power BI Desktop 2.98.683.0以降(2021年10月リリース)を使用する必要があります。

    Power BI DesktopにはWindowsが必要です。他のオペレーティングシステムを使用している場合は、物理ホストまたはWindowsベースの仮想マシン上でPower BI Desktopを実行し、ご利用のオペレーティングシステムからそれに接続することもできます。

    2.85.681.0より前のバージョンのPower BI Desktopを使用している場合は、Power BI Desktopと同じ環境にDatabricks ODBCドライバーをインストールする必要もあります。

Partner Connectを使用してPower BI DesktopをDatabricksに接続する

Partner Connectを使用すると、数回クリックするだけでPower BI DesktopからクラスターまたはSQLウェアハウスに接続できます。

  1. Databricks アカウント、ワークスペース、およびサインインしているユーザーが Partner Connectの 要件を満たし ていることを確認します。

  2. サイドバーで、「 Partner Connectボタン Partner Connect 」をクリックします

  3. Power BI」タイルをクリックします。

  4. [ パートナーへの接続 ] ダイアログの [コンピュート] で、接続する Databricks コンピュート リソースの名前を選択します。

  5. 接続ファイルをダウンロード」を選択します。

  6. ダウンロードした接続ファイルを開くと、Power BI Desktopが起動します。

  7. Power BI Desktopで、認証情報を入力します。

    • パーソナルアクセストークン:Databricksのパーソナルアクセストークンを入力します。

    • ユーザー名/パスワード:該当なし。

    • Microsoft エントラID:適用されません。

  8. 接続」をクリックします。

  9. Power BIのナビゲーターからクエリーするDatabricksデータを選択します。

    Power BIナビゲーター

Power BI DesktopとDatabricksを手動で接続する

選択した認証方法に応じて、Power BI Desktop でクラスターまたは SQLウェアハウスに接続するには、次の手順に従ってください。 Databricks SQL ウェアハウスは、 DirectQuery モードで Power BI を使用する場合に推奨されます。

迅速にPower BI Desktopと接続するには、Partner Connectを使用します。

  1. サーバーのホスト名と HTTP パスを取得します。

  2. Power BI Desktopを起動します。

  3. データを取得」または「ファイル」>「データを取得」をクリックします。

  4. データを取得」をクリックして開始します。

  5. Databricks」と検索し、コネクタをクリックします。

    • Azure Databricks

      コネクタ名は Azure Databricks ですが、 Databricks on Google Cloud.

  6. 接続」をクリックします。

  7. サーバーのホスト名HTTPパスを入力します。

  8. データ接続モードを選択します。インポートDirectQueryの違いについては、「Power BI DesktopでDirectQueryを使用する」を参照してください。

  9. OK」をクリックします。

  10. 認証方法をクリックします。

    • パーソナルアクセストークン:Databricksのパーソナルアクセストークンを入力します。

    • ユーザー名/パスワード:該当なし。

    • Microsoft エントラID:適用されません。

  11. 接続」をクリックします。

  12. Power BIのナビゲーターからクエリーするDatabricksデータを選択します。

    Power BIナビゲーター

カスタムSQLクエリーの使用

DatabricksコネクタはDatabricks.Queryデータソースを提供しています。これを使用すると、ユーザーがカスタムSQLクエリーを指定できます。

  1. Power BI Desktop との接続 」で説明されている手順に従って、データ接続モードとして [インポート ] を使用して接続を作成します。

  2. ナビゲーターで、選択したホスト名とHTTPパスを含む一番上のアイテムを右クリックし、「データを変換」をクリックしてPower Queryエディタを開きます。

    ナビゲーターで「データを変換」をクリック
  3. 関数バーで、関数名Databricks.CatalogsDatabricks.Queryに置き換えて、変更を適用します。これにより、SQLクエリーをパラメーターとして受け取るPower Query関数が作成されます。

  4. パラメーターフィールドに SQL クエリを入力し、[ 呼び出し] をクリックします。 これによりクエリが実行され、クエリ結果を内容として新しいテーブルが作成されます。

自動HTTPプロキシ検出

Power BI Desktopバージョン2.104.941.0以降(2022年5月リリース)には、Windowsシステム全体のHTTPプロキシ構成を検出するためのサポートが組み込まれています。

Power BI Desktopは、Windowsシステム全体のHTTPプロキシ構成を自動的に検出して使用できます。

プロキシサーバーが CRL 配布ポイント(CDP)を提供しない場合、Power BIから次のエラーメッセージが表示されることがあります。

Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."

このエラーに対応するには、以下のステップを実行します。

  1. ファイルが存在しない場合は、C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.iniを作成します。

  2. microsoft.sparkodbc.iniファイルに以下の構成を追加します。

    [Driver]
    CheckCertRevocation=0
    

Power BI Delta Sharingコネクタ

Power BI Delta Sharingコネクタにより、ユーザーはDelta Sharingオープンプロトコルを通じて共有されたデータセットを探索、分析、視覚化することができます。このプロトコルにより、RESTとクラウドストレージを活用することで、製品やプラットフォーム間でデータセットを安全に交換できるようになります。

接続手順については、 「Power BI: 共有データの読み取り」を参照してください。

制限事項

  • DatabricksコネクタはWebプロキシをサポートしています。ただし、.pacファイルで定義された自動プロキシ設定はサポートされません。

  • Databricksコネクタでは、Databricks.QueryデータソースとDirectQueryモードの組み合わせはサポートされていません。

  • Delta Sharingコネクタが読み込むデータは、マシンのメモリに収まるものである必要があります。これを確実にするために、コネクタはインポートされる行の数を、以前に設定された行制限に制限します。

関連リソース

サポート