Databricks ノートブックにおけるビジュアライゼーション

Databricks は、Databricks SQL とノートブックの両方で、チャートやビジュアライゼーションを組み込みでサポートしています。このページでは、Databricks ノートブックでビジュアライゼーションを操作する方法について説明します。Databricks SQLにおけるビジュアライゼーションの使用については、「Databricks SQL におけるビジュアライゼーション」を参照してください。

ビジュアライゼーションのタイプを表示するには、「ビジュアライゼーションのタイプ」を参照してください。

新しいビジュアライゼーションの作成

このセクションの例を再現するには、以下のコードを使用してください:

sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

ビジュアライゼーションを作成するには、結果の上にある [+] をクリックし、[ビジュアライゼーション] を選択します。ビジュアライゼーションエディタが表示されます。

新しいビジュアライゼーションメニュー
  1. [ビジュアライゼーションのタイプ] ドロップダウンで、[バー] を選択します。

    ビジュアライゼーションエディタ
  2. ビジュアライゼーションに表示するデータを選択します。使用できるフィールドは、選択したタイプによって異なります。

  3. [保存]をクリックします。

新しいデータプロファイルの作成

Databricks Runtime 9.1 LTS 以降で利用可能です。

データプロファイルは、Apache Spark DataFrame、pandas DataFrame、または SQL テーブルの要約統計を表形式とグラフィック形式で表示します。結果のセルからデータプロファイルを作成するには、[+] クリックして、[データプロファイル] を選択します。

Databricks が要約統計を計算して表示します。

データプロファイル
  • 数値特徴量とカテゴリ特徴量は別々の表に表示されます。

  • タブの上部では、特徴量を並べ替えたり検索したりできます。

  • チャート列の上部では、ヒストグラム(Standard)と分位のどちらを表示するかを選択できます。

  • チャートを拡大するには、[展開] をオンにします。

  • 対数スケールでチャートを表示するには、[対数] にチェックを入れます。

  • チャートの上にカーソルを置くと、ヒストグラムの列の境界や行数、分位値など、より詳細な情報を見ることができます。

データプロファイリングをプログラムで生成することもできます。 Summarize コマンド (dbutils.data.summarize) を参照してください。

ビジュアライゼーションとデータプロファイルの使用

データプロファイルは Databricks Runtime 9.1 LTS 以降で利用可能です。

ビジュアライゼーションまたはデータプロファイルの名前変更、複製、削除

ビジュアリゼーションまたはデータプロファイリングの名前を変更、複製、または削除するには、タブ名の右側にある下向きの矢印をクリックします。 メニューからダッシュボードを作成することもできます。

セルにデータプロファイリングが含まれている場合、関連するビジュアライゼーションとデータプロファイリングはノートブックダッシュボードにのみ追加できます。 ビジュアライゼーションのみのセルの場合、ドロップダウンに追加の [ダッシュボードに追加 ] メニュー項目が表示されます。 「ダッシュボードへのビジュアリゼーションの追加」を参照してください。

ノートブック データプロファイリング ドロップダウン メニュー

名前を直接クリックすることで、その場で名前を変更することもできます。

ビジュアライゼーションの編集

ビジュアリゼーションの下をクリックして ビジュアライゼーションの編集ボタン 、ビジュアリゼーション エディターを開きます。 変更が完了したら、[ 保存] をクリックします。

色の編集

ビジュアライゼーションの作成時または編集することで、ビジュアライゼーションの色をカスタマイズできます。

  1. ビジュアライゼーションを作成または編集します。

  2. [] をクリックします。

  3. 色を変更するには、四角をクリックし、次のいずれかの方法で新しい色を選択します。

    • カラーセレクターでクリックする。

    • 16進数を入力する。

  4. カラーセレクターの外側の任意の場所をクリックして閉じます。

  5. Visualization EditorSave をクリックして、変更を保存します。

シリーズ選択

グラフで分析する特定の系列を選択するには、次のコマンドを使用します。

  • 1 つの凡例項目をクリックして、そのシリーズを選択します

  • 凡例項目を Cmd/Ctrl + クリックして、複数のシリーズを選択または選択解除します

シリーズ選択

並べ替えられたツールチップ

折れ線グラフと積み上げられていない棒グラフでツールチップを大きさの順に並べて使用すると、分析が容易になります。

ソートされたツールチップ

ズーム

データ密度の高いチャートの場合、個々のデータポイントを拡大すると、詳細を調査したり、外れ値をトリミングしたりするのに役立ちます。 グラフを拡大するには、キャンバスをクリックしてドラッグします。 ズームをクリアするには、キャンバスにカーソルを合わせ、ビジュアライゼーションの右上隅にある [ ズームのクリア ] ボタンをクリックします。

ズームインして詳細を確認する

ビジュアライゼーションを PNG ファイルとしてダウンロードする

ビジュアライゼーションを PNG ファイルとしてダウンロードするには、キャンバスにカーソルを合わせ、右上隅にあるダウンロード アイコンをクリックします。

[ダウンロード] をクリックして、ビジュアライゼーションを PNG ファイルとしてエクスポートします

pngファイルがデバイスにダウンロードされます。

ダッシュボードにビジュアライゼーションを追加する

  1. タブ名の右にある下向きの矢印をクリックします。

  2. [ダッシュボードに追加] を選択します。利用可能なダッシュボードビューのリストが、メニューオプション [新しいダッシュボードに追加] と共に表示されます。

  3. ダッシュボードを選択するか、 新しいダッシュボードに追加 を選択します。 ダッシュボードが開き、新しく追加されたビジュアライゼーションが表示されます。

従来のビジュアライゼーション

最新バージョンのグラフ ビジュアライゼーションは、デフォルトでオンになっています。 このセクションの設定では、古いグラフで作業するとき、または最新バージョンをオフにしている場合に発生する可能性のある従来の視覚化について説明します。

ビジュアライゼーションツール

グラフの右上にカーソルを合わせると、Plotlyツールバーが表示され、選択、ズーム、パンなどの操作を実行できます。

ノートブックのビジュアライゼーションエディターツールバー

ビジュアライゼーションのダウンロード

.png でビジュアライゼーションをダウンロードするには フォーマットで、ノートブックのセルまたはビジュアライゼーションエディターのカメラアイコン カメラアイコンをクリックします。

  • 結果のセルでは、セル上にカーソルを移動すると、右上にカメラアイコンが表示されます。

    ノートブックセルのカメラ
  • ビジュアライゼーション エディターでは、カーソルをチャート上に移動するとカメラ アイコンが表示されます。 ビジュアライゼーションツールを参照してください。

系列を一時的に非表示または表示する

ビジュアライゼーション内の系列を非表示にするには、凡例内の系列をクリックします。系列を再度表示するには、凡例内でその系列をもう一度クリックします。

単一の系列のみを表示するには、凡例内の系列をダブルクリックします。他の系列を表示するには、それぞれの系列をクリックしてください。