クエリを視覚化し、Databricks SQL ダッシュボードを作成する

このチュートリアルでは、「サンプル」のニューヨーク市のタクシー データセットを使用します。 Databricks SQL の SQL エディターを使用して、いくつかのクエリーのそれぞれに視覚化を作成し、これらの視覚化を使用してダッシュボードを作成する方法を示します。 また、ダッシュボード内の各ビジュアリゼーションのダッシュボード パラメーターを作成する方法も示します。

SQL エディター を使用して Databricks SQL に接続する

  1. 新しいアイコン サイドバー で [ 新 規 ] をクリックし 、[ クエリー] を選択します。

    SQL エディターが開きます。

  2. ウェアハウスを選択します。

    クエリーを初めて作成すると、使用可能な SQLウェアハウスの一覧がアルファベット順に表示されます。 次回クエリを作成するときに、最後に使用したウェアハウスが選択されます。

  1. [スターター ウェアハウス]をクリックします。 このウェアハウスは、すぐに開始できるように自動的に作成されます。 SQLウェアハウスの作成については、 「SQLウェアハウスの作成」を参照してください。

集荷時間配分 のクエリー

  1. SQL エディターで、次のクエリーを新しいクエリー ウィンドウに貼り付けて、タクシー乗車の時間単位の分布を返します。

    SELECT
    date_format(tpep_pickup_datetime, "HH") AS `Pickup Hour`,
    count(*) AS `Number of Rides`
    FROM
    samples.nyctaxi.trips
    GROUP BY 1
    
  2. Ctrl / Cmd + Enter キーを押すか、[実行 (1000)] をクリックします。数秒後、クエリの結果が結果ウィンドウのクエリの下に表示されます。

    すべてのクエリーに対してデフォルトによって制限 1000 が選択され、クエリーが最大 1000 行を返すようにします。クエリーが [1000 件 の制限] 設定で保存されている場合、この設定はクエリーのすべての実行 (ダッシュボード内を含む) に適用されます。 このクエリーのすべての行を返す場合は、[実行 (1000)] ドロップダウンをクリックして [LIMIT 1000] の選択を解除できます。行数に別の制限を指定する場合は、任意の値を使用して LIMIT 句をクエリーに追加できます。

    クエリーの結果が [結果] タブに表示されます。

  3. [ 保存 ] をクリックし、クエリーを Pickup hourとして保存します。

    最初のクエリの結果 NYCタクシークエリー

時間別のタクシー乗車の分布のビジュアライゼーションを作成します。

  1. [結果] タブの横にある [+ ] をクリックし、[ 視覚化] をクリックします。

    ビジュアライゼーション エディターが表示されます。

  2. [ビジュアライゼーション タイプ] ドロップダウンで、[バー] が選択されていることを確認します。

  3. ビジュアリゼーション名を Bar chartに変更します。

  4. [Y] 列の ドロップダウンに Pickup Hour が指定されていることを確認します。

  5. [X] 列の ドロップダウンに Number of RidesSum が指定されていることを確認します。

    集荷時間の分布
  6. [保存]をクリックします。

    保存されたグラフが SQL エディターに表示されます。

これらのビジュアライゼーション を使用したダッシュボードの作成

  1. サイドバーで [新しいアイコン 新規 ] をクリックし 、[ダッシュボード] を選択します。

  1. ダッシュボード名を NYC taxi trip analysisに設定します。

  2. [保存]をクリックします。

  1. [ ウェアハウスの選択 ] ドロップダウン リストで、[ スターター ウェアハウス] を選択します。

  1. [ 追加 ] ドロップダウン リストで、[ ビジュアライゼーション] をクリックします。

  2. [ ビジュアライゼーション ウィジェットの追加 ] ウィンドウで、[ 日単位の運賃から距離解析 ] クエリーを選択します。

  3. [ 既存のビジュアライゼーションを選択 ] リストで、[ 距離による料金] を選択します。

  4. タイトル テキスト ボックスに、 Daily fare trendsと入力します。

    ビジュアライゼーションウィジェットの追加
  1. [ ダッシュボードに追加] をクリックします。

    毎日の運賃傾向の視覚化が破線のデザイン画面に表示されます。

  1. [ 追加 ] ドロップダウン リストで 2 つ目のウィジェットをダッシュボードに追加し、[ ビジュアリゼーション] をクリックします。

  2. [ 視覚化ウィジェットの追加 ] ウィンドウで、[ 集荷時間 ] クエリーを選択します。

  3. [ 既存の視覚化を選択 ] リストで、[ 棒グラフ] を選択します。

  4. タイトル テキスト ボックスに、 Pickup hour distributionと入力します。

  1. [ ダッシュボードに追加] をクリックします。

  1. ダッシュボードの最初のビジュアリゼーションの幅と一致するように、このビジュアリゼーションのサイズを変更します。

  2. [ 編集の完了] をクリックします。

初期ダッシュボード

各クエリー に集荷郵便番号パラメーターを追加する

  1. SQL エディターで、[ 日次運賃から距離への移動] 解析 クエリーを開きます。

  2. 次の WHERE 句を [毎日の運賃から距離分析 ] クエリに追加して、ピックアップ郵便番号でクエリーをフィルター処理します。

    WHERE
      pickup_zip IN ({{ pickupzip }})
    
  3. [pickupzip] テキスト ボックスに「 10018 」と入力し、[変更の適用] をクリックして、ピックアップ郵便番号パラメーターを使用してクエリーを実行します。

  4. [保存]をクリックします。

  5. 集荷時間 クエリーを開きます。

  6. 次の WHERE 句を 集荷時間 に追加して、集荷郵便番号でクエリーをフィルター処理します。 この句は、 GROUP BY 句の前に追加します。

       WHERE
         pickup_zip IN ({{ pickupzip }})
    
  7. [pickupzip] テキスト ボックスに「 10018 」と入力し、[変更の適用] をクリックして、ピックアップ郵便番号フィルターを使用してクエリーを実行します。

  8. [保存]をクリックします。

ダッシュボード パラメーター を使用するようにダッシュボードを更新する

  1. NYC タクシー乗車分析 ダッシュボードを開きます。

    各ビジュアライゼーションに、ピックアップ郵便番号のパラメーターが含まれるようになりました。

    ウィジェット - パラメーター
  2. このダッシュボードのケバブメニュー 垂直省略記号 をクリックし、[ 編集]をクリックします。

  3. 垂直省略記号 毎日の運賃 傾向 の視覚化のケ バブ メニュー をクリックし、[ ウィジェット設定の変更] をクリックします。

  4. [ パラメー 編集アイコン ター ] セクションで 、[] フィールドの [ウィジェット] パラメーター の鉛筆アイコン をクリックしま す。

    ウィジェットのパラメーターの表示
  5. [ ソースと値の編集 ] ウィンドウで、[ ソース ] パラメーターを [新しいダッシュボード] パラメーターに変更します。

    ウィジェットのパラメーターを新しいダッシュボードパラメーターに変更する
  6. [ OK ] をクリックし、[ 保存] をクリックします。

    pickupzip ダッシュボード パラメーターが表示され、 毎日の運賃傾向 ビジュアライゼーションのウィジェット パラメーターが表示されなくなります。

    1. [集荷時間の分布 ]垂直省略記号 ビジュアライゼーションの [ケバブ] メニュー をクリックし、[ ウィジェット設定の変更 ] をクリックします。

  7. [ パラメー 編集アイコン ター ] セクションで 、[] フィールドの [ウィジェット] パラメーター の鉛筆アイコン をクリックしま す。

  8. [ ソースと値の編集 ] ウィンドウで、[ ソース ] を [既存のダッシュボード] パラメーターに変更します。

  9. キー 値として pickupzip が選択されていることを確認します。

  10. [ OK ] をクリックし、[ 保存] をクリックします。

    集荷時間分布 ビジュアリゼーションのウィジェット パラメーターが表示されなくなりました。

  11. [ 編集の完了] をクリックします。

  12. pickupzip ダッシュボード パラメーターの値を 10017 に変更し、[変更の適用] をクリックします。

    各ビジュアライゼーションのデータには、集荷のデータが 10017 郵便番号で表示されます。

    ウィジェット パラメーターを新しいダッシュボード パラメーターに変更する