ワークスペースで機能を発見し、機能リネージを追跡する Feature Store (legacy)

注:

このドキュメントでは、従来のワークスペース Feature Store について説明します。 Databricks での特徴量エンジニアリングUnity Catalogの使用を推奨しています。ワークスペースで Unity Catalogが有効になっている場合は、Unity Catalogで機能を探索する で機能の検出とリネージに関する情報を参照してください。

Databricks Workspace Feature Store を使用すると、次のことができます。

  • 特徴量テーブル名を、特徴量テーブル名、特徴量テーブル、データソース、またはタグで検索します。

  • 特徴量テーブルへのアクセスを制御します。

  • 特徴量テーブルの作成に使用するデータソースを特定します。

  • 特定の機能を使用するモデルを識別します。

  • 特徴量テーブルにタグを追加します。

  • フィーチャの鮮度を確認します。

ワークスペースの Feature Store UI にアクセスするには、サイドバーで [Machine Learning] > [Features] を選択します。 テーブルには、使用可能なすべての特徴量テーブルと、テーブル内のフィーチャ、および次のメタデータが一覧表示されます。

  • 特徴量テーブルの作成者。

  • データ テーブルをコンピュートするために使用されます。

  • 特徴量テーブルが公開されているオンライン ストア。

  • 特徴量テーブル内の特徴量をコンピュートするスケジュールされたジョブ。

  • ノートブックまたはジョブが特徴量テーブルに最後に書き込んだ時刻。

Feature Store ページ

特徴量テーブルの検索と参照

検索ボックスを使用して、特徴量テーブルを検索します。 特徴量テーブル、特徴量、または特徴量の計算に使用するデータソースの名前の全部または一部を入力できます。 タグのキーまたは値のすべてまたは一部を入力することもできます。 検索テキストでは、大文字と小文字は区別されません。

フィーチャ検索の例

特徴量テーブルへのアクセスを制御する

「ワークスペース Feature Store (legacy)」の「特徴量テーブルへのアクセスを制御する」を参照してください。

特徴量のリネージュと鮮度を追跡する

UI では、機能がどのように作成されたか、どこで使用されたかを追跡できます。 たとえば、フィーチャのコンピュートに使用された未加工のデータソース、ノートブック、およびジョブを追跡できます。 また、それを使用してトレーニングされたモデルと、それを読み取るノートブックとジョブを追跡することもできます。

任意の特徴量テーブルの名前をクリックすると、特徴量テーブルのページが表示されます。

特徴量テーブル ページの [プロデューサー] テーブルには、この特徴量テーブルに書き込むすべてのノートブックとジョブに関する情報が表示されるため、スケジュールされたジョブの状態と特徴量テーブルの鮮度を簡単に確認できます。

プロデューサーテーブル

Features テーブルには、テーブル内のすべての機能が一覧表示され、その機能を使用するモデル、エンドポイント、ジョブ、およびノートブックへのリンクが表示されます。

機能テーブル

メイン機能のUIページに戻るには、ページの上部にある[ 機能 ]をクリックします。

特徴量テーブルにタグを追加する

タグは、 特徴量テーブルの検索に作成して使用できるキーと値のペアです。

  1. 特徴量テーブル ページで、まだ開いていない場合はクリックします タグアイコン 。 タグ テーブルが表示されます。

    タグテーブル
  2. [ 名前 ] フィールドと [ 値] フィールドをクリックし、タグのキーと値を入力します。

  3. [追加] をクリックします。

    タグを追加

タグを編集または削除する

既存のタグを編集または削除するには、[ アクション ] 列のアイコンを使用します。

タグアクション