特徴量の検出と特徴量リネージの追跡

Databricks Feature Storeを使用すると、次のことができます。

  • 特徴量テーブル名を、特徴量テーブル名、特徴量テーブル、データソース、またはタグで検索します。

  • 特徴量テーブルへのアクセスを制御します。

  • 特徴量テーブルの作成に使用するデータソースを特定します。

  • 特定の機能を使用するモデルを識別します。

  • 特徴量テーブルにタグを追加します。

  • フィーチャの鮮度を確認します。

Feature Store UI にアクセスするには、サイドバーで [機械学習] > Feature Storeを選択します。Feature Store UI には、使用可能なすべての特徴量テーブルが、テーブル内の特徴量テーブルおよび次のメタデータと共に一覧表示されます。

  • 特徴量テーブルの作成者。

  • データ テーブルをコンピュートするために使用されます。

  • 特徴量テーブルが公開されているオンライン ストア。

  • 特徴量テーブル内の特徴量をコンピュートするスケジュールされたジョブ。

  • ノートブックまたはジョブが特徴量テーブルに最後に書き込んだ時刻。

Feature Store ページ

特徴量テーブルの検索と参照

検索ボックスを使用して、特徴量テーブルを検索します。 特徴量テーブル、特徴量、または特徴量の計算に使用するデータソースの名前の全部または一部を入力できます。 タグのキーまたは値のすべてまたは一部を入力することもできます。 検索テキストでは、大文字と小文字は区別されません。

フィーチャ検索の例

特徴量テーブルへのアクセスを制御する

特徴量テーブルへのアクセスの制御」を参照してください。

特徴量のリネージュと鮮度を追跡する

UI では、機能がどのように作成されたか、どこで使用されたかを追跡できます。 たとえば、フィーチャのコンピュートに使用された未加工のデータソース、ノートブック、およびジョブを追跡できます。 また、それを使用してトレーニングされたモデルと、それを読み取るノートブックとジョブを追跡することもできます。

Feature Store UI で、特徴量テーブルの名前をクリックして、特徴量テーブル ページを表示します。

特徴量テーブル ページの [プロデューサー] テーブルには、この特徴量テーブルに書き込むすべてのノートブックとジョブに関する情報が表示されるため、スケジュールされたジョブの状態と特徴量テーブルの鮮度を簡単に確認できます。

プロデューサーテーブル

Features テーブルには、テーブル内のすべての機能が一覧表示され、その機能を使用するモデル、エンドポイント、ジョブ、およびノートブックへのリンクが表示されます。

機能テーブル

メインの Feature Store UI ページに戻るには、ページの上部にある [ Feature Store ] をクリックします。

特徴量テーブルにタグを追加する

タグは、 特徴量テーブルの検索に作成して使用できるキーと値のペアです。

  1. 特徴量テーブル ページで、まだ開いていない場合はクリックします タグアイコン 。 タグ テーブルが表示されます。

    タグテーブル
  2. [ 名前 ] フィールドと [ 値] フィールドをクリックし、タグのキーと値を入力します。

  3. [追加] をクリックします。

    タグを追加

タグを編集または削除する

既存のタグを編集または削除するには、[ アクション ] 列のアイコンを使用します。

タグアクション