AutoML Feature Store の統合
AutoML、 または 従来のワークスペース Feature Store のUnity Catalog 特徴量テーブル の特徴を使用して、元の入力データセットを拡張できます。
要件
エクスペリメントの分類と回帰には、 Databricks Runtime 11.3 LTS ML 以上が必要です。
エクスペリメントの予測には Databricks Runtime 12.2 LTS ML 以上が必要です。
AutoML UIを使用して特徴量テーブルを選択する
AutoMLエクスペリメントを設定したら、次の手順で特徴量テーブルを選択できます。
[ フィーチャを結合 (オプション)] をクリックします。
[追加特徴量テーブルの結合] ページで、[特徴量テーブル] フィールドで 特徴量テーブル を選択します。
特徴量テーブルの主キーごとに、対応する参照キーを選択します。参照キーは、AutoML エクスペリメントに指定したトレーニング データセットの列である必要があります。
[time series 特徴量テーブル] で、対応するタイムスタンプ参照キーを選択します。同様に、タイムスタンプ ルックアップ キーは、 AutoML エクスペリメント用に提供したトレーニング データセットの列である必要があります。
特徴量テーブルをさらに追加するには、「 別の特徴量テーブルを追加 」をクリックし、上記の手順を繰り返します。
特徴量テーブルをAutoML API と一緒に使用する
既存の特徴量テーブルを使用するには、 AutoML 実行仕様で feature_store_lookups
パラメーターを設定します。
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]
次のノートブックは、特徴量テーブルをトレーニング データセットに結合して AutoMLで使用する方法を示しています。