AutoML Feature Store の統合
AutoML、 または ワークスペース Feature Store の 特徴量テーブル の特徴で元の入力データセットを拡張できます。Unity Catalog
要件
エクスペリメントの分類と回帰には、 Databricks Runtime 11.3 LTS ML 以上が必要です。
エクスペリメントの予測には Databricks Runtime 12.2 LTS ML 以上が必要です。
AutoML UIを使用して特徴量テーブルを選択する
AutoMLエクスペリメントを設定したら、次の手順で特徴量テーブルを選択できます。
[ フィーチャを結合 (オプション)] をクリックします。
[追加特徴量テーブルの結合] ページで、[特徴量テーブル] フィールドで 特徴量テーブル を選択します。
特徴量テーブルの主キーごとに、対応する参照キーを選択します。参照キーは、AutoML エクスペリメントに指定したトレーニング データセットの列である必要があります。
[time series 特徴量テーブル] で、対応するタイムスタンプ参照キーを選択します。同様に、タイムスタンプ ルックアップ キーは、 AutoML エクスペリメント用に提供したトレーニング データセットの列である必要があります。
特徴量テーブルをさらに追加するには、「 別の特徴量テーブルを追加 」をクリックし、上記の手順を繰り返します。
特徴量テーブルをAutoML API と一緒に使用する
既存の特徴量テーブルを使用するには、 AutoML 実行仕様で feature_store_lookups
パラメーターを設定します。
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]
次のノートブックは、特徴量テーブルをトレーニング データセットに結合して AutoMLで使用する方法を示しています。