生成AI models maintenance ポリシー
この記事では、トークン単位の従量課金の基盤モデルAPIオファリングのモデル保守ポリシーについて説明します。
最先端のモデルを引き続きサポートするために、 Databricks 、サポートされているモデルを更新するか、基盤モデル APIs トークン単位の従量課金オファリングの古いモデルを廃止する場合があります。
モデル廃止ポリシー
次の廃止ポリシーは、基盤モデル APIs トークン単位の従量課金オファリングでサポートされているチャット モデルと完了モデルにのみ適用されます。
モデルが廃止されると、そのモデルは使用できなくなり、指定された機能オファリングから削除されます。 Databricks は、廃止予定のモデルについて顧客に通知するために、次の手順を実行します。
Databricks ワークスペースの [サービス] ページのモデル カードに、モデルが廃止が計画されていることを示す警告メッセージが表示されます。
該当するドキュメントには、モデルが廃止予定であることと、サポートされなくなる開始日を示す通知が含まれています。
今後のモデルの廃止についてユーザーに通知された後、Databricks は 3 か月後にモデルを廃止します。 この 3 か月間、お客様は次のいずれかを行うことができます。
プロビジョニングされたスループットエンドポイントに移行して、サポート終了日を過ぎてもモデルを引き続き使用することを選択します
既存のワークフローを移行して、推奨される代替モデルを使用します。
廃止日になると、モデルは製品から削除され、該当するドキュメントが更新されて、交換モデルの使用が推奨されます。
モデルの更新
Databricks 、最適化を実現するために、トークン単位の従量課金モデルに増分更新を出荷する場合があります。 モデルが更新されても、エンドポイント URL は変わりませんが、レスポンス オブジェクトのモデル ID は更新日を反映して変更されます。 たとえば、更新プログラムが 2024 年 3 月 4 日に meta-llama/Meta-Llama-3.3-70B
に出荷された場合、応答オブジェクトのモデル名は meta-llama/Meta-Llama-3.3-70B-030424
に更新されます。 Databricks は、参照できる更新プログラムのバージョン履歴を保持します。