Generative AI modela a política de manutenção

Este artigo descreve a política de manutenção do modelo para a oferta de pagamento por tokens do Foundation Model APIs .

Para continuar oferecendo suporte aos modelos mais modernos, o site Databricks pode atualizar os modelos suportados ou retirar modelos mais antigos da oferta de pay-per-tokens do Foundation Model APIs.

Política de aposentadoria modelo

A política de aposentadoria a seguir se aplica somente aos modelos de bate-papo e conclusão compatíveis com a oferta de pay-per-tokens do Foundation Model APIs.

Quando um modelo é aposentado, ele não está mais disponível para uso e é removido da oferta de recurso indicada. A Databricks adota as seguintes medidas para notificar os clientes sobre um modelo que está pronto para ser desativado:

  • Uma mensagem de aviso é exibida no cartão do modelo na página Serving do site Databricks workspace , indicando que o modelo está planejado para ser desativado.

  • A documentação aplicável contém um aviso que indica que o modelo está planejado para ser aposentado e a data de início em que não haverá mais suporte.

Depois que os usuários forem notificados sobre a próxima retirada do modelo, a Databricks retirará o modelo em três meses. Durante esse período de três meses, os clientes podem:

  • Opte por migrar para um provisionamento Taxa de transferência endpoint para continuar usando o modelo após a data de fim de vida útil.

  • Migrar o fluxo de trabalho existente para usar os modelos de substituição recomendados.

Na data de aposentadoria, o modelo é removido do produto e a documentação aplicável é atualizada para recomendar o uso de um modelo substituto.

Atualizações do modelo

Databricks pode enviar atualizações incrementais para modelos de pagamento por tokens para fornecer otimizações. Quando um modelo é atualizado, o URL do endpoint permanece o mesmo, mas o ID do modelo no objeto de resposta é alterado para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.3-70B em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.3-70B-030424. Databricks mantém um histórico de versões das atualizações que o senhor pode consultar.