workspace repositório de recursos (Legado)

Observação

Esta documentação abrange o workspace repositório de recursos. Use esta página somente se o seu workspace não estiver habilitado para Unity Catalog.

Databricks recomenda o uso do recurso engenharia em Unity Catalog. workspace repositório de recursos será descontinuado no futuro.

Por que usar o workspace repositório de recursos?

workspace O repositório de recursos é totalmente integrado a outros componentes do Databricks.

  • Possibilidade de descoberta. A interface do Feature Store, acessível a partir do espaço de trabalho do Databricks, permite que você navegue e pesquise recursos existentes.

  • Linhagem. Quando o senhor cria uma tabela de recursos em Databricks, a fonte de dados usada para criar a tabela de recursos é salva e fica acessível. Para cada recurso em uma tabela de recursos, o senhor também pode acessar os modelos, o Notebook, o Job e o endpoint que usam o recurso.

  • Integração com pontuação e veiculação de modelo. Quando você usa recursos da Feature Store para treinar um modelo, o modelo é empacotado com metadados de recursos. Quando você usa o modelo para pontuação em lote ou inferência on-line, ele recupera automaticamente os recursos da Feature Store. O chamador não precisa saber sobre eles ou incluir lógica para procurar ou unir recursos para pontuar novos dados. Isso torna a implantação e as atualizações do modelo muito mais fáceis.

  • Pesquisas pontuais. O Feature Store oferece suporte a casos de uso de séries temporais e baseados em eventos que exigem precisão no ponto no tempo.

Como funciona o workspace repositório de recursos?

O típico machine learning fluxo de trabalho usando repositório de recursos segue esse caminho:

  1. Escreva um código para converter dados brutos em recurso e crie um Spark DataFrame contendo o recurso desejado.

  2. Escreva o DataFrame como uma tabela de recursos no workspace repositório de recursos.

  3. ensinar um modelo usando recurso do repositório de recursos. Quando o senhor faz isso, o modelo armazena as especificações do recurso usado para o treinamento. Quando o modelo é usado para inferência, ele automaticamente junta recurso das tabelas de recurso apropriadas.

  4. modelo de registro em Model Registry.

Agora o senhor pode usar o modelo para fazer previsões sobre novos dados. O modelo recupera automaticamente o recurso necessário do repositório de recursos.

repositório de recursos fluxo de trabalho para lotes machine learning casos de uso.

começar a usar workspace repositório de recursos

Para começar, experimente estes exemplos do Notebook. O site básico Notebook mostra aos senhores como criar uma tabela de recursos, usá-la para ensinar um modelo e, em seguida, realizar a pontuação de lotes usando a pesquisa automática de recursos. Ele também apresenta a UI do recurso engenharia e mostra como o senhor pode usá-la para pesquisar recursos e entender como os recursos são criados e usados.

Exemplo básico de workspace repositório de recursos Notebook

Abra o bloco de anotações em outra guia

O exemplo de táxi Notebook ilustra o processo de criação de recursos, atualizando-os e usando-os para treinamento de modelos e inferência de lotes.

workspace repositório de recursos taxi example Notebook

Abra o bloco de anotações em outra guia

Tipos de dados compatíveis

Para conhecer os tipos de dados compatíveis, consulte Tipos de dados compatíveis.