Acompanhe o desenvolvimento do modelo usando MLflow

Este artigo contém exemplos de desenvolvimento de modelo de acompanhamento em Databricks. registra e rastreia modelos de ML e aprendizagem profunda automaticamente com MLflow ou manualmente com a API MLflow.

Modelo de acompanhamento & MLflow

O processo de desenvolvimento do modelo é iterativo e pode ser um desafio acompanhar seu trabalho à medida que você desenvolve e otimiza um modelo. No Databricks, você pode usar o acompanhamento do MLflow para ajudá-lo a acompanhar o processo de desenvolvimento do modelo, incluindo configurações ou combinações de parâmetros que você tentou e como elas afetaram o desempenho do modelo.

O acompanhamento do MLflow usa experimentos e execução para registrar e rastrear o desenvolvimento do seu modelo de ML e aprendizagem profunda. Uma execução é uma execução única do código do modelo. Durante uma execução do MLflow, você pode modelar parâmetros e resultados registrados. Um experimento é uma coleção de execuções relacionadas. Em um experimento, você pode comparar e filtrar a execução para entender o desempenho do seu modelo e como seu desempenho depende das configurações dos parâmetros, dos dados de entrada e assim por diante.

O Notebook neste artigo fornece exemplos simples que podem ajudá-lo a começar rapidamente a usar o MLflow para acompanhar o desenvolvimento do seu modelo. Para obter mais detalhes sobre como usar o acompanhamento do MLflow no Databricks, consulte Acompanhar ML e aprendizagem profunda execução de treinamento.

Observação

O acompanhamento do MLflow não suporta Job enviado com spark_submit_task na API Jobs. Em vez disso, você pode usar projetos MLflow para executar o código Spark.

Use o registro automático para rastrear o desenvolvimento do modelo

O MLflow pode registrar automaticamente o código de treinamento escrito em muitas estruturas de ML e aprendizagem profunda. Esta é a maneira mais fácil de começar a usar o acompanhamento do MLflow.

Este Notebook de exemplo mostra como usar o registro automático com Scikit-Learn. Para obter informações sobrelogsautomáticos com outras bibliotecas Python, consulte logs automáticos de execução de treinamento para MLflow.

Notebook Python com registro automático do MLflow

Abra o bloco de anotações em outra guia

Use a API de registro para acompanhar o desenvolvimento do modelo

Este Notebook ilustra como usar a API de criação de log MLflow. O uso da API de criação de logsoferece mais controle sobre os logs s de métricas e permite que você logs artefatos adicionais, como tabelas ou gráficos.

Este Notebook de exemplo mostra como usar a API de log do Python. O MLflow também possui APIs REST, R e Java.

API de registro do MLflow Python Notebook

Abra o bloco de anotações em outra guia

Exemplo de ponta a ponta

Este tutorial Notebook apresenta um exemplo de ponta a ponta de treinamento de um modelo em Databricks, incluindo carregamento de dados, visualização dos dados, configuração de uma otimização de hiperparâmetro paralelo e uso do MLflow para revisar os resultados, registrar o modelo e executar inferência em novos uso de dados do modelo registrado em um Spark UDF.

Requisitos

Databricks Runtime ML

Notebook de exemplo

Observação

O Notebook a seguir pode incluir funcionalidades que não estão disponíveis nesta versão do Databricks on Google Cloud.

Se o seu workspace estiver habilitado para Unity Catalog, use esta versão do Notebook:

Use Scikit-Learn com a integração de MLflow em Databricks (Unity Catalog)

Abra o bloco de anotações em outra guia

Se o seu workspace não estiver habilitado para Unity Catalog, use esta versão do Notebook:

Use o site Scikit-Learn com a integração MLflow no Databricks

Abra o bloco de anotações em outra guia