Use Scikit-Learn em Databricks
Esta página fornece exemplos de como você pode usar o pacote scikit-learn
para ensinar modelo de machine learning no Databricks. Scikit-Learn é uma das bibliotecas Python mais populares para machine learning de nó único e está incluída no Databricks Runtime e no Databricks Runtime ML. Consulte as notas sobre a versão do Databricks Runtime para obter a versão da biblioteca Scikit-Learn incluída no tempo de execução dos seus clusters .
Você pode importar esses Notebook e executá-los em seu espaço de trabalho do Databricks.
Para obter um exemplo adicional do Notebook para começar rapidamente em Databricks, consulte o tutorial: Get começar with IA and machine learning.
Exemplo básico usando Scikit-Learn
Este Notebook fornece uma visão geral rápida do modelo do machine learning treinamento em Databricks. Ele usa o pacote scikit-learn
para ensinar um modelo de classificação simples. Ele também ilustra o uso do MLflow para rastrear o processo de desenvolvimento do modelo e do Optuna para automatizar o ajuste do hiperparâmetro.
Se o seu workspace estiver habilitado para Unity Catalog, use esta versão do Notebook:
Se o seu workspace não estiver habilitado para Unity Catalog, use esta versão do Notebook:
Exemplo completo usando Scikit-Learn no Databricks
Este Notebook usa Scikit-Learn para ilustrar um exemplo completo de carregamento de dados, treinamento de modelo, ajuste de hiperparâmetros distribuídos e inferência de modelo. Ele também ilustra o gerenciamento do ciclo de vida do modelo usando MLflow Model Registry para logs e registrar seu modelo.
Se o seu workspace estiver habilitado para Unity Catalog, use esta versão do Notebook:
Se o seu workspace não estiver habilitado para Unity Catalog, use esta versão do Notebook: