Use Apache Spark MLlib em Databricks
Esta página fornece um exemplo Notebook mostrando como usar o MLlib no Databricks.
Apache Spark MLlib é a biblioteca machine learning do Apache Spark que consiste em algoritmos de aprendizagem comuns e utilidades, incluindo classificação, regressão, clusters, filtragem colaborativa, redução de dimensionalidade e primitivas de otimização subjacentes. Para obter informações de referência sobre os recursos do MLlib, a Databricks recomenda as seguintes referências Spark API :
Para obter informações sobre como usar o Apache Spark MLlib do R, consulte a documentação machine learningdo R.
Exemplo de classificação binária Notebook
Este Notebook mostra como construir um aplicativo de classificação binária usando a API pipeline Apache Spark MLlib.
Notebook de classificação binária
Exemplo de árvores de decisão Notebook
Estes exemplos demonstram várias aplicações de árvores de decisão usando a API pipeline Apache Spark MLlib.
Árvores de decisão
Este Notebook mostra como realizar classificações com árvores de decisão.
Árvores de decisão para Notebookde reconhecimento de dígitos
Árvores de decisão para Notebook de pesquisa SFO
Regressão GBT usando pipelines MLlib
Este Notebook mostra como usar pipelines MLlib para realizar uma regressão usando árvores com gradiente aumentado para prever contagens de aluguel de bicicletas (por hora) a partir de informações como dia da semana, clima, estação do ano e assim por diante.
Notebook de regressão de compartilhamento de bicicleta
Exemplo avançado Notebook Apache Spark MLlib
Este Notebook ilustra como criar um transformador personalizado.