Labelbox への接続
Labelbox は、画像、ビデオ、オーディオ、テキスト、タイル画像からトレーニング データを作成するために使用されるトレーニング データ プラットフォームです。 Labelboxを使用すると、AIチームはワークフローをカスタマイズして、単一の統合プラットフォームでデータのラベル付け、データカタログ化、およびモデルのデバッグを運用、管理、改善できます。 Labelboxは、AIチームが本番グレードの機械学習システムを構築および運用できるように設計されています。
機械学習バージョンの Databricks Runtime を持つ Databricks クラスターをLabelboxに接続できます。
Partner Connect を使用してLabelboxに接続する
このセクションでは、 Partner Connectを使用して Databricks ワークスペース内のクラスターを Labelbox に接続する方法について説明します。
標準接続とLabelbox の違い
Partner Connectを使用して Labelbox に接続するには、「 Partner Connectを使用して機械学習パートナーに接続する」の手順に従います。Labelbox 接続は、次の点で標準の機械学習接続とは異なります。
クラスター、サービスプリンシパル、および個人用アクセストークンに加えて、 Partner Connect は Labelbox アカウントの ワークスペース/共有/labelbox_demo フォルダーに
labelbox_databricks_example.ipynb
という名前のノートブックを作成します (まだ存在しない場合)。
接続するステップ
Partner Connectを使用してLabelboxに接続するには、次の手順を実行します。
ラベルボックスアカウントのLabelboxAPIキー を作成しません(お持ちでない場合)。API キーをコピーして安全な場所に保存します (キーは最終的に非表示になり、後でこのキーが必要になります)。
Labelboxに手動で接続する
このセクションのステップ では、Labelboxを Databricks クラスターに接続する方法について説明します。
注
より速く接続するには、 Partner Connectを使用します。
要件
Machine Learning 用の Databricks Runtime を実行している利用可能なクラスターが必要です。 既存のクラスターについてこれを確認するには、ワークスペースで クラスターを表示する ときに、 列で Runtime「機械学習」 を探します。使用可能な Databricks Runtime 機械学習クラスターがない場合は、クラスターを作成し、 [Databricks Runtime バージョン]で機械学習リストからバージョンを選択します。
接続するステップ
Labelboxに手動で接続するには、次の手順を実行します。
Labelboxページに移動して、新しいLabelboxアカウ ン トに サイン アップ するか、既存の Labelbox アカウントにログインします。
ラベルボックスアカウントのLabelboxAPIキー を作成しません(お持ちでない場合)。API キーをコピーして安全な場所に保存します (キーは最終的に非表示になり、後でこのキーが必要になります)。
ワークスペースで Labelbox スターター ノートブックを確認します。
サイドバーで、「 ワークスペース」>「共有」をクリックします。
labelbox_demo という名前のフォルダーが存在しない場合は、作成します。
[ 共有] の横にある下矢印をクリックします。
[ > フォルダーの作成] をクリックします。
labelbox_demo
と入力します。[ フォルダーの作成] をクリックします。
labelbox_demo フォルダーをクリックします。labelbox_databricks_example.ipynb という名前のスターター ノートブックがフォルダーに存在しない場合は、インポートします。
[labelbox_demo] の横にある下矢印をクリックします。
[ インポート] をクリックします。
[URL] をクリックします。
https://github.com/Labelbox/labelbox-python/blob/develop/examples/integrations/databricks/labelbox_databricks_example.ipynb
を入力し、[インポート] をクリックします。
引き続き、機械学習クラスターとLabelbox スターター ノートブックの設定を行います。
機械学習クラスターとLabelbox スターター ノートブックを設定する
必要な Labelbox ライブラリが機械学習クラスターにインストールされていることを確認します。
サイドバーで、「 コンピュート」をクリックします。
機械学習クラスターをクリックします。 必要に応じて、[ フィルター ] ボックスを使用して検索します。
注
Partner Connect を使用して Labelbox に接続した場合は、機械学習クラスターの名前を LABELBOX_CLUSTER にする必要があります。
「ライブラリ」 タブをクリックします。
labelbox パッケージがリストにない場合は、インストールします。
[ 新規インストール] をクリックします。
PyPIをクリックします。
[パッケージ] に「 Labelbox」と入力します。
「 インストール」をクリックします。
labelspark パッケージがリストにない場合は、インストールします。
[ 新規インストール] をクリックします。
PyPIをクリックします。
[パッケージ] に「 ラベルパーク」と入力します。
「 インストール」をクリックします。
機械学習クラスターをスターター ノートブックにアタッチします。
サイドバーで、[ワークスペース] > [共有> labelbox_demo > labelbox_databricks_example.ipynb] をクリックします。
ML クラスターをノートブックにアタッチ します。
ノートブックを参照して、Labelbox を自動化する方法について説明します。
関連リソース
README の GitHub でスターター ノートブックを入手