Unity Catalog ボリュームへのファイルのアップロード
ボリュームへのアップロード UI を使用すると、構造化データ、半構造化データ、非構造化データなど、任意の形式のファイルを Unity Catalog ボリュームにアップロードできます。「ボリュームの作成と操作」を参照してください。
アップロードするファイルは 5 ギガバイトを超えることはできません。
Databricks Runtime 13.3 LTS以降では、割り当て済みまたは共有アクセス モードでコンピュートの
.whl
ライブラリ を保存するためにボリュームを使用することがDatabricksによって推奨されています。Databricks Runtime 13.3 LTS以降では、割り当て済みまたは共有アクセス モードでコンピュートの JAR を保存するためにボリュームを使用することがDatabricksによって推奨されています。
アップロードされたファイルから Unity Catalog 管理テーブルを作成できます。 「ボリュームからのテーブルの作成」を参照してください。
ボリュームにアップロードされたファイルに対してさまざまな機械学習やデータサイエンスのワークロードを実行することもできます。 さらに、ライブラリ、証明書、および .whl などの任意の形式のその他の構成ファイルをアップロードできます。 または.txt、 クラスター ライブラリ、ノートブック スコープのライブラリ、またはジョブの依存関係を構成するために使用するもの。
ボリュームにファイルをアップロードするための UI にはどこからアクセスできますか?
この UI には、次の方法でアクセスできます。
サイドバーで、[ 新規 ] > [ データの追加 ] > [ ファイルをボリュームにアップロード] をクリックします。
カタログ エクスプローラーで、[ ボリュームに追加 > アップロード] をクリックします。 カタログ エクスプローラでボリュームを参照しながら、ボリュームまたはボリューム内のディレクトリにファイルを直接アップロードすることもできます。
ノートブック内から、 [ファイル] > [ファイルをボリュームにアップロード]をクリックします。
注
ボリュームは、Databricks Runtime 13.3 LTS 以降でのみサポートされます。 Databricks Runtime 12.2 LTS以前では、/Volumes
パスに対する操作は成功する可能性がありますが、期待どおりにUnity Catalogボリュームにデータが保存されるのではなく、コンピュート クラスターに接続された一時ストレージ ディスクにデータが書き込まれる可能性があります。
始める前に
Unity Catalog ボリュームにファイルをアップロードする前に、次のものが必要です。
Unity Catalog が有効になっているワークスペース。 詳細については、「 Unity Catalog の設定と管理」を参照してください。
ファイルをアップロードするボリュームに対する
WRITE VOLUME
特権。親スキーマに対する
USE SCHEMA
特権親カタログに対する
USE CATALOG
特権。
詳細については、「 Unity Catalog 特権とセキュリティ保護可能なオブジェクト」を参照してください。
ボリューム にファイルをアップロードするためのステップ
Unity Catalog ボリュームにファイルをアップロードするには、次の手順を実行します。
[ 新規 ] > [データの追加] をクリックします。
[ Upload files to volume] をクリックします。
ボリュームまたはボリューム内のディレクトリを選択するか、ボリュームパスを貼り付けます。
ターゲット・スキーマにボリュームが存在しない場合は、ダイアログを使用して新しいボリュームを作成できます。
必要に応じて、ターゲット・ディレクトリーへのフル・パスを指定することにより、ターゲット・ボリューム内に新しいディレクトリーを作成できます。
参照ボタンをクリックするか、ファイルをドロップゾーンに直接ドラッグアンドドロップします。