Unity Catalog ボリュームへのファイルのアップロード

ボリュームへのアップロード UI を使用すると、構造化データ、半構造化データ、非構造化データなど、任意の形式のファイルを Unity Catalog ボリュームにアップロードできます。「ボリュームの作成と操作」を参照してください。

アップロードするファイルは 5 ギガバイトを超えることはできません。

  • Databricks Runtime 13.3 LTS以降では、割り当て済みまたは共有アクセス モードでコンピュートの .whl ライブラリ を保存するためにボリュームを使用することがDatabricksによって推奨されています。

  • Databricks Runtime 13.3 LTS以降では、割り当て済みまたは共有アクセス モードでコンピュートの JAR を保存するためにボリュームを使用することがDatabricksによって推奨されています。

アップロードされたファイルから Unity Catalog 管理テーブルを作成できます。 「ボリュームからのテーブルの作成」を参照してください。

ボリュームにアップロードされたファイルに対してさまざまな機械学習やデータサイエンスのワークロードを実行することもできます。 さらに、ライブラリ、証明書、および .whl などの任意の形式のその他の構成ファイルをアップロードできます。 または.txt、 クラスター ライブラリ、ノートブック スコープのライブラリ、またはジョブの依存関係を構成するために使用するもの。

ボリュームにファイルをアップロードするための UI にはどこからアクセスできますか?

この UI には、次の方法でアクセスできます。

  • サイドバーで、[ 新規 ] > [ データの追加 ] > [ ファイルをボリュームにアップロード] をクリックします。

  • カタログ エクスプローラーで、[ ボリュームに追加 > アップロード] をクリックします。 カタログ エクスプローラでボリュームを参照しながら、ボリュームまたはボリューム内のディレクトリにファイルを直接アップロードすることもできます。

  • ノートブック内から、 [ファイル] > [ファイルをボリュームにアップロード]をクリックします。

ボリュームは、Databricks Runtime 13.3 LTS 以降でのみサポートされます。 Databricks Runtime 12.2 LTS以前では、/Volumes パスに対する操作は成功する可能性がありますが、期待どおりにUnity Catalogボリュームにデータが保存されるのではなく、コンピュート クラスターに接続された一時ストレージ ディスクにデータが書き込まれる可能性があります。

始める前に

Unity Catalog ボリュームにファイルをアップロードする前に、次のものが必要です。

  • Unity Catalog が有効になっているワークスペース。 詳細については、「 Unity Catalog の設定と管理」を参照してください。

  • ファイルをアップロードするボリュームに対する WRITE VOLUME 特権。

  • 親スキーマに対する USE SCHEMA 特権

  • 親カタログに対する USE CATALOG 特権。

詳細については、「 Unity Catalog 特権とセキュリティ保護可能なオブジェクト」を参照してください。

ボリューム にファイルをアップロードするためのステップ

Unity Catalog ボリュームにファイルをアップロードするには、次の手順を実行します。

  1. [ 新規 ] > [データの追加] をクリックします。

  2. [ Upload files to volume] をクリックします。

  3. ボリュームまたはボリューム内のディレクトリを選択するか、ボリュームパスを貼り付けます。

    • ターゲット・スキーマにボリュームが存在しない場合は、ダイアログを使用して新しいボリュームを作成できます。

    • 必要に応じて、ターゲット・ディレクトリーへのフル・パスを指定することにより、ターゲット・ボリューム内に新しいディレクトリーを作成できます。

  4. 参照ボタンをクリックするか、ファイルをドロップゾーンに直接ドラッグアンドドロップします。