Unity Catalog ボリュームへのファイルのアップロード

ボリュームへのアップロード UI を使用すると、構造化データ、半構造化データ、非構造化データなど、任意の形式のファイルを Unity Catalog ボリュームにアップロードできます。Unity Catalogボリュームとはを参照してください

アップロードできるファイルは 5 ギガバイトを超えることはできません。

  • Databricks Runtime 13.3 LTS 以降では、Databricks は、割り当て済みまたは共有アクセス モードを持つコンピュートの.whlライブラリを格納するためにボリュームを使用することをお勧めします。

  • Databricks Runtime 13.3 LTS 以降では、Databricks は、割り当て済みまたは共有アクセス モードのコンピュートの JAR を格納するためにボリュームを使用することをお勧めします。

アップロードされたファイルから Unity Catalog マネージドテーブルを作成できます。 「ボリューム内のデータからテーブルを作成する」を参照してください。

また、ボリュームにアップロードされたファイルに対して、さまざまな機械学習およびデータサイエンスワークロードを実行することもできます。 さらに、ライブラリ、証明書、および任意の形式のその他の構成ファイル (.whl など) をアップロードできます または.txt、 クラスター・ライブラリー、ノートブック・スコープ・ライブラリー、またはジョブの依存関係を構成するために使用するもの。

ボリュームにファイルをアップロードするためのUIには、どこからアクセスできますか?

この UI には、次の方法でアクセスできます。

  • サイドバーで、「 新規 」> 「データを追加」 >「 ファイルをボリュームにアップロード」をクリックします。

  • カタログエクスプローラーで、「 ボリュームに追加 」> 「アップロード」をクリックします。 また、カタログエクスプローラーでボリュームを参照しながら、ファイルをボリュームまたはボリューム内のディレクトリに直接アップロードすることもできます。

  • ノートブック内から、[ ファイル ] > [ ファイルをボリュームにアップロード] をクリックします。

注:

ボリュームは、Databricks Runtime 13.3 LTS 以降でのみサポートされます。 Databricks Runtime 12.2 LTS 以前では、/Volumesパスに対する操作は成功する可能性がありますが、コンピュート クラスターにアタッチされたエフェメラル ストレージ ディスクにデータを書き込むのではなく、期待どおりに Unity Catalog ボリュームにデータを永続化する可能性があります。

始める前に

Unity Catalog ボリュームにファイルをアップロードする前に、次のものが必要です。

  • Unity Catalog が有効になっているワークスペース。 詳細については、「 Unity Catalog の設定と管理」を参照してください。

  • ファイルのアップロード先のボリュームに対する WRITE VOLUME 権限。

  • 親スキーマに対する USE SCHEMA 権限

  • 親カタログに対する USE CATALOG 権限。

詳細については、「 Unity Catalog 特権とセキュリティ保護可能なオブジェクト」を参照してください。

ボリュームにファイルをアップロードするためのステップ

Unity Catalog ボリュームにファイルをアップロードするには、次の操作を行います。

  1. [新規] > [データの追加] をクリックします。

  2. ファイルをボリュームにアップロード」をクリックします。

  3. ボリュームまたはボリューム内のディレクトリを選択するか、ボリュームパスを貼り付けます。

    • ターゲット・スキーマにボリュームが存在しない場合は、ダイアログを使用して新しいボリュームを作成できます。

    • オプションで、ターゲット・ディレクトリーへの絶対パスを指定して、ターゲット・ボリューム内に新しいディレクトリーを作成できます。

  4. 参照ボタンをクリックするか、ファイルをドロップゾーンに直接ドラッグアンドドロップします。

Unity Catalogにファイルをアップロードするその他の方法については、「Unity Catalog ボリューム内のファイルの操作」を参照してください。