Databricksを使用したParquetファイルの読み取り

この記事では、Databricks を使用して Apache Parquet ファイルからデータを読み取る方法について説明します。

Parquetとは

Apache Parquet は、クエリーを高速化する最適化を備えた列指向ファイル形式です。 これは、CSVJSON よりも効率的なファイル形式です。

詳細については、「 Parquet ファイル」を参照してください。

オプション

サポートされている読み取り/書き込みオプションについては、次の Apache Spark 参照記事をご覧ください。

ノートブックの例: Parquet ファイルの読み取りと書き込み

次のノートブックは、Parquet ファイルに対してデータの読み取りと書き込みを行う方法を示しています。

Parquet ファイル ノートブックの読み取り

ノートブックを新しいタブで開く