arquivos read.parquet usando Databricks

Este artigo mostra como ler dados de arquivos Apache Parquet usando Databricks.

O que é Parquet?

Apache Parquet é um formato de arquivo colunar com otimizações que aceleram query. É um formato de arquivo mais eficiente que CSV ou JSON.

Para mais informações, consulte Arquivos Parquet.

Opções

Consulte os seguintes artigos de referência do Apache Spark para obter as opções de leitura e gravação com suporte.

Exemplo Notebook : ler e gravar em arquivos Parquet

O Notebook a seguir mostra como ler e gravar dados em arquivos Parquet.

Lendo arquivos Parquet Notebook

Abra o bloco de anotações em outra guia