Get Começar: Consultar e visualizar dados de um Notebook

Este get começar artigos orienta o senhor a usar um Databricks Notebook para consultar dados de amostra armazenados em Unity Catalog usando SQL, Python, Scala e R e, em seguida, visualizar os resultados da consulta no Notebook.

Requisitos

Para concluir a tarefa neste artigo, o senhor deve atender aos seguintes requisitos:

O site workspace deve ter Unity Catalog habilitado. Para obter informações sobre como começar com Unity Catalog, consulte Configurar e gerenciar Unity Catalog.
O senhor deve ter permissão para usar um recurso compute existente ou criar um novo recurso compute. Consulte Começar com Databricks ou consulte o administrador do site Databricks.

o passo 1: Criar um novo Notebook

Para criar um Notebook em seu workspace, clique em New na barra lateral e, em seguida, clique em Notebook. Um Notebook em branco é aberto no site workspace.

Para saber mais sobre como criar e gerenciar notebooks, consulte Gerenciar notebooks.

o passo 2: Consultar uma tabela

Consulte a tabela samples.nyctaxi.trips no Unity Catalog usando o idioma de sua escolha.

Copie e cole o código a seguir na nova célula vazia do site Notebook. Este código exibe os resultados da consulta da tabela samples.nyctaxi.trips no Unity Catalog.

SELECT * FROM samples.nyctaxi.trips

display(spark.read.table("samples.nyctaxi.trips"))

display(spark.read.table("samples.nyctaxi.trips"))

library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))

Pressione Shift+Enter para executar a célula e depois passe para a próxima célula.

Os resultados da consulta aparecem no site Notebook.

o passo 3: Exibir os dados

Exibir o valor médio da tarifa por distância de viagem, agrupado pelo código postal de retirada.

Próximo da guia Tabela, clique em + e, em seguida, clique em Visualização.

O editor de visualização é exibido.
No menu suspenso Visualization Type (Tipo de visualização ), verifique se Bar está selecionado.
Selecione fare_amount para a coluna X.
Selecione trip_distance para a coluna Y.
Selecione Average como o tipo de agregação.
Selecione pickup_zip como a coluna Group by (Agrupar por ).
Clique em Salvar.

Próximos passos

Para saber mais sobre como adicionar dados do arquivo CSV ao Unity Catalog e visualizar dados, consulte Get começar: Importar e visualizar dados de CSV de um arquivo Notebook.
Para saber como carregar dados em Databricks usando Apache Spark, consulte tutorial: Carga e transformação de dados usando Apache Spark DataFrames .
Para saber mais sobre a ingestão de dados no Databricks, consulte Ingerir dados em um Databricks lakehouse.
Para saber mais sobre a consulta de dados com o Databricks, consulte Consultar dados.
Para saber mais sobre visualizações, consulte Visualizações em Databricks Notebook.
Para saber mais sobre as técnicas de análise exploratória de dados (EDA), consulte o tutorial: EDA techniques using Databricks Notebook.