Get Começar: Consultar e visualizar dados de um Notebook
Este get começar artigos orienta o senhor a usar um Databricks Notebook para consultar dados de amostra armazenados em Unity Catalog usando SQL, Python, Scala e R e, em seguida, visualizar os resultados da consulta no Notebook.
Requisitos
Para concluir a tarefa neste artigo, o senhor deve atender aos seguintes requisitos:
O site workspace deve ter Unity Catalog habilitado. Para obter informações sobre como começar com Unity Catalog, consulte Configurar e gerenciar Unity Catalog.
O senhor deve ter permissão para usar um recurso compute existente ou criar um novo recurso compute. Consulte Começar com Databricks ou consulte o administrador do site Databricks.
o passo 1: Criar um novo Notebook
Para criar um Notebook em seu workspace, clique em New na barra lateral e, em seguida, clique em Notebook. Um Notebook em branco é aberto no site workspace.
Para saber mais sobre como criar e gerenciar notebooks, consulte Gerenciar notebooks.
o passo 2: Consultar uma tabela
Consulte a tabela samples.nyctaxi.trips
no Unity Catalog usando o idioma de sua escolha.
Copie e cole o código a seguir na nova célula vazia do site Notebook. Este código exibe os resultados da consulta da tabela
samples.nyctaxi.trips
no Unity Catalog.SELECT * FROM samples.nyctaxi.trips
display(spark.read.table("samples.nyctaxi.trips"))
display(spark.read.table("samples.nyctaxi.trips"))
library(SparkR) display(sql("SELECT * FROM samples.nyctaxi.trips"))
Pressione
Shift+Enter
para executar a célula e depois passe para a próxima célula.Os resultados da consulta aparecem no site Notebook.
o passo 3: Exibir os dados
Exibir o valor médio da tarifa por distância de viagem, agrupado pelo código postal de retirada.
Próximo da guia Tabela, clique em + e, em seguida, clique em Visualização.
O editor de visualização é exibido.
No menu suspenso Visualization Type (Tipo de visualização ), verifique se Bar está selecionado.
Selecione
fare_amount
para a coluna X.Selecione
trip_distance
para a coluna Y.Selecione
Average
como o tipo de agregação.Selecione
pickup_zip
como a coluna Group by (Agrupar por ).Clique em Salvar.
Próximos passos
Para saber mais sobre como adicionar dados do arquivo CSV ao Unity Catalog e visualizar dados, consulte Get começar: Importar e visualizar dados de CSV de um arquivo Notebook.
Para saber como carregar dados em Databricks usando Apache Spark, consulte tutorial: Carga e transformação de dados usando Apache Spark DataFrames .
Para saber mais sobre a ingestão de dados no Databricks, consulte Ingerir dados em um Databricks lakehouse.
Para saber mais sobre a consulta de dados com o Databricks, consulte Consultar dados.
Para saber mais sobre visualizações, consulte Visualizações em Databricks Notebook.