Adicione comentários gerados por IA a uma tabela

Visualização

Esse recurso está em Prévia Pública.

Como proprietário de tabela ou usuário com permissão para modificar uma tabela, você pode usar o Catalog Explorer para view e adicionar um comentário gerado por IA para qualquer tabela ou coluna de tabela gerenciada pelo Unity Catalog. Os comentários são alimentados por um modelo de linguagem grande (LLM) que leva em account os metadados da tabela, como o esquema da tabela e os nomes das colunas.

Como funcionam os comentários gerados por IA?

Os comentários gerados por IA (também conhecidos como documentação gerada por IA) fornecem uma maneira rápida de ajudar os usuários a descobrir o gerenciamento de dados pelo Unity Catalog.

Importante

Os comentários gerados pela IA têm como objetivo fornecer uma descrição geral de tabelas e colunas com base no esquema. As descrições são ajustadas para dados em um contexto comercial e empresarial, usando esquemas de exemplo de vários dataset abertos em vários setores. O modelo foi avaliado com centenas de amostras simuladas para verificar se evita a geração de descrições prejudiciais ou inadequadas.

Os modelos de IA nem sempre são precisos e os comentários devem ser revisados antes de serem salvos. A Databricks recomenda fortemente a revisão humana dos comentários gerados pela IA para verificar se há imprecisões. O modelo não deve ser utilizado para tarefas de classificação de dados, como detecção de colunas com PII.

Os usuários com privilégios USE SCHEMA e SELECT na tabela poderão view os comentários assim que forem adicionados.

Para obter informações sobre os modelos usados para gerar sugestões de comentários, consulte Perguntas frequentes sobre comentários de tabelas gerados por IA.

Adicione comentários gerados por IA

Você deve usar o Catalog Explorer para view comentários sugeridos, editá-los e adicioná-los a tabelas e colunas.

Permissões necessárias: você deve ser o proprietário da tabela ou ter o privilégio MODIFY na tabela para view o comentário sugerido pela IA, editá-lo e adicioná-lo.

Para adicionar um comentário gerado por IA a uma tabela:

  1. No seu workspace do Databricks, clique em Ícone de catálogo Catálogo.

  2. Pesquise ou procure a tabela e selecione-a.

  3. view o campo Comentário sugerido pela IA abaixo do campo tags .

    Campo de edição de comentários gerado por IA

    A IA pode demorar um pouco para gerar o comentário.

  4. Clique em Aceitar para aceitar o comentário como está ou em Editar para modificá-lo antes de salvá-lo.

Para adicionar um comentário gerado por IA a uma coluna:

  1. No seu workspace do Databricks, clique em Ícone de catálogo Catálogo.

  2. Pesquise ou procure a tabela e selecione-a.

  3. Na Colunas tab, clique no botão Gerar IA .

    Um comentário é gerado para cada coluna.

  4. Clique na marca de seleção ao lado do comentário da coluna para aceitá-lo ou fechá-lo sem salvá-lo.

O proprietário da tabela ou usuário com o privilégio MODIFY na tabela pode atualizar os comentários da tabela e da coluna a qualquer momento, usando a UI do Catalog Explorer ou o comando SQL (ALTER TABLE ou COMMENT ON).

Perguntas frequentes sobre comentários de tabelas gerados por IA

Esta seção fornece informações gerais sobre comentários de tabelas gerados por IA (também conhecidos como documentação gerada por IA) na forma de perguntas frequentes.

Qual serviço o recurso de documentação gerada por IA utiliza?

No workspace habilitado para complianceHIPAA, os comentários gerados por IA podem usar parceiros de modelo externos para fornecer respostas.

Para todos os outros workspace no GCP, os comentários gerados por IA usam um modelo interno de linguagem grande (LLM).

Quer o modelo seja interno ou externo, os dados enviados para esses modelos não são usados para treinamento de modelo. Os próprios modelos não têm estado: nenhum prompt ou conclusão é armazenado pelos provedores de modelo.

Em quais regiões endpoint do modelo de atividade está hospedado?

Os dados da União Europeia (UE) permanecem na UE. Para modelos de parceiros externos, workspace da União Europeia (UE) utiliza um modelo externo hospedado na UE. Todas as outras regiões usam um modelo externo hospedado nos EUA. Para modelos internos do Databricks, workspace da União Europeia (UE) usa um modelo hospedado em eu-west-1. Todo o restante tráfego é enviado para a região us-west-2 durante a visualização pública.

Como os dados são criptografados entre Databricks e parceiros de modelo externo?

O tráfego entre Databricks e parceiros de modelo externo é criptografado em trânsito usando criptografia TLS 1.2 padrão da indústria.

Tudo está criptografado em repouso?

Todos os dados armazenados em um workspace do Databricks são criptografados com AES de 256 bits. Nossos parceiros externos não armazenam nenhuma solicitação ou conclusão enviada a eles.

Quais dados são enviados aos modelos?

O Databricks envia os seguintes metadados aos modelos com cada solicitação de API:

  • Esquema da tabela (nome do catálogo, nome do esquema, nome da tabela, comentário atual)

  • Nomes de colunas (nome da coluna, tipo, key primária ou não, comentário da coluna atual)

Os comentários de tabela ou coluna aprovados são armazenados no banco de dados do plano de controle do Databricks, juntamente com o restante dos metadados do Unity Catalog . O banco de dados do plano de controle é criptografado em AES-256 bits.