Adicionar comentários gerados por IA a uma tabela

Este artigo apresenta os comentários de tabelas e colunas gerados por IA (também conhecidos como documentação gerada por IA), explica como eles funcionam, mostra como adicioná-los e editá-los e responde a perguntas frequentes.

Como funcionam os comentários gerados por IA?

Como proprietário de uma tabela ou usuário com permissão para modificar uma tabela, o senhor pode usar o Catalog Explorer para view e adicionar um comentário gerado pela IA para qualquer tabela ou coluna de tabela gerenciada por Unity Catalog. Os comentários são alimentados por um grande modelo de linguagem (LLM) que leva em conta account os metadados da tabela, como o esquema da tabela e os nomes das colunas.

Os comentários gerados pela IA oferecem uma maneira rápida de ajudar os usuários a descobrir dados gerenciados por Unity Catalog.

Importante

Os comentários gerados pela IA têm o objetivo de fornecer uma descrição geral das tabelas e colunas com base no esquema. As descrições são ajustadas para dados em um contexto comercial e empresarial, usando esquemas de exemplo de vários conjuntos de dados abertos de várias indústrias. O modelo foi avaliado com centenas de amostras simuladas para verificar se ele evita a geração de descrições prejudiciais ou inadequadas.

Os modelos de IA nem sempre são precisos e os comentários devem ser revisados antes de serem salvos. A Databricks recomenda enfaticamente a revisão humana dos comentários gerados por IA para verificar se há imprecisões. Não se deve confiar no modelo para tarefas de classificação de dados, como a detecção de colunas com PII.

Os usuários com privilégios USE SCHEMA e SELECT na tabela podem view comentários depois de adicionados.

Para obter informações sobre os modelos usados para gerar sugestões de comentários, consulte Perguntas frequentes sobre comentários de tabela gerados por IA.

Antes de começar

Adicionar comentários gerados por IA

O senhor deve usar o Catalog Explorer para acessar view os comentários sugeridos, editá-los e adicioná-los a tabelas e colunas.

Permissões necessárias: O senhor deve ser o proprietário da tabela ou ter o privilégio MODIFY na tabela para view o comentário sugerido pela IA, editá-lo e adicioná-lo.

Adicionar um comentário sugerido pela IA a uma tabela

  1. Em seu site Databricks workspace, clique em Ícone do catálogo Catalog.

  2. Pesquise ou navegue até a tabela e selecione-a.

  3. view o campo IA Suggested Comment no painel About this table (Sobre esta tabela ).

    Campo de edição de comentários gerado por IA

    A IA pode demorar um pouco para gerar o comentário.

  4. Clique em Accept (Aceitar ) para aceitar o comentário como está, ou Edit (Editar ) para modificá-lo antes de salvá-lo.

Adicionar um comentário sugerido por IA a uma coluna

  1. Em seu site Databricks workspace, clique em Ícone do catálogo Catalog.

  2. Pesquise ou navegue até a tabela e selecione-a.

  3. acima dos títulos das colunas da tabela, clique no botão Gerar IA.

    É gerado um comentário para cada coluna.

  4. Clique na marca de seleção ao lado do comentário da coluna para aceitá-lo ou fechá-lo sem salvar.

Atualizar um comentário gerado por IA

O proprietário da tabela ou o usuário com o privilégio MODIFY na tabela pode atualizar os comentários da tabela e da coluna a qualquer momento, usando a interface do usuário do Catalog Explorer ou SQL comando (ALTER TABLE ou COMMENT ON).

Perguntas frequentes sobre comentários de tabela gerados por IA

Esta seção fornece informações gerais sobre comentários de tabela gerados por IA (também conhecidos como documentação gerada por IA) na forma de perguntas frequentes.

Qual é o serviço usado pelo recurso de documentação gerado pela IA?

No espaço de trabalho habilitado para HIPAA complianceos comentários gerados pela IA podem usar parceiros de modelos externos para fornecer respostas.

Para todos os outros espaços de trabalho em GCP, os comentários gerados pela IA usam um modelo interno de linguagem grande (LLM).

Independentemente de o modelo ser interno ou externo, os dados enviados a esses modelos não são usados para o treinamento do modelo. Os modelos em si são sem estado: nenhum prompt ou conclusão é armazenado pelos provedores de modelos.

Em quais regiões o servindo modelo endpoint está hospedado?

Os dados da União Europeia (UE) permanecem na UE. Para modelos de parceiros externos, o espaço de trabalho da União Europeia (UE) usa um modelo externo hospedado na UE. Todas as outras regiões usam um modelo externo hospedado nos EUA. Para modelos internos do Databricks, o espaço de trabalho da União Europeia (UE) usa um modelo hospedado em eu-west-1. Todo o restante do tráfego é enviado para a região us-west-2 durante a Public Preview.

Como os dados são criptografados entre a Databricks e os parceiros externos do modelo?

O tráfego entre Databricks e parceiros externos do modelo é criptografado em trânsito usando a criptografia TLS 1.2 padrão das indústrias.

Tudo está criptografado em repouso?

Todos os dados armazenados em um Databricks workspace são criptografados em AES-256 bits. Nossos parceiros externos não armazenam nenhuma solicitação ou conclusão enviada a eles.

Quais dados são enviados para os modelos?

A Databricks envia os seguintes metadados para os modelos com cada solicitação de API:

  • Esquema de tabela (nome do catálogo, nome do esquema, nome da tabela, comentário atual)

  • Nomes de colunas (nome da coluna, tipo, primária key ou não, comentário da coluna atual)

Os comentários de tabela ou coluna aprovados são armazenados no banco de dados do plano de controle do Databricks, juntamente com o restante dos metadados do Unity Catalog. O banco de dados do plano de controle é criptografado em AES-256 bits.