Adicionar comentários gerados por IA aos objetos do Unity Catalog

Este artigo apresenta os comentários de coluna de tabela e objeto Unity Catalog gerados por IA (também conhecidos como documentação gerada por IA), explica como eles funcionam, mostra como adicioná-los e editá-los e responde a perguntas frequentes.

Objetos suportados

Os comentários gerados por IA são compatíveis com os seguintes objetos do Unity Catalog:

  • Catálogos

  • Esquemas

  • tabelas

  • Colunas da tabela

  • Funções

  • Modelos

  • Volumes

Os comentários gerados por IA não são compatíveis com a visualização ou a visualização materializada.

Como funcionam os comentários gerados por IA?

Como proprietário de um objeto ou usuário com permissão para modificar um objeto, o senhor pode usar o Catalog Explorer para view e adicionar um comentário gerado pela IA para objetos e colunas de tabela gerenciados por Unity Catalog. Os comentários são alimentados por um grande modelo de linguagem (LLM) que leva em conta os metadados do objeto account, como o esquema da tabela e os nomes das colunas.

Os comentários gerados pela IA oferecem uma maneira rápida de ajudar os usuários a descobrir dados gerenciados por Unity Catalog.

Importante

Os comentários gerados pela IA têm o objetivo de fornecer uma descrição geral dos objetos e das colunas da tabela com base no esquema. As descrições são ajustadas para dados em um contexto comercial e empresarial, usando esquemas de exemplo de vários conjuntos de dados abertos de várias indústrias. O modelo foi avaliado com centenas de amostras simuladas para verificar se ele evita gerar descrições prejudiciais ou inadequadas.

Os modelos de IA nem sempre são precisos e os comentários devem ser revisados antes de serem salvos. A Databricks recomenda enfaticamente a revisão humana dos comentários gerados por IA para verificar se há imprecisões. Não se deve confiar no modelo para tarefas de classificação de dados, como a detecção de colunas com PII.

Para view comentários depois de adicionados, o senhor deve ter o privilégio SELECT no objeto, USE SCHEMA no esquema pai e USE CATALOG no catálogo pai.

Para obter informações sobre os modelos que são usados para gerar sugestões de comentários, consulte Perguntas frequentes sobre comentários gerados por IA.

Antes de começar

Para que o senhor possa usar os comentários gerados por IA, o site workspace deve estar habilitado para o recurso de assistência de IA. Isso é ativado por default. Se não estiver ativado, o administrador do site workspace deverá fazer o seguinte:

  1. Em Settings (Configurações), acesse Advanced tab e role para baixo até a seção Other (Outros ).

  2. Ative a opção de recurso assistivo da IA alimentada por parceiros.

Adicionar comentários gerados por IA

O senhor deve usar o Catalog Explorer para acessar view os comentários sugeridos, editá-los e adicioná-los a objetos e colunas de tabelas.

Permissões necessárias: O senhor deve ser o proprietário do objeto ou ter o privilégio MODIFY no objeto para view o comentário sugerido pela IA, editá-lo e adicioná-lo.

Adicionar um comentário sugerido pela IA a um objeto

  1. Em seu site Databricks workspace, clique em Ícone do catálogo Catalog.

  2. Pesquise ou procure o objeto e selecione-o.

  3. No painel Sobre este <object>, clique em Gerar IA.

    Botão de comentários gerados por IA

    A IA pode demorar um pouco para gerar o comentário.

  4. Clique em Accept (Aceitar ) para aceitar o comentário como está, ou Edit (Editar ) para modificá-lo antes de salvá-lo.

Adicionar um comentário sugerido pela IA a uma coluna da tabela

  1. Em seu site Databricks workspace, clique em Ícone do catálogo Catalog.

  2. Pesquise ou navegue até a tabela e selecione-a.

  3. acima dos títulos das colunas da tabela, clique em IA generate (Gerar IA).

    É gerado um comentário para cada coluna.

  4. Clique na marca de seleção ao lado do comentário da coluna para aceitá-lo ou fechá-lo sem salvar.

Atualizar um comentário gerado por IA

O proprietário ou usuário do objeto com o privilégio MODIFY no objeto pode atualizar os comentários a qualquer momento, usando a interface do usuário do Catalog Explorer. O assistente de bate-papo em linha ajuda a editar comentários, oferecendo opções para encurtar texto ou traduzir texto para um idioma diferente.

Assistente de comentários em linha gerados por IA

O senhor também pode usar ALTER ou COMMENT ON SQL comando.

Perguntas frequentes sobre comentários gerados por IA

Esta seção fornece informações gerais sobre comentários gerados por IA (também conhecidos como documentação gerada por IA) na forma de perguntas frequentes.

Qual é o serviço usado pelo recurso de documentação gerado pela IA?

No espaço de trabalho habilitado para HIPAA complianceos comentários gerados pela IA podem usar parceiros de modelos externos para fornecer respostas.

Para todos os outros espaços de trabalho em GCP, os comentários gerados pela IA usam um modelo interno de linguagem grande (LLM) para tabelas e colunas. Eles podem usar parceiros de modelo externos para outros objetos do Unity Catalog e o assistente em linha.

Independentemente de o modelo ser interno ou externo, os dados enviados a esses modelos não são usados para o treinamento do modelo. Os modelos em si são sem estado: nenhum prompt ou conclusão é armazenado pelos provedores de modelos.

Em quais regiões o servindo modelo endpoint está hospedado?

Os dados da União Europeia (UE) permanecem na UE. Para modelos de parceiros externos, o espaço de trabalho da União Europeia (UE) usa um modelo externo hospedado na UE. Todas as outras regiões usam um modelo externo hospedado nos EUA. Para modelos internos do Databricks, o espaço de trabalho da União Europeia (UE) usa um modelo hospedado em eu-west-1. Todo o restante do tráfego é enviado para a região us-west-2 durante a Public Preview.

Como os dados são criptografados entre a Databricks e os parceiros externos do modelo?

O tráfego entre Databricks e parceiros externos do modelo é criptografado em trânsito usando a criptografia TLS 1.2 padrão das indústrias.

Tudo está criptografado em repouso?

Todos os dados armazenados em um Databricks workspace são criptografados em AES-256 bits. Nossos parceiros externos não armazenam nenhuma solicitação ou conclusão enviada a eles.

Quais dados são enviados para os modelos?

A Databricks envia os seguintes metadados para os modelos com cada solicitação de API:

  • Catálogo (nome do catálogo, comentário atual, tipo de catálogo)

  • Esquema (nome do catálogo, nome do esquema, comentário atual)

  • Tabela (nome do catálogo, nome do esquema, nome da tabela, comentário atual)

  • Função (nome do catálogo, nome do esquema, nome da função, comentário atual, parâmetros, definição)

  • Modelo (nome do catálogo, nome do esquema, nome do modelo, comentário atual, aliases)

  • Volume (nome do catálogo, nome do esquema, nome do volume, comentário atual)

  • Nomes de colunas (nome da coluna, tipo, primária key ou não, comentário da coluna atual)

Os comentários aprovados são armazenados no banco de dados do plano de controle do Databricks, juntamente com o restante dos metadados do Unity Catalog. O banco de dados do plano de controle é criptografado em AES de 256 bits.