Configurar e editar Databricks tarefa

Este artigo concentra-se nas instruções para criar, configurar e editar tarefas usando o fluxo de trabalho workspace UI.

Databricks gerenciar tarefas como componentes do site Databricks Jobs. Um trabalho tem uma ou mais tarefas. O senhor cria um novo trabalho na interface do usuário workspace configurando a primeira tarefa. Para configurar um novo Job, consulte Configurar e editar Databricks Jobs.

Cada tarefa tem um recurso associado compute que executa a lógica da tarefa. Consulte Configurar compute para o trabalho.

Databricks tem outros pontos de entrada e ferramentas para a configuração da tarefa, incluindo o seguinte:

Criar ou configurar uma tarefa

Para editar uma tarefa existente ou adicionar uma nova tarefa com a UI do workspace, selecione um trabalho existente usando os seguintes passos:

  1. Clique em fluxo de trabalho Icon fluxo de trabalho na barra lateral.

  2. Na coluna Nome, clique no nome do cargo.

  3. Clique na tarefa tab. A tarefa gráfica é exibida.

  4. Para editar uma tarefa, clique no nome da tarefa. A configuração da tarefa aparece abaixo do gráfico da tarefa.

  5. Para adicionar uma tarefa, clique em Botão adicionar tarefa.

Tipos de tarefa

As opções e instruções de configuração variam de acordo com a tarefa. Os seguintes tipos de tarefa estão disponíveis:

Clonar uma tarefa

Clone tarefa para copiar todas as configurações de uma tarefa existente, inclusive as dependências upstream.

Para clonar uma tarefa, faça o seguinte:

  1. Selecione a tarefa no gráfico de tarefas.

  2. Clique Botão Clonar tarefa.

  3. Especifique um nome de tarefa clonada e clique em Clonar.

Excluir uma tarefa

Para excluir uma tarefa, faça o seguinte:

  1. Selecione a tarefa no gráfico de tarefas.

  2. Clique em Lixo e selecione Delete task (Excluir tarefa).

Copiar um caminho de tarefa

Alguns tipos de tarefa, por exemplo, tarefas do notebook, permitem que você copie o caminho do código-fonte da tarefa:

  1. Clique na aba Tarefas.

  2. Selecione a tarefa que contém o caminho para copiar.

  3. Clique em Ícone de cópia de jobs ao lado do caminho da tarefa para copiar o caminho para a área de transferência.

Configurações avançadas de tarefa

As seguintes configurações avançadas controlam as novas tentativas de tarefas com falha e as políticas de tempo limite para tarefas que não respondem.

Observação

O senhor pode definir notificações no nível da tarefa ou do trabalho. Consulte Adicionar email e notificações do sistema para eventos de trabalho.

Defina uma política de repetição

A configuração default para novas tentativas de tarefa depende da configuração do trabalho. Na maioria das configurações, a configuração default não tenta novamente nenhuma tarefa em caso de falha.

O trabalho contínuo usa uma política de repetição de backoff exponencial. Consulte Como as falhas são tratadas no trabalho contínuo?

Para configurar uma política que determina quando e quantas vezes a execução de tarefas com falha é repetida, clique em + Add (Adicionar ) ao lado de Retries (Tentativas).

O intervalo de nova tentativa é calculado em milissegundos entre o início da execução com falha e a execução de nova tentativa subsequente.

Observação

Se você configurar o tempo limite e as novas tentativas, o tempo limite se aplicará a cada nova tentativa.

Configurar um tempo de conclusão esperado ou um tempo limite para uma tarefa

O senhor pode configurar um limite de duração opcional para uma tarefa, incluindo um tempo de conclusão esperado e máximo. Para configurar a duração limite, clique em duração limite.

Digite uma duração no campo Warning (Aviso) para configurar o tempo de conclusão esperado da tarefa. Se a tarefa exceder esse limite, um evento será acionado. O senhor pode usar esse evento para notificar quando uma tarefa estiver sendo executada lentamente. Consulte Configurar notificações para trabalhos de execução lenta ou atrasada.

Para configurar um tempo máximo de conclusão para uma tarefa, insira a duração máxima no campo Tempo limite. Se a tarefa não for concluída nesse período, o Databricks definirá seu status como "Timed Out".