失敗したジョブまたはエグゼキューターが削除されました

失敗したジョブや削除されたエグゼキューターが表示されます。

ジョブの失敗

エグゼキューターが削除される最も一般的な理由は次のとおりです。

  • オートスケール: この場合は予想通りであり、エラーではありません。 「オートスケールを有効にする」を参照してください。

  • スポットインスタンスの損失: クラウドプロバイダーが VM を回収しています。 スポットインスタンスの詳細については 、こちらを参照してください

  • エグゼキューターのメモリ不足

失敗した

失敗しているジョブを見つけた場合は、それらをクリックしてそのページに移動します。 次に、下にスクロールして、失敗したステージと失敗の理由を確認します。

失敗の理由

一般的なエラーが表示される場合があります。 説明のリンクをクリックして、詳細情報を取得できるかどうかを確認してください。

障害の説明

このページを下にスクロールすると、各タスクが失敗した理由を確認できます。 この場合、メモリの問題があることが明らかになりつつあります。

失敗したタスク

失敗したエグゼキューター

エグゼキューターが失敗する理由を調べるには、まずコンピュートのイベント ログをチェックして、エグゼキューターが失敗した理由の説明があるかどうかを確認します。 たとえば、スポットインスタンスを使用していて、クラウドプロバイダーがそれを回収している可能性があります。

イベントLog

エグゼキューターの喪失を説明するイベントがあるかどうかを確認します。 たとえば、クラスターのサイズが変更されていることや、スポットインスタンスが失われていることを示すメッセージが表示される場合があります。

イベント ログに情報が表示されない場合は、 Spark UIに戻り、 [エグゼキューター]タブをクリックします。

エグゼキューター タブ

ここで、失敗したエグゼキューターからのログを取得できます。

失敗したエグゼキューターの例

次のステップ

ここまで来たら、最も可能性の高い説明はメモリの問題です。 次のステップは、メモリの問題を詳しく調べることです。 Spark メモリの問題を参照してください。