単一ノードの PyTorch を分散型に適応させる ディープラーニング

PyTorch を使用して機械学習モデルの分散トレーニングを実行する方法について説明します。

このノートブックは、推奨される 開発ワークフローに従います。 最初に、単一ノードでモデルをトレーニングする方法を示し、次に分散トレーニングに HorovodRunner を使用してコードを適応させる方法を示します。

HorovodRunner PyTorch MNIST サンプルノートブック

ノートブックを新しいタブで開く