Databricksノートブック入門
ノートブックは、データサイエンスと機械学習において、コードを開発して結果を提示するための一般的なツールです。Databricksにおいて、ノートブックはデータサイエンスと機械学習のワークフローを作成し、同僚とコラボレーションするための主要なツールです。Databricksノートブックは、複数言語でのリアルタイムの共同編集、自動バージョン管理、組み込みのデータビジュアライゼーションを提供します。
Databricksノートブックを使用すると、以下のことが可能です。
結果とノートブックを
.html
形式または.ipynb
形式でエクスポートします。(実験的)高度な編集機能を使用できます。
ノートブックは、 探索的データ分析 (EDA) にも役立ちます。
サンプルノートブックをインポートして実行する方法
Databricksドキュメントには、Databricksの機能の使用方法を説明することを目的とした多くのサンプルノートブックがあります。これらのノートブックのいずれかをDatabricksワークスペースにインポートするには、以下を実行します。
ページに表示されたノートブックプレビューの右上にある「インポート用のリンクをコピー」をクリックします。
ワークスペースブラウザで、ノートブックをインポートする場所に移動します。
フォルダを右クリックし、メニューから「インポート」を選択します。
「URL」ラジオボタンをクリックし、コピーしたリンクをフィールドに貼り付けます。
「インポート」をクリックします。ノートブックがインポートされ、ワークスペースに自動的に表示されます。ノートブックに加えた変更は自動的に保存されます。ワークスペースでのノートブックの編集については、「Databricksノートブックでコードを開発する」を参照してください。
ノートブックを実行するには、ノートブックの上部をクリックします 。 ノートブックと個々のノートブック セルの実行の詳細については、「 Databricks ノートブックの実行」を参照してください。
ワークスペースに新しい空のノートブックを作成するには、「 ノートブックの作成」を参照してください。
Databricksノートブックの使用を開始する
ノートブックの管理:ノートブックの作成、名前変更、削除、ノートブックのパスの取得、エディター設定の構成
セル出力の操作:結果とビジュアライゼーションをダウンロードし、ノートブックでの結果の表示を制御します。
ノートブックを使用したコラボレーション:ノートブックを共有したり、ノートブック内のコメントの使用したりします。