Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ 練習用サンプルデータのインポート | ワークスペースのセットアップ
Databricks基礎:初心者ガイド

練習用サンプルデータのインポート

メニューを表示するにはスワイプしてください

Note
定義

データインジェスチョンは、外部ソースからDatabricks環境へデータを取り込むプロセス。Data Ingestion UIを使用することで、CSVのような生データファイルを、数回のクリックでカタログ内の構造化テーブルへ変換可能。

ワークスペースのセットアップが完了し、クラスターも稼働中。次に、作業対象となるデータが必要。実際の現場では、データはストリーミングセンサーや大規模なクラウドデータベースから取得されることもあるが、多くのデータプロジェクトはシンプルなファイルから始まる。本章では、最新のData Ingestion機能を使い、CSVファイルをアップロードしてカタログ内の永続テーブルへ変換する方法を扱う。

Note
注意

Databricksでデータを取り込む方法はさまざまあり、中にはより高度で複雑なものも存在(たとえば、クラウドプロバイダーで独自のエンドポイントを設定したり、サードパーティアプリケーションと接続したりする方法)。本章では、最も基本的な方法である「自分のコンピュータからデータをアップロードする」手順を紹介。まずはここから始める。

データ取り込みへのアクセス

このツールにアクセスするには、次の2つの方法があります:

  • サイドバー上部の**「New」ボタンをクリックし、「File Upload」**を選択。
  • または、Catalogタブに移動し、**「Create Table」**ボタン(多くの場合プラス記号で表示)をクリック。

ステップ2:ファイルのアップロード

アップロード画面に入ったら、ファイルをドラッグ&ドロップするか、コンピュータから選択可能。

  • シナリオ: この演習では、diamonds.csvというサンプルファイルを使用。
  • アップロード: ファイルがアップロードされると、Databricksは一時的に「ステージング」エリアに保存し、Catalogへの移動準備を行う。

ステップ3:テーブルの設定(プレビュー)

ここが「マジック」が起こる場所です。Databricks はデータのプレビューを表示します。

  • Catalog and Schema: テーブルを配置する場所を選択する必要があります。今回は workspace カタログと default スキーマを使用します;
  • Table Name: テーブルには diamonds などの分かりやすい名前を付けます;
  • Data Types: 列を確認します。Databricks は自動的に列が「String」(テキスト)、「Integer」(数値)、または「Timestamp」(日付)かを推測します。推測が間違っている場合は、UI 上でデータ型を手動で変更できます。

ステップ4:テーブルの作成

Create Table をクリックします。Databricks は、クラスタを使用して CSV を読み込み、高速な Delta Table として書き込む小規模なバックグラウンドジョブを開始します。処理が完了すると、Table UI に移動し、スキーマ、サンプルデータ、さらには閲覧権限を持つユーザーも確認できます。

おめでとうございます!ご自身のパソコンからクラウドネイティブな Lakehouse へデータを正常に移行できました。

1. Data Ingestion UI を使って CSV ファイルをアップロードすると、Databricks はそのファイルを何に変換しますか?

2. データ取り込みプロセスにおいて「プレビュー」ステップが重要なのはなぜですか?

3. 新しく作成したテーブルを後で見つけたい場合、どのサイドバータブを確認すべきか?

question mark

Data Ingestion UI を使って CSV ファイルをアップロードすると、Databricks はそのファイルを何に変換しますか?

正しい答えを選んでください

question mark

データ取り込みプロセスにおいて「プレビュー」ステップが重要なのはなぜですか?

正しい答えを選んでください

question mark

新しく作成したテーブルを後で見つけたい場合、どのサイドバータブを確認すべきか?

正しい答えを選んでください

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 2.  6

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 2.  6
some-alt