学ぶハッシュインデックス | クエリ最適化.インデックス

メニューを表示するにはスワイプしてください

特定の状況では、情報を効率的に検索するためにインデックスが必要ですが、B-treeインデックスを使用すると過度に複雑で冗長になる場合があります。このような場合、ハッシュインデックスがより適した選択肢となります。

ハッシュインデックスは、ハッシュ関数を使用してインデックス化された値をハッシュテーブル内の位置にマッピングするデータベースインデックスの一種です。
このインデックスタイプでは、対象カラムの値がハッシュ化され、固定サイズの値またはハッシュコードに変換されます。このハッシュコードがインデックスとして使用され、データ行を取得します。

仕組み

ハッシュインデックスでは、ハッシュ処理によってインデックスキーの値がハッシュ関数でハッシュコードに変換されます。このハッシュコードを使用して、対応するデータがインデックス内のどの場所（バケット）に格納されているかが決定されます。

図書館カタログシステムのハッシュインデックスを考えてみます。ここでは各書籍タイトルがISBN（国際標準図書番号）でインデックス化されています。

この例では、ハッシュ関数を利用して書籍のISBNを0x7FA4のような16進数のハッシュコードに変換します。これはISBNの数字に一連の数学的操作を行うことで得られます。
このハッシュコードが一意の識別子となり、ハッシュテーブル内のスロットを決定します。そのスロットには、該当する書籍のすべての情報が含まれるテーブルの該当行へのリンクがあります。

主な特徴

高速な検索: ハッシュインデックスは等価比較に対して高速な検索を提供します。特定の値を検索する際、PostgreSQLはその値のハッシュを計算し、インデックス内の該当位置に直接アクセスするため、データ取得が非常に効率的です；
演算子サポートの制限: B-treeインデックスとは異なり、ハッシュインデックスは等価比較（=）のみをサポートし、範囲検索（<, >, <=, >=）やソートはサポートしません。この制限により、ハッシュインデックスはB-treeインデックスに比べて汎用性が低くなります；
特定用途での高速性: ワークロードが等価検索を大量に含む場合（主キーや一意制約の強制など）、ハッシュインデックスはB-treeインデックスよりも高いパフォーマンスを発揮します。ただし、範囲検索やハッシュアルゴリズムに適合しないデータでは、その利点は小さくなります。

実装

SQLでハッシュインデックスを実装するには、次のステートメントを使用します：

CREATE INDEX hash_index_name ON table_name USING HASH (column_name1, column_name2,... );

この結果、column_name1, column_name2,...の値がハッシュ化され、ハッシュテーブルが作成されます。これにより、必要なデータ行の高速な取得が可能となります。

すべて明確でしたか？

フィードバックありがとうございます！

セクション 2. 章 4

AIに質問する

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 2. 章 4