【C++学習｜豆知識】std::unordered_map の盲点：ハッシュ衝突攻撃を防ぐための防御策

導入：高速な検索の裏に潜む脆弱性

C++の std::unordered_map は、ハッシュテーブルを利用することで平均計算量 O(1) という極めて高速な検索を提供します。しかし、外部からの入力をそのままキーとして使用する場合、意図的に「ハッシュ衝突」を誘発させる攻撃によって、検索性能が O(N) まで低下し、システムのリソースを枯渇させる DoS攻撃（Denial of Service） に繋がるリスクがあります。本記事では、この脆弱性の仕組みと、今日からできる対策を解説します。

基礎知識：ハッシュ衝突とは何か

ハッシュマップは、キーを「ハッシュ関数」に通して得られた値に基づき、データを「バケット」と呼ばれる領域に振り分けます。通常は各バケットにデータが分散されますが、異なるキーが偶然（あるいは悪意を持って）同じハッシュ値を持つとき、これらは同じバケットに格納されます。これを ハッシュ衝突 と呼びます。攻撃者は、ハッシュ値が一致する文字列を大量に送り込むことで、全てのデータを一つのバケットに集中させ、検索速度を線形探索レベルにまで劣化させます。

解決策：カスタムハッシュ関数の導入

標準の `std::hash` は高速ですが、セキュリティ強度は保証されていません。対策として最も有効なのは、ランダムなシード値を用いたハッシュ関数を自作し、`std::unordered_map` に適用することです。これにより、攻撃者が事前に衝突する文字列を予測することが困難になります。また、セキュリティが最優先される要件では、計算量が O(log N) で保証されている std::map（平衡二分探索木）への切り替えも賢明な選択肢です。

サンプルプログラム：安全なハッシュ関数の実装例

以下は、ランダムシードを組み込んだカスタムハッシュ関数の実装例です。

include include include include


// 攻撃耐性を高めるためのカスタムハッシュ構造体

struct SecureHash {

    size_t operator()(const std::string& key) const {

        // 実行時に決定されるランダムなシード値を使用

        static const size_t seed = std::random_device{}();

        std::hash hasher;

        // 基本のハッシュ値とシードをXOR（排他的論理和）することで予測を困難にする

        return hasher(key) ^ (seed + 0x9e3779b9 + (seed << 6) + (seed >> 2));

    }

};
int main() {

    // 第2テンプレート引数に自作のハッシュ関数を指定

    std::unordered_map safe_map;
    safe_map["user_input_1"] = 100;

    safe_map["user_input_2"] = 200;

std::cout << "安全なハッシュテーブルにアクセス: " << safe_map["user_input_1"] << std::endl; return 0; }

応用・注意点：現場での運用指針

1. 入力の制限とバリデーション：
ハッシュマップに渡すキーの長さや文字種に制限を設けるだけでも、攻撃の難易度は大幅に上がります。
2. std::map との使い分け：
データ量がそれほど多くなく、かつ外部からの入力が頻繁に行われる箇所では、性能低下の懸念がない std::map を使用するのが最も安全でコストの低い対策です。
3. コンパイラ実装への依存：
標準ライブラリの実装（GCC, Clang, MSVC）によってデフォルトのハッシュ関数は異なります。環境が変われば攻撃手法も変わる可能性があるため、不特定多数からの入力を扱う場合は常に「標準ハッシュ関数を過信しない」という意識を持つことが重要です。