1. 導入:なぜこの知識が必要なのか
Javaでの並列処理において、もっとも避けるべきエラーの一つが「ConcurrentModificationException」です。特にマルチスレッド環境でコレクションを操作する場合、単なるArrayListやHashMapでは整合性が保てず、予期せぬクラッシュやデータの不整合を引き起こします。本記事では、並列コレクションが提供する「Fail-safe」および「Weakly consistent(弱一貫性)」なイテレータの仕組みを理解し、安全なコードを書くための指針を解説します。
2. 基礎知識:イテレータの挙動による分類
Javaのコレクションにおけるイテレータは、大きく分けて以下の2種類が存在します。
Fail-fast(高速失敗)
ArrayListやHashMapのイテレータです。反復中にコレクションが変更(追加・削除)されると、即座にConcurrentModificationExceptionをスローします。これはデータの整合性を守るための挙動ですが、並列処理には不向きです。
Fail-safe / Weakly consistent(弱一貫性)
CopyOnWriteArrayListやConcurrentHashMapなどが採用する挙動です。反復中にコレクションが変更されても例外を投げません。イテレータ作成時点の状態を反映したり、反復処理中に変更が反映される場合とされない場合がありますが、少なくとも「例外で停止しない」という特徴があります。
3. 実装/解決策:ConcurrentHashMapの活用
並列環境で最も推奨されるアプローチは、java.util.concurrentパッケージ内のコレクションを使用することです。特にConcurrentHashMapのイテレータは「弱一貫性」を持ち、反復中に要素が追加・削除されても、その時点でのスナップショットや最新の状態に柔軟に対応します。
4. サンプルプログラム
以下のコードは、マルチスレッド環境で安全にMapを操作し、反復処理を行う例です。
import java.util.concurrent.ConcurrentHashMap;
import java.util.Map;
public class ConcurrentCollectionDemo {
public static void main(String[] args) {
// 並列環境で安全なConcurrentHashMapの生成
Map map = new ConcurrentHashMap<>();
map.put("A", "Apple");
map.put("B", "Banana");
// 別スレッドで要素を追加するシミュレーション
new Thread(() -> {
map.put("C", "Cherry");
System.out.println("別スレッドで要素を追加しました。");
}).start();
// メインスレッドで反復処理(弱一貫性により例外は発生しない)
// 反復処理中に別スレッドの変更が反映される可能性がある
for (Map.Entry entry : map.entrySet()) {
System.out.println(entry.getKey() + ": " + entry.getValue());
try {
// 処理の合間に時間を置くことで、別スレッドの変更タイミングを作る
Thread.sleep(100);
} catch (InterruptedException e) {
Thread.currentThread().interrupt();
}
}
}
}
5. 応用・注意点:現場で陥りやすいバグの回避策
弱一貫性の意味を正しく理解する
「弱一貫性」は、反復処理中に「最新の変更が必ず見える」ことを保証するものではありません。あくまで「例外を出さずに走査を完遂する」ことを優先した仕組みです。厳密な整合性が必要な場合は、反復処理の外側で明示的な同期(synchronizedブロックやReentrantLock)を行う必要があります。
Sequenced Collectionsとの使い分け
Java 21から導入されたSequenced Collections(LinkedHashMap等)を使用する場合、順序が保証されますが、これらは並列セーフではありません。並列環境で順序を保ちたい場合は、ConcurrentSkipListMap等の、順序を維持しつつ並列耐性のあるコレクションを選択するのがシニアエンジニアの定石です。
まとめ
・並列処理ではArrayListではなくCopyOnWriteArrayListやConcurrentHashMapを選ぶ。
・「例外が出ないこと」と「常に最新のデータであること」は別物と理解する。
・高頻度な書き込みが発生する箇所では、コレクションの選択がボトルネックにならないよう注意する。

コメント