導入
Javaでの並行処理といえば、CompletableFutureや最近のVirtual Threadsが注目されがちですが、これら非同期処理の「裏側」で重要な役割を果たしているのがForkJoinPoolです。大規模なタスクを細分化し、複数のCPUコアを効率的に使い切るために設計されたこの仕組みを理解することは、高負荷なアプリケーションを最適化する上で避けて通れません。
基礎知識
ForkJoinPoolは、Java 7で導入された「分割統治法(Divide and Conquer)」に基づくスレッドプールです。最大の特徴は、ワークスチール(Work-Stealing)アルゴリズムを採用している点にあります。
通常のスレッドプールでは、各スレッドが共有のタスクキューから仕事を取り出しますが、ForkJoinPoolでは各スレッドが自分専用の「デック(Deque)」を持ちます。自分のキューが空になったスレッドは、他の忙しいスレッドのキューの末尾からタスクを「盗んで」実行します。これにより、特定のCPUコアだけが過負荷になることを防ぎ、システム全体の稼働率を最大化します。
実装/解決策
ForkJoinPoolを最大限に活かすには、タスクをRecursiveTask(戻り値あり)またはRecursiveAction(戻り値なし)として定義します。ある程度の閾値までタスクを分割し、それ以上小さくできない場合は順次処理を行うのが基本パターンです。
サンプルプログラム
以下のコードは、巨大な配列の合計を並列で計算する例です。
import java.util.concurrent.RecursiveTask;
import java.util.concurrent.ForkJoinPool;
public class SumTask extends RecursiveTask<Long> {
private static final int THRESHOLD = 10_000; // 分割の閾値
private final long[] array;
private final int start, end;
public SumTask(long[] array, int start, int end) {
this.array = array;
this.start = start;
this.end = end;
}
@Override
protected Long compute() {
int length = end - start;
// タスクが小さければ直接計算(ベースケース)
if (length <= THRESHOLD) {
long sum = 0;
for (int i = start; i < end; i++) sum += array[i];
return sum;
}
// タスクを半分に分割
int mid = start + length / 2;
SumTask left = new SumTask(array, start, mid);
SumTask right = new SumTask(array, mid, end);
// 左側を非同期で実行開始し、右側を現在のスレッドで処理
left.fork();
return right.compute() + left.join();
}
public static void main(String[] args) {
long[] data = new long[100_000]; // テストデータ生成
ForkJoinPool pool = new ForkJoinPool();
long result = pool.invoke(new SumTask(data, 0, data.length));
System.out.println("合計値: " + result);
}
}
応用・注意点
現場でForkJoinPoolを扱う際の注意点を3つ挙げます。
1. ブロッキング操作を避ける: ForkJoinPool内のスレッドでI/O待ち(データベース接続やファイル読み込み)を行うと、そのスレッドは停止してしまい、ワークスチールの効率が著しく低下します。I/Oを伴う処理には、Virtual Threadsや適切なサイズの固定スレッドプールを使いましょう。
2. デフォルトの利用: Java 8以降、`ForkJoinPool.commonPool()`が導入されました。`Parallel Streams`や`CompletableFuture`のデフォルト設定はこれを使用します。独自のプールを作成する際は、タスクの性質に合わせてスレッド数を適切に設定してください。
3. 分割粒度の調整: タスクを細かくしすぎると、タスク生成のオーバーヘッドが計算時間よりも長くなります。上記サンプルにある閾値(THRESHOLD)の設定は、パフォーマンスを左右する重要なパラメータです。必ず負荷テストを行い、最適な値を決定してください。

コメント