【Fortran学習｜初心者向け】Fortranの隠れた最適化！<code>NON_RECURSIVE</code>属性で性能を引き出す（初心者向け）

こんにちは、数値計算エンジニアの皆さん！

日々の計算で、少しでもプログラムを速くしたいと思ったことはありませんか？今回は、Fortran 2018以降で使える、ちょっとマニアックだけど知っておくと役立つ「NON_RECURSIVE」属性について、初心者の方にも分かりやすく解説します。

1. 導入: なぜNON_RECURSIVEが重要なのか？

Fortran 2018以降の新しい標準では、サブルーチンや関数はデフォルトで「再帰可能」になりました。これは、手続きが自分自身を呼び出すことができる、ということを意味します。再帰は、特定のアルゴリズム（例えば、階乗計算やクイックソートなど）を簡潔に記述できる強力な機能です。

しかし、皆さんが書く多くのサブルーチンや関数は、実際には自分自身を呼び出すことはないはずです。例えば、配列の要素を合計したり、特定の計算を実行したりするような、ごく一般的な手続きです。

ここで登場するのがNON_RECURSIVE属性です！この属性をサブルーチンや関数に付けることで、「この手続きは絶対に再帰しないよ！」とコンパイラに明示的に教えてあげることができます。すると、コンパイラはメモリの割り当てを最適化し、ごくわずかではありますが、プログラムの実行速度を向上させる可能性が生まれるのです。

2. 基礎知識: 再帰とメモリのちょっと難しい話

NON_RECURSIVEのメリットを理解するために、まずは「再帰」と「メモリ」の基本的な仕組みを簡単に見ていきましょう。

再帰とは？

再帰とは、関数やサブルーチンが自分自身を呼び出すことです。
例えば、階乗（`n!`）を計算する関数を考えてみましょう。
`5! = 5 4!`
`4! = 4 3!`
…
このように、自分自身（より小さい数での階乗）を呼び出す形で定義できます。

メモリの話：スタック vs. 静的メモリ/レジスタ

プログラムが実行されるとき、コンピュータはさまざまな種類のメモリを使います。

スタック: 再帰的な呼び出しや、サブルーチンや関数内のローカル変数を管理するために使われるメモリ領域です。手続きが呼び出されるたびに、その手続きで使うデータがスタックに「積み重ねられ」、手続きが終了すると「取り除かれます」。これは柔軟ですが、メモリの確保・解放にオーバーヘッドがあったり、使える容量に限りがあります（スタックオーバーフローの原因）。
静的メモリ/レジスタ: プログラムのコンパイル時に、どこにどのくらいのメモリを確保するかが決まる領域です。また、CPU内部のレジスタは非常に高速な一時記憶領域です。これらはスタックよりも高速にアクセスできます。

なぜNON_RECURSIVEが必要なのか？

Fortran 2018以降では、デフォルトで手続きが再帰可能になったため、コンパイラは「いつ再帰呼び出しが発生しても大丈夫なように、スタックを使ってローカル変数を管理しよう」と考えます。

しかし、NON_RECURSIVE属性を指定すると、コンパイラは「この手続きは再帰しないから、スタックを使う必要がないな！」と判断できます。その結果、コンパイラはローカル変数をスタックではなく、より高速な静的メモリやCPUのレジスタに割り当てることを検討できるようになります。これが、微小な性能向上に繋がる可能性があるわけです。

3. 実装/解決策: NON_RECURSIVEの使い方

NON_RECURSIVE属性の使い方は非常にシンプルです。サブルーチンや関数の宣言部に、キーワードを追加するだけです。

non_recursive subroutine サブルーチン名(引数リスト)
  ! ...
end subroutine サブルーチン名

どんな時に使うべき？

手続きが確実に再帰しないことが分かっている場合: これが一番重要です。絶対に自分自身を呼び出さない手続きにのみ適用してください。
性能がクリティカルな部分で、少しでも最適化を試みたい場合: 特に、何度も繰り返し呼び出されるような小さな手続きで効果が見込める可能性があります。

注意点

もしnon_recursiveと宣言した手続きが、誤って自分自身を呼び出してしまった場合、どうなるでしょうか？
コンパイラは「再帰しないはずなのに！」と判断し、コンパイルエラーを出すか、あるいは実行時に予期せぬメモリ破壊やプログラムのクラッシュを引き起こす可能性があります。必ず、再帰しないことを確認してからこの属性を使ってください。

4. サンプルプログラム

Fortranで、NON_RECURSIVE属性を使った簡単なサブルーチンの例を見てみましょう。このサブルーチンは、二つの配列の要素ごとの積を計算し、その合計を求めます。明らかに再帰はしていませんね。

program test_non_recursive_example
  implicit none
  ! プログラム内で使用する変数を宣言します。
  real, dimension(10) :: array_a, array_b ! 2つの10要素の実数配列
  real                :: total_product_sum ! 計算結果を格納する変数
  integer             :: i                 ! ループカウンタ

  ! 配列array_aとarray_bをランダムな値で初期化します。
  ! random_numberはFortranの組み込みサブルーチンで、0から1の範囲の乱数を生成します。
  call random_number(array_a)
  call random_number(array_b)

  print , "--- 配列A ---"
  do i = 1, size(array_a)
    print '(F8.4)', array_a(i)
  end do

  print , "--- 配列B ---"
  do i = 1, size(array_b)
    print '(F8.4)', array_b(i)
  end do

  ! NON_RECURSIVE属性を持つサブルーチンを呼び出して、計算を実行します。
  call calculate_dot_product(array_a, array_b, total_product_sum)

  ! 計算結果を表示します。
  print 
  print , "配列Aと配列Bの要素ごとの積の合計:", total_product_sum

contains

  ! ここからサブルーチンの定義です。
  ! non_recursive属性を付けています。
  ! このサブルーチンは自分自身を呼び出すことは決してありません。
  ! コンパイラは、この情報を使って、ローカル変数（iやcurrent_sum）を
  ! スタック以外の、より高速なメモリ領域（静的メモリやレジスタ）に割り当てることを検討できます。
  non_recursive subroutine calculate_dot_product(input_a, input_b, output_sum)
    implicit none
    ! 引数の宣言:
    ! intent(in) は入力専用であることを示します。
    ! intent(out) は出力専用であることを示します。
    real, intent(in)  :: input_a(:) ! 入力配列A (サイズは呼び出し元から引き継ぐ)
    real, intent(in)  :: input_b(:) ! 入力配列B
    real, intent(out) :: output_sum ! 計算結果を格納する変数

    ! ローカル変数の宣言
    integer :: i             ! ループカウンタ
    real    :: current_sum   ! 中間合計値を一時的に保持する変数

    ! 初期化: 合計値を0に設定します。
    current_sum = 0.0

    ! 配列の要素数分ループします。
    ! 各要素の積を計算し、current_sumに加算していきます。
    do i = 1, size(input_a)
      current_sum = current_sum + input_a(i)  input_b(i)
    end do

    ! 最終的な合計値を出力変数に渡します。
    output_sum = current_sum

  end subroutine calculate_dot_product

end program test_non_recursive_example

このコードをコンパイルして実行してみてください。特別なことは起こりませんが、コンパイラの内部では、このcalculate_dot_productサブルーチンが効率的にメモリを使うように考慮されている可能性があります。

5. 応用・注意点: 現場で役立つ補足情報

性能測定の重要性: NON_RECURSIVEによる性能向上は、通常は非常に微々たるものです。特に小さなプログラムや、一度しか実行されない部分では、ほとんど体感できないでしょう。本当に効果があるかどうかは、プロファイリングツールを使って実際の実行時間を測定することが不可欠です。過度な期待はせず、「もしかしたら速くなるかも」くらいの感覚で試すのが良いでしょう。
デバッグの難しさ: もしnon_recursiveと宣言したサブルーチン内で、誤って再帰呼び出しが発生してしまった場合、デバッグが困難になることがあります。コンパイラがエラーを出してくれれば良いですが、そうでない場合、予期せぬメモリの挙動が原因でプログラムがクラッシュし、原因特定に時間がかかる可能性があります。
初心者の方は無理に使う必要なし: この属性は、どちらかというと「上級者向けの最適化テクニック」と考えるのが適切です。まずは正確で読みやすいコードを書くことを優先しましょう。プログラムの性能がボトルネックになっていることが明確になり、かつボトルネックになっている手続きが確実に再帰しないことが分かっている場合に、試してみる価値のある選択肢です。

NON_RECURSIVE属性は、Fortranのプログラムをより深く理解し、さらなる性能向上を目指すための、ちょっとした「隠し味」のようなものです。ぜひ、皆さんの数値計算ライフに役立ててみてください！

【Fortran学習｜初心者向け】Fortranの隠れた最適化！`NON_RECURSIVE`属性で性能を引き出す（初心者向け）