C#의 tail call 구현은?
우선, CLR 수준에서 어떻게 tail call이 처리되고 있는지에 대한 문서들을 웹상에서 찾아볼 수 있습니다.
Enter, Leave, Tailcall Hooks Part 2: Tall tales of tail calls
; https://learn.microsoft.com/en-us/archive/blogs/davbr/enter-leave-tailcall-hooks-part-2-tall-tales-of-tail-calls
Tail Call Improvements in .NET Framework 4
; https://learn.microsoft.com/en-us/archive/blogs/clrcodegeneration/tail-call-improvements-in-net-framework-4
그리고, CLR 2.0 기준으로 64bit/32bit에 따른 tail call이 가능하지 않은 조건들을 설명한 글이 있습니다.
Tail call JIT conditions
; https://learn.microsoft.com/en-us/archive/blogs/davbr/tail-call-jit-conditions
(* You must not take dependencies on this behavior. Use this information for your own personal entertainment only.)
이 중에서 "
Tail Call Improvements in .NET Framework 4" 글이 그나마 최신인데요. 대충 설명해 보면 다음과 같이 요약됩니다.
- CLR 2 + 64bit JIT: '쉬운(easy)' 경우만을 대상으로 tail call 최적화 처리, 이 때문에 tail. 접두사가 명시되어 있다 해도 'easy case'가 아니라면 tail call 최적화를 하지 못함.
- CLR 2 + 32bit JIT: tail. 접두사가 명시된 경우만. (하지만, 64bit JIT보다 tail call 처리를 할 수 없는 더 많은 예외적인 상황이 존재)
- CLR 4 + 64bit JIT: tail. 접두사가 명시된 경우 모든 상황에서 tail. 접두사를 (tail call 방식이 아니라도 TailCallHelper를 통해) 처리하도록 JIT 개선
- CLR 4 + 32bit/IA64 JIT: CLR 2의 상황과 바뀐 것이 없음. (따라서, tail. 접두사가 명시된 경우만 제한적으로.)
즉, CLR 4 + 64bit JIT에 와서야 "tail." 접두사가 존재한다면 어떤 식으로든 stack overflow가 발생하지 않도록 처리가 되었습니다.
이쯤에서, C#에서의 tail call 처리가 궁금할 텐데요. 일단, C# 컴파일러는 어떠한 코드에서도 "tail." 접두사를 생성하지 않습니다. 따라서, CLR 2/4에 상관없이 32bit JIT 컴파일러는 tail call 최적화를 하지 않습니다. 단지, 64bit JIT에서는 임의 재량으로 쉬운 것만을 대상으로 변환을 해줍니다.
F#이라면 어떨까요? F# 컴파일러는 언어의 특성상 "tail." 접두사를 상황에 따라 IL 코드에 출력을 합니다. 일단, "tail." 접두사가 출력되었다면 CLR 4 + 64bit JIT 환경에서 stack overflow 예외는 피할 수 있다고 안심하셔도 됩니다.
C#의 경우, 간단한 예제로 한번 테스트해볼까요? ^^
using System;
class Program
{
static void Main(string[] args)
{
RecursiveCall(1);
}
private static void RecursiveCall(int v)
{
if (v % 100 == 0)
{
Console.WriteLine(v);
}
RecursiveCall(v + 1);
}
}
C# 컴파일러로 위의 코드를 CLR 2 - x64/Release 빌드하면 다음과 같은 IL 코드가 생성됩니다.
.method private hidebysig static void RecursiveCall(int32 v) cil managed
{
.maxstack 8
L_0000: ldarg.0
L_0001: ldc.i4.s 100
L_0003: rem
L_0004: brtrue.s L_000c
L_0006: ldarg.0
L_0007: call void [mscorlib]System.Console::WriteLine(int32)
L_000c: ldarg.0
L_000d: ldc.i4.1
L_000e: add
L_000f: call void Program::RecursiveCall(int32)
L_0014: ret
}
보는 바와 같이 L_000f의 call 이전에 "tail." 접두사가 없습니다. 하지만, 이 코드를 실행해 보면 stack overflow 예외 없이 잘 실행됩니다. 반면, CLR 2 - x86/Release로 빌드해 실행하면 이번에는 "Process is terminated due to StackOverflowException." 예외가 발생합니다.
이 상황은 CLR 4에서도 동일하며, Debug 빌드의 경우에는 어떤 모드로 해도 tail call 처리를 JIT 컴파일러가 하지 않으므로 stack overflow가 발생합니다.
이야기 나온 김에 ^^ "tail." 접두사가 있는 경우도 테스트해 보겠습니다. ildasm.exe를 이용해 위의 예제를 빌드한 ConsoleApp1.exe를 IL 소스 코드로 변경한 다음,
ildasm /OUT=test.il ConsoleApp1.exe
생성된 test.il 파일을 메모장 등에서 열어 call 전에 "tail." 접두사를 추가해 줍니다. (IL_???? 번호는 br 계열 명령어의 오프셋 값만 일치시켜 준다면 임의로 변경하셔도 됩니다.)
.method private hidebysig static void RecursiveCall(int32 v) cil managed
{
// Code size 21 (0x15)
.maxstack 8
IL_0000: ldarg.0
IL_0001: ldc.i4.s 100
IL_0003: rem
IL_0004: brtrue.s IL_000c
IL_0006: ldarg.0
IL_0007: call void [mscorlib]System.Console::WriteLine(int32)
IL_000c: ldarg.0
IL_000d: ldc.i4.1
IL_000e: add
IL_000f: tail.
IL_0014: call void Program::RecursiveCall(int32)
IL_0018: ret
} // end of method Program::RecursiveCall
"tail." 접두사가 추가된 il 코드를 CLR 2 버전의 ilasm.exe를 이용해 빌드하고,
"C:\Windows\Microsoft.NET\Framework\v2.0.50727\ilasm.exe" /OUTPUT=test.exe test.il /RESOURCE=test.res
test.exe를 실행해 보면, "tail." 접두사가 있는 데다 "
Tail call JIT conditions" 문서에 따른 예외적인 조건이 아니기 때문에 정상적으로 tail call 처리가 되어 stack overflow 예외 없이 CLR 2 + x86에서도 잘 실행이 됩니다.
[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]