Swift compiler architecture

Swift 컴파일러 개발을 시작해보고 싶은 분들을 위해, 컴파일러의 전체 구성이 어떻게 되어있는지 대략적으로 설명해보겠습니다. 코드를 읽을 때 참고가 되면 좋겠네요.

저는 프로그램을 파악할 때, 엔트리포인트(entrypoint, 최초로 실행되는 곳, main 함수)를 알지 못하면 불안해집니다. 바꿔 말하면, 엔트리포인트만 알면 거기서부터 처리 과정을 따라가면 좋기 때문에, 그 다음 과정에 대한 이해도 굉장히 쉬워집니다. 그렇기 때문에 가장 먼저 swift 명령어의 엔트리포인트 부터 시작하겠습니다.

주의: 각 진입부는 깃헙에 있는 실제 코드의 링크를 달고 있는데, 행번호는 시간이 지나면서 변경되기 때문에, 파일까지의 링크만 달아놓았습니다. 함수명등으로 검색해주세요.

드라이버 (Driver)

swift 명령어 인데, 실체는 tools/driver 입니다.

tools/driver/driver.cpp에 main 함수가 있어, 여기서부터 lib 디렉토리 에서 구현하고 있는 각종 라이브러리를 호출하도록 되어있습니다.

드라이버에는 명령어 argument에 따른 몇개의 모드가 존재합니다.

서브명령어 런처 (sub-command launcher)

swift package로 호출되면 swift실행파일과 동일한 디렉토리에 있는 swift-package를 기동할 뿐인 런처입니다. swift명령어의 가장 첫 번째 argument가 아래의 조건에 모두 일치할 때 실행됩니다.

  • -로 시작하지 않는다
  • .을 포함하지 않는다 (파일명이 아니다)
  • repl이 아니다 1

시험삼아 swift oozoofrog 같은 느낌으로 명령어를 실행하면 swift-oozoofrog 라는 서브명령어를 찾지 못했다는 에러를 표시하게 됩니다.

$ swift oozoofrog
error: unable to invoke subcommand: /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/swift-oozoofrog (No such file or directory) 

batch mode

swiftc명령어 입니다. swiftcswift의 심볼릭 링크로 되어있습니다. argv[0]"swiftc"인 경우 batch mode가 됩니다. 소스파일을 실행가능한 파일로 만드는데는, 컴파일러나 링크등 여러가지 단계를 거쳐야할 필요가 있고, 이 모드는 그러한 작업들을 일괄 처리 가능한 상태로 실행합니다.

// hello.swift
func hello() {
	print("Hello Swift!")
// main.swift

-v 옵션을 붙이면 서브프로세스를 호출하는 모습을 확인할 수 있습니다.

# 실행하는 서브프로세스를 표시하면서 컴파일
$ swiftc -v -o hello main.swift hello.swift
Apple Swift version 3.1 (swiftlang-802.0.53 clang-802.0.42)
Target: x86_64-apple-macosx10.9
/Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/swift -frontend -c -primary-file main.swift hello.swift -target x86_64-apple-macosx10.9 -enable-objc-interop -sdk /Applications/Xcode.app/Contents/Developer/Platforms/MacOSX.platform/Developer/SDKs/MacOSX10.12.sdk -color-diagnostics -module-name hello -o /var/folders/y0/845byh512k53x98tw3ch5j2w0000gn/T/main-4e5977.o
/Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/swift -frontend -c main.swift -primary-file hello.swift -target x86_64-apple-macosx10.9 -enable-objc-interop -sdk /Applications/Xcode.app/Contents/Developer/Platforms/MacOSX.platform/Developer/SDKs/MacOSX10.12.sdk -color-diagnostics -module-name hello -o /var/folders/y0/845byh512k53x98tw3ch5j2w0000gn/T/hello-6eeba6.o
/Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/ld /var/folders/y0/845byh512k53x98tw3ch5j2w0000gn/T/main-4e5977.o /var/folders/y0/845byh512k53x98tw3ch5j2w0000gn/T/hello-6eeba6.o -force_load /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/lib/arc/libarclite_macosx.a -framework CoreFoundation -syslibroot /Applications/Xcode.app/Contents/Developer/Platforms/MacOSX.platform/Developer/SDKs/MacOSX10.12.sdk -lobjc -lSystem -arch x86_64 -L /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/lib/swift/macosx -rpath /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/lib/swift/macosx -macosx_version_min 10.9.0 -no_objc_category_merging -o hello
  1. 소스 파일마다 swift -frontend -c 를 호출해서 .o파일을 작성
  2. 링커인 ld.o를 링크해서 실행파일을 작성

라는 느낌입니다. -frontend는 다음에 이야기할 frontend mode입니다.

# 실행하는 명령어 작업 표시하기(macOS)
$ swiftc -driver-print-jobs -o hello main.swift hello.swift 

frontend mode

Swift 컴파일러의 핵심입니다. swift -frontend <action> [options...] <inputs...> 로 호출할 수 있습니다. Clang 에서의 -cc1과 비슷하고, 거두절미하고 말하자면 .swift파일을 읽어들여 .o파일로 변환까지를 담당합니다. 컴파일러의 본체가 되네요. 위에서 말했던 batch mode(swiftc)에서의 컴파일러도, 실제로는 frontend mode를 sub-command로써 실행하고 있습니다. frontend에도 여러가지 모드(action)이 있습니다만, 통으로 실행하는건 -c(-emit-object)입니다.

# emit-object
$ swift -frontend -emit-object -o test.o test.swift

다음으로는, 이 action을 실행할 때 처리의 흐름을 설명해 보겠습니다.

주의: frontend mode는 driver mode를 통해서 실행하는 것이 일반적이고, 보통의 Swift 개발자가 직접 -frontend를 지정해서 기동하는것을 상정하고 있지는 않습니다. 명령어 옵션도 자주 바뀝니다.

frontend(혹은 서브시스템)은 컴파일러외에도 SourceKit에서 사용하는 코드를 보완하거나, syntax coloring등에서도 이용합니다.

interpret mode

Swift의 소스파일을 그대로 실행하는 모드입니다. immediate mode라고 부르고 있습니다.

실제로는 swift -frontend -interpret <options...> <input file>로 기동합니다.

# Swift 스크립트 실행
$ swift hello.swift

혹은 standard input(STDIN)으로 소스를 전달해서 실행하는것도 가능합니다. 그 경우는 input file의 이름을 -로 합니다.

$ echo 'print("Hello Swift!")' | swift -
Hello Swift!

REPL mode

input file의 이름을 지정하지 않고 swift명령어를 실행하면 REPL mode가 됩니다.

$ swift
Welcome to Swift version 5.5.2-dev.
Type :help for assistance.

lldb명령어가 특정 디렉토리에 존재하는 경우 lldb를 Swift의 REPL mode로 실행, 그렇지 않으면 Frontend에 내장되어 있는 REPL을 실행합니다. 2

# STDIN(standard input)을 REPL 실행
$ echo 'print("Hello Swift!")' | swift
Welcome to Swift version 5.5.2-dev.
Type :help for assistance.
Hello Swift!

어째서 immediate mode와 별도로 되어있는지 잘 모르겠습니다만, STDIN은 REPL로의 입력이 되기 때문에, REPL 명령어도 유효합니다.

$ echo ':help' | swift
Welcome to Swift version 5.5.2-dev.
Type :help for assistance.

The REPL (Read-Eval-Print-Loop) acts like an interpreter.  Valid statements,
expressions, and declarations are immediately compiled and executed.
The complete set of LLDB debugging commands are also available as described
Commands must be prefixed with a colon at the REPL prompt (:quit for example.) 
Typing just a colon followed by return will switch to the LLDB prompt.
Type “< path” to read in code from a text file “path”.
Debugger commands:
  apropos           -- List debugger commands related to a word or subject.
  breakpoint        -- Commands for operating on breakpoints (see 'help b' for
# 이하 생략

그 외의 mode

이 외에도 몇 개의 모드가 더 있습니다. 어떤게 있는지 살펴보자면, (원문의 모드는 더 이상 존재하지 않거나 바뀌거나 해서 새로 작성했습니다. *swift 5.5기준)

swift api-digester ABI 검사기로 서로 다른 버전의 라이브러리 간에 안전하지 않는 변경점을 도출합니다.
swift api-extract 조사중
swift demangle 맹글링된 코드를 디맹글링합니다.
swift -modulewrap .swiftmodule의 데이터를 그대로 .o로3
swift package swift package 생성 등 관련한 작업을 합니다.
swift package-collection swift package collection 추가 등 관련한 작업을 합니다.
swift stdlib-tool  
swift symbolgraph-extract 라이브러리로부터 심볼 그래프를 json의 형태로 추출합니다.

각 모드가 명령어 옵션을 지정하거나, 심볼릭 링크에 의한 명령어의 이름의 별칭이거나 한것은 무슨 기준일까요.

Fontend의 구성

lib/FrontendTool/FrontendTool.cpp에 있는 swift::performFrontend가 진입부가 됩니다. 큰 흐름은 아래와 같습니다.

  1. frontend의 실행 설정을 들고 있는 객체인 CompilerInvocation을 명령어 옵션등으로부터 생성합니다.
  2. CompilerInstance을 생성, CompilerInvocation의 정보로 설정을 합니다.
  3. FrontendTool.cppperformCompile함수에서 컴파일을 실행합니다. 여기서부터 아래의 그림대로의 파이프라인이 동작하기 시작합니다. 각 컴포넌트에서 에러를 감지했을 때는 여기서 처리를 종료합니다.



include/swift/Frontend/Frontend.h에 정의되어 있습니다.

위의 그림에는 나타나지 않습니다만, 컴파일러 전체의 상태나 실행을 관리합니다. Frontend에 있어서 중요한 부분입니다.

CompilerInstance는 아래와 같은, 컴파일러의 중요한 싱글턴을 가지고 있습니다.

  • SourceManager: 소스의 관리
  • DiagnosticEngine: 진단 엔진
  • ASTContext: AST의 메모리 관리, 외부 모듈의 로딩
  • ModuleDecl:컴파일러의 AST모듈
  • SILModule: SIL모듈

파이프라인안의 Parse 및 Sema은 이 객체의 CompilerInstance::performSema메소드를 통해서 실행됩니다. 입력파일이 하나 이상인 경우, performSema를 한 번 수행하는것으로, 모든 입력 파일의 Parse와 Sema를 완료한 다음, 다음 단계로 넘어갑니다.


또 하나의 중요한 요소는 ASTContext입니다.

include/swift/AST/ASTContext.h 에 정의되어있습니다.

CompilerInstance 에 의해 인스턴스가 만들어져, LLVM IR의 생성이 완료되기까지 계속 살아있는, 사용시간이 상당히 긴 오브젝트입니다. AST노드의 메모리 관리가 주요한 역할 입니다만, 그 외에도

  • stdlib를 포함, 외부 모듈을 불러오고 소유
  • 컴파일러의 stdlib API의 관리

등의 역할을 가지고 있고, 또, Frontend의 각 서브시스템은 실행중에 FrontendTool이나 CompilerInstance를 접근하진 않지만, ASTContextFrontend의 거의 모든 부분에서 참조합니다.

또한 SourceManagerDiagnosticEngine 를 참조하고 있어, 각 서브시스템으로부터 이를 참조해야할 필요가 생기는 경우의 창구역할을 하고 있습니다. 여러군데서 찾아보고 싶은 경우는 일단 여기에 넣어두자 라는 친구죠.


컴파일러의 파이프라인상에 나타나는, 주요한 프로세스입니다. swift.org 에도 설명되어있습니다.

알맞은 용어인지 잘 모르겠습니다만, 소스 상에서는 “subsystems”에서 참조하고 있는 것들을 여기서는 서브시스템이라고 부릅니다. swift.org에서는 Compiler Architecture로 표기하고 있습니다.


소스를 AST(추상구문트리)로 변환합니다. 비교적 간단한 재귀 하향 파서로, lib/Parse/Lexer.cpp에 의해 낱말 분석을 수행하며, Lexer로부터 얻은 토큰의 나열을 판단해서 AST를 만들어갑니다. 타입 정보나, 의미 해석에는 관여하지 않습니다.4 예외적으로 로컬변수의 사용 등, 문맥상 명확한 경우 해당 시점에 Name Binding을 수행합니다. 또 문법 에러나, 문법과 관련한 워닝을 출력하는 것도 Parse가 하는 일입니다.

빌드 과정에서의 진입부는 lib/Parse/ParseRequests.cpp 에서 ParseSourceFileRequest::evaluate함수이며 lib/Parse에 있는 Parser의 인스턴스가 만들어집니다. 여기에서 lib/Parse/ParseDecl.cppParser::parseTopLevel 함수를 호출합니다. parseTopLevel함수는 lib/Parse/Parser.cppParserUnit::parse() 함수에서도 호출되는데 이 경우 소스의 syntax highlighting이나 formatting 등에서 사용되는듯 합니다.

1 최근(여기선 2017년)까지는 run도 대상이었습니다만, 내장하고 있는 swift run은 SE-0179의 swiftpm의 기능을 덮어쓰기 때문에 폐기되었습니다. SR-5332

2 Swift3까지 Linux에는 내장 REPL을 지원하고 있지 않았기 때문에, lldb가 없는 경우 에러가 났습니다만, 이제는 포함되어 있는듯합니다. PR-7709

3 swiftc -g로 컴파일할 때 사용하며, 바이너리에 포함되어 디버거가 사용합니다.

4 타입 정보에는 관여하지는 않지만, 타입명의 분석은 수행합니다. 다만, 분석한 타입명이 실제로는 무엇인지는 Parse의 시점에서는 알 수 없습니다.