서브메뉴

본문

순수 함수형 데이터 구조 (불변성과 지연 계산을 활용한 함수형 데이터 구조)
순수 함수형 데이터 구조 (불변성과 지연 계산을 활용한 함수형 데이터 구조)
저자 : 크리스 오카사키
출판사 : 에이콘출판
출판년 : 2020
ISBN : 9791161753515

책소개

불변성(immutability)과 지연 계산(laziness)을 활용해 100% 함수적으로 만든 데이터 구조와 알고리즘도 명령형 데이터 구조나 알고리즘만큼 성능이 좋을 수 있다는 것을 보여준다. 그리고 함수형 데이터 구조를 만들기 위한 몇 가지 방법을 제시한다.



함수형 프로그래밍을 공부하는 사람들 사이에서는 일종의 고전으로 자리잡은 중요한 책으로, 데이터 구조만 다루지 않는다. 이 책에서 제시하는 여러 기법을 이용해 직접 코드를 작성하고 분석하다 보면 함수형 프로그래밍 방식에 눈뜰 수 있을 것이다.
[알라딘에서 제공한 정보입니다.]

출판사 서평

데이터 구조를 다루는 대부분의 책에서는 C나 C++와 같은 명령형(imperative) 언어를 가정하고 설명한다. 하지만 명령형 언어의 데이터 구조는 SML(Standard ML), 하스켈(Haskell), 스킴(Scheme) 등의 함수형 언어로 잘 변환되기 어렵다. 이 책은 함수형 언어의 관점에서 데이터 구조를 살펴보고, 프로그래머가 자신만의 함수형 데이터 구조를 개발할 때 도움이 되는 여러 설계 기법을 보여준다. 적흑 트리(red-black tree)나 이항 큐(binomial queue) 등의 전통적인 데이터 구조를 배우며, 함수형 언어를 위해 별도로 개발한 여러 데이터 구조를 살펴본다. 모든 소스 코드는 SML과 하스켈로 만들어졌지만, 그 밖의 함수형 언어로도 쉽게 바꿀 수 있을 것이다. 이 책은 함수형 언어를 다루는 전문 프로그래머가 간편하게 참고할 수 있는 책이며, 함수형 언어를 공부하고 싶은 개발자에게는 자습서로 쓰기 좋다.

[지은이의 말]

나는 1989년 SML 프로그래밍을 처음 시작했다. 데이터 구조를 효율적으로 구현하기를 좋아했기 때문에, 가장 좋아하는 데이터 구조 중 일부를 SML로 포팅하기 시작했다. 몇몇 데이터 구조는 쉽게 포팅할 수 있었으며, 기쁘게도 변환한 결과 코드는 C, 파스칼(Pascal), 에이다(Ada) 등으로 작성했던 코드보다 더 간결하고 깔끔했다. 시간이 지나면서 내가 기존 값을 없애고 내용을 덮어쓰는 파괴적인 메모리 갱신(destructive update)을 사용하고 싶어 한다는 것을 깨달았다. 하지만 SML에서는 그러한 파괴적 메모리 갱신 사용을 권장하지 않고, 그 밖의 여러 함수형 언어는 메모리 갱신 사용을 아예 금지한다. 기존의 책과 논문에서 도움이 될 만한 내용을 찾아봤지만 소수의 논문을 제외하고는 관련 정보가 거의 없었다. 나는 이 분야가 아직 미개척지임을 깨달았고, 데이터 구조를 구현하는 새로운 방법을 탐색하기 시작했다.

8년이 지난 지금도 탐색 중이다. 함수형 언어를 사용해 어떻게 해야 효율적으로 구현할 수 있을지 아직도 잘 모르는 데이터 구조가 많다. 하지만 나는 함수형 언어에서 어떤 것이 작동하는지 많이 배워왔다. 이 책은 내 배움을 코드로 표현하려는 시도다. 이 책이 함수형 프로그래머에게 참고서가 되고, 함수형 환경에서 데이터 구조를 작성하는 법을 배우고 싶은 사람들에게 교과서 역할을 할 수 있기를 바란다.

[옮긴이의 말]

함수형 프로그래밍이 개발자들 사이에서 기본 교양으로 자리 잡기 시작했지만, 아직도 함수형 언어나 함수형 프로그래밍은 느리다는 편견을 가진 개발자가 많다. 특히 데이터 구조에 있어서는 불변성을 활용한 데이터 구조를 사용하면 제자리에서 데이터를 갱신하면서 최적화된 알고리즘을 사용할 수 있는 명령형 데이터 구조보다 느릴 것이라는 편견이 있는 개발자가 많을 것이다. 실제로 1990년대 중반까지만 하더라도 불변성을 활용한 데이터 구조를 사용하면 명령형 데이터 구조보다 느릴 것이라는 생각은 단순한 편견은 아니었다. 물론 물밑에서는 이 문제를 해결하려는 여러 가지 노력과 연구가 진행되고 있었다. 크리스 오카사키(Chris Okasaki)는 그런 연구 결과를 집약하고 자신의 연구 결과를 덧붙여서 박사 학위 논문을 썼고, 나중에 이를 좀 더 보완해 『Purely Functional Data Structures』라는 이름의 책으로 펴냈다. 이 책은 불변성(immutability)과 지연 계산(laziness)을 활용해 100% 함수적으로 만든 데이터 구조와 알고리즘도 명령형 데이터 구조나 알고리즘만큼 성능이 좋을 수 있다는 사실과 그런 데이터 구조를 만들기 위한 몇 가지 방법을 제시한다. 그리고 함수형 프로그래밍을 공부하는 사람들 사이에서는 일종의 고전으로 자리 잡았다.

비록 책의 제목은 데이터 구조 책처럼 보이지만, 데이터 구조에 대해서만 써놓은 책이 아니다. 이 책에서 제시하는 기수법을 활용한 데이터 구조 개발 방법이나 지연 계산을 활용해 비싼 연산을 분산시켜서 알고리즘의 효율을 높이는 기법 등을 읽어보고, 직접 코드를 작성하고 분석하다 보면 지금까지와는 전혀 다른 사고방식에 눈뜰 수 있을 것이다. 지연 계산을 활용해 연산을 분산시키는 것은 메모리와 실행 시간을 맞바꾸는 전통적인 트레이드오프(trade-off) 관계의 연장선상에 있다고 볼 수 있다. 힙에 맵(또는 딕셔너리) 등을 할당하고 이를 활용해 계산 결괏값을 저장함으로써 알고리즘의 효율을 높였던 방식에서 더 나아가 나중에 수행하거나 분산시켜 수행해야 할 계산을 함숫값(또는 클로저)이나 지연 계산 썽크(thunk) 형태로 저장하고 이를 활용해 효율적인 알고리즘을 개발할 수 있다. 어쩌면 이를 좀 더 확장하면 마이크로서비스 아키텍처 등의 분산 시스템이나 동시성 시스템 기술에 활용할 수 있는 새로운 라이브러리나 기법을 만들 수 있을지도 모른다. 굳이 그런 실무 활용을 고려하지 않더라도, 여러분이 원하는 작업을 처리하는 새로운 방법을 배우고 함수형 사고방식을 연습할 수 있는 교재로도 이 책은 (약간은 어렵겠지만) 훌륭하다. 함수형 프로그래밍 기초 서적을 한 권 정도 마무리하고, 하스켈이나 스칼라 같은 언어 책을 읽은 개발자에게 한 번쯤 도전해보라고 권하고 싶다.

개인적으로는 이런 고전 수준의 책을 번역한다는 것이 상당히 설레면서도 두려웠다. 쉬운 작업은 아니었고 아마 실수한 부분도 있겠지만 그래도 몇 권 안 되는 번역서 중에 이런 책이 추가된 건 큰 행운이라고 생각한다.
[예스24에서 제공한 정보입니다.]

목차정보

1장. 소개

1.1 함수형 데이터 구조와 명령형 데이터 구조 비교

1.2 미리 계산하는 언어와 지연 계산 언어

1.3 용어

1.4 접근 방법

1.5 이 책의 개요



2장. 영속성

2.1 리스트

2.2 이진 검색 트리

2.3 참고사항



3장. 이미 잘 알려져 있는 데이터 구조의 함수형 구현

3.1 레프티스트 힙

3.2 이항 힙

3.3 적흑 트리

3.4 참고사항



4장. 지연 계산

4.1 $ 표기법

4.2 스트림

4.3 참고사항



5장. 분할 상환 기초

5.1 분할 상환 분석 기법들

5.2 큐

5.3 이항 힙

5.4 스플레이 힙

5.5 페어링 힙

5.6 나쁜 소식

5.7 참고사항



6장. 지연 계산을 통해 분할 상환과 영속성을 동시에 달성하기

6.1 실행 트레이스와 논리적 시간

6.2 영속성과 분할 상환 사이를 중재하기

6.2.1 지연 계산의 역할

6.2.2 지연 계산 데이터 구조를 분석하기 위한 프레임워크

6.3 은행원 기법

6.3.1 은행원 기법의 정당성

6.3.2 예제: 큐

6.3.3 부채 상속

6.4 물리학자 기법

6.4.1 예제: 이항 힙

6.4.2 예제: 큐

6.4.3 예제: 공유를 사용하는 상향식 병합 정렬

6.5 지연 계산 페어링 힙

6.6 참고사항



7장. 분할 상환 없애기

7.1 스케줄링

7.2 실시간 질의

7.3 이항 힙

7.4 공유를 사용한 상향식 병합 정렬

7.5 참고사항



8장. 지연 재구축

8.1 일괄 재구축

8.2 전역 재구축

8.2.1 예제: 후드-멜빌 실시간 큐

8.3 지연 재구축

8.4 양방향 큐

8.4.1 출력이 제한된 데크

8.4.2 은행원의 데크

8.4.3 실시간 데크

8.5 참고사항



9장. 수치적 표현

9.1 위치에 기반한 수 체계

9.2 이진수

9.2.1 이진 임의 접근 리스트

9.2.2 영이 없는 표현들.

9.2.3 지연 계산 표현

9.2.4 조각을 사용하는 표현

9.3 치우친 이진수

9.3.1 치우친 이진 임의 접근 리스트

9.3.2 치우친 이항 힙.

9.4 삼진수와 사진수

9.5 참고사항



10장. 데이터 구조적 부트스트래핑

10.1 구조적 분해

10.1.1 비균일 재귀와 SML

10.1.2 이진 임의 접근 리스트 다시 보기

10.1.3 부트스트랩으로 만든 큐

10.2 구조적 추상화

10.2.1 효율적 연결을 지원하는 리스트

10.2.2 효율적인 병합을 지원하는 힙

10.3 조합된 타입 부트스트래핑하기

10.3.1 트라이

10.3.2 일반화한 트라이

10.4 참고사항



11 암시적이며 재귀적인 감속

11.1 큐와 데크

11.2 연결 가능한 데크

11.3 참고사항



부록 A. 하스켈 소스 코드
[알라딘에서 제공한 정보입니다.]