'Concurrency'에 해당되는 글 8

  1. 2009/08/06 My Recent Tweets 20090806
  2. 2009/07/22 Parallelism이란 무엇인가?!
  3. 2009/07/21 두가지 C++ 차세대 병렬 플랫폼 간단 비교 (1)
  4. 2009/07/15 My Recent Tweets 20090715
  5. 2009/05/12 std::stack에 관한 소고
  6. 2008/08/06 C++ guru's 2 recent articles on concurrency
  7. 2008/06/25 POSA 2
  8. 2008/03/26 Software Transactional Memory

My Recent Tweets 20090806

  • profile_image RT ujeani: RT urpurple: 엄청난 각종 전문서적 원서 e-book이 가득한 곳 http://knowfree.net 내 취향을 분석해주는 사이트 http://www.idsolution.co.kr/ 저보고 아방가르드취향이라는 군요. #
    • 또다른 공짜 이북 소개 사이트
  • profile_image RT nvidiadeveloper: Slides for "Efficient Substitutes for Subdivision Surfaces" is now available! http://is.gd/23HLQ #siggraph #
    • 엔비디아시그래프 2009 세션 정보 및 자료를 구할 수 있는 페이지
  • profile_image RT sioum: 수학노트라는 훌륭한 사이트 발견! pythagoras0님 대단하십니다 RT pythagoras0:puzzlist http://pythagoras0.springnote.com/ 에 가입하시면 써포트 해드리겠습니다 ㅋㅋㅋ #
    • 수학을 좋아하셨거나 좋아하시고 싶은 분들에게 유용할 위키 사이트
  • profile_image VSBuildStatusAddin display the status of a build/clean/deploy operation: http://su.pr/5RxOgw #
    • 비주얼스튜디오에서 빌드 진행 상태를 깔끔하게 보여주는 add-in
  • profile_image RT mike_acton: Roundup: Recent sketches on concurrency, data design and performance. http://post.ly/1u4J #
    • Insomniac Games에서 일하는 마이크의 영감을 주는 concurrency 관련 슬라이드들
  • profile_image RT KageKirin: "OpenGL 3.2 and GLSL 1.5 released at Siggraph!" - http://ping.fm/q4S7c #gl #programming #
    • 이번 시그래프에서 OpenGL 3.2GLSL 1.5가 발표되었답니다!
  • profile_image RT nvidiadeveloper: We've announced the launch of the NVIDIA Application Acceleration Engines, including Optix http://is.gd/22hNa #
    • 엔비디아도 이번 시그래프에서 실시간 광선추적 엔진을 비롯한 응용프로그램 가속 엔진들을 발표했습니다.
  • profile_image RT bjoernknafla: RT JamesReinders:Intel Threading Building Blocks, new version 2.2, appeals to C++ and C programmers http://tr.im/vrAi #
    • 인텔 TBB도 2.2 버전이 나오면서 C++0x의 람다도 지원하고 Cilk와 유사한 런타임 엔진을 제공한다는군요. 인텔이 Cilk++를 사들인 것과 무관하지 않은듯. 앞으로 더욱 기대가 되는군요!
  • profile_image RT unclebobmartin: http://bit.ly/127rtT Interview with Barbara Liskov. #
  • profile_image RT SoftTalkBlog: Some parallel programming locking strategies that can speed up programs while avoiding data races: http://bit.ly/WTPyc #
    • 병렬 프로그래밍에서의 locking 전략에 관한 팁들
  • profile_image RT programmingjoy: Lua bitstring parsing and creation library based on Erlang bit syntax #programming http://bit.ly/rMzwl #
    • 루아 비트열 파싱 및 생성 라이브러리
  • profile_image RT programmingjoy: C++ vs Java vs Python vs Ruby : a first impression #programming http://bit.ly/ke1e9 #
    • C++/Java/Python/Ruby 언어의 간단 비교
  • profile_image RT programmingjoy: The Scheme Programming Language, 4th Edition, now available #programming http://bit.ly/A8Atw #
  • profile_image RT programmingjoy: List of freely available programming books #programming http://bit.ly/vLVD6 #
    • 역시 프로그래밍 관련 공짜 이북
  • profile_image Ask.C++: Looking for references on coding for optimization on x86 architectures http://su.pr/7ApBEq #
    • 최적화 관련 도움을 주는 링크들
  • profile_image RT programmingjoy: Engineers are artists too. Reply to Merlin Mann on "engineering block" #programming http://bit.ly/zhLa7 #
    • 엔지니어도 아티스트다!
  • profile_image RT KageKirin: "rsizr" - seamless image resizing - http://rsizr.com/ #
    • 이미지를 깔끔하게 리사이징해주는 웹 도구
  • profile_image RT insic: 50 Eye-Popping Examples of Concept Art | Webdesigner Depot http://bit.ly/38FMvS #
    • 50가지 멋진 원화
  • profile_image RT mike_acton: Cool! Handy regex cheat sheet. RT FrankSansC http://bit.ly/zg9LV #
    • 아주 유용한 정규표현식 컨닝페이퍼
  • profile_image RT programmingjoy: Probably the hardest (answerable) logic question ever. #programming http://bit.ly/I95qJ #
    • 골때리는(?) 퀴즈 문제
  • profile_image RT programmingjoy: Don?t use standard library/CRT functions in static initializers/DllMain! #programming http://bit.ly/z9Wmt #
    • 정적 초기자 및 DllMain에서 표준 라이브러리/CRT 함수를 쓸 경우의 문제점
  • profile_image RT KageKirin: "Unigine" - http://unigine.com/ #programming #opengl #
    • 또다른 실시간 3D 엔진
  • profile_image RT programmingjoy: Sony Pictures Imageworks - Open Source #programming http://bit.ly/17z5As #
    • 소니 픽쳐스 이미지웍스오픈 소스 페이지
  • profile_image RT programmingjoy: Programming Praxis: Josephus' Circle #programming http://bit.ly/D0vt3 #
    • 풀어볼만한 프로그래밍 퀴즈
  • profile_image RT programmingjoy: How Bad Design Patterns Ruin Good Programmers #programming http://bit.ly/3oAoK #
    • 디자인패턴이 좋은 것만은 아니다!?
  • profile_image RT SoftTalkBlog: Two parallel programming debugging tools compared: Intel Thread Checker and Intel Parallel Inspector. http://bit.ly/iwrp1 #
    • 인텔에서 만든 두가지 병렬 프로그래밍 디버깅 도구의 간단 비교
  • profile_image RT programmingjoy: RethinkDB - The database for solid state drives. #programming http://bit.ly/ENVTG #
    • 이런 것도 나오네요. SSD를 위한 데이터베이스입니다.
  • profile_image The Passionate Programmer: Creating a Remarkable Career in Software Development (a book): http://su.pr/6w2YAH #
    • 구입예정인 책
  • profile_image RT programmingjoy: The Haskell Cheatsheet #programming http://bit.ly/8ICjH #
    • Haskell 컨닝페이퍼
  • profile_image RT programmingjoy: Can Agile development work for a team of experts? Doesn't look like it... #programming http://bit.ly/BBVs8 #
    • 애자일 개발이 전문가로 구성된 팀에 적절한가?
  • profile_image Pro Git - professional version control (A book about git now online): http://su.pr/2exnde #
    • 분산버전관리시스템 Git 온라인 서적
  • profile_image Intel Advanced Graphics Lab papers: http://su.pr/9aXwmJ #
    • 인텔 고급 그래픽스 연구실 논문들
  • profile_image Morphological Antialiasing: http://su.pr/2UTEKS #
    • 최근 발표된 새로운 안티알리아싱 기법 논문
  • profile_image RT programmingjoy: Statistics of two years of blogging about programming #programming http://bit.ly/5uByY #
    • 구글 엔지니어인듯한 한 친구의 블로그

* 이 포스트는 blogkorea [블코채널 : 웹, 컴퓨터, it에 관련된 유용한 정보 및 소식] 에 링크 되어있습니다.


크리에이티브 커먼즈 라이선스
Creative Commons License

'Tweets' 카테고리의 다른 글

My Recent Tweets 20090826  (0) 2009/08/26
My Recent Tweets 20090812  (0) 2009/08/13
My Recent Tweets 20090806  (0) 2009/08/06
My Recent Tweets 20090727  (0) 2009/07/27
My Recent Tweets 20090715  (0) 2009/07/15
My Recent Tweets 20090705  (0) 2009/07/06
Trackback 0 Comment 0

Parallelism이란 무엇인가?!

Parallelism
Parallelism by wauter de tuinkabouter 저작자 표시비영리변경 금지

※ 이 글은 http://www.cilk.com/multicore-blog/bid/5365/What-the-is-Parallelism-Anyhow 의 글을 바탕으로 정리한 것입니다.

이 글에서는 병렬성이라는 것을 이론적으로 정의해보겠습니다. 이론적인게 보통 그렇듯 실제 무슨 쓸모가 있냐 할 수도 있지만, 병렬 알고리즘의 이해에 많은 도움이 되더군요.

암달의 법칙(Amdahl's law)
먼저 잘 알려진 암달의 법칙을 소개하겠습니다.
연산의 50%만 병렬화가 가능하고 나머지는 순차 수행만이 가능하다면, 아무리 많은 자원으로 병렬화를 하더라도 2배 이상의 성능 향상은 불가능하다
이상입니다. 좀 더 일반적으로 표현하면, 연산의 p 비율만큼만 병렬화가 가능한 경우, 병렬화로 인한 속도 향상은 최대 1/(1-p)로 제한된다가 되지요.

프로그램의 병렬 수행을 dag로 표현하기
병렬성을 정의하기 위해 병렬 수행을 dag(directed acyclic graph) 형태로 표현해봅시다. 다음이 그 예입니다.



그래프 상의 노드는 단위 연산을 나타내고, 화살표 연결은 실행 흐름을 나타냅니다. 자식이 여러 개인 노드는 거기서 여러 스레드로 병렬 수행이 시작된다는 의미가 되지요.
이 경우 병렬성(parallelism)이 얼마가 될까요? 3 혹은 5?

Work law
먼저 work의 개념을 정의하겠습니다. Work는 실제 모든 연산들을 수행하는데 드는 시간을 나타내는 것으로, Dag 상의 노드들의 개수가 됩니다. 위 그래프의 경우는 18이 되지요.
TP를 간단히 p개의 프로세서를 사용해 낼 수 있는 최단 수행 시간이라 정의해보죠. work는 프로세서 한 개 사용 시 수행 시간에 해당하므로 T1으로 나타낼 수 있습니다. 이 때 다음이 성립합니다.

Tp >= T1/P

이를 Work law라 합니다. 쉽게 말하면 p 프로세서를 사용하면 p배를 넘어서는 속도 향상은 불가능하다는 자명한 이야기입니다.

Span law
다음으로 span이라는 개념이 중요합니다. Span은 dag에서 가장 긴 의존 경로의 길이를 말합니다. 위 경우는 1→ 2 → 3→ 6 → 7 → 8 → 11→ 12 → 18 9가 되겠습니다. Dag에서 소위 임계경로의 길이가 되겠습니다. 이는 무한 개의 프로세서를 쓸 수 있다고 할 때, 가장 빠른 수행 시간에 해당하므로 T로 나타낼 수 있습니다. 이 때 다음이 성립합니다.

Tp >= Tinf

 이를 Span law라 합니다. 역시 무한의 프로세서를 활용한 경우보다, p개의 프로세서를 활용한 경우가 더 빠를 수 없으니 자명해보입니다.

Parallelism
이 둘을 가지고 병렬성이 정의됩니다. 병렬성은 바로 T1/T입니다. 왜 이 놈으로 병렬성을 정의하는 것이 의미가 있는지 한번 고민해보세요. ^^ 위의 경우는 18/9가 되어 2의 병렬성이 나옵니다. 다시 말하면 프로세서 몇개를 사용해도 2배를 넘어서는 속도 향상은 위 프로그램 흐름에서는 불가능하다가 되겠습니다. 어떠세요? 예상했던 것과 비슷한가요?
실제 암달의 법칙도 간단히 유도가 됩니다. 암달의 법칙에서 p 비율만큼만 병렬화가 가능하고 나머지 1-p에 해당하는 부분은 순차 수행이 불가피하므로 T> (1–p) T1 라 할 수 있습니다. 이 때 가능한 최대 속도 향상은 T1/T< 1/(1–p) 식으로 제한이 되겠죠.

이제 병렬성을 이론적으로 확실히 정의하였습니다! 실제 이러한 병렬성의 개념을 어떻게 유용하게 쓸 수 있는지는 다음에 기회가 될 때 보여드리도록 하겠습니다.

참고링크
http://www.cilk.com/multicore-blog/

* 이 포스트는 blogkorea [블코채널 : 웹, 컴퓨터, it에 관련된 유용한 정보 및 소식] 에 링크 되어있습니다.


크리에이티브 커먼즈 라이선스
Creative Commons License
Trackback 0 Comment 0

두가지 C++ 차세대 병렬 플랫폼 간단 비교

C++0x의 기본적인 병렬 지원 강화와 함께 여러 병렬 플랫폼이 대두되고 있습니다. OpenMP(얼마 전 3.0 스펙이 나왔죠), 인텔의 TBB(Threading Building Blocks), VS 2010과 함께 등장할 PPL(Parallel Patterns Library) 및 AAL(Asynchronous Agents Library), MIT 스핀오프인 Cilk++(상용) 등이 그것입니다.


제가 일원으로 참여하고 있는 Visual Studio Team System 2010 공식 팀 블로그에 며칠 전 PPL을 이용한 피보나치 수 병렬 계산에 대한 글을 올렸습니다. 근데 그 후 Cilk++ 1.1.0 베타 버전이 출시되었다는 소식을 들었습니다. 그래서 한 번 받아서 테스트 해보았습니다.



코드의 전반적인 구성에 대한 설명은 팀블로그 글을 참고해주세요. 기본적으로 거기의 예제 코드에서 메모리 관련 테스트를 빼고 병렬 버전의 함수를 PPL이 아닌 Cilk++을 사용토록 수정한 것입니다. cilk_spawn이 PPL 코드의 tasks.run() 함수에 해당하고, cilk_sync가 tasks.wait() 함수에 해당한다고 보면 됩니다.

일단 순차 버전과의 실제 코드 차이가 PPL 버전 보다 더욱 좁혀졌습니다. 몇가지 키워드가 추가된 것 말고는 완전히 동일하죠. 라이브러리 형태로 태스크 개념을 지원하는 PPL과 달리, Cilk++는 언어 확장 키워드(31과 33줄의 cilk_spawn, cilk_sync가 그 예)로 병렬 개념을 지원합니다. 또한 OpenMP처럼 수많은 디렉티브를 공부해야할 필요도 없습니다. 서너 개의 키워드만이 제공되기 때문이죠.

그리고 Cilk++ 키워드의 장점은 그것이 강제 사항이 아니라 권고 사항이라는 겁니다. 따라서 위에서 cilk_spawn 했다고 해서 반드시 별도 스레드로 병렬 수행되는 것이 아니라 실제 하드웨어 병렬성을 조사하여 그냥 순차 실행하는 것이 낫다고 판단할 경우 순차실행할 수도 있다는거죠.

어쨌든 2 코어의 제 컴에서 릴리즈 빌드를 돌린 결과를 보면 다음과 같습니다.

PPL 버전:


Cilk++ 버전:


Cilk++ 버전이 병렬화를 더 잘하고 있음(1.82X > 1.51X)을 확인할 수 있습니다. 약간의 차이지만 여러번 돌려보아도 계속 비슷한 결과가 나왔습니다. PPL 버전은 VS 2010 기반이고 Cilk++ 버전은 VS 2080 기반이며, 그 밖에도 여러가지 면에서 엄정한 테스트와는 거리가 멉니다만... 그래도 어느 정도 Cilk++의 성능상 장점을 보여준다고 생각합니다(물론, PPL은 아직 정식 버전이 나온게 아니죠).

단, PPL은 VS 2010을 사면 공짜가 되겠지만, Cilk++은 상업적 용도로는 분명 유료라는 점!을 간과해서는 안되겠죠. ^^

* 이 포스트는 blogkorea [블코채널 : 웹, 컴퓨터, it에 관련된 유용한 정보 및 소식] 에 링크 되어있습니다.  


크리에이티브 커먼즈 라이선스
Creative Commons License
Trackback 0 Comment 1

My Recent Tweets 20090715


* 이 포스트는 blogkorea [블코채널 : 웹, 컴퓨터, it에 관련된 유용한 정보 및 소식] 에 링크 되어있습니다.  
크리에이티브 커먼즈 라이선스
Creative Commons License

'Tweets' 카테고리의 다른 글

My Recent Tweets 20090806  (0) 2009/08/06
My Recent Tweets 20090727  (0) 2009/07/27
My Recent Tweets 20090715  (0) 2009/07/15
My Recent Tweets 20090705  (0) 2009/07/06
My Recent Tweets 20090624  (0) 2009/06/25
My Recent Tweets 20090608  (0) 2009/06/08
Trackback 0 Comment 0

std::stack에 관한 소고

이하의 정보는 "C++ Concurrency in Action"에서 얻은 것임을 밝힙니다.
(참고로 아직 정식 출간되지 않은 이 책의 맛보기 버전을 여기에 있는 쿠폰코드를 사용하면 싸게 구입하실 수 있습니다.)

remember to thank all the books you haven't read over the past three years

C++ STL에서 제공하는 스택 컨테이너인 std::stack을 아실 겁니다. (정확히는 컨테이너 어댑터입니다만.)

스택하면 push/pop이 기본인데요, 이 std::stack은 실제 스택 꼭대기에 있는 놈을 리턴하는 top()과 실제 그 놈을 스택에서 꺼내는 pop() 함수가 따로 있습니다. 처음 사용할 때, 왜 이렇게 함수를 나눠놨을까 의아해 하였습니다.

이유가 있었더군요. 예외 안정성 때문이었습니다. 그냥 함수 하나로 값 리턴과 꺼내기를 한번에 수행할 경우, 그 리턴값을 지역 변수 등에 복사할 때 예외가 발생하면, 값은 못얻어왔으나 스택에서는 이미 꺼내버려 값이 사라지는 경우가 발생할 수 있습니다. 현 구현처럼 두 함수로 나눠놓으면 top()의 리턴값을 복사하는 와중에 예외가 발생하더라도 아직 꺼내진 않았기 때문에, 자료구조의 상태를 예외 발생 이전대로 안전하게 유지할 수 있는 것이죠.

근데 이러한 선택이 스레드 안전성에서는 오히려 문제가 됩니다. 아래와 같은 race 상황을 근본적으로 막을 수 없기 때문입니다. top()과 pop() 함수 등을 뮤텍스로 잘 보호해놓았어도 여전히 해결이 안되는 인터페이스 자체의 문제라 하겠습니다.


따라서 예외 안정성과 스레드 안정성을 동시에 보장할 수 있는 인터페이스를 고안해야합니다. 여러가지 해결책이 있습니다만, 다음과 같은 두가지 버전의 pop 함수를 제공해 상황에 맞게 사용자가 골라 쓸 수 있게 하는 것을 추천합니다. 위에 것은 포인터로 리턴하므로 복사 시 예외 문제가 없고, 아래 것은 출력 인자에 값을 복사한 후 pop을 하니 역시 예외 안정성이 유지됩니다.
(여러 해법들의 장단점에 대한 구체적 설명은 서두에 언급한 책을 참고해주세요.)


이 경우 빈 스택에 pop을 할 경우 예외를 던집니다. 스택이 비어 있지 않을 때가지 대기하다가 pop하는 등의 좀더 고급 동작을 원하는 경우, condition variable 같은 고급 동기화 개체를 사용해야 합니다. (위 쿠폰코드가 있는 슬라이드에 그 예가 나와있습니다.)

이렇게 생각할게 많은 병렬 프로그래밍이기에, C++0x스레드 라이브러리 지원이 개발자들에게는 천금과 같은 소식이겠습니다. ^^
크리에이티브 커먼즈 라이선스
Creative Commons License
Trackback 1 Comment 0

C++ guru's 2 recent articles on concurrency

Both DDJ articles are by Herb Sutter.
크리에이티브 커먼즈 라이선스
Creative Commons License

'Game Development' 카테고리의 다른 글

the Ten Commandments of Debugging  (0) 2008/08/14
Code Drill #1  (0) 2008/08/12
C++ guru's 2 recent articles on concurrency  (0) 2008/08/06
nvidia GPU-BBQ 2008  (0) 2008/08/06
'touch' command-line utility in Python  (2) 2008/08/01
초생산적인 팀  (0) 2008/07/31
Trackback 0 Comment 0

POSA 2

Pattern-Oriented Software Architecture Volume 2: Patterns for Concurrent and Networked Objects
사용자 삽입 이미지

I finally read this all. Definitely it's a must-read for all game programmers.
크리에이티브 커먼즈 라이선스
Creative Commons License

'Book Review' 카테고리의 다른 글

Gödel, Escher, Bach  (4) 2008/07/25
The art of being agile  (0) 2008/07/23
POSA 2  (0) 2008/06/25
Continuous endeavor for a better continuous integration  (2) 2008/06/04
Beautiful Code for game programmers  (0) 2008/04/17
Managing Humans  (0) 2008/03/27
Trackback 0 Comment 0

Software Transactional Memory

다음과 같은  두  개의  C 라이브러리를  발견하였습니다.

libcmt
LibLTX

아직 다소 생소한 concurrency  솔루션입니다만... 언젠가는  주류가 될지도 모르겠군요.

사용자 삽입 이미지

In English...(show)


크리에이티브 커먼즈 라이선스
Creative Commons License

'Game Development' 카테고리의 다른 글

DRY Macro Trick  (1) 2008/05/09
Win32 File Name Iteration Boost Way  (0) 2008/03/26
Software Transactional Memory  (0) 2008/03/26
GDC 마지막 날  (0) 2008/02/23
GDC 넷째 날  (0) 2008/02/22
GDC 셋째 날  (0) 2008/02/21
Trackback 0 Comment 0

top