1. 동시성 프로그램의 이해 – Blocking에서 블록의 크기를 결정할 때에는 아키텍쳐를 고려해야 한다. G80에서 SM은 물리적으로 최대 768개의 thread, 최대 8개의 thread block을 지원한다. 8X8 크기의 블록을 사용하면 12개의 thread block이 생기기 때문에, 한 번에 8개의 thread block 밖에 실행하지…
1. 동시성 프로그램의 이해 – Blocking에서 블록의 크기를 결정할 때에는 아키텍쳐를 고려해야 한다. G80에서 SM은 물리적으로 최대 768개의 thread, 최대 8개의 thread block을 지원한다. 8X8 크기의 블록을 사용하면 12개의 thread block이 생기기 때문에, 한 번에 8개의 thread block 밖에 실행하지…
연구실 워크샵 (한재웅) – 그림이 조금 더 직관적이면 좋을 것 같음. 그림이 아닌 그래프로 설명을 하려 해서 이해하기 힘들었음. – 발음, 억양이 조금 듣기 힘듦. 영어 단어의 억양에 따라 듣기 힘들 수 있음을 느낌. – 두 가지 중요한 contribution이 구분이…
There is no excerpt because this is a protected post.
There is no excerpt because this is a protected post.
동시성 프로그램의 이해 – OpenMP는 scheduling class를 제공한다. static, dynamic, guided, runtime 등이 있다. -> static은 전체 task N을 쓰레드의 수 t로 나눈 N/t를 각 쓰레드에 할당한다. 컴파일러가 쓰레드에 할당할 task를 결정한다. -> Dynamic은 동적으로 쓰레드에 task를 할당한다. Load imbalance가…