Monthly Archives: March 2016

20160331

1. 동시성 프로그램의 이해 – Blocking에서 블록의 크기를 결정할 때에는 아키텍쳐를 고려해야 한다. G80에서 SM은 물리적으로 최대 768개의 thread, 최대 8개의 thread block을 지원한다. 8X8 크기의 블록을 사용하면 12개의 thread block이 생기기 때문에, 한 번에 8개의 thread block 밖에 실행하지

Tagged with: , , , , , , , , , , , , , , , , , , ,
Posted in 1) Memo

20160330

연구실 워크샵 (한재웅) – 그림이 조금 더 직관적이면 좋을 것 같음. 그림이 아닌 그래프로 설명을 하려 해서 이해하기 힘들었음. – 발음, 억양이 조금 듣기 힘듦. 영어 단어의 억양에 따라 듣기 힘들 수 있음을 느낌. – 두 가지 중요한 contribution이 구분이

Tagged with: , , ,
Posted in 1) Memo

Protected: 20160329 – Research

There is no excerpt because this is a protected post.

Tagged with: , , , , , , , , , ,
Posted in 1) Memo

20160329

동시성 프로그램의 이해 – GPU 프로그래밍에서는 행렬의 한 개 요소 연산에 한 개의 쓰레드를 생성한다. dimGrid는 커널 연산에서의 쓰레드 블록의 차원을, dimBlock은 한 개 쓰레드 블록 내에서 쓰레드 차원을 정의한다. G80에는 16개의 streaming multiprocessor가 있음. 한 번에 한 개의 streaming

Tagged with: , , , , , , , , , , , , , , , , , , , ,
Posted in 1) Memo

Protected: 20160328 – Research

There is no excerpt because this is a protected post.

Tagged with: , , , , , , , , , ,
Posted in 1) Memo

20160324

동시성 프로그램의 이해 – OpenMP는 scheduling class를 제공한다. static, dynamic, guided, runtime 등이 있다. -> static은 전체 task N을 쓰레드의 수 t로 나눈 N/t를 각 쓰레드에 할당한다. 컴파일러가 쓰레드에 할당할 task를 결정한다. -> Dynamic은 동적으로 쓰레드에 task를 할당한다. Load imbalance가

Tagged with: , ,
Posted in 1) Memo

20160323

고성능컴퓨팅시스템 기술 동향 및 국내 개발 계획, 차광호 1. 슈퍼컴퓨터의 정의 – 슈퍼컴퓨터란? 시간 당 연산량이 많은 것. 전통적인 기준은 FLOPS. 하지만 그 기준이 다양화되고 있음. 인공지능같은 요구를 맞추려면 FLOPS는 맞지 않을 것 최근 들어 소비 전력이 중요한 기준이 됨.

Posted in 1) Memo
누적 방문자 수
  • 93,622 hits