20160304

1. SIGARCH ([MICRO’15] WarpPool Sharing Requests with Inter-Warp Coalescing for Throughput Processors)
– GPU에서 메모리 요청이 과다해 성능 문제가 되는 경우가 있음. 기존의 intra-warp coalescing 기법에서는 warp 내에서 메모리 요청을 병합했음. 이 논문에서는 inter-warp memory request를 coalescing하고자 한다. Intra-warp coalescing을 수행한 다음, inter-warp coalescing을 한 번 더 수행하는 것. 실리콘 면적을 적게 사용하고도 일부 어플리케이션에서 성능 향상을 얻을 수 있음. 이러한 점은 이점이지만, 최종 실험 대상 벤치마크가 너무 특이한 경우라는 단점이 있다. 그리고 critical path에 캐싱을 추가함으로 인해 성능이 떨어지지 않나 하는 우려가 있음.


2. lookbusy 실행하기
lookbusy 실행이 잘 되지 않았다. 확인해보니 인자값을 잘못 주어 생기는 문제였다. ./lookbusy -c 10과 같이 명령어를 줄 수 있다. 이 때 인자로 주는 숫자는 개별 CPU의 utilization을 의미한다. 이를 모르고 8개의 CPU 전체를 의미하는 것으로 알고 ./lookbusy -c 400을 주어 제대로 실행되지 않음. 한편, ./lookbusy -c 100도 잘 되지 않는 것 같다. 한 개의 CPU를 사실상 100% 부하시키기 어렵기 때문인 듯 하다. ./lookbusy -c 99는 잘 되었다.

Advertisements
Tagged with: , , , , , , ,
Posted in 1) Memo

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

누적 방문자 수
  • 101,234 hits
%d bloggers like this: