20170919

1. 병렬 처리
GPU에서 행렬 접근시 column-wise 접근이 coalescing에 더 좋음. Thread 내에서는 locality가 낮지만, thread 사이에는 locality가 높아 coalescing이 쉬움.
shared memory도 여러 개의 bank로 나누어져 있고, 따라서 bank conflict가 없도록 접근할 때 최대 성능을 보인다.
CHWN/NCHW 등의 메모리 배치에 따른 성능이 다르고, 이는 coalescing 때문이다. Memory access pattern에 차이가 발생한다.


2. 운동
오늘은 덤벨 쓰러스터와 TRX 로우를 배움. TRX 로우를 할 때에는 반동을 주지 말고, 천천히 올라갔다 내려가야 한다.

Advertisements
Posted in 1) Memo

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

누적 방문자 수
  • 98,779 hits
%d bloggers like this: