20150422 – Research

[MICRO’09] In-network coherence filtering snoopy coherence without broadcasts
Single core에서 multicore 프로세서로 넘어가게 되면서, 캐시 사이의 coherence 유지 문제가 중요하게 되었다. 이상적으로는 오버헤드가 적으면서, 빠르게 정보를 교환할 수 있는 프로토콜이 필요하다. 현재 가장 많이 쓰이고 있는 cache coherence protocol은 크게 두 종류인데, 하나는 broadcast-based snoopy protocol이고, 다른 하나는 directory protocol이다. Snoopy coherence protocol은 캐시 사이에 정보 전달이 빠르고, 저장 공간의 오버헤드는 없지만 브로드캐스팅이 많이 발생한다. Directory based cache coherence protocol은 홈 노드까지 가야 하므로 정보 전달은 느리지만, 브로드캐스팅이 발생하지 않는다.
실제로 확인해보면, 불필요한 브로드캐스팅이 많이 발생해 이것이 성능 저하의 원인이 되고 있음을 확인할 수 있다. 이를 해결하고자 지금까지 다양한 snoop filtering 기법이 제안되었다. 크게 두 종류로 나눌 수 있는데, destination-based filtering과 source-based filtering으로 나눌 수 있다. Destination-based filtering은 태그 확인에 소요되는 전력 소모와 포트 경쟁을 막는다. Source-based filtering은 공유되어있지 않은 것에대해서는 브로드캐스팅하지 않음으로써 대역폭 소모를 막는다.
하지만 source-based filtering에도 여전히 문제가 있다. Source based filtering은 공유되지 않은 데이터에 대한 브로드캐스팅은 방지하지만, 공유된 데이터에 대해서는 브로드캐스팅을 한다. 전체 노드 중에 단 한 개의 노드만 해당 캐시 라인을 공유하고 있더라도, 브로드캐스팅이 발생한다. 그리고 지금까지의 source based filtering 기법은 버스와 같이 동기화되는 브로드캐스팅 인터커넥션에만 적용 가능하다. 분산 인터커넥션에는 적용이 불가능하다.
이를 해결하고자 이 논문에서는 In-Network Coherence Filtering (INCF)를 제안한다. INCF는 불필요한 cache coherence traffic을 라우터 수준에서 막는다. 그리고 이것의 정보를 업데이트하기 위한 기법인 region update step을 제안한다. Motivation에 대한 그림은 Figure 3에서 볼 수 있으며, INCF 동작 과정에 대한 그림은 Figure 5에서 볼 수 있다.

[TPDS’07] A NUCA Substrate for Flexible CMP Cache Sharing
교수님께서 어떤 연구를 하셨는지 확인하기 위해 읽어본 논문. 내용이 어려워서 이해하기 힘들었다. 간단한 아이디어와 동기에 대해서만 설명하면 다음과 같다. LLC를 공유할 수도 있고, 각 프로세서가 private하게 가질 수도 있는데, 각각의 장단점이 있다. 공유하면 miss가 줄어들지만 latency가 증가하고, 공유하지 않으면 latency는 줄어들지만 miss는 늘어난다. 여기서 LLC 공유도를 sharing degree (SD)라고 정의한다.
이 논문에서는 이를 조금 더 잘 조작해서, miss도 줄이고 latency도 줄이자는 것이다. 우선 SD에 따른 캐시 성능 변화를 조사해 SD에 따른 coherence 오버헤드, 에너지 효율 등을 조사한다. 그 다음으로는 cache block을 동적으로 이동시킴으로써, 자주 이용하는 캐시 블록을 해당 블록을 사용하는 프로세서에 가깝게 한다. 그리고 자주 이용하지 않는 캐시 블록은 상대적으로 먼 곳에 위치시킨다. 추가로 L1에 prefetching을 추가함으로써 성능 향상을 더 이끌어낸다.
전반적으로 내용이 생소했고, 익숙하지 않아 읽기가 어려웠다.

[’15] Flexible Virtual Segmentation for Large Memory Systems
기억을 되살리기 위해 다시 한 번 읽어봄. 아무래도 technical report라 그런지, 논문의 내용이 쉽게 읽히지 않았다. 문단이 너무 길고, 문장이 자연스럽지 않고 반복되는 구조가 많았다. 아이디어 또한 그렇게 강하지 않은 듯 했다. 원래 paging을 쓰고 있었는데 Basu가 direct segment를 쓰자 했고, 여기에 또다시 segment를 넣자는 것이 자연스럽지도, 새로워 보이지도 않는다.

Advertisements
Tagged with: , , , , , , , , , , , , , , , , , , ,
Posted in 1) Memo

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

누적 방문자 수
  • 98,779 hits
%d bloggers like this: