20151127

1. 이정훈, Bandwidth-aware Prefetching for Emerging Architecture
– Prefetching은 bandwidth를 performance로 전환하는 기법이다.
– Prefetch에는 bandwidth, speculative라는 두 가지 측면이 있다.
– 기존의 아키텍쳐에서는 precision이 중요해서 prediction 자체에 대한 연구가 많았음. 하지만 앞으로의 아키텍쳐는 코어가 많아져서 NoC가 달라지고, bandwidth가 더 늘어나게 됨. 이를 고려해 새로운 prefetch에 대한 고려가 필요함.
– NoC 경쟁이 없는 상황에서는 prefetch를 충분히 하되, NoC 경쟁이 발생하면 prefetch보다 demand request를 우선해서 처리해주도록 한다. 그리고 경쟁이 더 심해지면 prefetch request를 throttling한다. 추가로, 메모리 bandwidth를 적절히 고려해 prefetch하도록 한다.
– prefetch가 NoC의 congestion을 일으킬 수 있다. prefetch보다는 demand request를 우선해서 처리함. congestion이 발생하면 prefetch throttling함. NoC packet의 latency를 보고 congestion을 판단한다.
– 기존의 DDR에서는 conservative한 prefetcher가 좋은 성능을 내지만, bandwdidth가 충분한 HBM에서는 aggressive한 prefetcher가 ideal에 가까운 성능을 낸다.
– 최적의 prefetch distance, degree를 찾기 위해 random profiling (RP)을 사용함. IPC를 기준으로 profiling하고, degree 우선 탐색 이후 distance를 결정한다. degree가 더 큰 영향을 미치기 때문이다.
– 하지만 이러한 random profiling은 many core system에서 문제가 될 수 있다. 여러 개의 core가 있을 때, core 1번에서 너무 많은 bandwidth를 차지하는 상황이 생길 수 있기 때문이다. 이러한 문제를 해결하기 위해 추가로 global random profiling (GRP)를 제안함.
– hybrid memory인 상황에서 RP를 적용하기 위해, 각각의 서로 다른 메모리에서 RP를 적용함. 서로 다른 두 메모리의 profiling 단계가 겹치지 않게 하기 위해, token을 사용해 해결함. profiling 단계에 들어가려면 반드시 token을 잡아야 한다.
– Motivation 설명에서 그림과 색을 적절히 사용해서 이해가 쉬웠다. 전반적인 구조를 보여주는 간단한 그림을 두고, 차례대로 각 부분을 설명하는 방법이 좋았음.
– 실험 및 그래프를 설명하는 순서: 실험 목적 및 그래프에서 보여주는 것 설명 -> 그래프의 X, Y축 설명 -> 그래프에서 각 설정 의미 설명 (legend) -> 전반적인 경향과 그 결과의 의미 설명
– 그래프에서 중요한 점을 그래프 위에 강조해주어 이해가 쉬웠다. 애니메이션을 적절히 사용하면 내용 이해에 도움이 됨.
– 발표할 때 표현에 대해 주의해야 함. “증명한다”는 표현을 하는 것은 정확하지 않음. 제목 “Bandwidth-aware Prefetching for Emerging Architecture”에서 emerging architecture가 모호한 표현일 수 있음.
– 그리고 제안하는 기법으로 인한 오버헤드도 항상 고려해야 함 (맹승렬 교수님). prefetcher로 인한 전력 소모 오버헤드에 대해 물어보심.
– 실험 모델링에 대한 질문도 있었음. DDR과 HBM을 어떻게 다르게 모델링했느냐?
– 제안한 것이 optimal이냐 하는 질문이 있었음.
– 다른 설정값에서는 성능이 어떻게 되는가 하는 질문도 있었음.


2. 한재웅, Performance Estimation and Scheduling of Parallel Computing Programs in virtual Clusters
– Cloud computing은 다양한 성능의 머신을 설정할 수 있다. 한편, 병렬 프로그램은 입력값에 따라 다른 경향을 보인다. 예전에는 클러스터의 수만 정할 수 있었으나, 요즘에는 머신의 종류까지 정할 수 있다. 사용자마다 제약 사항 또한 다르므로, 이를 고려해야 한다. 최적의 설정을 제안해주는 시스템이 필요하다.
– 여러 대의 컴퓨터에서 병렬 프로그램이 실행될 때, interference로 인한 문제가 생길 수 있음. Interference를 profiling을 통해 예측해, parallel program의 성능을 예측하는 것이 필요함.


3. 연구에 한계점이 있을 때에는 어떻게 해야 하는가?
– 석사 졸업 연구에 한계점이 있는데, 석사 디펜스 때 어떻게 해야하는지 고민이 되어 형들에게 여쭤보았음. 연구에 한계점이 있을 때에는, 한계점을 설명하고 장점이 되는 것들에 대해 설명해야 된다고 함. 한계점이 있고 장점이 없을 때에는 연구를 잘못한 것이다. 한계점을 아는 것으로도 석사 과정 학생에게는 중요한 것이니, 이를 파악하는 것이 중요하다.
– 연구를 할 때 한계점을 잘 파악하고, 어떻게 그러한 한계점을 해결할 것인지 고민하고, 해결되지 않을 때에는 다른 방법을 고안하는 과정을 거쳐야 하는 것 같다. 단순히 한계점 파악으로 끝나는 것은 좋지 않다고 생각함.

Advertisements
Tagged with: , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,
Posted in 1) Memo

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

누적 방문자 수
  • 96,190 hits
%d bloggers like this: