20140716

1. cacloud에 Xen 설치.
1) cacloud08에서 여전히 Xen이 잘 동작하지 않는다. 추측하기에 xen-utils-3.3을 설치하는 과정에서 문제가 생긴 것 같다. cacloud08에서 xen-utils-3.3을 제거하려 하면 다음과 같은 에러가 발생한다.

D000002: fork/exec /var/lib/dpkg/info/xen-utils-3.3.postinst ( configure  )
update-rc.d: warning: xend start runlevel arguments (2 3 4 5) do not match LSB Default-Start values (3 4 5)
update-rc.d: warning: xend stop runlevel arguments (0 1 6) do not match LSB Default-Stop values (0 1 2 6)
xencommons should be started first.
invoke-rc.d: initscript xend, action "start" failed.

상훈이 형에게 cacloud08에 ubuntu 재설치 가능한지 여쭤봄.

2) cacloud05, 09에 Xen 설치
cacloud09에 기본 패키지들이 설치되어 있지 않아서 시간이 꽤 걸렸음. 내가 정리한 Xen 설치 방법(2014/07/07 Xen Installation)에서는 관련 라이브러리 설치를 위해 apt-get build-dep 명령을 사용했는데, cacloud에서는 그 명령어가 잘 되지 않았다. apt-get install 명령으로 모두 설치했다.

#apt-get install bcc bin86 gawk bridge-utils iproute libcurl3 libcurl4-openssl-dev bzip2 module-init-tools transfig tgif texinfo texlive-latex-base texlive-latex-recommended texlive-fonts-extra texlive-fonts-recommended pciutils-dev mercurial build-essential make gcc libc6-dev zlib1g-dev python python-dev python-twisted libncurses5-dev patch libvncserver-dev libsdl-dev libjpeg62-dev iasl libbz2-dev e2fslibs-dev git-core uuid-dev ocaml libx11-dev bison flex gettext libfindlib-ocaml libyajl1 libyajl-dev ocaml-findlib

cacloud05, 09 모두에 Xen이 잘 설치되었다. cacloud09는 ubuntu 12.04.2가 설치되어 있었다. 실험에 문제가 있지는 않을까? cacloud09에 ubuntu 10.04가 설치되어 있었다. 문제 없음. cacloud09에서 grub2를 지우고 grub1으로 바꿨다. cacloud09의 커널이 Dom 0를 지원하지 않아, 커널을 교체함.

cacloud09의 커널을 교체하는 과정에서 에러 발생. (ERROR : Unable to locate IOAPIC for GSI)

하지만 알고 보니, IOAPIC 에러 메시지가 중요한 것이 아니었다. 커널 교체하는 과정에서 뭔가 잘못이 있었음. 다시 한 번 시도하니 잘 되었다.

3) cacloud01, 03, 05, 09, 02, 06, 04, 07, 08, 20을 실험에서 사용할 것.


2. [ISCA’13] Die-Stacked DRAM Caches for Servers를 읽음.
1) Dennard Scaling : Dennard scaling은 MOSFET scaling이라고도 하며, 1974년에 Robert H. Dennard가 쓴 논문에 등장하는 개념이다. Transistor가 작아져도 그것의 power density는 일정하므로, power usage는 면적에 비례한다는 것이다.

지금까지의 CMOS 스케일링에서는 트랜지스터 크기가 줄어들면서 게이트 길이가 원래의 70%로 짧아지면, 구동 전압(Vdd)도 70%로 떨어지고 정전 용량도 70%로 줄어들고, 게이트 산화막 두께(Oxide Thickness:Tox)도 마찬가지로 얇아집니다. 게이트 산화막이 얇아지면 트랜지스터의 스위칭이 빨라져 트랜지스터가 1.4배 빠르게 동작할 수 있게 됩니다.

전통적 CMOS 스케일링에서는 동작 클럭이 1.4배가 되면서 늘어난 전력은 정전 용량이 70%로 줄어든 것으로 상쇄할 수 있었습니다. 그리고 면적 당 트랜지스터 수가 2배 늘어나면서 따라 늘어난 전력은 전압을 70%로 줄이면서 상쇄할 수 있었습니다. 전력은 전압의 2승에 비례하기 때문입니다. 그 때문에 전력 사용량을 늘리지 않고 트랜지스터 수를 2배로, 클럭을 1.4배로 하는 것이 가능했습니다. Dark Silicon Workshop 2012의 Is Dark Silicon Useful?이란 슬라이드는 그 관계를 잘 보여주고 있습니다.

그러나 130나노미터 이후에는 실제 Vdd가 전통적 스케일링의 규칙에서 벗어났고, Tox도 차이가 나기 시작합니다. 즉 게이트 산화막 두께는 얇아지지 않고, 전압은 떨어지지 않는 것입니다. 바꿔 말하면 트랜지스터의 고속화와 소비 전력의 절감 속도가 줄어들게 되었습니다. 그 결과 미세화를 통해 트랜지스터 밀도가 향상되면 면적 당 전력이 늘어나게 됩니다. IBM은 2004년부터 이 현상을 전통적 CMOS 스케일링의 종말이라 제기하고, 앞으로 칩 설계에서 큰 장애물이 될 것이라 설명했습니다[1].

2) Dark Silicon : 성능에 기여하지 못하는 silicon area를 말한다. 예전에는 transistor가 희소한 자원이었다. 이 때에는 transistor를 추가함으로써 성능 향상을 기대할 수 있었다. 그리고 Dennard scaling으로 인해 power 소모는 크게 증가시키지 않고도 computing power의 향상이 가능했다. 이제는 많은 수의 transistor를 저렴한 비용에 집적할 수 있다. 하지만 Dennard scaling의 한계에 부딪힘에 따라, power 소모가 증가하게 된다. (더 많은 transistor를 넣는 것은 더 많은 power 소모를 의미하게 되었다.) 이같은 power의 제약으로, 많은 transistor를 넣는다고 해도 모두 사용하지 못하게 된다. 뿐만 아니라 application 수준의 parallelism에도 제약이 있으므로, 모든 transistor를 가동한다고 해도 성능 향상을 기대할 수 없다. (Amdahl’s law) 이처럼 성능 향상에 기여하지 못하는 silicon area를 dark silicon이라고 한다.

References :
[1] 모바일 SoC에서 다크 실리콘이 주는 한계, gigglehd, http://gigglehd.com/zbxe/newsreport/8070478
[2] Microprocessor Technology, http://tera.yonsei.ac.kr/class/2013_1/lecture/Topic%208%20Microprocessor.pdf
[3] David Chisnall, The Dark Silicon Problem and What it Means for CPU Designers, http://www.quepublishing.com/articles/article.aspx?p=2142913
[4] ADRIAN MCMENAMIN, THE END OF DENNARD SCALING, http://cartesianproduct.wordpress.com/2013/04/15/the-end-of-dennard-scaling/
[5] Dennard scaling, Wikipedia, http://en.wikipedia.org/wiki/Dennard_scaling


3. 교수님과 미팅
1) 교수님께 어제 생긴 의문에 대해 여쭤봄. (write through의 장점이 무엇일까?) Memory에 write through 하는 경우는 흔하지 않다. 메모리 계층이 L1, L2, memory 순서로 되어 있다고 하자. L1에서 L2로 write through, L2에서 memory로 write-back을 하게 된다. 그리고 메모리에 최신 데이터를 유지해야 하는 이유를 꼽자면, 입출력 장치에서 DMA로 메모리에 접근할 수 있으므로 최신 데이터를 유지해야 한다.

2) DRAM 스터디
상훈, 태훈이 형께서 DRAM 의 전반적인 것에 대해 알려주셨다.

DRAM의 계층은 channel, DIMM, Rank, Chip, Bank, Row/Column 으로 나뉜다.

Processor 안에 memory controller가 있고, i7의 경우 세 개의 channel을 갖는다.

한 개의 rank는 64 비트이다.

일반적으로 cache block의 크기는 64byte이다. 앞서 이야기했듯이 한 개의 rank는 64 bit (8 bytes)이므로, 한 개의 cache block을 채우기 위해서는 8번의 메모리 접근이 필요하다. 이 외에 DDR4, HBM에 대해 소개해주심.


4. SIGOPS ([SOSP’13] Timecard: Controlling User-Perceived Delays in Server-Based Mobile Applications)
‘모바일 어플리케이션이 서버와 통신하는 경우, 사용자의 요청과 응답 사이에 delay가 발생하게 된다. 요청과 응답 사이의 delay를 일정하게 하겠다.’는 주제의 논문. 여기서 제시하는 구조를 Timecard Architecture라고 이야기하고 있음. 사용자가 언제 서비스를 요청한 시점, 서버까지 요청이 도달하는데 걸린 시간, 사용자에게 응답이 돌아가는 데 걸리는 시간을 측정 및 예상해, 서버에서 처리할 시간을 정하겠다는 것이다. 서버는 남은 시간이 짧으면 낮은 quality의 서비스를, 시간이 많이 있으면 더 높은 quality의 서비스를 제공할 것이다.


5. 지금까지 SIGOPS, SIGARCH에서 다룬 논문 목록
1) SIGOPS
2014/04/09 [ASPLOS’13] Why You Should Care About Quantile Regression
2014/04/16 [NSDI’14] FaRM: Fast Remote Memory
2014/04/30 [HPCA’14] Improving In-Memory Database Index Performance with Intel Transactional Synchronization Extensions
2014/05/14 [SOSP’13] PARROT A Practical Runtime for Deterministic, Stable, and Reliable Threads
2014/05/28 [HPCA’14] Improving Cache Performance by Exploiting Read-Write Disparity
2014/06/25 [ASPLOS’13] Production-Run Software Failure Diagnosis via Hardware Performance Counters
2014/07/02 [OLS’14] Policy Extendable LMK Filter Framework
2014/07/09 [ATC’14] GPUvm Why Not Virtualizing GPUs at the Hypervisor
2014/07/16 [SOSP’13] Timecard Controlling User-Perceived Delays in Server-Based Mobile Applications

2) SIGARCH
2014/03/28 [MICRO’13] Multi-Grain Coherence Directories
2014/04/18 [ASPLOS’14] Scale Out NUMA
2014/05/02 [ASPLOS’14] Quasar Resource-Efficient and QoS-Aware Cluster Management
2014/05/16 [ASPLOS’14] The Sharing ArchitectureSub-Core Configurability for IaaS Clouds
2014/05/23 [ISCA’06] A Case for MLP-Aware Cache Replacement
2014/05/30 [MICRO’13] Trace Based Phase Prediction For Tightly-Coupled Heterogeneous Cores
2014/06/20 [MICRO’13] Meet the Walkers
2014/07/04 [ISCA’13] Die-Stacked DRAM Caches for Servers
2014/07/11 [S&P’14]Stealing Webpages Rendered on Your Browser By exploring GPU Vulnerabilities

Advertisements
Tagged with: , , , , , , , , ,
Posted in 1) Memo

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

누적 방문자 수
  • 90,796 hits
%d bloggers like this: