20141117

graph500, gups, NPB_BT, NPB_DC, NPB_EP, NPB_FT, NPB_MG, NPB_SP, NPB_UA, bzip2_source, perlbench_checkspam, perlbench_splitmail, bzip2_liberrty, gcc_typecheck, gcc_g23, gcc_scilab, mcf, h264ref_foreman_main, libquantum, sjeng, astar_biglake, astar_river, bwaves, omnetpp, xalancbmk, gamess_cytosine, milc, zeusmp, cactusADM, dealII, leslie3d, soplex_pds, soplex_ref, GemsFDTD, lbm, sphinx, tonto, wrf에서 에러 발생.

graph500에서 실행 중 에러 발생

Completed    1209073000 cycles,     864425859 commits:    260712 Hz,    187142 insns/sec: rip 0000000000405582
Invalid opcode at 0x7fffdf6becde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

gups에서 실행 중 에러 발생

Completed     985968000 cycles,     777630438 commits:    426270 Hz,     88624 insns/sec: rip ffffffff8109f101
Invalid opcode at 0x7fff2bdfecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

NPB_BT에서 실행 중 에러 발생

Completed     993915000 cycles,     831171501 commits:    365243 Hz,    203168 insns/sec: rip ffffffff8106be7c
Invalid opcode at 0x7fff33bfecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

NPB_DC에서 실행 중 에러 발생

Completed      89513000 cycles,      71067228 commits:    247808 Hz,    195015 insns/sec: rip 00007f66a0dd20fa
Invalid opcode at 0x7fffad9fe8c4: split_invalid_basic_blocks 0, first_insn_in_bb? 0

NPB_EP에서 실행 중 에러 발생

Completed     953183000 cycles,     699584104 commits:    276497 Hz,    196382 insns/sec: rip 00007fb408cc153d
Invalid opcode at 0x7fffccdfecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

NPB_FT에서 실행 중 에러 발생 (거의 돌지 않았음.)

Completed       5466000 cycles,       2728689 commits:    292571 Hz,    163453 insns/sec: rip 00007f981f13fddb
Invalid opcode at 0x7fffb57d9cde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

NPB_MG에서 실행 중 에러 발생

Completed     788057000 cycles,     320203572 commits:    619426 Hz,     81819 insns/sec: rip ffffffff81365d84
Invalid opcode at 0x7fff971fecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

NPB_SP에서 실행 중 에러 발생

Completed    1137014000 cycles,     439906215 commits:    468779 Hz,    154203 insns/sec: rip ffffffff810a4c90
Invalid opcode at 0x7fff1c46ecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

NPB_UA에서 실행 중 에러 발생

Completed    1508137000 cycles,     580809823 commits:    724558 Hz,    117810 insns/sec: rip ffffffff810d3bec
Invalid opcode at 0x7fff27dfecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

bzip2_source에서 실행 중 에러 발생

Completed     588632000 cycles,     499234113 commits:    423000 Hz,    141476 insns/sec: rip ffffffff8109e6c7
Invalid opcode at 0x7fff427fecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

perlbench_checkspam에서 실행 중 에러 발생

Completed     887824000 cycles,     874933533 commits:    229413 Hz,    239781 insns/sec: rip ffffffff8109e6c7
Invalid opcode at 0x7fffcbffecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

perlbench_splitmail에서 실행 중 에러 발생

Completed     979590000 cycles,     760574753 commits:    243692 Hz,    201439 insns/sec: rip ffffffff8108e50b
Invalid opcode at 0x7fff031fecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

bzip2_liberty에서 실행 중 에러 발생

Completed     339909000 cycles,     347881422 commits:    248067 Hz,    286037 insns/sec: rip 0000000000402312
Invalid opcode at 0x7fffa369e8c4: split_invalid_basic_blocks 0, first_insn_in_bb? 0

gcc_typecheck에서 실행 중 에러 발생

Completed     879165000 cycles,     629234663 commits:    382653 Hz,    117455 insns/sec: rip ffffffff817199d2
Invalid opcode at 0x7fffbf5ebcde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

gcc_expr2에서 실행 중 에러 발생

Completed    1011853000 cycles,     807098067 commits:    310105 Hz,    175888 insns/sec: rip ffffffff817199d6
Invalid opcode at 0x7fff251fecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

gcc_g23에서 실행 중 에러 발생

Completed     846305000 cycles,     702724785 commits:    283906 Hz,    169442 insns/sec: rip ffffffff810a5900
Invalid opcode at 0x7fffb9f65cde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

gcc_scilab에서 실행 중 에러 발생

Completed     666604000 cycles,     524200585 commits:    353197 Hz,    172395 insns/sec: rip ffffffff810a4501
Invalid opcode at 0x7fff1419a8c4: split_invalid_basic_blocks 0, first_insn_in_bb? 0

mcf에서 실행 중 에러 발생

Completed     461871000 cycles,     124090025 commits:    671151 Hz,    116944 insns/sec: rip ffffffff810a1218
Invalid opcode at 0x7fff9fbfe8c4: split_invalid_basic_blocks 0, first_insn_in_bb? 0

h264ref_foreman_main에서 실행 중 에러 발생

Completed     378562000 cycles,     368638271 commits:    453575 Hz,     99088 insns/sec: rip 00007f13e608b860
Invalid opcode at 0x7fff8b1fe8c4: split_invalid_basic_blocks 0, first_insn_in_bb? 0

libquantum에서 실행 중 에러 발생

Completed    1696880000 cycles,     905826920 commits:    591703 Hz,     98456 insns/sec: rip ffffffff81096628
Invalid opcode at 0x7fff99dfecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

sjeng에서 실행 중 에러 발생

Completed     979776000 cycles,     920131303 commits:    332335 Hz,    171951 insns/sec: rip ffffffff8136856f
Invalid opcode at 0x7fff69fdacde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

astar_biglake에서 실행 중 에러 발생

Completed    1534897000 cycles,     697564906 commits:    367983 Hz,    106983 insns/sec: rip ffffffff8109d850
Invalid opcode at 0x7fff29ffecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

astar_river에서 실행 중 에러 발생

Completed     775372000 cycles,     438586070 commits:    242098 Hz,    154760 insns/sec: rip 0000000000407825
Invalid opcode at 0x7fff7d7c7cde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

bwaves에서 실행 중 에러 발생

Completed    1390635000 cycles,     432941583 commits:    611567 Hz,    110430 insns/sec: rip ffffffff8109d581
Invalid opcode at 0x7fff2979fcde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

omnetpp에서 실행 중 에러 발생

Completed    1145417000 cycles,     437494829 commits:    373654 Hz,    137754 insns/sec: rip ffffffff810cd900
Invalid opcode at 0x7fff7cffecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

xalancbmk에서 실행 중 에러 발생

Completed     997003000 cycles,     363607398 commits:    592172 Hz,    128277 insns/sec: rip ffffffff8171d950
Invalid opcode at 0x7fff893fecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

gamess_cytosine에서 실행 중 에러 발생

Completed     818738000 cycles,     964813799 commits:    214857 Hz,    260907 insns/sec: rip 00007fce66d3d498
Invalid opcode at 0x7fffcf312cde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

milc에서 실행 중 에러 발생

Completed    1278216000 cycles,     645000286 commits:    479168 Hz,    185137 insns/sec: rip ffffffff8109d37f
Invalid opcode at 0x7ffff2bfecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

zeusmp에서 실행 중 에러 발생

Completed    1445702000 cycles,     992726126 commits:    481116 Hz,    150142 insns/sec: rip ffffffff8171db25
Invalid opcode at 0x7fffd016acde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

cactusADM에서 실행 중 에러 발생

Completed     587768000 cycles,     486095111 commits:    518855 Hz,    138848 insns/sec: rip ffffffff8101256b
Invalid opcode at 0x7fffa86eacde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

dealII에서 실행 중 에러 발생

Completed     534176000 cycles,     101426040 commits:    644677 Hz,    122198 insns/sec: rip 00007f03fe81560f
Invalid opcode at 0x7fff053fe8c4: split_invalid_basic_blocks 0, first_insn_in_bb? 0

leslie3d에서 실행 중 에러 발생

Completed    1247585000 cycles,     454711463 commits:    644079 Hz,    195026 insns/sec: rip ffffffff810a4d40
Invalid opcode at 0x7fffad8dccde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

soplex_pds에서 실행 중 에러 발생

Completed      26611000 cycles,       9469100 commits:    559600 Hz,    111525 insns/sec: rip ffffffff810c866e
Invalid opcode at 0x7fff27943cde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

soplex_ref에서 실행 중 에러 발생

Completed     773885000 cycles,     292917219 commits:    644516 Hz,    124471 insns/sec: rip ffffffff8136856f
Invalid opcode at 0x7fff977fecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

GemsFDTD에서 실행 중 에러 발생

Completed    1481933000 cycles,     526879982 commits:    626174 Hz,    108546 insns/sec: rip ffffffff8108ed43
Invalid opcode at 0x7ffff2ffecde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

lbm에서 실행 중 에러 발생

Completed     581382000 cycles,     279661669 commits:    559046 Hz,     90630 insns/sec: rip ffffffff8171da15
Invalid opcode at 0x7fffd4d86cde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

sphinx3에서 실행 중 에러 발생

Completed     937009000 cycles,     358712841 commits:    509585 Hz,    187477 insns/sec: rip 00000000004158ba
Invalid opcode at 0x7fff2fb4bcde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

tonto에서 실행 중 에러 발생

Completed     761086000 cycles,     782015837 commits:    295764 Hz,    205230 insns/sec: rip ffffffff8171da1e
Invalid opcode at 0x7fffde530cde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

wrf에서 실행 중 에러 발생

Completed     677186000 cycles,     386585129 commits:    557484 Hz,    137385 insns/sec: rip ffffffff8109d581
Invalid opcode at 0x7fff12df1cde: split_invalid_basic_blocks 0, first_insn_in_bb? 0

한편, graph500은 emulation mode로 실행했을 때에는 끝까지 잘 실행되었다. MARSSX86을 debug mode로 빌드한 뒤(scons … debug=1 …), 가장 짧게 실행된 NPB_FT를 simulation mode로 실행해보았다. 100000 instruction을 실행했을 때에는 잘 되었다. 1000000000 instruction을 실행했을 때에는 오류가 발생했다. NPB_IS는 임의로 fast-forwarding했는데, 너무 많은 instruction을 건너뛴 것이 아닌가 싶다.

Emulation mode로 실행했을 때 NPB_IS가 잘 되지 않았다. (NPB_IS가 프로세스 목록에 없음) Checkpoint 생성에 실패한 듯 하다. Emulation mode로 실행했을 때, graph500, gups, NPB_BT, NPB_DC, NPB_EP, NPB_FT, NPB_MG, NPB_SP, NPB_UA, NPB_LU, bzip2_source, wrf는 잘 실행되었다. (모두 다 실행해보기엔 너무 많음) 모든 snapshot을 끝까지 실행해보진 않았지만, simulation에서의 오류가 의심됨. NPB_IS는 확실히 emulation mode에서도 제대로 작동하지 않았으므로, checkpoint 생성에서의 문제가 맞다. graph500은 emulation mode로 하루 넘게 실행해도 오류가 발생하지 않았는데, simulation mode에서 1 billion instruction을 실행했을 때 에러가 발생했다. Simulation으로 인한 오류임을 보이기 위해서는, 수정 이전의 코드로 1 billion instruction을 실행해봐야 할 것 같다. (수정 이전의 코드에서는 에러 발생 안 하고, 수정 이후의 코드에서 에러 발생함을 확인해야 함.)

수정되지 않은 MARSSx86 코드를 빌드해, NPB_FT를 1 billion instruction 실행해야겠다. cacloud03에서 수정되지 않은 MARSSx86을 빌드하고, NPB_FT를 100000 instruction 실행했다. 수정되지 않은 MARSSx86에서도 에러가 발생한다. checkpoint에서의 에러로 보인다.

MARSSx86은 gcc-4.4로 빌드했다. (4.1로 빌드 불가능) 내 컴퓨터에 설치된 gcc는 4.8 버전이다. bzip2를 gcc, g++ 4.1로 빌드했다. cacloud01에서 잘 실행되었음. ubuntu 14 VM, ubuntu 12 VM 모두에서 checkpoint 생성이 제대로 되지 않았다. checkpoint가 생성되긴 하지만, 정상적으로 생성되지 않는다. 모두 실행되지 않고, 그냥 꺼져버리며 checkpoint가 생성되었다고 나온다. binary의 문제인가?

ubuntu 12.04에서 fast forwarding한 이후, gcc 4.1로 내가 빌드한 bzip2를 실행하고 checkpoint 생성 시도. 바로 꺼져버림. ubuntu 12.04에서 fast forwarding 없이, checkpoint 생성 시도. (bzip2를 실행) create_checkpoint로 생성 시도했음에도 바로 꺼져버림. 이번에는 강욱이 형에게 받은 bzip2로 fast forwarding 없이 checkpoint 생성 시도. 강욱이 형에게 받은 bzip2에서도 에러가 발생했다.

파이썬 스크립트의 문제인가 싶어서, create_checkpoint와 kill_sim 없이 bzip2만 실행해보았다.(ubuntu 12.02에서) 에러가 발생하지 않음.

확인해보니, ptlsim이 수정된 상태에서 checkpoint를 생성하고 있었다. 다시 해야 할 듯. 수정되지 않은 상태에서 fast forwarding하지 않고 checkpoint 생성 시도. 마찬가지로 잘 되지 않았다. OSError 발생. (12.04, 강욱이 형이 준 bzip2를 사용함.)

Switching to simulation
Checkpoint name:bzip2_source
ptlsim_ptlcall_init: mapped PTLcall MMIO page at phys 0x8fffff000, virt 0x7f7703942000
OSError

OSerror가 발생하는 것이 cacloud의 문제일지도 모르겠다는 생각이 든다. MARSSx86에서 제공하는 VM 이미지에, 강욱이 형이 준 bzip2를 돌렸음에도 checkpoint를 생성하자마자 에러가 발생했다. 아무리 해도 안 된다. 이렇게 checkpoint 생성이 어려웠던가? stop_sim을 빼고 했음에도 안 된다. create_checkpoint의 에러이거나, 명령어 전달 과정(;로 연결)의 에러일 것 같다. 내일 정섭이 형과 확인해봐야겠다.

Advertisements
Posted in 1) Memo

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

누적 방문자 수
  • 101,234 hits
%d bloggers like this: