(21) GTX650からGTX760に変えてみる

ヤフオクを眺めていたらよさげなワークステーションが安価で出品されていたのでこれを購入した。
スペックは以下の通り。これで6万円弱は安い!
・CPU: Xeon X5570 x 2個 (全16core)
・memory: 24GB
・GPU: Quadro 4000

このワークステーション、電源にも余裕があるので GPU2枚組を目論んで 2万円弱のGTX760も落札した。
今使っているGTX650のCudaCore数が384個、これに対してGTX760は1152個、なんと3倍!

比較その1: cuda-convnet

まずはcuda-convnetで速度性能を比較してみた。
対象は (15) cuda-convnetでMNIST自動認識(その2) で動かしたちょっとリッチなネットワークを100epochsとした。

結果1: 旧マシン(intel core-i3 3220, GTX650)

START: 2014年  8月 18日 月曜日 15:23:48 JST
======================Test output======================
logprob:  0.034047, 0.010900
END:   2014年  8月 18日 月曜日 15:30:26 JST

100epochsの処理時間は 398秒 、エラー率は 0.011だった。

結果2: 新マシン(intel Xeon x5570 x 2, GTX760)

START: 2014年  8月 18日 月曜日 15:24:10 JST
======================Test output======================
logprob:  0.034883, 0.010300
END:   2014年  8月 18日 月曜日 15:26:47 JST

100epochsの処理時間は 157秒 、エラー率は 0.010だった。

両者の処理時間の差は 398 : 157 だから 2.5 : 1 だった。
約8万円の投資で2.5倍に高速化した。 微妙…

比較その2: Caffe

次に caffeで速度性能を比較してみた。
対象は (20) CaffeでMNIST自動認識(その1) で動かしたCaffe付属サンプル 10,000batchesとした。

結果1: 旧マシン(intel core-i3 3220, GTX650)

I0813 20:23:56.937985  4618 solver.cpp:165] Solving LeNet
I0813 20:23:56.937995  4618 solver.cpp:232] Iteration 0, Testing net (#0)
I0813 20:23:58.769482  4618 solver.cpp:270] Test score #0: 0.0427
I0813 20:23:58.769534  4618 solver.cpp:270] Test score #1: 2.30319
======================Test output======================
I0813 20:30:07.157430  4618 solver.cpp:270] Test score #0: 0.9911
I0813 20:30:07.157462  4618 solver.cpp:270] Test score #1: 0.0283371
I0813 20:30:07.157470  4618 solver.cpp:218] Optimization Done.
I0813 20:30:07.157475  4618 caffe.cpp:102] Optimization Done.

10,000batchesの処理時間は 371秒 、正解率は 99.1%だった。

結果2: 新マシン(intel Xeon x5570 x 2, GTX760)

I0820 07:33:07.595406  9520 solver.cpp:165] Solving LeNet
I0820 07:33:07.595415  9520 solver.cpp:232] Iteration 0, Testing net (#0)
I0820 07:33:08.551427  9520 solver.cpp:270] Test score #0: 0.0566
I0820 07:33:08.551476  9520 solver.cpp:270] Test score #1: 2.30261
======================Test output======================
I0820 07:36:17.788245  9520 solver.cpp:270] Test score #0: 0.9914
I0820 07:36:17.788260  9520 solver.cpp:270] Test score #1: 0.0278619
I0820 07:36:17.788269  9520 solver.cpp:218] Optimization Done.
I0820 07:36:17.788275  9520 caffe.cpp:102] Optimization Done.

10,000batchesの処理時間は 189秒 、エラー率は 99.1%だった。

両者の処理時間の差は 371 : 189 だから 1.96 : 1 だった。
約8万円の投資で1.96倍に高速化した。 微妙…

PS.
GPU2枚組を目論んだが、GTX760が補助電源を2口も使ってしまい、電源コネクタが不足…
残念ながら古いQuadroは外すことになった…
今度差し替えてQuadroでも計測してみよう。

Leave a Comment


NOTE - You can use these HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*