(23) GTX760からGTX780に変えてみる

この記事は最終更新から 636日 が経過しています。

(22) cuda-convnet2はやってみれない (T_T) で残念な思いをしたのは20日ほど前のこと。
ここ最近で1万円近く値段が下がってきたGTX780を4万円少々で衝動買いした。

27cmもある長いボードは窮屈な筐体内で電気ストーブのように高熱を発しており…
しばらくはこまめに温度を確認しながら使うことになりそう。20140911_01

中身をのぞいてみる

deviceQueryの結果は以下の通り。
Compute capability 3.5 がうれしい!
GTX780のcore数は2304個、GTX650 384個の6倍、GTX760 1152個の2倍になった!

Device 0: "GeForce GTX 780"
  CUDA Driver Version / Runtime Version          6.0 / 6.0
  CUDA Capability Major/Minor version number:    3.5
  Total amount of global memory:                 3071 MBytes (3220504576 bytes)
  (12) Multiprocessors, (192) CUDA Cores/MP:     2304 CUDA Cores
  GPU Clock rate:                                1058 MHz (1.06 GHz)
  Memory Clock rate:                             3104 Mhz
  Memory Bus Width:                              384-bit
  L2 Cache Size:                                 1572864 bytes

cuda-convnetで速度計測

(21) GTX650からGTX760に変えてみる のときと同じく、ちょっとリッチなMNIST学習用ネットワーク100epochsで計測した。

結果1: 最新環境(intel Xeon x5570 x 2, GTX780)
100epochsの処理時間は 100秒 、エラー率は 0.010だった。

START: 2014年  9月 11日 木曜日 20:57:46 JST
======================Test output======================
logprob:  0.034160, 0.010400
END:   2014年  9月 11日 木曜日 20:59:26 JST

結果2: 直前環境(intel Xeon x5570 x 2, GTX760)
100epochsの処理時間は 157秒 、エラー率は 0.010だった。

START: 2014年  8月 18日 月曜日 15:24:10 JST
======================Test output======================
logprob:  0.034883, 0.010300
END:   2014年  8月 18日 月曜日 15:26:47 JST

結果3: 旧マシン(intel core-i3 3220, GTX650)
100epochsの処理時間は 398秒 、エラー率は 0.011だった。

START: 2014年  8月 18日 月曜日 15:23:48 JST
======================Test output======================
logprob:  0.034047, 0.010900
END:   2014年  8月 18日 月曜日 15:30:26 JST

Leave a Comment


NOTE - You can use these HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*