ALIENWARE m15 R2 ~デルアンバサダープログラム~
今回はデルアンバサダープログラムでALIENWAREをレンタルすることができたので、簡単なレビューをします。
と言っても、ゲーミング性についてはいろいろな方が記事にしているので、大学生の研究などでどの程度使えるかをCUDAのベンチマークを動かしてみようと思います。
ALIENWARE m15 R2 スペック
最新機種ではR3が出ているので一つ前の世代となる。
CPU | Intel Core i7-9750H 2.60GHz (TB 4.50GHz) |
GPU | NVIDIA GeForce RTX 2070 with Max-Q Design |
メモリ | DDR4 2666 16GB |
ストレージ | SN520 NVMe 512GB (256GB ×2 Raid0) |
ノートPCとしてはスペックは申し分ない、ミドルレンジのデスクトップPCよりも高性能な可能性もある。
気になる点はRaid0を使用している点だが、これはカスタマイズで変更できるので問題ないと思われる。
とことんSSDのスピードにこだわりたいならRaid0を選択すれば幸せになれます。あとでcrystal disk mark回した結果を載せておきます。
CPU性能
CINEBENCH R20を回した結果、2152でした。デスクトップPCにも引けを取らないような数値ですが、温度がものすごく高いです。
一時、100℃になるなど爆熱でした。追加の冷却ファンやスタンドがあると多少は緩和されるので、フルでCPUを使うときは注意が必要です。
※100℃を超えるとサーマルスロットリングが働きコアクロックが下がっていきます。CINEBENCHを連続でまわすとクロックが下がりスコアが1800台にまで下がることもありました。
GPU性能
今回はここが本番。CUDAサンプルを用いてGPUの性能評価をしていきます。ゲーミング性能というよりかは計算能力の評価なので、興味がない人は飛ばしてください。
また、後日CUDAサンプルの使い方を備忘録として投稿する予定ですので、興味がある方はそちらをお待ちください。
nbody
他体系のシミュレーションを行うサンプルプログラムです。FP32とFP64の性能評価ができます。
今回は2048000個の粒子に対してのシミュレーションを行っています。
FP32性能で3.54TFlops, FP64性能で121.1GFlopsとなりました。カタログスペックはFP32性能で5.46TFlops, FP64性能で170.6GFlopsなのでそこそこいい値が出ているのではないでしょうか?
GeForceにはFP64ネイティブのコアが搭載されていないのでFP64性能が低いのは当然の結果ですのでご心配なく、GeForceはゲーミング向けのGPUなので単精度の計算に特化したGPU設計になっており、倍精度計算が必要な方はQuadroをお勧めします。
eigenvalues
次は2重対角行列の固有値を計算するサンプルプログラムです。
65536×65536の行列の固有値を計算するのにかかる時間を測定しました。
結果は45秒ほどでした。このプログラムについてあまり調べていないのでコマンド実行から終了までをストップウォッチで測った時間です。参考までに。
bandwidthTest
GPUとDRAM, GPUとVRAMのメモリ帯域を測定するプログラムです。
VRAMの帯域は211.7GB/sと高速ですが、ホスト側のDRAMは3.1GB/sとPCIeの帯域とCPUがボトルネックになっていると思われます。
VRAMの帯域のカタログ値は384.0GB/sですので少し遅い気もします。
この結果からUnified Memoryを用いると計算スピードが大きく落ちてしまう理由がわかりますね。
MixBench
CUDAサンプルプログラムとは違うベンチマークですが、一応載せておきます。このベンチでは半精度性能(FP16)と整数演算性能も測定できますので、機械学習の性能評価として指標になるかもしれません。
ピーク性能 | カタログ値 | |
---|---|---|
FP16(半精度) | 12.64 TFlops | 10.92 TFlops |
FP32(単精度) | 6.367 TFlops | 5.469 TFlops |
FP64(倍精度) | 172.4 GFlops | 170.6 GFlops |
いずれもピーク性能ではカタログ値を上回っていることがわかります。カタログ値などのスペックはTECHPOWERUPを参考にさせていただきました。
Cupyを用いたエルミート行列の固有値計算
NumpyのComplex128とComplex64で8575×8575の複素行列をGPUに計算させた結果を示します。
※CPUで計算した結果はどちらも2分ほどとなりました。
FP32性能が必要なComplex64の計算速度は6秒と爆速になっていますね!CPUと比べて20倍も速くなっています!!一方、FP64性能が必要なComplex128では21秒と少し遅くなっています。単にデータ量が増えた影響が大きいと思うのですが、どうなのでしょうか?
なににせよ、ノートPCでシミュレーションの計算などを行っている人はGPUを搭載しているPCに変えると幸せになれることがわかります。(デスクトップも同様)
理系大学生さんなど研究室で支給されているPCにGPUが搭載されていなければ、この事実を教授に話してGPU搭載モデルを買ってもらいましょう!!
ストレージ性能
今回レビューしたPCのストレージは256GB 2枚をRaid0で組んだ構成になっており、単体のSSDよりも速度性能が上がる半面、片方のSSDが故障してしまった場合はもう片方が正常でもデータを復元することができなくなってしまう。故障率が2倍というわけです。
恒例のcrystal disk markの測定結果です。
高性能なTLCのSSDと同じくらいの性能です。Raid0なのに、、、とSSDを調べたところ。WDのSN520というSSDでした。
スペック表を見ると256GBでRaid0を組んでいるので2倍くらいの性能が出ていますね。インターフェイスがNVMe 2レーンしか使っていないようなので速度としてはインターフェイスの上限くらい出ていて優秀だと思います。
ただ、なぜ2レーンなのか、ノートPCは2レーンが普通なのでしょうか?R3ではどうなんでしょう?
使用感
軽く使用してみた結果、なかなか快適でした。この記事もエイリアンウェアを使って書いています。
ノートPCはMacを持っているのですが、タイピングは断然エイリアンウェアが打ちやすいです。また、トラックパッドもサラサラで引っ掛かりがなく快適で、筐体全体のさわり心地も良く、デザインは最高の出来だと思います。
ただ問題なのが発熱です。重い処理を走らせると触れないほど熱くなります。タイピングしているときの手首の部分が熱くて夏はうっとうしいかも、、、(冬は快適かも?)膝の上でやるのは無理ですね、やけどしそうです。
また、ACアダプタもめちゃくちゃ大きいです。2時間くらいの使用ならばバッテリー駆動で足りますが、それ以上になるとACアダプタで電源供給しないと無理です。240WもあるACアダプタなので大きいのは仕方ないのですが、持ち運びという面ではなかなかに大変だと思います。
ですが、デスクトップPCを持ち運べると考えれば全然ありです。性能は申し分なく、気軽に使用できるので1台あってもいいかな?と欲しくなりました。
おわりに
今回のレビューはデルアンバサダープログラムのモニターに参加したものです。この場をかりて感謝申し上げます。
登録さえすればどなたでも参加できますので、気になる方はぜひ参加してみてください!