/* Google Search Console */

ALIENWARE m15 R2 ~デルアンバサダープログラム~

今回はデルアンバサダープログラムでALIENWAREをレンタルすることができたので、簡単なレビューをします。

と言っても、ゲーミング性についてはいろいろな方が記事にしているので、大学生の研究などでどの程度使えるかをCUDAのベンチマークを動かしてみようと思います。

ALIENWARE m15 R2 スペック

最新機種ではR3が出ているので一つ前の世代となる。

CPUIntel Core i7-9750H 2.60GHz (TB 4.50GHz)
GPUNVIDIA GeForce RTX 2070 with Max-Q Design
メモリDDR4 2666 16GB
ストレージSN520 NVMe 512GB (256GB ×2 Raid0)

ノートPCとしてはスペックは申し分ない、ミドルレンジのデスクトップPCよりも高性能な可能性もある。

気になる点はRaid0を使用している点だが、これはカスタマイズで変更できるので問題ないと思われる。
とことんSSDのスピードにこだわりたいならRaid0を選択すれば幸せになれます。あとでcrystal disk mark回した結果を載せておきます。

CPU性能

CINEBENCH R20を回した結果、2152でした。デスクトップPCにも引けを取らないような数値ですが、温度がものすごく高いです。

一時、100℃になるなど爆熱でした。追加の冷却ファンやスタンドがあると多少は緩和されるので、フルでCPUを使うときは注意が必要です。

※100℃を超えるとサーマルスロットリングが働きコアクロックが下がっていきます。CINEBENCHを連続でまわすとクロックが下がりスコアが1800台にまで下がることもありました。

GPU性能

今回はここが本番。CUDAサンプルを用いてGPUの性能評価をしていきます。ゲーミング性能というよりかは計算能力の評価なので、興味がない人は飛ばしてください。

また、後日CUDAサンプルの使い方を備忘録として投稿する予定ですので、興味がある方はそちらをお待ちください。

nbody

他体系のシミュレーションを行うサンプルプログラムです。FP32とFP64の性能評価ができます。
今回は2048000個の粒子に対してのシミュレーションを行っています。

nbody FP32
nbody FP64性能

FP32性能で3.54TFlops, FP64性能で121.1GFlopsとなりました。カタログスペックはFP32性能で5.46TFlops, FP64性能で170.6GFlopsなのでそこそこいい値が出ているのではないでしょうか?

GeForceにはFP64ネイティブのコアが搭載されていないのでFP64性能が低いのは当然の結果ですのでご心配なく、GeForceはゲーミング向けのGPUなので単精度の計算に特化したGPU設計になっており、倍精度計算が必要な方はQuadroをお勧めします。

eigenvalues

次は2重対角行列の固有値を計算するサンプルプログラムです。
65536×65536の行列の固有値を計算するのにかかる時間を測定しました。

結果は45秒ほどでした。このプログラムについてあまり調べていないのでコマンド実行から終了までをストップウォッチで測った時間です。参考までに。

bandwidthTest

GPUとDRAM, GPUとVRAMのメモリ帯域を測定するプログラムです。

VRAMの帯域は211.7GB/sと高速ですが、ホスト側のDRAMは3.1GB/sとPCIeの帯域とCPUがボトルネックになっていると思われます。
VRAMの帯域のカタログ値は384.0GB/sですので少し遅い気もします。

この結果からUnified Memoryを用いると計算スピードが大きく落ちてしまう理由がわかりますね。

MixBench

CUDAサンプルプログラムとは違うベンチマークですが、一応載せておきます。このベンチでは半精度性能(FP16)と整数演算性能も測定できますので、機械学習の性能評価として指標になるかもしれません。

ピーク性能カタログ値
FP16(半精度)12.64 TFlops10.92 TFlops
FP32(単精度)6.367 TFlops5.469 TFlops
FP64(倍精度)172.4 GFlops170.6 GFlops

いずれもピーク性能ではカタログ値を上回っていることがわかります。カタログ値などのスペックはTECHPOWERUPを参考にさせていただきました。

Cupyを用いたエルミート行列の固有値計算

NumpyのComplex128とComplex64で8575×8575の複素行列をGPUに計算させた結果を示します。

※CPUで計算した結果はどちらも2分ほどとなりました。

complex64 (実部FP32, 虚部FP32)
complex128 (実部FP64, 虚部FP64)

FP32性能が必要なComplex64の計算速度は6秒と爆速になっていますね!CPUと比べて20倍も速くなっています!!一方、FP64性能が必要なComplex128では21秒と少し遅くなっています。単にデータ量が増えた影響が大きいと思うのですが、どうなのでしょうか?

なににせよ、ノートPCでシミュレーションの計算などを行っている人はGPUを搭載しているPCに変えると幸せになれることがわかります。(デスクトップも同様)

理系大学生さんなど研究室で支給されているPCにGPUが搭載されていなければ、この事実を教授に話してGPU搭載モデルを買ってもらいましょう!!

ストレージ性能

今回レビューしたPCのストレージは256GB 2枚をRaid0で組んだ構成になっており、単体のSSDよりも速度性能が上がる半面、片方のSSDが故障してしまった場合はもう片方が正常でもデータを復元することができなくなってしまう。故障率が2倍というわけです。

恒例のcrystal disk markの測定結果です。

高性能なTLCのSSDと同じくらいの性能です。Raid0なのに、、、とSSDを調べたところ。WDのSN520というSSDでした。

スペック表を見ると256GBでRaid0を組んでいるので2倍くらいの性能が出ていますね。インターフェイスがNVMe 2レーンしか使っていないようなので速度としてはインターフェイスの上限くらい出ていて優秀だと思います。

ただ、なぜ2レーンなのか、ノートPCは2レーンが普通なのでしょうか?R3ではどうなんでしょう?

使用感

軽く使用してみた結果、なかなか快適でした。この記事もエイリアンウェアを使って書いています。

ノートPCはMacを持っているのですが、タイピングは断然エイリアンウェアが打ちやすいです。また、トラックパッドもサラサラで引っ掛かりがなく快適で、筐体全体のさわり心地も良く、デザインは最高の出来だと思います。

ただ問題なのが発熱です。重い処理を走らせると触れないほど熱くなります。タイピングしているときの手首の部分が熱くて夏はうっとうしいかも、、、(冬は快適かも?)膝の上でやるのは無理ですね、やけどしそうです。

また、ACアダプタもめちゃくちゃ大きいです。2時間くらいの使用ならばバッテリー駆動で足りますが、それ以上になるとACアダプタで電源供給しないと無理です。240WもあるACアダプタなので大きいのは仕方ないのですが、持ち運びという面ではなかなかに大変だと思います。

ですが、デスクトップPCを持ち運べると考えれば全然ありです。性能は申し分なく、気軽に使用できるので1台あってもいいかな?と欲しくなりました。

おわりに

今回のレビューはデルアンバサダープログラムのモニターに参加したものです。この場をかりて感謝申し上げます。

登録さえすればどなたでも参加できますので、気になる方はぜひ参加してみてください!