Ampereアーキテクチャの次世代NVIDIA GPUではないか?と噂されるGPUのGeekbenchスコアを以前紹介しましたが、それらの情報がアップデートされましたので改めて紹介します。
前回記事ではCUDAコア「7552」と「6912」の結果が示されていましたが、今回はCUDAコア「7936」のベンチマーク結果となります。
A trio of next-gen Nvidia graphics cards have been discovered in the Geekbench database.
CU124, CUDAコア7936
NVIDIAはPascal世代からTuring世代に移行する際、SM(CU)ごとのCUDAコア数を128から64に減らしました。
Turingアーキテクチャにおける重要な新要素として挙げられるのは,Volta世代のGV100に対し,FP32演算器とIN32演算器が若干パワーアップした点である。
具体的に言うと,Turing世代のGPUではFP32演算器とINT32演算器をほぼ並列動作させられるようになった。
「ほぼ」なのは,1クロックでFP32演算とINT32演算を同時発行することまではできないためで,たとえば偶数クロックでFP32演算器に命令を発行し,奇数クロックではINT32演算器に命令を発行するといったメカニズムになっている。従来,そうした命令の発行は行えなかったので,Turingアーキテクチャ世代で改善が入ったという理解でいい。
FP32演算とINT32演算が事実上のオーバーラップ実行ができるので,その分の性能向上を見込めるというわけだ。
4gamerのTuring世代GPU仕様説明にあるように、TuringはすべてのCUDAコアでFP32 ALUとINT32 ALUを組み合わせます。FP32 ALUのみ使用するPascal世代のCUDAコアとの仕様違いにより、半分に減っているように見えるわけです。
次世代GPUのAmpereでは「INT32 ALUに対するFP32 ALUの比率を上げる」といった効率を高めるようなアーキテクチャ仕様変更等の噂もありますが、未だAmpereがどのような構成なるかわからない状態です。
What Geekbench registers as a compute unit may be a device we’re unfamiliar with, and contain CUDA cores that perform better or worse than what we’re used to.
Nvidia GPUs with nearly 8,000 CUDA cores spotted in benchmark database (updated) - TechSpot
確定された構成ではないため既存のGeekbenchでは正確な認識ができていない可能性をTechSpotでは指摘しています。
Model | UNKNOWN GPU1 | UNKNOWN GPU2 | UNKNOWN GPU3 | Quadro RTX 8000 |
CUs/SMs | 124 | 118 | 108 | 72 |
CUDA Cores | 7936 | 7552 | 6912 | 4608 |
Clock Speed | 1110 MHz | 1110 MHz | 1010 MHz | 1770 MHz |
Memory | 32 GB | 24 GB | 48 GB | 48 GB |
OpenCLベンチスコア
各CUDAコア別で示されているOpenCLベンチスコアは以下の通りです。
- CUDAコア7936:222,377ポイント
- CUDAコア7552:184,096ポイント、または169,368ポイント
- CUDAコア6912:141,654ポイント
- RTX2080 Ti:約130,000ポイント
TechSpotでは比較のため、RTX2080 Tiの参考ポイント「約130,000」を取り上げています。また、メモリーがそれぞれ32 GB、24 GB、48 GB搭載されているのでワークステーション向けのQuadroセグメントのものではないか?と推測しています。
NVIDIAはQuadroとGeForceは同一GPUアーキテクチャを使うのが通例のため、リークされているGPUの規模より多少制限されたものがGeForceになるだろう、とも推測しています。
RTX3080Ti?のCUDAコアは……
RTX2080 Tiの後継モデルは、約7,000程度のCUDAコア数だろう、とTechSpotでは推測しています。
2020年3月9日追記
AmpereアーキテクチャGPUのGeekbenchスコアに関するまとめ記事はこちらです。
前回の記事はこちら。
Ampere関連情報