帯域幅256ビット|AMD好きの自作PC速報

AMD好きによる自作PCパーツ, 自作PC向けのテック系記事ブログ。主に海外サイトのリーク, ベンチ記事を翻訳して解説します。CPUやマザボ, グラボの最新情報が強いはず。AMD情報多めです

Ampere GPU?のGeekbenchスコア, アップデート版リーク情報 /TechSpot【NVIDIA】

f:id:tatatatatax:20200305024211p:plain

2020年3月9日追記あり

Ampereアーキテクチャの次世代NVIDIA GPUではないか?と噂されるGPUのGeekbenchスコアを以前紹介しましたが、それらの情報がアップデートされましたので改めて紹介します。

前回記事ではCUDAコア「7552」と「6912」の結果が示されていましたが、今回はCUDAコア「7936」のベンチマーク結果となります。

A trio of next-gen Nvidia graphics cards have been discovered in the Geekbench database.

www.techspot.com

CU124, CUDAコア7936

NVIDIAPascal世代からTuring世代に移行する際、SM(CU)ごとのCUDAコア数を128から64に減らしました。

Turingアーキテクチャにおける重要な新要素として挙げられるのは,Volta世代のGV100に対し,FP32演算器とIN32演算器が若干パワーアップした点である。

 具体的に言うと,Turing世代のGPUではFP32演算器とINT32演算器をほぼ並列動作させられるようになった。
 「ほぼ」なのは,1クロックでFP32演算とINT32演算を同時発行することまではできないためで,たとえば偶数クロックでFP32演算器に命令を発行し,奇数クロックではINT32演算器に命令を発行するといったメカニズムになっている。従来,そうした命令の発行は行えなかったので,Turingアーキテクチャ世代で改善が入ったという理解でいい。
 FP32演算とINT32演算が事実上のオーバーラップ実行ができるので,その分の性能向上を見込めるというわけだ。

www.4gamer.net

4gamerのTuring世代GPU仕様説明にあるように、TuringはすべてのCUDAコアでFP32 ALUとINT32 ALUを組み合わせます。FP32 ALUのみ使用するPascal世代のCUDAコアとの仕様違いにより、半分に減っているように見えるわけです。

次世代GPUのAmpereでは「INT32 ALUに対するFP32 ALUの比率を上げる」といった効率を高めるようなアーキテクチャ仕様変更等の噂もありますが、未だAmpereがどのような構成なるかわからない状態です。

What Geekbench registers as a compute unit may be a device we’re unfamiliar with, and contain CUDA cores that perform better or worse than what we’re used to.

Nvidia GPUs with nearly 8,000 CUDA cores spotted in benchmark database (updated) - TechSpot

確定された構成ではないため既存のGeekbenchでは正確な認識ができていない可能性をTechSpotでは指摘しています。

 

Model UNKNOWN GPU1 UNKNOWN GPU2 UNKNOWN GPU3 Quadro RTX 8000
CUs/SMs 124 118 108 72
CUDA Cores 7936 7552 6912 4608
Clock Speed 1110 MHz 1110 MHz 1010 MHz 1770 MHz
Memory 32 GB 24 GB 48 GB 48 GB

OpenCLベンチスコア

各CUDAコア別で示されているOpenCLベンチスコアは以下の通りです。

  • CUDAコア7936:222,377ポイント
  • CUDAコア7552:184,096ポイント、または169,368ポイント
  • CUDAコア6912:141,654ポイント
  • RTX2080 Ti:約130,000ポイント

TechSpotでは比較のため、RTX2080 Tiの参考ポイント「約130,000」を取り上げています。また、メモリーがそれぞれ32 GB、24 GB、48 GB搭載されているのでワークステーション向けのQuadroセグメントのものではないか?と推測しています。

NVIDIAQuadroGeForceは同一GPUアーキテクチャを使うのが通例のため、リークされているGPUの規模より多少制限されたものがGeForceになるだろう、とも推測しています。

RTX3080Ti?のCUDAコアは……

RTX2080 Tiの後継モデルは、約7,000程度のCUDAコア数だろう、とTechSpotでは推測しています。

2020年3月9日追記

AmpereアーキテクチャGPUのGeekbenchスコアに関するまとめ記事はこちらです。

taxtax.hatenablog.jp

前回の記事はこちら。

taxtax.hatenablog.jp

カテゴリー

  

Ampere関連情報

ガイド記事

Copyright © 2020 帯域幅256ビット|AMD好きの自作PC速報 All rights reserved.