|
現在、GLS3 の 3D グラフィック処理のデバッグを行っているのですが、とりあえず動作するレベルまでたどり着いたため、レンダリング能力の性能を、実走での調査を簡単なものですが行ってみました。
結果、(SSE専用命令使用時)論理的メモリ転送速度の限界速度を超える結果が得られました。
RGB32+Zバッファ32ビットの、1ピクセルあたり8バイトの少なくともライトが必要なわけですが、これの論理的転送速度は、4バイト/FSBクロックです。
ですが、実際のレンダリング処理能力としては、8バイト/FSBクロックに近い数値が得られました(実際にはzバッファのリードも必要であるにもかかわらず)。
半透明処理を行っても、1〜2割程度の処理時間の増加に留まりました。
実験に使用したマシンの FSB は 100MHz ですのが、レンダリング能力として 5000万ピクセル/秒という結果が得られたと言うことです。
Pentium4 以降のより FSB の速いマシンでは、メモリ転送速度がそのままレンダリング能力として簡単に求められそうです。
因みに、ここで言うレンダリング能力というのは、(色・チャネル毎の透明度付のグーロー)シェーディング、Z バッファの計算、および比較、出力先への合成を含めた能力です。
因みに、テクスチャーマッピングを行うと、演算量が増える以上に、メモリ転送量が増大するため、当然、上記速度より遅くなると考えたほうがよいでしょう。
なお、PentiumIII においては、486 互換コードは SSE 専用コードより3倍少々遅かったです(PentiumII での速度に相当すると思われます)。
586 アーキテクチャではさらに 4 倍ほど遅そうです(と言うより、こちらは CPU 自体のクロックに強く影響されると思います)。
|
|