|
補足というか、修正
>ですが、実際のレンダリング処理能力としては、8バイト/FSBクロックに近い数値が得られました(実際にはzバッファのリードも必要であるにもかかわらず)。
>半透明処理を行っても、1〜2割程度の処理時間の増加に留まりました。
ウソ。
脳みそが死に掛かってます(汗)。
丁度、4バイト/FSBクロック程度の性能です(しかし、Z バッファのリードも含まれていますので、論理的限界を超えていることには間違いは無いか…(汗))。
サンプルに使用しているモデルの、延べ塗りつぶし面積からレンダリング性能を計測しています。
FSB 100MHz で、5000 万ピクセル/秒ですから、4 バイト(0.5 ピクセル)/FSB クロックですね。
>なお、PentiumIII においては、486 互換コードは SSE 専用コードより3倍少々遅ったです(PentiumII での速度に相当すると思われます)。
486 互換コードでは、基本的に、CPU クロックに依存する実際の処理時間+メモリ転送時間が、トータルのレンダリング時間となります。
SSE 専用コードでは、メモリ転送をバックグラウンドで行うことができるため、計算をメモリの転送とオーバーラップして行うことができるので、ほとんどメモリ転送速度に依存しますね。
>586 アーキテクチャではさらに 4 倍ほど遅そうです(と言うより、こちらは CPU 自体のクロックに強く影響されると思います)。
さらに 4 倍と言うか、同じ CPU クロックで SSE 専用命令より 4 倍以上って感じでしょうか?(わかりにくい説明だ)
普通、Pentium は、200MHz 以下なので、だいぶ遅いですね。(^^;
|
|