考察 ペナルティの大きさ JGNWG の見積もり:「Golliver の手法によるペナルティは 2〜4倍」 今回の実験では 1.43 〜 3.36 倍 (fscale使用,事前ロード無)。 ただし、今回観測されたのは scaling のペナルティのみ。 非strictfpでも store-reload が行われているので。(前述) 事前ロードの効果 (10 ** 7 回あたり) fscale使用: 約 80 msec 乗算使用: 約 800 〜 1300 msec 事前ロードの方法 現実装は、scaleをメソッド先頭でpush、末尾でpopしている。 strictfpメソッドがstrictfpメソッドを呼んでいった場合、 FPUレジスタスタック (深さ 8) が溢れてしまう。 現実装で妥当なのは『fscale命令でscaling & 事前ロード無し』か?