技術系備忘録/C++/最適化小手先テクニック/”エイリアスを使わないと仮定する”の意味のソース

印刷

差分^[1] を表示
技術系備忘録/C++/最適化小手先テクニック/”エイリアスを使わないと仮定する”の意味^[2] へ行く。

VC++には（それ以外のコンパイラにもきっと）、"エイリアスを使わないと仮定する"(/Ow,/Oa)という最適化オプションが用意されています。

このオプションは、"サイズ優先"とか"実行速度優先"という最適化にしても有効にはならず、明示的に有効にしないといけないものなので、恩恵に預かっているケースは少ないと思います。

まずリスト１に例を挙げます。上段がC++のソースコード。下段がコンパイラが出力したアセンブラコードです。 

-List1
--ソース
#prettify{{
void MemClear(int *pSize,char *pBuffer)
{
	for(int i=0; i<*pSize; i++ ){
		pBuffer[i] = 0;
	}
}
}}
--出力
#prettify{{
void MemClear(int *pSize,char *pBuffer)
{
	mov  ecx, pSize
	xor  eax, eax
	cmp  DWORD PTR [ecx], eax
	jle  SHORT LABEL2
LABEL1		// ループ戻り先(このラベルは次のmovの下でいい気がする…)
	mov  edx,pBuffer			// クリアするバッファを取得
	and  BYTE PTR [eax+edx],0	// １バイトクリア
	inc  eax					// カウンタをインクリメント
	cmp  eax, DWORD PTR [ecx]	// クリアサイズとカウンタを比較して
	jl   SHORT LABEL1			// まだ途中ならLABEL1に戻って繰り返す
LABEL2
	ret
}
}}

このコードは一見してわかるように、指定された領域のメモリをクリアする関数です。
出力されたコードをみると、コンパイラはとても素直に最適化されていないコードを吐き出していることがわかります。

今回の最適化オプションは、このような繰り返し処理を効率良いコードにする為の物です。リスト２。 

-List2
--ソース
#prettify{{
// "エイリアスを使わないと仮定する"を有効
#pragma optimize ( "a", on )

void MemClear(int *pSize,char *pBuffer)
{
	for(int i=0; i<*pSize; i++ ){
		pBuffer[i] = 0;
	}
}
#pragma optimize ( "", on ) // 元に戻す
}}
--出力
#prettify{{
void MemClear(int *pSize,char *pBuffer)
{
	mov	 eax, pSize
	mov	 ecx, DWORD PTR [eax]
	test	ecx, ecx
	jle	 SHORT LABEL1
	mov	 edx, ecx
	push	edi
	mov	 edi, pBuffer
	xor	 eax, eax
	shr	 ecx, 2		// クリアサイズ（の1/4。32BITで処理する為）
	rep stosd		// 一気にクリア
	mov	 ecx, edx
	and	 ecx, 3		// クリアサイズ（の４で割った余り）
	rep stosb		// 一気にクリア
	pop	 edi
LABEL1
	ret
}
}}

リスト１と比べると、繰り返し処理(条件分岐)も無くなっており、見るからに早そうです。

本ネタで重要だと思うのは以下になります。

なぜ、リスト１はリスト２のように最適化されないかというと、
コンパイラは、繰り返しの条件であるクリアサイズ(*pSize)が、pBufferの示すバッファに値を書き込むことで、書き換えられてしまうかもしれない。
と考えるからです。

リスト２は、"エイリアスを使わないと仮定する"としているので、コンパイラは、pSizeとpBufferの領域がダブることはない。という前提があるので最適化されたコードを出力出来ます。

ここまでの説明だと、"エイリアスを使わないと仮定する"を常に有効にすることで、何も考えずに今以上に最適化されるのではないか。と思ってしまうかもしれませんが、それは危険です。
むやみやたらに最適化させると、ソースコード的には正しいけれど、その通りに動いてくれないコードが出力される可能性があります。


僕の個人的意見では、"エイリアスを使わないと仮定する"は無効にしたまま、ソースコード上で最適化される書き方をするという手段が吉だと思います。
例えばリスト３のようにします。 

-List3
--ソース
#prettify{{
void MemClear(int *pSize,char *pBuffer)
{
	int nSize = *pSize;		// サイズをローカル変数にコピー
	for(int i=0; i<nSize; i++ ){
		pBuffer[i] = 0;
	}
}
}}
--出力
#prettify{{
（リスト２と同じコードなので割愛）
}}

最初にクリアサイズ(*pSize)をローカル変数にコピーして、そのローカル変数がforを抜ける条件であると書くことで、
pBufferへの書き込みによってループ条件が変わることはないので、コンパイラは最適化されたコードを出力できます。


以上のことから、自分の個人的意見を言わせてもらうと、
"エイリアスを使わないと仮定する"最適化オプションは使わないほうが吉。
使うことで最適化されるケースがあるのであれば、コードの書き方を工夫することで最適化するのが吉。

"エイリアスを使わないと仮定する"最適化オプションの利用法としては、
無効の場合と有効の場合とで、出力されるアセンブラを比較して、
もし有効にすることで最適化されるようなケースがあったなら、そこはまだコードの書き方を工夫できる。
という判断材料として"エイリアスを使わないと仮定する"を使用するのが吉と思われます。

/*
最近のコンパイラは優秀だと改めて思いました。
for文でメモリクリアって、昔は rep stosd とか使ってくれなかった気がします。
今回の例であるメモリクリアであれば memset とか使うのが常識なのですが、memsetだとBYTE値でしか埋めれないので、16Bit値や32Bit値で埋めたいときは for ループを使うしかないのですが、その場合でも rep stosd とか使ってくれるようになってました。

なお、かといって memset を使わずに for でメモリクリアを実装しなきゃならないかというと、一概にはそう言えません。
VC++（他のコンパイラは良く知りません）には、組み込み関数という仕組みがあって、memset は組み込み関数として用意されていますので、memset を使うことによるパフォーマンスの低下はまず無いでしょう。（組み込み関数を有効にする必要があります）
&#x2a;/

技術系備忘録/C++/最適化小手先テクニック/”エイリアスを使わないと仮定する”の意味のバックアップソース(No. All)
- 現: 2016-04-01 (金) 13:26:06 takatsuka^[3]

Links list

(This host) = https://thinkridge.com

^{(This host)}/modules/xpwiki/index.php?cmd=backup&pgid=56&age=Cur&action=diff
^{(This host)}/modules/xpwiki/?%E6%8A%80%E8%A1%93%E7%B3%BB%E5%82%99%E5%BF%98%E9%8C%B2%2FC%2B%2B%2F%E6%9C%80%E9%81%A9%E5%8C%96%E5%B0%8F%E6%89%8B%E5%85%88%E3%83%86%E3%82%AF%E3%83%8B%E3%83%83%E3%82%AF%2F%E2%80%9D%E3%82%A8%E3%82%A4%E3%83%AA%E3%82%A2%E3%82%B9%E3%82%92%E4%BD%BF%E3%82%8F%E3%81%AA%E3%81%84%E3%81%A8%E4%BB%AE%E5%AE%9A%E3%81%99%E3%82%8B%E2%80%9D%E3%81%AE%E6%84%8F%E5%91%B3
^{(This host)}/userinfo.php?uid=1

技術系備忘録​/C++​/最適化小手先テクニック​/”エイリアスを使わないと仮定する”の意味 のソース :: シンクリッジ

Links list

技術系備忘録/C++/最適化小手先テクニック/”エイリアスを使わないと仮定する”の意味のソース :: シンクリッジ