- 論壇徽章:
- 0
|
C語(yǔ)言高效編程的的四大絕招
C語(yǔ)言高效編程的的四大絕招(1)
引言:
編寫(xiě)高效簡(jiǎn)潔的C語(yǔ)言代碼,是許多軟件工程師追求的目標(biāo)。本文就工作中的一些體會(huì)和經(jīng)驗(yàn)做相關(guān)的闡述,不對(duì)的地方請(qǐng)各位指教。
第一招:以空間換時(shí)間
計(jì)算機(jī)程序中最大的矛盾是空間和時(shí)間的矛盾,那么,從這個(gè)角度出發(fā)逆向思維來(lái)考慮程序的效率問(wèn)題,我們就有了解決問(wèn)題的第1招--以空間換時(shí)間。
例如:字符串的賦值。
- 方法A:通常的辦法:
- #define LEN 32
- char string1 [LEN];
- memset (string1,0,LEN);
- strcpy (string1,"This is a example!!");
- 方法B:
- c*****t char string2[LEN] ="This is a example!";
- char * cp;
- cp = string2 ;
復(fù)制代碼 使用的時(shí)候可以直接用指針來(lái)操作。
從上面的例子可以看出,A和B的效率是不能比的。在同樣的存儲(chǔ)空間下,B直接使用指針就可以操作了,而A需要調(diào)用兩個(gè)字符函數(shù)才能完成。B的缺點(diǎn)在于靈活性沒(méi)有A好。在需要頻繁更改一個(gè)字符串內(nèi)容的時(shí)候,A具有更好的靈活性;如果采用方法B,則需要預(yù)存許多字符串,雖然占用了大量的內(nèi)存,但是獲得了程序執(zhí)行的高效率。
如果系統(tǒng)的實(shí)時(shí)性要求很高,內(nèi)存還有一些,那我推薦你使用該招數(shù)。該招數(shù)的變招--使用宏函數(shù)而不是函數(shù)。舉例如下:
- 方法C:
- #define bwMCDR2_ADDRESS 4
- #define bsMCDR2_ADDRESS 17
- int BIT_MASK(int __bf)
- {
- return ((1U << (bw ## __bf)) - 1) << (bs ## __bf);
- }
- void SET_BITS(int __dst, int __bf, int __val)
- {
- __dst = ((__dst) & ~(BIT_MASK(__bf))) \
- (((__val) << (bs ## __bf)) & (BIT_MASK(__bf))))
- }
-
- SET_BITS(MCDR2, MCDR2_ADDRESS, RegisterNumber);
- 方法D:
- #define bwMCDR2_ADDRESS 4
- #define bsMCDR2_ADDRESS 17
- #define bmMCDR2_ADDRESS BIT_MASK(MCDR2_ADDRESS)
- #define BIT_MASK(__bf) (((1U << (bw ## __bf)) - 1) << (bs ## __bf))
- #define SET_BITS(__dst, __bf, __val) \
- ((__dst) = ((__dst) & ~(BIT_MASK(__bf))) \
- (((__val) << (bs ## __bf)) & (BIT_MASK(__bf))))
-
復(fù)制代碼 SET_BITS(MCDR2, MCDR2_ADDRESS, RegisterNumber);
函數(shù)和宏函數(shù)的區(qū)別就在于,宏函數(shù)占用了大量的空間,而函數(shù)占用了時(shí)間。大家要知道的是,函數(shù)調(diào)用是要使用系統(tǒng)的棧來(lái)保存數(shù)據(jù)的,如果編譯器里有棧檢查選項(xiàng),一般在函數(shù)的頭會(huì)嵌入一些匯編語(yǔ)句對(duì)當(dāng)前棧進(jìn)行檢查;同時(shí),CPU也要在函數(shù)調(diào)用時(shí)保存和恢復(fù)當(dāng)前的現(xiàn)場(chǎng),進(jìn)行壓棧和彈棧操作,所以,函數(shù)調(diào)用需要一些CPU時(shí)間。而宏函數(shù)不存在這個(gè)問(wèn)題。宏函數(shù)僅僅作為預(yù)先寫(xiě)好的代碼嵌入到當(dāng)前程序,不會(huì)產(chǎn)生函數(shù)調(diào)用,所以僅僅是占用了空間,在頻繁調(diào)用同一個(gè)宏函數(shù)的時(shí)候,該現(xiàn)象尤其突出。
D方法是我看到的最好的置位操作函數(shù),是ARM公司源碼的一部分,在短短的三行內(nèi)實(shí)現(xiàn)了很多功能,幾乎涵蓋了所有的位操作功能。C方法是其變體,其中滋味還需大家仔細(xì)體會(huì)。
第二招:數(shù)學(xué)方法解決問(wèn)題
現(xiàn)在我們演繹高效C語(yǔ)言編寫(xiě)的第二招--采用數(shù)學(xué)方法來(lái)解決問(wèn)題。數(shù)學(xué)是計(jì)算機(jī)之母,沒(méi)有數(shù)學(xué)的依據(jù)和基礎(chǔ),就沒(méi)有計(jì)算機(jī)的發(fā)展,所以在編寫(xiě)程序的時(shí)候,采用一些數(shù)學(xué)方法會(huì)對(duì)程序的執(zhí)行效率有數(shù)量級(jí)的提高。舉例如下,求 1~100的和。
- 方法E
- int I , j;
- for (I = 1 ;I<=100; I ++)
- {
- j += I;
- }
- 方法F
- int I;
- I = (100 * (1+100)) / 2
復(fù)制代碼 這個(gè)例子是我印象最深的一個(gè)數(shù)學(xué)用例,是我的計(jì)算機(jī)啟蒙老師考我的。當(dāng)時(shí)我只有小學(xué)三年級(jí),可惜我當(dāng)時(shí)不知道用公式 N×(N+1)/ 2 來(lái)解決這個(gè)問(wèn)題。方法E循環(huán)了100次才解決問(wèn)題,也就是說(shuō)最少用了100個(gè)賦值,100個(gè)判斷,200個(gè)加法(I和j);而方法F僅僅用了1個(gè)加法,1次乘法,1次除法。效果自然不言而喻。所以,現(xiàn)在我在編程序的時(shí)候,更多的是動(dòng)腦筋找規(guī)律,最大限度地發(fā)揮數(shù)學(xué)的威力來(lái)提高程序運(yùn)行的效率。
第三招:使用位操作
實(shí)現(xiàn)高效的C語(yǔ)言編寫(xiě)的第三招――使用位操作。減少除法和取模的運(yùn)算。在計(jì)算機(jī)程序中,數(shù)據(jù)的位是可以操作的最小數(shù)據(jù)單位,理論上可以用"位運(yùn)算"來(lái)完成所有的運(yùn)算和操作。一般的位操作是用來(lái)控制硬件的,或者做數(shù)據(jù)變換使用,但是,靈活的位操作可以有效地提高程序運(yùn)行的效率。舉例如下:
- 方法G
- int I,J;
- I = 257 /8;
- J = 456 % 32;
- 方法H
- int I,J;
- I = 257 >>3;
- J = 456 - (456 >> 4 << 4);
復(fù)制代碼 在字面上好像H比G麻煩了好多,但是,仔細(xì)查看產(chǎn)生的匯編代碼就會(huì)明白,方法G調(diào)用了基本的取模函數(shù)和除法函數(shù),既有函數(shù)調(diào)用,還有很多匯編代碼和寄存器參與運(yùn)算;而方法H則僅僅是幾句相關(guān)的匯編,代碼更簡(jiǎn)潔,效率更高。當(dāng)然,由于編譯器的不同,可能效率的差距不大,但是,以我目前遇到的MS C ,ARM C 來(lái)看,效率的差距還是不小。相關(guān)匯編代碼就不在這里列舉了。
運(yùn)用這招需要注意的是,因?yàn)镃PU的不同而產(chǎn)生的問(wèn)題。比如說(shuō),訡上用這招編寫(xiě)的程序,并訡上調(diào)試通過(guò),在移植到一個(gè)16位機(jī)平臺(tái)上的時(shí)候,可能會(huì)產(chǎn)生代碼隱患。所以只有在一定技術(shù)進(jìn)階的基礎(chǔ)下才可以使用這招。
第四招:匯編嵌入
高效C語(yǔ)言編程的必殺技,第四招――嵌入?yún)R編。"在熟悉匯編語(yǔ)言的人眼里,C語(yǔ)言編寫(xiě)的程序都是垃圾"。這種說(shuō)法雖然偏激了一些,但是卻有它的道理。匯編語(yǔ)言是效率最高的計(jì)算機(jī)語(yǔ)言,但是,不可能靠著它來(lái)寫(xiě)一個(gè)操作系統(tǒng)吧?所以,為了獲得程序的高效率,我們只好采用變通的方法 --嵌入?yún)R編,混合編程。舉例如下,將數(shù)組一賦值給數(shù)組二,要求每一字節(jié)都相符。- char string1[1024],string2[1024];
- 方法I
- int I;
- for (I =0 ;I<1024;I++)
- *(string2 + I) = *(string1 + I)
- 方法J
- #ifdef _PC_
- int I;
- for (I =0 ;I<1024;I++)
- *(string2 + I) = *(string1 + I);
- #else
- #ifdef _ARM_
- __asm
- {
- MOV R0,string1
- MOV R1,string2
- MOV R2,#0
- loop:
- LDMIA R0!, [R3-R11]
- STMIA R1!, [R3-R11]
- ADD R2,R2,#8
- CMP R2, #400
- BNE loop
- }
復(fù)制代碼 #endif
方法I是最常見(jiàn)的方法,使用了1024次循環(huán);方法J則根據(jù)平臺(tái)不同做了區(qū)分,在ARM平臺(tái)下,用嵌入?yún)R編僅用128次循環(huán)就完成了同樣的操作。這里有朋友會(huì)說(shuō),為什么不用標(biāo)準(zhǔn)的內(nèi)存拷貝函數(shù)呢?這是因?yàn)樵谠磾?shù)據(jù)里可能含有數(shù)據(jù)為0的字節(jié),這樣的話,標(biāo)準(zhǔn)庫(kù)函數(shù)會(huì)提前結(jié)束而不會(huì)完成我們要求的操作。這個(gè)例程典型應(yīng)用于LCD數(shù)據(jù)的拷貝過(guò)程。根據(jù)不同的CPU,熟練使用相應(yīng)的嵌入?yún)R編,可以大大提高程序執(zhí)行的效率。
雖然是必殺技,但是如果輕易使用會(huì)付出慘重的代價(jià)。這是因?yàn)椋褂昧饲度雲(yún)R編,便限制了程序的可移植性,使程序在不同平臺(tái)移植的過(guò)程中,臥虎藏龍,險(xiǎn)象環(huán)生!同時(shí)該招數(shù)也與現(xiàn)代軟件工程的思想相違背,只有在迫不得已的情況下才可以采用。切記,切記。
使用C語(yǔ)言進(jìn)行高效率編程,我的體會(huì)僅此而已。在此以本文拋磚引玉,還請(qǐng)各位高手共同切磋。希望各位能給出更好的方法,大家一起提高我們的編程技巧。 |
|