少妇无码一区二区三区,亚洲av网站.,亚洲av无码国产精品色

論壇徽章:: 0

電梯直達(dá)

1樓 [收藏(0)] [報(bào)告]

發(fā)表于 2009-05-19 12:10 |只看該作者 |倒序?yàn)g覽

小弟剛剛鳥槍換小炮。得到一臺(tái)Intel(R) Core(TM)2 CPU 6400 @ 2.13GHz + PCI-E 4X 2.5GB的機(jī)器，以前看大家討論多核，IRQ中斷親和的問題，心里頭就發(fā)癢，現(xiàn)在終于有機(jī)會(huì)測(cè)試了�。�！反復(fù)做了些測(cè)試，有一些值得思考的地方，將整個(gè)測(cè)試過程發(fā)上來（不包括性能改進(jìn)方面的內(nèi)容），與大家一起討論（有點(diǎn)長(zhǎng)，適合有耐心的TX看）：

一些個(gè)人結(jié)論性的東西可能有誤，希望大家指點(diǎn)�。�！

一、測(cè)試環(huán)境：

發(fā)包機(jī)(PC_A) -------- (eth1)Linux(eth2)---------收包機(jī)(PC_B)

內(nèi)核版本：2.6.12
網(wǎng)卡驅(qū)動(dòng)：Intel e1000e[Intel現(xiàn)在把pci-e的千兆網(wǎng)卡單獨(dú)拿出來了。整了個(gè)e1000e]，ＮＡＰＩ模式;
發(fā)包工具：bwtest
Linux配置：網(wǎng)橋 + Netfilter；
數(shù)據(jù)包是單向發(fā)送64bytes小包。即PC_B不發(fā)包。

二、不開啟IRQ中斷均衡；
內(nèi)核編譯中，不開啟此選項(xiàng)。

Cpu(s): 0.0% user, 0.5% system, 0.0% nice, 50.3% idle
Cpu0 : 1.0% user, 0.0% system, 0.0% nice, 1.0% idle
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 100.0% idle
Cpu(s): 0.0% user, 0.0% system, 0.0% nice, 50.8% idle
Cpu0 : 0.0% user, 0.0% system, 0.0% nice, 1.0% idle
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 100.0% idle
Cpu(s): 0.5% user, 0.0% system, 0.0% nice, 50.8% idle
Cpu0 : 0.0% user, 1.0% system, 0.0% nice, 2.0% idle
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 100.0% idle

復(fù)制代碼

此時(shí)數(shù)據(jù)轉(zhuǎn)發(fā)約166Mb(這是我發(fā)包機(jī)的上限了……)

從三次采樣結(jié)果來看，所有負(fù)載都被放在了CPU0上面，CPU1基本上是在睡大覺。
同時(shí)，查看/proc/interrupt，也可以看到，CPU1上面沒有中斷。
結(jié)論：多核下不啟用IRQ中斷均衡功能是一種資源浪費(fèi)。

三、開啟IRQ中斷均衡：
在內(nèi)核編譯中，啟用該選項(xiàng)。

[root@SkyNet ~]# cat /proc/interrupts
CPU0 CPU1
74: 154789 1 PCI-MSI eth1
82: 16393 2102221 PCI-MSI eth2

復(fù)制代碼

并沒有去手動(dòng)修改smp_affinity文件。在開機(jī)的時(shí)候，短暫的把eth2的中斷也放到了CPU0后，立馬自己學(xué)習(xí)，轉(zhuǎn)到cpu1上面去了。實(shí)現(xiàn)了兩張網(wǎng)卡，兩個(gè)CPU，一人一個(gè)。哥倆好！��！
但是，這并不能讓我高興，因?yàn)閱栴}才剛剛開始：

Cpu(s): 0.0% user, 0.0% system, 0.0% nice, 38.5% idle
Cpu0 : 1.0% user, 1.0% system, 0.0% nice, 2.0% idle
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 73.7% idle
Cpu(s): 0.0% user, 0.0% system, 0.0% nice, 37.2% idle
Cpu0 : 0.0% user, 0.0% system, 0.0% nice, 2.1% idle
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 72.4% idle
Cpu(s): 0.5% user, 0.5% system, 0.0% nice, 38.2% idle
Cpu0 : 0.0% user, 0.0% system, 0.0% nice, 3.0% idle
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 73.7% idle

復(fù)制代碼

從三次采樣結(jié)果來看，
１、ＣＰＵ總負(fù)載不降反升了，從50%左右，上升到63%左右了。[從ilde的百分比可以看出來]
２、CPU0的下來了（因?yàn)閑th2的中斷不需要它去處理了）；
３、CPU1的負(fù)載從0%上升到了27%左右。

為什么會(huì)有這種情況發(fā)生呢？此時(shí)猜測(cè)唯一可以解釋的就是：

“CPU1此時(shí)只分擔(dān)到了發(fā)送數(shù)據(jù)幀的中斷工作，網(wǎng)絡(luò)內(nèi)核棧的工作，從net_rx_action開始，包括網(wǎng)橋、Netfilter、隊(duì)列調(diào)度等等工作，全部集中到了CPU0上，網(wǎng)絡(luò)棧的工作，并沒有實(shí)現(xiàn)負(fù)載均衡，換句話說，net_rx_action這個(gè)軟中斷，只在一個(gè)ＣＰＵ上運(yùn)行了，并沒有實(shí)現(xiàn)多個(gè)ＣＰＵ的同時(shí)運(yùn)行和調(diào)度(通過后面的實(shí)驗(yàn)和ShadowStar同學(xué) 的指點(diǎn)，最后這一句的結(jié)論是錯(cuò)的，我最后會(huì)說明)”

復(fù)制代碼

為了進(jìn)一步證明我的這個(gè)結(jié)論，我在Netfilter的raw表的PREROUTING中，丟棄所有數(shù)據(jù)：

Cpu(s): 0.0% user, 0.0% system, 0.0% nice, 78.6% idle, 0.0% x, 2.1% y
Cpu0 : 0.0% user, 0.0% system, 0.0% nice, 57.0% idle, 0.0% x, 5.4% y
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 100.0% idle, 0.0% x, 0.0% y
Cpu(s): 0.0% user, 0.0% system, 0.0% nice, 78.1% idle, 0.0% x, 2.7% y
Cpu0 : 0.0% user, 0.0% system, 0.0% nice, 55.3% idle, 0.0% x, 5.3% y
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 100.0% idle, 0.0% x, 0.0% y
Cpu(s): 0.0% user, 0.0% system, 0.0% nice, 80.1% idle, 0.0% x, 2.2% y
Cpu0 : 0.0% user, 0.0% system, 0.0% nice, 60.6% idle, 0.0% x, 4.3% y
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 100.0% idle, 0.0% x, 0.0% y

復(fù)制代碼

當(dāng)數(shù)據(jù)被丟棄時(shí)，從三次采樣的結(jié)果來看，
１、ＣＰＵ１因?yàn)椴辉侔l(fā)送數(shù)據(jù)，又沒有事情干了。它的空閑是100%，所以，像網(wǎng)橋處理，軟中斷，肯定也沒有它的份。再一次印證了剛才的想法（盡管它是錯(cuò)的）；
２、ＣＰＵ０負(fù)載也大幅的下降，這是因?yàn)�。它不再處理連接跟蹤那些東東了——再一次證明，Netfilter是一個(gè)很吃ＣＰＵ的東東。

那有沒有可能：讓一個(gè)ＣＰＵ來處理內(nèi)核網(wǎng)格棧的功能，一個(gè)ＣＰＵ來專門處理網(wǎng)卡中斷呢？？我突發(fā)奇想了�。�！
即然現(xiàn)在net_rx_action軟中斷是運(yùn)行在CPU0上的，那我調(diào)整中斷親和，把CPU0上的中斷負(fù)載調(diào)整到CPU1上去，不就完美了么？？呵呵：

Cpu(s): 0.0% user, 0.0% system, 0.0% nice, 59.0% idle, 0.0% x, 0.5% y
Cpu0 : 0.0% user, 1.1% system, 0.0% nice, 98.9% idle, 0.0% x, 0.0% y
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 18.1% idle, 0.0% x, 1.1% y
Cpu(s): 0.0% user, 0.0% system, 0.0% nice, 59.6% idle, 0.0% x, 0.5% y
Cpu0 : 0.0% user, 0.0% system, 0.0% nice, 100.0% idle, 0.0% x, 0.0% y
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 18.1% idle, 0.0% x, 1.1% y
Cpu(s): 0.0% user, 0.0% system, 0.0% nice, 59.6% idle, 0.0% x, 0.5% y
Cpu0 : 0.0% user, 0.0% system, 0.0% nice, 100.0% idle, 0.0% x, 0.0% y
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 20.2% idle, 0.0% x, 1.1% y

復(fù)制代碼

實(shí)驗(yàn)結(jié)果讓我失望：
1、總CPU負(fù)載的確是下降了；
2、此時(shí)Cpu0變?yōu)榭臻e又變?yōu)?00%——軟中斷函數(shù)并沒有像預(yù)期的那樣，跑到Cpu0上面去；而是所有的東東又跑到Cpu1了，此時(shí)CPU1負(fù)載明顯上升很多，net_rx_action好像是隨著中斷落到哪個(gè)ＣＰＵ上，它就跑到哪個(gè)ＣＰＵ上面去；
3、一個(gè)有趣的現(xiàn)像是：所有任務(wù)由Cpu0處理，總負(fù)載是50%，所有任務(wù)由Cpu1處理，總負(fù)載下降很明顯，這個(gè)原因沒有仔細(xì)去考究了，難道是第二個(gè)核性能比第一個(gè)好？？？

因?yàn)橥ㄟ^上述實(shí)驗(yàn)，得到了“net_rx_action好像是隨著中斷落到哪個(gè)ＣＰＵ上，它就跑到哪個(gè)ＣＰＵ上面去”的結(jié)論，那么一開始的“net_rx_action這個(gè)軟中斷，只在一個(gè)ＣＰＵ上運(yùn)行了，并沒有實(shí)現(xiàn)多個(gè)ＣＰＵ的同時(shí)運(yùn)行和調(diào)度”的結(jié)論就被推翻了�。∧菫槭裁磿�(huì)造成這種情況呢？？我陷入了沉思當(dāng)中。

四、為什么會(huì)是這樣呢？
通過查看代碼，找到了原因（代碼有刪減）：

static void net_rx_action(struct softirq_action *h)
{
struct softnet_data *queue = &__get_cpu_var(softnet_data);
while (!list_empty(&queue->poll_list)) {
struct net_device *dev;
dev = list_entry(queue->poll_list.next,
struct net_device, poll_list);
netpoll_poll_lock(dev);
if (dev->quota <= 0 || dev->poll(dev, &budget)) {
list_del(&dev->poll_list);
list_add_tail(&dev->poll_list, &queue->poll_list);
if (dev->quota < 0)
dev->quota += dev->weight;
else
dev->quota = dev->weight;
} else {
}
}
out:
local_irq_enable();
return;
softnet_break:
__get_cpu_var(netdev_rx_stat).time_squeeze++;
__raise_softirq_irqoff(NET_RX_SOFTIRQ);
goto out;
}

復(fù)制代碼

所有問題有核心在于，softnet_data是一個(gè)pre_cpu變量，net_rx_action被某個(gè)ＣＰＵ?qǐng)?zhí)行時(shí)，它只會(huì)遍歷屬于自己的網(wǎng)絡(luò)設(shè)備隊(duì)列。如上面的實(shí)驗(yàn)中，當(dāng)eth1只會(huì)出現(xiàn)在cpu０的網(wǎng)絡(luò)設(shè)備隊(duì)列，eth2只會(huì)出現(xiàn)在CPU1的隊(duì)列中。
遺憾的是，我的測(cè)試中，數(shù)據(jù)發(fā)送是單向的，所以，eth2沒有接收數(shù)據(jù)。所以，所有的網(wǎng)絡(luò)棧的工作，就理所當(dāng)然地落到了CPU0上面來了。
那為什么，“當(dāng)eth1只會(huì)出現(xiàn)在cpu０的網(wǎng)絡(luò)設(shè)備隊(duì)列，eth2只會(huì)出現(xiàn)在CPU1的隊(duì)列中”，也就是隨著硬件中斷落到哪個(gè)CPU上，它就會(huì)在哪個(gè)CPU響應(yīng)呢？？？這需要看poll_list這個(gè)網(wǎng)絡(luò)設(shè)備隊(duì)列的添加的實(shí)現(xiàn)過程了。
這個(gè)過程，都是在網(wǎng)卡中斷函數(shù)中，它會(huì)調(diào)用：
netif_rx_schedule

static inline void netif_rx_schedule(struct net_device *dev)
{
if (netif_rx_schedule_prep(dev))
__netif_rx_schedule(dev);
}

復(fù)制代碼

static inline void __netif_rx_schedule(struct net_device *dev)
{
unsigned long flags;
local_irq_save(flags);
dev_hold(dev);
list_add_tail(&dev->poll_list, &__get_cpu_var(softnet_data).poll_list);
if (dev->quota < 0)
dev->quota += dev->weight;
else
dev->quota = dev->weight;
__raise_softirq_irqoff(NET_RX_SOFTIRQ);
local_irq_restore(flags);
}

復(fù)制代碼

所以，每個(gè)網(wǎng)絡(luò)設(shè)備中斷，會(huì)把產(chǎn)生中斷的網(wǎng)絡(luò)設(shè)備（也就是自己）放到響應(yīng)中斷的那個(gè)ＣＰＵ的softnet_data的隊(duì)列上去。這就是原因所在了。
對(duì)于上面的實(shí)驗(yàn)，當(dāng)一個(gè)網(wǎng)卡一個(gè)CPU時(shí)：eth1產(chǎn)生中斷，把自己放到cpu0 的隊(duì)列，eth2產(chǎn)生中斷，把自己放到cpu1的隊(duì)列，因?yàn)閿?shù)據(jù)發(fā)送是單向的，當(dāng)cpu1進(jìn)入net_rx_action時(shí)，它的設(shè)備列表中顯然不會(huì)有eth1，所以它也就沒有了處理后續(xù)處理工作的機(jī)會(huì)，而所有的革命重任都落到了cpu0上。這就是前面實(shí)驗(yàn)中，為什么雖然硬中斷已經(jīng)實(shí)現(xiàn)一人處理一個(gè)，但是cpu0的負(fù)載很高，而cpu1的負(fù)載很低的原因了。

五、最后一個(gè)實(shí)驗(yàn)
為了證明以上的推斷，將測(cè)試數(shù)據(jù)包方向改為雙向發(fā)送。這樣，eth2也會(huì)產(chǎn)生接收中斷，會(huì)把eth2的接收幀放到CPU1的隊(duì)列上去。就能夠?qū)崿F(xiàn)兩個(gè)net_rx_action并行——cpu0的隊(duì)列中包含eth1，cpu1的隊(duì)列中包含eth2……

Cpu(s): 0.5% user, 0.5% system, 0.0% nice, 16.6% idle, 0.0% x, 1.6% y
Cpu0 : 1.1% user, 0.0% system, 0.0% nice, 11.6% idle, 0.0% x, 0.0% y
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 21.9% idle, 0.0% x, 2.1% y
Cpu(s): 0.0% user, 0.0% system, 0.0% nice, 16.8% idle, 0.0% x, 2.1% y
Cpu0 : 0.0% user, 1.1% system, 0.0% nice, 10.5% idle, 0.0% x, 2.1% y
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 22.1% idle, 0.0% x, 2.1% y
Cpu(s): 0.5% user, 0.5% system, 0.0% nice, 15.1% idle, 0.0% x, 2.1% y
Cpu0 : 1.0% user, 0.0% system, 0.0% nice, 11.5% idle, 0.0% x, 1.0% y
Cpu1 : 0.0% user, 0.0% system, 0.0% nice, 19.8% idle, 0.0% x, 3.1% y

復(fù)制代碼

１、cpu0的負(fù)載下降了，從2%的空閑到10%左右。這跟我的測(cè)試環(huán)境有關(guān)——數(shù)據(jù)包改為雙向后，發(fā)包機(jī)的性能下降，它發(fā)送的數(shù)據(jù)幀從166Mb/s降到了100Mb/s。
２、可以看到CPU1負(fù)載明顯地上升了，從70%多的空閑到20%左右，很明顯，它此時(shí)也要運(yùn)行net_rx_action，處理從收包機(jī)過來的接收到的數(shù)據(jù)幀，并處理網(wǎng)橋，Netfilter……等網(wǎng)絡(luò)棧的工能。

六：初步結(jié)論
1、多核下，IRQ的負(fù)載均衡應(yīng)該開啟；
2、中斷親和內(nèi)核自己可以通過調(diào)度算法解決，自己定義也可以；
3、中斷實(shí)現(xiàn)多核并行后，內(nèi)核協(xié)議棧的并行工作，包括網(wǎng)橋、ipv4、防火墻……的多核并行，跟硬中斷落到哪個(gè)CPU上，也有直接關(guān)系。

在實(shí)踐中，可能會(huì)遇到CPU數(shù)量大于/小于/等于網(wǎng)卡的情況，也有可能出現(xiàn)上/下行流量極不對(duì)稱的情況，但是以上實(shí)驗(yàn)對(duì)于多核下調(diào)整內(nèi)核的性能，還是很有意義的！

[ 本帖最后由獨(dú)孤九賤于 2009-5-19 15:51 編輯 ]

文庫|博客

楊亮-移動(dòng)廣告投放-潛在用戶探尋_部分1.pdf
C# 合并拆分Word.docx
C# 添加PDF圖層.docx
凌感科技馬賡宇——虛擬現(xiàn)實(shí)與人機(jī)交互技術(shù).pdf
C# 添加、刪除 Excel 文本框.docx
使用正則表達(dá)式與lex實(shí)現(xiàn)詞法分析器
C語言的MIPS匯編實(shí)現(xiàn)（四）SWITCH
Requested init /linuxrc failed (error -2).
比較 csv 文件中數(shù)據(jù)差異
LMD ElPack v2019.7新版亮點(diǎn)：Transparent mode全新升級(jí)|附下載

ShadowStar

家境小康

論壇徽章:: 0

2樓 [報(bào)告]

發(fā)表于 2009-05-19 12:21 |只看該作者

中斷處理函數(shù)僅會(huì)在觸發(fā)中斷的CPU上運(yùn)行。

九賤兄，又一次驗(yàn)證了這個(gè)。

PS. 一直不知道九賤兄是做什么的？

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫RadonDB知多少？

獨(dú)孤九賤

富足長(zhǎng)樂

論壇徽章:: 0

3樓 [報(bào)告]

發(fā)表于 2009-05-19 12:23 |只看該作者

回復(fù) #2 ShadowStar 的帖子

中斷處理函數(shù)僅會(huì)在觸發(fā)中斷的CPU上運(yùn)行
——不是“中斷處理函數(shù)”，而是軟中斷函數(shù)net_rx_action（因?yàn)閚et_rx_action會(huì)涉到到調(diào)用整個(gè)網(wǎng)絡(luò)棧的數(shù)據(jù)接收流程，包括橋、VLAN、三層、防火墻、QoS……，而它們的并行，非常地重要)

我是做網(wǎng)絡(luò)程序開發(fā)工作方面的，空了就看看Linux。呵呵。

[ 本帖最后由獨(dú)孤九賤于 2009-5-19 12:24 編輯 ]

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫RadonDB知多少？

ShadowStar

家境小康

論壇徽章:: 0

4樓 [報(bào)告]

發(fā)表于 2009-05-19 12:25 |只看該作者

原帖由 獨(dú)孤九賤 于 2009-5-19 12:23 發(fā)表
中斷處理函數(shù)僅會(huì)在觸發(fā)中斷的CPU上運(yùn)行
——不是“中斷處理函數(shù)”，而是軟中斷函數(shù)net_rx_action（因?yàn)閚et_rx_action會(huì)涉到到調(diào)用整個(gè)網(wǎng)絡(luò)棧的數(shù)據(jù)接收流程，包括橋、VLAN、三層、防火墻、QoS……，而它們的并 ...

不僅僅是net_rx_action。
也不僅僅是軟中斷。

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫RadonDB知多少？

獨(dú)孤九賤

富足長(zhǎng)樂

論壇徽章:: 0

5樓 [報(bào)告]

發(fā)表于 2009-05-19 12:28 |只看該作者

回復(fù) #4 ShadowStar 的帖子

你說“不僅僅”是什么意思？？沒懂。
其實(shí)我想要的結(jié)論是：
1、硬中斷如何分?jǐn)偟礁鱾€(gè)CPU上去；
2、內(nèi)核網(wǎng)絡(luò)棧如何在各個(gè)CPU上并行；

現(xiàn)在這兩個(gè)結(jié)論都得到了。剩下的就是如何進(jìn)一步優(yōu)化它，如果需要的話。

關(guān)于優(yōu)化，我現(xiàn)在有一個(gè)初步的想法，但是還沒有成形：
就是把網(wǎng)卡加入到所有CPU的設(shè)備隊(duì)列上去，但是
1、添加/移除設(shè)備時(shí)，就需要一個(gè)共享保護(hù)機(jī)制；
2、所有的NAPI的poll都需要被改寫，因?yàn)閟kb_buff隊(duì)列這個(gè)時(shí)候就也需要共享保護(hù)機(jī)制；
這樣做會(huì)帶來多少性能的提升？因?yàn)槎鄠€(gè)CPU可以同時(shí)處理同一個(gè)網(wǎng)卡接收的數(shù)據(jù)幀。但是因?yàn)橥粋€(gè)網(wǎng)卡的隊(duì)列必然要引入鎖機(jī)制，又會(huì)抵銷多少？？

呵呵，或許這個(gè)想法一開始就是荒誕的，再想想……

[ 本帖最后由獨(dú)孤九賤于 2009-5-19 12:46 編輯 ]

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫RadonDB知多少？

ShadowStar

家境小康

論壇徽章:: 0

6樓 [報(bào)告]

發(fā)表于 2009-05-19 12:46 |只看該作者

原帖由 獨(dú)孤九賤 于 2009-5-19 12:28 發(fā)表
你說“不僅僅”是什么意思？？沒懂。
其實(shí)我想要的結(jié)論是：
1、硬中斷如何分?jǐn)偟礁鱾€(gè)CPU上去；
2、內(nèi)核網(wǎng)絡(luò)棧如何在各個(gè)CPU上并行；

現(xiàn)在這兩個(gè)結(jié)論都得到了。剩下的就是如何進(jìn)一步優(yōu)化它，如果需要的話。

不僅僅就是說，硬中斷的響應(yīng)函數(shù)也在觸發(fā)這個(gè)中斷的CPU上執(zhí)行；其他軟中斷，例如定時(shí)器也會(huì)在觸發(fā)的CPU上執(zhí)行。

1。硬中斷分?jǐn)偅ㄗh采用手動(dòng)綁定的方式。即使在內(nèi)核配置中打開了irqbalance，也僅會(huì)在中斷觸發(fā)達(dá)到一定頻繁度時(shí)才會(huì)移動(dòng)到其他CPU上。

2。軟中斷的問題。其實(shí)，只要硬中斷綁定到了特定的CPU上，那么網(wǎng)絡(luò)協(xié)議棧也就是在這個(gè)CPU上處理。
因?yàn)楸镜谻PU的硬中斷處理完成后，會(huì)觸發(fā)本地軟中斷NET_RX_SOFTIRQ。

對(duì)于conntrack，主要是我覺得并行效果不好的原因，主要是鎖的問題。因?yàn)檎聪騮uple都在一個(gè)hash表中，所以不能像路由查詢一樣，采用多個(gè)鎖。
我也在思考這部分的優(yōu)化處理。

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫RadonDB知多少？

獨(dú)孤九賤

富足長(zhǎng)樂

論壇徽章:: 0

7樓 [報(bào)告]

發(fā)表于 2009-05-19 12:50 |只看該作者

2。軟中斷的問題。其實(shí)，只要硬中斷綁定到了特定的CPU上，那么網(wǎng)絡(luò)協(xié)議棧也就是在這個(gè)CPU上處理。
因?yàn)楸镜谻PU的硬中斷處理完成后，會(huì)觸發(fā)本地軟中斷NET_RX_SOFTIRQ。
——我與你結(jié)論相同，但是原因卻不同：你仔細(xì)看我貼子的最后一部份，并不是因?yàn)檎l觸發(fā)了NET_RX_SOFTIRQ而造成的。而是因?yàn)閜re_cpu變量中設(shè)備隊(duì)列的關(guān)系！你說這個(gè)，我個(gè)人認(rèn)為：觸發(fā)的時(shí)候，僅僅是掛起軟中斷，也就是設(shè)置了一個(gè)位圖標(biāo)志而已。它并不能決定，誰觸發(fā)，即調(diào)用_netif_rx_schedule來進(jìn)一步調(diào)用__raise_softirq_irqoff(NET_RX_SOFTIRQ);
而是調(diào)用了list_add_tail(&dev->poll_list, &__get_cpu_var(softnet_data).poll_list);的原因。
這樣：實(shí)際上軟中斷net_rx_action會(huì)在多個(gè)并行在CPU上，它的并行與否，與產(chǎn)生數(shù)據(jù)接收的網(wǎng)卡的硬中斷無關(guān)，但是即使有兩個(gè)net_rx_action同時(shí)被兩個(gè)cpu執(zhí)行，因?yàn)槠渲幸粋€(gè)cpu設(shè)備隊(duì)列中，沒有與之對(duì)應(yīng)的接收數(shù)據(jù)幀的網(wǎng)絡(luò)設(shè)備（因?yàn)橹袛鄷r(shí)沒有安裝進(jìn)隊(duì)列來）。也會(huì)很快退出。此例中，cpu1中，沒有eth1。所以，它即使進(jìn)入了net_rx_action，也會(huì)很快退出。
當(dāng)然，這個(gè)結(jié)論很有可能是錯(cuò)的，我還沒有進(jìn)一步證實(shí)，因?yàn)閷?duì)軟中斷的調(diào)度這塊，的確以前沒有深入學(xué)習(xí)過。

對(duì)于conntrack，主要是我覺得并行效果不好的原因，主要是鎖的問題。因?yàn)檎聪騮uple都在一個(gè)hash表中，所以不能像路由查詢一樣，采用多個(gè)鎖。
——我現(xiàn)在發(fā)現(xiàn)，單個(gè)CPU效果都很差，并行的話，我就更加沒有考慮到了，呵呵�？樟宋蚁日艺覇蜟PU的時(shí)候，效率差的原因再說。非常希望這一部份能與你進(jìn)一步交流。

[ 本帖最后由獨(dú)孤九賤于 2009-5-19 12:58 編輯 ]

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫RadonDB知多少？

ShadowStar

家境小康

論壇徽章:: 0

8樓 [報(bào)告]

發(fā)表于 2009-05-19 13:01 |只看該作者

原帖由 獨(dú)孤九賤 于 2009-5-19 12:50 發(fā)表
2。軟中斷的問題。其實(shí)，只要硬中斷綁定到了特定的CPU上，那么網(wǎng)絡(luò)協(xié)議棧也就是在這個(gè)CPU上處理。
因?yàn)楸镜谻PU的硬中斷處理完成后，會(huì)觸發(fā)本地軟中斷NET_RX_SOFTIRQ。
——我與你結(jié)論相同，但是原因卻不同：你仔細(xì)看我貼子的最后一部份，并不是因?yàn)檎l觸發(fā)了NET_RX_SOFTIRQ而造成的。而是因?yàn)閜re_cpu變量中設(shè)備隊(duì)列的關(guān)系！你說這個(gè)，我個(gè)人認(rèn)為：觸發(fā)的時(shí)候，僅僅是掛起軟中斷，也就是設(shè)置了一個(gè)位圖標(biāo)志而已。

你是指

static inline void __netif_rx_schedule(struct net_device *dev)
{
unsigned long flags;
local_irq_save(flags);
dev_hold(dev);
list_add_tail(&dev->poll_list, &__get_cpu_var(softnet_data).poll_list);
if (dev->quota < 0)
dev->quota += dev->weight;
else
dev->quota = dev->weight;
__raise_softirq_irqoff(NET_RX_SOFTIRQ);
local_irq_restore(flags);
}

復(fù)制代碼

這個(gè)中的list_add_tail(&dev->poll_list, &__get_cpu_var(softnet_data).poll_list);吧？

softnet_data本身也是per_cpu的。__get_cpu_var取的是當(dāng)前CPU的softnet_data。
這里無非就是將dev->poll_list添加到當(dāng)前CPU的softnet_data中的poll_list。

原帖由 獨(dú)孤九賤 于 2009-5-19 12:50 發(fā)表
對(duì)于conntrack，主要是我覺得并行效果不好的原因，主要是鎖的問題。因?yàn)檎聪騮uple都在一個(gè)hash表中，所以不能像路由查詢一樣，采用多個(gè)鎖。
——我現(xiàn)在發(fā)現(xiàn)，單個(gè)CPU效果都很差，并行的話，我就更加沒有考慮到了，呵呵�？樟宋蚁日艺覇蜟PU的時(shí)候，效率差的原因再說。非常希望這一部份能與你進(jìn)一步交流。

其實(shí)對(duì)于單CPU的話，我覺得主要還是互斥和同步操作導(dǎo)致的。畢竟關(guān)閉軟硬中斷都是針對(duì)本地CPU的。

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫RadonDB知多少？

獨(dú)孤九賤

富足長(zhǎng)樂

論壇徽章:: 0

9樓 [報(bào)告]

發(fā)表于 2009-05-19 13:16 |只看該作者

原帖由 ShadowStar 于 2009-5-19 13:01 發(fā)表

你是指static inline void __netif_rx_schedule(struct net_device *dev)
{
      unsigned long flags;

      local_irq_save(flags);
      dev_hold(dev);
      list_add_tail(&dev->poll ...

是的，我就是指它！
你看，例如eth1觸發(fā)中斷，它就會(huì)將自己加入到自己響應(yīng)中斷的那個(gè)cpu(如cpu0)的soft_data的設(shè)備隊(duì)列poll_list上去。

這樣，即使有10個(gè)cpu同時(shí)運(yùn)行了net_rx_action，也只有cpu0的poll_list上有eth1，所以其它九個(gè)net_rx_action會(huì)很快退出（在單向數(shù)據(jù)傳輸中，沒有其它網(wǎng)卡接收數(shù)據(jù)的情況下）。

這也就是我前面實(shí)驗(yàn)中，同時(shí)測(cè)試單向和雙向的原因。

當(dāng)然，我也只是一個(gè)猜測(cè)，因?yàn)槲覍?duì)do_softirq的調(diào)用機(jī)制還沒有完全看明白。但是我覺得，應(yīng)該是這樣吧，八九不離十！呵呵！

其實(shí)對(duì)于單CPU的話，我覺得主要還是互斥和同步操作導(dǎo)致的。畢竟關(guān)閉軟硬中斷都是針對(duì)本地CPU的

這個(gè)我把多核這個(gè)搞明白了，回頭就去做實(shí)驗(yàn)，找到原因所在。

[ 本帖最后由獨(dú)孤九賤于 2009-5-19 13:17 編輯 ]

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫RadonDB知多少？

ShadowStar

家境小康

論壇徽章:: 0

10樓 [報(bào)告]

發(fā)表于 2009-05-19 13:25 |只看該作者

原帖由 獨(dú)孤九賤 于 2009-5-19 13:16 發(fā)表

是的，我就是指它！
你看，例如eth1觸發(fā)中斷，它就會(huì)將自己加入到自己響應(yīng)中斷的那個(gè)cpu(如cpu0)的soft_data的設(shè)備隊(duì)列poll_list上去。

這樣，即使有10個(gè)cpu同時(shí)運(yùn)行了net_rx_action，也只有cpu0的poll_ ...

只有cpu0觸發(fā)的net_rx_action，才會(huì)檢測(cè)到本地CPU(cpu0)的softnet_data.poll_list上有cpu0上硬中斷添加的poll_list。

換句話說，軟中斷觸發(fā)的net_rx_action僅檢測(cè)本地CPU上的poll_list。

所以我說，“只要硬中斷綁定到了特定的CPU上，那么網(wǎng)絡(luò)協(xié)議棧也就是在這個(gè)CPU上處理。”。

[ 本帖最后由 ShadowStar 于 2009-5-19 13:27 編輯 ]

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫RadonDB知多少？

亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

在多核系統(tǒng)上網(wǎng)絡(luò)數(shù)據(jù)轉(zhuǎn)發(fā)實(shí)驗(yàn)和一點(diǎn)思考 [復(fù)制鏈接]

回復(fù) #2 ShadowStar 的帖子

回復(fù) #4 ShadowStar 的帖子


平臺(tái) 論壇博客文庫