- 論壇徽章:
- 3
|
6.2 tasklet機制
Tasklet機制是一種較為特殊的軟中斷。Tasklet一詞的原意是“小片任務(wù)”的意思,這里是指一小段可執(zhí)行的代碼,且通常以函數(shù)的形式出現(xiàn)。軟中斷向量HI_SOFTIRQ和TASKLET_SOFTIRQ均是用tasklet機制來實現(xiàn)的。
從某種程度上講,tasklet機制是Linux內(nèi)核對BH機制的一種擴展。在2.4內(nèi)核引入了softirq機制后,原有的BH機制正是通過tasklet機制這個橋梁來納入softirq機制的整體框架中的。正是由于這種歷史的延伸關(guān)系,使得tasklet機制與一般意義上的軟中斷有所不同,而呈現(xiàn)出以下兩個顯著的特點:
1. 與一般的軟中斷不同,某一段tasklet代碼在某個時刻只能在一個CPU上運行,而不像一般的軟中斷服務(wù)函數(shù)(即softirq_action結(jié)構(gòu)中的action函數(shù)指針)那樣——在同一時刻可以被多個CPU并發(fā)地執(zhí)行。
2. 與BH機制不同,不同的tasklet代碼在同一時刻可以在多個CPU上并發(fā)地執(zhí)行,而不像BH機制那樣必須嚴格地串行化執(zhí)行(也即在同一時刻系統(tǒng)中只能有一個CPU執(zhí)行BH函數(shù))。
6.2.1 tasklet描述符
Linux用數(shù)據(jù)結(jié)構(gòu)tasklet_struct來描述一個tasklet。該數(shù)據(jù)結(jié)構(gòu)定義在include/linux/interrupt.h頭文件中。如下所示:
struct tasklet_struct
{
struct tasklet_struct *next;
unsigned long state;
atomic_t count;
void (*func)(unsigned long);
unsigned long data;
};
各成員的含義如下:
(1)next指針:指向下一個tasklet的指針。
(2)state:定義了這個tasklet的當前狀態(tài)。這一個32位的無符號長整數(shù),當前只使用了bit[1]和bit[0]兩個狀態(tài)位。其中,bit[1]=1表示這個tasklet當前正在某個CPU上被執(zhí)行,它僅對SMP系統(tǒng)才有意義,其作用就是為了防止多個CPU同時執(zhí)行一個tasklet的情形出現(xiàn);bit[0]=1表示這個tasklet已經(jīng)被調(diào)度去等待執(zhí)行了。對這兩個狀態(tài)位的宏定義如下所示(interrupt.h):
enum
{
TASKLET_STATE_SCHED, /* Tasklet is scheduled for execution */
TASKLET_STATE_RUN /* Tasklet is running (SMP only) */
};
(3)原子計數(shù)count:對這個tasklet的引用計數(shù)值。NOTE!只有當count等于0時,tasklet代碼段才能執(zhí)行,也即此時tasklet是被使能的;如果count非零,則這個tasklet是被禁止的。任何想要執(zhí)行一個tasklet代碼段的人都首先必須先檢查其count成員是否為0。
(4)函數(shù)指針func:指向以函數(shù)形式表現(xiàn)的可執(zhí)行tasklet代碼段。
(5)data:函數(shù)func的參數(shù)。這是一個32位的無符號整數(shù),其具體含義可供func函數(shù)自行解釋,比如將其解釋成一個指向某個用戶自定義數(shù)據(jù)結(jié)構(gòu)的地址值。
Linux在interrupt.h頭文件中又定義了兩個用來定義tasklet_struct結(jié)構(gòu)變量的輔助宏:
#define DECLARE_TASKLET(name, func, data) \
struct tasklet_struct name = { NULL, 0, ATOMIC_INIT(0), func, data }
#define DECLARE_TASKLET_DISABLED(name, func, data) \
struct tasklet_struct name = { NULL, 0, ATOMIC_INIT(1), func, data }
顯然,從上述源代碼可以看出,用DECLARE_TASKLET宏定義的tasklet在初始化時是被使能的(enabled),因為其count成員為0。而用DECLARE_TASKLET_DISABLED宏定義的tasklet在初始時是被禁止的(disabled),因為其count等于1。
6.2.2 改變一個tasklet狀態(tài)的操作
在這里,tasklet狀態(tài)指兩個方面:(1)state成員所表示的運行狀態(tài);(2)count成員決定的使能/禁止狀態(tài)。
(1)改變一個tasklet的運行狀態(tài)
state成員中的bit[0]表示一個tasklet是否已被調(diào)度去等待執(zhí)行,bit[1]表示一個tasklet是否正在某個CPU上執(zhí)行。對于state變量中某位的改變必須是一個原子操作,因此可以用定義在include/asm/bitops.h頭文件中的位操作來進行。
由于bit[1]這一位(即TASKLET_STATE_RUN)僅僅對于SMP系統(tǒng)才有意義,因此Linux在Interrupt.h頭文件中顯示地定義了對TASKLET_STATE_RUN位的操作。如下所示:
#ifdef CONFIG_SMP
#define tasklet_trylock(t) (!test_and_set_bit(TASKLET_STATE_RUN, &(t)->state))
#define tasklet_unlock_wait(t) while (test_bit(TASKLET_STATE_RUN, &(t)->state)) { /* NOTHING */ }
#define tasklet_unlock(t) clear_bit(TASKLET_STATE_RUN, &(t)->state)
#else
#define tasklet_trylock(t) 1
#define tasklet_unlock_wait(t) do { } while (0)
#define tasklet_unlock(t) do { } while (0)
#endif
顯然,在SMP系統(tǒng)同,tasklet_trylock()宏將把一個tasklet_struct結(jié)構(gòu)變量中的state成員中的bit[1]位設(shè)置成1,同時還返回bit[1]位的非。因此,如果bit[1]位原有值為1(表示另外一個CPU正在執(zhí)行這個tasklet代碼),那么tasklet_trylock()宏將返回值0,也就表示上鎖不成功。如果bit[1]位的原有值為0,那么tasklet_trylock()宏將返回值1,表示加鎖成功。而在單CPU系統(tǒng)中,tasklet_trylock()宏總是返回為1。
任何想要執(zhí)行某個tasklet代碼的程序都必須首先調(diào)用宏tasklet_trylock()來試圖對這個tasklet進行上鎖(即設(shè)置TASKLET_STATE_RUN位),且只能在上鎖成功的情況下才能執(zhí)行這個tasklet。建議!即使你的程序只在CPU系統(tǒng)上運行,你也要在執(zhí)行tasklet之前調(diào)用tasklet_trylock()宏,以便使你的代碼獲得良好可移植性。
在SMP系統(tǒng)中,tasklet_unlock_wait()宏將一直不停地測試TASKLET_STATE_RUN位的值,直到該位的值變?yōu)?(即一直等待到解鎖),假如:CPU0正在執(zhí)行tasklet A的代碼,在此期間,CPU1也想執(zhí)行tasklet A的代碼,但CPU1發(fā)現(xiàn)tasklet A的TASKLET_STATE_RUN位為1,于是它就可以通過tasklet_unlock_wait()宏等待tasklet A被解鎖(也即TASKLET_STATE_RUN位被清零)。在單CPU系統(tǒng)中,這是一個空操作。
宏tasklet_unlock()用來對一個tasklet進行解鎖操作,也即將TASKLET_STATE_RUN位清零。在單CPU系統(tǒng)中,這是一個空操作。
(2)使能/禁止一個tasklet
使能與禁止操作往往總是成對地被調(diào)用的,tasklet_disable()函數(shù)如下(interrupt.h):
static inline void tasklet_disable(struct tasklet_struct *t)
{
tasklet_disable_nosync(t);
tasklet_unlock_wait(t);
}
函數(shù)tasklet_disable_nosync()也是一個靜態(tài)inline函數(shù),它簡單地通過原子操作將count成員變量的值減1。如下所示(interrupt.h):
static inline void tasklet_disable_nosync(struct tasklet_struct *t)
{
atomic_inc(&t->count);
}
函數(shù)tasklet_enable()用于使能一個tasklet,如下所示(interrupt.h):
static inline void tasklet_enable(struct tasklet_struct *t)
{
atomic_dec(&t->count);
}
6.2.3 tasklet描述符的初始化與殺死
函數(shù)tasklet_init()用來初始化一個指定的tasklet描述符,其源碼如下所示(kernel/softirq.c):
void tasklet_init(struct tasklet_struct *t,
void (*func)(unsigned long), unsigned long data)
{
t->func = func;
t->data = data;
t->state = 0;
atomic_set(&t->count, 0);
}
函數(shù)tasklet_kill()用來將一個已經(jīng)被調(diào)度了的tasklet殺死,即將其恢復(fù)到未調(diào)度的狀態(tài)。其源碼如下所示(kernel/softirq.c):
void tasklet_kill(struct tasklet_struct *t)
{
if (in_interrupt())
printk("Attempt to kill tasklet from interrupt\n");
while (test_and_set_bit(TASKLET_STATE_SCHED, &t->state)) {
current->state = TASK_RUNNING;
do {
current->policy |= SCHED_YIELD;
schedule();
} while (test_bit(TASKLET_STATE_SCHED, &t->state));
}
tasklet_unlock_wait(t);
clear_bit(TASKLET_STATE_SCHED, &t->state);
}
6.2.4 tasklet對列
多個tasklet可以通過tasklet描述符中的next成員指針鏈接成一個單向?qū)α。為此,Linux專門在頭文件include/linux/interrupt.h中定義了數(shù)據(jù)結(jié)構(gòu)tasklet_head來描述一個tasklet對列的頭部指針。如下所示:
struct tasklet_head
{
struct tasklet_struct *list;
} __attribute__ ((__aligned__(SMP_CACHE_BYTES)));
盡管tasklet機制是特定于軟中斷向量HI_SOFTIRQ和TASKLET_SOFTIRQ的一種實現(xiàn),但是tasklet機制仍然屬于softirq機制的整體框架范圍內(nèi)的,因此,它的設(shè)計與實現(xiàn)仍然必須堅持“誰觸發(fā),誰執(zhí)行”的思想。為此,Linux為系統(tǒng)中的每一個CPU都定義了一個tasklet對列頭部,來表示應(yīng)該有各個CPU負責執(zhí)行的tasklet對列。如下所示(kernel/softirq.c):
struct tasklet_head tasklet_vec[NR_CPUS] __cacheline_aligned;
struct tasklet_head tasklet_hi_vec[NR_CPUS] __cacheline_aligned;
其中,tasklet_vec[]數(shù)組用于軟中斷向量TASKLET_SOFTIRQ,而tasklet_hi_vec[]數(shù)組則用于軟中斷向量HI_SOFTIRQ。也即,如果CPUi(0≤i≤NR_CPUS-1)觸發(fā)了軟中斷向量TASKLET_SOFTIRQ,那么對列tasklet_vec[i]中的每一個tasklet都將在CPUi服務(wù)于軟中斷向量TASKLET_SOFTIRQ時被CPUi所執(zhí)行。同樣地,如果CPUi(0≤i≤NR_CPUS-1)觸發(fā)了軟中斷向量HI_SOFTIRQ,那么隊列tasklet_vec[i]中的每一個tasklet都將CPUi在對軟中斷向量HI_SOFTIRQ進行服務(wù)時被CPUi所執(zhí)行。
隊列tasklet_vec[I]和tasklet_hi_vec[I]中的各個tasklet是怎樣被所CPUi所執(zhí)行的呢?其關(guān)鍵就是軟中斷向量TASKLET_SOFTIRQ和HI_SOFTIRQ的軟中斷服務(wù)程序——tasklet_action()函數(shù)和tasklet_hi_action()函數(shù)。下面我們就來分析這兩個函數(shù)。
6.2.5 軟中斷向量TASKLET_SOFTIRQ和HI_SOFTIRQ
Linux為軟中斷向量TASKLET_SOFTIRQ和HI_SOFTIRQ實現(xiàn)了專用的觸發(fā)函數(shù)和軟中斷服務(wù)函數(shù)。其中,tasklet_schedule()函數(shù)和tasklet_hi_schedule()函數(shù)分別用來在當前CPU上觸發(fā)軟中斷向量TASKLET_SOFTIRQ和HI_SOFTIRQ,并把指定的tasklet加入當前CPU所對應(yīng)的tasklet隊列中去等待執(zhí)行。而tasklet_action()函數(shù)和tasklet_hi_action()函數(shù)則分別是軟中斷向量TASKLET_SOFTIRQ和HI_SOFTIRQ的軟中斷服務(wù)函數(shù)。在初始化函數(shù)softirq_init()中,這兩個軟中斷向量對應(yīng)的描述符softirq_vec[0]和softirq_vec[3]中的action函數(shù)指針就被分別初始化成指向函數(shù)tasklet_hi_action()和函數(shù)tasklet_action()。
(1)軟中斷向量TASKLET_SOFTIRQ的觸發(fā)函數(shù)tasklet_schedule()
該函數(shù)實現(xiàn)在include/linux/interrupt.h頭文件中,是一個inline函數(shù)。其源碼如下所示:
static inline void tasklet_schedule(struct tasklet_struct *t)
{
if (!test_and_set_bit(TASKLET_STATE_SCHED, &t->state)) {
int cpu = smp_processor_id();
unsigned long flags;
local_irq_save(flags);
t->next = tasklet_vec[cpu].list;
tasklet_vec[cpu].list = t;
__cpu_raise_softirq(cpu, TASKLET_SOFTIRQ);
local_irq_restore(flags);
}
}
該函數(shù)的參數(shù)t指向要在當前CPU上被執(zhí)行的tasklet。對該函數(shù)的NOTE如下:
①調(diào)用test_and_set_bit()函數(shù)將待調(diào)度的tasklet的state成員變量的bit[0]位(也即TASKLET_STATE_SCHED位)設(shè)置為1,該函數(shù)同時還返回TASKLET_STATE_SCHED位的原有值。因此如果bit[0]為的原有值已經(jīng)為1,那就說明這個tasklet已經(jīng)被調(diào)度到另一個CPU上去等待執(zhí)行了。由于一個tasklet在某一個時刻只能由一個CPU來執(zhí)行,因此tasklet_schedule()函數(shù)什么也不做就直接返回了。否則,就繼續(xù)下面的調(diào)度操作。
②首先,調(diào)用local_irq_save()函數(shù)來關(guān)閉當前CPU的中斷,以保證下面的步驟在當前CPU上原子地被執(zhí)行。
③然后,將待調(diào)度的tasklet添加到當前CPU對應(yīng)的tasklet隊列的首部。
④接著,調(diào)用__cpu_raise_softirq()函數(shù)在當前CPU上觸發(fā)軟中斷請求TASKLET_SOFTIRQ。
⑤最后,調(diào)用local_irq_restore()函數(shù)來開當前CPU的中斷。
(2)軟中斷向量TASKLET_SOFTIRQ的服務(wù)程序tasklet_action()
函數(shù)tasklet_action()是tasklet機制與軟中斷向量TASKLET_SOFTIRQ的聯(lián)系紐帶。正是該函數(shù)將當前CPU的tasklet隊列中的各個tasklet放到當前CPU上來執(zhí)行的。該函數(shù)實現(xiàn)在kernel/softirq.c文件中,其源代碼如下:
static void tasklet_action(struct softirq_action *a)
{
int cpu = smp_processor_id();
struct tasklet_struct *list;
local_irq_disable();
list = tasklet_vec[cpu].list;
tasklet_vec[cpu].list = NULL;
local_irq_enable();
while (list != NULL) {
struct tasklet_struct *t = list;
list = list->next;
if (tasklet_trylock(t)) {
if (atomic_read(&t->count) == 0) {
clear_bit(TASKLET_STATE_SCHED, &t->state);
t->func(t->data);
/*
* talklet_trylock() uses test_and_set_bit that imply
* an mb when it returns zero, thus we need the explicit
* mb only here: while closing the critical section.
*/
#ifdef CONFIG_SMP
smp_mb__before_clear_bit();
#endif
tasklet_unlock(t);
continue;
}
tasklet_unlock(t);
}
local_irq_disable();
t->next = tasklet_vec[cpu].list;
tasklet_vec[cpu].list = t;
__cpu_raise_softirq(cpu, TASKLET_SOFTIRQ);
local_irq_enable();
}
}
注釋如下:
①首先,在當前CPU關(guān)中斷的情況下,“原子”地讀取當前CPU的tasklet隊列頭部指針,將其保存到局部變量list指針中,然后將當前CPU的tasklet隊列頭部指針設(shè)置為NULL,以表示理論上當前CPU將不再有tasklet需要執(zhí)行(但最后的實際結(jié)果卻并不一定如此,下面將會看到)。
②然后,用一個while{}循環(huán)來遍歷由list所指向的tasklet隊列,隊列中的各個元素就是將在當前CPU上執(zhí)行的tasklet。循環(huán)體的執(zhí)行步驟如下:
l 用指針t來表示當前隊列元素,即當前需要執(zhí)行的tasklet。
l 更新list指針為list->next,使它指向下一個要執(zhí)行的tasklet。
l 用tasklet_trylock()宏試圖對當前要執(zhí)行的tasklet(由指針t所指向)進行加鎖,如果加鎖成功(當前沒有任何其他CPU正在執(zhí)行這個tasklet),則用原子讀函數(shù)atomic_read()進一步判斷count成員的值。如果count為0,說明這個tasklet是允許執(zhí)行的,于是:(1)先清除TASKLET_STATE_SCHED位;(2)然后,調(diào)用這個tasklet的可執(zhí)行函數(shù)func;(3)執(zhí)行barrier()操作;(4)調(diào)用宏tasklet_unlock()來清除TASKLET_STATE_RUN位。(5)最后,執(zhí)行continue語句跳過下面的步驟,回到while循環(huán)繼續(xù)遍歷隊列中的下一個元素。如果count不為0,說明這個tasklet是禁止運行的,于是調(diào)用tasklet_unlock()清除前面用tasklet_trylock()設(shè)置的TASKLET_STATE_RUN位。
l 如果tasklet_trylock()加鎖不成功,或者因為當前tasklet的count值非0而不允許執(zhí)行時,我們必須將這個tasklet重新放回到當前CPU的tasklet隊列中,以留待這個CPU下次服務(wù)軟中斷向量TASKLET_SOFTIRQ時再執(zhí)行。為此進行這樣幾步操作:(1)先關(guān)CPU中斷,以保證下面操作的原子性。(2)把這個tasklet重新放回到當前CPU的tasklet隊列的首部;(3)調(diào)用__cpu_raise_softirq()函數(shù)在當前CPU上再觸發(fā)一次軟中斷請求TASKLET_SOFTIRQ;(4)開中斷。
l 最后,回到while循環(huán)繼續(xù)遍歷隊列。
(3)軟中斷向量HI_SOFTIRQ的觸發(fā)函數(shù)tasklet_hi_schedule()
該函數(shù)與tasklet_schedule()幾乎相同,其源碼如下(include/linux/interrupt.h):
static inline void tasklet_hi_schedule(struct tasklet_struct *t)
{
if (!test_and_set_bit(TASKLET_STATE_SCHED, &t->state)) {
int cpu = smp_processor_id();
unsigned long flags;
local_irq_save(flags);
t->next = tasklet_hi_vec[cpu].list;
tasklet_hi_vec[cpu].list = t;
__cpu_raise_softirq(cpu, HI_SOFTIRQ);
local_irq_restore(flags);
}
}
(4)軟中斷向量HI_SOFTIRQ的服務(wù)函數(shù)tasklet_hi_action()
該函數(shù)與tasklet_action()函數(shù)幾乎相同,其源碼如下(kernel/softirq.c):
static void tasklet_hi_action(struct softirq_action *a)
{
int cpu = smp_processor_id();
struct tasklet_struct *list;
local_irq_disable();
list = tasklet_hi_vec[cpu].list;
tasklet_hi_vec[cpu].list = NULL;
local_irq_enable();
while (list != NULL) {
struct tasklet_struct *t = list;
list = list->next;
if (tasklet_trylock(t)) {
if (atomic_read(&t->count) == 0) {
clear_bit(TASKLET_STATE_SCHED, &t->state);
t->func(t->data);
tasklet_unlock(t);
continue;
}
tasklet_unlock(t);
}
local_irq_disable();
t->next = tasklet_hi_vec[cpu].list;
tasklet_hi_vec[cpu].list = t;
__cpu_raise_softirq(cpu, HI_SOFTIRQ);
local_irq_enable();
}
} |
|