亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 24254 | 回復(fù): 56
打印 上一主題 下一主題

滅哈哈,想了多半年的時間,終于明白多核編程的實質(zhì)了~!@#$%^&*( [復(fù)制鏈接]

論壇徽章:
4
戌狗
日期:2013-08-15 18:22:43技術(shù)圖書徽章
日期:2013-08-21 13:48:45巨蟹座
日期:2013-09-26 17:06:39處女座
日期:2013-12-25 11:26:10
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2011-09-10 11:53 |只看該作者 |倒序瀏覽
基本原理概括為兩句話:
1) CPU2若看到CPU1執(zhí)行了某條指令,則必可看到CPU1中這條指令之前的所有指令。
2) CPU3若看到CPU2執(zhí)行了某條指令,而此時CPU2若看到CPU1執(zhí)行了某條指令,則CPU3必可看到CPU1中的這條指令。該原則遞歸。

是不是很有bbjmmj的味道?哈哈。


不過俺覺得這就是人腦對多核編程的第一個感性認(rèn)識,抽象概括出來就是順序模型。所以才有了亂序模型中的內(nèi)存屏障。

《super-scalar processor design》
《Memory Consistency Models for Shared-Memory Multiprocessors》
《arm architecture referece manual     armv7A》
documentation/memory-barrier.txt
........................................................

  這些書都是在反復(fù)的討論這兩句話,滅哈哈。

評分

參與人數(shù) 2可用積分 +1 收起 理由
smalloc + 2 東莞技術(shù)沙龍的講課內(nèi)容?
帥絕人寰 -1 你丫玩變態(tài)禪啊

查看全部評分

論壇徽章:
7
丑牛
日期:2013-10-18 14:43:21技術(shù)圖書徽章
日期:2013-11-03 09:58:03辰龍
日期:2014-01-15 22:57:50午馬
日期:2014-09-15 07:04:39丑牛
日期:2014-10-16 14:25:222015年亞洲杯之伊朗
日期:2015-03-16 10:24:352015亞冠之城南
日期:2015-05-31 09:52:32
2 [報告]
發(fā)表于 2011-09-10 15:28 |只看該作者
"看到"是指引用其結(jié)果沒?
CPU1中這條指令之前的所有指令--這個之前是指CPU1上已經(jīng)運行的指令(這個沒多大問題,如果每CPU讀寫總是按一定序), 還是指即使存在亂序的情況下, 在亂序之前的指令序都能被"看到".

論壇徽章:
24
獅子座
日期:2013-12-31 10:48:0015-16賽季CBA聯(lián)賽之吉林
日期:2016-04-18 14:43:1015-16賽季CBA聯(lián)賽之北控
日期:2016-05-18 15:01:4415-16賽季CBA聯(lián)賽之上海
日期:2016-06-22 18:00:1315-16賽季CBA聯(lián)賽之八一
日期:2016-06-25 11:02:2215-16賽季CBA聯(lián)賽之佛山
日期:2016-08-17 22:48:2615-16賽季CBA聯(lián)賽之福建
日期:2016-12-27 22:39:272016科比退役紀(jì)念章
日期:2017-02-08 23:49:4315-16賽季CBA聯(lián)賽之八一
日期:2017-02-16 01:05:3415-16賽季CBA聯(lián)賽之山東
日期:2017-02-22 15:34:5615-16賽季CBA聯(lián)賽之上海
日期:2017-11-25 16:17:5015-16賽季CBA聯(lián)賽之四川
日期:2016-01-17 18:38:37
3 [報告]
發(fā)表于 2011-09-10 17:19 |只看該作者
基本原理概括為兩句話:
1) CPU2若看到CPU1執(zhí)行了某條指令,則必可看到CPU1中這條指令之前的所有指令。
2 ...
塑料袋 發(fā)表于 2011-09-10 11:53



    一個 CPU 執(zhí)行一個線程,看什么看。

論壇徽章:
4
戌狗
日期:2013-08-15 18:22:43技術(shù)圖書徽章
日期:2013-08-21 13:48:45巨蟹座
日期:2013-09-26 17:06:39處女座
日期:2013-12-25 11:26:10
4 [報告]
發(fā)表于 2011-09-10 17:47 |只看該作者
沒人來踩。抬杠都沒機(jī)會。唉

論壇徽章:
11
未羊
日期:2013-12-16 12:45:4615-16賽季CBA聯(lián)賽之青島
日期:2016-04-11 19:17:4715-16賽季CBA聯(lián)賽之廣夏
日期:2016-04-06 16:34:012015亞冠之卡爾希納薩夫
日期:2015-11-10 10:04:522015亞冠之大阪鋼巴
日期:2015-07-30 18:29:402015亞冠之城南
日期:2015-06-15 17:56:392015亞冠之卡爾希納薩夫
日期:2015-05-15 15:19:272015亞冠之山東魯能
日期:2015-05-14 12:38:13金牛座
日期:2014-12-04 15:34:06子鼠
日期:2014-10-16 13:40:4715-16賽季CBA聯(lián)賽之八一
日期:2016-07-22 09:41:40
5 [報告]
發(fā)表于 2011-09-10 20:31 |只看該作者
沒人來踩。抬杠都沒機(jī)會。唉
塑料袋 發(fā)表于 2011-09-10 17:47


不踩, 求科普

論壇徽章:
4
戌狗
日期:2013-08-15 18:22:43技術(shù)圖書徽章
日期:2013-08-21 13:48:45巨蟹座
日期:2013-09-26 17:06:39處女座
日期:2013-12-25 11:26:10
6 [報告]
發(fā)表于 2011-09-10 21:34 |只看該作者
"看到"是指引用其結(jié)果沒?
CPU1中這條指令之前的所有指令--這個之前是指CPU1上已經(jīng)運行的指令(這個沒多大問題,如果每CPU讀寫總是按一定序), 還是指即使存在亂序的情況下, 在亂序之前的指令序都能被"看到".

smalloc 發(fā)表于 2011-09-10 15:28



這里是說的順序模型。不過這個是最重要的。

因為亂序模型是根據(jù)順序模型來設(shè)計的,mb()的作用,就是搞了個順序一致的點,mb()前后的指令表現(xiàn)為順序一致。   


什么叫“看到”,雖然很多個文檔中定義了到底什么叫“看到”,不過以arm architecture reference manual中定義的最為標(biāo)準(zhǔn)。

什么時候可以認(rèn)為load指令被看到?  對同一地址執(zhí)行store時,不影響load的返回結(jié)果,即為load被看到

什么時候可以認(rèn)為store指令被看到?  對同一地址執(zhí)行l(wèi)oad時,將返回store的值,即為store被看到



雖然原理看起來很簡單,不過reorder buffer,load / store unit,store buffer,cache............的設(shè)計,均是以此為出發(fā)點。


一個例子,執(zhí)行mb()時需要將CPU1的各個讀寫請求通過MESI發(fā)給別的CPU,然后等待這些讀寫請求完成,即這些請求的應(yīng)答reply后,才叫mb()執(zhí)行完成。

但是為什么對于讀請求,需要這個讀操作確實在其他CPU的cache中完成,才能發(fā)回reply; 但是對于寫請求,僅僅是將invalidate request掛在其他CPU的incoming queue上,不等invalidate在其他CPU的cache中完成,就可以發(fā)回來reply???

對于上邊這種情況,有一個基本的設(shè)計原則:對于本CPU而言,
1) 從其他CPU發(fā)過來的invalidate request,
2) 從其他CPU發(fā)過來的的read reply,invalidate reply

這兩類數(shù)據(jù)包之間,一定不能亂序;但是本類數(shù)據(jù)包內(nèi)部,可以亂序。 這樣的話:

處理其他CPU發(fā)來的read replay之前,則必然已經(jīng)處理了其他CPU發(fā)來的invalidate request。即看到其他CPU的一個store操作時,則必然可看到這個store之前的所有store。

處理其他CPU發(fā)來的invalidate replay之前,則必然已經(jīng)處理了其他CPU發(fā)來的invalidate request。即看到其他CPU的一個load操作時,則必然可看到這個load之前的所有store。

論壇徽章:
7
丑牛
日期:2013-10-18 14:43:21技術(shù)圖書徽章
日期:2013-11-03 09:58:03辰龍
日期:2014-01-15 22:57:50午馬
日期:2014-09-15 07:04:39丑牛
日期:2014-10-16 14:25:222015年亞洲杯之伊朗
日期:2015-03-16 10:24:352015亞冠之城南
日期:2015-05-31 09:52:32
7 [報告]
發(fā)表于 2011-09-10 22:01 |只看該作者
本帖最后由 smalloc 于 2011-09-10 22:13 編輯

回復(fù) 6# 塑料袋


    記得LZ曾說過 構(gòu)架是精髓, 以上似乎還是一些細(xì)節(jié), 實際上多核這東西已經(jīng)有對應(yīng)的抽象理論, 稱為分布式計算 另外有個petri 網(wǎng)也是專門研究異步的, 就是把并行異步的邏輯模型單獨把出來搞.

論壇徽章:
11
未羊
日期:2013-12-16 12:45:4615-16賽季CBA聯(lián)賽之青島
日期:2016-04-11 19:17:4715-16賽季CBA聯(lián)賽之廣夏
日期:2016-04-06 16:34:012015亞冠之卡爾希納薩夫
日期:2015-11-10 10:04:522015亞冠之大阪鋼巴
日期:2015-07-30 18:29:402015亞冠之城南
日期:2015-06-15 17:56:392015亞冠之卡爾希納薩夫
日期:2015-05-15 15:19:272015亞冠之山東魯能
日期:2015-05-14 12:38:13金牛座
日期:2014-12-04 15:34:06子鼠
日期:2014-10-16 13:40:4715-16賽季CBA聯(lián)賽之八一
日期:2016-07-22 09:41:40
8 [報告]
發(fā)表于 2011-09-11 01:54 |只看該作者
這里是說的順序模型。不過這個是最重要的。

因為亂序模型是根據(jù)順序模型來設(shè)計的,mb()的作用,就 ...
塑料袋 發(fā)表于 2011-09-10 21:34


樓主能否解釋的更清楚一些, 或者推薦幾本資料; 一直對亂序執(zhí)行莫測高深, 怎么也不明白怎么能亂序而不影響執(zhí)行結(jié)果, 也不明白怎么在代碼級能夠預(yù)測亂序的發(fā)生

論壇徽章:
4
戌狗
日期:2013-08-15 18:22:43技術(shù)圖書徽章
日期:2013-08-21 13:48:45巨蟹座
日期:2013-09-26 17:06:39處女座
日期:2013-12-25 11:26:10
9 [報告]
發(fā)表于 2011-09-11 17:25 |只看該作者
《super-scalar processor design》: 這本側(cè)重亂序,超標(biāo)量等。
《Memory Consistency Models for Shared-Memory Multiprocessors》:這本側(cè)重多核的抽象模型。


亂序的基本原理就是“取指”,“譯碼”都是順序的;  

大部分指令的執(zhí)行結(jié)果都要寫回到一個寄存器中,雖然指令的“執(zhí)行”是亂序的,但是還是順序的將結(jié)果“提交到”register file,即真正的寫到寄存器中。

CPU在“譯碼”階段,額外給每條指令關(guān)聯(lián)了一個唯一的ID號, 將來通過這個ID號,即可檢索到這條指令的執(zhí)行結(jié)果。

CPU在“譯碼”階段,如果一條指令依賴于上條指令,那么上條指令的ID號,即是本條指令的源操作數(shù);或者上條條指令已經(jīng)執(zhí)行完畢,那么上條指令的執(zhí)行結(jié)果,即是本條指令的源操作數(shù)。

CPU一股腦的“譯碼”了一大片指令,每條指令“執(zhí)行”完畢后,都會將其ID號與執(zhí)行結(jié)果在CPU內(nèi)部廣播。 源操作數(shù)為這個ID號的已譯碼指令,會將源操作數(shù)從ID號置換為這個執(zhí)行結(jié)果。

這樣,源操作數(shù)里不包含ID號的指令就可以“執(zhí)行”,源操做數(shù)里還包含著ID號的指令就等待,由此來的“亂序”。




不過,CPU是亂序的,其讀寫內(nèi)存完全可能是順序的,這要視其load / store unit的設(shè)計。

open sparc的specification里比較詳細(xì)的描述了load / store unit的設(shè)計。

《Memory Consistency Models for Shared-Memory Multiprocessors》里,描述了load / store unit的一般性設(shè)計,并描述了分析其設(shè)計需求的方法。

論壇徽章:
2
CU十二周年紀(jì)念徽章
日期:2013-10-24 15:41:34處女座
日期:2013-12-27 22:22:41
10 [報告]
發(fā)表于 2011-09-11 20:45 |只看該作者
大濕高處不勝寒啊~~
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP