亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫(kù)
最近訪問(wèn)板塊 發(fā)新帖
查看: 53525 | 回復(fù): 100
打印 上一主題 下一主題

CUDA很不錯(cuò)啊 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2008-12-29 15:27 |只看該作者 |倒序?yàn)g覽
http://www.nvidia.cn/object/cuda_home_cn.html
http://cuda.csdn.net/
擴(kuò)展現(xiàn)有PC變成HPC,據(jù)稱成本是傳統(tǒng)CPU HPC的1/1000。Apple最近又搞出來(lái)OpenCL支持,那巨大的并行啊...
還聽(tīng)說(shuō)UC Berkeley曾經(jīng)有個(gè)項(xiàng)目是在GPU上JIT,比CPU快20倍。(忘記哪里看到的)
NV這個(gè)HPC大小和PC一樣,功耗幾百瓦。不知道和UC Berkeley那個(gè)項(xiàng)目有沒(méi)有關(guān)系。

[ 本帖最后由 prolj 于 2008-12-29 15:30 編輯 ]

論壇徽章:
0
2 [報(bào)告]
發(fā)表于 2008-12-30 18:02 |只看該作者
你現(xiàn)在的技術(shù)是通殺了,從嵌入式到HPC,無(wú)處不在。

論壇徽章:
0
3 [報(bào)告]
發(fā)表于 2008-12-30 19:16 |只看該作者

回復(fù) #2 old-cow 的帖子

只是了解了解。
NV說(shuō)雖然OpenCL比CUDA更“低級(jí)”,但是效率上的差距會(huì)因?yàn)榫幾g器的優(yōu)化相差不大,但是CUDA相比OpenCL更容易使用。
俺關(guān)心的數(shù)據(jù)流相關(guān)性分析,數(shù)據(jù)流分析的核心問(wèn)題。

論壇徽章:
0
4 [報(bào)告]
發(fā)表于 2008-12-30 21:35 |只看該作者
這個(gè)方面的話題很合適在這個(gè)論壇討論.
LZ把東西簡(jiǎn)要的整理一下直接貼上來(lái)就可以討論了,連接看起來(lái)不太方便,而且無(wú)法要定位討論的重點(diǎn).

論壇徽章:
0
5 [報(bào)告]
發(fā)表于 2008-12-31 10:03 |只看該作者
先從Cell說(shuō)起,Cell是異構(gòu)多核的,性能好,主頻高啊。
Intel又仿制了一個(gè)Larrabee顯卡,只是工藝還是90納米的,但是Arch上和Cell差不多。
再說(shuō)Intel的Atom,如果說(shuō)幾十上百個(gè)Atom核的多核U,現(xiàn)在來(lái)說(shuō)還為時(shí)過(guò)早,況且工藝,封裝...芯片組?都是問(wèn)題,關(guān)鍵是Arch上不是更有利于實(shí)現(xiàn)的。
CUDA倒是進(jìn)一步的發(fā)展(個(gè)人覺(jué)得),NV有個(gè)計(jì)算板,可以插在PC上的。CUDA的GPGPU的核心有N多...主頻很高,速度本來(lái)就不錯(cuò),再加上N多核心,并行的話,計(jì)算問(wèn)題可以很快解決。GPU不光可以浮點(diǎn)計(jì)算,定點(diǎn)是浮點(diǎn)的一個(gè)子集。CUDA沒(méi)有Cache好像是,大規(guī)模并行計(jì)算用Cache不太考譜,為了增加這方面的性能取而代之的是DDR3顯存,NV的說(shuō)法是對(duì)于大規(guī)模計(jì)算來(lái)講Cache不是那么重要。并行機(jī)來(lái)講,Cache的設(shè)計(jì)意義不大,因?yàn)橛?jì)算需要的大量數(shù)據(jù)Cache不一定裝的下,而且并行計(jì)算需要的數(shù)據(jù)不一定是連續(xù)的,比如Cary機(jī)就不用Cache。Intel的U怎么樣?芯片上大量的面積用來(lái)做Cache了,這樣作為不要Cache的GPU來(lái)講就可以容納更多的核來(lái)進(jìn)行計(jì)算。
從Cell開(kāi)始,我就覺(jué)得異構(gòu)多核好啊。CUDA還是用現(xiàn)有的PC結(jié)構(gòu),現(xiàn)有的軟件(OS)仍然能跑,CPU主要跑OS的,要是有啥計(jì)算,無(wú)論是浮點(diǎn)還是定點(diǎn),如果安排合適,GPGPU可以很快計(jì)算出結(jié)果。
關(guān)鍵的優(yōu)勢(shì)就在于CUDA更容易實(shí)現(xiàn),價(jià)格低的離譜(和傳統(tǒng)HPC相比),可以用更小的面積集成更多的核(GPGPU這個(gè)概念一開(kāi)始是AMD的流處理器提出的,只不過(guò)AMD的流處理(ATI顯卡)要用匯編,不方便),功耗目前是幾百瓦,也已經(jīng)低的離譜了~~~

[ 本帖最后由 prolj 于 2008-12-31 10:41 編輯 ]

論壇徽章:
0
6 [報(bào)告]
發(fā)表于 2008-12-31 12:24 |只看該作者
原帖由 prolj 于 2008-12-31 10:03 發(fā)表
先從Cell說(shuō)起,Cell是異構(gòu)多核的,性能好,主頻高啊。
Intel又仿制了一個(gè)Larrabee顯卡,只是工藝還是90納米的,但是Arch上和Cell差不多。
再說(shuō)Intel的Atom,如果說(shuō)幾十上百個(gè)Atom核的多核U,現(xiàn)在來(lái)說(shuō)還為時(shí)過(guò) ...

功耗目前是幾百瓦,也已經(jīng)低的離譜了

算低的離譜了? 是跟哪個(gè)做比較的?能否說(shuō)說(shuō)?

論壇徽章:
0
7 [報(bào)告]
發(fā)表于 2008-12-31 14:10 |只看該作者

回復(fù) #6 system888net 的帖子

跟傳統(tǒng)HPC比啊,獨(dú)立顯卡玩兒游戲PC的整機(jī)功耗也幾百瓦了 我覺(jué)得比起來(lái)機(jī)房里面需要空調(diào)甚至水冷的機(jī)器已經(jīng)很離譜了。
而且NV自己也一直強(qiáng)調(diào) 性能/功耗 比。

論壇徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11數(shù)據(jù)庫(kù)技術(shù)版塊每日發(fā)帖之星
日期:2016-08-03 06:20:00數(shù)據(jù)庫(kù)技術(shù)版塊每日發(fā)帖之星
日期:2016-08-04 06:20:00
8 [報(bào)告]
發(fā)表于 2008-12-31 23:04 |只看該作者
怎么現(xiàn)在都在用gpu來(lái)搭計(jì)算架構(gòu)了,對(duì)gpu沒(méi)什么了解,只知道其一般是浮點(diǎn)運(yùn)算,還無(wú)法真正理解它的優(yōu)勢(shì)所在。

論壇徽章:
0
9 [報(bào)告]
發(fā)表于 2008-12-31 23:47 |只看該作者
這是現(xiàn)存在的一些說(shuō)法和觀點(diǎn)(本人認(rèn)為僅是某個(gè)角度的說(shuō)法,并不排斥大家各自的觀點(diǎn)):

使用顯示芯片來(lái)進(jìn)行運(yùn)算工作,和使用 CPU 相比,主要有幾個(gè)好處:
   1. 顯示芯片通常具有更大的內(nèi)存帶寬。例如,NVIDIA 的 GeForce 8800GTX 具有超過(guò) 50GB/s 的內(nèi)存帶寬,而目前高階 CPU 的內(nèi)存帶寬則在 10GB/s 左右。
   2. 顯示芯片具有更大量的執(zhí)行單元。例如 GeForce 8800GTX 具有 128 個(gè) "stream processors",頻率為 1.35GHz。CPU 頻率通常較高,但是執(zhí)行單元的數(shù)目則要少得多。
   3. 和高階 CPU 相比,顯卡的價(jià)格較為低廉。例如目前一張 GeForce 8800GT 包括 512MB 內(nèi)存的價(jià)格,和一顆 2.4GHz 四核心 CPU 的價(jià)格相若。

當(dāng)然,使用顯示芯片也有它的一些缺點(diǎn):

   1. 顯示芯片的運(yùn)算單元數(shù)量很多,因此對(duì)于不能高度并行化的工作,所能帶來(lái)的幫助就不大。
   2. 顯示芯片目前通常只支持 32 bits 浮點(diǎn)數(shù),且多半不能完全支持 IEEE 754 規(guī)格, 有些運(yùn)算的精確度可能較低。目前許多顯示芯片并沒(méi)有分開(kāi)的整數(shù)運(yùn)算單元,因此整數(shù)運(yùn)算的效率較差。
   3. 顯示芯片通常不具有分支預(yù)測(cè)等復(fù)雜的流程控制單元,因此對(duì)于具有高度分支的程序,效率會(huì)比較差。
   4. 目前 GPGPU 的程序模型仍不成熟,也還沒(méi)有公認(rèn)的標(biāo)準(zhǔn)。例如 NVIDIA 和 AMD/ATI 就有各自不同的程序模型。

論壇徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11數(shù)據(jù)庫(kù)技術(shù)版塊每日發(fā)帖之星
日期:2016-08-03 06:20:00數(shù)據(jù)庫(kù)技術(shù)版塊每日發(fā)帖之星
日期:2016-08-04 06:20:00
10 [報(bào)告]
發(fā)表于 2008-12-31 23:57 |只看該作者
原帖由 system888net 于 2008-12-31 23:47 發(fā)表
這是現(xiàn)存在的一些說(shuō)法和觀點(diǎn)(本人認(rèn)為僅是某個(gè)角度的說(shuō)法,并不排斥大家各自的觀點(diǎn)):

使用顯示芯片來(lái)進(jìn)行運(yùn)算工作,和使用 CPU 相比,主要有幾個(gè)好處:
   1. 顯示芯片通常具有更大的內(nèi)存帶寬。例如,NVIDIA ...

......
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過(guò)ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP