亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
樓主: xtthnfr
打印 上一主題 下一主題

[算法] 我對算法的一點感觸 [復(fù)制鏈接]

論壇徽章:
0
11 [報告]
發(fā)表于 2007-09-01 16:41 |只看該作者
以后再遇到瓶頸,采用B+樹算法構(gòu)建索引文件

并不合適, 多個客戶端 一起用 也是非常麻煩的。

論壇徽章:
39
2017金雞報曉
日期:2017-02-08 10:39:4219周年集字徽章-周
日期:2023-04-15 12:02:2715-16賽季CBA聯(lián)賽之深圳
日期:2023-02-16 14:39:0220周年集字徽章-年
日期:2022-08-31 14:25:28黑曼巴
日期:2022-08-17 18:57:0919周年集字徽章-年
日期:2022-04-25 13:02:5920周年集字徽章-20	
日期:2022-03-29 11:10:4620周年集字徽章-年
日期:2022-03-14 22:35:1820周年集字徽章-周	
日期:2022-03-09 12:51:3220周年集字徽章-年
日期:2022-02-10 13:13:4420周年集字徽章-周	
日期:2022-02-03 12:09:4420周年集字徽章-20	
日期:2022-01-25 20:14:27
12 [報告]
發(fā)表于 2007-09-01 20:08 |只看該作者
樓主你就直說了吧,最后用什么方法快,別賣關(guān)子了,你說的那些處理都很平常,多數(shù)人都知道不靈的。

論壇徽章:
0
13 [報告]
發(fā)表于 2007-09-01 20:11 |只看該作者
原帖由 MMMIX 于 2007-8-31 19:35 發(fā)表

不要動不動就把算法抬那么高 :em11:


幼稚。

論壇徽章:
0
14 [報告]
發(fā)表于 2007-09-01 20:59 |只看該作者
這叫“摸著石頭過河”么。

論壇徽章:
0
15 [報告]
發(fā)表于 2007-09-03 09:39 |只看該作者


任何事情都要考慮效果和效率,程序設(shè)計尤其如此.

一般來講分為4種情況

1.效果好,效率高.

2.效果好,效率低.

3.效果差,效率高.

4.效果差,效率低.

程序設(shè)計出來能正常運行,這是效果;程序設(shè)計出來效果好,運行速度快,這是效率,也就是算法.

作為絕大多數(shù)公司,都對程序的要求是第一種,先要求效果....效率放到第二位.

解決了生存問題的公司和我們程序設(shè)計人員,才能資格和機會去追求第一種效果.

論壇徽章:
0
16 [報告]
發(fā)表于 2007-09-03 10:42 |只看該作者

回復(fù) #1 xtthnfr 的帖子

樓主的url排重有什么好方法嗎?

bloom-filter?還是干脆用map-reduce?你所列的前幾種方法都無法適應(yīng)大規(guī)模的應(yīng)用。

論壇徽章:
0
17 [報告]
發(fā)表于 2007-09-03 11:16 |只看該作者


我都說了是自己寫HASH了....

搜索引擎里面很多地方都用到HASH.

論壇徽章:
0
18 [報告]
發(fā)表于 2007-09-03 11:36 |只看該作者
原帖由 福瑞哈哥 于 2007-9-3 10:42 發(fā)表
樓主的url排重有什么好方法嗎?

bloom-filter?還是干脆用map-reduce?你所列的前幾種方法都無法適應(yīng)大規(guī)模的應(yīng)用。


搜索了一把.....我感覺bloom-filter基本上也還是hash....map-reduce看了半天....沒搞太明白....但我總的感覺就是特殊處理.

我在接著細(xì)化討論一點URL排重吧.

URL有很多特點....

1.URL太長的不多....太短的也不多.....你大概能分析出來URL的平均長度.

2.網(wǎng)頁數(shù)目特別多的超級的大網(wǎng)站也不多.....可以對各個網(wǎng)站進(jìn)行分級.

3......

URL排重具備很多特點,和純粹的算法上的隨機分布完全是兩回事.

所以,URL的排重的HASH就要根據(jù)你對URL的特點歸納整理出來之后來設(shè)計.

比如說:先按照域名做第一次HASH....然后各個具體網(wǎng)站上面的在做2級HASH...象sina和sohu那樣的大網(wǎng)站,還可以按照頻道去做3級hash.....

//這只是我個人的想法....

論壇徽章:
0
19 [報告]
發(fā)表于 2007-09-03 13:20 |只看該作者
我的算法:

1.重排URL變量
2.md5一次,16個字節(jié)128位
3.將16字節(jié)運算得到34位數(shù)據(jù)
4.34位數(shù)據(jù)剛好使用2G文件(* 8 bit)來記錄是否出現(xiàn)過

可能有重疊情況發(fā)生,但16G的位空間應(yīng)該夠用了。

論壇徽章:
0
20 [報告]
發(fā)表于 2007-09-03 17:49 |只看該作者
算法就像登山中尋找的路。
找對了,能省很多力氣!
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP