亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
樓主: xtthnfr
打印 上一主題 下一主題

搜索引擎技術(shù)介紹的PPT,我寫的,歡迎觀看. [復(fù)制鏈接]

論壇徽章:
0
21 [報告]
發(fā)表于 2007-09-21 20:08 |只看該作者
不錯,lz在做移動搜索。。。。。?

論壇徽章:
0
22 [報告]
發(fā)表于 2007-09-22 00:09 |只看該作者
打不開!
office 2003!

論壇徽章:
0
23 [報告]
發(fā)表于 2007-09-22 00:23 |只看該作者
我也搞了一個全文檢索的套件在 www.ftphp.com

樓主的東西瀏覽了一下,大概是講述如何從頭構(gòu)建一個像Google,baidu之類的web搜索引擎, 但小弟認(rèn)為目前再去構(gòu)建這樣的東西除了興趣研究之外,似乎沒有什么好的發(fā)展前景, 且不說能否做得更優(yōu)秀(不得不承認(rèn)這是極難的), 做好以后面對的市場競爭也是難上加難.

我弄的ftphp支持的量沒有樓主提到的億\上百億\上千億或更多級別,目前基本上能較好的支持千萬級,作為全文索引庫, 主要目標(biāo)是站內(nèi)搜索, 站內(nèi)搜索和通用的WEB搜索引擎(google,baidu為代表)有著許多本質(zhì)的區(qū)別, 站內(nèi)搜索通常對"查全"有更高的要求, 此外排序也應(yīng)更靈活(類似SQL的字段排序), 這些的運(yùn)算都是目前我無法較好解決的疑難之一呵.

特別是排序, 如果不預(yù)排序,成千上百億的數(shù)量肯定會有億命中的數(shù)量,如果要根據(jù)"點(diǎn)擊次數(shù)"排名,有何良方?? 而且 web 搜索對于查全沒有這么高的要求, 排序也相對單一只要按一種自己認(rèn)為的和搜索關(guān)鍵詞相關(guān)\重要性排序即可.

有興趣在此方面進(jìn)行探討,可惜文章中說到的技術(shù)部分比較,期待技術(shù)文章....

現(xiàn)在搞搜索的個人也蠻多呀,之前看到一個 www.sqlet.com 也是在做億級WEB通用搜索引擎....

論壇徽章:
0
24 [報告]
發(fā)表于 2007-09-22 00:55 |只看該作者
謝謝             .

論壇徽章:
0
25 [報告]
發(fā)表于 2007-09-22 00:59 |只看該作者
下來看看先

論壇徽章:
0
26 [報告]
發(fā)表于 2007-09-22 01:29 |只看該作者
收了,對搜索技術(shù)有點(diǎn)興趣,特別是算法部分

論壇徽章:
0
27 [報告]
發(fā)表于 2007-09-22 16:04 |只看該作者
提示: 作者被禁止或刪除 內(nèi)容自動屏蔽

論壇徽章:
0
28 [報告]
發(fā)表于 2007-09-24 10:07 |只看該作者
原帖由 benlan 于 2007-9-1 22:09 發(fā)表
強(qiáng)人,頂一個

借問一個問題,爬蟲對javascript是咋么處理的,有沒有一個javascript解析器引擎的
如跳轉(zhuǎn)等用javascript來實(shí)現(xiàn)的,如何處理。
一般用什么實(shí)現(xiàn)javascript引擎,從firefox上抽?


//這個問題,我沒做過....不知道如何回答.

//如果我要來解決這個問題,我估計會去寫個javascript解析器之類的東西.

//寫類似的東西,其實(shí)問題并不困難.主要是去看看javascript之類的語法定義就應(yīng)該能解決.沒有具體做過,只能猜測.

論壇徽章:
0
29 [報告]
發(fā)表于 2007-09-24 10:08 |只看該作者
原帖由 parachute 于 2007-9-21 20:08 發(fā)表
不錯,lz在做移動搜索。。。。。?


對,原來我是做了2年的WEB搜索...

我現(xiàn)在做移動搜索....已做了3年了.

論壇徽章:
0
30 [報告]
發(fā)表于 2007-09-24 10:12 |只看該作者
//直接不能看PPT文件的朋友,可以訪問下面的URL,全部是圖片格式.

//感謝這位沒見過面的朋友,把我的PPT轉(zhuǎn)成圖片.

http://blog.csdn.net/heiyeshuwu/archive/2007/09/12/1782718.aspx
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP