亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 3916 | 回復(fù): 4
打印 上一主題 下一主題

寫個爬蟲是用php還是perl? [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2011-03-22 13:51 |只看該作者 |倒序瀏覽
大家好,
我現(xiàn)在要寫爬蟲程序,功能是抓取一些電子商務(wù)網(wǎng)站的商品信息,并且要監(jiān)控它們價格的變動。
現(xiàn)在猶豫的是,不知道是php還是用perl來寫這個腳本合適。
有經(jīng)驗的朋友給點(diǎn)意見吧。

論壇徽章:
30
水瓶座
日期:2014-08-22 21:06:3415-16賽季CBA聯(lián)賽之新疆
日期:2015-12-19 19:05:48IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-12-25 06:20:31IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-12-25 06:20:31IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-12-25 06:20:3315-16賽季CBA聯(lián)賽之上海
日期:2016-04-15 19:51:31程序設(shè)計版塊每日發(fā)帖之星
日期:2016-04-17 06:23:29程序設(shè)計版塊每日發(fā)帖之星
日期:2016-04-23 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2016-05-26 06:20:00每日論壇發(fā)貼之星
日期:2016-05-26 06:20:0015-16賽季CBA聯(lián)賽之遼寧
日期:2017-02-16 23:59:4715-16賽季CBA聯(lián)賽之天津
日期:2019-01-11 01:11:44
2 [報告]
發(fā)表于 2011-03-22 15:22 |只看該作者
用你擅長的來寫

論壇徽章:
0
3 [報告]
發(fā)表于 2011-03-22 19:38 |只看該作者
用perl

1 perl有多線程機(jī)制
2 perl的正則處理要方便一點(diǎn)
3 php是插件機(jī)制,只適合處理短時的請求,不是為后臺長時間運(yùn)行設(shè)計的
4 perl爬蟲方面現(xiàn)成的類庫比較多,解析html的模塊也比較成熟

論壇徽章:
0
4 [報告]
發(fā)表于 2011-03-23 09:23 |只看該作者
回復(fù) 3# yakczh


    樓上,能提供參考資料嗎。謝謝哈!!!

論壇徽章:
0
5 [報告]
發(fā)表于 2011-03-23 15:56 |只看該作者
現(xiàn)在做爬蟲還用正則嗎?out了。

建議用支持CSS3/XPath selector那樣的包,因為你可以使用類似jquery那樣的語法去分析頁面,
很爽的。

cpan 搜索xpath, css3能夠一堆。

上月我還用過Mojo. Mojo的xpath相對弱一些,但是如果夠用也就行了,我是看上他的
異步IO和連接池。

你可以試試其他的。
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP