亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
12下一頁
最近訪問板塊 發(fā)新帖
查看: 4763 | 回復: 15
打印 上一主題 下一主題

[文章采集] 請問如何補全url? [復制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2005-08-25 17:00 |只看該作者 |倒序瀏覽
請問一下我在做采集的時候有些圖片或者文章地址是相對路徑,怎么辦呢?

當然,我可以取新聞列表頁URL加相對地址..
但是更多時候比如:
新聞列表頁URL為:http://www.aaa.com/aaa/bb/news.html
然后圖片相對地址為
../../images/tt.jpg

這時候我該怎么辦呢?

而且更多的時候可能情況更復雜,不知道大家在遇到這樣的問題的時候有什么好的解決方法?

論壇徽章:
0
2 [報告]
發(fā)表于 2005-08-25 18:43 |只看該作者

[文章采集] 請問如何補全url?

這個問題好,,頂。。

關系到頁面里的地址如何處理。。

論壇徽章:
1
技術圖書徽章
日期:2013-12-05 23:25:45
3 [報告]
發(fā)表于 2005-08-25 19:54 |只看該作者

[文章采集] 請問如何補全url?

原帖由 "diychen" 發(fā)表:
請問一下我在做采集的時候有些圖片或者文章地址是相對路徑,怎么辦呢?

當然,我可以取新聞列表頁URL加相對地址..
但是更多時候比如:
新聞列表頁URL為:http://www.aaa.com/aaa/bb/news.html
然后圖片相對地址為
..........


更多得時候,難道相對路徑就不起作用了?
還是可以再基礎路徑上多次../../../../的。

論壇徽章:
0
4 [報告]
發(fā)表于 2005-08-25 21:54 |只看該作者

[文章采集] 請問如何補全url?

版主, LZ的意思應該是把頁面抓下來以后, 碰到圖片無法顯示時想尋找解決辦法.

這個我覺得可以在讀取網(wǎng)頁內(nèi)容時用正則表達式進行匹配判斷,然后替換...

論壇徽章:
0
5 [報告]
發(fā)表于 2005-08-26 09:01 |只看該作者

[文章采集] 請問如何補全url?

這個問題不好辦,我以前用 outlook 發(fā)送網(wǎng)頁時,發(fā)現(xiàn)網(wǎng)頁中的圖片是相對路徑的,就無法顯示。

論壇徽章:
1
技術圖書徽章
日期:2013-12-05 23:25:45
6 [報告]
發(fā)表于 2005-08-26 09:27 |只看該作者

[文章采集] 請問如何補全url?


  1. $strBaseUrl = "[當前頁面的網(wǎng)頁地址的路徑部分(去掉最后的文件名成)]";
  2. $strDist = preg_replace('/([src|href])=([\'"])(?!http:\/\/)(.+?)(.+?)([\'"])/', '$1=$2'.$strBaseUrl.'$3$4', $strSource);
復制代碼


以上針對:
src='xxxxx'
src="xxxxx"
href='xxxxx'
href="xxxxx"
且其中的網(wǎng)址,不以http://開頭

論壇徽章:
1
技術圖書徽章
日期:2013-12-05 23:25:45
7 [報告]
發(fā)表于 2005-08-26 09:34 |只看該作者

[文章采集] 請問如何補全url?


  1. <?php
  2. $strSource = "src='../../../images/test.gif'";
  3. $strBaseUrl = "http://www.test.com/";
  4. $strDist = preg_replace('/([src|href])=([\'"])(?!http:\/\/)(.+?)(.+?)([\'"])/', '$1=$2'.$strBaseUrl.'$3$4', $strSource);
  5. echo $strDist;

  6. print "\n";

  7. $strSource = "src='http://www.test.com/images/test.gif'";
  8. $strBaseUrl = "http://www.test.com/";
  9. $strDist = preg_replace('/([src|href])=([\'"])(?!http:\/\/)(.+?)(.+?)([\'"])/', '$1=$2'.$strBaseUrl.'$3$4', $strSource);
  10. echo $strDist;
  11. ?>;
復制代碼

----------php Complier ----------
Content-type: text/html
X-Powered-By: PHP/4.4.0

src='http://www.test.com/../../../images/test.gif
src='http://www.test.com/images/test.gif'
輸出完成 (耗時 0 秒) - 正常終止

論壇徽章:
0
8 [報告]
發(fā)表于 2005-08-26 09:50 |只看該作者

[文章采集] 請問如何補全url?

相對路徑有什么關系,比如現(xiàn)在http://www.a.com/b/c/index.html文件中有圖片鏈接為<img src="../../imgs/a.gif">;,你要取圖片是嗎,你可能想方設法用絕對路徑來表示:http://www.a.com/imgs/a.gif,其實可以直接在后面加,http://www.a.com/b/c/../../imgs/a.gif。這樣有什么問題嗎?

論壇徽章:
0
9 [報告]
發(fā)表于 2005-08-26 12:44 |只看該作者

[文章采集] 請問如何補全url?

還個應該試試用preg_replace 里 /x 修正符, 針對 ".../.../" 和當前的 URL 判斷層次數(shù), 然后再返回應有的URL

論壇徽章:
0
10 [報告]
發(fā)表于 2005-09-11 22:29 |只看該作者

[文章采集] 請問如何補全url?

版主:
如果它沒有引號如何處理?

如:
<img src=a.gif>;
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術有限公司. 版權所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP