亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 7877 | 回復(fù): 8
打印 上一主題 下一主題

[文本處理] 正則表達(dá)式取出指定的字符串,求助. [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2015-08-06 17:35 |只看該作者 |倒序瀏覽
有如下網(wǎng)頁源文件
<div class="threadtype">
<p>
<strong>全部</strong>
<a href="forum.php?mod=forumdisplay&amp;fid=24&amp;filter=typeid&amp;typeid=506">文本處理</a>
<a href="forum.php?mod=forumdisplay&amp;fid=24&amp;filter=typeid&amp;typeid=507">文件目錄</a>
<a href="forum.php?mod=forumdisplay&amp;fid=24&amp;filter=typeid&amp;typeid=508">系統(tǒng)管理</a>
<a href="forum.php?mod=forumdisplay&amp;fid=24&amp;filter=typeid&amp;typeid=509">數(shù)值計算</a>
<a href="forum.php?mod=forumdisplay&amp;fid=24&amp;filter=typeid&amp;typeid=510">日期時間</a>
<a href="forum.php?mod=forumdisplay&amp;fid=24&amp;filter=typeid&amp;typeid=511">網(wǎng)絡(luò)相關(guān)</a>
<a href="forum.php?mod=forumdisplay&amp;fid=24&amp;filter=typeid&amp;typeid=512">游戲娛樂</a>
<a href="forum.php?mod=forumdisplay&amp;fid=24&amp;filter=typeid&amp;typeid=513">學(xué)習(xí)共享</a>
<a href="forum.php?mod=forumdisplay&amp;fid=24&amp;filter=typeid&amp;typeid=514">其他</a>
</p>
</div>

想通過正則表達(dá)式匹配對應(yīng)中文,如找到"文本處理</a>"內(nèi)容,取出對應(yīng)的href="forum.php?mod.....typeid=506"的字符串內(nèi)容,求助.完全忘記干凈這個正則表達(dá)式了.......

論壇徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年紀(jì)念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役紀(jì)念章
日期:2022-04-24 14:33:24
2 [報告]
發(fā)表于 2015-08-06 17:38 |只看該作者
  1. grep -Po '.*(?=文本處理</a>)' 1.txt
復(fù)制代碼

論壇徽章:
0
3 [報告]
發(fā)表于 2015-08-06 17:45 |只看該作者
這個HTML的源文件,實際上是沒有回車符的,用GREP是不是行的.
另我只是想知道用正則表達(dá)式怎么匹配到我想得到的這串字符.
多謝二樓.

論壇徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年紀(jì)念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役紀(jì)念章
日期:2022-04-24 14:33:24
4 [報告]
發(fā)表于 2015-08-06 17:56 |只看該作者
本帖最后由 Shell_HAT 于 2015-08-06 17:59 編輯
  1. <[^<]+>(?=文本處理<\/a>)
復(fù)制代碼

論壇徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年紀(jì)念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役紀(jì)念章
日期:2022-04-24 14:33:24
5 [報告]
發(fā)表于 2015-08-06 17:58 |只看該作者
grep -Po '<[^<]+>(?=文件目錄<\/a>)' 1.txt
沒有換行符不代表grep不行

論壇徽章:
0
6 [報告]
發(fā)表于 2015-08-06 18:17 |只看該作者
多謝各位,呵呵.主要是要正則表達(dá)式,謝謝.

論壇徽章:
7
2015年辭舊歲徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:57:092015小元宵徽章
日期:2015-03-06 15:58:18程序設(shè)計版塊每日發(fā)帖之星
日期:2015-08-09 06:20:00每日論壇發(fā)貼之星
日期:2015-08-09 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-08-22 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-08-27 06:20:00
7 [報告]
發(fā)表于 2015-08-06 18:37 |只看該作者
  1. sed -n '/^[<]a href/s/<a \(href=[^>]*\)[>].*/\1/p'
復(fù)制代碼

論壇徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年紀(jì)念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役紀(jì)念章
日期:2022-04-24 14:33:24
8 [報告]
發(fā)表于 2015-08-06 19:14 |只看該作者
回復(fù) 6# 軒靜天


    4樓哪個測試出現(xiàn)什么問題了嗎

論壇徽章:
20
卯兔
日期:2015-01-26 22:05:142015亞冠之薩濟拖拉機
日期:2015-09-10 15:15:282015亞冠之阿爾希拉爾
日期:2015-09-25 17:37:53程序設(shè)計版塊每日發(fā)帖之星
日期:2015-10-03 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-12-09 06:20:00CU十四周年紀(jì)念徽章
日期:2015-12-17 09:07:15程序設(shè)計版塊每日發(fā)帖之星
日期:2015-12-25 06:20:34程序設(shè)計版塊每日發(fā)帖之星
日期:2015-12-25 06:20:34程序設(shè)計版塊每日發(fā)帖之星
日期:2015-12-25 06:20:342015亞冠之廣州富力
日期:2015-08-27 19:29:56每日論壇發(fā)貼之星
日期:2015-08-26 06:20:002015亞冠之阿爾希拉爾
日期:2015-05-18 17:26:27
9 [報告]
發(fā)表于 2015-08-07 11:54 |只看該作者
回復(fù) 1# 軒靜天
  1. awk 'match($0,/([^><]+)<\/a>$/,a){print a[1]}' file
  2. awk 'match($0,/^<a (href=[^>]+)/,a){print a[1]}' file
復(fù)制代碼
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP