亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
12下一頁
最近訪問板塊 發(fā)新帖
查看: 6581 | 回復(fù): 16
打印 上一主題 下一主題

python:正則表達式提取信息 [復(fù)制鏈接]

論壇徽章:
1
子鼠
日期:2014-08-28 13:27:13
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2014-08-27 17:52 |只看該作者 |倒序瀏覽
[14/Jul/2014:15:45:00 CST] [1939478272] 10.6.99.163 test1 "" ACLDENY - - - (10.6.99.163:62691 -> 210.75.65.219:80) (Pre authorization failed)
有這樣一個文本,內(nèi)容如上(幾千行),想用正則表達式把后邊的端口號提出來,
ip_port = re.findall(????????)[0].strip()求問括號里怎么寫?小白第一次接觸正則

論壇徽章:
4
金牛座
日期:2013-10-11 16:12:50卯兔
日期:2014-07-31 09:17:19辰龍
日期:2014-08-08 09:28:02獅子座
日期:2014-09-14 20:32:05
2 [報告]
發(fā)表于 2014-08-27 18:01 |只看該作者
  1. re.findall('\d+\.\d+\.\d+\.\d+:\d+', s)
復(fù)制代碼

論壇徽章:
9
2015亞冠之阿爾納斯爾
日期:2015-09-10 16:21:162015亞冠之塔什干火車頭
日期:2015-07-01 16:23:022015年亞洲杯之巴勒斯坦
日期:2015-04-20 17:19:46子鼠
日期:2014-11-13 09:51:26未羊
日期:2014-08-28 18:13:36技術(shù)圖書徽章
日期:2014-02-21 09:30:15酉雞
日期:2014-01-14 11:12:49天蝎座
日期:2013-12-09 17:56:53平安夜徽章
日期:2015-12-26 00:06:30
3 [報告]
發(fā)表于 2014-08-27 18:07 |只看該作者
本帖最后由 HH106 于 2014-08-27 18:07 編輯

后面的80端口嗎?
  1. re.compile('\.\d+:(\d+?)\)')
復(fù)制代碼

論壇徽章:
1
子鼠
日期:2014-08-28 13:27:13
4 [報告]
發(fā)表于 2014-08-27 18:13 |只看該作者
ssfjhh 發(fā)表于 2014-08-27 18:01

謝謝,不過只想要端口號,不要ip

論壇徽章:
1
子鼠
日期:2014-08-28 13:27:13
5 [報告]
發(fā)表于 2014-08-27 18:14 |只看該作者
HH106 發(fā)表于 2014-08-27 18:07
后面的80端口嗎?

是的 只要端口號

論壇徽章:
1
子鼠
日期:2014-08-28 13:27:13
6 [報告]
發(fā)表于 2014-08-27 18:24 |只看該作者
本帖最后由 chosen86 于 2014-08-27 18:27 編輯
HH106 發(fā)表于 2014-08-27 18:07
后面的80端口嗎?

times = re.findall(r'(?<=\[).*?(?= CST\])', text)[0]
             sourIp = re.findall(r'\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}', text)[0]
             test = re.findall(r'(?<={}).*?(?="'.format(ips),text)[0].strip()
             destIp = re.findall(r'(?<=->.*?(?=', text)[0].strip()
             port = re.findall(????????????????????).strip()
             infos = ' '.join([times, ips, test, ip_port]) + '\n'
想這樣寫,請問port= re.findall(??????).strip(),?????????這塊怎么配?上邊的是請教同事寫的

論壇徽章:
9
2015亞冠之阿爾納斯爾
日期:2015-09-10 16:21:162015亞冠之塔什干火車頭
日期:2015-07-01 16:23:022015年亞洲杯之巴勒斯坦
日期:2015-04-20 17:19:46子鼠
日期:2014-11-13 09:51:26未羊
日期:2014-08-28 18:13:36技術(shù)圖書徽章
日期:2014-02-21 09:30:15酉雞
日期:2014-01-14 11:12:49天蝎座
日期:2013-12-09 17:56:53平安夜徽章
日期:2015-12-26 00:06:30
7 [報告]
發(fā)表于 2014-08-27 18:27 |只看該作者
回復(fù) 6# chosen86
  1. port=re.findall('\.\d+:(\d+?)\)', a)[0].strip()
復(fù)制代碼

論壇徽章:
1
子鼠
日期:2014-08-28 13:27:13
8 [報告]
發(fā)表于 2014-08-27 18:30 |只看該作者
HH106 發(fā)表于 2014-08-27 18:27
回復(fù) 6# chosen86

thx,剛才漏了最后的text

論壇徽章:
1
子鼠
日期:2014-08-28 13:27:13
9 [報告]
發(fā)表于 2014-08-27 19:11 |只看該作者
HH106 發(fā)表于 2014-08-27 18:27
回復(fù) 6# chosen86


[14/Jul/2014:15:45:00 CST] [1939478272] 10.6.99.163 test1 "" ACLDENY - - - (10.6.99.163:62691 -> www.baidu.com:80) (Pre authorization failed)
文本里也有像上邊的這樣的行,如果端口號前邊是URL,這個還適用嗎?好像有點問題

論壇徽章:
0
10 [報告]
發(fā)表于 2014-08-28 01:42 |只看該作者
本帖最后由 tianzhizhengdao 于 2014-08-28 01:57 編輯

回復(fù) 9# chosen86

可以用這個:
     port = re.findall(':(\d+)\)', s)
這個跟前面是IP Address 還是URL沒關(guān)系,只要端口前面有‘:’, 后面有‘)’就都能匹配到,無論端口是幾位幾位也都可以。

PS: 個人感覺你這個完全可以考慮直接按照特征split每一行然后簡單replace或切片得到所有想要的值啊。

   
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP