亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

Chinaunix

標(biāo)題: python:判斷一個字符串是否是URL [打印本頁]

作者: chosen86    時間: 2014-09-03 15:57
標(biāo)題: python:判斷一個字符串是否是URL
07/Aug/2014:15:36:32     10.6.99.74     cyjtest   124.160.136.240
07/Aug/2014:15:36:32     10.6.99.74     cyjtest    124.160.136.250
07/Aug/2014:15:36:59     10.6.99.74     cyjtest     www.baidu.com
07/Aug/2014:15:37:00     10.6.99.74     cyjtest     sports.sina.com.cn
包含很多行上述行的文本text1.txt:
Python code:

fr = open (r'text1.txt','r')
fw = open(r'text2.txt','w+')
for text in fr:
    li = text.split(' ')
    if li[3].......:
       fw.write(text)
fr.close()
fw.close()

想判斷l(xiāng)i[3]是不是URL,如果是就寫入新文件,不是(即IP)就不寫入,請問省略號部分怎么寫?謝謝
作者: huangxiaohen    時間: 2014-09-03 16:02
我覺得你可以按.分割一下字符串,然后判斷每部分是否在字母集合里,如果在那就說明是個地址,  if li[3].split('.')[0] in string.letters:XXXX
作者: chosen86    時間: 2014-09-03 16:26
huangxiaohen 發(fā)表于 2014-09-03 16:02
我覺得你可以按.分割一下字符串,然后判斷每部分是否在字母集合里,如果在那就說明是個地址,  if li[3].spl ...

字母集合怎么用,python小白,
fr = open (r'text1.txt','r')
fw = open(r'text2.txt','w+')
for text in fr:
    li = text.split(' ')
    tf = re.match(/^(http://){0,1}[A-Za-z0-9][A-Za-z0-9\-\.]+[A-Za-z0-9]\.[A-Za-z]{2,}[\43-\176]*$/,li[3])
    if tf:
       fw.write(text)
fr.close()
fw.close()
這樣可以嗎?
作者: Linux_manne    時間: 2014-09-03 16:26
你要嚴(yán)格的話 url 就用re 去匹配
作者: huangxiaohen    時間: 2014-09-03 16:35
不用那么麻煩,string.letters  就是所有大小寫字母集合了. 導(dǎo)入個string模塊
作者: q1208c    時間: 2014-09-03 16:54
不知道樓主所說的 "URL" 判斷標(biāo)準(zhǔn)是啥?

有 http ftp 開頭?
域名?
有 .html ?
有 /.../... 這樣 ?

在我看來, 樓主 列出來的文件中的四個都可以算做是 URL, 至少, 丟到IE下能可能被訪問.
作者: chosen86    時間: 2014-09-03 16:54
huangxiaohen 發(fā)表于 2014-09-03 16:35
不用那么麻煩,string.letters  就是所有大小寫字母集合了. 導(dǎo)入個string模塊

好的,我試試,謝謝!
作者: zhwei228    時間: 2014-09-04 09:14
我也是初學(xué)者,我是這么寫的
import re
p=re.compile('\D')
f=open('hello.txt','r')
fw=open('12.txt','w+')
for i in f.readlines():
    i=i.split()
    if p.match(i[3]):
        fw.write(i[3])
f.close()
fw.close()
作者: chosen86    時間: 2014-09-04 10:49
回復(fù) 8# zhwei228
恩,謝謝!

   




歡迎光臨 Chinaunix (http://www.72891.cn/) Powered by Discuz! X3.2