亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
12
最近訪問板塊 發(fā)新帖
樓主: volwang
打印 上一主題 下一主題

[文本處理] 匹配每行的第二列,只輸出第一次匹配行 [復制鏈接]

論壇徽章:
2
2015年亞洲杯之巴勒斯坦
日期:2015-02-15 12:11:292015年辭舊歲徽章
日期:2015-03-03 16:54:15
11 [報告]
發(fā)表于 2015-02-15 12:31 |只看該作者
回復 4# volwang


    量大有啥區(qū)別?這個解決很完美!

論壇徽章:
1
2015年辭舊歲徽章
日期:2015-03-03 16:54:15
12 [報告]
發(fā)表于 2015-02-16 18:27 |只看該作者
本帖最后由 volwang 于 2015-02-16 18:32 編輯

文本有20萬行。
akw只處理一部分文本就退出。awk沒有處理全部文本。

回復 11# yyt030


   

論壇徽章:
780
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉雞
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥豬
日期:2014-04-22 16:13:09獅子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53處女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
13 [報告]
發(fā)表于 2015-02-16 18:48 |只看該作者
回復 12# volwang

1樓的數(shù)據(jù)和你的真實數(shù)據(jù)差距很大?
否則25W行好像可以處理啊。。。
   

論壇徽章:
1
2015年辭舊歲徽章
日期:2015-03-03 16:54:15
14 [報告]
發(fā)表于 2015-02-16 18:52 |只看該作者
稍微有點差距。20w行,8列。
awk處理一部分。
20w行中第二列中有不少重復的。需要輸出第一個,后續(xù)相同的不輸出。

回復 13# Herowinter


   

論壇徽章:
1
2015年辭舊歲徽章
日期:2015-03-03 16:54:15
15 [報告]
發(fā)表于 2015-02-16 19:01 |只看該作者
你好。過節(jié)好。
awk我試過了,少量行可以處理,行20萬就不行了。
如果我把這個文件命為log,用for循環(huán)遍歷每一行第二列。
第一次出現(xiàn)的寫到log2中,后續(xù)循環(huán)中,判斷l(xiāng)og2中是否含有相同字符,無則輸出到log2。
不知道這樣可行?
最后得到log2,則為輸出。

回復 13# Herowinter


   

論壇徽章:
1
2015年辭舊歲徽章
日期:2015-03-03 16:54:15
16 [報告]
發(fā)表于 2015-02-16 19:36 |只看該作者
原輸入文件為log;輸出文件為log2。

rm -rf log2
touch log2
for i in `cat log |awk '{print $2 }' `
do
aa=`cat log2 | grep $i `
if  [ ! -z "$aa" ] ; then
echo "have"
else
cat log |grep $i |head -1 >> log2
fi
done

這樣可否

回復 13# Herowinter


   

論壇徽章:
0
17 [報告]
發(fā)表于 2015-02-17 11:09 |只看該作者
用python建立一個數(shù)組,然后try一下就好了
沒有就輸出,有就忽略


回復 1# volwang


   

論壇徽章:
145
技術圖書徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11獅子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龍
日期:2014-01-08 15:26:12技術圖書徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
18 [報告]
發(fā)表于 2015-02-17 15:18 |只看該作者
回復 14# volwang

Try this way if your awk can't work properly

$ perl -lane '{print if(!$h{$F[1]}++)}' FILE
qq sss.1  ww dd  rr  ee  tt yyy  
qq sss.2  ww dd  rr  ee  tt yyy
qq sss.3  ww dd  rr  ey  tt yyy
qq sss.x1  ww dr  ur  te  wt yyy

論壇徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:56:11
19 [報告]
發(fā)表于 2015-02-27 15:43 |只看該作者
先把第二列重復的字符串找出來
然后對每個這樣的字符串找出其行號
如果能找出所有非第一次出現(xiàn)的行號
刪去這些行即可
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP