亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
樓主: _lpq
打印 上一主題 下一主題

[文本處理] 怎么不獲取(或跳過)重復(fù)的字符串 [復(fù)制鏈接]

論壇徽章:
1
15-16賽季CBA聯(lián)賽之廣夏
日期:2016-04-12 15:53:16
11 [報(bào)告]
發(fā)表于 2016-03-08 14:14 |只看該作者
回復(fù) 9# jason680


    hi jason 謝謝你解決了我的問題
我以為我可以解決我這個(gè)問題

!但是發(fā)現(xiàn)我不能單純的用awk -F,
1.
例如這句:
[104][14Jan16 12:13:51.500] [abc]  hgdf.350.1.djcn: cds-[cds:350-gsd] red cfd.350.1 cdf succed guass, cds3:sdj7

跟這個(gè)類似
d,g,j,l,l
s,f,o,k,l
z,r,y,j,k
d,v,n,k,r
q,f,h,k,j 這一行為f和k都在上一行的同一個(gè)位置,因?yàn)樵谠谏弦恍兄幸呀?jīng)獲取了k這個(gè)關(guān)鍵字,所以這個(gè)k就不獲。ɑ蛱^)
a,f,j,r,o

因?yàn)槲乙氖菑囊粋(gè)文件中通過查找到有guass的行,然后在截取cds3,且cds3不能只能獲取一次
我自己是這樣寫的,
grep "guass" "${log_path}" | while read line
do
echo ${line} | cut -d, -f2 | cut -c2-9 >> "CN.csv"
sort -u "CN.csv"
done
要運(yùn)行三秒,太慢了。。。

2.那查找的行提取信息隨后刪除呢?

謝謝哈~


   

論壇徽章:
145
技術(shù)圖書徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11獅子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龍
日期:2014-01-08 15:26:12技術(shù)圖書徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
12 [報(bào)告]
發(fā)表于 2016-03-08 15:01 |只看該作者
回復(fù) 11# _lpq

問問題,基本三個(gè)重點(diǎn)
1. Input Data 輸入數(shù)據(jù)

2. Procedure (程序)處理過程
  如果是程序出問題,別直接問程序出問題....
而是要讓大家知道,我要讓A(Input)變成B(Output)(或從A中取出B)
你沒寫"讓A變成B(或從A中取出B)",你的程序得到C(正常,因?yàn)槟愕某绦蛘=Y(jié)果就會(huì)得到C)
一你直說有問題,有問題(你要得到B,但沒寫出來)----沒人知道你要什么...

最好也把你這么做的用意是什么也寫出來...
問者:要找XX路201號(hào)...(結(jié)果沒這號(hào))...
沒人答 (沒人知道XX路201號(hào))
問者:買鞋,要去YYY店XX路201號(hào)...
答者:YYY店在XX路102號(hào)...(號(hào)錯(cuò)了)
答者:YYY店在WW路201號(hào)...(路錯(cuò)了)
答者:ZZ鞋店 檔次高


3. Output Data 輸出數(shù)據(jù)(期望結(jié)果)
    依"輸入數(shù)據(jù)"及"處理過程",最后你要給出你期望結(jié)果...
   

論壇徽章:
1
15-16賽季CBA聯(lián)賽之廣夏
日期:2016-04-12 15:53:16
13 [報(bào)告]
發(fā)表于 2016-03-08 16:21 |只看該作者
回復(fù) 12# jason680


        我錯(cuò)了。。。。
好,現(xiàn)在說下我遇到的問題
1. file
[104][14Jan16 12:13:51.500] [abc]  hgdf.343.1.djcn: cds-[cds:350-gsd] red cfd.350.1 cdf succed guass, cds3:sdj7
[104][14Jan16 12:13:54.500] [abc]  hgdf.350.1.djcn: cds-[cds:350-gsd] red cfd.350.1 cdf succed sef, cds3:sdj7
[104][14Jan16 12:13:51.546] [abc]  hgdf.365.1.djcn: cds-[cds:350-gsd] red cfd.350.1 cdf succed guass, cds3:sdj7
[104][14Jan16 12:13:12.500] [abc]  hgdf.231.1.djcn:
[104][14Jan16 12:13:51.500] [abc]  hgdf.789.1.djcn: cds-[cds:350-gsd] red
[104][14Jan16 12:13:51.234] [abc]  hgdf.390.1.djcn: cds-[cds:350-gsd] red cfd.350.1 cdf succed sef,fdr5:hyf6
[104][14Jan16 12:13:01.500] [abc]  hgdf.453.1.djcn: cds-[cds:350-gsd] red cfd.350.1 cdf succed
[104][14Jan16 12:13:23.500] [abc]  hgdf.350.1.djcn: cds-[cds:350-gsd] red cfd.350.1 cdf succed sef, cds3:sdj7
[104][14Jan16 12:13:65.500] [abc]  hgdf.645.1.djcn: cds-[cds:350-gsd] red cfd.350.1 cdf succed sef, fers3:654

因?yàn)槲乙氖菑囊粋(gè)文件中通過查找到有sef的行,然后在截取cds3,且cds3只能獲取一次

最后的結(jié)果:
cds3
fdr5
fers3

2.截取完之后能否把所有有sef的行刪除呢?

thanks

論壇徽章:
145
技術(shù)圖書徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11獅子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龍
日期:2014-01-08 15:26:12技術(shù)圖書徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
14 [報(bào)告]
發(fā)表于 2016-03-09 09:21 |只看該作者
本帖最后由 jason680 于 2016-03-09 09:33 編輯

回復(fù) 13# _lpq


... cdf succed sef, cds3:sdj7
... cdf succed sef,fdr5:hyf6
... cdf succed sef, cds3:sdj7
... cdf succed sef, fers3:654

思路:
1. 找出共通點(diǎn)/固定格式
  sef,xxxx:
  注:可能有(半角)空格

2. 正則
  A  正則  xxxx ( : )  ==> [^:]+
    sef,xxxx:    ==>   sef,[^:]+:
  B 捕獲 加 (....)
    sef,[^:]+:  ==>   sef,([^:]+):
  C   再加可有可無空格
    sef,([^:]+):    ==>  sef, *([^:]+):   


2. awk 去重
$ awk 'match($0,"sef, *([^:]+):",a){print a[1]}' file
cds3
fdr5
cds3
fers3

$ awk 'match($0,"sef, *([^:]+):",a){if(!d[a[1]]++)print a[1]}' file
cds3
fdr5
fers3

   

論壇徽章:
1
15-16賽季CBA聯(lián)賽之廣夏
日期:2016-04-12 15:53:16
15 [報(bào)告]
發(fā)表于 2016-03-09 16:24 |只看該作者
回復(fù) 14# jason680


       hi,jason

我試了,但是報(bào)錯(cuò)。。。

報(bào)錯(cuò)為:     
gawk: cmd. line:1: fatal: match() cannot have 3 arguments

論壇徽章:
145
技術(shù)圖書徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11獅子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龍
日期:2014-01-08 15:26:12技術(shù)圖書徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
16 [報(bào)告]
發(fā)表于 2016-03-09 17:25 |只看該作者
回復(fù) 15# _lpq

awk version issue

$ awk --version
GNU Awk 3.1.8
Copyright (C) 1989, 1991-2010 Free Software Foundation.
....


$ awk -F'[,:]' '/sef/{k=$(NF-1);gsub(/^ +| +$/,"",k);if(!a[k]++)print k}' file
cds3
fdr5
fers3




   

論壇徽章:
1
15-16賽季CBA聯(lián)賽之廣夏
日期:2016-04-12 15:53:16
17 [報(bào)告]
發(fā)表于 2016-03-09 17:56 |只看該作者
回復(fù) 16# jason680

謝謝~

那可以用sed弄出來嗎?麻煩O(∩_∩)O哈!
   

論壇徽章:
145
技術(shù)圖書徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11獅子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龍
日期:2014-01-08 15:26:12技術(shù)圖書徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
18 [報(bào)告]
發(fā)表于 2016-03-10 09:25 |只看該作者
回復(fù) 17# _lpq

sorry, I can't using sed to solve this issue.

but, there is easy way to solve it by perl, as below:

$ perl -lane '{if(m/sef, *([^:]+):/){if(!$h{$1}++){print$1}}}' file
cds3
fdr5
fers3


Note: it's good enough for Unix like OS, ex: AIX, Solaris, ...   

論壇徽章:
1
15-16賽季CBA聯(lián)賽之廣夏
日期:2016-04-12 15:53:16
19 [報(bào)告]
發(fā)表于 2016-03-12 16:14 |只看該作者
回復(fù) 18# jason680


thank you ~

  因?yàn)槿メt(yī)院拔了智齒一直沒上論壇,

謝謝你一直幫助我!

   

論壇徽章:
1
15-16賽季CBA聯(lián)賽之廣夏
日期:2016-04-12 15:53:16
20 [報(bào)告]
發(fā)表于 2016-03-14 10:08 |只看該作者
回復(fù) 18# jason680


    回復(fù) 18# jason680

hi,jason

請教一下,將第三列和第四列相比較,如果第三列與第四列相等,則把第四列賦值為空
file:
d,g,j,l,l
s,f,o,o,l
z,r,y,j,k
d,v,n,n,r
q,f,h,k,j
a,f,j,j,o
s,f,y,i,e

結(jié)果

d,g,j,l,l
s,f,o,l
z,r,y,j,k
d,v,n,,r
q,f,h,k,j
a,f,j,,o
s,f,y,i,e

  thanks
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP