亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫
12下一頁
最近訪問板塊 發(fā)新帖
查看: 4435 | 回復(fù): 12
打印 上一主題 下一主題

[文本處理] (在線等)對文本進(jìn)行awk處理,結(jié)果保留 制表符 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2016-05-05 13:25 |只看該作者 |倒序?yàn)g覽
本帖最后由 haofang666777 于 2016-05-05 13:49 編輯

我的初始文本如下 (如圖1)

PZ1-01-1425609646.328        3        40000002000                1425609704        1425609748        44        2008                xx                2015-03-06 02:42:28.973+00
PZ1-01-1426480458.1418        3        40000002000                1426480501        1426480520        19        2233                xxx                2015-03-16 04:35:20.207+00

文本中兩個(gè)字符之間有多個(gè)制表符 tab

我使用awk 進(jìn)行批處理

處理后tab 全部轉(zhuǎn)化為了空格,并且多個(gè)連續(xù)的tab也轉(zhuǎn)化為一個(gè)空格 如圖2

有什么方式 可以把我這里的第三個(gè)域 即4000000 轉(zhuǎn)化為 3000818并且保留原有的格式,也就是tab呢。并且tab個(gè)數(shù)保持一致

QQ截圖20160505132032.png (11.57 KB, 下載次數(shù): 52)

QQ截圖20160505132032.png

QQ截圖20160505132412.png (10.57 KB, 下載次數(shù): 47)

QQ截圖20160505132412.png

論壇徽章:
54
2015亞冠之德黑蘭石油
日期:2015-07-07 13:00:1615-16賽季CBA聯(lián)賽之深圳
日期:2016-03-31 09:03:5415-16賽季CBA聯(lián)賽之遼寧
日期:2016-05-09 20:38:15程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-05-12 06:20:0015-16賽季CBA聯(lián)賽之四川
日期:2016-05-13 15:19:4715-16賽季CBA聯(lián)賽之福建
日期:2016-05-15 20:24:34每日論壇發(fā)貼之星
日期:2016-05-16 06:20:0015-16賽季CBA聯(lián)賽之吉林
日期:2016-05-26 11:49:4715-16賽季CBA聯(lián)賽之廣東
日期:2016-05-26 13:49:18極客徽章
日期:2016-12-07 14:05:2315-16賽季CBA聯(lián)賽之廣夏
日期:2016-12-20 17:33:532017金雞報(bào)曉
日期:2017-01-10 15:19:56
2 [報(bào)告]
發(fā)表于 2016-05-05 13:28 |只看該作者
  1. awk '{sub($3,3000818)}1'
復(fù)制代碼

論壇徽章:
145
技術(shù)圖書徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11獅子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龍
日期:2014-01-08 15:26:12技術(shù)圖書徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
3 [報(bào)告]
發(fā)表于 2016-05-05 13:30 |只看該作者
回復(fù) 1# haofang666777

  1. $ cat FILE
  2. PZ1-01-1425609646.328        3        4000000        1425609704        1425609748        44        2008        xx        2015-03-06        02:42:28.973+00
  3. PZ1-01-1426480458.1418        3        4000000        1426480501        1426480520        19        2233        xxx        2015-03-16        04:35:20.207+00

  4. $ awk 'BEGIN{FS=OFS="\t"}{$3=3000818}1' FILE
  5. PZ1-01-1425609646.328        3        3000818        1425609704        1425609748        44        2008        xx        2015-03-06        02:42:28.973+00
  6. PZ1-01-1426480458.1418        3        3000818        1426480501        1426480520        19        2233        xxx        2015-03-16        04:35:20.207+00
復(fù)制代碼



   

論壇徽章:
0
4 [報(bào)告]
發(fā)表于 2016-05-05 13:31 |只看該作者
本帖最后由 haofang666777 于 2016-05-05 13:34 編輯
jason680 發(fā)表于 2016-05-05 13:30
回復(fù) 1# haofang666777



如果是 40000002000 替換為 3008182000呢

也就是 4000000之后可能有其他字符 要進(jìn)行字符替換

論壇徽章:
28
15-16賽季CBA聯(lián)賽之八一
日期:2016-02-22 19:10:4215-16賽季CBA聯(lián)賽之深圳
日期:2016-12-01 10:34:0415-16賽季CBA聯(lián)賽之新疆
日期:2016-12-07 10:24:2915-16賽季CBA聯(lián)賽之同曦
日期:2016-12-15 12:06:43CU十四周年紀(jì)念徽章
日期:2016-12-18 13:03:4415-16賽季CBA聯(lián)賽之吉林
日期:2017-01-03 15:52:2515-16賽季CBA聯(lián)賽之遼寧
日期:2017-01-04 14:58:2415-16賽季CBA聯(lián)賽之遼寧
日期:2017-01-15 09:42:512016科比退役紀(jì)念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16賽季CBA聯(lián)賽之上海
日期:2017-03-18 10:14:5415-16賽季CBA聯(lián)賽之青島
日期:2017-03-18 22:00:44
5 [報(bào)告]
發(fā)表于 2016-05-05 13:35 |只看該作者
本帖最后由 moperyblue 于 2016-05-05 13:45 編輯
  1. sed -r 's/((\S+\s+){2})4000000(.*)/\13000818\3/'
復(fù)制代碼

論壇徽章:
0
6 [報(bào)告]
發(fā)表于 2016-05-05 13:37 |只看該作者
awk 'BEGIN{FS=OFS="\t"}1gsub(4000000,3000818,$3)' /tmp/investigation_record.txt  > /home/ec2-user/investigation_record_replace.txt  這個(gè)樣子可以 不知道是否可行。。。。。

論壇徽章:
4
程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-10-14 06:20:00每日論壇發(fā)貼之星
日期:2015-10-14 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-05-02 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-05-08 06:20:00
7 [報(bào)告]
發(fā)表于 2016-05-05 14:07 |只看該作者
本帖最后由 mswsg 于 2016-05-05 17:59 編輯

我怎么看到多了2000  ?
  1. __author__ = 'shengwei ma'
  2. __author_email__ = 'shengweima@icloud.com'
  3. import re
  4. with open('1.txt', 'r') as f:
  5.     for line in f.readlines():
  6.         line = line.strip().split()
  7.         if '4000000' in line[2]:
  8.             new = re.sub('4000000', '3000818', line[2])
  9.             print('\t'.join(line[:2]) + '\t' + new, '\t'.join(line[3:]))
復(fù)制代碼
結(jié)果
  PZ1-01-1425609646.328        3        30008182000 1425609704        1425609748        44        2008        xx        2015-03-06        02:42:28.973+00
PZ1-01-1426480458.1418        3        30008182000 1426480501        1426480520        19        2233        xxx        2015-03-16        04:35:20.207+0

論壇徽章:
307
程序設(shè)計(jì)版塊每周發(fā)帖之星
日期:2016-04-08 00:41:33操作系統(tǒng)版塊每日發(fā)帖之星
日期:2015-09-02 06:20:00每日論壇發(fā)貼之星
日期:2015-09-02 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-04 06:20:00每日論壇發(fā)貼之星
日期:2015-09-04 06:20:00每周論壇發(fā)貼之星
日期:2015-09-06 22:22:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-09 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-19 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-20 06:20:00每日論壇發(fā)貼之星
日期:2015-09-20 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-22 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-24 06:20:00
8 [報(bào)告]
發(fā)表于 2016-05-05 14:15 |只看該作者
本帖最后由 sunzhiguolu 于 2016-05-05 14:16 編輯
  1. perl -anle '$"="\t";substr($F[2],0)=3000818;print "@F"' f
  2. PZ1-01-1425609646.328   3       3000818 1425609704      1425609748      44      2008    xx      2015-03-06      02:42:28.973+00
  3. PZ1-01-1426480458.1418  3       3000818 1426480501      1426480520      19      2233    xxx     2015-03-16      04:35:20.207+00
復(fù)制代碼

論壇徽章:
307
程序設(shè)計(jì)版塊每周發(fā)帖之星
日期:2016-04-08 00:41:33操作系統(tǒng)版塊每日發(fā)帖之星
日期:2015-09-02 06:20:00每日論壇發(fā)貼之星
日期:2015-09-02 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-04 06:20:00每日論壇發(fā)貼之星
日期:2015-09-04 06:20:00每周論壇發(fā)貼之星
日期:2015-09-06 22:22:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-09 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-19 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-20 06:20:00每日論壇發(fā)貼之星
日期:2015-09-20 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-22 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-24 06:20:00
9 [報(bào)告]
發(fā)表于 2016-05-05 14:23 |只看該作者
回復(fù) 3# jason680
大神您那個(gè)在進(jìn)行輸出的時(shí)候分隔符為啥好好的, 我的進(jìn)行輸出的時(shí)候咋不行呢. 還請您指點(diǎn), 謝謝...

   

論壇徽章:
28
15-16賽季CBA聯(lián)賽之八一
日期:2016-02-22 19:10:4215-16賽季CBA聯(lián)賽之深圳
日期:2016-12-01 10:34:0415-16賽季CBA聯(lián)賽之新疆
日期:2016-12-07 10:24:2915-16賽季CBA聯(lián)賽之同曦
日期:2016-12-15 12:06:43CU十四周年紀(jì)念徽章
日期:2016-12-18 13:03:4415-16賽季CBA聯(lián)賽之吉林
日期:2017-01-03 15:52:2515-16賽季CBA聯(lián)賽之遼寧
日期:2017-01-04 14:58:2415-16賽季CBA聯(lián)賽之遼寧
日期:2017-01-15 09:42:512016科比退役紀(jì)念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16賽季CBA聯(lián)賽之上海
日期:2017-03-18 10:14:5415-16賽季CBA聯(lián)賽之青島
日期:2017-03-18 22:00:44
10 [報(bào)告]
發(fā)表于 2016-05-05 14:23 |只看該作者
本帖最后由 moperyblue 于 2016-05-05 14:37 編輯
  1. cat -A file
  2. PZ1-01-1425609646.328^I3^I40000002000^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I1425609704^I^I^I^I^I^I^I^I1425609748^I^I^I^I^I^I^I^I44^I^I^I^I^I^I^I^I2008^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I^Ixx^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I2015-03-06^I02:42:28.973+00$
  3. PZ1-01-1426480458.1418^I3^I4000000^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I1426480501^I^I^I^I^I^I^I^I1426480520^I^I^I^I^I^I^I^I19^I^I^I^I^I^I^I^I2233^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I^Ixxx^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I2015-03-16^I04:35:20.207+00$

  4. sed -r 's/((\S+\s+){2})4000000(.*)/\13000818\3/' file|cat -A
  5. PZ1-01-1425609646.328^I3^I30008182000^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I1425609704^I^I^I^I^I^I^I^I1425609748^I^I^I^I^I^I^I^I44^I^I^I^I^I^I^I^I2008^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I^Ixx^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I2015-03-06^I02:42:28.973+00$
  6. PZ1-01-1426480458.1418^I3^I3000818^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I1426480501^I^I^I^I^I^I^I^I1426480520^I^I^I^I^I^I^I^I19^I^I^I^I^I^I^I^I2233^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I^Ixxx^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I^I2015-03-16^I04:35:20.207+00$
復(fù)制代碼
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP