亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫(kù)
12下一頁(yè)
最近訪(fǎng)問(wèn)板塊 發(fā)新帖
查看: 9869 | 回復(fù): 12
打印 上一主題 下一主題

如何用SHELL正確分割CSV文件中的列? [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2009-12-01 19:19 |只看該作者 |倒序?yàn)g覽
好久沒(méi)有搞過(guò)SHELL了,最后在用SHELL處理CSV文件時(shí)遇到一個(gè)問(wèn)題,就是如何正確分割列的問(wèn)題.

如下是SAMPLE數(shù)據(jù):

1,"A","A B","A  C","A,D"

我想將以上SAMPLE數(shù)據(jù)以逗號(hào)分割,得到的結(jié)果如下:

1,
"A",
"A B",
"A  C",
"A,D"

但一直找不到好的方法對(duì)最后一列進(jìn)行正確處理,SHELL始終將A與D間的逗號(hào)也認(rèn)成分割符了,請(qǐng)問(wèn)各位高人如何解決?

論壇徽章:
0
2 [報(bào)告]
發(fā)表于 2009-12-01 20:04 |只看該作者

回復(fù) #1 nees 的帖子

針對(duì)上面的

sed -r 's/",/&\n/g;s/(,)(")/\1\n\2/g'

論壇徽章:
5
2015年辭舊歲徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亞洲杯之朝鮮
日期:2015-03-13 22:47:33IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-01-09 06:20:00IT運(yùn)維版塊每周發(fā)帖之星
日期:2016-03-07 16:27:44
3 [報(bào)告]
發(fā)表于 2009-12-01 20:26 |只看該作者
sed 's/,"/,\n"/g'

論壇徽章:
0
4 [報(bào)告]
發(fā)表于 2009-12-01 20:41 |只看該作者
這個(gè)問(wèn)題好難。我只能用awk來(lái)解,而且解得蠻復(fù)雜的。
處理過(guò)程如下:
1. 確定本列長(zhǎng)度大于0;將本列存到s1,并在最后補(bǔ)上一個(gè)","
2. 如果s1的長(zhǎng)度大于0:
3. 如果s1第一個(gè)字元是引號(hào)("),則去掉第一個(gè)字元,找到分隔符號(hào)(",),輸出此欄,并自s1中刪除此欄位資料(含結(jié)尾的",)
4. 如果s1第一個(gè)字元不是引號(hào)("),則找到分隔符號(hào)(,),輸出此欄,并自s1中刪除此欄位資料(含結(jié)尾的,)
5. 再回到步驟2

awk script如下(假設(shè)存在擋案tmp1.awk):
length($0) > 0 {
  s1 = $0 ",";
  while (length(s1) > 0) {
    c1 = substr(s1, 1, 1);
    if (c1 == "\"") {
      sub(/\"/, "", s1);
      i1 = index(s1, "\",");
      print "\"" substr(s1, 1, i1);
      sub(/^[^\"]*\",/, "", s1);
    } else {
      i1 = index(s1, ",");
      print substr(s1, 1, i1-1);
      sub(/^[^,]*,/, "", s1);
    }
  }
}

以樓主的sample來(lái)執(zhí)行及結(jié)果:
$ echo '1,"A","A B","A  C","A,D"' | awk -f tmp1.awk
1
"A"
"A B"
"A  C"
"A,D"

 

[ 本帖最后由 czcjinu 于 2009-12-1 20:46 編輯 ]

論壇徽章:
5
2015年辭舊歲徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亞洲杯之朝鮮
日期:2015-03-13 22:47:33IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-01-09 06:20:00IT運(yùn)維版塊每周發(fā)帖之星
日期:2016-03-07 16:27:44
5 [報(bào)告]
發(fā)表于 2009-12-01 20:48 |只看該作者
引號(hào)內(nèi)外問(wèn)題,用sed也可以。

shell版有很多這種例子。

論壇徽章:
0
6 [報(bào)告]
發(fā)表于 2009-12-02 08:58 |只看該作者
perl -ne 's/,/,\n/g;print' file

論壇徽章:
0
7 [報(bào)告]
發(fā)表于 2009-12-02 09:52 |只看該作者
  1. awk 'BEGIN{FS=OFS=""}{for (i=1;i<=NF;i++) {if ($i=="\"") T=!T;if (T&&$i==",") $i="@@##"}}1' file >file1
  2. awk -F, '{for (i=1;i<=NF;i++) gsub(/@@##/,",",$i)} {urcmd...}' file1
復(fù)制代碼

[ 本帖最后由 ywlscpl 于 2009-12-2 10:31 編輯 ]

論壇徽章:
5
2015年辭舊歲徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亞洲杯之朝鮮
日期:2015-03-13 22:47:33IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-01-09 06:20:00IT運(yùn)維版塊每周發(fā)帖之星
日期:2016-03-07 16:27:44
8 [報(bào)告]
發(fā)表于 2009-12-02 10:00 |只看該作者

回復(fù) #7 ywlscpl 的帖子

如果字段以""包圍(LZ的字段有些是沒(méi)有""包圍),用awk也不用這么復(fù)雜吧。
  1. awk -F '","' -v OFS='"\n"' '{$1=$1;print}'
復(fù)制代碼

論壇徽章:
5
2015年辭舊歲徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亞洲杯之朝鮮
日期:2015-03-13 22:47:33IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-01-09 06:20:00IT運(yùn)維版塊每周發(fā)帖之星
日期:2016-03-07 16:27:44
9 [報(bào)告]
發(fā)表于 2009-12-02 10:09 |只看該作者
try
echo 'foo,bar,"1,2,3","A","A B","E,F","A  C","A,D"'|awk -F \" -v OFS=\" '{for(i=1;i<=NF;i=i+2) gsub(/,/,"\n",$i);print}'
foo
bar
"1,2,3"
"A"
"A B"
"E,F"
"A  C"
"A,D"

論壇徽章:
0
10 [報(bào)告]
發(fā)表于 2009-12-02 10:21 |只看該作者

回復(fù) #8 blackold 的帖子

只是恰好舉了個(gè)全帶" "包圍的例子
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專(zhuān)區(qū)
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過(guò)ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP