亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 5597 | 回復(fù): 7
打印 上一主題 下一主題

[文本處理] 【求助】三個文本處理的問題 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2013-08-14 18:20 |只看該作者 |倒序瀏覽
本人初學(xué)這門課,遇到很多問題搞不懂,希望各位大神給與解答~~

【Q1】如何實現(xiàn)文本中刪除指定的字符?
例如:
        xxx -c aeiou xx.txt #刪除txt中所有的a,e,i,o,u

【Q2】uniq刪除的都是比較單純的重復(fù)行或者是忽略幾個字符

但是如何把:
        in what I said! "Twaddle!", you say? I'll have you know
        "Twaddle!", you say? I'll have you know
        there's a deep truth
        in what I said! there's a deep truth
變成:
        "Twaddle!", you say? I'll have you know
        in what I said! there's a deep truth
菜鳥表示完全沒有思路、、

【Q3】在忽略大小寫的情況下如何檢查并輸出拼寫錯誤的詞匯
我記得unix下有個online-dictionary但是真不知道怎麼用、
例’:        Im not
        certin
        mouses
        or
        catsll
        pass
        fael

輸出:
        Im certin
        mouses catsll
        fael

論壇徽章:
6
摩羯座
日期:2013-08-24 10:43:10獅子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午馬
日期:2014-09-28 16:06:0015-16賽季CBA聯(lián)賽之八一
日期:2016-12-19 13:55:0515-16賽季CBA聯(lián)賽之天津
日期:2016-12-20 14:01:23
2 [報告]
發(fā)表于 2013-08-14 18:29 |只看該作者
q1
  1. $ echo "xxx -c aeiou xx.txt" | tr -d 'uoiea'
  2. xxx -c  xx.txt
復(fù)制代碼
q2 沒看懂

Q3 首先要有字典,對文件中的每個單詞在字典中檢索,檢索不到輸出。

論壇徽章:
0
3 [報告]
發(fā)表于 2013-08-14 18:55 |只看該作者
【Q1】
如果要求必須按照: sh xxx -c aeiou filename 這種形式來執(zhí)行,那么在shell script xxx中應(yīng)該怎麼寫呢?

【Q2】
是我自己突發(fā)奇想,我也不知道能不能實現(xiàn)。
大意:第n行是第m行的一部分,那么就保留m行,刪除第n行

【Q3】
字典是個什么樣的文件?如果我找到了應(yīng)該怎麼調(diào)用呢?

非常感謝之前的解答回復(fù) 2# cao627


   

論壇徽章:
0
4 [報告]
發(fā)表于 2013-08-14 19:09 |只看該作者
回復(fù) 2# cao627
第二題應(yīng)該是這樣的,刪除第一次匹配的行,匹配到 in what I said! 和  there's a deep truth


   

論壇徽章:
0
5 [報告]
發(fā)表于 2013-08-14 19:16 |只看該作者
我看到了一個題目要求去除重復(fù)
in what I said!
"Twaddle!", you say? I'll have you know
"Twaddle!", you say? I'll have you know
there's a deep truth
in what I said!
there's a deep truth

執(zhí)行后:
"Twaddle!", you say? I'll have you know
in what I said!
there's a deep truth

為什麼我執(zhí)行后是?
in what I said!
there's a deep truth
"Twaddle!", you say? I'll have you know

我用的:  cat filename | sort -d -u
spiraspera 發(fā)表于 2013-08-14 19:09
回復(fù) 2# cao627
第二題應(yīng)該是這樣的,刪除第一次匹配的行,匹配到 in what I said! 和  there's a deep t ...

論壇徽章:
6
摩羯座
日期:2013-08-24 10:43:10獅子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午馬
日期:2014-09-28 16:06:0015-16賽季CBA聯(lián)賽之八一
日期:2016-12-19 13:55:0515-16賽季CBA聯(lián)賽之天津
日期:2016-12-20 14:01:23
6 [報告]
發(fā)表于 2013-08-14 21:02 |只看該作者
【Q2】
是我自己突發(fā)奇想,我也不知道能不能實現(xiàn)。
大意:第n行是第m行的一部分,那么就保留m行,刪除第n行
但是如何把:
        in what I said! "Twaddle!", you say? I'll have you know
        "Twaddle!", you say? I'll have you know
        there's a deep truth
        in what I said! there's a deep truth
變成:
        "Twaddle!", you say? I'll have you know
        in what I said! there's a deep truth
菜鳥表示完全沒有思路、

"Twaddle!", you say? I'll have you know 怎么沒有刪除? 它不是in what I said! "Twaddle!", you say? I'll have you know的一部分嗎?
  1. $ awk '{a[NR]=$0;b[NR]=$0}END{for(i=1;i<=NR;i++)for(j=1;j<=NR;j++)if(i!=j && index(b[j],a[i])){delete a[i];break};for(i in a)print a[i]}' file
  2. in what I said! there's a deep truth
  3. in what I said! "Twaddle!", you say? I'll have you know
復(fù)制代碼
【Q3】
字典是個什么樣的文件?如果我找到了應(yīng)該怎麼調(diào)用呢?

字典就是你要求的所有合法單詞的集合。

論壇徽章:
0
7 [報告]
發(fā)表于 2013-08-15 12:19 |只看該作者
我看到了一個題目要求去除重復(fù)
in what I said!
"Twaddle!", you say? I'll have you know
"Twaddle!", you say? I'll have you know
there's a deep truth
in what I said!
there's a deep truth

執(zhí)行后:
"Twaddle!", you say? I'll have you know
in what I said!
there's a deep truth

為什麼我執(zhí)行后是?
in what I said!
there's a deep truth
"Twaddle!", you say? I'll have you know

我用的:  cat filename | sort -d -u
回復(fù) 6# cao627


   

論壇徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年紀(jì)念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役紀(jì)念章
日期:2022-04-24 14:33:24
8 [報告]
發(fā)表于 2013-08-16 10:35 |只看該作者
回復(fù) 7# ICrazyBox


因為那個題目的作者用了一種比較愚蠢的方法:
  1. awk '{a[$0]++}END{for(i in a)if(a[i]>1)print i}' urfile
復(fù)制代碼
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP