亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

Chinaunix

標題: 求助,找出不同文件中同樣信息 [打印本頁]

作者: anber45    時間: 2009-12-06 18:21
標題: 求助,找出不同文件中同樣信息
f1.txt
801217 008613885959179 4442 801042 10669160 145101 21000
819247 008613688595742 4442 819021 10658139 100002 21000
801225 008613985267010 4442 801005 10668888 102109 21000
819247 008613688595742 4442 819021 10658139 100002 21000
819247 008615186128981 4442 819013 10663223 164112 21000
801225 008613984088269 4442 801011 10666666 170101 21000
801225 008615885919166 4442 801005 10668888 102109 21000

f2.txt
801217 008613985959179 4442 801042 10669160 145201 21000
819247 008613788595742 4442 819021 10658139 101002 21000
801225 008613985267010 4442 801005 10668888 102109 21000
819247 008613688595742 4442 819021 10658139 100002 21000
819247 008615386128981 4442 819013 10663223 164112 21000
801225 008615885919166 4442 801005 10668888 102109 21000

f1.txt 和 f2.txt中相同的記錄是:
801225 008613985267010 4442 801005 10668888 102109 21000
801225 008615885919166 4442 801005 10668888 102109 21000

6個域,每個都一樣的時候才能認為相同的記錄。
每個文件可能有20萬條記錄,有什么好方法快速得到結果?

謝謝!
作者: nhw_cs    時間: 2009-12-06 19:54
sort f1.txt f2.txt|uniq -d
作者: ljs_darkfish    時間: 2009-12-06 20:26
其實應該先
sort f1.txt | uniq > test1
sort f2.txt | uniq > test2
sort test1 test2 | uniq -d

要不然f1中有重復記錄而f2沒有,直接用
sort f1.txt f2.txt | uniq 就會顯示出來……
作者: yyt030    時間: 2009-12-06 21:39
comm -12 file1 file2
作者: Shell_HAT    時間: 2009-12-06 21:49
  1. fgrep -f f1.txt f2.txt
復制代碼

作者: Shell_HAT    時間: 2009-12-06 21:50
819247 008613688595742 4442 819021 10658139 100002 21000
這樣也屬于相同的記錄吧,樓主?
作者: beginner-bj    時間: 2009-12-06 22:40
之前,waker有個hash算法的帖子,處理這樣的問題,應該效率比較高。




歡迎光臨 Chinaunix (http://www.72891.cn/) Powered by Discuz! X3.2