亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

Chinaunix

標(biāo)題: perl 如何查找兩個(gè)文件中有相同字段的行然后按其中一個(gè)文件格式輸出? [打印本頁(yè)]

作者: elaine2017    時(shí)間: 2018-05-09 14:52
標(biāo)題: perl 如何查找兩個(gè)文件中有相同字段的行然后按其中一個(gè)文件格式輸出?
比如說(shuō)現(xiàn)在有兩個(gè)文件(都是以制表符分隔):
1.txt(有4列)
aaa 111 TTTTT 1234
bbb 111 AAAA 2345

2.txt(有10多列)
aaa 12 111 TTTT asb ajhs asja 1234
ccc 14 134 AAAA asg jjjs asjk 1278
bbb 21 111 AAAA ash kkka aksk 2345

最后輸出結(jié)果:
aaa 12 111 TTTT asb ajhs asja 1234
bbb 21 111 AAAA ash kkka aksk 2345

就是說(shuō)文件1中的1、2、3、4列是對(duì)應(yīng)文件2中的1、3、4、8列,由于排列順序不一樣,沒(méi)辦法把文件1作為哈希來(lái)處理

作者: kk861123    時(shí)間: 2018-05-19 16:22
tricky一點(diǎn),你可以直接把文件1的四列直接作為hash的key,處理了文件2時(shí)單獨(dú)取出對(duì)應(yīng)的列組成key值在前面的hash里去查找。這樣一般沒(méi)什么問(wèn)題,當(dāng)然取決于你的數(shù)據(jù)。
嚴(yán)謹(jǐn)一點(diǎn),你就把文件1創(chuàng)建為多重hash,例如$hash{aaa}{111}{TTTTT}{1234},這樣文件2查詢時(shí)會(huì)稍微復(fù)雜點(diǎn)
作者: 523066680    時(shí)間: 2018-05-19 17:31
本帖最后由 523066680 于 2018-05-19 17:36 編輯

1.txt(有4列)
aaa 111 TTTTT 1234

2.txt(有10多列)
aaa 12 111 TTTT asb ajhs asja 1234

5個(gè)T 和 4個(gè)T ?示例內(nèi)容是不是有錯(cuò)?

假設(shè)都是四個(gè)T吧,如果數(shù)據(jù)量不大,可以用拆分后用正則去匹配對(duì)應(yīng)的行并列出。

  1. use File::Slurp;
  2. STDOUT->autoflush(1);

  3. my @src_a = read_file( "a.txt" );
  4. my $str_b = read_file( "b.txt" );

  5. for my $a ( @src_a )
  6. {
  7.     $a=~s/\n//;
  8.     my @g = split( /\s/, $a );

  9.     if ( $str_b =~/(^|\n)($g[0].*?$g[1].*?$g[2].*?$g[3].*?)(\n|$)/ )
  10.     {
  11.         print $2, "\n";
  12.     }
  13. }
復(fù)制代碼







歡迎光臨 Chinaunix (http://www.72891.cn/) Powered by Discuz! X3.2