亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫(kù)
12下一頁(yè)
最近訪問(wèn)板塊 發(fā)新帖
查看: 9505 | 回復(fù): 17
打印 上一主題 下一主題

文本處理,取最大值和最小值 [復(fù)制鏈接]

論壇徽章:
8
雙子座
日期:2013-08-31 07:37:12金牛座
日期:2013-09-09 18:49:12處女座
日期:2013-09-23 11:43:14處女座
日期:2013-10-09 19:48:21獅子座
日期:2014-03-24 18:22:12丑牛
日期:2014-04-22 22:07:51申猴
日期:2014-06-12 21:54:13雙魚(yú)座
日期:2014-06-13 21:52:31
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2013-09-30 21:55 |只看該作者 |倒序?yàn)g覽
shell一題,
有一個(gè)文件里面內(nèi)容如下:

111        16644211        348795021
111        16644211        348795368
111        16644211        348797001
111        16644211        348797826
111        22443489        348795333
111        67384560        348795445
111        67384560        348795879
現(xiàn)需要根據(jù)第一二列,統(tǒng)計(jì)它們出現(xiàn)的次數(shù),
以及對(duì)應(yīng)第三列的最小值和最大值,如果只有
一次,則第3列為最小值
統(tǒng)計(jì)結(jié)果如下:

111        16644211    4   348795021   348797826
111        22443489    1   348795333
111        67384560    2   348795445   348795879

去重和計(jì)數(shù)都寫(xiě)好的,就卡在取最大和最小值沒(méi)有思路,請(qǐng)大家?guī)兔?br /> 下面是我的腳本
  1. #!/usr/bin/perl -w

  2. use 5.010;
  3. use strict;
  4. use List::Util qw(max min);

  5. my %h;
  6. my @arr;
  7. my $str;
  8. my $str1;
  9. my $str2;

  10. while (<DATA>) {
  11.     ($str,$str1,$str2) = split;
  12.     $h{$str."\t".$str1}++;

  13. }

  14. for my $k (keys %h) {
  15.     say "$k\t$h{$k}"
  16. }

  17. __DATA__
  18. 111        16644211        348795021
  19. 111        16644211        348795368
  20. 111        16644211        348797001
  21. 111        16644211        348797826
  22. 111        22443489        348795333
  23. 111        67384560        348795445
  24. 111        67384560        348795879
復(fù)制代碼

論壇徽章:
0
2 [報(bào)告]
發(fā)表于 2013-10-01 00:23 |只看該作者
本帖最后由 ulmer 于 2013-10-01 00:26 編輯

回復(fù) 1# kernel69

Simply using reference array/hash => Hash of Array for example:

  1. use strict;
  2. # Load data
  3. my @data =<DATA>;
  4. # Create data structure Hash of Array
  5. my %HoA = ();
  6. foreach my $line (@data) {
  7.     chomp $line;
  8.     # Split columns
  9.     my ($c1, $c2, $c3) = split /\s+/, $line, 3;
  10.     # Column2 as key and column3 as array items to append   
  11.     push @{$HoA{$c2}}, $c3;
  12. }
  13. # Access the data structure
  14. foreach my $key (sort keys %HoA) {
  15.     # derefernce Array in Hash and sort it to get max and min.
  16.     my @ary = sort @{$HoA{$key}};
  17.     # show
  18.     printf ("%s counted %s times, max=%s, min=%s\n",
  19.         $key, scalar(@ary), $ary[-1], $ary[0]);
  20. }

  21. __DATA__
  22. 111        16644211        348795021
  23. 111        16644211        348795368
  24. 111        16644211        348797001
  25. 111        16644211        348797826
  26. 111        22443489        348795333
  27. 111        67384560        348795445
  28. 111        67384560        348795879
復(fù)制代碼
Happy National holiday

論壇徽章:
145
技術(shù)圖書(shū)徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11獅子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龍
日期:2014-01-08 15:26:12技術(shù)圖書(shū)徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
3 [報(bào)告]
發(fā)表于 2013-10-01 10:40 |只看該作者
回復(fù) 1# kernel69

How about this ...

$ perl cnt_min_max.pl
111     16644211        4       348795021       348797826
111     22443489        1       348795333
111     67384560        2       348795445       348795879

$ cat cnt_min_max.pl
use strict;
use warnings;

my %h;
while(<DATA>){

  my ($sKey1,$sKey2,$sValue) = split;
  
  my $sKey = "$sKey1\t$sKey2";
  if( ++$h{$sKey}->{Cnt} == 1){    # Cnt for Count
      $h{$sKey}->{Min} = $sValue;   # Min for Minimum value
      $h{$sKey}->{Max} = $sValue;  # max for maximum value
  }
  else{
    if($h{$sKey}->{Max} < $sValue){
           $h{$sKey}->{Max} = $sValue;  
        }
    if($h{$sKey}->{Min} > $sValue){
           $h{$sKey}->{Min} = $sValue;  
        }
  }
}

my $sOut;
foreach (sort keys %h) {
  $sOut = join("\t", $_, $h{$_}->{Cnt}, $h{$_}->{Min});
  $sOut .= "\t". $h{$_}->{Max} if($h{$_}->{Cnt} != 1);
  print "$sOut\n";
}

__DATA__
111        16644211        348795021
111        16644211        348795368
111        16644211        348797001
111        16644211        348797826
111        22443489        348795333
111        67384560        348795445
111        67384560        348795879

論壇徽章:
8
雙子座
日期:2013-08-31 07:37:12金牛座
日期:2013-09-09 18:49:12處女座
日期:2013-09-23 11:43:14處女座
日期:2013-10-09 19:48:21獅子座
日期:2014-03-24 18:22:12丑牛
日期:2014-04-22 22:07:51申猴
日期:2014-06-12 21:54:13雙魚(yú)座
日期:2014-06-13 21:52:31
4 [報(bào)告]
發(fā)表于 2013-10-01 10:46 |只看該作者
學(xué)習(xí)了,
  1. 哈希當(dāng)數(shù)組
  2. push @{$HoA{$c2}}, $c3;
  3. 最大和最小值
  4. my @ary = sort @{$HoA{$key}};
  5. scalar(@ary), $ary[-1], $ary[0]);
復(fù)制代碼
回復(fù) 2# ulmer


   

論壇徽章:
8
雙子座
日期:2013-08-31 07:37:12金牛座
日期:2013-09-09 18:49:12處女座
日期:2013-09-23 11:43:14處女座
日期:2013-10-09 19:48:21獅子座
日期:2014-03-24 18:22:12丑牛
日期:2014-04-22 22:07:51申猴
日期:2014-06-12 21:54:13雙魚(yú)座
日期:2014-06-13 21:52:31
5 [報(bào)告]
發(fā)表于 2013-10-01 10:51 |只看該作者
完全符合要求
  1. $h{$sKey}->{Cnt}
復(fù)制代碼
這是引用吧,還沒(méi)學(xué),呵呵,表示有點(diǎn)看不懂
回復(fù) 3# jason680


   

論壇徽章:
8
雙子座
日期:2013-08-31 07:37:12金牛座
日期:2013-09-09 18:49:12處女座
日期:2013-09-23 11:43:14處女座
日期:2013-10-09 19:48:21獅子座
日期:2014-03-24 18:22:12丑牛
日期:2014-04-22 22:07:51申猴
日期:2014-06-12 21:54:13雙魚(yú)座
日期:2014-06-13 21:52:31
6 [報(bào)告]
發(fā)表于 2013-10-01 11:01 |只看該作者
本帖最后由 kernel69 于 2013-10-01 11:02 編輯

大牛,能不能解釋一下這一段
  1. if( ++$h{$sKey}->{Cnt} == 1){    # Cnt for Count
  2.       $h{$sKey}->{Min} = $sValue;   # Min for Minimum value
  3.       $h{$sKey}->{Max} = $sValue;  # max for maximum value
  4.   }
復(fù)制代碼
感覺(jué)挺core的,不明覺(jué)厲啊

回復(fù) 3# jason680


   

論壇徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午馬
日期:2014-08-06 03:56:58
7 [報(bào)告]
發(fā)表于 2013-10-01 14:53 |只看該作者
回復(fù) 6# kernel69
我和我的小伙伴們據(jù)估計(jì),憑猜測(cè)
  1.     if( ++$h{$sKey}->{Cnt} == 1){   
  2. # 當(dāng)?shù)谝淮?沒(méi)有 Min 沒(méi)有 Max 的時(shí)候:
  3.           $h{$sKey}->{Min} = $sValue;   
  4. # $sValue 分配給 Min
  5.           $h{$sKey}->{Max} = $sValue;  
  6. # $sValue 分配給 Max
  7.       }
復(fù)制代碼

論壇徽章:
145
技術(shù)圖書(shū)徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11獅子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龍
日期:2014-01-08 15:26:12技術(shù)圖書(shū)徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
8 [報(bào)告]
發(fā)表于 2013-10-01 15:32 |只看該作者
本帖最后由 jason680 于 2013-10-01 15:33 編輯

回復(fù) 7# pitonas


Good answer and thanks !!!   

論壇徽章:
8
雙子座
日期:2013-08-31 07:37:12金牛座
日期:2013-09-09 18:49:12處女座
日期:2013-09-23 11:43:14處女座
日期:2013-10-09 19:48:21獅子座
日期:2014-03-24 18:22:12丑牛
日期:2014-04-22 22:07:51申猴
日期:2014-06-12 21:54:13雙魚(yú)座
日期:2014-06-13 21:52:31
9 [報(bào)告]
發(fā)表于 2013-10-01 16:27 |只看該作者
$h{$sKey}->{Cnt} == 1
這也是創(chuàng)建一個(gè)引用,是嗎?
回復(fù) 7# pitonas


   

論壇徽章:
3
CU十二周年紀(jì)念徽章
日期:2013-10-24 15:41:34子鼠
日期:2013-12-14 14:57:19射手座
日期:2014-04-25 21:23:23
10 [報(bào)告]
發(fā)表于 2013-10-09 09:10 |只看該作者
  1. use strict;
  2. use warnings;
  3. my $h;
  4. map { /(\d+\s+\d+)\s+(\d+)(?{push @{$h->{$1}},$2})/ } <DATA>;
  5. map {
  6.     my ( $min, $max ) = ( sort @{ $h->{$_} } )[ 0, -1 ];
  7.     my $sc = scalar @{ $h->{$_} };
  8.     print "$_\t";
  9.     $sc == 1 ? print "1\t@{$h->{$_}}\n" : print "$sc\t$min\t$max\n"
  10. } keys $h;
  11. __DATA__
  12. 111        16644211        348795021
  13. 111        16644211        348795368
  14. 111        16644211        348797001
  15. 111        16644211        348797826
  16. 111        22443489        348795333
  17. 111        67384560        348795445
  18. 111        67384560        348795879
復(fù)制代碼
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專(zhuān)區(qū)
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過(guò)ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP