亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 2329 | 回復: 4
打印 上一主題 下一主題

抽取信息進行統(tǒng)計 [復制鏈接]

論壇徽章:
2
2015年亞洲杯之沙特阿拉伯
日期:2015-03-27 17:28:472015年亞洲杯之韓國
日期:2015-03-27 22:34:22
跳轉到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2016-08-20 21:04 |只看該作者 |倒序瀏覽
假如有3個文本:A1.txt
                     A2.txt
                     A3.txt
格式一樣(列以tab分隔),如下:

      A1.txt                                     A2.txt                                  A3.txt

ID    group    o                         ID    group    o                       ID    group    o
11    s k        sd                        1      aa1      222                    3      a b       dwd
12    aa1       34                        2      aa1      dd                      2      s k       222
12    a b        bb                        1      a b      111                    
13    a b        eee


提取每個文本中group列的類別信息并計數,生成文件第一列名稱“group”,后幾列是文本前綴,并且按名稱排序“A1 A2 A3”,列之間以tab分隔:

group    A1    A2    A3

s k        1       0      1
aa1       1       2       0
a b        2       1       1



用哈?梢詫崿F(xiàn)嗎?

首先提取各個文本的統(tǒng)計信息,存成哈希,
第二步對生成文本的表頭排序:sort {$a cmp $b} keys %datas)
這個思路如何?

論壇徽章:
307
程序設計版塊每周發(fā)帖之星
日期:2016-04-08 00:41:33操作系統(tǒng)版塊每日發(fā)帖之星
日期:2015-09-02 06:20:00每日論壇發(fā)貼之星
日期:2015-09-02 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-04 06:20:00每日論壇發(fā)貼之星
日期:2015-09-04 06:20:00每周論壇發(fā)貼之星
日期:2015-09-06 22:22:00程序設計版塊每日發(fā)帖之星
日期:2015-09-09 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-19 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-20 06:20:00每日論壇發(fā)貼之星
日期:2015-09-20 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-22 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-24 06:20:00
2 [報告]
發(fā)表于 2016-08-21 01:22 |只看該作者
本帖最后由 sunzhiguolu 于 2016-08-21 01:37 編輯
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. my ($offset, $idx, $last) = (-1, 0, "");
  5. my (%grpMap, %grpCnt, @aTh, @aData);

  6. while (<>){
  7.     next if (/\A\s*ID/);
  8.     if ($last ne $ARGV){
  9.         $last = $ARGV;
  10.         %grpCnt = ();
  11.         $offset++;
  12.     }
  13.     my @aCols = split;
  14.     my $group = @aCols > 3 ? "@aCols[1, 2]" : $aCols[1];
  15.     if (!exists $grpMap{$group}){
  16.         $grpMap{$group} = $idx++;
  17.         push (@aTh, $group);
  18.     }
  19.     my $index = $grpMap{$group};
  20.     $aData[$index][$offset] = ++$grpCnt{$group};
  21. }

  22. print join ("\t", qw /group A1 A2 A3/), "\n";
  23. while (my ($gID, $gName) = each @aTh){
  24.     $aData[$gID][$offset] = $aData[$gID][$offset] // 0;
  25.     my @aT = map {defined ? $_ : 0} @{$aData[$gID]};
  26.     print join ("\t", $gName, @aT), "\n";
  27. }
復制代碼
perl abc.pl a1.txt a2.txt a3.txt
----------------------------------------------------------------------
group   A1      A2      A3
s k     1       0       1
aa1     1       2       0
a b     2       1       1

論壇徽章:
95
程序設計版塊每日發(fā)帖之星
日期:2015-09-05 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-17 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-18 06:20:002015亞冠之阿爾艾因
日期:2015-09-18 10:35:08月度論壇發(fā)貼之星
日期:2015-09-30 22:25:002015亞冠之阿爾沙巴布
日期:2015-10-03 08:57:39程序設計版塊每日發(fā)帖之星
日期:2015-10-05 06:20:00每日論壇發(fā)貼之星
日期:2015-10-05 06:20:002015年亞冠紀念徽章
日期:2015-10-06 10:06:482015亞冠之塔什干棉農
日期:2015-10-19 19:43:35程序設計版塊每日發(fā)帖之星
日期:2015-10-21 06:20:00每日論壇發(fā)貼之星
日期:2015-09-14 06:20:00
3 [報告]
發(fā)表于 2016-08-21 21:32 |只看該作者
  1. #!/usr/bin/perl

  2. use strict;
  3. use warnings;

  4. use v5.14;
  5. use autodie;
  6. use Data::Dumper;

  7. sub load_data {
  8.   local @ARGV = @_;

  9.   my (%records, %groups);
  10.   while (<>) {
  11.     next if /^ID/;

  12.     my $group = (split)[1];
  13.     $records{$ARGV}->{$group} += 1;
  14.     $groups{$group} = 1;
  15.   }

  16.   return (\%records, \%groups);
  17. }

  18. ###

  19. my @files = @ARGV;
  20. my ($records, $groups) = load_data @files;

  21. print Dumper($records);

  22. say join("\t", 'group', map { s/\.txt//r } @files);

  23. foreach my $group (sort keys %$groups) {
  24.   say join("\t", $group, map { $_->{$group} // 0 } @{$records}{@files});
  25. }
復制代碼

論壇徽章:
0
4 [報告]
發(fā)表于 2016-08-24 22:56 |只看該作者
本帖最后由 華小飛_Perl 于 2016-08-25 20:16 編輯
  1. #!/usr/bin/perl

  2. use warnings;
  3. use strict;
  4. use YAML;

  5. my (@calculation, @allstring);
  6. my @copy = my @filebak = grep { s/(\S+)\.txt/$1/ } @ARGV;

  7. foreach my $file (@ARGV) {
  8.         open DATA, '<', $file.'.txt' or die "Can't open the file $file: $!";
  9.         my $string_cal;                # autovivification
  10.         my $filename = shift @filebak;       
  11.         while (<DATA>) {
  12.                 chomp;
  13.                 next if (/^ID/);               
  14.                 my $catch = (split /\t+/)[1];
  15.                 $string_cal->{$filename}{$catch}++;
  16.         }       
  17.         push @calculation, $string_cal;
  18.         push @allstring, keys %{ $string_cal->{$filename} };
  19. }

  20. for my $hash_ref (@calculation) {
  21.         my $name = shift @copy;
  22.         for (@allstring) {
  23.                 $hash_ref->{$name}{$_} = 0 unless ( exists $hash_ref->{$name}{$_} );
  24.         }
  25. }

  26. print Dump( \@calculation );
復制代碼

僅供參考~

論壇徽章:
6
15-16賽季CBA聯(lián)賽之新疆
日期:2016-03-22 22:34:5915-16賽季CBA聯(lián)賽之山東
日期:2016-04-11 09:08:41程序設計版塊每日發(fā)帖之星
日期:2016-06-28 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-19 06:20:00每日論壇發(fā)貼之星
日期:2016-07-19 06:20:0015-16賽季CBA聯(lián)賽之青島
日期:2016-07-20 22:44:17
5 [報告]
發(fā)表于 2016-08-25 02:48 |只看該作者
$>  perl aa.pl A?.txt
group   A1      A2      A3
s k     1       0       1
aa1     1       2       0
a b     2       1       1


aa.pl:

while (<>)
{
  next if (/group/);
my $Key  = $ARGV =~ s/.txt//r;
my ($group) = /\t(.+?)\t/;
$Keys->{$Key} ++;
$OUT->{$group}->{$Key} ++;
}


printf "group\t%s\n", join "\t",sort keys %$Keys;
for $G (reverse sort keys %$OUT)
{
  print "$G";
  printf "\t%d", $OUT->{$G}->{$_} for (sort keys %$Keys);
  print "\n";
}
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術有限公司. 版權所有 京ICP備16024965號-6 北京市公安局海淀分局網監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關心和支持過ChinaUnix的朋友們 轉載本站內容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP