亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫(kù)
最近訪問板塊 發(fā)新帖
查看: 3621 | 回復(fù): 9
打印 上一主題 下一主題

交叉比對(duì),取最大的,求思路或者程序。 [復(fù)制鏈接]

論壇徽章:
3
2015亞冠之武里南聯(lián)
日期:2015-07-29 12:14:352015年亞冠紀(jì)念徽章
日期:2015-08-12 14:28:272015亞冠之德黑蘭石油
日期:2015-09-09 17:15:52
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2015-09-01 11:30 |只看該作者 |倒序?yàn)g覽
有兩個(gè)輸入 :

file1:::::gene_list.txt
PEX19
NDUFS2

file2:::::NM.txt
NM_015840        ADAR        15        3603
NM_001111        ADAR        15        3681
NM_001193495        ADAR        14        2796
NM_001025107        ADAR        14        2796
NM_002857        PEX19        8        900
NR_036493        PEX19        1        2
NR_036492        PEX19        1        2
NM_001193644        PEX19        8        840
NM_004550        NDUFS2        14        1392
NM_001166159        NDUFS2        13        1374
NM_020435        GJC2        1        1320

NM中第二列(ADAR)在gene_list存在,比如PEX19有四個(gè)符合的,
NM_002857        PEX19        8        900
NR_036493        PEX19        1        2
NR_036492        PEX19        1        2
NM_001193644        PEX19        8        840
第三列取最大的,此處是8,有兩個(gè),取第四行最大的900,
print OUT NM_002857        PEX19        8        900;

我正在寫程序,但是寫的好復(fù)雜,請(qǐng)問各位大神,能提示一下么!

論壇徽章:
8
技術(shù)圖書徽章
日期:2013-09-30 08:51:28技術(shù)圖書徽章
日期:2013-12-11 09:26:39白羊座
日期:2013-12-27 15:27:13金牛座
日期:2014-01-06 09:13:05天蝎座
日期:2014-01-21 14:23:28酉雞
日期:2014-05-09 16:51:12卯兔
日期:2014-08-11 16:49:1515-16賽季CBA聯(lián)賽之八一
日期:2017-08-14 23:24:57
2 [報(bào)告]
發(fā)表于 2015-09-01 12:11 |只看該作者
本帖最后由 xiumu2280 于 2015-09-01 12:16 編輯

簡(jiǎn)單的寫了一下,本質(zhì)應(yīng)該是個(gè)排序問題,用了引用

這樣的寫法應(yīng)該可以找到每個(gè)基因?qū)?yīng)的數(shù)值最大條目

后續(xù)還需要你自己更改一下
  1. use strict;
  2. use warnings;
  3. use Data::Dumper;
  4. use File::Basename;


  5. my %hash;

  6. while (<DATA>) {
  7.         chomp;
  8.         my @data = split /\s+/,my $line = $_;
  9.         if ($hash{$data[1]}) {
  10.                 if (($data[2] == $hash{$data[1]}->[2] && $data[3] > $hash{$data[1]}->[3]) || $data[2] > $hash{$data[1]}->[2]) {
  11.                         $hash{$data[1]} = \@data;
  12.                 }
  13.         }else{
  14.                 $hash{$data[1]} = \@data;
  15.         }
  16.        
  17. }


  18. print Dumper \%hash;


  19. __DATA__
  20. NM_015840        ADAR        15        3603
  21. NM_001111        ADAR        15        3681
  22. NM_001193495        ADAR        14        2796
  23. NM_001025107        ADAR        14        2796
  24. NM_002857        PEX19        8        900
  25. NR_036493        PEX19        1        2
  26. NR_036492        PEX19        1        2
  27. NM_001193644        PEX19        8        840
  28. NM_004550        NDUFS2        14        1392
  29. NM_001166159        NDUFS2        13        1374
  30. NM_020435        GJC2        1        1320
復(fù)制代碼

論壇徽章:
95
程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-05 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-17 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-18 06:20:002015亞冠之阿爾艾因
日期:2015-09-18 10:35:08月度論壇發(fā)貼之星
日期:2015-09-30 22:25:002015亞冠之阿爾沙巴布
日期:2015-10-03 08:57:39程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-10-05 06:20:00每日論壇發(fā)貼之星
日期:2015-10-05 06:20:002015年亞冠紀(jì)念徽章
日期:2015-10-06 10:06:482015亞冠之塔什干棉農(nóng)
日期:2015-10-19 19:43:35程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-10-21 06:20:00每日論壇發(fā)貼之星
日期:2015-09-14 06:20:00
3 [報(bào)告]
發(fā)表于 2015-09-01 12:30 |只看該作者
回復(fù) 1# 54red


    把你的代碼貼上來看看

論壇徽章:
145
技術(shù)圖書徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11獅子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龍
日期:2014-01-08 15:26:12技術(shù)圖書徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
4 [報(bào)告]
發(fā)表于 2015-09-01 12:54 |只看該作者
回復(fù) 1# 54red

>>...求思路

先讀取file2,第二列當(dāng)key,保存最大值,就好了...

第一筆,沒有key資料(新資料),直接(最大值)保存
NM_015840        ADAR        15        3603
key: ADAR   
$gene{'ADAR'} = [( NM_015840        ADAR        15        3603 )]   # 思路,非程序代碼

下一筆,先比第三列,再比第四列
NM_015840        ADAR        15      3683
key: ADAR   
$gene{'ADAR'} = [( NM_015840        ADAR        15        3683 )]   # 思路,非程序代碼
保存最大值


再讀取file1,依key值讀取(最大值)
$gene{'PEX19'} <--- 保存最大值

論壇徽章:
3
2015亞冠之武里南聯(lián)
日期:2015-07-29 12:14:352015年亞冠紀(jì)念徽章
日期:2015-08-12 14:28:272015亞冠之德黑蘭石油
日期:2015-09-09 17:15:52
5 [報(bào)告]
發(fā)表于 2015-09-01 13:12 |只看該作者
十分謝謝!我一直在看你的代碼學(xué)習(xí)perl,可是引用這塊始終沒學(xué)好,再次謝謝!回復(fù) 2# xiumu2280


   

論壇徽章:
3
2015亞冠之武里南聯(lián)
日期:2015-07-29 12:14:352015年亞冠紀(jì)念徽章
日期:2015-08-12 14:28:272015亞冠之德黑蘭石油
日期:2015-09-09 17:15:52
6 [報(bào)告]
發(fā)表于 2015-09-01 13:15 |只看該作者
謝謝jason680大神的思路,還把關(guān)鍵的引用怎么寫都給我寫好了 ^^回復(fù) 4# jason680


   

論壇徽章:
0
7 [報(bào)告]
發(fā)表于 2015-09-01 14:54 |只看該作者

  1. my @genelist = qw/PEX19 NDUFS2/;
  2. my %gene = map { $_, 1 } @genelist;
  3. my %nm;

  4. while (<DATA>) {
  5.     my ( undef, $key, $v1, $v2 ) = split;
  6.     next unless $gene{$key};

  7.     if ( exists $nm{$key} ) {
  8.         next if $v1 < $nm{$key}[0];

  9.         if ( $v1 > $nm{$key}[0] or $v2 > $nm{$key}[1] ) {
  10.             $nm{$key} = [ $v1, $v2, $_ ];
  11.         }
  12.     }
  13.     else {
  14.         $nm{$key} = [ $v1, $v2, $_ ];
  15.     }
  16. }

  17. print $_->[2] for values %nm;

  18. __DATA__
  19. NM_015840        ADAR        15        3603
  20. NM_001111        ADAR        15        3681
  21. NM_001193495        ADAR        14        2796
  22. NM_001025107        ADAR        14        2796
  23. NM_002857        PEX19        8        900
  24. NR_036493        PEX19        1        2
  25. NR_036492        PEX19        1        2
  26. NM_001193644        PEX19        8        840
  27. NM_004550        NDUFS2        14        1392
  28. NM_001166159        NDUFS2        13        1374
  29. NM_020435        GJC2        1        1320
復(fù)制代碼

論壇徽章:
3
2015亞冠之武里南聯(lián)
日期:2015-07-29 12:14:352015年亞冠紀(jì)念徽章
日期:2015-08-12 14:28:272015亞冠之德黑蘭石油
日期:2015-09-09 17:15:52
8 [報(bào)告]
發(fā)表于 2015-09-01 17:34 |只看該作者
剛剛看見你的程序,謝謝啦!今天下班了,明天再仔細(xì)看看 ~回復(fù) 7# ba_du_co


   

論壇徽章:
307
程序設(shè)計(jì)版塊每周發(fā)帖之星
日期:2016-04-08 00:41:33操作系統(tǒng)版塊每日發(fā)帖之星
日期:2015-09-02 06:20:00每日論壇發(fā)貼之星
日期:2015-09-02 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-04 06:20:00每日論壇發(fā)貼之星
日期:2015-09-04 06:20:00每周論壇發(fā)貼之星
日期:2015-09-06 22:22:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-09 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-19 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-20 06:20:00每日論壇發(fā)貼之星
日期:2015-09-20 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-22 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-09-24 06:20:00
9 [報(bào)告]
發(fā)表于 2016-03-08 01:45 |只看該作者
其實(shí)你的問題在于不要將解決問題的思路放在細(xì)節(jié), 從整體看待這個(gè)問題就相對(duì)好解決一些.

論壇徽章:
6
15-16賽季CBA聯(lián)賽之新疆
日期:2016-03-22 22:34:5915-16賽季CBA聯(lián)賽之山東
日期:2016-04-11 09:08:41程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-06-28 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-07-19 06:20:00每日論壇發(fā)貼之星
日期:2016-07-19 06:20:0015-16賽季CBA聯(lián)賽之青島
日期:2016-07-20 22:44:17
10 [報(bào)告]
發(fā)表于 2016-03-09 00:56 |只看該作者
my @genelist = qw/PEX19 NDUFS2/;
my %gene = map { $_, 1 } @genelist;

while (<DATA>) {
    my ( undef, $key, $v1, $v2 ) = split;
    next unless $gene{$key};
    $OUT->{$key}->{$v1 * 1000000 + $v2} = $_;
}
map {
  print $OUT->{$_}->{(sort {$b<=>$a} keys %{$OUT->{$_}})[0]} ;
}sort keys %$OUT;

__DATA__
NM_015840        ADAR        15        3603
NM_001111        ADAR        15        3681
NM_001193495        ADAR        14        2796
NM_001025107        ADAR        14        2796
NM_002857        PEX19        8        900
NR_036493        PEX19        1        2
NR_036492        PEX19        1        2
NM_001193644        PEX19        8        840
NM_004550        NDUFS2        14        1392
NM_001166159        NDUFS2        13        1374
NM_020435        GJC2        1        1320


$> perl test.pl
NM_004550        NDUFS2        14        1392
NM_002857        PEX19        8        900

評(píng)分

參與人數(shù) 1信譽(yù)積分 +10 收起 理由
54red + 10 很給力!

查看全部評(píng)分

您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP