亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
12下一頁
最近訪問板塊 發(fā)新帖
查看: 6592 | 回復(fù): 17
打印 上一主題 下一主題

新人求助,請各位大神幫幫忙!。∪f分感謝! [復(fù)制鏈接]

論壇徽章:
1
獅子座
日期:2014-02-25 09:46:33
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2013-10-23 09:53 |只看該作者 |倒序瀏覽
本帖最后由 旋轉(zhuǎn)小馬 于 2013-10-23 11:12 編輯

生物信息中,這是一fastq文檔,每四行是一個循環(huán),現(xiàn)在我要看每個循環(huán)的第二行的堿基“A”或者“T”是否連續(xù)超過40個以上(包括40個),如果是的話,把這整個循環(huán)去掉,最后輸出一個文件,用perl怎樣實現(xiàn)?
@HWI-D00318:33:H166PADXX:2:1101:1337:2089 1:N:0:TAGCTT
AAAAACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
+
CCCFFADFHHHHHJJJJJJJHFDDDDDDDDDDDDDDDDDDBDBDDDDDDDDDBDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD
@HWI-D00318:33:H166PADXX:2:1101:1493:2146 1:N:0:TAGCTT
CAGATACACAGGAGTATTCAAAACCCTGGCAAGTATTGATGACAAACCGTCCCGTTTCGAAATTTTGATACCATTGGTACAAACTTTAGTTCGCGACAAT
+
CCCFFFFFHHHHHJGIJJJJJJJJJJJJJJJJJHIJJJJJJJJJJJJIIGIJJJJIJIJJJJHHHHHFFFFFFFEEEAEEDDDDDDDDDDDEDDDDDDDD
@HWI-D00318:33:H166PADXX:2:1101:1515:2150 1:N:0:TAGCTT
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
+
CCCFFFFFHHHHHJJJHFDDDDDDD8BDD@BDDDDDDDDDDDDDDDDDDDDDDDDDDDBDDDDDDDBDDDDDDDDBBDDDDBDDDDDDDDDDDDDDDDDD
@HWI-D00318:33:H166PADXX:2:1101:1798:2219 1:N:0:TAGCTT
CCTAAAGCCTAAGAGAGCAGGACTCAGGCTGGAGGCCTCTGCCTGGCCAGGATGAGGCTGAGGGCTTGGGGCAAAATTACTACCTGTCCTGATACCTGCA
+
CCCFFFFFHHHHHJJJJJJJJJJJJJJJJJJJJJJJJJJJJIJJJIJJJJJGIJJJJJJJIHHHDFFFDDDDDDDDDDDDDEDDDDDDDDDDDDDDDDDD
@HWI-D00318:33:H166PADXX:2:1101:2167:2087 1:N:0:TAGCTT
GCTGGGATGGGCCTCCAACTCCTCTGACAGGGCCTGCTAATCCAGCAGGAGCCTGGGGAATAGGTACACCTGCTGGCACTCCTCTGCCAGCTGCTCTTCC
+
CCCFFFFFHHHGHJJJJJJJJJIJJJJJJJIJJJJJJJJJJJJJJJJJJJGHJJIJJJJHHHHHBCFFFFEEEEEDDDDDDDDDDCDDDDDDDDDDDDDD
@HWI-D00318:33:H166PADXX:2:1101:2072:2182 1:N:0:TAGCTT
ATGCTGAGCTATCAGGTGTTCAGCCACAGTGGAGTTCTCCCCACTGCCTGTTGCTGTCATCCGGGCCACGTGGTCTACACCGATCCGTTCAGCTTCCTCA
+
CCCFFFFFHHHHHJJJGHIIJJJJJJJJJHIIHIJJJJJJJJJJJIJJJJIJJIJJHIJJJJJJJJHFFFCDDCEDDDDDDDDDDDDDDDDDDDDDDDDD
@HWI-D00318:33:H166PADXX:2:1101:2852:2107 1:N:0:TAGCTT
ATTTTTTTCTTTTTTTTTTTTTTTTACTGTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT
+
@@@DDDDDHHHHHIIIIIIIIIE',((-(5>5<?B339BBBBBBBBBBBB5@BBBBBBBB7@BBBBBB8BB9@@BBBBBB>BB5@BBBBBBBBBBBBBBB
@HWI-D00318:33:H166PADXX:2:1101:4032:2050 1:N:0:TAGCTT
GATAATATCCGGGTAGGCGCAATCACTTTCGTCTACTCCGTTACAAAGCGAGGCTGGGTATTTCCCGGCCTTTCTGTTATCCGAAATCCACTGAAAGCAC
+
CCCFFFFFHHHHHBGHIJJJJJJJJIJJJJJJJJJJJJJJJJJJJJJIJJJJHFFFDDACDEEFEDDDDDDDDDDDEDDEDDDDDDDDDDDDDDDDDDDD

論壇徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午馬
日期:2014-08-06 03:56:58
2 [報告]
發(fā)表于 2013-10-23 12:31 |只看該作者
  1. #!/usr/bin/perl -w

  2. my ( $in, $out ) = ( 'data.txt', 'save.txt' );
  3. open my $I, '<', $in  or die "$in\t$!";
  4. open my $S, '>', $out or die "$out\t$!";

  5. while (<$I>) {
  6.     my $line = <$I>;
  7.     if ( $line =~ /A{40,}/ or $line =~ /T{40,}/ ) { <$I>, <$I> }
  8.     else { print $S $_, $line, <$I> . <$I> }
  9. }

  10. print 'finish';
復(fù)制代碼

論壇徽章:
1
獅子座
日期:2014-02-25 09:46:33
3 [報告]
發(fā)表于 2013-10-23 13:18 |只看該作者
結(jié)果不大對呢,就是在第二行中,若出現(xiàn)連續(xù)的“A”或“T”達(dá)到40或以上的時候,這一個循環(huán)去掉的,這里好像沒實現(xiàn)!回復(fù) 2# pitonas


   

論壇徽章:
3
CU十二周年紀(jì)念徽章
日期:2013-10-24 15:41:34子鼠
日期:2013-12-14 14:57:19射手座
日期:2014-04-25 21:23:23
4 [報告]
發(fā)表于 2013-10-23 13:40 |只看該作者
期望的結(jié)果什么? LZ貼出來{:3_204:}

論壇徽章:
1
獅子座
日期:2014-02-25 09:46:33
5 [報告]
發(fā)表于 2013-10-23 13:54 |只看該作者
我這要是能得出結(jié)果就不求助大家了,上面的文檔4行一循環(huán),如果在每個循環(huán)中的第二行中,若“A”或“T”連續(xù)出現(xiàn)40次以上(包括40次),那么就把這一個循環(huán)去掉,最后輸出剩下的文檔就可以了!回復(fù) 4# mcshell


   

論壇徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午馬
日期:2014-08-06 03:56:58
6 [報告]
發(fā)表于 2013-10-23 13:55 |只看該作者
這是實現(xiàn), 8個循環(huán) -> 5個循環(huán) save.txt
  1. @HWI-D00318:33:H166PADXX:2:1101:1493:2146 1:N:0:TAGCTT
  2. CAGATACACAGGAGTATTCAAAACCCTGGCAAGTATTGATGACAAACCGTCCCGTTTCGAAATTTTGATACCATTGGTACAAACTTTAGTTCGCGACAAT
  3. +
  4. CCCFFFFFHHHHHJGIJJJJJJJJJJJJJJJJJHIJJJJJJJJJJJJIIGIJJJJIJIJJJJHHHHHFFFFFFFEEEAEEDDDDDDDDDDDEDDDDDDDD
  5. @HWI-D00318:33:H166PADXX:2:1101:1798:2219 1:N:0:TAGCTT
  6. CCTAAAGCCTAAGAGAGCAGGACTCAGGCTGGAGGCCTCTGCCTGGCCAGGATGAGGCTGAGGGCTTGGGGCAAAATTACTACCTGTCCTGATACCTGCA
  7. +
  8. CCCFFFFFHHHHHJJJJJJJJJJJJJJJJJJJJJJJJJJJJIJJJIJJJJJGIJJJJJJJIHHHDFFFDDDDDDDDDDDDDEDDDDDDDDDDDDDDDDDD
  9. @HWI-D00318:33:H166PADXX:2:1101:2167:2087 1:N:0:TAGCTT
  10. GCTGGGATGGGCCTCCAACTCCTCTGACAGGGCCTGCTAATCCAGCAGGAGCCTGGGGAATAGGTACACCTGCTGGCACTCCTCTGCCAGCTGCTCTTCC
  11. +
  12. CCCFFFFFHHHGHJJJJJJJJJIJJJJJJJIJJJJJJJJJJJJJJJJJJJGHJJIJJJJHHHHHBCFFFFEEEEEDDDDDDDDDDCDDDDDDDDDDDDDD
  13. @HWI-D00318:33:H166PADXX:2:1101:2072:2182 1:N:0:TAGCTT
  14. ATGCTGAGCTATCAGGTGTTCAGCCACAGTGGAGTTCTCCCCACTGCCTGTTGCTGTCATCCGGGCCACGTGGTCTACACCGATCCGTTCAGCTTCCTCA
  15. +
  16. CCCFFFFFHHHHHJJJGHIIJJJJJJJJJHIIHIJJJJJJJJJJJIJJJJIJJIJJHIJJJJJJJJHFFFCDDCEDDDDDDDDDDDDDDDDDDDDDDDDD
  17. @HWI-D00318:33:H166PADXX:2:1101:4032:2050 1:N:0:TAGCTT
  18. GATAATATCCGGGTAGGCGCAATCACTTTCGTCTACTCCGTTACAAAGCGAGGCTGGGTATTTCCCGGCCTTTCTGTTATCCGAAATCCACTGAAAGCAC
  19. +
  20. CCCFFFFFHHHHHBGHIJJJJJJJJIJJJJJJJJJJJJJJJJJJJJJIJJJJHFFFDDACDEEFEDDDDDDDDDDDEDDEDDDDDDDDDDDDDDDDDDDD
復(fù)制代碼

論壇徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午馬
日期:2014-08-06 03:56:58
7 [報告]
發(fā)表于 2013-10-23 13:57 |只看該作者
代碼LZ貼出來

論壇徽章:
1
獅子座
日期:2014-02-25 09:46:33
8 [報告]
發(fā)表于 2013-10-23 14:02 |只看該作者
納尼???我怎么沒得到這結(jié)果。!回復(fù) 6# pitonas


   

論壇徽章:
1
獅子座
日期:2014-02-25 09:46:33
9 [報告]
發(fā)表于 2013-10-23 14:13 |只看該作者
本帖最后由 旋轉(zhuǎn)小馬 于 2013-10-23 14:15 編輯

  1 #!/usr/bin/perl -w
  2 use strict;
  3 use PerlIO::gzip;
  4 open IN,"1Asel_L2_I010.R1.clean.fastq.gz"or die"Can not open IN.\n";
  5 open OUT,">R1.gz"or die"Can not open endfile.\n";  
  9 while (<IN>){
10         my $line = <IN>;
11         if($line =~/A{40}/ or $line =~/T{40}/){
12         <IN>;
13         <IN>;
14         }else{
15         print OUT $_, $line, <IN> . <IN> }
16 }
17         print 'finish';回復(fù) 7# pitonas


   

論壇徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午馬
日期:2014-08-06 03:56:58
10 [報告]
發(fā)表于 2013-10-23 14:36 |只看該作者
please read doc how to use PerlIO::gzip
http://search.cpan.org/~nwclark/PerlIO-gzip-0.18/gzip.pm
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP