亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

Chinaunix

標(biāo)題: shell [打印本頁(yè)]

作者: biobaby    時(shí)間: 2018-11-13 12:10
標(biāo)題: shell
求助:

現(xiàn)有文件file.txt 內(nèi)容為坐標(biāo)位置信息, 第二列為起始,第三列為終止, 第四列為距離。
現(xiàn)在想要統(tǒng)計(jì)每一個(gè)基因(第五列)的總長(zhǎng)度,不同行之間第二列 第三列有重疊的部分, 如果只是單純把第四列相加則有些位置計(jì)算了多次,不能達(dá)到目的。

所以 想請(qǐng)教各位幫忙解決一下,謝謝!
chrX        106893170        106894256        1087        ENSG00000147224.6
chrX        106893170        106893531        362        ENSG00000147224.6
chrX        106893170        106893480        311        ENSG00000147224.6
chrX        106871737        106871980        244        ENSG00000147224.6
chrX        106884132        106884354        223        ENSG00000147224.6
chrX        106871760        106871980        221        ENSG00000147224.6
chrX        106871793        106871980        188        ENSG00000147224.6
chrX        106882525        106882708        184        ENSG00000147224.6
chrX        106888407        106888580        174        ENSG00000147224.6
chrX        106893320        106893487        168        ENSG00000147224.6
chrX        106890836        106890995        160        ENSG00000147224.6
chrX        106885596        106885720        125        ENSG00000147224.6
chrX        106871858        106871980        123        ENSG00000147224.6
chrX        106882588        106882708        121        ENSG00000147224.6
chrX        106893170        106893270        101        ENSG00000147224.6
chrX        106884132        106884230        99        ENSG00000147224.6
chrX        106871745        106871786        42        ENSG00000147224.6
chr12        25357723        25362845        5123        ENSG00000133703.7
chr12        25386753        25388160        1408        ENSG00000133703.7
chr12        25362102        25362845        744        ENSG00000133703.7
chr12        25362365        25362845        481        ENSG00000133703.7
chr12        25403685        25403870        186        ENSG00000133703.7
chr12        25403685        25403865        181        ENSG00000133703.7
chr12        25380168        25380346        179        ENSG00000133703.7
chr12        25403698        25403863        166        ENSG00000133703.7
chr12        25378548        25378707        160        ENSG00000133703.7
chr12        25368371        25368494        124        ENSG00000133703.7
chr12        25398208        25398329        122        ENSG00000133703.7
chr12        25403685        25403737        53        ENSG00000133703.7




作者: cfwyy    時(shí)間: 2018-11-13 15:57
總長(zhǎng)度是如何定義的呢?  最大的終止坐標(biāo) - 最小的起始坐標(biāo)+1?
作者: wh7211    時(shí)間: 2018-11-14 17:50
本帖最后由 wh7211 于 2018-11-14 17:52 編輯

回復(fù) 1# biobaby


  1. awk '{a[$5]=a[$5]&&a[$5]<$2?a[$5]:$2;b[$5]=b[$5]>$3?b[$5]:$3}END{for(i in a){print i,b[i]-a[i]+1}}' file.txt
  2. ENSG00000147224.6 22520
  3. ENSG00000133703.7 46148
復(fù)制代碼





歡迎光臨 Chinaunix (http://www.72891.cn/) Powered by Discuz! X3.2