亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫(kù)
12下一頁(yè)
最近訪問(wèn)板塊 發(fā)新帖
查看: 8293 | 回復(fù): 14
打印 上一主題 下一主題

[文本處理] 將文本根據(jù)行數(shù)平均分配行寫(xiě)到相關(guān)文件中 [復(fù)制鏈接]

論壇徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16賽季CBA聯(lián)賽之北京
日期:2016-07-06 15:42:0715-16賽季CBA聯(lián)賽之同曦
日期:2016-06-12 10:38:0915-16賽季CBA聯(lián)賽之佛山
日期:2016-05-27 11:54:56黃金圣斗士
日期:2015-12-02 11:44:35白銀圣斗士
日期:2015-11-25 14:32:43白銀圣斗士
日期:2015-11-23 12:53:352015亞冠之布里斯班獅吼
日期:2015-10-21 16:55:482015亞冠之首爾
日期:2015-09-01 16:46:052015亞冠之德黑蘭石油
日期:2015-08-31 11:39:192015亞冠之薩濟(jì)拖拉機(jī)
日期:2015-08-28 21:06:5315-16賽季CBA聯(lián)賽之廣東
日期:2016-07-12 14:58:53
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2013-09-06 21:07 |只看該作者 |倒序?yàn)g覽
本帖最后由 reyleon 于 2013-09-06 21:57 編輯

有個(gè)文件,數(shù)據(jù)如下:

1
2
3
4
5
6
7
8
9
10

共10行數(shù)據(jù).將這些數(shù)據(jù)進(jìn)行平均分配(有不能平均分配的情況,如下所說(shuō))。

詳細(xì)解析如下:

1. 平均分配到兩個(gè)文件(假設(shè)為a,b)中,則a分5行,b分5行 (注:是按順序分配,就是說(shuō)前5行寫(xiě)到a文件,后5行寫(xiě)到b文件,而不是1在a中,2在b中,3在a中,4在b中這樣,下同....),其內(nèi)容是:
a:
1
2
3
4
5

b:
6
7
8
9
10

2. 平均分配到三個(gè)文件(a,b,c),因?yàn)樾袛?shù)不被3整除,則要求a文件分前4行,b分3行,c分3行,其內(nèi)容是:
a:
1
2
3
4

b:
5
6
7

c:
8
9
10

3. 平均分配到四個(gè)文件(a,b,c,d),同第二點(diǎn),因行數(shù)不被4整除,則a分3行,b分3行,c分2行,d分2行,其內(nèi)容是:
a:
1
2
3

b:
4
5
6

c:
7
8

d:
9
10

4. 平均分配到N個(gè)文件(a,b,c,d....) 這樣子下去...

----------------

注:以上是【文件是偶數(shù)行的情況】,但假如文件行數(shù)是奇數(shù)行,比如是11行,則:

1. 分配到兩個(gè)文件(a,b),則a分6行,b分5行
2. 分配到三個(gè)文件(a,b,c),則a分4行,b分4行,c分3行
3. 分配到四個(gè)文件(a,b,c,d),則a分3行,b分3行,c分3行,d分2行
4. 分配到N個(gè)文件(a,b,c,d...),則............


========================
   話說(shuō)這能寫(xiě)程序么?


論壇徽章:
0
2 [報(bào)告]
發(fā)表于 2013-09-06 21:15 |只看該作者
linux split 命令

  功能說(shuō)明:切割文件。

  語(yǔ)  法:split [--help][--version][-<行數(shù)>][-b <字節(jié)>][-C <字節(jié)>][-l <行數(shù)>][要切割的文件][輸出文件名]

  補(bǔ)充說(shuō)明:split可將文件切成較小的文件,預(yù)設(shè)每1000行會(huì)切成一個(gè)小文件。

  參  數(shù):

  -<行數(shù)>或-l<行數(shù)>  指定每多少行就要切成一個(gè)小文件。

  -b<字節(jié)>  指定每多少字就要切成一個(gè)小文件。支持單位:m,k

  -C<字節(jié)>  與-b參數(shù)類(lèi)似,但切割時(shí)盡量維持每行的完整性。

  --help  顯示幫助。

  --version  顯示版本信息。

  [輸出文件名]  設(shè)置切割后文件的前置文件名,split會(huì)自動(dòng)在前置文件名后再加上編號(hào)。

  使用例子:

  split -b 100m filename

論壇徽章:
10
天蝎座
日期:2013-09-22 22:32:23程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-08-07 06:20:00lufei
日期:2016-06-17 17:38:40程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-06-12 06:20:002016科比退役紀(jì)念章
日期:2016-05-31 15:47:20CU十四周年紀(jì)念徽章
日期:2016-05-27 12:24:562015年亞洲杯之阿曼
日期:2015-05-03 21:01:352015年辭舊歲徽章
日期:2015-03-03 16:54:15天蝎座
日期:2013-10-20 21:05:24程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-08-11 06:20:00
3 [報(bào)告]
發(fā)表于 2013-09-06 22:03 |只看該作者

  1. s=1
  2. split()
  3. {
  4.         lines=$1
  5.         files=$2
  6.         if [[ $lines == 0 || $files == 0 ]]; then
  7.                 exit 0
  8.         fi
  9.         max=$(( $1/$2 ))
  10.         tmp=$(( $max*$files ))
  11.         if [[ $lines != $tmp ]]; then
  12.                 (( max++ ))
  13.         fi
  14.         echo "==========file $files======="
  15.         tmp=$(( $max+$s-1 ))
  16.         seq $s $(( $max+$s-1 ))
  17.         (( lines=$lines-$max ))
  18.         (( files-- ))
  19.         s=$(( tmp+1 ))
  20.         split $lines $files
  21. }

  22. split 11 3
復(fù)制代碼

論壇徽章:
10
天蝎座
日期:2013-09-22 22:32:23程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-08-07 06:20:00lufei
日期:2016-06-17 17:38:40程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-06-12 06:20:002016科比退役紀(jì)念章
日期:2016-05-31 15:47:20CU十四周年紀(jì)念徽章
日期:2016-05-27 12:24:562015年亞洲杯之阿曼
日期:2015-05-03 21:01:352015年辭舊歲徽章
日期:2015-03-03 16:54:15天蝎座
日期:2013-10-20 21:05:24程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-08-11 06:20:00
4 [報(bào)告]
發(fā)表于 2013-09-06 22:13 |只看該作者
n個(gè)分m份,使分的最多的與最小的之間的差最小。是這個(gè)意思么

論壇徽章:
10
天蝎座
日期:2013-09-22 22:32:23程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-08-07 06:20:00lufei
日期:2016-06-17 17:38:40程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-06-12 06:20:002016科比退役紀(jì)念章
日期:2016-05-31 15:47:20CU十四周年紀(jì)念徽章
日期:2016-05-27 12:24:562015年亞洲杯之阿曼
日期:2015-05-03 21:01:352015年辭舊歲徽章
日期:2015-03-03 16:54:15天蝎座
日期:2013-10-20 21:05:24程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-08-11 06:20:00
5 [報(bào)告]
發(fā)表于 2013-09-06 22:40 |只看該作者
本帖最后由 liion631818 于 2013-09-06 22:54 編輯

前面的太復(fù)雜了,耗時(shí)

  1.         s=1
  2.         increment=1
  3.         lines=$1
  4.         files=$2
  5.         if [[ $lines == 0 || $files == 0 ]]; then
  6.                 exit 0
  7.         fi
  8.         avg=$(( $1/$2 ))
  9.         off=$(( $lines-$avg*$files ))
  10.        
  11.         for i in `eval echo {1..$files}`; do
  12.                 if [[ $off -eq 0 ]]; then
  13.                         increment=0
  14.                 fi
  15.                 echo "==========file $i======="
  16.                 seq $s $(( s+avg+increment-1 ))
  17.                 s=$(( s+avg+increment-0 ))
  18.                 (( off-- ))
  19.         done
復(fù)制代碼

論壇徽章:
0
6 [報(bào)告]
發(fā)表于 2013-09-06 23:04 |只看該作者
回復(fù) 1# reyleon


   
11 個(gè)數(shù)據(jù) 分到5個(gè)里面 怎么分法  

論壇徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16賽季CBA聯(lián)賽之北京
日期:2016-07-06 15:42:0715-16賽季CBA聯(lián)賽之同曦
日期:2016-06-12 10:38:0915-16賽季CBA聯(lián)賽之佛山
日期:2016-05-27 11:54:56黃金圣斗士
日期:2015-12-02 11:44:35白銀圣斗士
日期:2015-11-25 14:32:43白銀圣斗士
日期:2015-11-23 12:53:352015亞冠之布里斯班獅吼
日期:2015-10-21 16:55:482015亞冠之首爾
日期:2015-09-01 16:46:052015亞冠之德黑蘭石油
日期:2015-08-31 11:39:192015亞冠之薩濟(jì)拖拉機(jī)
日期:2015-08-28 21:06:5315-16賽季CBA聯(lián)賽之廣東
日期:2016-07-12 14:58:53
7 [報(bào)告]
發(fā)表于 2013-09-07 00:00 |只看該作者
回復(fù) 6# yaozhibing41001


就是平均分配啊,11行的數(shù)據(jù)分成5個(gè)文件,假設(shè)是a,b,c,d,e,行數(shù)依次為: 3,2,2,2,2

a為:
1
2
3

b:
4
5

c:
6
7

d:
8
9

e:
10
11

11行分為6個(gè)文件的話則為:a,b,e,d,e,f ,行數(shù)依次為:2,2,2,2,2,1.

論壇徽章:
39
辰龍
日期:2013-08-21 15:45:192015亞冠之廣州富力
日期:2015-05-12 16:34:52亥豬
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17雙魚(yú)座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亞冠之卡爾希納薩夫
日期:2015-05-24 15:24:35黃金圣斗士
日期:2015-12-02 17:25:0815-16賽季CBA聯(lián)賽之吉林
日期:2017-06-24 16:43:52
8 [報(bào)告]
發(fā)表于 2013-09-07 00:29 |只看該作者
本帖最后由 關(guān)陰月飛 于 2013-09-07 00:47 編輯

回復(fù) 1# reyleon

應(yīng)該是這個(gè)意思:
  1. [root@ test]#seq 11 >urifle
  2. [root@ test]#a="a b c"
  3. [root@ test]#echo $a |awk 'FNR==NR{a[NR]=$0;nr=NR;next}{n=split($0,b);for(i=1;i<=n;i++){c[i]=int(nr/n)+c[i-1];if(i<=nr%n)c[i]++;for(j=1;j<=nr;j++)if(j>k&&j<=c[i])print a[j]" to "b[i];k=c[i];print ""}}' urfile -
  4. 1 to a
  5. 2 to a
  6. 3 to a
  7. 4 to a

  8. 5 to b
  9. 6 to b
  10. 7 to b
  11. 8 to b

  12. 9 to c
  13. 10 to c
  14. 11 to c

  15. [root@ test]#seq 10 >urifle
  16. [root@ test]#echo $a |awk 'FNR==NR{a[NR]=$0;nr=NR;next}{n=split($0,b);for(i=1;i<=n;i++){c[i]=int(nr/n)+c[i-1];if(i<=nr%n)c[i]++;for(j=1;j<=nr;j++)if(j>k&&j<=c[i])print a[j]" to "b[i];k=c[i];print ""}}' urfile -
  17. 1 to a
  18. 2 to a
  19. 3 to a
  20. 4 to a

  21. 5 to b
  22. 6 to b
  23. 7 to b

  24. 8 to c
  25. 9 to c
  26. 10 to c

復(fù)制代碼

論壇徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16賽季CBA聯(lián)賽之北京
日期:2016-07-06 15:42:0715-16賽季CBA聯(lián)賽之同曦
日期:2016-06-12 10:38:0915-16賽季CBA聯(lián)賽之佛山
日期:2016-05-27 11:54:56黃金圣斗士
日期:2015-12-02 11:44:35白銀圣斗士
日期:2015-11-25 14:32:43白銀圣斗士
日期:2015-11-23 12:53:352015亞冠之布里斯班獅吼
日期:2015-10-21 16:55:482015亞冠之首爾
日期:2015-09-01 16:46:052015亞冠之德黑蘭石油
日期:2015-08-31 11:39:192015亞冠之薩濟(jì)拖拉機(jī)
日期:2015-08-28 21:06:5315-16賽季CBA聯(lián)賽之廣東
日期:2016-07-12 14:58:53
9 [報(bào)告]
發(fā)表于 2013-09-08 11:17 |只看該作者
回復(fù) 5# liion631818

你這個(gè)確實(shí)可以對(duì)數(shù)字進(jìn)行分行處理并寫(xiě)到文件中,也滿(mǎn)足要求。但我帖子中描述的只是一個(gè)內(nèi)容為數(shù)字的文本示例,而實(shí)際上文本是“以行為單位的任意類(lèi)型的文本內(nèi)容”,所以你的腳本可能還需要改改。

我這里有個(gè)腳本,不過(guò)是別人的思路,然后我整理了下,是可以滿(mǎn)足我的需求的!
  1. #!/bin/sh

  2. if [ $# -ne 2 ];then
  3.         echo "U: sh $0 [file] [fnumber]"
  4.         echo "E: sh $0 myfile 3"
  5.         exit 1
  6. fi

  7. srcfile=$1 #原始文件
  8. fnumber=$2 #需要拆分的文件個(gè)數(shù)

  9. eval $(cat $srcfile | awk -vn=$fnumber 'END{print "total="NR,"fline="int(NR/n),"extra="NR%n,"cline="int(NR/n)+1}')
  10. # total:原始文件總行數(shù)
  11. # fline:拆分文件平均行數(shù)
  12. # extra:拆分文件擴(kuò)展行數(shù)
  13. # cline:當(dāng)前拆分文件行數(shù)

  14. i=1
  15. iline=1
  16. while true;do
  17.         filename="file$i"
  18.         # 按行的順序分別寫(xiě)入文件中,滿(mǎn)足我的需求
  19.         if [ $extra = 0 ];then
  20.                 echo "$filename lines: $fline"
  21.                 tail -n +$iline $srcfile | head -n $fline > $filename
  22.                 iline=$((iline+fline))
  23.         else
  24.                 echo "$filename lines: $cline"
  25.                 tail -n +$iline $srcfile | head -n $cline > $filename
  26.                 iline=$((iline+cline))
  27.                 extra=$((extra-1))
  28.         fi
  29.         ((i++))
  30.         [ $iline -ge $total ] && exit 0
  31. done
復(fù)制代碼

論壇徽章:
4
CU大牛徽章
日期:2013-03-13 15:29:07CU大;照
日期:2013-03-13 15:29:49CU大;照
日期:2013-03-13 15:30:19CU十二周年紀(jì)念徽章
日期:2013-10-24 15:41:34
10 [報(bào)告]
發(fā)表于 2013-09-08 13:50 |只看該作者
樓主,你的要求太嚴(yán)格,這樣有用嗎?能不能夠簡(jiǎn)單一點(diǎn)呢?這樣就可以直接使用split進(jìn)行處理了。比如說(shuō)文件數(shù)要求6個(gè),但是分成了7個(gè)也行。另外,最后一個(gè)文件行數(shù)少一些也沒(méi)有關(guān)系。這樣行嗎?
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專(zhuān)區(qū)
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過(guò)ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP