- 論壇徽章:
- 780
|
回復(fù) 10# 關(guān)陰月飛
估計(jì)他拿過(guò)來(lái),改了一下,現(xiàn)在不行了,你幫他一下吧,
我看過(guò)他需求,只完成第一步好像不難。
對(duì)一個(gè)純文本,其中的每一句話,你首先需要按順序地得到這句話中每一個(gè)單詞的字母數(shù),比如“ In statistics, a power lar is a functional relationship between two quantities, where one quantity varies as a power of another" 這句話中,按順序得到的單詞的字母數(shù)序列是“ 2 10 1 5 3 2 1 10 12 7 3 10 5 3 8 5 3 8 6 2 1 5 2 7.
這文件中的每一句話做一次這樣的分析后,你會(huì)得到一長(zhǎng)串的字?jǐn)?shù)(x1,x2, x3, ... xn), 每一個(gè)數(shù)字代表一個(gè)單詞的字母數(shù)(n 為文件中單詞數(shù))。接下去對(duì)這串字?jǐn)?shù)進(jìn)行進(jìn)行求平均,得到 xbar. 將原來(lái)的數(shù)組與xbar做差,得以 ( X1, X2, X3,X4,X5 .... Xn), 其中Xi=xi-xbar.然后對(duì)數(shù)組[ Xi ] 做累加 得到 [ Y1, Y2, Y3, ... Yn], 其中 Y1=X1, Y2=X1+X2, Y3=X1+X2+X3, ..., Yi = X1+X2+ ... + Xi.
|
|