- 論壇徽章:
- 0
|
大俠,你能幫我處理一下這整個題目嗎,對我感覺有很大的難度,謝謝了。
對一個純文本,其中的每一句話,你首先需要按順序地得到這句話中每一個單詞的字母數(shù),比如“ In statistics, a power lar is a functional relationship between two quantities, where one quantity varies as a power of another" 這句話中,按順序得到的單詞的字母數(shù)序列是“ 2 10 1 5 3 2 1 10 12 7 3 10 5 3 8 5 3 8 6 2 1 5 2 7.
這文件中的每一句話做一次這樣的分析后,你會得到一長串的字?jǐn)?shù)(x1,x2, x3, ... xn), 每一個數(shù)字代表一個單詞的字母數(shù)(n 為文件中單詞數(shù))。接下去對這串字?jǐn)?shù)進行進行求平均,得到 xbar. 將原來的數(shù)組與xbar做差,得以 ( X1, X2, X3,X4,X5 .... Xn), 其中Xi=xi-xbar.然后對數(shù)組[ Xi ] 做累加 得到 [ Y1, Y2, Y3, ... Yn], 其中 Y1=X1, Y2=X1+X2, Y3=X1+X2+X3, ..., Yi = X1+X2+ ... + Xi.
對以上得到的數(shù)組 [ Yi ] 以L個為單元進行分組, 即第一組為 [ Y1 Y2 Y3 ... YL]. 對這L個數(shù)字進行最小二乘法擬合,得 Y=a1 x + a0, (這里的x為數(shù)組對應(yīng)的下標(biāo)數(shù),即1~ L).
計算偏差量 E = sqrt( sum (Yi - (a1*xi +a0) )^2對其他單元進行一樣的的計算,得到不同的不同的E_L_i。該尺度L下,統(tǒng)計的波動量 E_bar_L = mean( E_L_i) 用不同的L重復(fù)以上計算,得到相應(yīng)的E_bar_L值。
|
|