疲勞分析中需要知道的一點統(tǒng)計學(xué)
我們來看一組數(shù)據(jù):
表1 – 數(shù)據(jù)列表

這些數(shù)據(jù)有什么含義呢?如果將這些點連接起來,它們看起來像一段隨機(jī)數(shù)據(jù)(圖1- a);如果我們看這段數(shù)據(jù)從頭到尾的趨勢變化,趨勢變化并不明顯(圖1 - b);如果將這段數(shù)據(jù)的動態(tài)均值連起來,均值變化大約在50附近上下波動(圖1- c)。初步看上去,數(shù)據(jù)沒有多大的規(guī)律性。

圖1 – (a)原始數(shù)據(jù),(b)趨勢分析,(c)動態(tài)均值分析
換一種方式,如果我們統(tǒng)計一下每個數(shù)據(jù)點在整個樣本中出現(xiàn)的頻次(如圖2),橫坐標(biāo)為數(shù)據(jù)大小區(qū)間,縱坐標(biāo)為測試數(shù)據(jù)在各區(qū)間出現(xiàn)的頻次,這些頻次接近一種近似的規(guī)律性。越接近均值的點的個數(shù)越多,越遠(yuǎn)離均值的點的個數(shù)越少。

圖2 – 數(shù)據(jù)出現(xiàn)頻次圖
這些點出現(xiàn)的頻次所呈現(xiàn)出的特性就是一種概率分布。將圖2中的柱狀圖進(jìn)行平滑,找出其頻次數(shù)的平滑擬合線,如圖3。繼續(xù),將縱坐標(biāo)的頻次數(shù)改為累積頻次數(shù),例如,假定柱狀圖中以數(shù)值44為起點,數(shù)值44出現(xiàn)了3次,數(shù)值45出現(xiàn)了5次,累積頻次圖的縱坐標(biāo)則變?yōu)樾∮跀?shù)值44的數(shù)出現(xiàn)了3次,小于數(shù)值45的數(shù)出現(xiàn)了(3+5)次,以此類推,則成為累積頻次圖(CumulativeDistribution Function, CDF,其縱坐標(biāo)變成各級次數(shù)除以總次數(shù)的比值)。如果將累積頻次圖的縱坐標(biāo)改為對數(shù)坐標(biāo),所有的頻次數(shù)則變成了一個直線分布。至此,我們找到了這個數(shù)據(jù)樣本的一般性規(guī)律:數(shù)據(jù)服從正態(tài)分布。

圖3– 累積頻次圖(CDF)
對數(shù)縱坐標(biāo)下的累積頻次圖,絕大多數(shù)的點都分布在中間的一條直線上,中間直線的左右兩邊各有一條線,這兩條線幾乎將所有的點都囊括在其中。這兩條線所形成的區(qū)域,稱為置信區(qū)間。本案例中,這個置信度為95%,即100個樣本中有95個處于這個置信區(qū)間中。
正態(tài)分布是諸多概率分布中的一種。其他常用的分布還有對數(shù)正態(tài)分布、二項式分布、威布爾分布、極值分布等。對于工程應(yīng)用來說,沒有必要過多的考慮這些分布的數(shù)學(xué)公式,有很多統(tǒng)計軟件,如MINITAB[1],可以幫助我們解決諸如此類的概率統(tǒng)計問題。我們可以通過軟件選擇合適的分布表達(dá)數(shù)據(jù),找到最適合這些數(shù)據(jù)的分布即可。
舉個例子。假如我們做了12個零部件試驗,得到了在某一固定幅值下的12組失效次數(shù),如表2。
表2 – 試驗失效次數(shù)

我們用不同的概率分布來表達(dá)這組數(shù)據(jù),如圖4。通過肉眼,直觀判斷對數(shù)正態(tài)分布最適合這組數(shù)據(jù)。實際上,通過數(shù)學(xué)指標(biāo)AD值(Anderson-Darling)也能得到同樣的判斷。AD值越小,對應(yīng)的P值(P-Value)越大,概率分布與數(shù)據(jù)的適應(yīng)性越好。如果P值過小,通常為小于0.1,則該組數(shù)據(jù)不服從于所選擇的分布。

圖4 – 通過不同的概率分布表達(dá)數(shù)據(jù)
一旦選定了合適的分布,我們即可直接讀取這組數(shù)據(jù)的統(tǒng)計值。如表2數(shù)據(jù)的均值(mean)或中值(median)[2]約為83,000,或者說我們有95%的信心這組數(shù)據(jù)的中值處于70,000和98,000之間(圖5)。在現(xiàn)有測試樣本數(shù)的條件下,這是我們對這組數(shù)據(jù)的統(tǒng)計特征能做到的做好的估計。

圖5 – 對數(shù)正態(tài)分布

圖6 – 比較6個樣本數(shù)和12個樣本數(shù)的中值
如果將服從同一概率分布的6個樣本值和12個樣本值放在一起比較(如圖6),會發(fā)現(xiàn)兩組數(shù)據(jù)的中值接近,但12個樣本值的概率分布置信區(qū)間更小,這意味著樣本數(shù)越多,其概率分布越趨于集中,由此預(yù)測大樣本概率的精度會越高。
現(xiàn)在我們可以看到概率的好處了。它幫助我們解釋測試結(jié)果并告訴我們結(jié)果的離散度會有多大。在后續(xù)的文章中,我們會運用概率來分析道路測試數(shù)據(jù)和試驗室測試結(jié)果。
需要強(qiáng)調(diào)的是,任何工程測試數(shù)據(jù)都是一個估計。估計值的精度取決于測試方法的定義,試驗樣本的多少,以及表達(dá)試驗結(jié)果的變量的選擇。而置信區(qū)間表達(dá)了試驗結(jié)果可能的離散度,在總結(jié)試驗結(jié)論時需要考慮進(jìn)去。
我們通過兩組數(shù)據(jù)來舉例說明。假定我們從測試1中獲得了10個測試結(jié)果,從同樣的測試2中獲得了100個測試結(jié)果,測試結(jié)果服從正態(tài)分布如圖7所示。

圖7 – 測試結(jié)果
從圖中可以看到,測試1的均值為93.4,測試2的均值為100.5,兩者約7%的差異。相比測試1,測試2的結(jié)果置信區(qū)間精度高出很多。測試1的置信區(qū)間為±7% ,而測試2的置信區(qū)間< ±2%。
再舉一個利用統(tǒng)計概念幫助我們解釋試驗結(jié)果的例子。一個整車生產(chǎn)廠將某個零部件的售后失效里程數(shù)進(jìn)行了統(tǒng)計。數(shù)據(jù)來源于兩個不同的區(qū)域。將該部件在兩個區(qū)域的失效里程用概率分布表達(dá),如圖8所示。兩組數(shù)據(jù)均服從正態(tài)分布,其均值大致相同,但分布的斜率完全不同。從圖中可以看出,對區(qū)域A,絕大多數(shù)零部件會在9萬公里左右失效,而區(qū)域B則會到16萬公里左右,此外,區(qū)域A的載荷輸入或者說道路條件比區(qū)域B穩(wěn)定,因此其零件失效里程數(shù)相對穩(wěn)定。換句話說,區(qū)域B駕駛條件更加惡劣,零件失效里程數(shù)的離散度更大。

圖8 – 售后失效數(shù)據(jù)
總結(jié)來說,可供分析的數(shù)據(jù)樣本量越多,對數(shù)據(jù)統(tǒng)計量的預(yù)測精度越高。在工程實踐中,由于時間和成本的關(guān)系,往往得不到足夠的試驗樣本數(shù),這是我們需要面對的挑戰(zhàn),需要取舍和綜合判斷。
[1] http://www.minitab.com/en-us/
[2]中值又稱中位數(shù),當(dāng)樣本項數(shù)n為奇數(shù)時,處于中間位置的樣本值即為中位數(shù);當(dāng)n為偶數(shù)時,中位數(shù)則為處于中間位置的2個樣本值的平均數(shù)。只有在正態(tài)分布下,均值和中值相等。
廣告 最新資訊
-
“汽車爬坡試驗方法”將有國家標(biāo)準(zhǔn)
2026-03-03 12:44
-
十年耐久監(jiān)管時代:電池系統(tǒng)開發(fā)策略將如何
2026-03-03 12:44
-
聯(lián)合國法規(guī)R59對機(jī)動車備用消聲系統(tǒng)的工程
2026-03-03 12:08
-
聯(lián)合國法規(guī)R58對后下部防護(hù)裝置的工程化約
2026-03-03 12:07
-
聯(lián)合國法規(guī)R57對摩托車前照燈配光性能的工
2026-03-03 12:07





廣告


























































