1、歐洲目前的可靠性預(yù)計技術(shù)現(xiàn)狀
可靠性是航天系統(tǒng)及其部件的關(guān)鍵性能特征之一,在整個開發(fā)階段都會不斷地進行評估,以確保系統(tǒng)在性能水平上提供足以實現(xiàn)任務(wù)目標的功能。有幾種方法可以預(yù)測可靠性,包括基于手冊的預(yù)測、基于測試數(shù)據(jù)的預(yù)測以及基于在軌或現(xiàn)場數(shù)據(jù)的預(yù)測。
基于手冊的預(yù)測與可靠性建模技術(shù)(如可靠性框圖(RBD))相結(jié)合是歐洲航天應(yīng)用中最廣泛使用的評估系統(tǒng)可靠性的方法,主要是由于缺乏相關(guān)的現(xiàn)場和/或測試數(shù)據(jù)。
可靠性預(yù)計可用于以下主要目的:
? 確定設(shè)計是否滿足/超過系統(tǒng)可靠性要求。
? 在設(shè)計中關(guān)注薄弱部分/問題區(qū)域。
? 評估設(shè)計變更對系統(tǒng)可靠性的影響。
? 比較不同設(shè)計或備選設(shè)計方案。
? 確定可修復(fù)系統(tǒng)的備用機組數(shù)量和類型。
? 支持系統(tǒng)可用性、維修、維護和生命周期成本評估。 為了使得可靠性預(yù)測工作有效,需要解決當(dāng)前可靠性預(yù)測面臨的限制條件或者缺陷問題。這些問題/缺陷包括:
? 定量要求規(guī)范中沒有明確的要求標準。
? 簡化假設(shè),如恒定故障率。
? 缺乏統(tǒng)計置信度。
? 忽視了人為因素或系統(tǒng)故障(如設(shè)計、制造等)所導(dǎo)致的系統(tǒng)不可靠。
? 在技術(shù)發(fā)展方面使用不完整或過時/過時的模型。
? 有關(guān)實驗數(shù)據(jù)(試驗或現(xiàn)場/在軌數(shù)據(jù))的有限使用,以支持可靠性預(yù)測。
目前,歐洲航天系統(tǒng)的可靠性預(yù)計流程:
(1) 確定系統(tǒng)級可靠性要求規(guī)范
(2) 將可靠性要求分配到較低級別(低至單元級/組件級)
(3) 使用手冊來源和供應(yīng)商數(shù)據(jù)(如電路板級)驗證可靠性要求,并在組件級進行可靠性預(yù)測,然后在更高級別進行建模,例如可靠性框圖(RBD)或模擬技術(shù)(蒙特卡羅、馬爾可夫、貝葉斯網(wǎng)絡(luò)等)
(4) 潛在的可靠性預(yù)測可通過測試和/或在軌數(shù)據(jù)進行可靠性預(yù)測更新。
2、歐洲航天系統(tǒng)可靠性預(yù)計流程
(1)確定可靠性要求 系統(tǒng)可靠性要求提供了研制目標、要求,以確保系統(tǒng)在給定的操作環(huán)境下、在指定的時間段內(nèi)成功地執(zhí)行其預(yù)期功能。可靠性要求對于安全關(guān)鍵、長期或高成本系統(tǒng)更為嚴格,對于低成本或短期任務(wù)相對較寬松或不存在。在低成本/短期任務(wù)的情況下,只有在符合項目限制條件(如預(yù)算)的情況下,識別和消除關(guān)鍵區(qū)域(如單點故障)和使用空間級部件才能確??煽啃???煽啃砸笸ǔR詨勖Y(jié)束時成功概率的形式且在衛(wèi)星級規(guī)定,而不規(guī)定任何置信水平。然而,根據(jù)項目的需要,也可在任務(wù)級(包括地面和發(fā)射段)或空間段/系統(tǒng)級規(guī)定定量可靠性要求。其他可靠性指標可能包括:平均壽命、故障率等。
一些衛(wèi)星項目的可靠性定量要求示例如下:
(2)分配可靠性要求
可靠性要求從系統(tǒng)級(如衛(wèi)星)分配給所有子系統(tǒng)。然后,每個子系統(tǒng)將其可靠性需求分配給每個單元或設(shè)備。如果每個單元達到其分配的可靠性,則子系統(tǒng)將滿足其要求,如果所有子系統(tǒng)滿足其要求,則系統(tǒng)將滿足其系統(tǒng)級可靠性要求。
分配的必要先決條件是以可靠性框圖的形式對系統(tǒng)進行分解。然后有幾種方法可以將系統(tǒng)可靠性需求分配到較低的級別:
? 等分配法
? 權(quán)重分配法(例如ARINC分配法)
(3)組件/部件可靠性預(yù)測
一旦對較低級別的組件/部件的可靠性分配過程完成后,就需要確定從組件到單元、到子系統(tǒng)、到系統(tǒng)級別的所有設(shè)計級別上是否滿足既定的可靠性目標。在空間應(yīng)用中,部件大部分是電氣/電子部件,盡管也有大量的機械部件。其他對系統(tǒng)可靠性有影響的系統(tǒng)元素,如結(jié)構(gòu)組件或軟件,目前主要通過安全邊際/安全因素或軟件保證過程進行處理。事實上,可靠性分析(如FTA和FMECA)是為了應(yīng)對硬件的隨機磨損故障而開發(fā)的,對設(shè)計錯誤不是很有效。
在包括空間應(yīng)用在內(nèi)的所有工業(yè)部門中,最廣泛使用的電氣/電子系統(tǒng)可靠性預(yù)測方法是基于手冊的mil-hdbk-217。本標準假設(shè)電子元件可以使用恒定的故障率進行建模,并包含無源元件(如電阻、電感器、電容器等)和有源元件(晶體管、二極管、集成電路等)的故障率數(shù)據(jù)。有一些方法可以根據(jù)使用環(huán)境、質(zhì)量控制要求、集成電路中的門的數(shù)量等來調(diào)整組件的基本故障率。用于修改基本故障率的因素稱為π系數(shù)。在MIL-217中有兩種主要的預(yù)測方法:零件計數(shù)法和零件應(yīng)力法。零件計數(shù)法假設(shè)平均應(yīng)力水平作為提供部件失效率早期設(shè)計估計的方法,而零件應(yīng)力方法要求了解部件經(jīng)歷的應(yīng)力水平。然后,通過增加安裝在電路板上的所有部件的故障率來預(yù)測電路板的故障率。這里是假設(shè)電路板為一個串聯(lián)模型(即沒有內(nèi)部冗余),并將導(dǎo)致最壞情況的預(yù)測。由于假設(shè)了一個串聯(lián)模型,因此當(dāng)系統(tǒng)的所有部件都具有恒定的故障率時,系統(tǒng)的故障率是恒定的。
其他電子產(chǎn)品的手冊預(yù)測方法,如PRISM,是為了克服MIL-HDBK-217的一些固有局限性而開發(fā)的(目前,MIL-HDBK-217手冊尚未對這些局限性或問題維護)。PRISM集成了系統(tǒng)級故障率模型、新的組件類型模型,以及在預(yù)測中使用現(xiàn)場和測試數(shù)據(jù)的能力,以及其他改進。同樣,另一種方法217plus通過包括新的失效率模型,并使用貝葉斯更新方法將其與經(jīng)驗數(shù)據(jù)相結(jié)合來擴展PRISM。使用mil-hdbk-217和PRISM/217plus預(yù)測可靠性與觀察到的軍用設(shè)備可靠性之間的比較情況如圖所示。
另一種基于手冊的電子產(chǎn)品可靠性預(yù)測方法是Fides,該方法旨在預(yù)測接近現(xiàn)場平均值的可靠性值。它不僅通過對故障的物理/技術(shù)建模,而且通過工藝過程建模,例如開發(fā)、生產(chǎn)和運行過程對可靠性的影響。
在空間系統(tǒng)中,除了電子系統(tǒng)外,我們還遇到許多機械系統(tǒng)和部件。對于這類部件,可使用相應(yīng)的預(yù)計手冊,如NSWC-16《機械設(shè)備可靠性預(yù)測程序手冊》。該手冊的預(yù)測手段與MIL-HDBK-217類似,包括機械部件的基本故障率,并可根據(jù)材料特性的類型、系統(tǒng)運行環(huán)境等,對基本故障率調(diào)整。該標準涵蓋的某些特定系統(tǒng)包括密封件和墊圈、彈簧、閥門、軸承、電機和其他機械設(shè)備。與MIL-HDBK-217類似,NSWC-16也假設(shè)了恒定的故障率模型。機械零件故障率的其他來源包括NPRD2016(非電子零件可靠性數(shù)據(jù)),允許考慮磨損故障。
3、基于手冊的可靠性預(yù)計的局限性
基于手冊的可靠性預(yù)測有一定的局限性。最明顯的簡化是基本假設(shè),即組件具有固有的恒定失效率,而實驗表明,在微觀層面上,很少有失效機制顯示出這種行為。然而,在考慮跨多個不同組件類型的累積失效機制時,它仍然是一個有效的簡化假設(shè)。另一個簡化是串聯(lián)系統(tǒng)假設(shè),其中電路板的預(yù)測故障率是由電路板上所有組件的預(yù)測故障率之和產(chǎn)生最壞情況(保守)預(yù)測的結(jié)果。此外,基于手冊的可靠性預(yù)測通常不能提供統(tǒng)計置信度,因為沒有相關(guān)的實驗數(shù)據(jù)可供支持。這是由于組件模型開發(fā)中使用的數(shù)據(jù)源的不連貫性造成的。
此外,大多數(shù)基于手冊的預(yù)測既不考慮失效的物理或力學(xué),也不考慮系統(tǒng)失效。電子零件失效的關(guān)鍵因素是溫度,而其他問題如溫度循環(huán)、濕度、振動、沖擊等也沒有建模。此外,預(yù)測僅占與零件故障相關(guān)的現(xiàn)場故障的一小部分,而大多數(shù)現(xiàn)場故障源于設(shè)計、制造或測試過程中的系統(tǒng)故障。
最后,最廣泛使用的預(yù)測手冊mil-hdbk-217已經(jīng)過時,因為它最后一次更新是在1995年,不包括新的組件、技術(shù)進步和質(zhì)量改進。當(dāng)有足夠的在軌數(shù)據(jù)(如電池、太陽能電池等)和開發(fā)新技術(shù)模型(如高度集成電路)時,工業(yè)界正在應(yīng)用修正系數(shù),但這些努力并未在歐洲層面得到鞏固,導(dǎo)致不同供應(yīng)商之間的不一致。
然而,值得注意的是,217PLUS和FIDES等手冊制定了應(yīng)對MIL-HDBK-217局限性或存在問題的策略,如圖所示。
4、其它可靠性預(yù)測方法
其他組件預(yù)測方法包括利用可用測試數(shù)據(jù)的方法??煽啃灶A(yù)測可以根據(jù)符合可用失效時間數(shù)據(jù)的概率分布參數(shù)進行。最廣泛使用的分布是威布爾分布,因為它的多功能性,可以采取不同的形狀和模型,在產(chǎn)品的生命周期中的每個階段。
早期階段:失效率降低。威布爾β參數(shù)小于1
使用階段:恒定故障率。威布爾β參數(shù)等于1,成為指數(shù)分布
磨損階段:失效率增加。威布爾β參數(shù)大于1
必須強調(diào)的是,目前唯一可用于實際估計可靠性的可靠性預(yù)測方法是利用相關(guān)試驗或現(xiàn)場數(shù)據(jù)的方法。 最后,失效物理方法對系統(tǒng)可靠性的影響越來越大,也越來越多人關(guān)注該方法。關(guān)于什么時候使用失效物理的預(yù)測方法,如何做到最大效率化,參見什么情況選擇失效物理手段進行可靠性預(yù)測,如何把控工作的效益最大化。
5、系統(tǒng)可靠性預(yù)計
當(dāng)完成部件、組件的可靠性預(yù)計后,有幾種方法可以從部件可靠性中獲得系統(tǒng)可靠性。兩種主要的方法是:
(1) 可靠性框圖(RBD)
(2) 仿真模型(蒙特卡洛、貝葉斯網(wǎng)絡(luò)等)
6、系統(tǒng)可靠性預(yù)測與場/在軌可靠性
在空間領(lǐng)域,人們普遍認為,使用mil-hdbk-217進行的預(yù)測一般是保守的,這意味著產(chǎn)品的失效率將小于預(yù)測值。 事實上,這一聲明在最近幾年得到了證實,即衛(wèi)星級的可靠性預(yù)測明顯低于基于在軌數(shù)據(jù)的可靠性估計(盡管在較低的兩個95%置信區(qū)間內(nèi)),直至目前可靠性預(yù)測方法的實用性得到工業(yè)領(lǐng)域得到證實。
此外,在軍事應(yīng)用中,可靠性預(yù)測的使用產(chǎn)生了誤導(dǎo)性和不準確的結(jié)果,盡管與空間相反,軍事系統(tǒng)的經(jīng)驗表明,戰(zhàn)場可靠性低于預(yù)測值(即,mil-hdbk預(yù)測過于樂觀)。
為了解決所謂的預(yù)測不準確性,建議采用針對MIL-HDBK-217故障率的調(diào)整系數(shù)和/或使用補充方法(如在軌數(shù)據(jù)反饋的貝葉斯更新)。
歐空局審查了通過從在軌數(shù)據(jù)推斷的修正系數(shù)調(diào)整MIL-HDBK-217F失效率數(shù)據(jù)的方法。得出的結(jié)論是,群體特征的變異性和有限的樣本量使得很難定義一個統(tǒng)計上合理的校正因子以應(yīng)用于未來的項目。因此,當(dāng)時不建議使用提出的修正因子方法來驗證可靠性要求的符合性。
當(dāng)前可靠性預(yù)測與實際在軌驗證可靠性不一致的一個明顯原因是,并非所有影響系統(tǒng)可靠性的因素都得到了適當(dāng)?shù)目紤]。當(dāng)前的系統(tǒng)可靠性預(yù)測僅涵蓋隨機故障,當(dāng)前已經(jīng)證明在軌道上發(fā)生的許多異?,F(xiàn)象并非由設(shè)計、制造或磨損等隨機原因引起時。其他因素,如軟件或人員參與(操作員、制造/測試技術(shù)人員等)在系統(tǒng)可靠性中起著重要作用,但在空間應(yīng)用中廣泛使用的預(yù)測方法也沒有涵蓋這些因素。
隨著從在軌獲得更多相關(guān)的現(xiàn)場數(shù)據(jù),可靠性模型可以通過包括這些數(shù)據(jù)來改進。這可以通過使用貝葉斯推理在所有系統(tǒng)級別上實現(xiàn)。該方法目前正在美國宇航局借助相關(guān)工具進行實施。
7、建議的改進措施
(1)可靠性要求規(guī)范的合理化
(2)商定一個統(tǒng)一的可靠性預(yù)計框架
例如,IEEE1413不是一種可靠性預(yù)測方法,它不取代或補充任何可用的預(yù)測方法。該標準也不建議或禁止使用任何特定的可靠性預(yù)測方法。根據(jù)IEEE1413進行的預(yù)測確保了預(yù)測方法的好處和局限性由準備預(yù)測的工程師考慮和評估,并且用戶也需知道這一點。該標準將可靠性預(yù)計過程從一個時間例行和強制性任務(wù)提升為一個增值活動。
除非在短期內(nèi)開發(fā)出一種新的、更為合適的空間預(yù)測方法,否則任何現(xiàn)有的標準都不能被視為適用于所有情況的最佳標準,而且該方法不應(yīng)規(guī)定任何特定的標準、方法。從長遠來看,歐空局打算確定一種適用于所有工業(yè)伙伴的方法。然而,當(dāng)今空間應(yīng)用最相關(guān)的方法包括217plus、FIDES和壽命測試(如果可行,僅在較低層級部件水平)。