本文介紹如何向網絡、通信、工業和醫療設備添加“黑匣子”功能(非易失性故障記錄)。它概述了記錄故障數據的好處,包括更快、更明確的故障分析。
背景
每個人都熟悉“黑匣子”一詞,指的是提供飛機失事原因線索的設備。飛機的黑匣子收集了有關飛機運行條件的大量數據點,包括高度、速度、襟翼和方向舵位置;它記錄了飛行員在事故發生前所做的事情和所說的話。此運行日志記錄了崩潰前發生的事情,對于確定事件的根本原因至關重要。
順便說一句,“黑匣子”一詞用詞不當。飛機上使用的設備從來都不是黑色的——它是橙色的,以便于定位。該設備的正確航空電子術語是“事件數據記錄器”。
當然,工程界也會把黑匣子理解為輸入和輸出已知,但黑匣子的內部操作未知的設備。這種類型的黑匣子不是本文的主題。
在飛機以外的電子設備中添加數據記錄功能(黑匣子)可以證明非常有價值。黑匣子功能在電子設備中被稱為“復雜系統管理器”,可在網絡、工業控制、醫療和通信設備中提供故障記錄。故障記錄的主要好處非常簡單:更快、更明確的故障分析。本文介紹如何實現此類功能,并概述非易失性故障記錄可以實現的好處。
電源管理方案
從電源管理的角度來看,大多數“大盒子”和“小盒子”系統的內部工作原理看起來非常相似。無論機箱是路由器、服務器、基站、光復用器、可編程邏輯控制器 (PLC) 還是磁共振成像儀 (MRI),它們都包含一系列開關模式電源和線性電源,需要監控電壓、電流、溫度和可能的風扇速度。參見圖1。
圖1.典型的電源布置。
非易失性故障記錄
在大型大盒子系統和較小的“披薩盒”系統中,復雜的系統管理器的主要功能是控制和監視許多電源和風扇。監控包括查找系統故障事件,例如電壓過高或過低、電流過高、溫度超出范圍以及風扇未以適當速度旋轉。檢查故障可以像檢查參數是否超出閾值一樣簡單。如果在系統運行時收集實時數據,并在發生故障時將其存儲到非易失性存儲器中,則可以創建事件數據記錄器功能。圖 2 顯示了這樣一個系統。
圖2.用于多個電源和風扇的非易失性故障記錄系統的功能圖。
在圖 2 中,復雜的系統管理器連續收集有關眾多系統電壓、電流、溫度和風扇速度的數據。與飛機中的黑匣子類似,最新的參數數據(例如,最近 500 毫秒到 1 秒的數據)是滾動連續收集的。然后,當發生故障時,將永久記錄當時系統的快照。能夠在故障發生之前檢查系統運行前 500 毫秒到 1 秒,是了解導致故障的原因以及系統如何受到影響的關鍵信息。通過檢查數據,可以重建時間線并確定相互依賴關系。理想情況下,復雜的系統管理器應記錄多個故障發生。由于系統相互依賴性緊密耦合,一個故障可能會導致多個系統故障連續發生。因此,為了找到故障的根本原因,捕獲所有數據非常重要。此外,大量的非易失性存儲允許系統存儲可能不被視為災難性的事件,而只是指示系統何時在指定范圍之外運行。此數據的存儲對于強制執行保修合規性非常重要。
一個例子
考慮圖 3 中所示的場景。電源發生故障(步驟1),故障由持續監控電壓、電流和溫度的復雜系統管理器之一檢測到。經理會立即通知系統中的其他經理,以便他們可以根據需要采取措施(步驟 2)。然后,復雜的系統管理器根據系統需要對電源和風扇進行排序(步驟 3)。然后,有關系統電壓、電流、溫度和風扇速度的所有最新數據都會記錄到每個復雜系統管理器的板載黑匣子中(步驟 4)。由于數據存儲在非易失性存儲器中,主機可以在將來的任何時候(即使在從現場返回數據之后)提取數據,以確定導致故障的原因(步驟5)。
圖3.黑盒故障日志記錄方案。
非易失性故障記錄的優勢
非易失性故障記錄具有許多優點。如果設備能夠跟蹤現場故障期間發生的情況,故障分析團隊可以快速分析并準確確定故障的根本原因。這種故障排除改善了客戶關系,因為用戶不可避免地希望快速了解設備故障的原因。此外,制造商越快意識到潛在的責任,他們就能越快地糾正問題并節省未來潛在故障的成本。這再次使客戶滿意,并提高了其設備的整體可靠性。非易失性故障記錄還可以確定客戶是否在指定的工作范圍之外使用設備,這一操作可能違反產品保修。隨著時間的推移,收集現場故障數據可以通過識別不良供應商和薄弱的設計實踐來提高未來的產品可靠性。
復雜系統管理器
Maxim Integrated提供多種復雜的系統管理器,包括廣泛的非易失性故障記錄,適用于服務器等大型系統和網絡交換機等披薩盒設計。參見圖 4 和圖 5。
MAX34440控制和監視多達4個電源(圖34440)。它提供電源排序和裕量調節,并監控電壓、電流和溫度故障。多個MAX31785器件可以并聯,以處理系統中存在的所有電源。MAX34440控制和監視多達31785個風扇。與MAX<>一樣,可以使用多個MAX<>器件來支持任意數量的風扇。
圖4.大盒子系統設計采用MAX34440和MAX31785。
Maxim還提供復雜的系統管理器,支持網絡交換機等小型披薩盒設計。MAX34441支持多達5個電源和一個風扇(圖34441)。為了最大限度地提高設計靈活性,多個MAX34440器件可以并聯或與多個MAX31785和MAX<>器件配合使用。
圖5.采用MAX34441的披薩盒系統設計
價值主張
網絡、工業控制、醫療和通信設備中的黑匣子故障記錄可實現更快、更明確的故障分析。反過來,這又可以通過更快的反應時間產生更高的客戶滿意度,從長遠來看,更好的產品可靠性。
審核編輯:郭婷
-
電源
+關注
關注
184文章
17836瀏覽量
251790 -
交換機
+關注
關注
21文章
2656瀏覽量
100177 -
管理器
+關注
關注
0文章
248瀏覽量
18613
發布評論請先 登錄
相關推薦
評論