衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何將強化學習用于火箭發(fā)動機引擎研發(fā)的創(chuàng)新解決方案中

電子工程師 ? 來源:YXQ ? 2019-04-29 14:16 ? 次閱讀

如何將強化學習用于火箭發(fā)動機引擎研發(fā)的創(chuàng)新解決方案中。

超越科技行業(yè)的機器學習

機器學習(ML)在各個行業(yè)以及眾多的應用軟件中產生了令人難以置信的影響,其中包括個性化電視推薦和順風車應用中的動態(tài)價格模型等。因為它是當下科技行業(yè)各大公司成功的核心要素,所以機器學習相關理論研究和應用的發(fā)展速度十分驚人。

對于科技以外的行業(yè),機器學習可用于用戶的個性化體驗,自動地執(zhí)行繁重的任務并優(yōu)化主觀決策。然而,即使是科技行業(yè)的業(yè)內人士,了解最新的機器學習進展并且知道如何最大化利用現有的先進技術依然十分困難,更不用說那些在其他領域(例如制造業(yè))致力于優(yōu)化工作的人。

然而,跨學科的產品經理能夠很好地應對這一艱巨的挑戰(zhàn)。通過了解行業(yè),進程和商業(yè)價值,以及對機器學習應用廣度的深入理解,產品經理可以確定現有哪些領域的創(chuàng)新是成熟的。

具有產品管理、軟件工程和數據科學經驗的他們具有獨特的視角,使他們自己能夠促進那些尚未廣泛應用機器學習的行業(yè)與先進技術應用之間的融合。通過與跨學科的各領域專家合作,產品經理可以重塑制造流程,全面提升其效率、安全性和可靠性。

作為Insight的數據產品管理研究員,我曾與機器學習工程研究員,Nina Lopatina,仿真工程師Saeed Jahangirian以及Jordan Noone的動力工程師一起工作,研究提高火箭發(fā)動機引擎的生產效率。硬件設計人員和制造商的最大成本來自于控制系統(tǒng)的測試、驗證和校準。

我們提出了一個概念,并驗證可以將強化學習用于自動調整火箭引擎中的子組件,以滿足驗證和協(xié)作中對大量時間和資源的需求問題。我們的解決方案可以節(jié)省數千美元,從而避免在昂貴的測試設備上進行長達三個月的手動測試。傳統(tǒng)的程序也十分危險,很小的錯誤也會對昂貴的硬件造成重大損害,更重要的是,會對參與測試的技術人員構成危害。

測試,驗證和校準是硬件開發(fā)中最昂貴,最耗時的任務

在制造過程中開發(fā)控制軟件的過程是非常繁瑣的

在我上一份工作中,我是一名軟件和控制工程師,為一個大型金屬3D打印機開發(fā)控制回路。控制回路是一臺機器控制軟件的別稱。控制汽車巡航的控制軟件就是一個相當簡單的例子。它監(jiān)控車輛的速度并控制油門直至達到目標速度。對于3D金屬打印機這個項目,控制算法相對更復雜一些。我們開發(fā)的打印機是一個連接機器人手臂的焊工。機器人逐層跟蹤零件,而焊工將新的一層焊接到先前的一層并構建零件。

在逐層追蹤零件的同時,熱源熔化金屬絲并將新層融合到前一層 - 圖片由Sciaky Inc.提供

控制軟件可控制熱量的輸入,遍歷速度,送絲速度以及其他一些旋鈕,以確保零件符合規(guī)格要求。規(guī)范包括最終部件的質量,例如缺陷的數量和尺寸,以及部件的尺寸,每層的寬度和高度。如果一切正常,結果將符合規(guī)范。但是如果控制算法沒有正確地完成其工作,則該部件會變形、斷裂或撕裂,并具有許多裂縫和毛孔。

開發(fā)控制算法包括三個階段:

控制器法則設計:在這個階段,目標是理解管理過程的物理學。開發(fā)了該過程的模擬仿真并用于創(chuàng)建控制軟件,而無需進行昂貴且冗長的物理試驗。

軟件開發(fā):在此階段,我們使用不同的建模技術來定義過程中輸入和輸出之間的關系。此步驟需要工程師將問題分解為更小的部分并為每個部分開發(fā)相對應的模型。然后使用這些模型創(chuàng)建可以控制過程以達到預期結果的軟件。

控制校準:一旦軟件成功通過模擬仿真測試,工程師就會花幾個月的時間在物理系統(tǒng)上對軟件進行調整優(yōu)化,以解釋模擬仿真和物理現實之間的差異。

問題是每個階段可能需要數周到數年,并且在大多數情況下,包括微調過程模型或微調控制軟件以實現所需輸出的種種試驗。這是許多試驗所做的優(yōu)化問題。更智能的方法是將系統(tǒng)分解為更容易建模的子組件,然后使用直接和迭代方法來找到控制子組件的最佳方法。這種方法仍然需要工程師的聰明才智來解決問題,并且最終需要通過多次試驗來優(yōu)化各個子組件之間的交互。它還遠遠不是一個全自動化的過程。

為了尋找解決這一問題的自動化方法,我們將強化學習作為開發(fā)復雜機械控制回路的端到端解決方案。

強化學習

強化學習(RL)正在學習如何最大化獎勵功能。從某種意義上說,強化學習是學習環(huán)境中代理的控制算法的自動化過程。

1. 一個代理在一個環(huán)境中運行,它可以使用我們稱為“動作”的執(zhí)行器來執(zhí)行環(huán)境。

2. 然后環(huán)境響應代理所采取的操作,這樣會將代理和環(huán)境置于一個新的狀態(tài)。

3. 然后根據代理的狀態(tài)和環(huán)境定義獎勵函數。

4. RL的目標是學習采取行動的最佳策略,使未來的回報總和最大化。

強化學習的組成部分

例如,像俄羅斯方塊這樣的電子游戲可以被認為是一個環(huán)境,游戲中的玩家可以被認為是一個代理。

1.動作是玩家可以采取的動作,比如旋轉形狀。

2. 這些動作改變了游戲的狀態(tài),游戲狀態(tài)可以定義為在每個時間點上顯示器上的所有像素。

3.我們可以將獎勵函數定義為玩家清除的每一行的+1和輸掉游戲的-100。

4. 強化學習的目的是提出一個將狀態(tài)映射到操作的函數,從而使總回報最大化。

類似地,金屬3D打印機控制回路的開發(fā)也可以表示為強化學習問題。

1. 所采取的動作是改變熱輸入的強度、遍歷速度、送絲速度等。

2. 這些操作改變了打印的幾何形狀及其質量,我們稱之為打印狀態(tài)。

3.獎勵函數可以被定義為這樣一種函數:它顯示了打印結果在任何時刻與它的規(guī)格的接近程度。

4. 其目標是提出一個函數,告訴打印機如何控制其執(zhí)行器,給定其當前打印狀態(tài),以獲得最佳打印結果。

所有控制的問題都可以描述為強化學習問題。目的是估計一個稱為“策略”的函數。策略將狀態(tài)映射到操作,從而使獎勵函數最大化。如果函數域是有限的,那么你可以探索和存儲每個輸入和輸出映射,但是如果函數具有復雜的動態(tài)和很大或無限的域,那么這時機器學習就可以發(fā)揮作用了。

最近,強化學習研究人員一直致力于解決棘手的問題。他們跟隨深度學習的腳步,解決了經典算法無法解決的任務(圖像分類),得到了很多的牽引和關注。他們著手解決目前經典算法幾乎無法解決的非常困難的問題。谷歌的DeepMind專注于在圍棋等非常復雜的游戲中擊敗人類,而OpenAI專注于開發(fā)通用的人工智能

另外,強化學習也可以用來自動解決更簡單的問題,而不是專注于困難的問題,這些問題目前都是人工完成的,需要花費大量的時間和精力來解決,比如為3D打印機或其他復雜的機械部件開發(fā)一個控制循環(huán)。這種影響不如開發(fā)通用智能具有新聞價值,但它可以為許多制造組織中的許多控制工程師節(jié)省時間和精力。

用RL調整火箭發(fā)動機

我們制作了火箭發(fā)動機或燃氣輪機中遇到的流體動力學問題的簡化版本。為這樣的系統(tǒng)開發(fā)控制算法可能需要長達3個月的設計、測試和驗證。這是一個非線性控制問題,需要工程師的智慧和時間來解決,可以證明強化學習在解放工程師時間方面的可行性。

以流體動力學中的一個非線性控制問題為例,說明了用強化學習開發(fā)控制算法的可行性

這是一個跨學科的項目,需要推動工程師之間的合作來定義問題,仿效工程師來構建一個準確的系統(tǒng)模擬,以及一個培訓代理的機器學習工程師。最后,結果表明強化學習算法可以產生與控制工程師一樣好的控制策略,并且可以節(jié)省數月的試驗時間。

針對流體動力學控制問題,策略優(yōu)化過程中的模擬狀態(tài)快照。

一個使用深度增強學習(Proximal Policy Optimization)訓練過的代理對一個新目標做出反應。代理平均通過4個步驟自動更改輸入參數以匹配所需的輸出。結果與由工程師開發(fā)和調整的控制算法一樣好。

結論

我們使用強化學習來為火箭發(fā)動機的制造提供一個有效的解決方案,而不是使用機器學習技術來解決以前幾乎不可能完成的任務。使用機器學習解決更簡單的問題是一種適用于許多領域的方法,如制造業(yè)、汽車和航空航天工業(yè)。強化學習研究人員通常是看不到這些行業(yè)所面臨的困難,同樣地,這些行業(yè)往往也不熟悉強化學習領域的進展。這種脫節(jié)更突出了機器學習產品經理在機器學習與產品需求之間的聯系,以及彌合學科之間的差距方面所起到的作用。

Insight的數據產品管理研究項目(The Insight Data Product Management Fellowship)提供了一個協(xié)作學習環(huán)境來彌補這一差距。產品經理、工程師和數據科學家通過利用各自在這些領域的專長,共同構建交叉學科的產品。Insight吸引了來自工程、科學和產品領域的不同背景的學者,當他們聚在一起時,我們看到機器學習的新應用成功地解決了各個行業(yè)的問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴

原文標題:如何利用強化學習設計出更好的火箭發(fā)動機

文章出處:【微信號:BigDataDigest,微信公眾號:大數據文摘】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    汽車發(fā)動機是如何工作的

    汽車,作為現代社會不可或缺的交通工具,其核心部件 —— 發(fā)動機,猶如人類的心臟,為車輛源源不斷地提供動力,驅動著我們馳騁在道路之上。那么汽車發(fā)動機究竟是如何工作的呢? 汽車發(fā)動機的類型多樣,常見的有
    的頭像 發(fā)表于 02-05 11:13 ?51次閱讀

    探討未來發(fā)動機機油的研發(fā)之路

    ? 殼牌全球解決方案的Karin Haumann在采訪中分享了關于新型PC-12發(fā)動機機油的見解,并探討了替代燃料對其研發(fā)過程的影響。 八月,殼牌Rotella在俄亥俄州鮑靈格林舉辦的全美拖拉機拉力
    的頭像 發(fā)表于 01-03 11:10 ?736次閱讀

    全球53種汽車發(fā)動機技術匯總

    1,SOHC (單頂置凸輪軸發(fā)動機)根據凸輪軸位置數量劃分的發(fā)動機類型,SOHC表示單頂置凸輪軸發(fā)動機,適用于2氣門發(fā)動機。 2,DOHC
    的頭像 發(fā)表于 12-30 11:32 ?944次閱讀

    LoRaWAN網絡在智慧水務創(chuàng)新解決方案

    隨著城市化的不斷發(fā)展,對水資源的高效管理變得愈發(fā)重要。LoRaWAN(低功耗廣域網)網絡作為一種適用于長距離、低功耗的通信解決方案,正日益在智慧水務領域展現其獨特的創(chuàng)新應用。本文探討
    的頭像 發(fā)表于 12-20 16:17 ?279次閱讀
    LoRaWAN網絡在智慧水務<b class='flag-5'>中</b>的<b class='flag-5'>創(chuàng)新解決方案</b>

    發(fā)動機試驗臺架遠程管理運維系統(tǒng)方案

    、加速實驗等。這些測試有助于評估發(fā)動機的動力性、經濟性、可靠性和耐久性。 發(fā)動機需要這些實驗數據以評估設備性能并對產品研發(fā)工作進行進一步修改,就需要實驗過程的安全可靠,對試驗臺架的運行安全提出越來越高的要求
    的頭像 發(fā)表于 12-01 16:28 ?216次閱讀

    氣密測試解決方案---汽摩發(fā)動機

    應用背景發(fā)動機作為汽車和摩托車最關鍵的心臟部位,整體的安全性可想而知,作為汽車、摩托車發(fā)動機最必要的一環(huán)---氣密性檢測也是各個發(fā)動機生產廠家最為關注的關鍵點。檢測產品1、缸體、缸蓋、缸頭以及
    的頭像 發(fā)表于 11-26 01:06 ?215次閱讀
    氣密測試<b class='flag-5'>解決方案</b>---汽摩<b class='flag-5'>發(fā)動機</b>

    全柴發(fā)動機和云內發(fā)動機哪個好

    全柴發(fā)動機和云內發(fā)動機各有其優(yōu)勢和特點,選擇哪個更好主要取決于具體的應用場景、性能需求以及預算等因素。以下是對兩款發(fā)動機的綜合比較: 全柴發(fā)動機 優(yōu)勢 : 可靠性高 :全柴
    的頭像 發(fā)表于 09-23 14:37 ?2383次閱讀

    直噴發(fā)動機的優(yōu)缺點有哪些

    直噴發(fā)動機,也稱為燃油直噴(Direct Injection,簡稱DI)發(fā)動機,是一種燃油直接噴射到發(fā)動機燃燒室的技術。與傳統(tǒng)的進氣道噴
    的頭像 發(fā)表于 09-23 11:40 ?701次閱讀

    直噴發(fā)動機和電噴發(fā)動機的區(qū)別

    , DI) 直噴發(fā)動機技術,也稱為缸內直噴,是一種燃油直接噴射到發(fā)動機的燃燒室內的技術。這種技術可以更精確地控制燃油的噴射量和噴射時機,從而提高燃油效率和動力輸出。 工作原理 燃油噴射 :在直噴
    的頭像 發(fā)表于 09-23 11:36 ?488次閱讀

    電控發(fā)動機的優(yōu)點與工作原理

    隨著汽車工業(yè)的不斷發(fā)展和科技的進步,電控發(fā)動機逐漸成為現代汽車的核心部件。電控發(fā)動機以其高精度控制、高效能燃燒、低排放等優(yōu)點,受到廣泛關注和青睞。本文將對電控發(fā)動機的優(yōu)點和工作原理進行詳細的闡述,旨在為讀者提供全面的了解和認識。
    的頭像 發(fā)表于 06-20 11:33 ?1195次閱讀

    發(fā)動機電子控制系統(tǒng)的優(yōu)點有哪些?

    發(fā)動機電子控制系統(tǒng),也被稱為發(fā)動機管理系統(tǒng)(Engine Management System,簡稱EMS),是一種利用電子技術對發(fā)動機運行進行實時監(jiān)控和控制的系統(tǒng)。它通過收集各種傳感器信號,對
    的頭像 發(fā)表于 06-17 10:25 ?1028次閱讀

    汽車發(fā)動機上的電控技術主要包括什么

    ,實時調整燃油噴射量,以實現最佳的空燃比和燃燒效率。電控燃油噴射系統(tǒng)主要包括以下幾個部件: 1.1 燃油泵:負責燃油從油箱輸送到噴油器。 1.2 噴油器:根據ECU的指令,燃油噴射到發(fā)動
    的頭像 發(fā)表于 06-17 10:18 ?1095次閱讀

    發(fā)動機實現閉環(huán)反饋的主要元件是

    傳感器是發(fā)動機閉環(huán)反饋系統(tǒng)的關鍵元件,它們負責實時監(jiān)測發(fā)動機的各種參數,并將這些參數轉換為電信號,發(fā)送給控制器。發(fā)動機閉環(huán)反饋系統(tǒng)中常用的傳感器包括: 1.1 空氣流量傳感器 空氣
    的頭像 發(fā)表于 06-17 10:15 ?642次閱讀

    基于隱形飛機噴氣式發(fā)動機雙S彎噴管的纖維纏繞工藝

    使用了基于相對彎曲脊柱生成的螺旋路徑的方法。這類似于相對軸線為直線的普通圓管的纏繞螺旋線。 關鍵詞:非軸對稱繞組仿真、纖維纏繞工藝仿真 基于隱形飛機噴氣式發(fā)動機雙S彎噴管的纖維纏繞工藝 在現代戰(zhàn)爭
    發(fā)表于 04-19 09:52

    等離子發(fā)動機的原理 等離子發(fā)動機最大推力是多少

    是指由電離的電子和正離子構成的穩(wěn)定氣體。為了產生等離子體,等離子發(fā)動機首先通過電離器氣體加熱,并加入電磁場使氣體的原子或分子發(fā)生電離。電離過程,電子會從外層軌道躍遷到內層軌道,從
    的頭像 發(fā)表于 02-14 18:18 ?5993次閱讀
    真人百家乐官网怎么对冲| 棋牌平台| 百家乐官网备用网址| 澳门百家乐官网出千| 百家乐开户投注| 百家乐官网网站加盟| 威尼斯人娱乐城线上博彩| 宾利百家乐现金网| 百家乐官网赌博合作| 黔江区| 德州扑克几副牌| 百家乐打劫法| 百家乐官网专打方法| 澳门百家乐官网怎洋赢钱| 凌龙棋牌官方下载| 济州岛百家乐的玩法技巧和规则 | 青岛棋牌室| 威尼斯人娱乐平台注册| 金公主百家乐现金网| 百家乐官网路纸发表区| 六合彩报纸| 太阳城77娱乐城| 金樽百家乐的玩法技巧和规则| 7位百家乐官网扑克桌| 新锦江百家乐官网娱乐场| 百家乐官网外挂程式| 新利娱乐开户| 人气最高棋牌游戏| 大发888体育场下载| 大发888 894| 威尼斯人娱乐城百家乐赌博| 乐享百家乐的玩法技巧和规则| 百家乐西园二手房| 真钱百家乐游戏排行| 大发888娱乐城六合彩| 大发888鸿博博彩| 网络百家乐网站| 百家乐怎么计算概率| 博天堂百家乐官网的玩法技巧和规则 | 大发888娱乐场下载客户端| 博狗百家乐开户|