基于深度增強學習的衛(wèi)星姿態(tài)控制方法-2019年第04期-中國空間科學技術(shù)-好發(fā)表

首頁 > 期刊 > 中國空間科學技術(shù) > 基于深度增強學習的衛(wèi)星姿態(tài)控制方法【正文】

基于深度增強學習的衛(wèi)星姿態(tài)控制方法

王月嬌; 馬鐘; 楊一岱; 王竹平; 唐磊西安微電子技術(shù)研究所; 西安710065

關(guān)鍵詞：深度增強學習衛(wèi)星姿態(tài)控制動力學環(huán)境自主姿態(tài)控制質(zhì)量參數(shù)

摘要：針對衛(wèi)星在執(zhí)行丟棄載荷或捕獲目標等復雜任務時遭遇的姿態(tài)突然發(fā)生變化的問題,采用深度增強學習方法對衛(wèi)星姿態(tài)進行控制,使衛(wèi)星恢復穩(wěn)定狀態(tài)。具體來說,首先搭建飛行器的姿態(tài)動力學環(huán)境,并將連續(xù)的控制力矩輸出離散化,然后采用Deep Q Network算法進行衛(wèi)星自主姿態(tài)控制訓練,以姿態(tài)角速度趨于穩(wěn)定作為獎勵獲得離散行為的最優(yōu)智能輸出。仿真試驗表明,面向空間衛(wèi)星姿態(tài)控制的深度增強學習算法能夠在衛(wèi)星受到突發(fā)隨機擾動后穩(wěn)定衛(wèi)星姿態(tài),并能有效解決傳統(tǒng)PD控制器依賴被控對象質(zhì)量參數(shù)的難題。所提出的方法采用自主學習的方式對衛(wèi)星姿態(tài)進行控制,具有很強的智能性和一定的普適性,在未來衛(wèi)星執(zhí)行復雜空間任務中的智能控制方面有著很好的應用潛力。

中國空間科學技術(shù)雜志要求:

{1}統(tǒng)計學符號：按GB3358-1982《統(tǒng)計學名詞及符號》的有關(guān)規(guī)定書寫。

{2}內(nèi)容突出理論性、學術(shù)性、實用性和探索性。

{3}參考文獻：是對引文作者、作品、出處、版本等情況的說明。文未依次排列參考文獻時，按作者、書刊名或出版社、出版年（期）、起訖頁順序標注。

{4}中英文摘要(200字左右)、中英文關(guān)鍵詞3-5個（均用分號隔開）。

{5}來稿請附作者詳細聯(lián)系方式(姓名、單位、通訊地址、郵編、郵箱、固定電話、手機等)。

注：因版權(quán)方要求，不能公開全文，如需全文，請咨詢雜志社

投稿咨詢免費咨詢