關(guān)鍵詞:深度增強學習 衛(wèi)星姿態(tài)控制 動力學環(huán)境 自主姿態(tài)控制 質(zhì)量參數(shù)
摘要:針對衛(wèi)星在執(zhí)行丟棄載荷或捕獲目標等復雜任務時遭遇的姿態(tài)突然發(fā)生變化的問題,采用深度增強學習方法對衛(wèi)星姿態(tài)進行控制,使衛(wèi)星恢復穩(wěn)定狀態(tài)。具體來說,首先搭建飛行器的姿態(tài)動力學環(huán)境,并將連續(xù)的控制力矩輸出離散化,然后采用Deep Q Network算法進行衛(wèi)星自主姿態(tài)控制訓練,以姿態(tài)角速度趨于穩(wěn)定作為獎勵獲得離散行為的最優(yōu)智能輸出。仿真試驗表明,面向空間衛(wèi)星姿態(tài)控制的深度增強學習算法能夠在衛(wèi)星受到突發(fā)隨機擾動后穩(wěn)定衛(wèi)星姿態(tài),并能有效解決傳統(tǒng)PD控制器依賴被控對象質(zhì)量參數(shù)的難題。所提出的方法采用自主學習的方式對衛(wèi)星姿態(tài)進行控制,具有很強的智能性和一定的普適性,在未來衛(wèi)星執(zhí)行復雜空間任務中的智能控制方面有著很好的應用潛力。
中國空間科學技術(shù)雜志要求:
{1}統(tǒng)計學符號:按GB3358-1982《統(tǒng)計學名詞及符號》的有關(guān)規(guī)定書寫。
{2}內(nèi)容突出理論性、學術(shù)性、實用性和探索性。
{3}參考文獻:是對引文作者、作品、出處、版本等情況的說明。文未依次排列參考文獻時,按作者、書刊名或出版社、出版年(期)、起訖頁順序標注。
{4}中英文摘要(200字左右)、中英文關(guān)鍵詞3-5個(均用分號隔開)。
{5}來稿請附作者詳細聯(lián)系方式(姓名、單位、通訊地址、郵編、郵箱、固定電話、手機等)。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社