資料介紹
針對分層強化學習需要人工給出層次結構這一問題,同時考慮到基于狀態空間的自動分層方法在環境狀態中沒有明顯子目標時分層效果并不理想的情況,提出一種基于動作空間的自動構造層次結構方法。首先,根據動作影響的狀態分量將動作集合劃分為多個不相交的子集;然后,分析Agent在不同狀態下的可用動作,并識別瓶頸動作;最后,由瓶頸動作與執行次序確定動作子集之間的上下層關系,并構造層次結構。此外,對MAXQ方法中子任務的終止條件進行修改,使所提算法構造的層次結構可以通過MAXQ方法找到最優策略。實驗結果表明,所提算法可以自動構造層次結構,而不會受環境變化的干擾。與Q學習、Sarsa算法相比,MAXQ方法根據該結構得到最優策略的時間更短,獲得回報更高。驗證了所提算法能夠有效地自動構造MAXQ層次結構,并使尋找最優策略更加高效。
- 基于層次值的皮膚創面形態學展開方法綜述 6次下載
- 基于POI分布的空間索引結構TDG 10次下載
- 基于數據外包的空間查詢驗證方法 23次下載
- 可提取非線性結構的子空間聚類方法 2次下載
- 基于層次值的皮膚創面形態學展開方法 31次下載
- DSP不同層次的低功耗設計研究思路綜述 19次下載
- 一種可行的分布式存儲系統安全構造方法 21次下載
- 基于異質網絡層次的基因節點表示學習方法 5次下載
- 可同步目標導向行為和記憶空間結構的視覺導航方法 11次下載
- 基于空間/通道注意力機制的化學結構圖像識別方法 7次下載
- 基于層次社區結構的大規模社會網絡K-出入度匿名算法 8次下載
- 一種層次結構中多維屬性的可視化方法 0次下載
- 基于思維導圖層次結構的本體庫創建方法 17次下載
- 層次原理圖設計 0次下載
- 結構設計中的鋼筋混凝土構造
- arcgis空間分析方法有哪些 1758次閱讀
- 在 MATLAB 中實現層次分析法的主要步驟 2047次閱讀
- 計算機網絡的層次結構 7323次閱讀
- 聚類分析中的機器學習與統計方法綜述(二) 799次閱讀
- Matplotlib圖表層次結構 1712次閱讀
- 步進電機零位標定的方法 7678次閱讀
- 熱繼電器的結構圖解 1.7w次閱讀
- C++:詳談拷貝構造函數 2040次閱讀
- 組合開關構造_組合開關選用 5230次閱讀
- 自動空氣開關的結構和工作原理 1.4w次閱讀
- 如何通過MEC構造基于深度學習的自動駕駛汽車緩存 4424次閱讀
- 自動神經結構搜索方法實現高效率卷積神經網絡設計 5165次閱讀
- 一種利用強化學習來設計mobile CNN模型的自動神經結構搜索方法 3747次閱讀
- 哈夫曼算法的理解及原理分析,算法實現,構造哈夫曼樹的算法 3.4w次閱讀
- 利用狀態機的狀態機實現層次結構化設計 3248次閱讀
下載排行
本周
- 1HFSS電磁仿真設計應用詳解PDF電子教程免費下載
- 24.30 MB | 126次下載 | 1 積分
- 2H橋中的電流感測
- 545.39KB | 7次下載 | 免費
- 3雷達的基本分類方法
- 1.25 MB | 4次下載 | 4 積分
- 4I3C–下一代串行通信接口
- 608.47KB | 3次下載 | 免費
- 5電感技術講解
- 827.73 KB | 2次下載 | 免費
- 6從 MSP430? MCU 到 MSPM0 MCU 的遷移指南
- 1.17MB | 2次下載 | 免費
- 7有源低通濾波器設計應用說明
- 1.12MB | 2次下載 | 免費
- 8RA-Eco-RA2E1-48PIN-V1.0開發板資料
- 35.59 MB | 2次下載 | 免費
本月
- 12024年工控與通信行業上游發展趨勢和熱點解讀
- 2.61 MB | 763次下載 | 免費
- 2HFSS電磁仿真設計應用詳解PDF電子教程免費下載
- 24.30 MB | 126次下載 | 1 積分
- 3繼電保護原理
- 2.80 MB | 36次下載 | 免費
- 4正激、反激、推挽、全橋、半橋區別和特點
- 0.91 MB | 32次下載 | 1 積分
- 5labview實現DBC在界面加載配置
- 0.57 MB | 21次下載 | 5 積分
- 6在設計中使用MOSFET瞬態熱阻抗曲線
- 1.57MB | 15次下載 | 免費
- 7GBT 4706.1-2024家用和類似用途電器的安全第1部分:通用要求
- 7.43 MB | 13次下載 | 免費
- 8PADS-3D庫文件
- 2.70 MB | 10次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935113次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420061次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233084次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191360次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183329次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81578次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73804次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65985次下載 | 10 積分
評論
查看更多