搜索结果: 1-7 共查到“计算机科学技术 深度强化学习”相关记录7条 . 查询时间(0.535 秒)
CAA会士面对面系列活动是中国自动化学会为学会会士量身打造的高端学术交流平台,每期活动邀请1位或数位学会会士进行专题报告,围绕国际科技热点,聚焦国家创新发展战略需求,前瞻学科领域发展新方向,积极发挥学术引领和科技智库作用,展现重大学术咨询研究成果,引导社会尊崇科学思想和方法,促进公众提升科学意识和素养。
异策略深度强化学习中的经验回放研究综述
深度强化学习 异策略 经验回放 人工智能
2024/1/16
作为一种不需要事先获得训练数据的机器学习方法,强化学习(Reinforcement learning,RL)在智能体与环境的不断交互过程中寻找最优策略,是解决序贯决策问题的一种重要方法.通过与深度学习(Deep learning,DL)结合,深度强化学习(Deep reinforcement learning,DRL)同时具备了强大的感知和决策能力,被广泛应用于多个领域来解决复杂的决策问题.异策略...
深度强化学习联合回归目标定位
视觉注意机制 循环神经网络 深度强化学习 目标定位
2024/1/17
为了模拟人眼的视觉注意机制,快速、高效地搜索和定位图像目标,提出了一种基于循环神经网络(Recurrent neural network,RNN)的联合回归深度强化学习目标定位模型.该模型将历史观测信息与当前时刻的观测信息融合,并做出综合分析,以训练智能体快速定位目标,并联合回归器对智能体所定位的目标包围框进行精细调整.实验结果表明,该模型能够在少数时间步内快速、准确地定位目标。
组合优化问题广泛存在于国防、交通、工业、生活等各个领域,几十年来,传统运筹优化方法是解决组合优化问题的主要手段,但随着实际应用中问题规模的不断扩大、求解实时性的要求越来越高,传统运筹优化算法面临着很大的计算压力,很难实现组合优化问题的在线求解.近年来随着深度学习技术的迅猛发展,深度强化学习在围棋、机器人等领域的瞩目成果显示了其强大的学习能力与序贯决策能力。
多机协同是空中作战的关键环节,如何处理多实体间复杂的协作关系、实现多机协同空战的智能决策是亟待解决的问题.为此,提出基于深度强化学习的多机协同空战决策流程框架(Deep-reinforcement-learning-based multi-aircraft cooperative air combat decision framework,DRL-MACACDF),并针对近端策略优化(Proxim...
中国科学院沈阳自动化研究所与爱丁堡机器人中心在基于深度强化学习的机器人控制方面联合研究获进展(图)
中国科学院沈阳自动化研究所 爱丁堡机器人中心 深度强化学习 机器人控制 人工智能学习
2020/3/17
近日,中国科学院沈阳自动化研究所与英国爱丁堡机器人中心合作研究取得新进展,提出了一种在动态、非结构环境下基于深度强化学习的移动机械臂自主作业方法,将最新的人工智能学习理论成功应用于真实的复杂移动机械臂控制。相关研究成果发表于期刊Sensors。