方略学科导航

搜索结果: 1-5 共查到“自动控制理论强化学习”相关记录5条 . 查询时间(0.208 秒)

基于滚动时域强化学习的智能车辆侧向控制算法滚动时域强化学习智能汽车侧向控制 2024/1/16

针对智能车辆的高精度侧向控制问题,提出一种基于滚动时域强化学习(Receding horizon reinforcement learning,RHRL)的侧向控制方法.车辆的侧向控制量由前馈和反馈两部分构成,前馈控制量由参考路径的曲率以及动力学模型直接计算得出;而反馈控制量通过采用滚动时域强化学习算法求解最优跟踪控制问题得到。

存档附件原文地址

第七届深度强化学习理论与应用研讨会顺利召开（图）算法应用交通信号控制无人系统 2023/5/22

2023年1月5-6日，第七届深度强化学习理论与应用研讨会顺利举行。活动聚焦深度强化学习（DRL）与博弈、自动驾驶和机器人等方向的前沿进展与最新成果开展研讨交流，并邀请4位领域专家分别从“小样本强化学习算法及应用的研究进展”，“基于深度强化学习的交通信号控制进展”，“无人系统分布式协同控制”，“基于深度强化学习的智能电网新能源高效利用”等不同主题进行了精彩分享。报告环节在线上平台进行同步直播，吸引...

原文地址

2017年中国多媒体大会：“多媒体信息处理中的深度强化学习”专题会议多媒体多媒体信息处理专题会议数据驱动自然语言语音 2017/2/14

近年来，以数据驱动为核心的深度学习通过逐层抽象方式形成原始数据区别性表达，在自然语言、语音和计算机视觉等领域取得了显著进展。但是，这一任务式、刺激式的学习机制需要向探索式（直觉牵引）、自主式学习机制跃升，具备“学习的学习(learning to learn)”能力，形成解释性强、数据依赖灵活和知识引导的模型和方法。

原文地址

基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制传送带给料生产加工站 Look-ahead控制多Agent强化学习性能函数 2010/3/1

研究多站点传送带给料生产加工站(Conveyor-serviced production station, CSPS)系统的最优控制问题, 其优化目标是通过合理选择每个CSPS的Look-ahead控制策略, 实现整个系统的工件处理率最大.本文首先根据多Agent系统的反应扩散思想, 对每个Agent的原始性能函数进行改进, 引入了具有扩散功能的局域信息交互项(原始项看作具有反应功能); 并运用性...

存档附件原文地址

基于线性平均的强化学习函数估计算法自动控制技术强化学习线性平均 2009/2/24

提出了一种基于最小线性平均的强化学习算法，用于解决连续空间下强化学习函数估计的非收敛性问题。该算法基于梯度下降法，根据压缩映射原理，通过采用线性平均法作为值函数估计的性能衡量标准，把值函数估计的迭代过程转化为一个收敛于不动点的过程。该算法利用强化学习算法的标准问题Mountain Car问题进行了验证，仿真结果验证了算法是有效的和可行的，并且可以快速收敛到稳定值。

存档附件原文地址

中国研究生教育排行榜-条

正在加载...

中国学术期刊排行榜-条

正在加载...

世界大学科研机构排行榜-条

正在加载...

中国大学排行榜-条

正在加载...

人　物-篇

正在加载...

课　件-篇

正在加载...

视听资料-篇

正在加载...

研招资料 -篇

正在加载...

知识要闻-篇

正在加载...

国际动态-篇

正在加载...

会议中心-篇

正在加载...

学术指南-篇

正在加载...

学术站点-篇

正在加载...

中国研究生教育排行榜-条

中国学术期刊排行榜-条

世界大学科研机构排行榜-条

中国大学排行榜-条

人 物-篇

课 件-篇

视听资料-篇

知识库-篇

研招资料 -篇

知识要闻-篇

国际动态-篇

会议中心-篇

学术指南-篇

学术站点-篇

人　物-篇

课　件-篇