动态交互频繁的地铁站台车门区域易因乘客轨迹交织和方向冲突形成非线性拥堵,传统密集度指标难以准确捕捉风险。本文提出DB-DDPG-ET综合评估框架,通过双分支深度确定性策略梯度算法提取乘客位置、速度和角度熵特征,再利用熵权TOPSIS方法融合为集成熵驱动 ...
markdown 国家知识产权局最新信息显示,江苏科技大学、南京合信自动化有限公司和中国矿业大学联合申请了一项名为“基于DDPG强化学习算法的机器人焊缝打磨控制方法、系统和存储介质”的专利,公开号为CN120480905A,申请日期为2025年5月。该专利的公布,标志着 ...
循环水养殖系统(RAS)虽为可持续鱼类生产带来希望,但高能耗制约其发展。研究人员开展了利用混合长短期记忆(LSTM)- 深度确定性策略梯度(DDPG)方法优化 RAS 能源的研究。结果显示可降低 15 - 20% 日能耗,减少 17% 每千克鱼生产的能源成本。该研究为水产 ...
工信部:“二次号码”焕新,一键解绑历史互联网账号。
本项目为本人2024.12在某基金量化部门实习时的所完成,和公司达成一致后开源代码. 本项目基于论文 《Deep Reinforcement Learning for Automated Stock Trading: An Ensemble Strategy》,该论文发表于 2020 年 ACM 国际金融人工智能会议(ICAIF 2020)。论文提出了一种集成策略,将 Proximal ...
金融界2025年2月25日消息,国家知识产权局信息显示,国网(山东)电动汽车服务有限公司取得一项名为“基于背向DDPG的机械臂精准路径规划方法及系统”的专利,授权公告号 CN 118832601 B,申请日期为2024年9月。 天眼查资料显示,国网(山东)电动汽车服务有限 ...
[导读]“双碳”背景下 ,光储充电站逐渐成为未来充电站的一种主流形式 。为提高光储充电站的经济效益并降低二 氧化碳 排放 ,提出了一种基于改进深度强化学习的光储充电站实时控制策略 。首先 ,建立以碳排放最小与运行成本最低为目标的优化 模型并将其转换 ...
强化学习是一种通过智能体与环境的交互来学习最优行为策略的方法。值函数近似算法是强化学习中的重要技术之一,用于估计状态或状态动作对的价值。本文将重点比较深度Q网络(DQN)和确定性策略梯度(DDPG)这两种常用的值函数近似算法,探讨其原理 ...
10月10日至10月13日,IEEE车载技术会议(IEEE Vehicular Technology Conference)在中国香港举行。由西南交通大学信息科学与技术学院作为第一单位的论文“DDPG-based Multi-AP Cooperative Access Control in Dense Wi-Fi Networks”荣获大会唯一的最佳学生论文奖(IEEE VTC2023-Fall ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果