D/Dpg Implementation - 搜索 News

DB-DDPG-ET：一种用于地铁站台上下车过程中人群安全风险评估的新框架

动态交互频繁的地铁站台车门区域易因乘客轨迹交织和方向冲突形成非线性拥堵，传统密集度指标难以准确捕捉风险。本文提出DB-DDPG-ET综合评估框架，通过双分支深度确定性策略梯度算法提取乘客位置、速度和角度熵特征，再利用熵权TOPSIS方法融合为集成熵驱动 ...

搜狐

江苏科大发布基于DDPG强化学习的机器人焊缝打磨专利，**智能制造 ...

markdown 国家知识产权局最新信息显示，江苏科技大学、南京合信自动化有限公司和中国矿业大学联合申请了一项名为“基于DDPG强化学习算法的机器人焊缝打磨控制方法、系统和存储介质”的专利，公开号为CN120480905A，申请日期为2025年5月。该专利的公布，标志着 ...

生物通

创新深度学习策略助力循环水养殖系统高效节能：开启可持续水产 ...

循环水养殖系统（RAS）虽为可持续鱼类生产带来希望，但高能耗制约其发展。研究人员开展了利用混合长短期记忆（LSTM）- 深度确定性策略梯度（DDPG）方法优化 RAS 能源的研究。结果显示可降低 15 - 20% 日能耗，减少 17% 每千克鱼生产的能源成本。该研究为水产 ...

央视网

[新闻直播间]工信部 “二次号码”焕新一键解绑历史互联网账号

工信部：“二次号码”焕新，一键解绑历史互联网账号。

GitHub

Deep Reinforcement Learning for Automated Stock Trading (Ensemble Strategy)

本项目为本人2024.12在某基金量化部门实习时的所完成,和公司达成一致后开源代码. 本项目基于论文《Deep Reinforcement Learning for Automated Stock Trading: An Ensemble Strategy》，该论文发表于 2020 年 ACM 国际金融人工智能会议（ICAIF 2020）。论文提出了一种集成策略，将 Proximal ...

来自MSN

国网（山东）电动汽车服务有限公司取得基于背向DDPG的机械臂精准 ...

金融界2025年2月25日消息，国家知识产权局信息显示，国网（山东）电动汽车服务有限公司取得一项名为“基于背向DDPG的机械臂精准路径规划方法及系统”的专利，授权公告号 CN 118832601 B，申请日期为2024年9月。天眼查资料显示，国网（山东）电动汽车服务有限 ...

51CTO

鸿蒙开发者社区

本文旨在探索DDPG算法如何解决连续动作控制难题，从而进一步提升生物工程领域AI驱动的医疗机器人的强大功能。引言想象一下，你正在手术过程中控制着一台机械臂。此机械臂的离散动作可能有：在这些情况下，你需要的不仅仅是选择一个动作——你必须 ...

51CTO

鸿蒙开发者社区

本文将使用五篇新发表的强化学习论文中介绍的五种算法（DDPG、SAC、PPO、I2A和决策转换器）来训练模拟人形机器人互相打斗并对训练结果进行排名。我想起了最近的一个老电视节目《Battlebots》，并想对这个节目进行进一步的改造。因此，我将使用最新发表的五 ...

21ic

基于PSO-DDPG算法的光储充电站实时控制策略研究

[导读]“双碳”背景下 ,光储充电站逐渐成为未来充电站的一种主流形式。为提高光储充电站的经济效益并降低二氧化碳排放 ,提出了一种基于改进深度强化学习的光储充电站实时控制策略。首先 ,建立以碳排放最小与运行成本最低为目标的优化模型并将其转换 ...

搜狐

强化学习中的值函数近似算法：DQN与DDPG对比研究

强化学习是一种通过智能体与环境的交互来学习最优行为策略的方法。值函数近似算法是强化学习中的重要技术之一，用于估计状态或状态动作对的价值。本文将重点比较深度Q网络（DQN）和确定性策略梯度（DDPG）这两种常用的值函数近似算法，探讨其原理 ...

news.swjtu

信息科学与技术学院研究生荣获IEEE VTC 2023-Fall最佳学生论文奖

10月10日至10月13日，IEEE车载技术会议(IEEE Vehicular Technology Conference)在中国香港举行。由西南交通大学信息科学与技术学院作为第一单位的论文“DDPG-based Multi-AP Cooperative Access Control in Dense Wi-Fi Networks”荣获大会唯一的最佳学生论文奖(IEEE VTC2023-Fall ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

DB-DDPG-ET：一种用于地铁站台上下车过程中人群安全风险评估的新框架

江苏科大发布基于DDPG强化学习的机器人焊缝打磨专利，**智能制造 ...

创新深度学习策略助力循环水养殖系统高效节能：开启可持续水产 ...

[新闻直播间]工信部 “二次号码”焕新 一键解绑历史互联网账号

Deep Reinforcement Learning for Automated Stock Trading (Ensemble Strategy)

国网（山东）电动汽车服务有限公司取得基于背向DDPG的机械臂精准 ...

鸿蒙开发者社区

鸿蒙开发者社区

基于PSO-DDPG算法的光储充电站实时控制策略研究

强化学习中的值函数近似算法：DQN与DDPG对比研究

信息科学与技术学院研究生荣获IEEE VTC 2023-Fall最佳学生论文奖

[新闻直播间]工信部 “二次号码”焕新一键解绑历史互联网账号