专利名称 ---【 强化学习多智能体沟通与决策方法 】

基本信息
申请号
CN201810606662.1
申请日
20180612
公开(公告)号
CN108921298A
公开(公告)日
20181130
申请(专利权)人
中国科学技术大学
申请人地址
230026 安徽省合肥市包河区金寨路96号
发明人
查正军;李厚强;温忻;李斌;王子磊; 专利类型 发明专利
摘要
本发明公开了一种强化学习多智能体沟通与决策方法,包括:根据各个智能体的观测状态信息通过神经网络提取相应的状态特征;将所有智能体的状态特征作为沟通信息输入至VLAD层中进行软分配与聚类,得到聚类后的沟通信息;将聚类后的沟通信息分发给各个智能体,由各个智能体将自身的状态特征与接收到的聚类后的沟通信息进行聚合,并通过智能体内部的全连接神经网络进行动作决策。该方法可以对各智能体的状态信息进行聚类并与其他智能体进行沟通,进而提高智能体的决策水平。
主权项
1.一种强化学习多智能体沟通与决策方法,其特征在于,包括:根据各个智能体的观测状态信息通过神经网络提取相应的状态特征;将所有智能体的状态特征作为沟通信息输入至VLAD层中进行软分配与聚类,得到聚类后的沟通信息;将聚类后的沟通信息分发给各个智能体,由各个智能体将自身的状态特征与接收到的聚类后的沟通信息进行聚合,并通过智能体内部的全连接神经网络进行动作决策。

 

IPC信息
IPC主分类号
G06N99/00

 

法律状态信息
法律状态公告日
20181225
法律状态
实质审查的生效 法律状态信息
CN201810606662 20181225 实质审查的生效 实质审查的生效IPC(主分类):G06N 99/00
法律状态公告日
20181130
法律状态
公开 法律状态信息
CN201810606662 20181130 公开 公开

 

代理信息
代理机构名称
北京凯特来知识产权代理有限公司 11260
代理人姓名
郑立明;郑哲

 

被引专利信息
引用阶段 被引时间 专利号 申请人 公开时间

 

被引非专利信息
引用阶段 被引时间 被引文档类型 被引文档信息


| 联系我们 | 网站地图 | 版权声明 |

版权:中国科学院 主办:中国科学院科技促进发展局 承办:中国科学院成都文献情报中心 蜀ICP备05003827号-12

建议使用1024×768 分辨率 IE6.0以上版本浏览器