专利名称 ---【 一种事件发展脉络图生成方法 】

基本信息
申请号
CN201811631236.X
申请日
20181229
公开(公告)号
CN111382276A
公开(公告)日
20200707
申请(专利权)人
中国科学院信息工程研究所
申请人地址
100093 北京市海淀区闵庄路甲89号
发明人
虎嵩林;吕尚文;黄龙涛;韩冀中; 专利类型 发明专利
摘要
本发明公开了一种事件发展脉络图生成方法。本方法为:1)对语料库中的每一新闻文本,生成该新闻文本的向量表示并抽取该新闻文本中的实体、事件隐含话题;2)计算目标事件的新闻文本与语料库中各新闻文本之间的实体相似性、话题相似性和向量表示相似性,并根据计算结果选取该目标事件的新闻集合;3)将该新闻集合中的每一篇新闻文本看作该目标事件的事件发展脉络图中的一节点,并计算节点之间的相似度,如果两节点的相似度大于设定阈值,则生成一连接该两节点的边,从而生成该新闻集合的新闻文本关系图;4)对该新闻文本关系图进行子事件划分,得到若干子事件阶段;5)根据每个子事件阶段对应的代表性文档生成该目标事件的事件发展脉络图。
主权项
1.一种事件发展脉络图生成方法,其步骤包括:1)对语料库中的每一新闻文本,生成该新闻文本的向量表示并抽取该新闻文本中的实体、事件隐含话题;2)计算目标事件的新闻文本与该语料库中各新闻文本之间的实体相似性、话题相似性和向量表示相似性,并根据计算结果选取出该目标事件的新闻集合;3)将该新闻集合中的每一篇新闻文本看作该目标事件的事件发展脉络图中的一个节点,并计算节点之间的相似度,如果两节点的相似度大于设定阈值,则生成一连接该两节点的边,从而生成该新闻集合的新闻文本关系图;4)对该新闻文本关系图进行子事件划分,得到若干子事件阶段;5)分别从每个子事件阶段对应的新闻文本集合中选取出代表性的文档来作为该目标事件的发展状况,然后根据各所选代表性文档生成该目标事件的事件发展脉络图。

 

IPC信息
IPC主分类号
G06F16/36

 

法律状态信息
法律状态公告日
20200707
法律状态
公开 法律状态信息
CN201811631236 20200707 公开 公开

 

代理信息
代理机构名称
北京君尚知识产权代理有限公司 11200
代理人姓名
司立彬


| 联系我们 | 网站地图 | 版权声明 |

版权:中国科学院 主办:中国科学院科技促进发展局 承办:中国科学院成都文献情报中心 蜀ICP备05003827号-12

建议使用1024×768 分辨率 IE6.0以上版本浏览器