成果名称 ---【 "图象、语音、自然语言理解与知识挖掘" 】

基本信息
所属机构
中国科学院自动化研究所
主题词
图像理解;自然语言、语音;数据挖掘
研究起止时间
1999.12 至2003.12
成果公报内容
国家重大基础研究计划(973)项目"图象、语音、自然语言理解与知识挖掘"(G1998030500〕,研究内容主要为:图像理解、视频(动态序列图像)理解以及基于内容的图像视频检索;发展并建立综合各种基本知识源包括韵律结构、声调、语音学和语言学等信息的口语信息处理体系。五年来,上述课题组全体成员努力工作,按照任务书的要求,圆满地完成了课题的预定研究计划;在发展创新理论、突破关键技术、建设数据资源、培养优秀人才等各方面取得了显著进展。任务完成情况以及主要的科研成果概述如下: 1.在图像理解、分割、摄像机标定、图像理解的实验平台、动态序列图像理解、动态序列图像理解、车辆的识别与跟踪、行人识别与跟踪、异常检测与行为预测、对动态场景状态的自然语言描述、图像视频检索系统中的共性关键问题(镜头检测、图像拼接、相关反馈)、数字图像水印、生物特征图像理解与识别(脸像、虹膜、指纹)等研究中,取得了一系列有创新意义的研究成果。研究成果主要发表在图像理解与模式识别领域国内外的主流学术期刊与国际学术会议上,如IEEE Transactions, Pattern Recognition, ICPR, ICCV等。课题实施期间(1998-2005年),在图像理解与模式识别领域国际的顶级刊物IEEE T-PAMI上发表论文6篇(国内同期同类论文总数12篇),另有2篇已被IEEE T-PAMI录用待发。多次应邀在国际主流学术会议上(如IEEE International Conference on Systems, Man and Cybernetics [2001年,美国]、欧洲计算机视觉大会视觉监控研讨会[ECCV Workshop on PETS,2002年,丹麦]、IAPR机器视觉与应用国际会议[MVA'02, 2002年,日本]作大会特邀报告。 2.口语翻译导向的高性能语音识别和理解的研究方面,在基础数据资源、识别和理解方法以及实验系统和平台三个层次上开展了工作。五年来,建立了用于研究的基本语音库、语料库并进行了仔细的标注;参与和组织了多个国际会议和国际研讨会,作为核心成员参加了国际"七国语:言电话语音同声翻译计划"。共发表学术论文167篇,其中学术期刊论文26篇,国际学术会议107篇,国内学术会议34篇,包括大会报告8篇,主持组织召开了三次有重大学术影响的国际学术会议。针对面向奥运的很多应用,包括中、英、日、韩等多语种的语音识别以及人机交互,到2008年,基本实现任何人、在任何时间、任何场所都能够安全、方便、快捷、高效地获取可支付得起的、丰富的、无语言障碍的、个性化的信息服务,保证北京奥运会的出色承办,向世界充分展示中国的信息化水平和成就。我们的任务是实现三个示范工程:多语言奥运信息网站、多语言信息亭和多语言信息服务移动终端。


| 联系我们 | 网站地图 | 版权声明 |

版权:中国科学院 主办:中国科学院科技促进发展局 承办:中国科学院成都文献情报中心 蜀ICP备05003827号-12

建议使用1024×768 分辨率 IE6.0以上版本浏览器