龚才春

龚才春    

中国科学院计算技术研究所

【学科领域】


6
专利
4
论文
0
科技成果
0
软件著作权
0
其它


[发明专利] 一种构造用于处理大规模词典的完美哈希函数的方法 - CN100495402C

申请人:中国科学院计算技术研究所 申请年:20061231 主分类号:G06F17/30

本发明涉及信息检索和自然语言处理技术领域,公开了一种构造用于 处理大规模词典的完美哈希函数的方法,该方法包括:A、将待构造哈希 函数的词典中的单词平滑;B、将平滑后词典按照单词长度分为n个子词

[发明专利] 一种识别中文文本编码形式的方法 - CN101013420A

申请人:中国科学院计算技术研究所 申请年:20061231 主分类号:G06F17/27

本发明公开了一种识别中文文本编码形式的方法,包括:A.在各种编码形式下分别对待识别文本进行整数ID序列转换;B.判断待识别中文文本是否只能按照某种编码形式转换为整数ID序列,如果是,则执行步骤

[发明专利] 一种面向互联网的有意义串的挖掘方法和系统 - CN101149739A

申请人:中国科学院计算技术研究所 申请年:20070824 主分类号:G06F17/30

本发明公开了一种面向互联网的有意义串的挖掘方法和系统。该方法包括下列步骤:步骤A,重复字符串发现;步骤B,通过上下文邻接分析过滤所述字符串;步骤C,通过语言模型分析过滤所述字符串。其能够有效的

[发明专利] 一种专业术语抽取方法和系统 - CN101122919A

申请人:中国科学院计算技术研究所 申请年:20070914 主分类号:G06F17/30

本发明涉及自然语言计算机处理领域,提供了一种专业术语抽取方法,首先,按照专利文献所属领域的不同将专利文献划分到不同领域的文献库中;而后,以划分后的不同领域的专利文献库,组成语料库,并根据专业术

[发明专利] 一种短文本的新词发现方法和系统 - CN100478961C

申请人:中国科学院计算技术研究所 申请年:20070917 主分类号:G06F17/30

本发明公开了一种从短文本中发现新词的方法,包括以下步骤:获取短文 本中所有多个连续字符或词语,构成候选新词集合;确定符合预先设定规则的 候选新词;将候选新词作为查询关键词,在搜索引擎中进行精确

[发明专利] 一种新词发现方法和系统 - CN101131705A

申请人:中国科学院计算技术研究所 申请年:20070927 主分类号:G06F17/30

本发明公开了一种发现新词的方法,包括以下步骤:查找语料中所有出现频次大于一定阈值的字符串;统计每一个字符串在语料中所有出现位置的左侧和右侧各有多少个不同的字符或词语;若字符串左右侧不同字符或词
个人标签
合作学者

贺敏   合作次数:1

中国科学院计算技术研究所

黄玉兰   合作次数:4

中国科学院计算技术研究所

张华平   合作次数:2

中国科学院计算技术研究所

这是标签3的内容。

这是标签4的内容。

这是标53的内容。

这是标签6的内容。

这是标签7的内容。

这是标签8的内容。

这是标签9的内容。

这是标签10的内容。

这是标11的内容。

这是标签12的内容。

这是标签13的内容。



| 联系我们 | 网站地图 | 版权声明 |

版权:中国科学院 主办:中国科学院科技促进发展局 承办:中国科学院成都文献情报中心 蜀ICP备05003827号-12

建议使用1024×768 分辨率 IE6.0以上版本浏览器