搜索结果: 91-105 共查到“知识库 自然语言处理”相关记录311条 . 查询时间(3.415 秒)
使用半监督学习方法中的自训练、协同训练方法,利用少量已标注样本和大量未标注样本来完成蛋白质关系抽取的任务.首先使用基于词特征的SVM(support vector machine)模型进行自训练,然后使用基于词特征的SVM模型和基于依存树特征的SVM模型进行协同训练.通过对4个语料的实验,验证了自训练及协同训练方法在蛋白质关系抽取领域中的应用效果.相比于自训练,协同训练可以通过两个相对独立的视图相...
随着计算机网络的发展,电子文章逐渐繁荣.电子文章版权保护近年来也越来越受关注.电子文章版权保护的一个解决方案是,首先提取一个作者的写作特征,通过写作特征的比较来判断版权所属.目前作者特征提取方向的研究多集中在寻找新的更有效的特征上.如何更加有效的提取一个作者的写作特征仍是一件富有挑战性的工作.本文建立了一个作者特征提取引擎模型,该引擎以某个作者某一类型的文章作为输入,以该作者在这一类型文章上的写作...
We present the first unsupervised approach to the problem of learning a semantic parser, using Markov logic. Our USP system transforms dependency trees into quasi-logical forms, recursively induces la...
Learning Context-Dependent Mappings from Sentences to Logical Form
Learning Context-Dependent Mappings Sentences Logical Form
2009/11/5
We consider the problem of learning context-dependent mappings from sentences to logical form. The training examples are sequences of sentences annotated with lambda-calculus meaning representations. ...
一种提高本体映射精确度的方法
本体映射 自然语言处理 WordNet词库
2009/11/5
针对本体映射精确度不高的问题,提出一种基于自然语言处理的本体映射结果校验方法。对复合词进行启发式处理,分析WordNet词库中词汇所对应注释的语法树,提取与参考本体和目标本体相关的词汇,对已有的本体映射结果进行校验。实验结果表明,该方法能有效提高本体映射的精确度。
话题发现与追踪技术研究
话题发现与追踪 统一研究框架 表示模型
2009/11/4
话题发现与追踪以新闻流为处理对象,采用基于事件的信息组织方式进行研究,一直是自然语言处理领域里的热点。该研究借鉴大量相关研究尤其是信息检索中的经典模型和方法,取得了很大成功。首先介绍了话题发现与追踪的主要研究内容、评价方法以及发展历史;然后对其多个研究内容提出一个统一研究框架,并对该框架中的关键技术进行了详细分析;最后指出该领域中的关键问题及难点,并对未来研究做出展望。
11001 New Features for Statistical Machine Translation
11001 New Features Statistical Machine Translation
2009/11/2
We use the Margin Infused Relaxed Algorithm of Crammer et al. to add a large number of new features to two machine translation systems: the Hiero hierarchical phrasebased translation system and our sy...
Multi-task learning is the problem of maxi-mizing the performance of a system across a number of related tasks. When applied to mul-tiple domains for the same task, it is similar to domain adaptation,...
Fast Translation Rule Matching for Syntax-based Statistical Machine Translation
Fast Translation Rule Matching Syntax-based Statistical Machine Translation
2009/10/22
Fast Translation Rule Matching for Syntax-based Statistical Machine Translation。
Effective Use of Linguistic and Contextual Information for SMT
Effective Use Linguistic Contextual Information SMT
2009/10/22
Effective Use of Linguistic and Contextual Information for SMT。
改进的基于句模匹配算法的问句理解方法
自然语言处理 句模匹配算法 词库匹配算法
2009/10/20
句模匹配方法是基于字符表层的文本分析技术,只能处理各个关键词中有分隔词的问句,具有局限性。针对该问题,结合问答系统的应用背景,提出将句模匹配与关键词词库匹配相结合的方法,改进了传统的句模匹配问句理解方法。实际应用表明,该方法能扩大问句理解的范围,提高问句理解的准确性。
混合的汉语基本名词短语识别方法
基本名词短语 规则模板 组合分类器
2009/10/20
提出一种混合的汉语基本名词短语(BaseNP)识别模型,包括采用语法规则、统计方法和组合分类器方法。利用BaseNP词的信息、词性信息及上下文句法信息,构建组合分类器,提高判断的准确性。在中文树库(CTB5.0)上进行实验,F值达到了90.09%,证明该方法能有效地识别BaseNP。
A Compact Forest for Scalable Inference over Entailment and Paraphrase Rules
Compact Forest Scalable Inference over Entailment Paraphrase Rules
2009/10/20
A large body of recent research has been investigating the acquisition and application of applied inference knowledge. Such knowledge may be typically captured as entailment rules, applied over syntac...
基于逻辑行和最大接纳距离的网页正文抽取
信息抽取 网页正文 逻辑行
2009/10/10
网页正文抽取是很多互联网应用的基础工作和必须解决的问题。目前的主流方法是基于DOM树结构,此方法需要解析出网页的DOM树结构。对于目前互联网上的网页来源众多、结构众多的情形,基于DOM树的处理方法除了性能不足以外,还会遇到抽取精度上的问题。针对这些问题,该文提出了一个网页正文抽取的新方法,该方法不依赖DOM树,而是考虑人们编写网页的方式形成一些启发式规则,并结合相关的统计规律,以逻辑行为基本处理单...