工学 >>> 计算机科学技术 >>> 人工智能 >>> 机器翻译 >>>
搜索结果: 91-105 共查到知识库 机器翻译相关记录157条 . 查询时间(3.783 秒)
不确定的中心支持向量机     确定  中心  支持向量机       2009/6/16
在一般支持向量机中,训练集的每个元素(xi,yi),i=1,2,…,l,对输入xi有确定的类别标号yi 。而在许多实际问题中,xi的类别往往是不确定的,常常是以概率zi+属于正类的概率zi-属于负类。针对这种实际情况,改造训练集,把原来的yi,用zi+,zi-代替,然后建立分类最优先模型,构建不确定中心支持向量机。
对用于回归估计的标准SVR算法加以改进,提出了回归型支持向量机的一种改进算法。并针对医学上胆固醇含量测定问题进行了回归估计。实验表明,该算法在运算速度和回归估计精度的稳定性上都明显优于标准算法,特别适于解决大规模样本问题。
FSL-SP的研究     机器学习  策略模式  FSL-SP       2009/5/14
在机器学习领域,特征选择对于提高学习机器的性能和效率具有重要意义,但是当前特征选择算法普遍存在着具体实现独立性强、可扩展性差的问题,使得对多种算法性能的统一对比评估实施困难,算法的替换和扩展比较复杂。以面向对象的设计理念为指导,基于设计模式中的策略模式,提出特征选择算法工具库FSL的设计构想,通过将一些常用的特征选择算法按照策略模式进行包装,以便机器学习算法用户的使用,同时确保其较强的可扩展性。 ...
模糊粗糙集知识约简是模糊粗糙集理论的核心内容之一。该文从粗糙集知识熵出发,结合模糊集隶属度函数,将其应用于模糊环境下,推广了互信息的度量概念,使其能评价模糊决策表中属性的重要性。并给出了一种模糊决策表的启发式属性约简算法,通过实例验证了它的可行性,为模糊决策表的属性约简提供了一种有效的方法。
翻译实例库是基于实例的机器翻译系统的主要知识源。本文采用基于浅层句法分析的方法进行翻译实例的获取。首先根据浅层句法信息划分源语言和目标语言的翻译单元,然后在词对齐结果的指导下,利用统计对齐模型确定源语言和目标语言翻译单元之间的映射关系,从而获取翻译实例。通过与几种较具代表性的翻译实例获取方法进行对比实验发现,无论是对翻译实例库直接评测,还是通过EBMT系统进行间接评测,该方法都获得了令人满意的效果...
This paper presents an overall introduction to the CWMT2008 evaluation and focuses on its two new metrics: BLEU-SBP (Chiang et al., 2008) and linguistic check-point me-thod (Zhou et al., 2008). BLEU-S...
最小错误率训练是统计机器翻译中标准的调参方法,但由于搜索过程中的贪婪特性,往往会导致结果不稳定或陷入局部最优。本文提出投票平均方法来增强标准调参方法——通过翻译验证集,对训练过程的中间结果进行投票平均,从而获得更稳定和准确的参数。在新闻和口语两个领域上的中文到英文翻译的实验表明,本方法是有效的。
Tree-based statistical machine translation models have made significant progress in re-cent years, especially when replacing 1-best trees with packed forests. However, as the parsing accuracy usuall...
Current system combination methods usu-ally use confusion networks to find consensus translations among different systems. Requir-ing one-to-one mappings between the words in candidate translations, c...
人工书写的翻译模板包含语言学知识,能够准确捕捉语言对之间的对应关系。尽管这些模板的准确度高,但它们没有概率信息,难以被应用到统计机器翻译系统中,而且匹配时容易发生冲突。本文提出了一种将人工书写翻译模板应用到统计机器翻译系统中的方法,在统计机器翻译解码的过程中匹配模板,利用对数线性模型选择翻译。这种方法不仅提供了统计机器翻译系统高质量的翻译模板,还利用统计机器翻译系统的框架解决了模板匹配冲突问题。实...
层次短语翻译模型融合了短语模型和句法模型的优点,是当前统计机器翻译的主流模型之一。然而,传统的层次短语抽取方法在抽取过程中,只考虑了对齐一致性和规则长度的限制,没有考虑到句子中存在的短语搭配和高频骨干词,因此抽取出了大量冗余的泛化规则。对此,本文提出了相应抽取约束策略:1)采用对数似然比来确定短语搭配,并且在抽取过程中,把短语搭配当作一个整体语言单位;2)采用频率来识别句子中的高频骨干词,在抽取过...
Current SMT systems usually decode with single translation models and cannot ben-efit from the strengths of other models in decoding phase. We instead proposejoint decoding, a method that combines mul...
Current tree-to-tree models suffer from parsing errors as they usually use only 1-best parses for rule extraction and decod-ing. We instead propose a forest-based tree-to-tree model that uses packed f...
Current statistical machine translation sys-tems usually extract rules from bilingual corpora annotated with 1-best alignments.They are prone to learn noisy rules due to alignment mistakes. We propose...
目前,稳定可靠的信息抽取是一个有待解决的问题,该文提出了基于本体关系匹配信息抽取算法,应用语义Web把信息抽取目标文档描述为特殊的本体格式,采用机器学习理论对本体进行分析和处理。测试数据集的实验结果显示,本体关系集匹配算法优于其他4种信息抽取算法。

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...