工学 >>> 计算机科学技术 >>> 计算机科学技术基础学科 人工智能 计算机系统结构 计算机软件 计算机工程 计算机应用 计算机科学技术其他学科
搜索结果: 1-7 共查到计算机科学技术 跨语言相关记录7条 . 查询时间(0.158 秒)
本发明公开了一种融合词对齐适配器模块的跨语言文本表示方法、装置、设备及存储介质,涉及人工智能、自然语言处理、文本建模等技术领域。具体实现方案为:构建源语言?目标语言平行语料数据集,通过无监督词对齐算法对平行语句构建词对齐矩阵;在Transformer结构的跨语言预训练模型的每个子层之间插入词对齐适配器,通过掩码语言建模与词对齐建模联合训练,实现跨语言表示特征的语义对齐;将所述词对齐适配器模块生成的...
本发明公开了一种基于残差修剪的跨语言机器翻译方法、装置、电子设备及存储介质。该方法获取多语言数据集,对所述数据集进行预处理和数据集划分;将预处理得到的数据进行目标语言标记并利用Fairseq对训练集和验证集进行二值化处理;将二值化后的数据输入经过残差修剪的编码器进行编码训练;将编码器输出的高维向量表示利用解码器进行解码生成目标语言语句,实现最终的非平行语言间的翻译。本发明通过修剪残差连接的方式,有...
跨语言自动摘要是一项对源语言文本核心信息进行内容归纳,以目标语言的形式组织成摘要的任务。跨语言自动摘要方法研究对于跨境电商(辅助用户进行决策)、舆情分析(帮助分析人员过滤冗余信息)和内容推荐(为用户推荐外语新闻)等应用场景具有重要意义。 由于平行数据的缺失,大多数已有的跨语言自动摘要方法只能基于管道式方法实现,造成严重的误差传播问题,使得摘要质量受到极大的制约。
学术搜索是一种行业化的搜索引擎,因其缺乏个性化、智能化的服务,使得用户的学术文献检索效率低下,海量的数字学术资源得不到充分利用。本研究跨语言智能学术搜索系统的设计与实现,旨在让用户可以在尽可能短的时间内找到所需学术资源。系统的几个关键技术包括:研究混合语种文本的分词技术;研究基于机器翻译的跨语言信息检索;研究搜索结果聚类算法在不同语言文本上的性能差异问题;研究基于聚类的个性化信息检索方法以及交互式...
针对传统查询扩展方法存在的问题,提出一种基于潜在语义分析的跨语言扩展方法,利用聚类提高扩展文本集合的精度,并用潜在语义分析实现无需翻译的查询扩展,减轻翻译歧义带来的影响。实验结果表明,该方法能够获得较好的性能。
跨语言信息检索中,输入的查询语句往往是一系列关键词组合,而不是一个完整意义上的句子,致使查询关键词序列缺乏必要的语法、语境信息,难以实现查询语句的精确翻译。该文基于大规模双语语料库,以向量空间模型和词汇同现互信息为理论基础,运用传统单语信息检索技术,将查询语句的翻译问题转换为查询关键词词典义项的boost值计算,重构目标语查询语句
NTCIR的测试集是效仿TREC测试集的构架而建立的"可携式"测试集(即可应用于不同的测试目的及需求的通用测试集)。第一届NTCIR Workshop开始于1998年11月,并于1999年8月30日至9月1日在日本东京举行了会议。来自6个国家的28个组织参加了研究任务并提交了结果。第二届开始于2000年的6月,并于2001年3月7-9日在日本东京举行会议。来自包括美国、日本、中国等8个国家的46个...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...