工学 >>> 计算机科学技术 >>> 计算机应用 >>> 中国语言文字信息处理 >>>
搜索结果: 121-135 共查到中国语言文字信息处理相关记录494条 . 查询时间(1.738 秒)
This paper presents a novel approach to open-vocabulary spoken utterance retrieval using confusion networks. If out-of-vocabulary (OOV) words are present in queries and the corpus, word-based indexing...
With an average of 17 Chinese characters per phonetic syllable, correcting conversion errors with current phonetic input method editors (IMEs) is often painstaking and time consuming. We explore the a...
In this paper, we present an unsupervised method for automatically discovering words from speech using a combination of acoustic pattern discovery, graph clustering, and baseform searching. The algori...
复杂背景是影响场景文字自动定位算法性能的重要因素.为消除背景干扰,本文首先根据谱残差理论获取显著性区域,然后利用基于笔画特征的点对梯度方向差比例图与基于傅里叶谱统计特征的后验概率图取得显著性区域的文字置信图,最后借助图模型融合视觉显著性图、文字置信图与HSI颜色特征最终达到抑制自然图像背景并突出前景文字的效果.在ICDAR2011场景文字定位竞赛数据库与实验室场景中文数据库中的实验结果表明,本算法...
本文提出了语言真值格蕴涵代数的蕴涵不可约元、有限蕴涵分解元、有限蕴涵分解不可约元的定义,并研究了它们的结构特征,证明了语言真值格蕴涵代数中的部分元素可由蕴涵不可约元通过张量积运算生成.
中文分词结果对中英命名实体识别及对齐有着直接的影响,本文提出了一种命名实体识别及对齐中的中文分词优化方法.该方法利用实体词汇的对齐信息,首先修正命名实体识别结果,然后根据实体对齐结果调整分词粒度、修正错误分词.分词优化后的结果使得双语命名实体尽可能多地实现一一对应,进而提高中英命名实体翻译抽取和统计机器翻译的效果.实验结果表明了本文优化方法的有效性.
针对目前人工蜂群算法的早熟收敛、陷入局部极值等问题,提出一种基于混沌鲶鱼效应的改进人工蜂群算法.首先,采用随机性更高的混沌序列初始化蜂群以扩大其遍布范围;其次,集成了鲶鱼效应和混沌理论提出了混沌鲶鱼蜂,并引入了它与跌入局部极值的蜂群之间的有效竞争协调机制,从而增进蜜蜂群体跳出局部最优解、加速收敛的能力.支持向量机的学习能力主要取决于其惩罚因子C和核函数参数的合理选择,对其参数的优化可以提升其学习效...
图像语义标注是图像语义分析研究中的一个重要问题.在主题模型的基础上,本文提出一种新颖的跨媒体图像标注方法来进行图像间语义的传播.首先,对训练图像使用主题模型,抽取视觉模态和文本模态信息的潜在语义主题.然后,通过使用一个权重参数来融合两种模态信息的主题分布,从而学习到一种融合主题分布.最后,在融合主题分布的基础上训练一个标注模型来给目标图像赋予合适的语义信息.在标准的MSRC和Corel5K数据集上...
传统的Bag of Words模型检索方法并不具备局部特征间的空间关系,因此影响检索性能.本文提出了基于分级显著信息的空间编码方法.通过分层次的提取显著区域并对每个显著区域内的特征点进行空间编码.目的是探索特征间的空间关系,并根据分级显著信息提高特征间的相关性.在几何验证过程中,本文通过任意三点间的角度编码和位移编码构成的空间编码方法完成图像对之间的空间关系匹配,同时根据图像各个区域间的显著程度赋...
构建英文情感词典研究相对成熟,形成了丰富可靠的词典资源。而针对中文的研究时间短,中文情感分析词典资源较少。借鉴现有可靠的英文词典资源,提出了基于语义关系的情感词典自动构建算法,算法先从HowNet的概念中进行中文义原和词语抽取及语义分析,再利用HowNet概念中DEF中英文属性值,在英文情感词典SentWordNet中进行义原和词语情感值查询,最后根据词语和义原之间的语义关系进行词语的情感值计算。...
本文探讨了用户兴趣挖掘的新方法,首先从用户搜索日志中获取访问行为元素,并借助通用本体中的概念描述网页所体现的用户个体兴趣,然后提出了一种兴趣得分计算方法,并在此基础上从用户个体兴趣序列中识别不同的兴趣模式,判断用户的短期兴趣,并利用通用本体得出用户兴趣的集合表示,最后根据短期兴趣的增量积累推算长期兴趣.整个过程避开了以往兴趣挖掘方法中通过相似度计算和文档聚类算法进行兴趣合并的问题,为兴趣发现提供了...
提高从海量和复杂的数据中获取知识的能力,加速科学与工程领域发明的步伐,增强国家安全,并改变教学研究。
2013年7月22日,记者从山东省语言文字工作委员会获悉,日前,中国语言资源有声数据库山东库建设工程正式启动。据介绍,山东库建设工程为中国语言资源有声数据库建设工程组成部分,其目的主要是做好山东方言资源调查,建成山东语言资源数据库,进而建成包括山东语言文化信息(民谣、儿歌、俗语、地方戏曲和曲艺等)、山东语言地图在内的山东语言文化数据库。山东库建设工程的实施,对科学保存山东语言文化资源、传承地方优秀...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...