工学 >>> 计算机科学技术 >>> 计算机应用 >>> 中国语言文字信息处理 >>>
搜索结果: 151-165 共查到知识库 中国语言文字信息处理相关记录355条 . 查询时间(3.333 秒)
基于参数和语义特征的CAD系统,改变参数的值是最重要的操作,也通常是一种反复性的过程,针对适合的参数值对于用户来说提前是不知道的,提出一种新的方法用于自动侦测参数的适当的范围。先通过分析拓扑约束图,找到距离和角度约束,并将这些约束加入到其相应的几何约束中,然后通过分解找到子问题的临界参数值,再求解每个并列的参数区间内部的一个具体的实例,精确的参数范围就能够被确定。
支持向量机在处理两类分类问题时,当两类样本混杂严重时会降低分类精度。在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离修剪混淆点,进而提出了一种改进的NN-SVM算法——KCNN-SVM。实验数据表明,KCNN-SVM算法与SVM以及NN-SVM相比,有着更高的分类精度和更快的训练、分类时间。
博客作为一种大众化的信息及文化载体被越来越多的人所接受,博客信息的情感分析也逐渐成为了信息挖掘领域的热点。目前,在研究情感分析时,多是通过计算词汇的倾向性来完成的。由于并不是所有的带有情感色彩的词汇都是主题相关的,因此,以词为粒度的情感分析存在一定的缺陷。为了解决这一问题,试图从句子层面进行分析,主要研究了与之相关的主题情感句的自动提取问题。为了有效地提取主题相关情感句,设计了一个新颖的基于二元切...
意见挖掘是自然语言处理研究领域的一个新热点。词语倾向性的判定是意见挖掘的基础和重要环节。该文进行了中文词语倾向性的自动判定实验。实验中采用了《现代汉语褒贬用法词典》中的词语做为褒贬判定的核心词汇,以同义词词典扩展了褒贬义词典的词语,并使用二元语法模型来判定多倾向性词语的倾向。实验结果褒义词的F-Score为79.31%,贬义词的F-Score为78.18%。
现有的中文语义相关度计算模型对相关度的定义并不明确和统一,且计算方法多以相似度计算为基础,导致应用语义相关度存在局限。提出了一个新的语义相关的定义,认为两个词所表达的概念之间,如果存在用类似“知网”的知识描述体系所描述的语义关系,那么这两个概念之间就是语义相关的。通过挖掘这些直接或间接的关系,提出了一种新的语义相关度的计算模型,适用于所有类似知网的知识体系中语义相关度的计算。最后将该计算模型应用于...
传统权重公式TFIDF忽略了词语在集合中的分布比例,针对TFIDF的这个缺点,把信息增益公式引入文本集合中并提出IF*IDF*IG,取得了较好的效果。在分析中发现单纯把信息增益引入文本集合并不能完全解决词语分布对词语权重的影响。从文档类别层次上考虑,把信息论中信息增益应用到文本集合的类别层次上,提出了一种改进的权重公式tf*idf*IGc,用改进的权重公式来衡量词语在文本集合的各个类别中分布比例上...
随着网络信息日益增多,文本摘要变得越来越重要。大多数现有的文摘方法采用的是独立于查询的方法来生成文摘。论文提出了一种将基于查询条件的句子权值计算融入句子重要度计算的文摘技术,实验结果表明该方法生成的文摘能有效提高用户搜索信息的速度并提高准确性。
统计学习理论证明,支撑矢量机是具有高分类能力和高推广性能的优秀分类器。但由于语音的动态时间属性,它很难直接应用到汉语方言辨识领域。论文利用高斯混合模型和语言模型提取等维的全局语言特征,成功解决了支撑矢量机难于直接处理动态时间模式的困难,有效地增强了系统的分类能力。实验结果表明,支撑矢量机方法可以比直接用语言模型进行分类决策提高近20%的正确辨识率,比人工神经网络方法也可提高4%的正确辨识率。
语义相似是词汇间的基本关系之一。词汇间语义相似的定量化研究对于信息检索、统计语言模型等的自然语言处理的应用技术具有重要的指导意义。本文提出了基于知识图的词汇间语义相似度计算的方法,把知识图这种属于语义网络范畴的知识表示方法在汉语信息处理中得以应用。初步试验表明,该方法是一种理论基础严整,实践上行之有效的方法。
信息检索中相关文档的排序一直是一个至关重要的问题。本文提出一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率。主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系。本文中,主题词对的选择采用概率潜在语义索引的方法,并根据主题词对在文档中的分布状况对其进行重排。对NTCIR-5中文信息检索的文档集合进行测试,采用trec标准...
计算句子的相似度在机器问答、机器翻译、文本分类等系统中有着非常重要的作用。该文对基于相同关键词的句子相似模型作了进一步的改进,包括关键词抽取,以及在句子相似度的定义中引入同义词以及近义词的情形。并以此为基础,实现了一个基于常问问题集的中文自动问答系统,对用户以自然语言输入的问题,该系统能够自动地在FAQ(Frequently-Asked Question)库中寻找候选问题集,通过计算句子相似度,将...
针对中日论坛的情感分类问题,研究了特定领域(中日关系论坛)语料的特点,考察了不同特征维数、不同特征权重计算、不同特征选取方法以及限定词类词语对情感分类结果的影响。最后通过对2006年1月份到5月份的中日论坛语料的自动情感分类,推断出该阶段中日关系走势。
文本的形式化表示一直是信息检索领域关注的基础性问题。向量空间模型(Vector Space Model)中的tf.idf文本表示是该领域里得到广泛应用,并且取得较好效果的一种文本表示方法。词语在文本集合中的分布比例量上的差异是决定词语表达文本内容的重要因素之一。但是其IDF的计算,并没有考虑到特征项在类间的分布情况,也没有考虑到在类内分布相对均匀的特征项的权重应该比分布不均匀的要高,应该赋予其较高...
通过对A Farewell to Arms中章节值和文本召回率值拉锯式攀升状态的分析,验证了文本排歧语义图式的正确性和相关性:具有读者参与的文本歧义推动了情节的发展,而这种推动源自于读者期待和文本顿悟点自动匹配的顺序性和读者纠错控制的选择性。
根据孟加拉手写体数字的特点,用Kirsch算子提取象素的水平、垂直、右对角线以及左对角线的特征矢量,并与字符图像的密度特征相结合,采用BP算法训练的MLP网络作分类器进行识别。最后,用从实际孟加拉信封图像中采集到的手写体数字作样本进行实验,达到了96.1%的识别率。

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...