工学 >>> 计算机科学技术 >>> 计算机科学技术基础学科 人工智能 计算机系统结构 计算机软件 计算机工程 计算机应用 计算机科学技术其他学科
搜索结果: 106-120 共查到计算机科学技术 数据挖掘相关记录174条 . 查询时间(0.035 秒)
由于存在着大量的在线信息,WWW成为数据挖掘的热点。该文介绍了Web网页的数据挖掘技术,提出一种基于XML的Web数据挖掘模型,阐述将半结构化HTML文档转换成良构的XML文档的原因,并给出基于HTML Tide库的转换代码,介绍了利用XML技术从Web网页析取数据的关键技术,包括XHTML、XSLT和XQuery等,对Web数据挖掘的其他方面如数据检验和集成作了一定的探讨。
中国人民大学统计学院主办的2009年第六届中国数据挖掘与商业智能研讨会将于2009年6月6日在中国人民大学逸夫会议中心召开,会议主题是数据挖掘应用型的研究。
数据挖掘用于从超大规模数据库中提取感兴趣的信息。聚类是数据挖掘的重要工具,根据数据间的相似性将数据库分成多个类,每类中数据应尽可能相似。从机器学习的观点来看,类相当于隐藏模式,寻找类是无监督学习过程。目前已有应用于统计、模式识别、机器学习等不同领域的几十种聚类算法。该文对数据挖掘中的聚类算法进行了归纳和分类,总结了7类算法并分析了其性能特点。
中药文化的地区差异带来了中医药数据的众多不确定性,为解决基于数据挖掘的新药研制决策支持系统的数据问题,提出了一套规范原始中医药数据的处理方法。应用了数据归约技术、聚类的方法、模糊集理论改进了中医药数据的质量,使得在预处理后的中药方剂数据库中成功挖掘出重要规则,为研制中药新药提供了有力的决策支持。
针对数据挖掘的组合模型问题,研究了组合模型的理论和技术,分析了组合理论在近邻法的应用现状,提出了一种通过随机属性子集组合近邻分类器的算法MNN,利用简单的投票方法,通过一个随机的属性子集来组合多重近邻分类器,对多重NN分类器的输出进行组合,MNN方法能有效地改进近邻法的分类精度。MNN方法与NN-E000相比,有两个主要的优点:(1) MNN是一个更简单的方法;(2) MNN不受多类问题的限制。
介绍了建立热轧带钢力学性能质量模型的数据挖掘过程。用普通神经网络建立起由工艺参数预测力学性能的质量模型,模型预测结果的5%命中率是0.508。提出了一种新的建模方法──逐层逼近法,并用它建立起质量模型,预测结果的5%命中率达到0.721,完全可以满足现实生产需要。
论文提出将正则化神经网络与粗集理论相结合应用于股票时间序列数据库的数据挖掘.首先对时间序列数据库进行预处理,除去高频干扰信号,然后将股票时间序列数据按照收盘价的变化趋势分割成一系列静态模式,每种模式代表股票价格的一种行为趋势(上涨或下跌),把决定各种模式的相关属性组成一系列信息,形成一个适用于粗集方法的信息表.然后使用正则神经网络对信息表进行学习,用粗集理论从正则神经网络所存储的知识中抽取规则,得...
异常检测是目前入侵检测研究的主要方向之一。该文提出一种新的程序行为异常检测方法,主要用于Linux或Unix平台上以系统调用为审计数据的入侵检测系统。该方法利用数据挖掘技术中的序列模式对特权程序的正常行为进行建模,根据系统调用序列的支持度和可信度在训练数据中提取正常模式。在检测阶段,通过序列模式匹配对被监测程序的行为异常程度进行分析,提供两种可选的判决方案。实验结果表明,该方法具有良好的检测性能。
传统的面向属性归纳技术(AOI)存在概化粗糙及算法效率较低等缺陷。为适应中药方剂数据挖掘的复杂需求,提出基于中药数据驱动的属性关联概化算法;为关联的维度创建概念树,利用关联属性与基准属性的相关性以提高归纳的效率,实现了面向属性关联归纳的数据挖掘系统TCMDBMiner。实验结果表明,新算法较传统算法的归纳概化效率提高了23%以上,挖掘结果符合中医理论。
在分析了现有分布式数据挖掘算法的运行机制和P2P技术具有无中心、不同步等特点的基础上,通过扩展经典K-mean算法的迭代过程,设计了一种能够用于P2P网络的分布式数据挖掘算法。该算法只需要在直接相连的节点间传递数据,并且能使每个节点上的数据按照全局聚类的结果聚合。最后用模拟实验验证了该算法的有效性。
将小波分析和ARMA模型引入时间序列数据挖掘中。利用小波消噪对原始时间序列进行滤波,利用小波变换充分提取和分离金融时间序列的各种隐周期和非线性,把小波分解序列的特性和分解数据随尺度倍增而倍减的规律充分用于BP神经网络和自回归移动平均模型的建模。利用小波重构技术将各尺度域的预报结果组合成为时间序列的最终预报。经过试验验证了该方法的实际有效性
网络安全日志数据库是一种历史数据,对它的分析具有十分重要的实际价值,作为一种时序数据库,针对它的信息挖掘已研究出许多方法。该文提出了一种新的对此类时序数据库的信息挖掘方法,利用小波变换多分辨率分析的方法对信号化后网络安全日志数据库中的数据在不同的时间尺度上进行分析和信息挖掘,从中提取出单位时间内网络受到攻击次数的时间周期规律,并对这种方法的分析特性进行了阐述,而且利用小波阈值重建的方法对原始信号数...
基于隐私保护的数据挖掘(PPDM)的目标是在保护原始数据的情况下建立挖掘模型并得到理想的分析结果。该文从PPDM的总体需求出发,基于数据隐藏,将PPDM技术分为安全多方计算技术、匿名技术和数据转换技术。从准确性、隐私性和复杂性3个方面对PPDM技术进行了评估。
分析NPA训练算法,指出其不足并提出改进措施。在第1类子循环的前半阶段采用Gilbert迭代,后半阶段采用NPA迭代,并提出界定这2个阶段的方法,利用中间计算结果优化了第2类子循环中的迭代过程。在不增加计算量的条件下,提高了算法收敛速度。基于该算法开发的自动分类模拟系统获得了较好的分类结果。
基于FAS算法,设计并实现了一个基于最近挖掘结果的数据挖掘系统AR_Miner,包括数据预处理、频繁集初始计算、频繁集更新计算、频繁集选择、关联规则生成5个部分,实现了关联规则挖掘的可视化和生成结果按“支持度-可信度”形式的可视化,为基于频繁集的交互式挖掘提供了方便、友好的界面。对历史的稽查数据中纳税人采用的主要违法违章手段之间的关联关系进行了数据挖掘,得到了一些合理的知识,提高了对稽查历史数据的...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...