工学 >>> 计算机科学技术 >>> 计算机软件 >>> 软件理论 操作系统与操作环境 程序设计及其语言 编译系统 数据库 软件开发环境与开发技术 软件工程 计算机软件其他学科
搜索结果: 1-11 共查到计算机软件 数据集相关记录11条 . 查询时间(0.317 秒)
美国能源部橡树岭国家实验室(ORNL)科研人员生成并发布了两个超大规模的有机分子数据集,提供了超1000万个有机分子的紫外可见光谱特性。科研人员开发了一款可扩展的工作流程软件,确保量子力学代码生成的文件得到正确处理,并使用该软件生成GDB-9-Ex数据集,再进一步扩展生成ORNL_AISD-Ex数据集
在日常购物时,我们不妨畅想一下未来商超的购物场景:无需结算台,消费者取下产品的同时,商品识别算法就可以完成自动结算;无需货架管理员,智能货架管理技术可以实时动态监测商品数量变化,并自动完成数据分析。实现这种智能化消费方式的核心难点在于解决目标检测计数联合任务领域中的遮挡问题。近日,中国科学院软件研究所智能软件研究中心发布了目前为止最大的零售场景目标检测计数联合任务数据集——Locount,该数据集...
针对现有基于距离的离群点检测算法在处理大规模数据时效率低的问题,提出一种基于聚类和索引的分布式离群点检测(DODCI) 算法。首先利用聚类方法将大数据集划分成簇;然后在分布式环境中的各节点处并行创建各个簇的索引;最后使用两个优化策略和两条剪枝规则以循环的方式在各节点处进行离群点检测。在合成数据集和整理后的KDD CUP数据集上的实验结果显示,在数据量较大时该算法比Orca和iDOoR算法快近一个数...
商业活动和工程实践中通常会积累一些大规模的携带重要信息的数据,由于这种数据集经常有更新且数据量较大,在对它们进行增量式关联规则挖掘时,若采用基于传统的Apriori算法进行计算,一方面难以取得较好的效率;另一方面支持度设置过低会产生大量的冗余规则,设置过高则会把一些支持度不高但有用的规则过滤掉而导致算法对这些新规则感应迟钝。因此,借助遗传算法的相关机理,同时结合自然界的免疫进化理论及相关仿生机制,...
针对中国健康信息数据集规范不支持语义集成、自动处理和推理,在Description Logics数学基础上,提出一种基于本体数据库的知识基(KBS)处理架构。该架构将健康信息数字化建设纳入知识工程轨道,提供一个庞大、规范、可靠、安全、可维护的KBS。以婚前体格检查数据集为案例说明,结果证明该架构可实现知识的自动处理和推理。
样本数据集的不一致性和冗余特征会降低分类的质量和效率。提出了一种一致化特征选择约简方法,该方法基于贝叶斯公式,采用阈值,将非一致数据归为最可能的一类,使数据集一致化。并在一致数据集上,运用类别区分矩阵选择可准确区分各类数据的最小特征变量集。给出的启发式搜索策略和应用实例表明:一致化特征选择约简方法能有效消除分类数据集的不一致性,选择最优的特征变量、降低数据的维数、减少数据集中的冗余信息。
将高维的大数据集随机分成若干个子集,对每个子集聚类采用一种基于遗传算法的高维数据模糊聚类方法。该方法引入了一个模糊非相似矩阵来表示高维样本之间的非相似程度,并将高维样本随机初始化到二维平面,利用遗传算法迭代优化二维样本的坐标值,实现二维样本之间的欧氏距离向样本间的模糊非相似度的趋近。将得到的最优的二维样本用模糊C-均值聚类(FCM)算法聚类,克服了聚类有效性对高维样本空间分布的依赖。实验仿真表明,...
采用关系数据库模型进行建模,对于同一关系框架上的数据定义了相似数据集。对单个数据集,通过关系拆分对数据库模型进行规范化处理,去除了关系内部的数据冗余;对多个数据集之间的压缩提出了一种基于0-1状态标记序列的增量式无损压缩算法,压缩后的数据可以快速地完全解压缩。试验结果表明,算法可以实现对相似数据集的高效无损压缩和快速查询。
提出了一种基于网格技术的高维大数据集离群点挖掘算法(OMAGT)。该算法针对高维大数据集的分布特性,首先采用基于网格技术的方法寻找出聚类区域,并删除聚类区域内不可能成为离群点的聚类点集,然后运用局部离群因子(LOF)算法对剩下的点集进行离群点挖掘。OMAGT算法较好地实现了聚类信息的动态释放,将保留的离群点挖掘信息控制在一定的内存容量范围内,提高了算法的时间效率和空间效率。理论分析与实验结果表明O...
为了有效检测聚类的边界点,提出了结合对象的密度及其Eps-邻域中数据的分布特点进行的边界点检测技术和边界点检测算法 ——BOUND。实验结果表明,BOUND能在含有不同形状、大小簇的噪声数据集上有效地检测出聚类的边界点,并且执行效率高。
“高分子溶液数据集及其数据库系统”所包括的相平衡和热力学数据是高分子化工与加工中工艺计算的基础。高分子溶液在分子尺度和结构上存在巨大的差异,使其表现为高度非对称体系,是流体相平衡研究前沿和热点。该项目针对高分子溶液相平衡和热力学数据测定方法不一、基准各异、有些数据的精度尚存疑问且散见于各类期刊等问题,对数据的收集、评价、规范化和工程实用化开展系统性的基础研究。该项成果系统地收集了1989年之前在2...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...