工学 >>> 计算机科学技术 >>> 计算机科学技术基础学科 >>> 算法理论 >>>
搜索结果: 1-15 共查到算法理论 Q-学习相关记录122条 . 查询时间(0.162 秒)
双目深度估计的在线适应是一个有挑战性的问题,其要求模型能够在不断变化的目标场景中在线连续地自我调整并适应于当前环境.为处理该问题,提出一种新的在线元学习适应算法(Online meta-learning model with adaptation,OMLA),其贡献主要体现在两方面:首先引入在线特征对齐方法处理目标域和源域特征的分布偏差,以减少数据域转移的影响;然后利用在线元学习方法调整特征对齐过...
自监督学习可以为图像聚类算法提供良好的表征,但是当表征和聚类同步学习时会存在一些问题。具体来说,基于对比的自监督学习方法通常需要大量的负样本来使得所有样本的表征分离,但是负样本会带来类别冲突,进而影响下游的聚类性能;反之,基于非对比的自监督学习方法虽然避免了类别冲突问题,但是由于缺少负样本,与聚类任务联合优化时容易造成聚类崩溃。本报告将围绕这两个问题,分别介绍基于语义伪标签和原型对比的图像聚类算法...
运行指标决策问题是实现工业过程运行安全和生产指标优化的关键.考虑到多运行指标决策问题求解的复杂性和工业过程生产条件动态波动引发生产指标状态的不确定性,提出了一种策略异步更新强化学习算法自学习决策运行指标,并给出算法收敛性的理论证明.该算法在随机自适应动态规划框架下,利用样本均值代替计算生产指标状态转移概率矩阵,因此无需要求生产指标状态转移概率矩阵已知.并且通过引入时钟和定义其阈值,采用集中式策略评...
现有基于孪生网络的单目标跟踪算法能够实现很高的跟踪精度,但是这些跟踪器不具备在线更新的能力,而且其在跟踪时很依赖目标的语义信息,这导致基于孪生网络的单目标跟踪算法在面对具有相似语义信息的干扰物时会跟踪失败.为了解决这个问题,提出了一种异步相关响应的计算模型,并提出一种高效利用不同帧间目标语义信息的方法.在此基础上,提出了一种新的具有判别性的跟踪算法.同时为了解决判别模型使用一阶优化算法收敛慢的问题...
设计出一种基于学习去噪的近似消息传递(Learned denoising-based approximate message passing,LDAMP)的深度学习网络,将其应用于量子状态的估计.该网络将去噪卷积神经网络与基于去噪的近似消息传递算法相结合,利用量子系统输出的测量值作为网络输入,通过设计出的带有去噪卷积神经网络的LDAMP网络重构出原始密度矩阵,从大量的训练样本中提取各种不同类型密度...
近日,2022年度教育部-华为“智能基座”优秀课件遴选结果公布。南方科技大学深港微电子学院副院长余浩教授的《机器学习芯片设计》入选教育部-华为“智能基座”优秀课件。本期遴选活动共收到118份申请,经教育部-华为“智能基座”联合工作组组织专家组审定,最终60份课件荣获“2022年度教育部-华为‘智能基座’优秀课件”。
近日,核科学技术学院等离子体物理与聚变工程系刘健课题组与中国科学院数学与系统科学研究院唐贻发课题组合作提出了一大类保体积神经网络(VPNets)算法,VPNets可严格保持相空间体积(满足刘维定理),通过将物理系统的基本性质嵌入网络结构,有效解决应用AI算法处理物理问题时常见的数据不完备、泛化能力弱等问题。该工作还严格证明了VPNets的逼近定理,在理论上保证了该网络的表达能力。这是中科大多途径磁...
优化算法是机器学习的重要组成部分,但是传统的优化算法并不完全适用于机器学习,因为通常来说机器学习模型的参数维度很高或涉及的样本数巨大,这使得一阶优化算法在机器学习中占据主流地位。为了在应用中推广加速一阶优化算法,中国图象图形学学会与浙江师范大学数理医学院、浙江师范大学数学与计算机科学学院、西安科技大学数学与统计学院共同主办了“CSIG-机器学习中的加速一阶优化算法系列讲座”,由中国图象图形学学会机...
优化算法是机器学习的重要组成部分,但是传统的优化算法并不完全适用于机器学习,因为通常来说机器学习模型的参数维度很高或涉及的样本数巨大,这使得一阶优化算法在机器学习中占据主流地位。为了在应用中推广加速一阶优化算法,中国图象图形学学会与浙江师范大学数理医学院、浙江师范大学数学与计算机科学学院、西安科技大学数学与统计学院共同主办了“CSIG-机器学习中的加速一阶优化算法系列讲座”,由中国图象图形学学会机...
中国科学技术大学李泽峰研究员利用机器学习方法,总结了全球3000多个5.5级以上地震的震源时间函数特征,全景式地展示全球地震破裂过程的相似性和多样性,深化了对地震能量释放模式的认识,对地震早期预警具有启示意义。研究成果日前发表在国际知名地学期刊《地球物理研究快报》上。
航空瞬变电磁(AEM)法对地形适应性强,采集效率高,是重要的浅地表勘探方法。
在无先验信息的情况下,贝叶斯网络(Bayesian network,BN)结构搜索空间的规模随节点数目增加呈指数级增长,造成BN结构学习难度急剧增加.针对该问题,提出基于双尺度约束模型的BN结构自适应学习算法.该算法利用最大互信息和条件独立性测试构建大尺度约束模型,完成BN结构搜索空间的初始化.在此基础上设计改进遗传算法,在结构迭代优化过程中引入小尺度约束模型,实现结构搜索空间小尺度动态缩放.同时...
多机协同是空中作战的关键环节,如何处理多实体间复杂的协作关系、实现多机协同空战的智能决策是亟待解决的问题.为此,提出基于深度强化学习的多机协同空战决策流程框架(Deep-reinforcement-learning-based multi-aircraft cooperative air combat decision framework,DRL-MACACDF),并针对近端策略优化(Proxim...
研究了控制信号被恶意篡改的信息物理系统的安全控制问题.首先,提出一种改进果蝇优化核极限学习机算法(Kernel extreme learning machine with improved fruit fly optimization algorithm,IFOA-KELM)对攻击信号进行重构.然后,将所得重构信号作为系统扰动加以补偿,进而设计模型预测控制策略,并给出了使被控系统是输入到状态稳定的...
脑效应连接(Effective connectivity,EC)网络是人脑连接组研究中一项重要的研究课题,识别脑效应连接网络已成为评价正常脑功能及其与神经退化疾病相关损伤的一种有效手段.针对从功能性磁共振成像数据中进行脑效应连接网络的学习问题,提出了一种将多源信息与蚁群优化过程相融合的学习方法.新方法首先利用弥散张量成像数据获取感兴趣区域的结构约束信息,并利用正相关的皮尔森信息来压缩蚁群搜索的空间...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...