搜索结果: 1-15 共查到“算法理论 Q-学习”相关记录122条 . 查询时间(0.162 秒)
双目深度估计的在线适应是一个有挑战性的问题,其要求模型能够在不断变化的目标场景中在线连续地自我调整并适应于当前环境.为处理该问题,提出一种新的在线元学习适应算法(Online meta-learning model with adaptation,OMLA),其贡献主要体现在两方面:首先引入在线特征对齐方法处理目标域和源域特征的分布偏差,以减少数据域转移的影响;然后利用在线元学习方法调整特征对齐过...
Academy of Mathematics and Systems Science, CAS Colloquia & Seminars:基于自监督表征学习的图像聚类算法研究
自监督表征学习 图像聚类算法 语义伪标签
2023/3/22
运行指标决策问题是实现工业过程运行安全和生产指标优化的关键.考虑到多运行指标决策问题求解的复杂性和工业过程生产条件动态波动引发生产指标状态的不确定性,提出了一种策略异步更新强化学习算法自学习决策运行指标,并给出算法收敛性的理论证明.该算法在随机自适应动态规划框架下,利用样本均值代替计算生产指标状态转移概率矩阵,因此无需要求生产指标状态转移概率矩阵已知.并且通过引入时钟和定义其阈值,采用集中式策略评...
现有基于孪生网络的单目标跟踪算法能够实现很高的跟踪精度,但是这些跟踪器不具备在线更新的能力,而且其在跟踪时很依赖目标的语义信息,这导致基于孪生网络的单目标跟踪算法在面对具有相似语义信息的干扰物时会跟踪失败.为了解决这个问题,提出了一种异步相关响应的计算模型,并提出一种高效利用不同帧间目标语义信息的方法.在此基础上,提出了一种新的具有判别性的跟踪算法.同时为了解决判别模型使用一阶优化算法收敛慢的问题...
设计出一种基于学习去噪的近似消息传递(Learned denoising-based approximate message passing,LDAMP)的深度学习网络,将其应用于量子状态的估计.该网络将去噪卷积神经网络与基于去噪的近似消息传递算法相结合,利用量子系统输出的测量值作为网络输入,通过设计出的带有去噪卷积神经网络的LDAMP网络重构出原始密度矩阵,从大量的训练样本中提取各种不同类型密度...
![](http://www.firstlight.cn/upload/imgfile/202311/29/20231129102024849.png)
![](http://www.firstlight.cn/upload/imgfile/20231/4/202314101623585.png)
![](http://www.firstlight.cn/upload/imgfile/20229/19/202291910506905.png)
![](http://www.firstlight.cn/upload/imgfile/20229/19/2022919105911806.png)
用机器学习揭示全球中大地震破裂模式
机器学习 全球 中大地震 破裂模式
2022/6/29
中国科学技术大学李泽峰研究员利用机器学习方法,总结了全球3000多个5.5级以上地震的震源时间函数特征,全景式地展示全球地震破裂过程的相似性和多样性,深化了对地震能量释放模式的认识,对地震早期预警具有启示意义。研究成果日前发表在国际知名地学期刊《地球物理研究快报》上。
![](http://www.firstlight.cn/upload/imgfile/20236/21/202362115851176.png)
航空瞬变电磁(AEM)法对地形适应性强,采集效率高,是重要的浅地表勘探方法。
基于双尺度约束模型的BN结构自适应学习算法
贝叶斯网络 结构学习 约束模型 遗传算法
2021/8/20
在无先验信息的情况下,贝叶斯网络(Bayesian network,BN)结构搜索空间的规模随节点数目增加呈指数级增长,造成BN结构学习难度急剧增加.针对该问题,提出基于双尺度约束模型的BN结构自适应学习算法.该算法利用最大互信息和条件独立性测试构建大尺度约束模型,完成BN结构搜索空间的初始化.在此基础上设计改进遗传算法,在结构迭代优化过程中引入小尺度约束模型,实现结构搜索空间小尺度动态缩放.同时...
多机协同是空中作战的关键环节,如何处理多实体间复杂的协作关系、实现多机协同空战的智能决策是亟待解决的问题.为此,提出基于深度强化学习的多机协同空战决策流程框架(Deep-reinforcement-learning-based multi-aircraft cooperative air combat decision framework,DRL-MACACDF),并针对近端策略优化(Proxim...
研究了控制信号被恶意篡改的信息物理系统的安全控制问题.首先,提出一种改进果蝇优化核极限学习机算法(Kernel extreme learning machine with improved fruit fly optimization algorithm,IFOA-KELM)对攻击信号进行重构.然后,将所得重构信号作为系统扰动加以补偿,进而设计模型预测控制策略,并给出了使被控系统是输入到状态稳定的...