搜索结果: 1-9 共查到“计算机应用 多模态”相关记录9条 . 查询时间(0.256 秒)
一种融合视频多模态内容的人物可视化方法及装置(图)
视频多模态 人物可视化
2023/11/10
语音情感计算及多模态交互研究团队荣获CCF A类国际顶级会议IEEE/CVF CVPR 2020超大规模商品图像检测挑战赛冠军(图)
语音情感计算 多模态交互 CCF A类 国际顶级会议 超大规模商品 图像检测 挑战赛 冠军
2020/8/12
2020年6月14—19日期间,CCF A类国际顶级会议-国际计算机视觉与模式识别大会(以下简称IEEE/CVF CVPR 2020,图1)主办的超大规模商品图像检测挑战赛(以下称“RetailVision Detection Grand Challenge”)举行了颁奖典礼。由来自语音及语言信息处理国家工程实验室语音情感计算及多模态交互研究室和中国科大信息学院自动化系组成的参赛团队(以下简称US...
基于多模态信息融合的新闻独白镜头检测
独白镜头检测 新闻视频 视频检索
2009/10/12
新闻视频中的独白镜头具有较大的信息量,在视频检索和挖掘中具有较高的应用价值。提出了一种融合音频、视频、时域以及上下文信息等多模态特征进行独白场景检测的方法。首先利用规则移除广告和“其他”镜头,然后应用聚类的方法检测主持人镜头,最后应用条件随机场(CRFs)模型标记独白和记者镜头。该方法无需额外的信息,具有较好的普适性,实验取得了较好的性能。
利用高维互信息的多模态医学图像配准
高维互信息 多模态医学图像 图像配准
2009/7/1
互信息相似性测度在多模态医学图像配准中获得了广泛的应用,然而其不足之处在于没用充分利用图像固有的空间信息。针对这一不足,提出了利用图像邻域信息的高维互信息配准方法。首先用图像像素及其邻域构成高维向量的集合,然后利用基于最近邻的熵估计法来估计集合的高维熵,并采用近似最近邻搜索算法来加快高维熵的计算。实验结果验证了新的相似性测度的有效性。
基于分箱核密度估计的非参数多模态背景模型
非参数背景模型 运动目标检测 核密度估计
2009/2/5
提出了一种用于检测运动目标的非参数多模态背景模型。该模型采用分箱核密度估计算法从训练图像序列中得到背景的密度函数。分箱核密度估计算法利用基于网格数据重心的分箱规则,很好地提取了训练图像序列的关键信息,避免了采用全样本数据点的重复计算, 大大提高了运动目标检测算法的实时性。通过与全样本算法进行对比,发现该背景模型在运动目标检测中的有效性,可用于户外的实时交通监控系统。
一种多模态信息融合的视频检索模型
TRECVID 视频检索 多模态信息融合
2008/12/30
针对包含复杂语义信息的视频检索的需要,提出了一种基于关系代数的多模态信息融合视频检索模型,该模型充分利用视频包含的文本、图像、高层语义概念等多模态特征,构造了对应于多个视频特征的查询模块,并创新地使用关系代数表达式对查询得到的多模态信息进行融合。实验表明,该模型能够充分发挥多模型视频检索及基于关系代数表达式的融合策略在复杂语义视频检索中的优势,得到较好的查询结果。
改进的粒子群算法多模态生物医学图像配准
图像 粒子群算法
2008/3/11
多模态生物医学图像配准在医疗诊断、治疗方案的制定,以及身体机能的研究等方面起到越来越大的作用。如何将这些多模态信息融合在一起是目前研究的重点,目前,该融合主要基于图像强度信息的配准方法。该类方法通过最大化化图像间的相似度函数达到配准的目的,但配准过程中使用往往会出现参数变化非凸且不光滑的现象,因而,传统的局部最优方法通常不能得到较好的结果。粒子群算法是一种全局寻优算法,但传统的方法中受初始值的选取...