工学 >>> 计算机科学技术 >>> 计算机应用 >>> 中国语言文字信息处理 数字媒体技术 计算机仿真 计算机图形学 计算机图象处理 计算机辅助设计 计算机过程控制 计算机信息管理系统 计算机决策支持系统 计算机应用其他学科
搜索结果: 1-9 共查到计算机应用 多模态相关记录9条 . 查询时间(0.256 秒)
本发明涉及一种融合视频多模态内容的人物可视化方法及装置。该方法包括:抽取目标视频在各模态下的原始数据;依据各模态下抽取的原始数据的最小尺度,对齐各模态下的原始数据;基于对齐后的各模态下的原始数据,在设定尺度范围内依据不同模态特性提取模态特征数据;基于提取的模态特征数据,针对视频摘要的可视化形式进行人物可视化,并针对视频播放器的可视化形式进行人物可视化;基于视频播放器的可视化形式,进行视频播放及播放...
近日,南科大计算机系2019级本科生唐云龙以第一作者的身份在计算机视觉领域亚洲顶级会议Asian Conference on Computer Vision(ACCV2022)发表研究成果,题为Multi-modal Segment Assemblage Network for Ad Video Editing with Importance-Coherence Reward。本文由南方科技大学与...
2020年6月14—19日期间,CCF A类国际顶级会议-国际计算机视觉与模式识别大会(以下简称IEEE/CVF CVPR 2020,图1)主办的超大规模商品图像检测挑战赛(以下称“RetailVision Detection Grand Challenge”)举行了颁奖典礼。由来自语音及语言信息处理国家工程实验室语音情感计算及多模态交互研究室和中国科大信息学院自动化系组成的参赛团队(以下简称US...
新闻视频中的独白镜头具有较大的信息量,在视频检索和挖掘中具有较高的应用价值。提出了一种融合音频、视频、时域以及上下文信息等多模态特征进行独白场景检测的方法。首先利用规则移除广告和“其他”镜头,然后应用聚类的方法检测主持人镜头,最后应用条件随机场(CRFs)模型标记独白和记者镜头。该方法无需额外的信息,具有较好的普适性,实验取得了较好的性能。
互信息相似性测度在多模态医学图像配准中获得了广泛的应用,然而其不足之处在于没用充分利用图像固有的空间信息。针对这一不足,提出了利用图像邻域信息的高维互信息配准方法。首先用图像像素及其邻域构成高维向量的集合,然后利用基于最近邻的熵估计法来估计集合的高维熵,并采用近似最近邻搜索算法来加快高维熵的计算。实验结果验证了新的相似性测度的有效性。
提出了一种用于检测运动目标的非参数多模态背景模型。该模型采用分箱核密度估计算法从训练图像序列中得到背景的密度函数。分箱核密度估计算法利用基于网格数据重心的分箱规则,很好地提取了训练图像序列的关键信息,避免了采用全样本数据点的重复计算, 大大提高了运动目标检测算法的实时性。通过与全样本算法进行对比,发现该背景模型在运动目标检测中的有效性,可用于户外的实时交通监控系统。
针对包含复杂语义信息的视频检索的需要,提出了一种基于关系代数的多模态信息融合视频检索模型,该模型充分利用视频包含的文本、图像、高层语义概念等多模态特征,构造了对应于多个视频特征的查询模块,并创新地使用关系代数表达式对查询得到的多模态信息进行融合。实验表明,该模型能够充分发挥多模型视频检索及基于关系代数表达式的融合策略在复杂语义视频检索中的优势,得到较好的查询结果。
多模态生物医学图像配准在医疗诊断、治疗方案的制定,以及身体机能的研究等方面起到越来越大的作用。如何将这些多模态信息融合在一起是目前研究的重点,目前,该融合主要基于图像强度信息的配准方法。该类方法通过最大化化图像间的相似度函数达到配准的目的,但配准过程中使用往往会出现参数变化非凸且不光滑的现象,因而,传统的局部最优方法通常不能得到较好的结果。粒子群算法是一种全局寻优算法,但传统的方法中受初始值的选取...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...