搜索结果: 1-15 共查到“工学 CVPR”相关记录26条 . 查询时间(0.125 秒)

2025年来,潜在扩散模型(LDMs)的发展推动了音乐生成领域的创新,使视频配乐在灵活性和多模态融合方面取得了显著突破。然而,现有方法大多采用两阶段流程,难以全面捕捉视频的声音特征,尤其在复杂视频场景下,难以同时呈现准确的音效细节和丰富的音乐情感氛围。为解决上述挑战,我们提出了一种创新性的视频配乐生成框架(C3GVS),能够同步生成与参考视频相匹配的音乐和音效。为此,我们设计了一种基于扩散模型的频...


2024年4月16日,世界模型的概念引发了广泛关注。我们首次提出了一种名为Drive-WM的全新多视图世界模型,旨在增强端到端自动驾驶规划的安全性。Drive-WM模型通过多视图世界模型,能够想象不同规划路线的未来情景,并根据视觉预测获取相应的奖惩反馈,从而优化当前的路线选择,为自动驾驶系统的安全提供了保障。Drive-WM是与现有端到端规划模型兼容的第一个驾驶世界模型。通过视图因子分解促进的联合...

2024年4月16日,世界模型的概念引发了广泛关注。我们首次提出了一种名为Drive-WM的全新多视图世界模型,旨在增强端到端自动驾驶规划的安全性。Drive-WM模型通过多视图世界模型,能够想象不同规划路线的未来情景,并根据视觉预测获取相应的奖惩反馈,从而优化当前的路线选择,为自动驾驶系统的安全提供了保障。Drive-WM是与现有端到端规划模型兼容的第一个驾驶世界模型。通过视图因子分解促进的联合...





东北大学信息科学与工程学院魏颖教授团队的论文被计算机视觉顶级会议(CVPR)录用
魏颖 计算机视觉 图像处理
2023/4/10
近日,由东北大学信息科学与工程学院魏颖教授作为通讯作者、共同第一作者为东北大学信息科学与工程学院2022级直博生马帅磊和2021级硕士生王越峰的研究成果《CAT:Localization and Identification Cascade Detection Transformer for Open-World Object Detection》被CVPR 2023(The IEEE/CVF C...



在近期举行的2021年国际计算机视觉与模式识别会议(全球计算机视觉三大顶级会议之一,CVPR 2021: Conference on Computer Vision and Pattern Recognition 2021)上,北京邮电大学人工智能学院宋晴教授负责的BUPT-PRIV 团队(模式识别与智能视觉)在多个重要赛道中再创佳绩,斩获2项冠军、2项亚军。BUPT-PRIV团队继2018、20...

中国科学院深圳先进技术研究院和澳门大学联合提出自动驾驶新型鲁棒评估机制获视觉领域顶级会议发表并获CVPR安全AI挑战赛亚军(图)
自动驾驶 新型鲁棒 评估机制 视觉领域 顶级会议 CVPR安全 AI挑战赛 亚军
2021/4/27
近日,中国科学院深圳先进技术研究院和澳门大学联合提出一项关于自动驾驶技术的新型鲁棒性评估机制,并以LAFEAT: Piercing Through Adversarial Defenses with Latent Features为题在人工智能领域公认的顶尖会议——国际计算器视觉与模式识别(CVPR)会议上发表。此外,联合团队以此技术研发了一款攻防软件,并于美国伊利诺大学、清华大学和阿瑞安全合办的...