首页 > 科技 >

中国科研团队突破性发布:VideoChat-Flash技术引领长视频处理速度飙升百倍

发布时间:2025-01-21 16:20:09来源:

传统视频理解模型在长视频处理上遭遇复杂上下文理解及训练推理效率低等挑战。研究团队通过HiCo技术,层次化压缩视频,分割长视频为短片段,显著降低计算需求并保留关键信息,同时增强模型处理能力。

“VideoChat-Flash”采用多阶段短视频到长视频的学习方案,通过构建包含300,000小时视频和2亿字注释的庞大数据集,提高了模型视觉感知能力。实验显示,该方法在计算上大幅减少,成为短视频理解领域新标杆,并在长视频理解方面超越现有开源模型,展现出卓越的时间定位能力。

免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。